GB2312码

(1)GB2312 字符集
GB2312 是汉字字符集和编码的代号,中文全称为“信息交换用汉字编码字符集”,由中华人民共和国国家标准总局发布,一九八一年五月一日实施。GB 是“国标” 二字的汉语拼音缩写。

(2)GB2312 字符集 (character set) 只收录简化字汉字,以及一般常用字母和符号,主要通行于中国大陆地区和新加坡等地。

(3)GB2312 共收录有 7445 个字符,其中简化汉字 6763 个,字母和符号 682 个。

(4)GB2312 将所收录的字符分为 94 个区,编号为 01 区至 94 区;每个区收录 94 个字符,编号为 01 位至 94 位。GB2312 的每一个字符都由与其唯一对应的区号和位号所确定。例如:汉字“啊”,编号为 16 区 01 位。

(5)GB2312 字符集的区位分布表:
区号??? 字数??? 字符类别
01????? 94??? 一般符号
02????? 72??? 顺序号码
03????? 94??? 拉丁字母
04????? 83??? 日文假名
05????? 86??? Katakana
06????? 48??? 希腊字母
07????? 66??? 俄文字母
08????? 63??? 汉语拼音符号
09????? 76??? 图形符号
10-15??????????? 备用区
16-55??? 3755??? 一级汉字,以拼音为序
56-87??? 3008??? 二级汉字,以笔划为序
88-94??????????? 备用区

GB2312 编码

举例来说,“啊”字是GB2312之中的第一个汉字,它的区位码就是1601。字节编码,通常采用EUC储存方法,以便兼容于ASCII。每个汉字及符号以两个字节来表示 。第一个字节称为“高位字节”,第二个字节称为“低位字节”。 “高位字节”使用了0xA1-0xF7(把01-87区的区号加上0xA0),“低位字节”使用了0xA1-0xFE(把01-94加上0xA0)。例如 “啊”字在大多数程序中,会以0xB0A1储存(与区位码对比:0xB0=0xA0+16,0xA1=0xA0+1)。

所以GB2312编码中汉字区码的十进制是从176到247,位码是从161到255.之所以存储了6763小于72(一级汉字和二级汉字所占的区)*94(每个区有94个汉字)=6768,是因为在区码为215,位码为250-254之间共五个编码没有汉字编码,所以6768-5=6763个

GB2312码表

《GB2312码》上有33条评论

评论已关闭。