汉字编码标准

1. GB2312

中国国家标准总局1980年发布了GB2312—1980《信息交换用汉字编码字符集》,1981年5月1日开始实施,共收录汉字6763个和非汉字图形字符682个。

中国国家技术监督局1990年发布了与GB2312对应的国标繁体字符集GB12345-1990《信息交换用汉字编码字符集辅助集》,第16区到第87区排列与GB2312相对应的繁体字,第88区到89区增补了由于汉字简化而被精简的103个汉字,共收录汉字6866个。

2. GB13000

国际标准化组织1993年发布了ISO/IEC 10646-1《信息技术通用多八位编码字符集第一部分体系结构与基本多文种平面》,中国等同采用此标准制定GB 13000.1-1993,共收录了中、日、韩(CJK)汉字20902个。

3. GBK

在GB18030-2000制定前,中国全国信息技术标准化技术委员会1995年12月1日制订了GBK《汉字内码扩展规范》,国家技术监督局标准化司、电子工业部科技与质量监督司1995年12月15日联合以技监标函1995[229]号文件的形式,将它确定为技术规范指导性文件,共收录汉字21003个和其它符号883个。

GBK与GB2312—1980国家标准所对应的编码标准兼容,同时在字汇一级支持13000.1-1993(ISO/IEC 10646—1)的全部中、日、韩(CJK)汉字20902个。由于GB18030是国家标准,在技术上是GBK的超集,并与其兼容,因此,GB18030发布后GBK结束了历史使命。

4. GB18030

由于GB13000.1-1993编码体系与GB2312编码体系、当时的多数操作系统和外部设备不兼容,中国政府选择在GB2312的基础上进行扩充,在字汇上与GB 13000.1兼容的方案,研制一个新的汉字编码标准,并且列入1998年国家标准制定计划,2000年3月17日由原中国信息产业部和国家质量技术监督局联合发布了GB18030-2000《信息技术信息交换用汉字编码字符集基本集的扩充》,包括CJK统一汉字扩充A在内的GB 13000.1 中的全部字符,共收录汉字27533个。

2005年发布又发布了GB18030-2005,增加了CJK统一汉字扩充B,共收录汉字70244个。