中华字库工程是中华人民共和国新闻出版总署的建设项目,于2006年被列入《国家“十一五”时期文化发展规划纲要》的重大建设项目,并于2009年被列入国家《
文化产业振兴规划》。
“中华字库”工程以对文字学深入研究为基础,充分利用新技术,开发相应的软件工具,探索人-机结合的文字收集、整理、筛选、比对和认同的操作与管理流程,从数千年流传下来的文字载体中尽可能将所有出现过的汉字形体和少数民族文字形体汇聚起来,建立字际联系,最终按照出版印刷及网络数字化需求,制作出符合各种应用需求的汉字及少数民族文字的编码及主要字体字符库。
“中华字库”工程是引领中华文化步入信息化、数字化时代的先导性、奠基性工程,目的是要“建立全部汉字及少数民族文字的编码和主要字体字符库。重点研发汉字的编码体系、输入、输出、存储、传输以及兼容等关键技术”。完成后的“中华字库”,预计可编码字符数在50万左右(汉字古文字约10万、楷书汉字约30万、各少数民族文字约10万),力争达到能对我国所有的出土、传世文献和当代文字作品进行数字化处理,全面打通信息化的发展瓶颈,使中华各民族文字的使用,中华文明的普及与传播,更加方便和高效。
“中华字库”工程还研发超大规模字库的输入输出、存储传播以及相互兼容等关键技术。完成后的“中华字库”能对中国各种出土、传世文献和当代文字作品进行数字化处理,也能够满足社会数字化服务和数字化监管需求,如国土资源管理、公民身份管理等。