
CFP供图
摘要
我国现有的字库只收入了7万多字,已无法满足时代需求。历经5年精心准备的“中华字库”工程进入研发阶段,工程将利用先进的信息技术手段,收集和汇总历代文献资源中出现过的汉字和少数民族文字,辨析源流衍变,确定每个字形的历史地位,建立汉字及少数民族文字的编码和主要字体字符库。字库建成后将是开放性的,会及时吸收新的字或字形。
你是否知道?计算机屏幕上显现的每个字符,背后都有一个对应的被国际标准化组织正式认证的区位编码。如果字符没有编码,它将无法在电脑中显现和存储。而这个字符编码汇聚的地方,就是字库。
我国现有的字库只收入了7万多字,除了遗漏的许多现代汉字外,古汉字和许多少数民族文字也没被纳入进来。而随着电脑应用的日渐广泛,现有的字库已远远不能满足人们各方面的需求。
一条喜讯传来:历经5年精心准备的“中华字库”工程日前正式进入研发阶段。
“一套权威全面的字表”
“中华字库”工程总体组专职副组长张力伟介绍,该工程将利用先进的信息技术手段,收集和汇总历代文献资源中出现过的汉字和少数民族文字,辨析源流衍变,确定每个字形的历史地位,建立汉字及少数民族文字的编码和主要字体字符库,重点研发汉字输入、输出、存储、传输以及兼容等关键技术。
完成后的“中华字库”预计可编码字符数在50万左右,包括汉字古文字约10万、楷书汉字约30万、各少数民族文字约10万。
张力伟表示:“‘中华字库’最终的呈现状态,就是做出一套权威全面的字表来,然后提交给国际标准化组织,在电脑区位中给每个字编码,厂商再据此做出字形,从而满足现实的各种需求。”
“永久的保存和无限的传播”
上古至今的各种传世文献,是中华各族人民的精神财富,具有不可估量的价值。“让我国的传统文献实现‘永久的保存和无限的传播’,是‘中华字库’建成后最重要的意义。”张力伟指出。
张力伟说:“网上已有的一些文献资料,文字的准确度不够,还常常出现拼字、空格、替代等,都是因为字库不完善。古文字中的甲骨文、铜器铭文等,是文化的瑰宝。但由于目前我国的古文字都没有编码,导致现在无法对其实现数字化,录入时只能转写成现代的通行字,转写中字的意义损失很大。因此,从长远来看,要对传统文化典籍进行数字化的存储和传播,就需要建立一个容量更大的‘中华字库’。”
“‘中华字库’工程完成后,不仅对文字学和文献学领域贡献巨大,还将会对我国的整个社会科学研究产生巨大的推动作用。”北京师范大学教授、“中华字库”工程楷书召集组召集人李国英这样说。