汉字规范的科学化
汉字规范的科学化,是指遵循汉字的构造规律、演变规律和社会应用规律,择取最为优化的方案,使所制定的规范科学、合理、适用。
《通用规范汉字表》(以下简称“《字表》”)是在以往几十年汉字规范工作经验和现代化、信息化条件下研制的,其科学化程度较以往字表有新的提高。主要体现在两个方面:
第一,运用现代技术手段处理语料,使字表的定量、分级、收字更加科学实用。
一、二级字表是对大量语料进行统计分析得出的结果。语料质量直接影响着统计结果的科学性。本次制表选定国家语委的“现代汉语平衡语料库”为基础语料库,保证了作为研制基础的语料的客观性和代表性。同时,又使用北京语言大学“现代新闻媒体动态流通语料库”、《规范汉字表》研制课题组建立的“教育科普综合语料库”、《规范汉字表(送审稿)》专家委员会工作组建立的“儿童文学语料库”三个辅助语料库对一、二级字表的定量、分级进行核查,以确保语料库统计数据的全面有效。以这些语料为基础,依据“汉字效用递减率”,运用语料库技术和统计学理论,辅以适当的人工干预,确定一、二级字典字量和收字。
三级字表中的姓氏人名用字、地名用字、科学技术术语用字由主管部门公安部、民政部、国家测绘局、全国科学技术名词审定委员会和实际应用者提供,中小学教材文言文用字从“中小学语文教材文言文语料库”(收1949—2008年中小学语文教材文言文)中提取。其中少量可疑的姓氏用字和地名用字,还向相关地方政府和基层群众直接进行了核实。
第二,从汉字社会应用实际出发,对以往汉字规范的缺失和矛盾进行弥补、修订和调适。
汉字规范涉及汉字整体系统、现代应用与历史传承、通用领域与专门领域、内在理据与约定俗成、语言文字与政治及社会等关系。汉字规范必须树立全局意识,统筹兼顾,在各种矛盾的处理中把握好合适的“度”。尤其当汉字内在理据与汉字社会应用发生矛盾的时候,汉字规范必须从社会用字的实际出发,充分尊重群众的应用习惯。对于以往规范中存在的问题,既实事求是科学对待,也充分考虑历史形成的全民习惯和社会的可接受程度,凡需改动之处,都遵照“约定俗成”的原则审慎处理,尽量保持社会用字的稳定。这也是汉字规范科学化的重要原则。
用附表方式对“一简对多繁”加以分解。简化字中,由于同音替代等原因,存在着一个简化字对应简化以前多个汉字的现象,如干(干/乾/幹)、发(發/髮)、纤(縴/纖)等,这就是所谓的“一对多简繁关系”。简繁汉字非一一对应,给计算机繁简转换、两岸四地文化交流以及古籍阅读与整理等造成不便。如果因此而恢复部分繁体字,就又将造成文化教育领域的波动,不利于社会用字的稳定。一对多简繁关系造成的困难可以通过研制新的计算机软件、加强相关知识点宣传等方式解决。两相比较,《字表》决定不恢复繁体字,而在附表中对具有一简对多繁现象的简繁字的音义对应关系进行详细分解。这应该是一个更为稳妥和合理的方案。
在坚持原则的前提下灵活处理异体字。《第一批异体字整理表》中包含了不少非严格意义上的异体字,有的非正字的义项并不能完全由正字所取代,这给社会用字造成困扰。由于该表已经实行多年,如果完全推倒重来,也会给大众带来不便。因此,对《第一批异体字整理表》(包括后来文件对该表的调整),《字表》采取坚持原则、灵活处理的方式。一方面按照严格的异体字定义,对《一异表》重新进行审视;另一方面,对非严格意义的异体字,根据不同情况进行不同处理。对于正字义项完全能够包含非正字义项的字组,仍认可其正异关系;对于正字义项无法完全包含非正字义项的字组,在认可其正异关系的同时,将非正字在特定意义上视为规范字(着重照顾人们在人名、地名命名方面的习惯和用字需要);对于正字义项与非正字义项完全不同的字组,不再处理为正异关系。
为类推简化划定合理范围。类推简化指《简化字总表》第二表收录的132个简化字和14个简化偏旁,在作其他字的组成部分时同样简化。这样有利于保持简化字的构形体系,方便记忆和使用,但无限制的类推简化会造出一批新的同形字、形近字、违反汉字构形规则的怪异字、历史上并不存在而现实中极少使用或从不使用的僻字和死字,给整体的汉字系统造成新的混乱,拉大汉字应用的古今距离和两岸四地距离。《字表》将类推简化限定在通用范围,较好地调适了由类推简化引起的各种矛盾,解决了一个存在了几十年的老大难问题。
从实际出发,暂缓对汉字微观字形的进一步调整。尽管字形标准化是汉字发展和信息处理的需要,但鉴于字形调整尚未得到社会的普遍认同,加上字形问题涉及宋体、仿宋、楷体、黑体四种常用印刷字体的字形规范,需在做好通用字集与大字符集字形协调、印刷体与手写体协调、海峡两岸字形协调的基础上进行统一整理,因此《字表》仍沿用《印刷通用汉字字形表》和《现代汉语通用字表》的字形规则,字形的进一步统一规范留待新的字形标准出台后进行。这种处理,是在需要与可能之间的适宜的选择。
(作者系语文出版社原副总编辑)