语文现代化工程实验的一条成功之路——26104 电脑汉字简介

来源 《汉字书同文研究》第4辑(2003年) 发布时间 2014-12-10

一、历史背景和时代背景:
铁器的发明和文字的使用是人类进入文明时代的主要标志。中国铁器的使用早于欧洲,文字的使用有六千年的历史,是世界四大文明古国之一。从公元四世纪至十五世纪中国的经济、文化、科学、技术均处于世界领先水平。
语言文字是人类智慧的结晶, 语言文字的发展是人类文明发展的见证,与语言文字关系最密切的科学技术的发明,始终是推动人类历史发展最强有力的动力,如纸张、印刷术、字母打字机、电话和计算机的发明等,都具有里程碑的意义。
汉语与汉字,是全世界使用人口最多、历史最悠久的语言和文字、也是当代最有活力的一种语言和文字。当中国的经济、文化、科学、技术还处于世界领先地位的时候,没有人会说我们,这也不行,那也不行。而当欧洲在文艺复兴以后,已经大踏步地从中世纪的黑暗中走了出来,接着又完成了第一次产业革命和第二次产业革命,西方社会的经济、文化、科学和技术的发展,不但全面赶上、而且大踏步地超越了东方。贫弱的中国成了西方列强宰割的殖民地和半殖民地。落后伴着贫穷,屈辱伴着悲奋,渡过了近三个世纪。我们的语言被说成是'还没有成熟到可以用字母来表达'的语言,我们的文字被说成是‘全世界最落后的文字',承认‘落后’并不可耻,它需要勇气和自知之明,是反思和觉醒的表现。正是在这种历史背景下,在一百多年来的前仆后继、一往无前的革命洪流中,我国语文界的先驱分子,举起了文字改革的旗帜,发动了切音字、罗马化、拉丁化等一波又一波的新文字运动,到新中国建国初期,一个空前的蓬勃发展的宣传、学习拉丁化新文字的运动,在全国形成。1954年,国家建立了领导全国文改工作的中国文字改革委员会。从此,文改工作纳入了有领导、有规划、有步骤的发展阶段。
在文改会的领导下,坚持‘要走世界文字共同的拼音方向’,根据音素化、拉丁化、口语化三原则,制定了全国统一的汉语拼音方案,并迅速在教育部门全面推广。同时大力加强方言地区的推广普通话的工作,为实现文字拼音化进行思想、舆论、组织、师资等各方面的准备。在改革开放以后,随着信息化浪潮的到来,文字拼音化的呼声再次高涨,拼音化的形势,比过去任何时候都好。为了适应信息化对语言文字工作发展的更高要求,根据国家领导的部署,文改会适时地改名为语言文字工作委员会,从战略上加强了对语言文字工作的全面领导,特别是语言文字信息处理方面的领导。开拓了在语言文字信息工程领域进行拼音化的强化实验阵地,进一步增强了语文现代化的动力和信心。现在,拼音编码输入法已经成为汉字进入计算机的主流输入法。中国信息化的进程,正在推动着文字代码文字化的进程,一种更加富有生命力的电脑汉字输入法,必将应运而生。它将成为新一代的主流输入法,电脑汉字既是汉字的输入码,又可以在电脑及其网络环境中,起着文字的作用,直接传输和交换汉语的信息。从而折射出中国汉字拼音化的曙光。
电脑汉字的出现,一方面象征着我国信息化开始进入了一个新阶段,红火了四分之一世纪的汉字编码大潮,不可逆转地走向衰落。同时,它又昭示着语文现代化的工程实验,即将进入一个以拼音化为主要特征的新阶段。在电脑汉字的推动下,全国统一的、更高效能的拼音汉字,必将应运而生、茁壮成长。
当全国统一的拼音汉字逐步普及,并在信息处理中发挥主导作用时;当拼音汉字通过庄严的法定手续,开始以第二种合法文字的身分,进入社会流通领域时;一种更加富有活力的‘一语双文’相辅相成、长期共存的局面形成的时候,我国语文现代化的历史任务就圆满完成了。
二十一世纪,将是中国实现语文现代化的最佳时期,因为我们可以通过信息化来强化推动语文现代化,再通过实现语文现代化去促进更高水平的信息化。这就是我们必须要走的路。

二、语文现代化的曲折而光辉的道路
语文现代化是我国一百多年来的大众语运动、白话文运动和文字改革运动的继承和发展,是当代语言文字工作的总目标和大方向。它包含着语言规范化和文字现代化两个方面,重点是文字现代化。它的最终目标,是彻底改变我国语言文字与信息化时代不相适应的落后状态。
语文现代化所走过的道路,充满艰难险阻,有高潮,也有低潮,有成功的经验,也有失败的教训。从总体看,它是沿着推动社会发展和进步的方向前进的。这是无可怀疑、不能否定的。
有人说,文字改革已经失败了,原因是文字改革的口号现在不提了,文改会的牌子也没有了。作为文字改革当前的一项工作,汉字简化已经历史地完成了。经过几代人使用的检验,证明基本上是好的,极少数有问题的已在调整之中。众所周知,文字的历史稳定性,比语言还大,动一个字要影响几千年。不能隔几年再来一次,那是对历史文化继承不负责任的态度。如果我们能在本世纪内实现汉字拼音化的飞跃,那么,已经完成的汉字简化,很可能就是方块字发展史上带有改革性质的最终的简化。因此,现在不再提汉字改革的口号,不挂文改会的牌子,正是党和国家正确决策的体现。
汉字拼音化的探索、研究与实验,从外国传教士开始,已有近四百年的历史,中国的先驱们也搞了一个多世纪,但文字的拼音化,仍然停留在方案的基础上,没有实质性的突破,应该引起深刻的反思。反思有积极的,也有消极的。积极的反思是认真查找原因,深入分析,更新观念,采取措施,积极改进;消极的反思则是强调客观,寻找借口,自圆其说;更又甚者,由原来的拼音化的拥护者,一变而成了新的反对派。说什么‘神奇的汉字’根本不需要拼音化。
在全世界诸多文字中,汉字的寿命最长,是唯一贯通古今、文化底蕴深厚、阅读效率极高、生命力极强的文字。它的优点,应该得到肯定和保护。但是方块字也确实存在着严重的缺点,它的难学是举世公认的,事实上它已经严重影响到我国国民教育的现代化,使我国语文教学面临着严峻的形势,广大学龄儿童长期处于高负荷的紧张状态,视力健康受到严重威胁(中、日两国为倒数前两位);它的无序性严重影响对汉字的科学管理,汉字的检素是世界最难的;由于方块字,使我们失去了一个汉字机械化的时代;在信息化时代,又使汉字进入计算机的时间,比西方迟后了四分之一的世纪;为了解决汉字的输入问题,需要进行编码,为了研究和学习、使用编码,人们又需要付出多大的代价;为了解决汉字的输出问题,还要装备一个包含全部字种、字号、字体与字型的点阵字形库,而且随着汉字量的增大和字形精密度的提高,字库总容量呈指数上升,其规模可能是西文字库的数千倍甚至更大,这就决定了同样是计算机,同样是搞文字处理,在相同的软件及硬件资源配置下,西方和东方,根本就不可能处在同一条起跑线上。这就是必须面对的事实!
汉语要走向世界,拼音汉字是康庄大道,方块字就是独木桥。为了炎黄子孙世世代代的利益,也为了外国人学习汉语的方便,信息时代需要拼音汉字。
语文现代化的根本宗旨,就是要把语言文字中最本质的、最基础的、也是最有生命力的东西,加以巩固和发扬,而对所存在的与信息化时代不相协调的东西,加以改造和扬弃。文字拼音化的路,必须沿着这一宗旨开拓前进。
现在比较普及的全拼输入法,如果它本身是文字的话,就已经显示了把汉字从繁难、多符、无序的状态解放出来的能力。遗憾的是,它只是简单的、粗糙的注音工具(一般不具备表达声调的能力),无法完成代码的文字化。
四百年来几几乎所有汉语拼音方案,都遵守一条神圣的原则,就是纯拼音。以为只要把语音表达出来,文字就形成了。理论根据是:语言中所有的词语都是通过语音表达出来的。西方拼音文字,原则上就是依据这一理论创造出来的。汉语则不然,单纯的语音,不能充分准确地表达汉语。现代汉语中的普通话只有411个音节结构,而且还有进一步减少的趋势,加上声调也只有1200多个,而需要由汉字表达的独立义项有15000多项,纯拼音所能提供的单个音节的语音形态,无论如何都无法普遍保证字形对语义的确定性。据《汉字信息字典》对7785个汉字的统计,每字只含<=2的义项的字,竟高达百分之81.6。这是汉字字形与字义可以达到条件反射、从而保证具有最高阅读效率的根本原因。因此,纯拼音是汉语拼音文字必须首先突破的禁区。
汉语与西方语言有着本质的区别,而语言的特点,本质地决定了文字的特点。汉字服务于汉语数千年,证明了汉字对汉语有着本质的适应性。汉语拼音文字要有效地为汉语服务,就必须具备汉字所固有的本质特点,这种文字才是我们所追求的目标文字,也可以简称为拼音汉字。语文现代化只能沿着继承与改革相结合的道路即汉字现代化的道路前进,汉字的音意字与语素字的特点应当继承,而落后的表音方法及形体结构的多符性与孤立状态则必须加以扬弃。
有人说,拼音文字如果加上表义成分,是迁就落后,而且会变得不伦不类。这是由于文字发展三段论造成的偏见。最早提出这一理论的,是原苏联语言学家契柯巴瓦。他把文字的发展界定为表形、表意、表音三个阶段。这种似是而非的理论,已经进入了我们的教科书和工具书了。这种理论既没有庄严的历史依据,又缺乏科学的说服力。人类文字首先是起源于记号,其次才是象形。单独的象形不能形成为完整的文字。汉字明明是以形声为主体的音义结合的文字,怎么能简单地界定为表意文字呢?汉字‘六书’象形只其一,与义有关的有三书,与音有关的也是三书。汉字不可能发展为纯拼音文字,已为近四百年的拼音化的历史所证明。当今西方的拼音文字,有哪一种是从表意文字发展过来的呢?
文字的形、音、义三要素,形是外壳,音是中介,而义是内核,是联系客观万事万物的纽带,也是区别汉语中大量同音字、词的主要手段。字形中含有义的成分是语义资源的合理开发和利用,是中华民族先民智慧的结晶,又何落后之有?
事实上,在这个世界上根本就不存在纯拼音文字,十个阿拉伯数字就是表意的,它的使用范围比拉丁字母还要广,已经普遍用于各个民族对数词及数组的表达。在有关自然科学及工程科学中,就有上万种带有通用及规范性质的科技符号,已经溶入到各种语言文字之中,起着交流信息的作用。不表音的标点符号(包括频率很高的空格),是言语时各种间歇与停顿的反映,虽然并不反映具体的词汇,但却蕴涵着重要的语法意义。这些广义的、无声的文字符号,以及词汇中不发音的哑字母或发音相同而字符串的结构不同等普遍现象,也从另一侧面证明了:所谓纯拼音文字是根本不存在的。

三、汉语拼音方案应当更上一层楼
汉语拼音方案是中国人向西方学习拼音文字的总结,如果只是作为一个为汉字注音的工具,它可以永远保持现状,以尊重其历史价值。如果是要作为文字使用,就必须根据汉语、汉字的本质特点作相应的调整和扩充,就必须突破纯拉丁化的限制,否则阅读的高效率将丧失殆尽。
拉丁字母产生于西方语言。辅音极其发达,可以自由连缀。在音节内部,辅音可置于元音之前,也可置于元音之后,从而形成近万种不同的音节结构(何善芬《英汉语言对比研究》p26)。元音则数量较少,一个音节原则上只有一个元音。汉语基本上没有独立的辅音形态,也就没有它的自由连缀;汉语音节数量少(只有英语的二十分之一),这是根本原因;而汉语的元音则十分发达,可以独立存在。用多个字母的组合来表达丰富的韵母,不但增加了学习汉语拼音的难度,且必然拉长音节结构,降低文字的阅读效率。如表音遵照汉语传统的声韵体制,每个韵母原则上只用一个字母,提高文字效率就可以收到事半功倍的效果。由于各个韵母之间存在一定程度的互补性,总体上只要增加十来个韵母键,就可以达到预期的目的。
汉语是有声调的语言,声调是区别语义的重要手段。在汉拼中它是处于附加符号的地位,在键盘上没有它的位置,可操作性极差。要使汉语拼音文字化,就必须把它上升到与字母等同的地位,成为字形的固定组成部分。

四、26104电脑汉字指导思想;
形体国际化、表音声韵化、表意集约化、字词组合化是总的指导思想。
26104分别代表26个拉丁字母、10个阿拉伯数字、4个声调符号,全都是通用键盘的键位符号。由这些符号组成的文字,形体是100%的国际化,以保证共享国际硬件资源。
表音与汉语语音的声、韵、调系统基本一致。声母由辅音字母与及作零声母的元音字母表示;韵母主要由元音字母与10个数字韵母表示,个别声母有条件地兼作韵母或零韵母使用,四个调符分别代表阴平、阳平、上声、去声四声。
在分析基础上整合为34个意类,分别由24个字母和10个数字表示,比现有的约200个左右的表意部类更加集约化了。意符固定在音节之末,不发音。单音节字的长度<=3个字符。
汉字是汉语的特产,是形、音、义最小的统一体。绝大多数字是汉语中可以自由应用的最小语义单位,绝大多数词是由字构成的独立语义单位。在保持字本位的基础上实现分词连写,以逐步形成词的独立形象,进一步提高表达汉语的精密度。
在不影响阿拉伯数字的传统功能的前提下,尽可能用阿拉伯数字取代拼音数字。并且依据序位原则,开发它的表音或表义功能。数字用作韵母或意符时,不可能是首字符,当数字处于首位时,则表明它是数或序了。
人名、地名或其它专名的首字符要大写,前后字连接可能产生混淆时,后一个字的首字符也要大写,或在前一个字的末字符之后,加隔开字符‘’’。

五、26104电脑汉字的功用
用于输入方块汉字,平均每个汉字2.2键(含空格符号),可整句、整段、整篇一次性自动转换。本系统有常用词库八万余条,在输入多字词时,可通过词语的冗余信息,有效减少实际击键次数,输入效率还可进一步提高。
电脑汉字本身可以作为数据文件保存或传输,在网络环境下 熟悉相同电脑汉字的网友间,可以直接通过电脑汉字进行相互对话与交流。
由于电脑汉字与现行汉字具有相同的基因与血型, 因此可以通过学习电脑汉字,来帮助学习掌握汉字与汉语。
电脑汉字的分词连写,有助于建立对汉语的词的独立概念及形象;进一步强化对汉语的表达能力。
由于实行了拼音化,多音字问题的困惑基本上解决了。由于有了音与意的整合,同音字的语义混淆问题,获得了更好的分化,从而使同音词的语义混淆问题,也就从根本上解决了。
在熟练掌握电脑汉字后,可以完全摆脱方块汉字,从而使我们在面对一切软、 硬件资源方面,同西方文字一样,处于真正平等的同一起跑线上。在国外工作环境下,虽然没有汉字平台,通过电脑汉字的数据文件,照样可以在国际间通讯。
26104电脑汉字结构简单,平均字长较短,书写流畅,笔画可以一面倒。个人还可以用于记日记、作笔记,充当速记的工具。

六、26104电脑汉字将展示汉字拼音化的美好前景
26104电脑汉字明确继承汉字所固有的本质特点,坚定维护形声互补、音意相辅、字词共荣的光辉传统,它所揭示的汉字拼音化是汉字强大生命力的一次升华,是汉字发展历史的延伸与继续,而不是汉字发展的终结,更不是汉字的灭亡。
它将提高汉字表述汉语的精密度,不但表现在语音上, 而且还反映在词汇意义及语法意义上。它既维护汉语语音集约化的历史发展成果,又充分利用语义分析化的历史发展成果,彻底解决同音字词高度集中所带来的困难,从根本上保证文字相对于语言的高精密度的要求。
它所展示的不但是高效率的拼音文字(平均音节长度最短),而且是更彻底的拼形文字;从字合成词、词组成短语、短语构成句子这样的组合层次看问题,把各个可以自由运用的最小的语义单位(语素),有序地拼装成一个独立完整的大的语义单位,还体现了具有鲜明的拼意文字的特点。
它把音、意、形建立在有限的可以操作的规则基础之上,必将使汉字难学、难认、难写、难记的缺点,获得根本改善。方块字的难学,在于它要记忆947个基本声旁,二百多个表义部首和不少于3000的基本字形。还要加上学习汉语拼音,不少于两种的查字法,以及相应的汉字编码输入法等。26104电脑汉字可以揭示这样一种学习前景:通过学习拼音汉字来学习方快字,比单独学习方块字加汉语拼音、查字法、编码输入法等,所花的时间还要少,从而为我国教育现代化带来新的活力。
它所展示的拼音汉字,在可比的单项效率及整体的综合效率方面,将通过科学的比较分析,证明在总体效能及技术性能指标方面,全面超越方块汉字和西方拼音文字的水平。不但保持了最高的阅读效率,而且也是全世界写得最快和检索最快的文字。
它所展示的拼音汉字,与现行汉字具有相同的基因,它们可以分别单独使用,也可相互参用;相辅相成,长期共存。既可保证现行汉字原汁原味地传之久远,贯通古今,在历史研究、考古研究、古代文学研究、汉字文化传统研究,以及汉字书法艺术研究等领域,方块字仍将继续发挥其得天独厚的作用;另一方面又可使拼音汉字传遍中外,展翅腾飞,为中国的信息化服务,为汉语走向世界、汉外教学、中外文化交流服务。

26104的工程实验只是为了证明一个普通而简单的道理,告别由西方学来的纯拼音的僵化模式,走继承与创新相结合的道路,伟大的语文现代化的历史任务,就可在本世纪内胜利完成,汉字拼音化的光辉前景,就一定会展现在祖国的大地上。历史还将证明,汉语和汉字的光辉是永恒的。


附:26103电脑汉字例句及与相应的汉语拼音和英语对比: 1. 1.我是一个中国人。
wo shi yige Zhongguoren.(汉语拼音)
I'm a Chinese.(英语)
o s 1g`Zgor.(26104电脑汉字)
2.伟大的中华人民共和国万岁!
weida de Zhonghua Renmin Gongheguo wansui!(汉语拼音)
Long life the great People's Republic of China!(英语)
weadad Zha/rmg0`hgo w8svi!(26104电脑汉字)
3.国歌歌词:
起来!不愿做奴隶的人们,把我们的血肉,筑成我们新的长城;中华民族到了最危险的时候,每个人被逼着发出最后的吼声!起来!起来!!起来!!!我们万众一心,冒着敌人的炮火,前进!冒着敌人的炮火,前进!前进!前进!进!
qilai! bu yuan zuo nuli de renmen, ba womende xuerou zhucheng women xinde changcheng; Zhonghua Minzu daoliao zui weixiande shihou,meige ren bei bizhe fachu zui hou de housheng! qilai! qolai!!qilai!!! women wan zhong yi xin, maozhe diren de paohuo qianjin! maozhe diren de paohuo,
qianjin! qianjin! qianjin! jin!(汉语拼音)
ql2! byo`zo` nu/lir d rm,ba omnd xv`r9,zyoc7 omn xnd c4c7t;Zha/mzyr
d5l zvve2x82d s/h9`,mvg`r bvb-ze fc zvh9d h9hs7h! ql2! ql2!! ql2!!! omn
w8z0r 1xn- m5oze d/rd p55ho\,q8jn!m5oze d/rd p55ho\,q8jn!q8jn!q8jn!jn!
(26104电脑汉字)
(英语翻译从略)
基本比较:
1.句长:方快汉字<电脑汉字<英译句<汉语拼音
2.表音粗糙性:方块汉字>汉语拼音>电脑汉字
3.表义精密性:电脑汉字>方块汉字>汉语拼音
26104电脑汉字与英语的综合对比及单项分析对比,有待于更深入的研究。

(上海交通大学 李公宜 李海飚)

QQXIUZI.CN 千千秀字