完善汉文字
有人说:汉字有很多缺点,学习、使用都不方便,要淘汰,终将要被拼音文字所取代。汉文字到底有什么缺点?拼音文字到底有什么优点?汉字一定要被淘汰吗?
事物都是一分为二的,汉字和拼音文字既有各自的优点,也都有自己的缺点。这里主张“完善汉文字”,就是认为:克服汉字的缺点,发扬汉字的优点,汉文字不但不会被淘汰,而且一定会成为世界上最优秀的文字之一。
语言是人们用来描述自然界万事万物的工具,文字是用来表达语言的符号。语言有语音和语意两个要素,文字有字形、字音、字意三个要素。文字的形、音、意三要素,并不是说有“表形”、“表音”、“表意”三种文字,文字都是用来表达语言意思的,所以,字意是文字的基本要素。
拉丁文字由26个拉丁字母拼成,字形简单;拉丁文字的字音由字母而定,字形确定了,字音也就定了,所以,拉丁文字又称“拼音文字”,不应叫“表音文字”。拼音文字形、音结合密切,因形见音,这是拼音文字的一大优点;拉丁字母序使拉丁文字成为有序文字,便于检索和应用,这是拉丁文字的又一个优点。拉丁文字因形见音,但是,和字意的联系是生硬、呆板、杂乱的。英文字index,字意是:索引、目录、指数、系数、分数、幂、率、标志[高]、符[记]号、示量、高程、指标[引、示、南]、指示[定位]器、针盘、(刻度盘上的)指针、(铣床)分度头、食指、示指、参见号、加[编(入)、附以]索引、检索、记…号码、转换角度(使对准位置)、转(换)位(置)、搭档、改[变]址、指向[明],其中的:指数、系数、分数、幂这些意思本身就是相互矛盾的,拉丁文字的这种字意特性不利于人们对文字的理解和记忆,不利于学习。
汉字造字有六书:象形、指事、会意、形声、假借、转注。日、月、人、目、山、水、牛、羊、……,都可以画物象形;以木为树,树上的部分“末”表末梢,树下的部分“本”表根本,视而可识,指事可见;“休”为人在树旁,大树底下好乘凉,表示人在休息;“看”为手在眼上,手搭凉棚望远看;“信”为人说话要可信、守信。汉字大多数都是形声造字,还有假借、转注,有的字有些抽象,但是,推本求源都离不开象形。汉文字能生动地表达天、地、风、雷、水、火、山、泽,复杂宇宙、自然万物。因为,汉字字形取材于自然界,观象于天,观法于地,雄伟的山峰,蜿蜒的河流,茂密的树林,长空飞鸟、水底游鱼、寓于文字,汉文字因形见意,形、音、意完美结合。所以,汉文字构造本身就蕴含着丰富多彩的自然情趣,能够完美地表达语意,易于学习、理解、记忆,这是拼音文字远不可及的。
汉字的主要缺点在无序、多杂两个方面。解决汉字的序和多杂的问题是完善汉文字的关键所在。
汉字的序
汉字大约有六千年的历史,但是,至今没有一本可供简便查字的字典,这是汉文字的一个千古憾事!就是因为汉字没有一个有实用意义的序。汉字检索法应用最多的有:部首法、笔画法、号码法、音序法四种,最常用的是部首法和拼音法两种。
部首法:东汉许慎在公元100年时著《说文解字》,将汉字按540部首排列,编成我国第一部字典。数以万计的汉字放在一起进行查寻,简直就是不可能;按部首分为540类,在一类中查寻,其困难程度,十倍、百倍地降低了,几乎不可能的事,变得可行了。部首法是汉字发展中的一个历史事件,一千九百多年以来,部首法查字仍然是汉字检索中的一个重要方法。但是,部首只是汉字的分类,没有序的概念,部首本身也是无序的。金、木、水、火、土、山、石、人、手、口、草、女、言、虫、鸟等大部首,多达几百字,上千字,查字一般也是很困难的;若不能准确判断一个字的部首,需要试探其它部首,花费的时间就更多了;若无法确定部首,这个字就不能用部首法查了。所以,部首法并不是一个好的查字法,正是由于这样,才会出现汉字的多种查字法。
拼音法:解放后制定了汉语拼音方案,借用26个拉丁字母取代原有的40个注音符号给汉字注音,按照汉字语音就产生了汉字的拉丁字母音序。解放后出版的汉语字典、词典,多数是按音序编排的,按拉丁字母序查字十分简便。但是,由于一个汉字只有一个音节,普通话语音里只有417个音节,致使汉字的同音字常常多达几十,甚至一、二百以上,不仅给字典查字,尤其是电脑按拼音打字增加困难;又由于地区方言多杂,语音成为一些人难以克服的障碍;更由于汉字多杂,一般人只认识四分之一、五分之一,甚至更少,不认识的字,音序字典无法使用。所以,音序字典不附有“部首检字表”,其实用价值就会受到很大的影响。有时遇到无法确定部首又不知道读音的字就无法查找。汉字同音的现象表明,汉文字是不可以用拼音字母来取代的,试看:“chǎn pǐn quán bù hé gé”,是完全规范的“拼音文字”,这几个字到底是什么意思?!一个民族的文字不能准确表达语言的意思,闹出这样的笑话,这个民族的文字还有什么尊严?什么信用?什么严肃性?所以,不应叫“汉语拼音”,只应是汉字注音;拉丁字母只是汉字注音符号,不可取代汉字的形象。
汉字形音码是已获国家发明专利的汉字编码,其特点也是借用26个拉丁字母,把汉字看成是由26类汉字字母拼成,这样以来,拉丁字母的优点就简单、自然地被借到汉字里来了。学习形音码:1.不受文化水平限制;2.不受地区方言影响;3.不需要死记硬背。汉字形音码可供全民方便使用,既可使用形音码序字典简便查字,同时也可以利用形音码进行计算机的汉字输入,形音码一举解决了汉文字发展的两大历史难题。
《现代汉语阶梯字典》是按形音码序编排的字典,有四个方面的内容:1.形音编码;2.汉字(简、繁互注);3.汉字注音;4.电脑码。掌握形音码,对任何汉字,立即可以定出它的编码,按码序很快就能查到字,既不用部首,也不靠拼音。使用了近两千年的主要查字途径“部首”法,就自然淘汰了;拦在人们面前的因读音不准和很多不认识的字无法查找的障碍,都自然消失了,这无疑是汉字发展史上的一个重大事件。《现代汉语阶梯字典》设有繁体字头,按简、繁互注编排,所以,也实用于使用繁体字的地区。繁体字后注有简体字,有利于使用繁体字的人逐渐熟悉简体字。《现代汉语阶梯字典》只有注音不带注释,容量大大减少,使用方便,若需注释即可按已查到的注音,再查音序字典,使缺乏实用价值的音序字典被激活了。《现代汉语阶梯字典》就像是通向音序字典的一个梯子,故称“阶梯字典”。《现代汉语阶梯字典》有文字版和电子版两种,使用十分方便,查字非常便捷。
汉字简化
汉字多杂要简化,简化汉字包括两个方面:一是字形的简化;一是字数的简化。有关部门统计,半个世纪内的出版物,使用的字在四、五千范围内,而《新华词典》2001年1月修订第三版,收单字15200条;《康熙字典》收字头数47035个;《汉语大字典》收字头数54678个;《中华字海》收有85568字。对于研究汉文字的学者来说,会用毕生精力;对于一般使用汉字的人,超不出几千字的范围。《中华人民共和国国家通用语言文字法》已经以法律的形式明确了汉字简化的内容,使汉字易学实用,便于全球推广。要补充说明的是:应从严控制对汉字的乱造、乱用现象,将规范字广发到各有关单位、部门,控制用字。中华民族应该养成规范用字的好习惯。
汉字形音编码
过去研究汉字结构,用“笔画”、“部件”、“部首”、“偏旁”、“四角” 等概念,都是只观察一个汉字的局部构造;形音码则是考察一个汉字的全部整体、所有笔画,确定哪些笔画构成一个部件,与某个拉丁字母形状相当、相象,这个部件就确定为一个汉字的字母,并取其相应的拉丁字母作为这个汉字字母的代码。一个汉字可以包括一个或多个汉字字母,与拼音文字由拼音字母拼写而成相似,汉字就是由汉字字母拼写而成,这就是汉字字母化的概念。所以,汉字字母化不改变汉字的形体构造,不是用拉丁字母拼出汉字的形象。汉字字母不是任意割取的,而是自然形成的,如下面的一些例字:
订印叩吼色邹日昂区凶百页巫吹晶唱歌石录之岁多丐是眉君良江真鬯比哎啊红纽兴旭协李柑哈艺飞爻疋点永太咀斤汗洋
上面的一些汉字都是由汉字字母组成,同时也可以看成是由拉丁字母组成,不经提示,很多人都一定会自己给出很多字的英文字母;一经提示,你就会心悦诚服地认可所有的英文字母。汉字字母和英文字母在这里就完全联系起来了,这种联系是很自然的,好象预先约定一样。汉字字母和拉丁字母的联系,使拼音文字的很多优点就可以借用到汉文字里来。运用电脑技术进行汉字书写、记录、打字、印刷、收发电报、传递信号、编辑字典、编制索引等都象拼音文字一样方便,同时又不改变汉字的形体,保留了汉字因形见意的独特优点。
音的因素:汉字形音编码,用形、音两个因素来互补,主要按字形,字音的因素为辅。汉字形音码总共只用12个字的音码:虫(c)、大(d)、点(d)、戈(g)、横(h)、井(j)、木(m)、捺(n)、儿(r)、鱼(y)、子(z)、走(z)。12个汉字的12个字母代码,非常简单不需死记。12个汉字字母带出12类汉字字母:虫类读音、大类读音、点类读音、戈类读音、横笔读音、井类读音、木类读音、捺笔读音、儿类读音、鱼字读音、子类读音、走字读音。
现将上述例字的英文代码列于后面:
订(ij) 印(ep) 叩(op) 吼(ozl) 色(hdl) 邹(hep) 日(b) 昂(bcp)
区(cx) 凶(xu) 百(jb) 页(jnv) 巫(ivv) 吹(ohv) 晶(bbb) 唱(obb)
歌(jojohv) 石(jo) 录(ejx) 之(dz) 岁(eh) 多(hh) 丐(fs)
是(bfv) 眉(pb) 君(po) 良(dpk) 江(di) 真(xbd) 鬯(xdul) 比(ll)
哎(ohx) 啊(opjo) 红(wi) 纽(wb) 兴(dk) 旭(xb) 协(xxd) 李(mz)
柑(mb) 哈(ovho) 艺(hz) 飞(zd) 爻(xx) 疋(fv) 点(iod) 永(jx)
太(dd) 咀(ob) 斤(jt) 汗(dt) 洋(ddt)
每一个汉字和他的字母与括号里相应的拉丁字母(汉字代码),读者应该边看边思考,希望读者能自己给出括号里的汉字代码,这才算看懂了这段文字,尽量减少死记硬背的负担。
在这段所选的例字中,汉字都是比较典型的,汉字字母和相应的拉丁字母都是很相近、很相象的。实际上汉字结构是很复杂的,有些汉字字母并不是很象英文字母,需要分析、推论、联想,实在联系不上的,不应勉强、牵强,否则流于无理、死记,这是形音编码力求避免的。汉字字母和拉丁字母实在不象的,就定义为音码。
形音码完善地解决了汉字序的问题,使汉字字母化,虽然汉字字母个数有四、五百个,但是归并到26类,与26个拉丁字母相对应,既不用部首,也不靠拼音,易学易记,把汉字看成是由拉丁字母组成,更便于外国人学汉语;电脑技术使手写的汉文字与拼音文字一样,成为键盘文字。
解决了汉字的序和汉字的简化,就实现了完善汉文字的要求,就能弘扬民族文化,就能为推动世界文化发展作出更大的贡献。
作者简介:
石月明,同济大学计算机系。