汉字的发展与中国的统一

来源 《汉字书同文研究》第4辑(2003年) 发布时间 2014-12-10

汉字的发展与中国的统一
﹝根据在“纽西兰中国和平统一促进会”汉字研讨会的发言稿整理﹞
新西兰中华文化协会 黄乃强
--《汉字的发展与中国的统一》之一

一、前言
有人说,中国的统一最重要的方面是文化的统一。这句话说得很对,因为几千年来,中华民族的文化形成了一种很独特的、很统一的文化体系,那就是近年来人们常提到的、倍受世人崇尚的“中华文化”。汉字不但是中华文化的重要载体之一,而且它本身就是一种很独特文化形式。因此,研究一下海峡两岸﹝其实还应包括海外华人社群在内﹞汉字的差异与统一,及其与中国和平统一前景的关系,应该是很有意义的一个课题。
我想,研究汉字的差异与统一,不外乎以下几个方面的内容:一是汉字的“义”,二是它的“形”,三是它的“音”,四是它的“码”,五是要顾及它的应用范围﹝普及率﹞。
【义】汉字向来是一字多义的。不过,从北京到台北,从纽西兰到北美洲,从新加坡到马来西亚,从澳门到香港,全球华人对汉字的字义的认知几乎是完全没有异义的,此处不再多所述说了﹝注:此处指的是单个汉字的”字义”,而由数个汉字组成词的“词义”,虽然全球华人在这方面的认同性也不存在问题,不过不在我们讨论的范围内,此略﹞;
【形】形比较复杂,海峡这边通行简体字,海峡那边通行繁体字,即“形”之异也;不过自古以来汉字就是一字多形,即同一个汉字也有一种或多种不同写法,例如孔乙己说“茴香豆的茴有五种写法”就是这个意思。回顾整部中华历史,汉字本来就是发展的;除简体、繁体之外,汉字还有甲骨文、彖体、楷书、草书、隶书、魏书、仿宋体等不同发展阶段、不同书体之别;而且同一书体的汉字还有正体字、异体字之分;香港流行一种“百福图”,即福字有一百种写法,包括了福字的一百种体形,都是汉字的“福”字也。
既然汉字本来就有那么多不同形体存在,那么,在那多形体之外,发展多一种简化形体,是社会发展的需要,有什么不好? 所以,不管简体、繁体、草书、楷书、隶书、魏书、宋体、大篆、小篆…,尽管形体不同,它们通统都是汉字。
所以,从发展的角度看,汉字根本从来就是一种统一的文字;不管在历代的平版印刷世界,还是在现代计算机世界和互联网世界里面,都是如此!
【音】汉字的发音就更复杂了,不单一字多音,而且“南腔北调”,自古如此,并不妨碍我们民族的大一统。但时代进入高文明高科技年代,这种“南腔北调”各说各话毕竟不便,因此,从孙中山蒋介石的国民政府到中华人民共和国政府,到香港、澳门政府,到新加坡政府、马来西亚华人领袖,都把推广标准汉语拼音当作一项长远的目标在努力。而在这一方面,中国政府早期制定的标准汉语拼音方案,在实现中华民族语言文字“消异求同”,在让“汉语走进国际而成为世界主要通行语言文字之一”这一方面,起了非常重要的作用。我说“汉语走进国际而成为世界主要通行语言文字之一”不是没有根据的。实际上,在世界各国,学习和使用汉语的人越来越多;在计算机世界特别在互联网世界,汉语的用户目前己经超过法语而成为世界通行的第二大语言。
【普及率】普及率当然也是一个重要的考量因素。例如“甲骨文”的“义”、“音”、”码”等的异同并不重要;一些僻字,少人应用,也可不论,但作为一种社会的通用语言文字,异同之争就不能等闲视之。汉字的改造、大陆简体汉字的再改造和废存,就是不能不考量一个社会层面的问题,即其“普及率”的因素。
【码】即汉字的标准编码。这本来不是汉字的固有属性,只是到了近代世界的计算机时代,汉字的编码才成为它的一个固有属性。而且我们可以肯定地说,与前面谈到的几个属性相比,目前“码”是汉字的一个最重要属性。
目前汉字的码有两套,一套是中国政府早期制定的国标码【GB2312】﹝还包括其补充集﹞,另一套是【Big5】码即大五码;国标码专用于简体字,大五码专用于繁字,它们在计算机里可以互相转换和互通。最近的消息是一套新的汉字国际标准码已出笼,不久即将替代【GB2312】简体码和【Big5】繁体码而实现简繁汉字的完全统一。

二、以发展的眼光看简繁汉字的优劣
就其美学性、易辨认性与信息密度来说,繁体汉字优于简化汉字。不过从易学易写这方面说,简化汉字又有很大的优点。孰优孰劣难以简单下结论。
从历史的角度看,我们不要忘记近百年来中国经济文化落后的日子。文化的落后表现在众多的文盲劳苦大众。而在那段经济落后、没有计算机的艰苦年代,简化汉字在普及教育、扫除文盲,以至提高中国人民的文化素质的过程中起过的重大作用是不应被忘记的。
不过,随着中华民族经济的起飞、人民生活的改善和文化的发展和进步,对汉字的美学要求自然不应继续被忽略;特别是计算机时代的到来改变了人们对文字的需求,计算机逐步解决了人们书写汉字的困难;繁体汉字原来的缺点不再重要而其优点逐渐凸现,简体汉字的优点不再重要而它的缺点却逐渐凸现出来;因此,汉字的再改造或曰发展,自然应提到议事日程上来。
笔者的浅见是:时至计算机普及以及互联网迅速发展的时代,实在不必太介意于简繁汉字孰优孰劣的争论。时代是不断进步的,事物是不断发展的,汉字也是不断发展的,与其在简繁上争论不休,不如把眼界放宽放远一点,让我们更加着眼于汉字的再发展方面。

三、简繁体汉字之分妨碍中国的统一?
我以为答案应该是完全否定的﹝注﹞。
八十年代以来,海峡两岸从军事对抗逐渐走向和平交流,两岸经济文化的交流难免遇上简繁汉字不统一的障碍。人们有理由担心,繁简汉字的“分裂”状态若未能早日“统一”,恐怕也会变成中国的统一过程不可回避的障碍。
不过笔者以为不必过虑。香港和澳门的顺利回归是一个有力的证明。现代计算机和互联网世界里汉字文化的统一和迅速发展,又是另一个有力的证明。
香港、澳门回归前后都一直沿用繁体汉字为主、简繁兼容并行;虽然许久以来,民间一直简繁并行而以繁体为主;而政府的正式文件都是繁体汉字,政府的计算机系统、官方的电子商务系统、机场系统….等,也都是采用Big5码之繁体汉字。香港的报纸刊物﹝包括中国政府属下的报刊﹞全部都是使用繁体汉字。学校、书店里的书籍,除极少数简体外,绝大部份都是繁体汉字。
在计算机和互联网世界里,一个简繁汉字完全统一的汉语文化世界也己经形成或正在形成。汉字在这里的这种“统一”,也是通过简繁兼容并行的过程实现的。汉字文化在计算机互联网的形成和统一,更加使人们相信:一个统一的中国就在前面不远处,这是历史的必然。
在现实世界里,简繁汉字的完全融合或“统一”,也是迟早的事,而且我以为一定会很快就实现的。其实现之路也应该是简繁兼容并行。
汉字文化在互联网世界里的大统一和迅速发展,使我们更憧憬于现实世界里中华民族的大统一和发展。我们相信,两岸简繁体汉字大融合之日,就是离两岸统一不远了;两岸的中国人大统一之日,一定是中华民族大振兴之始。

﹝注:不过我自已以为,今天如果还有人主张台湾应废繁体而行简体,或大陆应废简体而行繁体,那非但是不现实的,而且是不利于两岸和平统一的论调,令人怀疑是在对两岸统一设置障碍。我还以为,主张台湾坚行繁体而禁简体或大陆坚行简体而禁繁体,反对或阻挠目前民间己渐多见的简繁汉字的并行使用,那也不是促进两岸和平统一之道。当然,各人看法、观点有异是正常事。本文若有不当处,欢迎大家批评指正。﹞

汉字是最美丽、最科学和最有效率的文字
--《汉字的发展与中国的统一》之二


清朝末年以至五四运动以降,一直到中华人民共和国成立之前,中国的知识界有部分人一直存在一种见解:以为中国的方块汉字是一种落后的文字;中国的落后与汉字有关;中国要现代化非改革汉字不可。有的学者甚致主张完全摒弃方块汉字,改为拉丁字母拼音文字。
研讨会主讲人王和先生以历史资料否定了以上论点。王先生指出,汉字(形象方块字)的存在和发展至少在三千年以上;而西方拼音文字的存在约不到一千年的历史(汉朝的中国人已经知道西方有拼音文字)。而从汉朝到清朝末年这一千多年间,中国的经济文化一直都远远领先于西方,只是到清朝末的近一百年间中国才落后了。这说明汉字不是造成中国落后的原因。
研讨会另一主讲人黄乃强先生从美学和科学方面,特别是在现代计算机和通讯领域的领先地位,说明了汉字是最美丽、最科学、最有效率的文字。

汉字是最科学和最有效率的文字
这主要表现在以下两个方面:
a, 汉字是一种高度发展了的形象文字,它的美学与科学性不同于原始状态下的原始象形文字;汉字的信息密度也比一般拼音文字的信息密度要高很多。﹝据台湾一位著名汉字学专家朱邦复先生说,汉字与拼音文相比较,汉字的信息密度要高出1.3倍。﹞
b, 中国政府制定的、目前国际上普遍采用的【GB2312】汉字编码规定每个汉字的通讯代码﹝或称计算机代码﹞为两个字节﹝2 Byte﹞。英文字母的通用代码则为每个字母一字节﹝1 Byte﹞;英文单字有长有短而平均由五个字母组成,即每个英文单字需五个字节﹝5 Byte﹞代码。这就是说英文单字的计算机化码比汉字单字码长了2.5倍。在计算机处理过程中或通讯的过程中,是以“码”来进行和完成的,所以相同数目的英文字要比汉字慢了2.5倍!
c, 考虑到a, b 两个因素,整体的信息在计算机处理和通讯的过程中,汉语比英文至少要快1.3X2.5=3.25倍!汉字比英文可以快近两三倍,尽管外国人至今故意不去提它,但这在现代计算机和通讯技术中是非常重要的因素!所以,汉字落后的理由何在?!
d:我自己以汉英对照的文章的粗略统计则是:英文比汉文的计算机字节要高出1.5倍至3.0倍不等,即平均来说汉文比英文,效率要高出2至3倍。笔者以近日东京“全球华侨华人推动中国和平统一大会”给我们“纽西兰中国和平统一促进会”的邀请函﹝中英文各一份﹞为例,它的中文函共386汉字计772计算机字节,英文函1448字母计1448计算机字节。两相比较英文函比中文函多出1.88倍的计算机字节。远就是说,若经计算机互联网传输这两篇邀请函,中文篇的传输速率要比英文篇快1.88倍。
在中华诗歌、词、对联等文体的中英文本对照中,对比更是3到4倍以上。而且中华诗词中许多“字外之义”﹝这是形象文字的特点之一﹞,英文根本就很难译出。这大概就是朱邦复先生所谓“汉字信息密度较高”的道理。不过中华诗词的这种字外之义,实难用百分比量度出来。
不但在计算机和通讯技术中,你在现实中也可以感到汉字的优越、英文的相对“落后”﹝其实只是两种文字形体不同而引起的差异罢了,英文并不真的落后﹞。辨认一个英文单字,例如 Dangerous,人脑也有一个由D, a, 到s 的拼聚到取义到反应的过程,对日益快速的交通干线来说,这个过程可能是太慢了;可能等你从d到a到n到g到e到r还没到o,还没回过神来,车已经撞上了!所以,国际交通警告符号通统都用图形符号,没有一处是用类似Dangerous这样的拼音文字来做交通警示的!
但我们辨认汉字却只辨其整体的“形”,是辨认一个个“图像”;而辨认图像比辨认一串字母再拼出字义来比较直接也比较快。这就解释了为什么有许多中国的才子读书可以“一目十行”而且过目不忘;不过这样读英文是万万不可能的。
他一向习惯于用图象思考而不是用符号思考。这一点被专家们认定为是他所以成为天才的重要﹝附注:发明”相对论”的科学家爱因斯坦被公认是伟大天才。而爱因斯坦曾说过,因素:用图象思考而不是用符号思考。因为汉字是图象,西文是符号,所以有人说中国人从小就被训练以图象思考,所以用图象思考的中国人比用符号思考的西方人天份更高,你相信吗?﹞
汉字还是世界上最美丽的文字。从来没有那种文字给人们带来那么多美学和艺术的享受。书法家挥书几个字,可以或豪放或优雅、或粗犷或温柔,尽表现书者胸中之志向、之情感、之灵性,并可以将之传感给读者、观赏者。
美学和艺术属性是汉字最要重的属性之一。这一点我们留给千千万万优秀的汉家书法家和书法欣赏家们去评说。
有一点值得一提的是,日本人的文字既继承了某些汉字又夹杂了平假名、片假名,失去日本文字的书法美,所以时至今日,日本的书法美学还多以汉字辅之,这恐怕不能不是日本书法家们的一种遗憾吧。

汉字简化、拉丁化进程的中止
如上所说,五四运动以来以至中华人民共和国成立之前,中国的知识界有部分人一直存在一种以为中国的汉字是一种落后的文字的见解。有的学者甚致主张完全摒弃方块汉字,改为拉丁字母拼音文字。这种见解和主张导致中华人民共和国成立后立即设立了【中央文字改革委员会】,提出中国文字改革的方向﹝最终改为拉丁字母化﹞和汉字的简化方案﹝作为汉字拉丁化改革的第一步﹞,并公布了汉字的罗马拼音方案和第一、二批汉字简化方案并付诸执行。
人们不应否定中国政府在汉字改革上的努力和一切积极的成就,例如它制定了汉字的统一编码国标【GB2312】和汉字标准罗马字母拼音法。这两项制定为以后汉字的国际化和计算机化做出的贡献是毋庸置疑的。简化汉字方案虽然近年来很受垢病,但它在一定历史时期促进了教育的普及等方面的作用,也不应完全予以否定。
只不过,随着世代的进步特别由于近代计算机技术的发展,人们逐渐认识到汉字其实并不是一种落后的文字,甚至还可能是一种最美和最科学的文字;认识到中国在某个历史时期的落后其实也并不是汉字的责任。因此有必要对汉字的改革方向﹝简化以致最后拉丁字母化﹞和发展作出检讨。
1983年间,我作为香港最早期的中文计算机设计师,出席了联合国“科教文”在中国政府支持下,于北京召开的“国际汉字信息处理研讨会”。会上,来自一百多个国家的数百名汉学家、学者及计算机工作者对汉字的信息处理和文字改革方面进行了热烈的讨论。虽然有一些不同的意见,例如有两三位外藉华裔学者(笔者知道其中一位来自美国某大学,另一位是东南亚学者)还是发表了几篇主张汉字完全拉丁化的论文,但并未成为主流意见;会议的主流意见对中国政府制定汉字信息处理方案和文字改革方面的意见几乎是一致的,那就是:
* 中国政府制定的汉字计算机编码方案即国标码GB2312,得到会议的一致认可与接受;
* 中国政府制定的以标准北京话为准的汉字拼音码(当时叫罗马拼音码)作为汉字的注音码是很好的方案,得到会议的一致认可与接受;
* 中国文字(汉字)完全改成罗马拼音化是完全没有必要和不可行的;
* 汉字是一种美丽的文字,它在信息处理领域里更是一种既科学又有效率的文字,对它的过份简化和改造是没有必要的。

中国政府很支持这次研讨会。会议期间,中国人大副委员长周培源先生两次(一次在全聚德一次在人大会堂小宴会厅)宴请了全体与会学者和专家。
会后,我陪同伦敦大学东方语言系系主任汤姆逊教授和与会的几位英国汉学家拜访了中央文字改革委员会。印象中,接见我们的领导对这次国际研讨会的情形似乎很了解并持相当开明的态度。
过后不久,大约是1984年吧,中央文字改革委员会收回了在文化大革命期间制定的第三批汉字改革﹝简化﹞方案。随后,连中央文字改革委员会本身也被改组(被撤消;目前相应的部门是“中国国家语言文字工作委员会”)了。
汉字的改革﹝简化﹞进程就这样中止了。当然,汉字的拉丁化改革运动﹝如果还有少数学者仍拟推动的话﹞也自然中止了。

简体繁体汉字最后的统一
--《汉字的发展与中国的统一》之三

汉字计算机代码的统一。
现代计算机里,全部用的都是数码制;文字在计算机里是用一种”数字代码”来表示;中文如此,其它各种文字都是如此。例如英文的26个字母,在计算机里是用26套8位数的二进制数﹝8bits﹞来表示。目前国际上通用的英文代码是美国政府制定的ASCII码,每个字母用8位数表示。当然,英文还有另外几套编码,如早期的莫尔氏码、早期的IBM码等等,不过己逐渐被计算机业界淘汰而不用了。
那么中文计算机里汉字用什么表示呢?也是用数字代码。目前国际上通用的汉字标准代码,是中国政府制定的【GB2312】;每个汉字用16位数的二进制数﹝16bits﹞表示。汉字还有另外一套编码,那就是【大五码】﹝即Big5﹞,现被普遍应用于繁体汉字的代码。
八十年代中国大陆政府着手制定汉字统一国标码【GB2312】是最早的国家标准。虽然它为汉字的国际化奠定了基础,为中文计算机的发展起了催生作用,但在计算机领域的使用中它越来越显得太狭小。
1990年6月,中国又公布了【GB/T12345】即【信息交换用字编码字符集辅助集】,该集共收集6866个汉字,是关于繁体汉字的第一套国家标准,它企图解决与六千七百个简体字相对应的繁体字,但根本满足不了需求,也几乎不被大多数计算机系统所采用。
1995年12月,中国政府再制定了【汉字内码扩展规范】即【GBK】标准码集。这一次它共收集了20902个汉字;它除向下与【GB2312】编码兼容外,更重要的是向上支持ISO10646.1国际标准。该标准是国际组织ISO制定的通用编码标准﹝该标准1993年被中国政府以【GB13000.1】的形式认可。【GB13000.1】共收录了包括简繁在内的20902个汉字,简繁汉字处同一平台(实际上意味着简繁汉字在此平台上的完全统一)。
2000年7月,中国政府公布了【GB18030】信息交换字编符码,并规定从2001年初强制执行。这个标准比【GB13000.1】进一步,共涵盖了27484个汉字,也是简繁汉字处同一平台。这是一套国际标准组织认可的汉字“大字符集国际标准”。

简繁汉字并行是实现汉字完全融合之路。
那么简繁汉字在实际生活中,如何才能完全融合起来呢?
伴随着改革开放的步伐,当八十年初北京【国际汉字信息处理研讨会】结束、中国政府收回了把汉字简化得太过份的【第三批简化汉字草案】之时,人们对汉字简化拉丁化进程的中止,摘除了“汉字落后”的帽子感到兴奋。90年中国政府公布【GB/T12345】标准,初步开放了六千七佰多个繁体汉字;95年再定【GBK】标准,收入两万个简繁汉字;2000年再制定【GB18030】标准,共收录两万七千多个汉字。
在公布【GB18030】标准时有报道说,在中国政府的坚持和积极游说下,国际标准组织ISO终于同意拨出共九万个编码位置预留给汉字专用,此次【GB18030】标准只用了其中的两万字,仍有七万个编码位可供未来汉字的发展之用。由此可见中国政府在汉字的发展方面,持多么开放和积极进取的姿态。我们为此感到十分欣慰和高兴。
我想:如果台湾政府现在和将来,不管它是国民党政府还是民进党政府,如果有发展更多汉字的建议或方案,大可以向北京中国政府提出建议,海峡两岸的中国人可以用携手通过扩展【GB18030】的方法,共同把台湾政府的新方案列入国家标准与国际ISO标准,不亦乐乎?中国政府既已向ISO要来那么多预留编码位给汉字专用,那么也一定乐于接受台湾政府的任何发展汉字的好建议﹝不管它是“正体字”建议还是“异体字”,只要是有意义的汉字就行﹞。
应该特别一提的是:中国政府虽曾大力推广简体汉字的教学和应用,其实却从未废止过繁体汉字。大陆历年来出版的【康熙辞典】、【辞海】、【辞源】等经典文字工具书以及许多历史经典名著,都仍然沿用和保留了繁体汉字。大陆中华书局印行的、历年来为中小学生通用的【新华字典】更是每个字都简、繁体并列。
所以我说“无论简体、繁体都是中华文化宝库里珍贵的精品,都应包容和兼行并用,在兼行并用的过程中达到完全的融合。”应是可行的。
最新消息是,中国政府要求大陆有关部门及计算机制造厂商自2001年起一定要采用【GB18030】汉字平台;而全世界最大的计算机软件供货商【微软】己经在它新一版的【发现者】(Explorer5.0)网上软件采用了这一汉字平台。
最早的【GB2312】曾是强制执行的;而以后的【GB/T12345】与【GBK】、【GB13000.1】等并未提出强制执行;所以至今我们不知道大陆有哪家计算机厂商或部门采用过这几个标准。
此次【GB18030】提出强制执行,是否意味着繁体字在中国大陆所有计算机系统、互联网站、报业、电讯、银行系统….等,会有繁体汉字出现、简繁体汉字并行呢?我想答案是肯定的。
因为计算机的发展有一个特点,一是新开发的更高一级的国际标准、国际通信协议等,绝大多数都可以向下兼容;即用户原有的旧系统不用大的改变或几乎不用变动,就可以向上过渡到更高级的系统。二是新标准一订定,全世界各国政府各大小厂商一定争相跟进使用,而且越大的厂商跟进的越快;理由很简单,因为不跟进就只能被市场淘汰掉。通常不出若干年,旧的系统就完全融化入新系统而被用户完全“忘记”。所以用不了很久,当全世界的计算机都采用新的、简繁体统一的同一平台的时候,目前的【GB2312】和【Big5】码也会逐渐被用户完全“忘记”––【GB2312】被全部融入【GB18030】而【Big5】大五码会被完全淘汰掉。(我说“全世界各国政府各大小厂商一定争相跟进使用”,当然包括台湾的计算机厂商、商业机构以至政府机构在内,如果它们想保持与国际社会的接轨而不被淘汰的话。)
至此,借助于计算机、通讯和互联网等高新科技的新发展,简繁体汉字在计算机、国际通讯、互联网世界等人类重要活动领域,可以说基本实现了完全的统一。
计算机系统和互联网世界里简繁汉字的统一,必将大大促进和推动简繁体汉字在现实生活里很快达到完全的融合和“统一”,进而推动两岸的中国人进一步走上统一之路。这是文化的统一之路,科学科技的统一之路,和平的统一之路。
近代人类文明史上很多类似的例子:许多政治上、军事上无法解决的人类矛盾,很容易地被科学技术之手悄悄地化解了。面对现代的计算机化热潮,面对互联网世界里中华文化即汉字文化的大发展、大统一,那些鼓吹分裂中国的势力,那些企图在汉字上寻找“分裂”借口的人们,还有什么花样再出招呢?

总之,汉字无论从大篆、小篆到隶书、魏书,从宋体、明体到楷书、草书,到繁体、简体,它们通统都是我们中华文化宝库里珍贵的文品,我们都应该包容和珍惜;这是一。其二,汉字是发展的,我们的祖先在汉字的发展上作了许许多多的贡献,我们现代人也应有可能在汉字的发展上做出自己的贡献的吧。

QQXIUZI.CN 千千秀字