关于异体字整理的几个问题

来源 《汉字书同文研究》第5辑(2004年) 发布时间 2014-12-11

本文立足于现代汉字整理和规范工作,就其中异体字整理的方面讨论几个问题。

一 宽式异体字的认定问题

异体字的界定,通常有狭义和广义,也就是严式和宽式的分别。

严式异体字的判定是用法没有区别而字形不同的两个字。不过,用法是否相同不是一成不变,而是因时而异的。有的是历史上曾经没有区别,但后来有了区别。例如,上古时期“粥”字原本是“鬻”的省体,即同一个字的不同写法,但后来“鬻”字常用于表示卖的意思,两者的读音也分化了。“無”和“舞”,“耶”和“邪”的关系也与此相似。“毋”和“母”,“气”和“乞”则由异写(异写概念见下文)转化为完全不同的两个字。还有的则是历史上曾经有区别,但后来的用法已无区别。如“俯”和“俛”,“帆”和“颿”,“氣”和“炁”等①。 对于历史上曾经不同的字,例如“俯”和“俛”,在文献文字处理时是不应该混同的(“僶俛”显然不能写作“僶腑”);古代曾经相同而现在用法不同的字,例如“鬻”和“粥”,当然就更不能算是异体字了。

对于严格意义上的异体字,处理的原则相对比较简单,就是从中选择一个作为规范写法,而把其余的作为非规范写法。但选择哪个作为规范写法,应该有一个合理的原则。这个问题留待下文再谈。

至于宽式异体字,处理起来就要很谨慎。我在《汉字改革的反思》(发表在《南阳师范学院学报》2002年第3期)一文中曾提到:1955年公布的《第一批异体字整理表》,最大的问题就是把许多音义有别的字当作异体字来合并。例如,被规定必须淘汰的“异体字”中有许多并不真是异体字,而是假借字或区别字或本来就是不同的字。如果把音义有别的字一概当作“异体字”加以淘汰,例如把“並”(义为“傍”)归入“并”,“郤”(古氏)归入“却”,“薙”(义为除草)归入“剃”,“蒐”(狩猎)归入“搜”,就会改变原义,甚至连读音也被改变。例如义为“傍”的“並”应读为bàng,“郤”通常音xì,“辛薙”的“薙”音zhì,“蒐”有时音huì。就以“並”和“并”的关系为例,这两个字在许多场合下的用法是不同的。例如“並”作为副词表示“都”、“全部”的用法就是“并”字所没有的。《诗经·小雅·宾之初筵》的“並受其福”就是都受其福,这跟“并受其福”的意思是不一样的。

在异体字的整理问题上,曾有一种做法,就是对于“同音包孕异体字”用义项多的甲字代替义项少的乙字。所谓“包孕异体字”,“指甲乙两字同音,其中甲字的义项多,乙字的义项少,而且甲字包括了乙字的义项。”② 例如《现代汉语通用字表》只收“溜”而不收“霤”,就是把“霤”并入“溜”字。这种处理,从实质上说并不是异体字整理,而是不同汉字的归并,或者说是某一个词(通常就是义项较少的那个乙字所表示的词)的记录符号如何来确定的问题。所以,简单地规定用义项多的代替义项少的字,并没有考虑那个词由什么字来记录最合适的问题,从而是可商的。首先,许多所谓“同音包孕异体字”,其实义项多的甲字不见得能够完全取代义项少的乙字。就以“霤”字为例,《汉语大字典》所收义项共7个:屋檐的流水,下流的水,屋檐,承霤(屋檐下接水长槽),檐下滴水处,中霤(天井四周的檐霤),方言指堂屋两柱之间。③ 今按,在古书中还有一个较常见的义项,即神名,也称为“中霤”,属“五祀”之一。在这8个义项中,只有3个是“溜”的义项中所包含的,其余的用法只能写成“霤”。尤其是作为“五祀”神之一的“霤”,已经成为古代贵族礼仪中的专有名词,在史书中常见,是不能写成“溜”的。再说“溜”的义项中所包含的“霤”的用法,也是因假借而造成的。借字吃掉本字的代替法,恐怕是不妥当的。其二,“溜”的义项多达20项(其中liu去声13项,liu阴平声6项,liu阳平声1项)(《汉语大字典》716页),记词负担较重。即使“霤”的义项真的完全由“溜”所包含,也不宜让“溜”来承担“霤”的用法,否则会给阅读带来义项辨认的困难。汉字的记词功能,一直处在合并和分化的矛盾之中。当某个字的义项太多时,就往往会出现分化字来承担其中的部分记词功能。以“华”字为例,本来的意思是开花的“花”,后来因引申,常用于表示荣华的意思,还假借来表示“华夏”的“华”,于是后人就另造了“花”字来分化它的用法,专门表示“华”的本义。我们如果强行把“花”的用法并入“华”字,大概不是一个聪明的做法。我们见到的所谓“包孕异体字”,往往具有分化用法的功能,它们已经是不同的两个字了,合并的结果并不能真正实现汉字总数的减少。这是因为,历史上曾经使用过的分化字,不论是字典,还是计算机的字符集中,都还有它存在的必要,把它合并到另一个字的用法中,很可能反而增加了混淆,恐怕是害多益少的。其三,从整理历史文献的角度说,凡是历史上曾经有用法区别的字,就不应该人为地改动。类似“霤”这样的字,如果作为异体字处理,在整理历史文献时就会遇到两难选择,要么违背文献整理原则而迁就现行的用字规范要求,把“霤”改为“溜”,要么保持历史文献的原貌而违背现行的用字规范原则。

如果要认真地计较,即使是音义完全相同的严式异体字,由于在用作人名地名时往往还具有区别的功能,要如何处理也不见得就没有讨论的余地。例如撰写《铁围山丛谈》的宋人蔡絛不能写成“蔡縧”,清代著名学者吴大澂不能写成“吴大澄”;《左传》文选“鞌之战”中的地名“鞌”也不宜改为“鞍”。即使现代人的姓名用字,除了作姓氏的字不宜改变之外(例如“亓氏”不能改为“其氏”),人名用字恐怕也不宜改,如“鎔”不能写成“熔”,“堃”不能写成“坤”,“崧”不能写成“嵩”,“喆”不能写成“哲”,否则就可能遇到麻烦(例如在银行和邮政业务中要核对当事人身份证姓名)。当然,今后可以规定人名用字的选字范围,以免出现计算机字符集中没有的生僻字和异体字,并且不允许使用错字和俗字。

总之,对于宽式异体字的处理应该坚持一个原则,就是不能轻易把用法有区别的两个字合并为一个字。这方面已经得到较多的关注,这里不打算进一步展开来讨论。

二 异写和异构

这里就严式异体字在形体差异上的认定问题谈一点个人的看法。这个问题还多少牵涉到“新旧字形”的问题。

狭义异体字在形体上的差异可以分成两类状况,可以把它称为“异写”和“异构”。

异构指的是汉字构成成份(字素)或其相对位置的不同。如“淚”又写作“泪”,“羣”又写作“群”(现在“泪”和“群”被作为规范写法)。而异写就是指汉字在不改变基本结构的情况下因书写习惯不同而形成的某种形体差异。例如“吳”字又写作“呉”或“吴”(现在“吴”被作为规范写法)。不过,异写也可能会造成字素结构的改变,至少表面上是如此。例如“吳”写作“吴”,就由从“夨”变成了从“天”,于是就有介于异写和异构的第三种情况。下面分别作进一步的说明:

(一)异构 即构字字素不同,或者位置安排不同,或者繁简不同。绝大多数异体字都属于这种情况。字素部分不同或全部不同的例如:岳-嶽,鳄-鱷,歌-謌,遍-徧,睹-覩,溪-谿,杯-盃,葬-塟,裸-臝,村-邨,體-躰,迹-跡-蹟,視-眂。相对位置不同的例如:够-夠,脅-脇,慚-慙,棋-棊,松-枀,鵝-鵞,裏-裡,啓-啟。繁简不同的例如:螡-蚊,靁-雷,纍-累,鬭-鬪-鬥。

(二)异写 多数是因手写行书体与正体的差异造成的形体不同。例如:亞-亜(破折号之后的字来源于行书体,下同),惡-悪,堇-菫,曾-曽,兔-兎,土-圡,卯-夘,册-冊,冰-氷,啓-唘,留-畄,乘-乗,歲-嵗,呪-咒,戹-厄,囘-回,煑-煮,敎-教,黃-黄。

也有些是由于隶定不同而造成的。例如:卯-戼,享-亯,留-畱,犁-犂,莉-菞,亡-亾,並-竝。

还有一些本来是错字或讹误字,被当作异体字。例如(破折号之后的字为错讹字):拗-抝,冤-寃,冗-宂,歷-厯,曆-暦,荔-茘,往-徍,博-愽,丞-氶,殼-殻,徵-徴。

(三)因异写而变成异构,或形成较显著的差别。例如:往-徃,晉-晋,鬧-閙,珍-珎,你-伱,況-况,揑-捏,船-舩,憩-憇,策-筞,怪-恠,雍-雝,並-竝。

如果两个字在形体上是异构关系而用法毫无差别,那是典型的异体字,可以不论。这里要讨论的是对于异写字形的认定问题,换言之,就是对异写造成的差异是否一定要作为“异体”来看待。

可以说,异写字的出现,本来是一种不可避免的正常现象。自古以来,在汉字的日常应用中,不同的人总是会有不同的书写作风和习惯。在一般情况下,因书写习惯差异造成的异写,还不至于构成“异体”关系。例如“木”字,第三、四两笔应该是一撇一捺,但在手写体中,许多人会写成左右两点,尤其是“集”、“某”、“棠”、“荣”、“檠”等“木”处在下方的文字中。笔画上的变化,通常是不被看作异体的,但如果不忽略这种手写体与印刷体(或者说行书体与正楷体)的笔画差别,就会扩大异体字认定的范围。例如“户”字,在1965年《印刷通用汉字字形表》有关“新旧字形”的规定出台之前,正规写法的上部本来写成一撇(戶)或一横(戸)的,只有手写体才写成一点(户)。由于《印刷通用汉字字形表》强调用手写体的点改造印刷体的横,这种本来属于正常状况的书写差异不再被忽略,于是它们就构成了“新旧字形”关系(本质上就是一种异体关系),在国标扩展字符集中就分别给了“户”、“戶”、“戸”三个字各一个字码。这种对细微书写差异的认定,其后果就是增加了新的形体。如果要考虑类推的原则,那么凡从“户”的“房”、“扉”、“扇”、“扁”等字,以及从“扁”的“篇”、“编”、“偏”、“翩”等字,也都需要各出现相应的两体(正规的繁体字,“扁”字上部都是写成一横的),那还得了。还有一些区别,原本也是日用手写体与庄重正楷体的不同,例如“糸”旁,即使在简化字公布之前,一般人日常书写也大多写作“纟”旁,只是在汉字简化方案出台之后,这种原本属于正常状态的手写体与印刷体分工的状态才被破坏,反而变成了繁简两体。于是,就从一种本来可以忽略的书写差异,变成了一种不可忽略的书写“规范”性的问题了。过去的汉字规范化工作,就是过分地强调印刷体与手写体的一致性,为着迁就手写体和行书体,就不惜改变印刷体和正楷体。如果一定要迁就手写体来改造印刷体,或者追求两者的统一,可以说手写体永远不可能完全紧跟印刷体,那么,书写的规范问题也就永远得不到解决。由此可见,忽略细微的差别,尤其是忽略手写体与印刷体(或行书体与正楷体)的差别,有助于减轻问题的复杂性,从而大大减少印刷体字符的数量。对于类似的区别,只要规定印刷体的规范写法就可以了,大可不必规定要淘汰的所谓“异体”。而印刷体的字形,则应该尽量保持传统的(例如以《康熙字典》为代表的)写法,不要另造一套,尤其不应该迁就手写体,徒然增加计算机的字符量。

从某种意义上说,承认异体写法,就等于把它们的书写区别合法化。即使规定异体要废除,实质上也是在另一种形式上对异体写法的承认。在过去,有些字的错误写法虽然很多人会犯,如“切”的从“土”的写法,“別”字从“另”的写法(别,现在已规定为规范字),但人们都把他作为错字而不是异体字来看待。类似这样的书写差异或讹误历史上很多,将来也无法杜绝,如果不加以忽略,就可能会涉及许多以它们为偏旁的汉字,必然导致异体字队伍变得很庞大,不胜罗列。所以,上述第二类异写造成的书写差别原则上可视为俗书或错字,不宜作为异体字来处理。至于第三类已造成字素结构变化的书写差异,则可根据具体情况的不同,有的可承认为异体,而有的则仍可忽略。

附带说一点,《康熙字典》等字书上的异体字,有许多是讹误字和篆书隶定字,其中的隶定字有不少来自《集韵》。类似的篆书隶定字书写风气在少数清代和民国读书人的作品中作为个体风格颇为盛行。例如《说文解字诂林》中所收的章炳麟《文始叙例》(《说文解字诂林·前编上》,75-77页),宋保《谐声补逸叙》(《前编上》,77-78页),江声《六书说》(《前编中》,109-111页)等都是。过去的学问家以精通《说文》为要务,往往也喜好通过《说文》篆书的隶古定书写来显示自己对汉字固有结构的熟悉。但由于他们并未接触过出土古文字资料,其实并不真懂汉字形体的历史面貌。如果《说文》篆书的隶定字都要作为异体字,那么甲骨金文的隶定字大概也应该作为异体字了,这样一来,异体字的范围就会非常庞大,带来不便。今天,隶古定的风气早已成为陈迹,在文献异体字的调查过程中,当然没有必要因过去某些人的书写偏好而造成汉字字符量的增加。只有唐宋以来写本刻本中较常出现的古隶定文字才可考虑纳入异体字的范围内。

还有一个问题,就是对于严式的异体字,有一个如何确定规范写法的问题。过去的做法,往往只考虑笔画的多寡,并不很在乎汉字固有的传统性和规范性。例如“异”和“異”,《一异表》把“異”作为“异体”给淘汰。结果,在历史文献中大量出现的“異”字一下子成了不规范的写法,而过去罕见少有人认识的“异”字反倒成了规范字。这给古籍整理带来处理上的麻烦和难题(“异”和“異”本来是不同的两个字,把“異”改为“异”是一种违背文献整理原则的改字现象)。又如“耻”字,原本从“心”作“恥”,俗书讹作从“止”,结果《整理表》把“耻”定为正体,原来的讹体反倒成了规范的写法,反之,原来的规范写法反而成了不规范的写法了。这种颠倒正误的处理破坏了汉字的体系,有害无益。

三 历史积淀异体字和共时并存异体字

汉字异体字的形成,是一个必然的现象。从殷墟甲骨文反映的商代文字开始,一直到现代汉字,异体字的产生从来就没有间断过。从秦代李斯、汉代许慎、唐代颜师古、颜元孙、宋代郭忠恕、张有以来,历史上曾有过多次汉字规范和整理的工作。汉字规范工作虽有某种成效,但在下层社会中民间俗字异体字的产生,恐怕基本上不受汉字规范的限制。可以设想,文化程度不高的人,书写错误很多,或者图省事采用民间俗字(也许本来就不知道何为规范字何为俗字),这是必然的。即使文化程度较高的人,在非正式场合下的书写也往往只求方便而并不拘束,往往把行书草书与楷书夹杂在一起;或者讲究变化生动,还夹杂一些古文异体。人心一样,古今同理。

异体字既然是无穷无尽的,就不应该都进入我们整理的视野中。在这个问题上,首先要有关于异体字历时或共时的时代观念。

我们可以按照流通时限的不同把异体字区别为“历史积淀异体字”和“共时并存异体字”两大类。为着与“共时”的提法相称,“历史积淀异体字”不妨也称为“历时积淀异体字”。历时积淀异体字在理论上指的是历史上曾经出现过的异体字的累计字集。共时并存异体字,则指某一段时期内还在流通使用的异体字字集。这里说的“流通使用”,指的是当时日常应用和一般图书(包括一般古籍)抄写或出版所使用的汉字,当然不应该包括与古文字相关的学术研究和《集韵》、《康熙字典》之类字汇字典上收入的异体字。字汇字典上收录的文字带有储存的性质,不能代表当时实际流通的文字的状况。《集韵》、《康熙字典》之类字汇字典虽然所收异体字不全,但已具有历史积淀异体字的性质。

历时积淀异体字和共时并存异体字是两个不同的字集,前者包括后者,所以前者大而后者小。这两个字集不管在实践操作中是否能够完全区分开来,在理论上必须加以研究,否则我们就会在汉字整理过程中失去整理的目标和取舍的依据,面对大量的异体字无所适从。从汉字规范和整理的角度说,我们的目标是规范现代汉字的使用,包括一般古籍的整理和出版,所以,我们应该立足于共时并存异体字,也就是现代汉字中的异体字的整理。古代曾经使用过的异体字,只要现在不流通了,就不必去管它。从极端的方面举例,甲骨金文中的异体写法毫无必要列入今天的汉字规范的范围,因为它们早就不被使用了。那么,虽然同样是楷书的异写,或者是篆书不同隶定的异写,如果早就不再被使用了(这里不包括古文字研究中等特殊场合下的使用),同样没有必要纳入整理的范围。如曓(暴)、旾(春)、椉(乘)、珡(琴)等,凡社会上和一般古籍中已经不再使用的死字,恐怕就没有必要列入异体字整理的范围。当然,哪些要整理,哪些不要,既然要考虑一般古籍整理中的用字,就需要作一些调查工作。

四 异体字整理与汉字信息处理

这个问题的提出,与学术信息的印刷出版和计算机信息处理技术相关。

在一般的信息交流中,媒体使用的都是规范的汉字,但被规定淘汰的异体字在有些场合下不能不出现。最明显的场合就是1955年文化部和文改会联合公布的《第一批异体字整理表》,这个关于异体字规范的文件本身,就无法回避异体字的字形问题。我们注意到,从1955年以来,历来印刷的这个异体字整理表,被淘汰的那些异体字的字模有许多是临时制作的,不仅形体别扭难看,而且还出现造字的错误(未能表达原整理者手写的异体字的形体状况,例如把“却”的异体“卻”错刻成了“郤”,把“膝”的异体“厀”错刻成了阝旁)。在学术性的文献中,尤其是有关文字学、古文字学、古籍整理等方面,以及宣传汉字规范的论著中,常常会提到或列举那些被淘汰的异体字。在今后的社会中,任何文献,尤其是重要的文献总是要由计算机来处理、流通和储存的。这些涉及异体字的文献同样如此。所以,那些被有关汉字规范的法规文件宣布淘汰的异体字,同样需要有一套规范的写法(就像繁体字也必须有规范的写法一样),而且进入由相关部门制定的某种特殊的字符集中,以便计算机的处理。这当然是一件不得已的做法。正因为如此,为了减少字符量,对需要淘汰的异体字的承认应该是有条件的,严格的。上文我们曾提到尽量不要把手写体中出现的异写和错字讹字当作异体字,也不要把早已死亡的异体字和篆书隶定字纳入现代汉字整理的视野中,减少字符总量就是一个重要的考虑因素。

为了适应古籍和古文字研究成果的计算机信息处理(如输入、储存、排版、网络传送、信息共享等),需要制作足够大的字符集。这是不言而喻的。但大字符集的收字并不是越多越好。听说现在有公司在开发特大的字符集,我不知道其收字原则如何,但我是怀有担忧的。就我所见的日本人做的《今昔文字镜》来看,我以为其中有许多字符大概是永远不可能被使用的,除非《文字镜》本身要被制作使用。我相信,大字符集之所以大,主要并不是汉字真有那么多,很大的因素是异体字多。在古籍汉字处理工作中,即使在需要保持异体字原貌的场合下,对异体字的认定也同样是有原则的。所以,在大字符集的制作时,凡错字俗字讹误字避讳变体字等等,原则上都不应进入其中。大字符集汉字的审定和异体字的认定,应该成为汉字整理和异体字整理工作中不能忽视的任务。

注释:

①俛-腑:“俛”本从“免”得声,段玉裁《说文解字注》:“《毛诗》‘黾勉’,李善引皆作‘僶俛’。俛与勉同音,故古假为勉字。”颿-帆:《说文》:“颿,马疾步也。”《广韵·凡韵》:“帆,船上幔也。亦作颿。”氣-气-炁:《说文》:“氣,馈客刍米也,从米,气声。餼,氣或从食。”可见氣本是“餼”的初文。《说文》:“气,云气也。”《集韵·未韵》:“气,或作氣、炁。”

②高更生《字形规范化的重要依据――学习〈现代汉语通用字表〉的一点认识》,《语文建设》1993年11期。

③《汉语大字典》缩印本,第1695页,1995年。

(华东师范大学中国文字研究与应用中心 詹鄞鑫)

QQXIUZI.CN 千千秀字