汉字研究与汉语研究——兼评“字本位”理论
【内容提要】汉语音节与汉字存在天然的对应关系。因此,通过研究汉字来研究汉语是中国式的有效方法。本文认为,近年出现的“字”本位是主要针对“词”本位提出的汉语研究理论,有可取之处,但也有严重的理论缺陷。百年来的汉语研究未能充分利用近两千年的汉字研究成果,制约了汉语研究的深入。因此,要更好地研究汉语,适应信息时代的要求,应在“词”本位理论体系中,充分利用汉字研究的丰富成果,从汉语与汉字的特殊关系出发,以字与词的关系为突破点,同时全面吸收语言学各分支学科及信息处理等学科的新成果。
【关键词】字本位 词本位 汉字研究 汉语研究
引 言
汉字是世界文字体系中唯一形、音、义一体的特殊文字。它作为记录汉语的工具,与汉语的音节形成天然的对应关系。一般而言,汉字具有“1个字·1个音节·一个概念”的特点,因此,研究汉字对研究汉语具有特殊意义。我国古代的汉字研究成果异常丰富,文字学、音韵学、训诂学是分别主要从汉字的形、音、义三个方面进行研究的。文字学主要从字形结构入手,对汉字的音义进行分析,从而使人们对该字所代表的汉语“词”或“语素”的音义有所了解;音韵学是通过对汉字的声、韵、调以及它们在不同历史时期的分合与异同进行辨析,达到对汉语语音系统进行研究的目的;训诂学则是着重研究词义兼及语法、修辞的一门学问。因此,这些粗看似乎是研究汉字的学问,本质上都是研究汉语。
十九世纪末以来的一百多年间,我国学者引进西方语言研究的成果对汉语进行研究,取得了很大的成绩。但在这种研究中,似乎一下子没有了几千年来汉字研究成果的地位,使传统汉字研究与语言研究形成“断裂”状态,甚至以汉字为中心的语言研究传统在这种氛围中被贬称为“前科学”或“语文学”。西方语言学体系是以“词”为本位的,而汉人缺少“词”的概念,汉语又缺乏形态变化;因此,当我们用这种西方语言学体系分析和研究汉语时,许多问题难以解决。例如,由于汉语词缺乏形态变化,书写上词与词之间不空格,因而确定“词”和“非词”的界限,就是长期难以解决的问题,如此等等。这些问题使人们在运用拼音文字语言的理论研究汉语时不得不有所反思。
近年来,我国一些学者,在进行汉语研究的“百年反思”时提出“字本位”理论,主张确立“字”在汉语研究中的核心地位。笔者认为这种理论虽有一定道理,但在本质上是站不住脚的。例如,认为汉语中只有字没有词就是不成立的。因为“词”是任何语言都存在的基本单位,在汉语中当然也不例外;而“字”在本质上是写“词”的。如“黑”是一个“字”,也是一个“词”;“黑板”是两个字,也是一个“词”,并不是两个字的字义相加(黑色的板)。同时,对汉语的信息处理中,除了字处理,更需要进行词处理、句处理和智能处理。如单字输入“中”和“国”,重码率很高,而以词“中国”输入则无重码,大大提高了效率。句处理、智能处理则效率更高,但都必须以词为基础。因此,从语言角度看,应当是“词本位”。怎样看待“字”本位和“词”本位?怎样进行汉语研究?对这些问题,本文试作一点粗浅的分析和探讨。
一、“字”本位及其理由
“字本位”理论认为,在用拼音文字记录的西方语言中,“词”是“基本结构单位”,其语言研究以“词”为中心;在用汉字记录的汉语中,“字”是“基本结构单位”,其语言研究应以“字”为中心。其理由大致如下:
1.在与拼音文字的比较中,认为“字”是汉语的“基本结构单位”。
汉语的“字”不等于拼音文字的“字母”,也不等于它的“词”(word)。汉语的“字”是汉语中一个音节所表达的一个概念或声音。“字母” 通常只有“形”和“音”而无“义”;而汉语的“字”是“形音义”三位一体的。
汉语的“字”大于印欧语的“字母”,小于或等于它的词。拼音文字只有“词典”没有“字典”;而汉语既有“字典”也有“词典”。汉语“词典”里的“词”都是以“字头”作“领衔”进行排列的。可见,在汉语里,“字”是纽带、是基础,处于核心地位。
清末以来,我国许多先进的知识分子,从对汉字与西方拼音文字的简单对比中认为,中国的汉字数目太多,总数有数万,常用的也有四五千,繁难不易写,不如西方拼音文字,通常只有二十来个字母,好写又好记。为发展教育,救国富民,他们主张推行拼音文字。但由于他们未对各种语言与记录该语言的文字各自有些什么特点、二者是否相适应等进行研究,因此,得出的结论似乎蛮有道理,但终究在实践中行不通。例如主张拼音文字第一人的卢戆章,于1892在《〈中国第一快切音新字〉原序》中说:“中国字或者是当今普天之下之字之至难者”,他说,要想学会常用的数千个汉字,“至聪明者非十余载之苦工不可。”因此,他主张推行切音新字(拼音文字),认为“基于切音文字,则字母与切法习完,凡字无师能自读,基于字话一律,则读于口遂即达于心,又基于字画简易,则易于习认,亦即易于捉笔,省费十余载之光阴。将此光阴专攻于算学、格致、化学,以及种种之实学,何患国不富强也哉!”(卢戆章,1958,1-2页)
其实,用汉字的数目与拼音文字字母的数目进行对比本身就是一种不正确的比较方法,因为二者不是同一的东西,没有可比性。汉字虽然有数万,但常用的并不多,一般人认识三四千就可以了。在一般情况下,一个或两个汉字与英文的一个词差不多,而英国人至少要掌握三四万个单词才够一般使用。如此说来,何者难,何者易,恐怕很难说得清楚。实际上,两种文字各有优缺点。例如,汉字表音不足,难以检索是缺点,但字形易辨,易于扫读,文本简短,简称容易让人了解原词意义,这些方面比英文又有优越之处。特别是,一个汉字表示汉语的一个音节,其“方块”的字字独立正好与汉语的音节界限个个分明相适应,这就从根本上使汉字成为最适宜于记录汉语的文字。正因为如此,汉字才成为在埃及圣书字、两河流域丁头字、中南美玛雅文字都消亡后仍然还在使用的唯一自源性文字,而且至今仍生气勃勃,永葆青春!这一点,是“汉字长生不老”的最根本原因。这就是所谓“鞋合适不合适,只有脚知道。”汉字最适合于记录汉语,那么对汉语来说,就是最好的文字。
记录汉语时,“字”是天然的、基本的单位,分析研究汉语时,当然也应以“字”为基本单位。
2.汉人习惯于用“字”的概念而缺少“词”的概念。
汉人说话写文章,向来是讲“字”不讲“词”的,“字”在汉人的观念里是扎了根的。如要求别人讲话慢一点,说“你一个字一个字慢慢说”,而不说“你一个词一个词慢慢说”;又如“你敢说一个‘不’字”这句话里的“字”也不能换成“词”(徐通锵,2001,33页)。我们说歌唱演员唱歌“吐字清楚”;说戏曲演员唱戏“字正腔圆”;我们把文字表面的意思叫“字面意义”;把深层含义叫“字里行间”;把著名店铺叫作“老字号”;把写一个简短的条据叫“留张字条”;写一个凭据叫“立个字据”;把行文或说话时用来表情达意的词语叫“字眼儿”;把说话或写文章反复推敲词语叫“字斟句酌”;把文章写得通顺叫“文从字顺”,等等。这些地方,“字”也都不能换成“词”。
3.汉人是计“字”不计“词”的。
我国计算稿酬从来都以字数计,不以词的数目计;就连书写习惯也是字字独立,不分词连写。我国的诗有所谓“四言”、“五言”、“七言”,都是以每句的字数计;“杂言诗”则指每句字数不定的诗。“上万言书”是指向上司(常指最高领导人)写的长信多达万字以上。正因为这样,几千年来,我国历代学者对汉语的研究都是从“字”入手的,甚至由不只一个汉字组成的“联绵词”,从《尔雅》以来也一直叫作“联绵字”;还有收这类字的专门“字典”(注意:不叫“词典”),如近代符定一的《联绵字典》、王国维的《联绵字谱》。这就是我国“字”学渊源特别深厚的原因。
4.汉人以“字”别“词”。
汉语普通话音节,不加声调只有400多个,加上声调也只有1200个左右;而汉字总数却很多,即使以7000个通用汉字说,平均每个音节有五六个汉字。实际上,各个音节的出现频率是很不相同的,经常出现的只是其中一小部分。有人把汉语400多个音节分为常用(14个)、次常用(33个)、又次常用(62个)、不常用(其余)4类,其中前两类仅47个音节,却占总出现率的50﹪(林祥楣,1995,15-16页)。这样,语言中出现这些相同音节的“词”时,汉人就用“字”加以分别。最常见的是说姓氏时所用的“拆字法”,如“我姓zhāng,立早章。”又如对话:“您贵姓?”“免贵,姓wú,口天吴。”另外,汉语方言众多,同一个“字”,在不同的方言里读音是不同的,所以当两个人用方言交谈互相听不懂时,用汉字写出来便顿时冰释,方言隔阂也就消除了。
从以上四点可以看出,“字”本位有一定的道理。徐通锵、潘文国等是“字”本位理论方面有影响的学者。徐先生的《基础语言学教程》(北京大学出版社,2001)和潘先生的《字本位与汉语研究》(华东师范大学出版社,2002)是这方面的代表性著作。徐先生在他的著作中提出“字”本位的基础理论——语言的基本结构单位理论。他说:“语言中只要是和概念或判断相联系的音义结合的单位,它就有可能是这种语言的最重要、最基本的结构单位。这种单位具有如下特点:第一,现成的,拿来就能用,像汉语的天、地、人、山、叫、走……都是储存在每一个人脑子里的现成的结构单位;第二,离散的,封闭的,很容易和其他的结构单位区别开来,像汉语的天、地、人等结构单位的封闭性、离散性特点非常突出,一个字一个音节,界限清楚;第三,在语言社团中具有心理现实性,即使没有受过教育的人,也知道一句话中有几个基本单位,例如‘鸡叫了三遍,天快亮了’这个句子有9个字。”(徐通锵,2001,20-21页)
二、“字”本位的理论缺陷
“字”本位说是近年来对百年汉语研究的反思中提出的一种理论,它主要针对的是“词”本位学说。由于“词”是对英语等拼音文字记录的语言的研究中得到的一个概念,所以,持“字”本位观点的学者认为:在英语等拼音文字记录的语言中,“词”(word)是天然的、基本的单位;而在以方块汉字记录的汉语中,这种天然的、基本的单位不是“词”而是“字”。其实,“字”的本质是写“词”的。“字”只是记录汉语“音节”的符号,而语言的单位,大者是能表达一个相对完整的意思的“句”,小者是表达一个概念的“词”。只是在古代汉语中,绝大多数“词”都是由单音节的“字”记录的,所以,在汉人的观念深处,没有“词”的概念,只有“字”的概念。由于“字”的本质是写“词”的,所以,所谓“造字法”其实就是“写词法”。关于这一点,王凤阳先生在他的《汉字学》(吉林文史出版社,1989)中有详细的论述。也正是由于“字”的本质是写“词”的,所以历代的“正字法”实际上就是“正词法”,只是汉字所表示的“词”没有形态变化,不存在大写小写和移行等西方文字所包含的内容,因而汉语是通过“正字”来达到规范“词”并进而规范语言的目的。
汉语里的词,在古代主要是单音节的,由于语言的发展,到了现代则以双音节为主。这样一来,从汉字方面看,在古代汉语里是表“词”的,在现代汉语里则是表“语素”的。现代汉语中汉字表语素实际是古汉语中汉字表词的发展。
由此看来,“字”本位和“词”本位在汉语研究中,本质上并无太大的差别,而是可以建立以“义”为核心的联系的。“字”是表“义”的,表词义或语素义,在古汉语中主要表词义;在现代汉语中主要表语素义。前边谈“字”本位的理由时,其第四点“汉人以‘字’别‘词’”其实正从反面说明了“字”本位的不足,或说明了“字”本位向“词”本位的回归。即从语言角度讲,其基本结构单位是“词”,“字”只是“别词”的一种手段或方式。
在用拼音文字记录的语言中,无论口语还是书面语,“词”要随其所在句子中的语法关系发生相应的形态变化;而在以方块汉字记录的汉语中,每个“字”都不变化,又与口语中的自然单位音节一一对应,因此,汉人长期以来不区分“词”,而关注的仅仅是“字”,于是就造成了“汉语是‘字本位’”的这种错觉。
其实,前面提到徐通锵先生所举的“天、地、人、山、叫、走……”;“鸡叫了三遍,天快亮了”这两个例子中,正好一个字就是一个词,但在现代汉语里,双音节词占多数,因此,“词”在人们的观念里,不仅渐渐产生了明晰的概念,而且地位也越来越重要。例如在“我们学校著名的化学教授高鸿是科学院院士”这个句子里,人们划分出的自然单位不是“字”,而是“词”:“我们/学校/著名/的/化学/教授/高鸿/是/科学院/院士”,如划分成单个的“字”,人们反而不知所云了;又如毛泽东《论联合政府》里有这样一段话:“我们/曾经/说/过/,房子/是/应该/经常/打扫/的/,不/打扫/就/会/积/满/了/灰尘/;脸/是/应该/经常/洗/的/,不/洗/也/就/会/灰尘/满/面/。我们/同志/的/思想/,我们/党/的/工作/,也/会/沾染/灰尘/的/,也/应该/打扫/和/洗涤。”这段话里,有21个双音节词,假如我们把这些双音节词按单个的“字”分开,这段话将是难以理解的:“我们”变成了“我”和“们”,“我”是指“自己”,“们”是什么呢?“曾经”变成了“曾”和“经”,“曾”是“曾经”的意思,多出这个“经”作何解释?……看来,光以单个的“字”来解释汉语,尤其是现代汉语,是解释不清楚的。
我们应该坚信的是:
1.任何语言,不管有没有书面语,其表达单位都是句子(表达一个相对完整的意思)。构成句子的基本单位都是词。一个句子可以由一个词单独构成,也可以由几个词组合构成。词和词可以组合成为短语,词和短语可以组合构成句子。
2.有书面语的语言,不管记录该语言的文字是表音文字还是表意文字,其文字都是写词的,汉字当然也不例外。
从上面的分析,我们可以认为:“字”本位的产生是看到汉语书面语的表面现象而未从语言的本质进行深入研究的结果。任何语言,不管它有没有书面语,都是以“词”为基本单位的。在汉语书面语里,“字”不是单独成词就是一个构词语素,外在表现都是一个个独立的方块形体,给人以十分深刻的“视觉冲击”,因而使其地位显得太特殊、太重要了,甚至连西方语言学家索绪尔也说:“对汉人来说,表意字和口说的词都是观念的符号;在他们看来,文字就是第二语言。”这样,在语言研究的“百年反思”中产生“字”本位思想当然也就不奇怪了。
三、汉字研究与汉语研究
1.从学汉字入手学习汉语。
汉字的“形、音、义”称为汉字三要素。形是音和义附丽的基础,音是该汉字所记录汉语的词或语素的读音;义是该汉字所代表的词或语素的意义(联绵词和音译外来词中的单个汉字无意义,仅代表音节,这种词很少)。
汉字的“三要素相统一”体现了汉字的科学性与系统性。通过对这种科学性与系统性的研究,可以提高对学习汉字的规律性的认识,从而提高学习汉语的效率。例如,北京大学对外汉语教育学院李大遂先生从对外国留学生的汉字教学实践中总结出汉字在形、音、义三个方面的系统性,他说:“汉字字形的系统性,主要体现在偏旁和合体字的形体联系即外部结构关系上。例如:“隹”系联常用汉字,可以系联出“隹”字形系字族:隹—难、集、雅、雀、雁、雄、焦、雇、雌、霍、雕、雏、准、谁、堆、推、唯、崔、惟、淮、维、稚、椎、锥。具有构形组字能力的汉字偏旁有一千多个,以这些偏旁系联合体常用字,就可以系联出一千多个形系字族。偏旁与其字族在形体上有明显的联系。如果学生把握了汉字字形的系统性,有利于合体字字形的记忆和书写。”
李大遂先生还讲到:“汉字的读音系统,主要是从形声字与表音偏旁读音关系上显现出来的。据分析统计,在构成现代汉语常用字的偏旁中,具有表音功能的有九百多个。如果以九百多个表音偏旁系联现代汉语常用字中的形声字,可以系联出九百多个大小不同的音系字族。具有同一表音偏旁的形声字,读音都与表音偏旁相同、相近或有声韵亲缘关系,如:唐—塘、糖、搪、溏;分—份、芬、扮、吩、纷、贫、氛、盼、盆、颁、粉。
汉字的意义系统,主要是从会意字、形声字与表义偏旁(包括表义兼表音偏旁)的意义关系上显现出来的。在构成现代汉语常用字的偏旁中,具有表义功能的偏旁约四百个。如果以这些表义偏旁系联现代汉语常用字中的会意字、形声字,可以系联出约四百个大小不同的义系字族。具有同一表义偏旁的一系列会意字、形声字,意义都与表义偏旁相同、相近或相关,如:鸟—鸣、鸦、鸭、鸽、鹅、鹊、鸡、鹰、鸠、鸥、莺、鸯、鸵、鸳、鸿、鹃、鹉、鹏、鹤、鹦;又如仑—伦、论、纶、沦、轮(‘仑’的本义是‘条理’、‘次序’,以‘仑’为表义兼表音偏旁的字,字义都与‘条理’或‘次序’有关)。”(李大遂,2004,115页)
这种以“形系字族”、“音系字族”、“义系字族”为纽带的识字法体现了汉字内在的规律性,也体现了汉字与汉语的内在一致性。
其实,这种认识不光对于外国留学生适用,对于我们以汉语为母语的人照样适用。几千年来,从周代《史籀篇》,秦代《苍颉篇》、《爰历篇》、《博学篇》,汉代《凡将篇》、《滂熹篇》,以及以后各代的《千字文》、《百家姓》、《三字经》等等,莫不是从识字入手来学汉语的。
汉字的字形结构也是有规律的。掌握这些规律可以帮助我们更有效地学习汉字,从而提高学习汉语的效率。例如,北京师范大学王宁教授通过汉字构形系统的分析,证明汉字是一种在字形结构上具有系统性的文字。她说:“从小篆起,汉字就有了一批兼有音和义的成字构件,作为构形的基础。汉字有了这批成字构件,便有条件把甲骨文的多形符象形字改造为多义符拼合的会意字,并且产生了一大批意符和音符互相制约的形声字。凡同义的字,用声符别词,如‘根’、‘枝’、‘条’、‘标’……都是树的部位,都从‘木’,用声符来提示它们记录哪个词而加以区别。‘玩’、‘完’、‘冠’、‘顽’……都从‘元’声,用义符来将它们分类而加以区别。这种形声字,大约占汉字总数的87﹪以上,成为汉字的主体。同时,汉字的义符和声符的表意示源功能又都得到了进一步的规整,这样,汉字便形成了以形声系统为中心的构形体系。”(王宁,2003,92页)
学好汉语何以要以“字”为基础?为什么从汉字入手可以提高学习汉语的效率呢?这可从以下几方面加以说明:
(1)“字”为构词基础及其与汉语层级体系的关系。
“字”,或本身就是词,或是语素用以构词;以词构成词组(短语),以词和词组(短语)构成句子,然后再由句子构成段落和篇章。这与刘勰《文心雕龙》中所说的“因字而生句,积句而成章,积章而成篇”是一致的。“字”的基础打牢了,学习汉语就会“日新月异,蒸蒸日上”。我国几千年语文教育都从识字入手;外国留学生学汉语也必须突破识字关这一事实说明,只有打牢“字”的基础才能学好汉语。
(2)汉语中词、短语、句子三者的结构原则基本一致。
许多汉字可以单独构成词,如“山”、“水”、“天”、“地”、“江”、“河”、“人”等;这些字也可以合起来构成词,如“江河”、“天地”、“河山”等;也可以同一个字重叠构成词,如“山山”、“水水”、“人人”等。以汉字为基础构词,方法多样,形式灵活,用少量字可以构成大量的词供人们在不同情况下使用。在古汉语中,汉字单独成词率极高,到了现代,双音节词在汉语中占了优势,但汉字的重要性并未降低。单字词的数量虽然少了,但过去的表词单字又以语素的身份大量地参与造词,其功能更强了。
汉语中,词、短语、句子三者的结构原则基本一致,使汉字的基础地位异常牢固:字构成词,词构成短语,词和短语构成句子都有主谓、动宾、偏正、补充、联合等五种基本关系,学会了以“字”构词这个基础,掌握了这一套基本结构,便可以造出无穷的句子来表达无限丰富的思想了。词的双音化,大大提高了汉字的利用率,使常用字量减少,从而减轻了识字的负担,加上现代白话文和口语一致,学习的效率就可以大大提高。
(3)汉语以语序和虚词为表达语法关系的主要手段。
汉语主要以语序和虚词为语法表达手段,所以,掌握了一定数量的“字”,并学会了以字构词,便会很容易地掌握以词造句。例如 “不很好”和“很不好”,同样三个字,次序不同,意思很不一样;“我和弟弟”与“我的弟弟”意思也很不相同。这些都是“字序”和虚词在起作用。虚词数量不多,掌握了这些虚词,熟悉了汉语的“语序”,便找到了学习汉语的门径。门径既得,登堂入室也就不难了。
2.从“字”出发研究汉语。
从上面汉语的“层级体系”和汉语的语法特点可以看出,“字”代表汉语中的“词”或“语素”,都能表“义”,因而是研究汉语的基础。但是,多年来的汉语研究却忽视了汉字这个基础,因而使汉语研究的许多深层次问题难以解决,比如怎么确定词与非词的界限就是一个有待研究的问题。让我们来看下面的例子:“游”是一个词,“游泳”是词还是词组?“泳”是语素还是词?从“字”出发,在不同的语言环境里情况是不同的。“游”可以是一个动词,如“游过江去”;也可以是一个语素,如在“游泳”、“上游”、“旅游”等词中。“泳”可以是一个词,相当于“游泳”,如可构成词组“泳坛”;也可以是一个语素,用它可以构成“游泳”、“泳道”、“泳装”、“泳帽”等动词或名词。再如“蝴蝶”是联绵词,由两个“字”构成,一般不能单说“蝴”或“蝶”;但在“蝶恋花”、“庄周梦蝶”中,“蝶”是词,指“蝴蝶”。“石榴”也是这样,一般不能单说“石”或“榴”;但可以说“榴花红似火”,“榴花”即指“石榴花”。联绵词中的字有的却又不能单说,如“萝卜"中的“罗”和“卜”、“芙蓉”中的“芙”和“蓉”等。因此,以“字”作为计算机自动识别的对象,再让计算机识别哪些字是表词的字,哪些字是表语素的字或表音节的字,以及在什么环境下怎样组合,这需要我们做许多“分辨” 的工作和仔细的研究,并把不同情况下的处理结果“教”给计算机。这种分辨和研究涉及词法、句法、语义分析、语用分析等诸多方面,其中的理论问题、技术问题相当复杂,有待各方面的专家作进一步的深入研究。再如:
(1)、a.白天鹅飞过来了。
b.白天鹅可以看家。
在这两个句子里,a句可以以词为单位切分为“白/天鹅/飞/过来/了”;而b句则可切分为“白天/鹅/可以/看/家”。其中“白天鹅”三个“字”之所以作不同的切分,是因为在a句里,“白”是一个词,它和“天鹅”构成偏正关系的词组(短语);而在b句里,“白”是一个语素,它和“天”构成一个词“白天”。
这种切分是基于人的生活常识:“天鹅”会飞,“鹅”不会飞。在我国南方农村,“鹅”可以看家,而“天鹅”不会看家。如果要让计算机能做出如上的正确切分,则须教给它以上这些“生活常识”,让它具有这种“智能”。因此,以“字”为基础,对“白、天、鹅”三个字在以上句子里的“词”与“非词”进行“智能”分析就成为信息处理的必需。
(2)、a.买瓶饮料。(“饮”:读yǐn,“可以喝的”义。)
b.牛饮了没有?(“饮”:读yì n,“给牲畜水喝”义。)
这两个句子里的“饮”是多音多义字,a句里“饮”是语素,b句里“饮”是词;如果让计算机自动识别,也必须“教”会它识别的方法。
(3)、a.我就管他。(“就”:“只”义)
b.我就管他。(“就”:“偏”义)
这两个句子有歧义,但无论在口语中还是在书面语中都是完全相同的。意思的不同是由“就”这个汉字构成的同音多义词造成的:读音相同、词性也相同,而词义不同。要让计算机能做出正确判断,就必须教给它对“就”这样的同音多义词在句子所在的“语境”里的具体意义作出正确判断。
(4)、a.县里来了一位眼科大夫。
b.他理发去了。
这两个句子都有歧义。对a句可以作两种理解:(1)“一位眼科大夫从县里来了。”“县里”是出发地。(2)“一位眼科大夫来到了县里。”“县里”是到达地。对b.句也可以有两种理解:(1)“他去给别人理发了。”(2)“他去让别人给自己理发了。”在a句的两种理解里,关键是:“县里”是施动者“一位眼科大夫”动作(位移)的“起点”还是“终点”。在b句的两种理解里,关键是:“他”是行为“理发”的发出者还是承受者。a句里的方位词组“县里”和b句里的代词“他”,相同的“字”之所以可以理解为不一样的意思,是因为不同的上下文“语境”造成的,要让计算机能正确做出判断,就要给计算机这方面的“智能”,让它在一个更大范围的上下文里知道“县里”和“他”的具体含义是什么。
结 语
汉字是记录汉语的书写符号系统,几千年来,它有效地记录了汉语,负载和传播了汉文化,因此,离开汉字研究汉语是不可思议的;汉字又是一种形、音、义三位一体的特殊文字,科学性、系统性很强;所以,我们运用西方语言学理论来研究汉语时,必须把汉字这个“中国特色”考虑进去,充分挖掘汉字研究这一富矿,对“字”在不同语言环境里的具体功能作具体的分析,并广泛吸收社会语言学、心理语言学、认知语言学等语言学分支学科,以及信息处理等学科的新成果,采用现代手段进行研究,只有这样,才能把汉语的研究不断引向深入。
【参考文献】
李大遂 《突出系统性 扩大识字量——关于中高级汉字课的思考和实践》,《语言文字应用》[J],2004年第3期。
林祥楣主编《现代汉语》[M],语文出版社1995年版。
卢戆章《中国第一快切音新字》序,《清末文字改革文集》[C]文字改革出版社1958年版。
王 宁《汉字构形学讲座》[M],上海教育出版社2003版。
徐通锵《基础语言学教程》[M],北京大学出版社2001年版。
林允富 西北大学文学院教授,《汉字书同文研究》丛书编审委员会委员。