500个基本汉字是怎样产生确定的?
【内容提要】500个基本汉字是一个新概念。它是怎样产生的?它不是主观臆造,它是经过归纳整理得出来的科学结论。汉字本身是有构字规律的,它不是杂乱无章的。只要我们认识并找出汉字构字规律,就掌握了学习汉字的一把金钥匙,打开了知识宝库的大门。
【关键词】基本汉字 独体字 构字规律 被构成字
汉语和汉字是亿万人民所掌握的语言和文字。特别是汉字何以能为广大亿万人民所掌握?我们的传统观念认为汉字难学,既然难学,那又为什么被那么多的人们所掌握所利用?这当中存在着什么奥秘?这个问题值得我们认真对待。
除了我们在学习汉字时所付出的时间代价,究竟汉字本身构字有没有规律可循?我们对这些构字规律是否给予了足够的重视?进行了科学的、认真的、足够的研究?其实这个问题很简单,只要认真地加以研究,汉字的构字规律是可以认识的。经过近年来对这个问题的逐步研究和认识,归纳整理出的500个基本汉字就科学地解答了这些问题。
1982年5月,《快速集中识字手册》出版后,我感到这本书的“基本汉字”没有明确的字数,能不能把基本字继续进一步压缩?找出一个明确的字数?这样,我就开始了这方面的研究。在《快速集中识字手册》的基础上,又进一步进行了压缩,最后确定500个基本字是完全可能的,也是可行的。
发表在1995年第7期《电子出版》的《汉字的笔画、部件、偏旁和基本字四大组成部分》,列出了《500个基本汉字总表》。这是我90年代初,为第三届重庆计算机技术交流学术会议写的一篇论文。《500个基本汉字总表》第一次出现,公布了我研究这500个基本汉字的成果。
这个《500个基本字总表》,是我在1982年5月由新华出版社出版的《快速集中识字手册》的基础上归纳整理而成。《快速集中识字手册》的《基本字组字表》是在原文改会公布的《印刷通用汉字字形表》的范围归纳整理而成。
1998年10月,由海洋出版社出版的《汉字基本字带字识字手册》(汉英对照版),所列的《基本字组字表》基本上是按《快速集中识字手册》中的《基本字组字表》而确定。
《基本字组字表》是根据《印刷通用汉字字形表》和原北京新华字模厂的《字目表》6805字的范围,在70年代末归纳整理而成。它的基本字有901个,被构成字有4999个,这个数字是很大的。在4999个被构成字中,有很大一部分字是冷僻字。《基本字组字表》曾附在《快速集中识字手册》的前面。
《快速集中识字手册》正文中的878个基本字和2684个被构成字,是按照《基本字组字表》选出确定的。《汉字基本字带字识字手册》正文中的733个基本字,2337个被构成字的这两本书正文中数字,基本上相差不大,《学好500个基本汉字》确定的500个基本字,是在前两本书的基础上进一步压缩,得出了500个基本字和2333个被构成字的结论。
早在1974年8月,在原国家出版局开展汉字查频工作之前,我们就开始搜集各种各样的字表,如印刷厂的字架表,新华字模厂的贴字模箱表,包括1965年1月由文化部和原文改会联合发布的《印刷通用汉字字形表》等大量字表,当时我感觉这些字表很乱。也联想到印刷厂的铸字工人,他们查字模不是按字的使用频度,而是按部首笔画,因为不科学,每查一个字模,须在字模箱前拉来拉去,他们的工作是那么辛苦。那时我就萌发了要搞清汉字构字规律的念头。
1979年我国还没有台式微机,汉字输入采用大键盘还是小键盘,还没有定论。我被派到天津红星打字机厂研制大键盘,那时我已有了几年的搞汉字频度和标准汉字研究的经验,我便开始了对汉字构字规律问题的研究。
1980年我被调到新华出版社工作。我利用业余时间对基本字开始研究并动手制作卡片。根据《印刷通用汉字字形表》6196字加上495个添盘字等工具书进行归纳整理出《基本字组字表》。1982年5月,新华出版社出版了《快速集中识字手册》。
名 称 |
基本字 |
被构 |
部件 |
部件 |
难以构 |
《基本字组字表》[1] |
901 |
4999 |
140 |
726 |
166 |
《快速集中识字手册》 |
878 |
2684 |
114 |
352 |
93 |
《汉字基本字带字识字手册》 |
733 |
2337 |
73 |
243 |
37 |
《学好500个基本汉字》 |
500 |
2333 |
汉字 |
汉字 |
27 |
在《学好500个基本汉字》中,共列有500个基本汉字,2333个被构成的汉字,共2833个汉字。这个数字同几个学习汉字要求的工具书认读数字相对比,它比较适中。
同《汉字频度统计》相比较,它已达到99.474%,学好2833个汉字,一般的书刊上的文章都能看懂,文章中所出现的冷僻字,看不懂的字不太多了,这是一个继续提高的问题了。
同《现代汉语常用字表》3500个常用字比较,它高于一级常用字2500个,低于3500个常用字,2833个汉字比较适中。
同《小学语文用字表》3071个相比,2833个字也低于3071个,也较适中。
同《汉语水平词汇与汉字等级大纲》的2905个字相比,2833个汉字基本上相吻合。因此,它符合外国人学习汉字的要求。
1988年2月,国务院发布《扫盲工作条例》,规定脱盲标准农民必须识字1500个,职工和城镇居民必须识字2000个。《现代汉语常用字表》有2500个常用字,在《学好500个基本汉字》中收集的2833个基本字和被构成字,也基本上符合要求。
在《快速集中识字手册》和《汉字基本字带字识字手册》这两本书中的基本字字数878个字和733个,这两个数字基本相差不大,基本上反映了汉字构字规律。被构成的汉字情况基本也是如此。
《学好500个基本汉字》确定的500个基本汉字,除了按正规的构字规律归并外,对一部分字形不规则的汉字,采取了如下的一些做法:
——以基本字为中心,采用简略模糊并入法;
——有极少数笔画较多,由几个基本字构成的字,按主要的基本字并入;
——有极少数由冷僻字和没有字义和读音的部件独体字,为了控制基本字字数便于归纳排列,选择一个基本字作为代表字。
据统计,在7000个通用字中,只有236个是独体字。在236个独体字中,还有极少数字没有构字的能力,不能构成另外的汉字。为了把基本字控制在500字之内,不扩大传统的部首范围,采取了以基本字为中心,简略模糊并入法。这些办法并不影响认读汉字,只是一个不得已的办法而已。具体说明如下:
⑴基本字加部件:“拖的右边”并入“也”。
⑵基本字上面加部件:“敢的左旁”并入“耳”,“卢”并入“尸”。
⑶基本字加笔画:“弗、弟、夷”并入“弓”,“讯的右边、凡”并入“几”,“丸”并入“九”,“刃”并入“刀”。
⑷基本字字形相同加笔画:“豖”并入“豕”,“矛”并入“予”,“甩”并入“用”。
⑸基本字上面加基本字:“”并入“早”。
⑹左右双重基本字:“羽”并入“习”。
⑺上下基本字,以上面基本字为主:“歪、甭”并入“不”。
⑻双重基本字加基本字:“琴”并入主要基本字“今”,“殿”并入“共”,“辑”并入“耳”。
⑼基本字加复式基本字:“冀”并入起始基本字“北”。
⑽基本字分离:“衣字框”并入“衣”。
⑾基本字加偏旁加部件和笔画:“滚”并入“公”,“藤”并入“月”中。“葵”并入“天”,“插”并入“千”,“舞”并入“夕”。
⑿偏旁加上下基本字:“隋”并入“月”。
⒀基本字加部件:“鼻”并入“自”。
⒁偏旁加基本字和部件:“寇”并入“元”,“漆”并入“木”,“藏”并入“臣”。
⒂冷僻基本字不单列:“融”并入“虫”。
⒃字形中间变换基本字和部件集中,如“辨”、“辩”,“衍”、“街”的字形集中排列。
⒄以部件为中心集中:勺(勹)所有“勹”这个部件构成的字都集中。
⒅部件用汉字代表:“厶”(私)、“丩”(叫)、“择的右边”(择)、“报的右边”(报)。
⒆笔画多、字形复杂的以基本字为主并入,“穆、黎、鼎”分别并入“白、禾、目”。“寡”并入“刀”。“叠”并入“又”,“器”并入“犬”。
⒇多个基本字组成的字,由笔顺起始的基本字并入:“翻”并入“釆”、“赢”并入“亡”、“嘴”并入“此”。
(21)变形的基本字并入正体基本字:“⺶”并入“羊”,“判的左旁”并入“半”,“”并入“主”、“逆”并入“山”、“攻”并入“工”。
通过以上给这部分字形不规则的汉字定位,目的是便于学习,如按一般工具书传统的细致的部首定位,那要增加若干部首,位置会分散,不利于集中学习汉字,这样定位并不影响学习。
500个基本汉字反映了汉字构字基本规律。汉字的构字存在着规律。汉字多是由基本字加上偏旁、部件和笔画组成新字。如果我们把这些偏旁、部件和笔画去掉,还原基本字,加以归纳和整理,便可以得出基本字。这些基本字有多少呢?经过归纳整理,可以初步确定它有500个。我们认识这一汉字构字规律,对汉语教学将起很大作用,我们要使集中识字系统化,使汉语教学科学化、系统化,提高汉字教学的速度和质量。
汉字是象形文字,一般由偏旁构成的汉字,左边是偏旁表意,右边是形声字表示字音和意义,它是独体字,也是基本字,这些基本字可以加上不同的偏旁和多个偏旁和部件构成另外的汉字,不管字形多么复杂,总有由一个基本字和部件构成。在被构成的新字中,产生新的字义,或相近的字义。这也是为了表达更接近字义和客观事物的意境,产生的新汉字。这也说明了汉字的变化功能和作用,不同于拼音文字的地方。汉字适应性很强,它的构词能力也很强,同样一个汉字,在不同的构词中,在不同的句子中,产生不同的意义变化和功能作用。
基本汉字与独体字的关系。据统计:在7000个通用字中只有236个独体字,占通用字3.4%。在这236人独体字中,有的无法进行构字,或构字很少。因此,有的独体字它不能算作基本汉字。但大部分可以作为基本汉字,因为它们可以构成另外的汉字,或者构成一部分基本汉字。
基本汉字大部分是独体字。有一部分独体字不是基本汉字。它不能构成另外的汉字,也不是常用字。比如“凸、凹、丫、孓”等是独体字,它又不能构成另外的汉字。它既不是常用字,也不是基本汉字。
基本汉字的双重意义。“基本汉字”不是汉字改革的概念。“基本汉字”是通过对7000多个汉字的归纳整理得出来的结果。它是构成众多汉字的基本的汉字字形,因此,赋予它基本汉字的名称。基本汉字大多是不带偏旁的汉字,它是独体字,绝大多数是常用字,个别的有带偏旁的字,因为有些汉字是由多个偏旁组成,因此保留为基本字。
1935年11月,由上海生活书店出版的洪深所著《一千一百个基本汉字使用教学法》,是属于文字改革的范畴,他所拟定的基本汉字,是起一个限定使用汉字的数量作用,不是根据汉字构字规律确定的基本字,它是由常用的普通汉字所组成,把中国的汉字限定1100个数量范围,遇到这数量范围以外的字,要改用别的字,这个难度相当的大,不太现实。这要比我们70年代搞的达到使用频度的99.73%的3260个标准汉字同音代替的难度还要大的多。
这篇文章的写作接近尾声之时,收到了台湾渔业研究专家、中易系统创始人戚桐欣先生,对这项工作给予大力支持的信件。戚先生同意把《学好500个基本汉字》同中易系统相结合,并开展各方面的工作。对此,向戚桐欣先生表示衷心地谢意,现引用一段原文:《中易系统Chinese Binary System》分为Big5/13053、GB-K/7000两种使用环境,前者的资源比较丰富,有篆、隶、楷、行、正、简等字型,有字典、辞典等注解,有偏、旁、声、韵、笔形、笔顺等检索功能,这些资源尚未全部移转到GB-K/7000环境,所以,现在使用新著《学好500个基本汉字——基本字带字集中识字》的最佳环境是Cwin98/cbs-02B5.exe。
在这篇拙文写完的时候,特别要感谢“书同文”研究会周胜鸿同志,是他的建议促使我写成了此文。多年来,出版了几本集中识字的书,对这些书,并没有认真地加以系统地总结,为了写此文,又从头到尾把这几本书做了统计,得出了科学的数据;同时,也罗列了确定500个基本汉字的问题,这些工作和所得出的数据,可能对研究基本汉字有所裨益,诚恳地希望学者专家对此提出宝贵的意见。
主要参考文献
⑴《快速集中识字手册》,新华出版社出版,1982年5月。
⑵洪深著《一千一百个基本汉字使用教学法》,上海生活书店出版,1935年11月。
⑶《汉字的笔画、部件、偏旁和基本字四大组成部分》,《电子出版》,1995年第7期。
⑷《汉字基本字带字识字手册》(汉英对照版),海洋出版社出版,1998年10月。
[1] 《基本字组字表》是在《快速集中识字手册》和《汉字基本字带字识字手册》前面列出的字表。