仓颉输入法
仓颉输入法是一种常用的中文输入法,由有“中文电脑之父”称誉的朱邦复先生于1976年创制。初期只有繁体字版本,原名“形意检字法”,用以解决电脑处理汉字的问题,包括汉字输入、字形输出、内码储存、汉字排序等。
朱邦复发明此输入法时正值他为台湾三军大学发展中文通讯系统之际,为纪念上古时期仓颉造字之精神,蒋纬国于1978年将此输入法重新定名为“仓颉输入法”。1980年,与宏碁公司共同发表世上首部具有中文操作系统、中文程式语言、中文套装软体的中文电脑——天龙中文电脑。
仓颉输入法适用于多种平台,主流操作系统和大部分电子辞典均有内嵌。一些线上汉字字典也采用仓颉编码作为检索工具。
1980年代初期,朱邦复在个人电脑上设计中文系统,以仓颉码为其根本,收字数万,效率甚高。
1982年,朱邦复登报公开放弃仓颉输入法专利权,并且极力推动电脑之中文化。现今大部分操作系统,甚至一些电子辞典皆附有仓颉输入法,为正体中文世界最普及的形码输入法。
朱邦复本来想根据其“汉字基因”理论,建立一套“仓颉系统”,用仓颉码统一处理汉字的形、音、义、码、序、辨等六大问题。其中仓颉码的原始目的是汉字检索及排序,其取码具有字首及字身的概念,以字首做为分类,字身做为补充,如此便可让电脑“理解”汉字,进而达到组字、字义理解,甚至与人沟通的功能。
由于本以汉字检索为目的,仓颉取码依据视觉辨识原理,能反映汉字的细微特征,几乎所有不同字形或异体字,都有不同的编码,因此重码率为当今中文输入法最低者。仓颉输入法亦为一般系统中支援字库最大者,几乎所有系统可见的汉字,皆可用仓颉输入法键入,因此也成为汉字文化工作者选用的主要输入法。然而,在台湾,当今主流电脑系统只提供仓颉输入法,没有采用整套仓颉系统,因此许多原先的设计理念,如仓颉内码、字型产生器与极大字库等,都没有实现。
朱邦复公开仓颉输入法,不收分文,使电脑汉化得到很大的进展。现今大部分作业系统皆附有仓颉输入法。它是繁体中文使用地区最常用的形码输入法。
目前最新的公开版本是第五代。待公开的第六代,为十万字库设计,重码率低。字库收录历代文献用字,以仓颉码作字库内码。这版本现仅提供部分专家学者使用。
软件优势
仓颉输入法的设计原意不单用来输入,更是一个整合的中文系统。汉字以仓颉码为内码,使汉字的字序分明,新字随时添加,没有大五码和统一码的收字不足,字序混乱的缺点。输出方面,汉字字形产生器以仓颉码为基本,自动产生字形。不需储存每一个字的字形,大大减少所需记忆空间。(例如朱邦复于1989年推出用第五代仓颉的聚珍整合系统,提供符合汉字结构的字数百万,有七万为实际用字。)由于输入输出统一以仓颉处理,取码可以与字形一致。现时以第六代仓颉(又称苍颉)为内核的中文系统,用来建构收录中国历代文献的汉文史资料库,仓颉系统的优点得到发挥。
版本更新
1977年,朱邦复在台湾发表第一代仓颉,根据一万二千字的《国语辞典》所设计。
1980年,发表第二代仓颉,仅将第一代仓颉略作调整。
1982年,发表第三代仓颉,是以《康熙字典》为范围,选取其中四万字,将第二代加以改良的结果。
1985年,在美国发表第四代仓颉。
1987年,返深圳科技园,任两仪文化科技公司总经理,发表聚珍大字库、第五代仓颉输入法。第五代将正、简体字统一处理,共收集了约六万字,同时增加一些辅助字形及修正了少许的取码。在朱邦复工作室网站上的《第五代仓颉输入法手册》一书中提供了第三代、第五代改码字的对照表。
1990年,与台湾资策会合作开发微软中文视窗(Windows)系统3.0,采用仓颉系统的概念。后来朱邦复与微软的合作关系破裂,之后Windows系统改采其他的汉字编码系统,并自行更新第三代仓颉输入法(修改了一些异体字及加入了部分香港字,但有错码),成为所见的主流版本。一般所称的“三代仓颉”多指此版。
2002年,朱邦复在其论坛提及:“仓颉输入法最后一版本——第六代已完成,并据之设计中文CPU”。因为朱邦复已不理输入法之事,转交沈红莲女士照料。第六代仓颉输入法改名为“苍颉检字法”,至2008年止未曾公开,仅供与“朱邦复工作室”有工作关系之专家学者使用。
仓颉字码
分为五大类,共26个仓颉字母,括号文字为相对键及读音:
五行类:日(A)、月(B)、金(C)、木(D)、水(E)、火(F)、土(G)
笔划类:竹(H,音斜)、戈(I,音点)、十(J,音交)、大(K,音叉)、中(L,音纵)、一(M,音横)、弓(N,音勾)
人体类:人(O)、心(P)、手(Q)、口(R)
字型类:尸(S,音侧)、廿(T,音并)、山(U,音仰)、女(V,音纽)、田(W,音方)、卜(Y)
复合类:无论在任何情况下,最多取首尾两码,包括:鬼(HI)、虍(YP)、斗(LN)、目(BU)、门(AN)、阝(NL)、几(VI,不包括左下角的人)、隹(OG)、吂(YR)
特殊类:难(X),用于特定的笔划,包括:臼(HX),卍(NX)等约十一种笔划;重(Z)(在第三代中不再使用,被一些自制仓颉当作特殊键)
首24个仓颉字母还可再变化、衍生出「辅助字形」来辨别所有的中文字。例如:「叉」字拆解为「又+丶」,对应字母为 E+I,其中这个「又」就是「水」这个仓颉字母的辅助字形。取码原则 中文字根据「由上而下,由左而右,由外而内」等原则分拆成字型结构,再以字码拼出。键盘上A至Y键各代表一字码(X键用于特殊字,Z键通常不用),例如A是「日」、N是「弓」。字码分表代表不同的中文字字型结构。取码分字首及字身,一个中文字最少用一码输入,最长则为五码。更有一口诀:
独体字:即不能成几部分的,取码:头、二、三。业-廿金廿木-TCTD
合体字:又可分为:
可分成两部分的:头尾、头二尾,例如:瑜-一土人一弓-MGOMN
可分成三部分的:头尾、头尾,尾(如字身一只一个码时,则字身二可取头尾两码),例如:髓-月月卜大月-BBYKB
其他例子:
“理”字 -(分拆)-> 一+土+田+土 -(对应字母)-> M+G+W+G
“哈”字 -(分拆)-> 口+人+一+口 -(对应字母)-> R+O+M+R
仓颉五代多字词取码规则:
(注:以下所指的 首/末,是其作为单字编码中所取的首尾码字母)
二字词:首末+首末=4;
三字词:首+首+首末=4;
四字词:首+首+首+首末=5.
仓颉字根口诀
G 土旁土与士
F 火小三四滴
D 木寸少心力
S 屍首左右柜,右侧梯,左弯钩
A 日曰日横立
--------------------------
H 竹头撇斤首
J 十宝玉不留
K 大病右爻头
L 中竖衣(衤)聿首【聿(yù)】
M 一提工厂石无口
--------------------------
T 廿草昔首头,业无眼,关下头
R 口
E 水滂雨点又
W 田囗毋空腹【 囗wei】
Q 手旁半少头,夫失足,年无头
--------------------------
Y 卜卞斗首走(辶)
U 山上框渔叉
I 戈点广县底
O 人入捺,矢无大,左倒八
P 心勹七匕弋失喉【勹(bāo)、弋(yì)】
--------------------------
N 弓乙左竖勾,斜月飞头
B 月且然半下框爵
V 女折衣底右弯勾
C 金儿八米头
X 难
仓颉字码键位口诀
ABCDEFG 日月金木水火土
日月金木水火土
HIJKLMN斜 点交叉纵横 钩
(竹) (戈) (十) (大) (中) (一) (弓)
OPQR人心手口
人心手口
STUVWXY 侧并仰纽方 难 卜
(尸) (廿) (山) (女) (田) (曰) (卜)
参照“仓颉字根口诀”,按照键盘26个英文字母,从左至右、从上至下的键位规律,总结出五言30字口诀。
手方水口并——【手田水口廿】——(QWERT)
卜仰点人心——【卜山戈人心】——(YUIOP)
日则木火土——【日尸木火土】——(ASDFG)
斜交叉纵横——【竹十大中一】——(HJKLM)
重难不常用——【重难不常用】——(ZX)
金纽月勾终——【金女月弓终】——(CVBN)
仓颉字码拆字
连体字
1. 取码数:最多四码,不足四码者全取。
2. 取码顺序:由上而下,由左而右。
3. 取码次序:取首、次、三、尾码。
例如:
允──【戈竹山】
豆──【口廿】
爱──【月月心水】
分体字
分体字的取码,分为【字首】及【字身】两部份。
由於分体字分为两部份,所以要注意两个取码的大原则:
1. 字首──至少取一码,至多取两码。
例如:
取一码:份、沙
取两码:则、话
超过两码﹝头尾两码﹞:点、线
2. 字身──至少取一码,至多取三码。
例如:
不超过三码﹝全取﹞:话、时
超过三码﹝分拆处理﹞:道、识