專(zhuān)利名稱(chēng):科學(xué)碼編碼方案的制作方法
專(zhuān)利說(shuō)明 用于計(jì)算機(jī)漢字鍵盤(pán)輸入所使用的輸入碼編碼方案。
現(xiàn)有各種編碼方案,從漢字的形和音的直觀反映出發(fā),進(jìn)行編碼方案地設(shè)計(jì)。因此有些方案重碼率較高;有些平均動(dòng)態(tài)碼長(zhǎng)較長(zhǎng);有些字集范圍較窄,有些規(guī)則較復(fù)雜難記難學(xué)。這些方案在《漢字編碼方案匯編》(科學(xué)技術(shù)文獻(xiàn)出版社1980年版)中有反映,在《中文信息處理國(guó)際研討會(huì)論文集》第三集中也有反映。
本方案克服了上述缺點(diǎn),引進(jìn)了拓?fù)鋵W(xué)和模糊數(shù)學(xué)并得出了一種比較科學(xué)的編碼方案。
本發(fā)明的目的是提高我國(guó)的漢語(yǔ)信息自動(dòng)處理能力,解決漢字輸入這個(gè)“瓶莖”問(wèn)題。
一、漢字的方向性 對(duì)每一漢字來(lái)說(shuō),我們定義它具有四個(gè)向外的方向性,即向上、向下、向左、向右。
二、漢字“字件”和“基本結(jié)構(gòu)字件”的方向性。
漢字的基本筆劃有“點(diǎn)”“橫”“豎”“撇”“捺”“鉤”六種。單獨(dú)的“頓”算作一“點(diǎn)”,與“撇”相交的“頓”算作“捺”,如“匆、兇、趙”等字中的“頓”。與“豎”相交的“頓”算作一“橫”。如“斥、拆”等字中的“頓”。“提”筆劃算作一“橫”,如′打、地、端′等字中的“提”?!罢邸惫P劃算作一“撇”如“通、令”中的“折”筆劃。
我們對(duì)基本筆劃分析其拓?fù)湫再|(zhì)。
各種基本筆劃的不同組合構(gòu)成了漢字的“部件”(單一的基本筆劃,即一筆劃,不能作為部件),由這些部件組成方塊字。
字件一漢字中單獨(dú)出現(xiàn)(與其它部件不相連)的部件。
舉例說(shuō)明“備”可以看作是上、下兩個(gè)字件組成;“向”可以看作是內(nèi)外兩個(gè)字件組成;“容”可以看作由4個(gè)字件組成。
基本結(jié)構(gòu)字件-由一個(gè)或多個(gè)字件組成,構(gòu)成漢字的基本結(jié)構(gòu)單元。
漢字的基本結(jié)構(gòu)字件組成漢字時(shí)有四種方式。
①上、下方式以
形表示,如“基、共、塹等字。象“翼”“蕊”“帶”等字屬于
形,也可視為上下方式即把上部第一二字件看做上部基本結(jié)構(gòu)字件,其它視為下部基本結(jié)構(gòu)字件。
②左右方式,以
表示,如“橫”、“瞧”、“欽”等字,象“浙”“鍬”“卿”等字屬于
形的也可視為左右方式,即把最左邊的字件視為左部基本結(jié)構(gòu)字件,其它部分視為右部基本結(jié)構(gòu)字件。
③包圍式,以
表示,可分為全包圍,三面包圍和二面包圍,如“國(guó)”“同”、“勺”、“闖”、“區(qū)”、“延”、“翹”等字。
④不可分結(jié)構(gòu),以
形表示,如“木”、“左”、“右”、“為”、“目”、“允”、“早”等。
1、對(duì)于
形漢字,(或
)其最上部字件只有向上、向左向右三個(gè)方向,最下部字件只有向下、向左向右三個(gè)方向,中部字件只有向左、向右二個(gè)方向。
2、對(duì)于
形漢字,其最左部字件只有左、上、下三個(gè)方向,中部字件只有上、下二個(gè)方向。最右部字件有右、上、下三方向。
3、對(duì)于包圍結(jié)構(gòu)
形漢字,被包圍字件只有未被包圍方向的方向,而起包圍作用的字件具有上下左右四個(gè)方向,如“這”字內(nèi)部字件只有向上、向右二方向。
4、對(duì)
形漢字具有上下左右四個(gè)方向。
綜上所述,字件或基本結(jié)構(gòu)字件其方向都不具有相鄰其它字件位置方向的方向性。
三、漢字基本筆劃(除“點(diǎn)”外)的規(guī)定方向和確定方向 1、漢字的每一基本筆劃(除“點(diǎn)”外)都有一個(gè)或兩個(gè)規(guī)定方向走向。
對(duì)“一”筆劃,有向左、向右的規(guī)定方向。對(duì)“|”,有向上、向下的規(guī)定方向。
對(duì)“/、\、
、乛、亅、乙、乚、
、”等,我們稱(chēng)它們?yōu)椤疤厥夤P劃”。
“特殊筆劃”規(guī)定方向法則特殊筆劃規(guī)定方向按左、右方向優(yōu)先考慮的原則。
例如對(duì)“/”,則有向左、向右的規(guī)定方向。“\”有向左、向右的規(guī)定方向。對(duì)“亅”,有向上向左的規(guī)定方向。對(duì)“
”則有向左方向的規(guī)定方向。對(duì)“乙”,只有向左、向右的規(guī)定方向。對(duì)“
”,只有向左、向右的規(guī)定方向,等等。
2、關(guān)于漢字基本筆劃上的非分點(diǎn)-FD 如果在每一基本筆劃的兩端標(biāo)以字母記號(hào),比如
……則a、b點(diǎn)是屬于拓?fù)鋵W(xué)中的非分點(diǎn),我們專(zhuān)稱(chēng)為“非分點(diǎn)”,以“FD”表示;另外規(guī)定FD具有方向性,其方向服從基本筆劃(除了“點(diǎn)”)的確定方向(不是規(guī)定方向)。確定方向的定義見(jiàn)3。
特殊FD對(duì)特殊筆劃中的“
”a點(diǎn)算作特殊的FD”,方向向下。而象“卩a、阝a”中a點(diǎn)不算作FD。
實(shí)際上,我們的編碼方案中的數(shù)字碼就是由漢字四個(gè)方向上的FD數(shù)目選取的。
3、漢字基本筆劃(除“點(diǎn)”筆劃外)的確定方向 (1)對(duì)“一”“丨”筆劃,其最后確定方向即規(guī)定方向。
(2)對(duì)特殊筆劃中的“丶”和“/”,其最后確定方向按上、下優(yōu)先考慮的原則,如這樣確定的方向延伸后與其它筆劃的規(guī)定方向或最后確定方向指向相交,則方向轉(zhuǎn)為考慮向左或向右。如果仍相交或符合“減消原理”中的條件,則該筆劃無(wú)最后確定方向,該筆劃上的FD不再計(jì)入FD數(shù)目。
減消原理-如果基本筆劃的確定方向與該筆劃所在的字件所具有的方向不一致,則該基本筆劃的這個(gè)方向上的FD不再計(jì)入FD數(shù)目。
(3)對(duì)特殊筆劃中的“
”等,a最后確定方向就是它的規(guī)定方向。
4、漢字四個(gè)方向上的FD數(shù)目的確定(本方案只涉及到下、右、上三個(gè)方向上的FD數(shù)目) 漢字的基本筆劃如果有最后確定方向,則該方向上的FD計(jì)入FD數(shù)目。
幾個(gè)特殊情況 (1)在“保、行、自、息、怎、復(fù)、在、右、怠、臺(tái)、豺”等字中出現(xiàn)有“
”部件,其中的a點(diǎn)作為FD只具有向上方向,b點(diǎn)只具有向左方向。另外象“喜”等字有“
a”部件,a點(diǎn)作為FD也只具有向上方向。上述規(guī)定下,如與其它筆劃的規(guī)定方向或最后確定方向指向延伸后相交,則其端點(diǎn)不再作為FD計(jì)入FD數(shù)目(“立”例外) (2)象“派、毛、紙、千、系、延、后、采、愛(ài)”等字中有“
a”等部件的,a點(diǎn)作為FD方向向右,如與其它筆劃的規(guī)定方向或確定方向指向延伸后相交或符合減消原理的條件,則a點(diǎn)作為FD變?yōu)橄蛏希绻苑较虿淮_定,則確定方向減消,a點(diǎn)不計(jì)入FD數(shù)目。
象“衣”等字中部件“a
”(方向向左)也有以上規(guī)定。
(3)象“秩、耕、補(bǔ)、襪、林、棘”等字中左部字件“a禾、a耒、a木、a礻、a衤、a朿”中a點(diǎn)作為FD只具有向左方向。如與其它筆劃的規(guī)定方向或最后確定方向指向延伸后相交,則其端點(diǎn)a不再計(jì)入FD數(shù)目。
(4)象“建、趙、遼、捉、提、處”等字中有“走a、辶a、
a、夂a、廴a、”等筆劃或部件的,其中a點(diǎn)作為FD只具有向右方向。如與其它筆劃的規(guī)定方向或最后確定方向指向延伸后相交,則其端點(diǎn)a不再計(jì)入FD數(shù)目。
(5)對(duì)“脊、登、炸、燈”等字中有“
a、火a”部件的,a點(diǎn)作為FD方向均向右。如與其它筆劃的規(guī)定方向或最后確定方向指向延伸后相交,則其端點(diǎn)a不再計(jì)入FD數(shù)目。
(6)象“小”等字中筆形“亅”對(duì)左邊的“撇”無(wú)減消方向作用。象“狡、豺”等字中“
”筆形對(duì)其左邊的“撇”有方向減消作用。
(7)象“闖、用、而”等字“
、冂、門(mén)”部件對(duì)內(nèi)部的“豎”筆劃的FD和“特殊FD”不起減消方向作用。
四、“點(diǎn)”筆劃的確定方向 準(zhǔn)則 ①“點(diǎn)”筆劃的確定方向延伸后不能與其它筆劃的規(guī)定方向或最后確定方向相交。
②“點(diǎn)”的最后確定方向不能與點(diǎn)所在字件的方向不一致。
③如果“兩點(diǎn)”相鄰,則其中一“點(diǎn)”不具有相鄰“點(diǎn)”在其相對(duì)位置方向的方向性。
這樣直接作為FD的“點(diǎn)”其方向確定按如下原則漢字中“點(diǎn)”的方向確定,依據(jù)其位置,優(yōu)先考慮向上或向下。如與準(zhǔn)則不符,或具有方向不單一,轉(zhuǎn)為向左、向右。如仍與準(zhǔn)則矛盾,或仍方向不單一,則該點(diǎn)不再計(jì)入FD數(shù)目。
幾個(gè)特殊情況 ①對(duì)“禾、木、衤、礻、朿、耒、赤”等部件其右下的點(diǎn)不再計(jì)入FD數(shù)目。
②象“門(mén)、勇、心、令、蟲(chóng)、則、貝、以、父”等字中“豎、橫、撇、鉤、提”等筆劃端點(diǎn)處如連著“點(diǎn)”筆劃,則該端點(diǎn)不再計(jì)入FD數(shù)目。而“點(diǎn)”的方向與這些筆劃的最后確定方向一致。這樣規(guī)定下,如與準(zhǔn)則?,灶R暗恪輩輝偌迫隖D數(shù)目。
如“令”字向下FD數(shù)目為1,而“勇”字上面的“點(diǎn)”不再計(jì)入FD數(shù)目。
③如果“點(diǎn)”筆劃在“橫”筆劃的中上部,則點(diǎn)作為FD方向向上。如果“點(diǎn)”筆劃在“豎”筆劃的中左部,則方向向左,在中右部,則方向向右。上述規(guī)定下,如與準(zhǔn)則矛盾,則“點(diǎn)”不再計(jì)入FD數(shù)目。
數(shù)字碼設(shè)計(jì) 每個(gè)漢字向下、向右、向上的FD數(shù)目均可作為數(shù)字碼。
字母碼設(shè)計(jì) 1、以漢字拼音的第一字母作為字母代碼。
2、取尾筆劃讀音的第一個(gè)字母作為字母代碼,計(jì)六種D(點(diǎn))H(橫)S(豎)P(撇)N(捺)G(鉤)。
3、(1)、對(duì)
形漢字及兩面包圍結(jié)構(gòu)的漢字,我們選取起筆劃所在的基本結(jié)構(gòu)字件;對(duì)三面或全包圍結(jié)構(gòu)的漢字,我們選取內(nèi)部基本結(jié)構(gòu)字件,如被選取的基本結(jié)構(gòu)字件能夠組成漢字并能發(fā)音,我們?nèi)“l(fā)音拼音的第一字母作為字母代碼;如不能發(fā)音,則如果該基本結(jié)構(gòu)字件有被定義的字母,取該字母作為字母代碼。(被定義有字母的部件見(jiàn)附錄) 如仍取不到字母碼,則取該基本結(jié)構(gòu)字件中起筆劃所在的第一個(gè)可發(fā)音字件拼音的第一字母或該字件被定義的字母作為字母代碼。
如仍取不到字母碼,則取該基本結(jié)構(gòu)字件中起筆劃所在的部件發(fā)音拼音的第一字母或被定義的字母作為字母代碼。如仍取不到字母碼,則取該基本結(jié)構(gòu)字件中起筆劃的讀音的第一字母作為字母代碼,這樣有四種 D(點(diǎn))H(橫)S(豎)P(撇) 注1°可發(fā)音的漢字不包括漢字的十個(gè)數(shù)字(一、二、三、四……八、九、十) 2°判定一個(gè)字件是兩面包圍還是三面包圍或是全包圍是依筆劃的規(guī)定方向而定的。如“勹”是三面包圍;“幾”是非包圍結(jié)構(gòu),“門(mén)”是全包圍結(jié)構(gòu)。
(2)對(duì)
形不可分結(jié)構(gòu)的漢字,起筆劃所在的部件如果可發(fā)音,則取其發(fā)音拼音的第一字母,如不能但被定義有字母則取該字母作為代碼。
上述規(guī)定下,如仍取不到字母碼,則取起筆劃的讀音的第一字母作為字母代碼(D、H、S、P)。
例如走-T早-R局-K足-K吊-K赤-T鹿-G (附錄)可被定義有字母的歸類(lèi)部件及定義字母 A-
宀 冖
亠(A類(lèi)歸類(lèi)部件) B-疒 C-镸
E-阝纟廿 F-衤礻 G-
戊
I-讠 J-钅 O-忄 Q-犭其 R-亻 彳
S-饣 T-扌 U-
(U類(lèi)歸類(lèi)部件) V-氵冫(V類(lèi)歸類(lèi)部件) W-艸 X-
(X類(lèi)歸類(lèi)部件) Y-耒 Z- 另外且-Q 木-M 耒-L 孑-Z 止-Z 車(chē)-C 習(xí)-X 忄-X 黑-H -Y 土-T 牛-N 匕-B 巫-W 西-X 工-G 禾-H 矢-S 朿-J 米-M 缶-F(Fou) 巳(Shi-S) 堇(jiny)-J 豸(zhi)-Z 酉(you)-Y 豕(Shi)-S 艮(yen)-G 聿(Yu)-Y 雨-Y 山-S 女-N 幾-J 又-Y 大-D
-F 克-K
-B 編碼規(guī)則 一、對(duì)單個(gè)漢字的編碼規(guī)則設(shè)計(jì)(數(shù)字0寫(xiě)成φ) 1、對(duì)頻度最高的幾十個(gè)漢字,我們采用二碼長(zhǎng)的規(guī)則設(shè)計(jì) 字母碼設(shè)計(jì)3中所得字母與向下的FD數(shù)目字組成二碼一字的代碼。如的-B1我-P3 2、對(duì)最常用的400多個(gè)漢字,我們采用三碼長(zhǎng)的規(guī)則設(shè)計(jì) 字母碼設(shè)計(jì)1、3中所得字母與向下的FD數(shù)目,字組成三碼一字的代碼。如媽-MN3最-ZR3國(guó)-GYφ 總碼數(shù)約2500左右 3、對(duì)全部漢字,我們采用五碼長(zhǎng)的規(guī)則設(shè)計(jì)(兩種) ①字母碼設(shè)計(jì)1,3所得字母與向下、右、上的FD數(shù)目字組成代碼總碼數(shù)約十二萬(wàn)多個(gè)。
例徇-XR2φ2或-HG232耕-GL323 芯-BW132 ②字母碼設(shè)計(jì)3,2所得字母與按字母碼設(shè)計(jì)2轉(zhuǎn)換成的數(shù)字(D-1,H-2,S-3,P-4,N-5,G-6)與向下、右、上的FD數(shù)目字組成代碼總碼數(shù)約32000左右。
例部-L31φ1數(shù)-L5414 二、對(duì)詞匯的編碼規(guī)則設(shè)計(jì) 1、①詞中每一字按字母碼設(shè)計(jì)1所得的字母與倒數(shù)第二字按字母碼設(shè)計(jì)3所得字母和最末字向下的FD數(shù)目字組成代碼。
如民族-MZH4 字母碼-ZMMP1(ZMMS1) 中國(guó)共產(chǎn)黨-ZGGCDA1 ②詞中每一字按字母碼設(shè)計(jì)3所得字母與倒數(shù)第一、二字向下的FD數(shù)目字組成代碼。
例面積-HHφ3科學(xué)家-HAA12大連工學(xué)院-HCHAE12中國(guó)共產(chǎn)黨-SYHAA11 2、快速碼四字以上的詞如果常用則采用快速碼 取首字按字母設(shè)計(jì)3所得字母與倒數(shù)第一、二、三字所得向下的FD數(shù)目字,組成代碼。
如標(biāo)準(zhǔn)代碼-M221戰(zhàn)爭(zhēng)與和平-Z111 中華人民共和國(guó)-S21φ 三、對(duì)漢字偏旁部首的編碼設(shè)計(jì) 每一偏旁部首的起筆和尾筆的讀音作為字母碼以9作為第一個(gè)數(shù)字碼,向下向右的FD數(shù)目作為兩個(gè)數(shù)字碼。例 乙-HG9φ1凵-SS9φφ 扌-HH912纟-PH9φ權(quán)利要求
1、一種用于計(jì)算機(jī)漢字鍵盤(pán)輸入所使用的輸入碼編碼方案。
該編碼是由數(shù)字碼和字母碼兩者組成,字母碼是由漢字各部件被定義的字母或漢字拼音的代表字母組成;數(shù)字碼是漢字某些方向上的非分點(diǎn)數(shù)目組成,非分點(diǎn)以“FD”表示;其特征在于(A)所給出的19個(gè)漢字歸類(lèi)部件和相應(yīng)被定義成的英文字母;(B)其FD的選取依據(jù)在筆劃、字件和漢字三者的“確定方向”或規(guī)定方向一致方向上。
2、根據(jù)權(quán)利要求1所述編碼,其特征在于(A)漢字字件和基本結(jié)構(gòu)具有的規(guī)定方向;(B)漢字基本筆劃和特殊筆劃具有的“確定方向;”(C)漢字基本筆劃和特殊筆劃具有的“規(guī)定方向”。
3、根據(jù)權(quán)利要求1所述編碼,其特征在于非分點(diǎn)所包括的“特殊FD”是部件
中的a點(diǎn)。
全文摘要
一種用于計(jì)算機(jī)漢字鍵盤(pán)輸入所使用的輸入碼編碼方案。
本編碼數(shù)字碼是采用拓?fù)浞欠贮c(diǎn)(FD)的數(shù)目。字母碼是采用本編碼給出的各部件的代表英文字母,或拼音的代表字母,或尾筆劃讀音的代表字母。由字母碼和數(shù)字碼結(jié)合而成一個(gè)漢字或漢語(yǔ)詞匯的編碼。
本編碼中信息能完全兼容、字集范圍龐大,重碼率低于0.4%,平均動(dòng)態(tài)碼長(zhǎng)短于目前的其它方案,規(guī)則簡(jiǎn)單,適合方言地區(qū),海外人士和不同教育程度者的要求。
文檔編號(hào)G06F3/023GK1033326SQ8710796
公開(kāi)日1989年6月7日 申請(qǐng)日期1987年11月22日 優(yōu)先權(quán)日1987年11月22日
發(fā)明者趙瑛 申請(qǐng)人:趙瑛