專利名稱:新概念漢字編碼的制作方法
新概念漢字編碼(簡稱新概念碼)。本發(fā)明屬于一種確定漢字字根以及漢字韻母在26個英文字母鍵上位置布局關(guān)系的漢字編碼方法,適用于一切計算機及電腦打字機的漢字輸入鍵盤,適用于一切使用漢字編碼進行分類、查詢的領(lǐng)域。
從鍵盤布局來說,漢字編碼可以分為兩類第一類是字根和字根讀音相對應分布,比如字根“大、刀”和“D”對應,“宀、貝”和“B”對應;第二類是字根不與字根讀音對應分布,比如五筆字形的鍵盤布局就是這樣。一般說來,第一類比第二類要易記易學得多。但第一類同時也比第二類的重碼率高得多。五筆字形屬于第二類,自然碼、栗氏碼、五十字元法和新概念漢字編碼同屬于第一類。屬于第一類的漢字編碼還有許多。自然碼、栗氏碼和五十字元法雖然好學好記,但它們的重碼率就比五筆字形重碼率高得多??墒俏骞P字形字根太多又難以記憶,且編碼規(guī)則也太多。因此,上述四種漢字編碼往往在易記易學和重碼率之間偏重一方,并沒有找到一個兩者兼優(yōu)的平衡點。
經(jīng)過嚴格計算,將五筆字形重碼字的個數(shù)除以國標字庫的全部6763個漢字,它的重碼率為7.33%;將五十字元法重碼字的個數(shù)除以6763個漢字,那么,它的全形碼的重碼率為18.04%,它的形聲碼(包括聲形碼)的重碼率為10.35%。自然碼和栗氏碼的重碼率和五十字元法屬于同一量級。自然碼僅是一種音形碼(聲韻形碼)。這種漢字編碼對使用者掌握拼音的要求很高,因此,在使用范圍上受到很大限制。栗氏碼和自然碼特點類似。五十字元法雖然有形聲碼、全形碼和音形碼,但它主要還是屬于以音為主的漢字編碼,它的編碼中目前也只有形聲碼較為受用戶歡迎,而全形碼由于重碼率太高,所以用戶很少使用。它的全形碼和五筆字形(五筆字形是一種全形碼)相比,重碼率高出一個數(shù)量級,并且,它的全形碼和聲形碼并未實現(xiàn)統(tǒng)一。因為,有許多漢字在全形碼中的編碼和形聲碼中的編碼完全不一樣,一類漢字就是這樣。按照形聲碼和全形碼統(tǒng)一的原則,兩者之間只是最后一碼不同,而聲形碼和全形碼兩者之間只是第一碼不同,五十字元法遠遠沒有達到這樣的要求。
本發(fā)明的目的是設計一種易記易學的漢字編碼,且最大限度地降低重碼率,真正實現(xiàn)漢字編碼三大類型五種編碼模式的統(tǒng)一。
經(jīng)過多年的實踐探索、綜合分析和歸納統(tǒng)計計算,本發(fā)明選用了一百二十九個漢字部件作為字根,并且將一百二十九個字根劃分為基本字根和歸類字根兩類。基本字根是按其讀音或其名稱的主要讀音布置在與其讀音相同的聲母鍵上;歸類字根為與基本字根形狀類似的字根,無論歸類字根如何讀音均認定該歸類字根與其形狀類似的某一基本字根為同一讀音,即該歸類字根布置在與其形狀類似的某一基本字根的同一鍵上。
基本字根在英文鍵盤上的位置布置關(guān)系為A:竹中B:宀八貝C:艸寸D:氵刀大刂E:阝二兒F:囗日目方 G:廣工弓亅 H:火一 I:廠車乂 J:钅幾臼
K:冂 L:扌力
M:木皿 N:牛女鳥
O:口
p><p>聲母和字根關(guān)系的說明如下①用A、I、U三個字母分別代表zh、ch、sh三個聲母;V代表ü;O叫做“零聲母”,代表沒有聲母的字的“聲母”。如“安、餓、歐、哀”O(jiān)J、OE、OO、OL等。
②“七”是代表類似“七”和含有類似“七”結(jié)構(gòu)的字根(
、匕、
),不管三七二十一均統(tǒng)稱為“七”;按照“七”字的聲母放在Q里。
③“扌”叫“拉手旁”,“ク”叫“魚字頭”,“
”叫“曲”,“丨”叫“豎”,“一”叫“橫”,分別按各自(拉、魚、曲、豎、橫)的聲母放在L、V、Q、U、H里。“忄”是豎“心”,放在X里?!皝R”是倒“八”,放在B里。
④“”叫“折”,按“折”的聲母放在A里。注意凡是向左下折筆的結(jié)構(gòu)均叫做“折”,如“ㄣ、ㄋ”等。
⑤“門”叫“門框”,按“框”的聲母放在K里。其中也包括上框、下框、左框和右框,即“冂、凵、匚、
”。
⑥把“丶”部歸在“
”部,按“捺”的聲母放在N里。
⑦把“囗、日、目”看作為方形結(jié)構(gòu),按“方”的聲母放在F里。應當注意的是,其中“囗”內(nèi)包含有其他字根,它和“口”是完全不同的。
⑧“口”和英文字母“O”象形,按照英文字母“O”的形態(tài),放在O里。
此外,為了形成全形碼”形聲碼(包括聲形碼)、音形碼(包括形音碼)的統(tǒng)一整體,又在原CCDOS拼音基礎上,增加上25個韻母。
漢字韻母在英文鍵盤上的位置布局關(guān)系為A:zh aB:eiC:un vnD:uan vanE:eF:enG:engH:angI:ch iJ:anK:aoL:aiM:inN:iuO:o uoP:ieQ:ueR:ua iaS:ong iongT:ianU:sh uV:ui vW:uang iangX:iaoY:ing uaiZ:ou
韻母和字根的關(guān)系說明如下上述的韻母鍵盤布局中,韻母en、eng、an、ao、ang、ai、ing、ong和ü,分別與F、G、J、K、H、L、Y、S和V對應,這些是采用CCDOS的韻母方案。因為大家都很熟悉它,所以,采用它將會給用戶帶來很大方便。其它韻母的選取,主要是采用和新概念碼的字根對應起來的方法。如Zou(辶);Xiao(小);Cun(寸);Niu(牛);uang(王);Pie(丿);Tian(田)等。
少數(shù)韻母的讀音直接和英文字母的發(fā)音對應。如ia,ua(R)ui(V);uai(Y)。這種韻母鍵盤布局很容易記憶。
本發(fā)明提出的新概念漢字編碼在選取字根時,充分利用漢字本身的各種內(nèi)在聯(lián)系,在實現(xiàn)技術(shù)指標的同時使記憶量降到最低限度;在拆字編碼時,最大限度地體現(xiàn)判斷敏感、直觀、明顯、連貫,減少二異性的優(yōu)點,并使其符合人們的語言文字使用習慣,而達到易學的目的;在鍵盤布局和編碼規(guī)則之間的配合上,力求達到最大限度地降低重碼率,提高速度。
新概念漢字編碼對于國標字庫的所有6763個漢字都實現(xiàn)了五種編碼模式的嚴格統(tǒng)一,只需將它的全形碼的最后一碼(包括空格)換成聲母碼,即為形聲碼,只需將形聲碼的最后一碼調(diào)換到第一碼,即為聲形碼;只需將全形碼的后兩碼(包括空格)換成聲母碼和韻母碼,即為形音碼,只需將形音碼的后兩碼調(diào)到前兩碼的位置,即為音形碼。
新概念漢字編碼不但易記易學,而且它的全形碼和五筆字形的重碼率屬于同一量級,為7.87%;它的形聲碼(包括聲形碼)的重碼率為6.83%。顯然,在字根與字根讀音相關(guān)聯(lián)的第一類漢字編碼中,它的重碼率是最低的。甚至,它的形聲碼(包括聲形碼)的重碼率比第二類的五筆字形還要低??梢?,新概念漢字編碼在易記易學、重碼率之間找到一個理想平衡點。
圖1、新概念漢字編碼字根鍵盤布局圖2、新概念漢字韻母鍵盤布局下面結(jié)合附圖用實施例對本發(fā)明做進一步的描述本發(fā)明設計的新概念漢字編碼選用了一百二十九個字根,這些字根包括基本字根和歸類字根在26個英文鍵盤上的位置布局關(guān)系(見附圖1)是A: 竹中 蟲
B:宀 冖 八 丷 貝C:艸 寸D: 大刀 刂氵
E: 兒阝卩二 亠冫
F: 方日 目囗
G: 弓工 廣疒 亅
乚H:火 一 灬I:車 廠 丆 乂 J: 钅臼 幾
豐
K: 冂匚 凵門
L: 扌力
M:木 皿N: 牛女 鳥
丶對本實用新型
如下圖1是本實用新型的結(jié)構(gòu)示意2是構(gòu)成控制部件的比較放大器電子原理3是電熱控溫管構(gòu)造中(1)控制部件(2)電熱及測溫部件(3)電熱體導線(4)溫度傳感器導線(5)硬質(zhì)玻璃管體(6)溫度傳感器(7)電熱體圖1中的控制部件就是由圖2所示的比較放大器構(gòu)成,它是一個由運算放大器F007組成的恒溫電路,采用電容降壓,并由一個雙向可控硅控制負載,這一部分元件可置于一個小型塑料合中,設有發(fā)光二極管指示工作狀態(tài)。圖3中的電熱控溫管內(nèi),溫度傳感器(6)與電熱體(7)相互隔離絕緣安置,確保溫度傳感器接受的溫度為被加熱液體的實際溫度(誤差∠±0.5℃)。管內(nèi)用填充物(如石膏粉、水泥或環(huán)氧樹脂)塞實固定。溫度傳感器(6)和電熱體(7)引出線分別按圖導2中的
和“負載”兩端。
實際應用時,將電熱控溫管置于盛有液體的顯影盤內(nèi)一側(cè)(用夾具或膠紙稍加固定)然后將插頭接220V電源就進入自動工作狀態(tài)。隨著照片顯影操作,液體處于攪動狀態(tài)促使熱量的均勻擴散,從而確保顯影效果。
M:inN:iuO:o uoP:ieQ:ueR:ia uaS:ong iongT:ianU:uV:v uiW:wang iangX:iaoY:ing uaiZ:ou新概念漢字編碼的五種取碼模式本系統(tǒng)共提供五種輸入方案給用戶,即全形碼、形聲碼、聲形碼、形音碼、音形碼。所有編碼碼長不超過四碼。
〖全形碼〗的碼序是形形形形。如“新”的編碼是LIUH。
〖形聲碼〗的碼序是形形形聲。如“新”的編碼是LIUX。
〖聲形碼〗的碼序是聲形形形。如“新”的編碼是XLIU。
〖音形碼〗的碼序是聲韻形形。如“新”的編碼是XMLI。
〖形音碼〗的碼序是形形聲韻。如“新”的編碼是LIXM。
一、單字編碼取碼模式1、全形碼取碼模式第一條可分成左右角取字根的字,一取左上角,二取右上角,三取右下角,四取右下角字根左邊緊挨著的字根,一字編為四碼。
如
粘丷一口木BHOM得
日寸亻 PFCR福丶一田
NHTY第二條字首是一個字根蓋頂?shù)淖秩粲蚁陆亲指筮呌凶指扇?,則一取字首字根,二取右下角字根,三取右下角左邊緊挨著的字根,往右無字根可取,則四取右下角上面的字根一字編為四碼。如
薄艸寸氵冂CCDK霪一土氵丿HTDP第三條字首是一個字根蓋頂?shù)淖秩糇值滓彩怯梢粋€字根構(gòu)成,一取字首字根,二取字底字根,三和四取字底字根的上部字根,一字編為四碼。如
啻
口冂丨 LOKU寨宀木八一BMBH稟亠小二囗EXEF第四條字首是一個字根蓋頂?shù)淖秩糇值滓彩怯梢粋€字根構(gòu)成,而字底字根的上邊有兩個以上字根并列,則一取字首字根,二取字底字根,三取字底字根上部最右下的字根,四取第三字根左邊的字根,一字編為四碼。如
燕艸灬匕口CHQO褒亠
木亻 EYMR第五條字首是一個字根蓋頂?shù)淖秩糇质鬃指虏糠譃樽笥医Y(jié)構(gòu),而左上又有字根可取,則一取字首字根,二取右下角字根,三取左下角字根,四取左下角上部的字根,一字編為四碼。如
對本實用新型
如下圖1是本實用新型的結(jié)構(gòu)示意2是構(gòu)成控制部件的比較放大器電子原理3是電熱控溫管構(gòu)造中(1)控制部件(2)電熱及測溫部件(3)電熱體導線(4)溫度傳感器導線(5)硬質(zhì)玻璃管體(6)溫度傳感器(7)電熱體圖1中的控制部件就是由圖2所示的比較放大器構(gòu)成,它是一個由運算放大器F007組成的恒溫電路,采用電容降壓,并由一個雙向可控硅控制負載,這一部分元件可置于一個小型塑料合中,設有發(fā)光二極管指示工作狀態(tài)。圖3中的電熱控溫管內(nèi),溫度傳感器(6)與電熱體(7)相互隔離絕緣安置,確保溫度傳感器接受的溫度為被加熱液體的實際溫度(誤差∠±0.5℃)。管內(nèi)用填充物(如石膏粉、水泥或環(huán)氧樹脂)塞實固定。溫度傳感器(6)和電熱體(7)引出線分別按圖導2中的
和“負載”兩端。
實際應用時,將電熱控溫管置于盛有液體的顯影盤內(nèi)一側(cè)(用夾具或膠紙稍加固定)然后將插頭接220V電源就進入自動工作狀態(tài)。隨著照片顯影操作,液體處于攪動狀態(tài)促使熱量的均勻擴散,從而確保顯影效果。
第七條兩字根字的編碼兩字根字共有左右結(jié)構(gòu)、上下結(jié)構(gòu)和交叉結(jié)構(gòu)三種,編碼時編成三碼或四碼。
1、左右結(jié)構(gòu)的字取完兩碼之后,第三碼追加該字的右下角單筆字元,作為識別碼,第四碼固定取W。
則貝刂亅BDGW沖冫中丨EAUW2、上下結(jié)構(gòu)的字取完兩碼之后,第三碼追加該字的右下角單筆字元,作為識別碼,第四碼固定取C。
吉士口
TOAC主亠土一ETHC3、交叉結(jié)構(gòu)的字取完兩碼之后,第三碼固定取J,“J”也就是交叉結(jié)構(gòu)的“交”字的聲母,沒有第四碼。
九乙丿YPJ果囗木FMJ十一丨HUJ4、具有方框結(jié)構(gòu)的兩碼字①、外圍是大“囗”的兩碼字,則第三碼追加方框內(nèi)字根右下角的單筆,作為識別碼。沒有第四碼(因為它不屬于上述三種結(jié)構(gòu)中的任何一種)。
田囗十丨FUU回囗口
FOA困囗木
FMN②、在左右結(jié)構(gòu)和上下結(jié)構(gòu)中,右邊或下邊具有方框結(jié)構(gòu),則第三碼取方框中的字根,第四碼和上面一樣,如
畝亠田十ETUC陽阝日一EFHW冒曰目二FFEC2、形聲碼取碼模式形聲碼取碼模式只需將全形碼的最后一碼換為該字的聲母。如“新”,先取前三個形碼“
丨”,即“LIU”,然后再取聲母“X”,即“LIUX”。當全形碼為三碼時,只需在最后加上一個本字聲母,如下一丶丨(X)HNUX;先丿土兒(X)PTEX;
女一
丿(N) HQPN; 再一冂土(Z) HKTZ。
當全形碼為兩碼時同樣只需在第三碼加上一個本字聲母即可,如個人丨(G)RUG;只口八(A)OBA;
困囗木(K)FMK;里日土(L)FTL。
當漢字沒有聲母時,就在后面加上零聲母“O”,如安宀女(O)BNO;惡一心一(O)HXHO。
3、聲形碼取碼模式該取碼模式和形聲碼取碼模式只有一點不同,即只需將形聲碼的最后一碼調(diào)到第一碼的位置即可。
4、音形碼取碼模式音形碼取碼模式是將漢字的聲母和韻母置于前兩碼的位置,后兩碼是漢字形碼的前兩碼,如“得”,先取聲母和韻母“DE”,然后再取全形碼的前兩碼“丿日”,即“PF”,“得”字的音形碼為DEPF。
5、形音碼取碼模式該取碼模式和音形碼取碼模式只有一點不同,即只需將音形碼的前兩碼調(diào)到第三、第四碼的位置即可。
二、基本取碼規(guī)則1、交叉結(jié)構(gòu)橫筆結(jié)構(gòu)優(yōu)先在取碼時,若遇到漢字的左上角或右上角是兩個字根相交,則先取橫筆結(jié)構(gòu)的字根,如
的目的,適應了廣大業(yè)余攝影愛好者的消費水平。
對本實用新型
如下圖1是本實用新型的結(jié)構(gòu)示意2是構(gòu)成控制部件的比較放大器電子原理3是電熱控溫管構(gòu)造中(1)控制部件(2)電熱及測溫部件(3)電熱體導線(4)溫度傳感器導線(5)硬質(zhì)玻璃管體(6)溫度傳感器(7)電熱體圖1中的控制部件就是由圖2所示的比較放大器構(gòu)成,它是一個由運算放大器F007組成的恒溫電路,采用電容降壓,并由一個雙向可控硅控制負載,這一部分元件可置于一個小型塑料合中,設有發(fā)光二極管指示工作狀態(tài)。圖3中的電熱控溫管內(nèi),溫度傳感器(6)與電熱體(7)相互隔離絕緣安置,確保溫度傳感器接受的溫度為被加熱液體的實際溫度(誤差∠±0.5℃)。管內(nèi)用填充物(如石膏粉、水泥或環(huán)氧樹脂)塞實固定。溫度傳感器(6)和電熱體(7)引出線分別按圖導2中的
和“負載”兩端。
實際應用時,將電熱控溫管置于盛有液體的顯影盤內(nèi)一側(cè)(用夾具或膠紙稍加固定)然后將插頭接220V電源就進入自動工作狀態(tài)。隨著照片顯影操作,液體處于攪動狀態(tài)促使熱量的均勻擴散,從而確保顯影效果。
啻
口冂丨 LOKU寨宀木八一BMBH稟亠小二囗EXEF第四條字首是一個字根蓋頂?shù)淖秩糇值滓彩怯梢粋€字根構(gòu)成,而字底字根的上邊有兩個以上字根并列,則一取字首字根,二取字底字根,三取字底字根上部最右下的字根,四取第三字根左邊的字根,一字編為四碼。如
燕艸灬匕口CHQO褒亠
木亻 EYMR第五條字首是一個字根蓋頂?shù)淖秩糇质鬃指虏糠譃樽笥医Y(jié)構(gòu),而左上又有字根可取,則一取字首字根,二取右下角字根,三取左下角字根,四取左下角上部的字根,一字編為四碼。如
科學技術(shù)丿
扌木 PXLM④五字以上的詞語先取前三個字的按字編碼的第一個字根,再加上最后一字的按字編碼的第一個字根。如中華人民共和國口亻丿囗FRRF國家標準局囗宀木尸F(xiàn)BMU3.聲形碼①雙字詞語依次取第一個字的聲母,第一個字的首取字根,第二個字的聲母和第二個字的首取字根,一詞編為四碼。如家庭J宀T廣BJGT國家G囗J宀FGBJ③三字詞語先取各字的本字聲母,再加上最后一字的首取字根,一詞編為四碼。如國務院GWY阝GWYE計算機JSJ木JSJM系列化XLH亻XLHR③四字詞語只取每字的聲母碼,一詞編為四碼。如體制改革TAGG科學技術(shù)KXJI④五字以上的詞語先取前三個字的聲母碼,加上最后一字的聲母碼,中間字舍去不用,一詞編為四碼。如
中華人民共和國AHRG國家標準局GJBJ中國工商銀行AGGH4、音形碼①雙字詞語依次取第一個字的聲母和韻母,第二個字的聲母和韻母,一詞編為四碼。如家庭JRTYR(ia)Y(ing)國家GOJRO(uo)R(ia)②三字詞語先取各字的本字聲母,再加上最后一字的韻母,一詞編為四碼。如國務院GWYDD(uan)計算機JSJII(i)系列化XLHRR(ua)四字詞和五字以上的詞編碼方式與聲形碼一樣。
5、形音碼形音碼詞的取碼方式和上述類似。
到此為止,已經(jīng)清楚、完整地介紹了本發(fā)明設計的新概念漢字編碼??梢灶A料這種編碼的使用必將給用戶帶來極大的方便,而且,能有效的節(jié)省用戶在購買編碼技術(shù)和漢字輸入軟件、資料以及培訓方面的人、財、物的消耗,因為這樣的編碼技術(shù)具有最大的資源和信息的共享范圍。
權(quán)利要求
一種確定漢字字根在26個英文字母鍵盤上位置布局的新概念漢字編碼,其特征在于1、新概念漢字編碼采用了129個字根;
2.129個字根分為基本字根和歸類字根;基本字根是按基讀音或其名稱的主要讀音布置在與其相同讀音的字母鍵上;歸類字根為與基本字根形狀類似的字根,無論歸類字根如何讀音均認定該歸類字根與其形狀類似的某一基本字根為同一讀音,因而歸類字根布置在與其形狀類似的某一基本字根的同一鍵上;
全文摘要
本發(fā)明提出的新概念漢字編碼在選取字根時,充分利用漢字本身的各種內(nèi)在聯(lián)系,經(jīng)過大量的綜合分析和測算,選用了129個漢字部件作為字根,并且將129個字根分為基本字根和歸類字根。基本字根是按其讀音或其名稱的主要讀音與其聲母鍵對應布陣;歸類字根為與其基本字根形狀類似的字根,歸類字根布置在與其形狀類似的某一基本字根的同一鍵上。其特點是易記易學,重碼率低,真正實現(xiàn)漢字編碼三大類型五種編碼模式的統(tǒng)一。
文檔編號G06F3/023GK1070494SQ92110268
公開日1993年3月31日 申請日期1992年9月15日 優(yōu)先權(quán)日1992年9月15日
發(fā)明者楊庚生, 呂梁, 柯紅五, 張學東 申請人:楊庚生, 呂梁