"。相似的原因,規(guī)定"羊,,="尹,,="至,,="μ、Φ" = "96"。結(jié)合前面的"月"="Π、二" = "31"及"車"="·,,= "七、十、賴" =" 166",這樣的竅門歸納方便記憶;漢字中,這些偏旁出現(xiàn)次數(shù)較多,應(yīng)注意其特別之處。 ④ 字配的分步使用:個別字配本身是獨立塊,構(gòu)成漢字有時一步到位,有時筆順間斷, 分步進行。如:"戈"字配,構(gòu)成"戰(zhàn)"字,順序是">"一"口" - "戈";構(gòu)成"找"字,順序是 "孑"一"戈",都是直接使用"戈"字配。而構(gòu)成"戒"字,是"戈"與"升"兩個獨立塊,順序 是"一升戈",使用字配"戈"的筆順,是先寫"一",中間插入"升",再完成"戈", 分步完成使用。分步使用時,遵循分步使用的編碼規(guī)則。 ⑤ 分步報關(guān):獨立的字配,如分步使用,象:"戒"字,拆分成"戈"和"升"兩個字配,照 筆順先寫"一",接著寫"升",然后再完成"戈","戈"在使用中筆順發(fā)生了間斷,是分步進行 的,其"戈"的編碼要使用兩次,先報關(guān)一次,完成時使用一次,即"戈""升""戈",編碼即 616〇 ⑥ 字配的獨立性與分步使用:獨立性與分步使用是不相互矛盾的。獨立性表現(xiàn)在三個 方面,一是獨立塊,二是使用中一次完成或分步完成都是同一獨立塊,三是分步完成沒有改 變原獨立塊及原序位。分步使用不是將原獨立的字配塊,分拆成兩個或幾個不同的字配,也 不是將不同的字配塊結(jié)合成一個新的使用,是對同一字配在特殊情況下使用的特殊處理, 需對這種處理做出標記,遵循專門的編碼規(guī)則,增加這一特定信息。分步使用是原字配獨立 性的保證,是裁截字配少大優(yōu)先規(guī)則的體現(xiàn)。這符合漢字是由某字配與某字配組合而成的 認識規(guī)律,但對分步使用的字配做了標記,以區(qū)別一般情況下不分步使用的結(jié)果。只有個別 字配存在分步使用的情況,如違背少大優(yōu)先的規(guī)則,則沒有必要將字配分步使用。假如只能 分步完成,不能一次性使用,這樣的字配是不存在的。另外,為明確標記字配分步或交穿的 情況,不遺漏信息,禁止拆分出同一字配又分步使用又與其它字配相交穿的復(fù)雜形式,即一 字配不可能同時標記分步和交穿的兩種信息,限定這樣的編碼不存在。 ⑦ 結(jié)構(gòu)可析:在漢字的字配數(shù)量少,信息量不足或區(qū)分其它重碼漢字時,可辨析數(shù)配碼 結(jié)構(gòu),配合使用漢字結(jié)構(gòu)編碼。 ⑧ 末筆識辨:按需要可用漢字末筆的五種筆畫編碼加于辨識。 四、漢字漢語詞編碼流程 依據(jù)拆分字配的順序,遵循漢字編碼的規(guī)則,對照編碼流程,根據(jù)不同情況,就可以完 成對漢字及漢語詞的編碼。 1、編碼流程: 漢字漢語詞編碼流程 ① 依序編列、交分守則 例:編鄉(xiāng)、尸門#(完成)54071(完成) 較七十馨1八乂(完成)16β438 (完成) 酥(報關(guān))一西千八(完成)@1683(完成) ② 成字字配、續(xù)拆補碼 例:豐(豐)三丨_ (完成)6122(完成) 乙(乙)乙(完成)55(完成) ③ 本位不支、再填析辨 例:軍-七十⑩(漢字拆分)4166 (本位碼) 因軍與庫重碼:(再填析辨)結(jié)構(gòu)(Φ7)末筆(丨) 所以:軍一七十龜&?(D4166&這(完成) 庫廣七十_ (漢字拆分)4166 (本位碼) 因庫與軍重碼:(再填析辨)結(jié)構(gòu)(? 9)末筆(丨) 所以:庫廣七十響&擊Φ4166&翌(完成) 其中,代表"結(jié)構(gòu)類型為半包圍結(jié)構(gòu)";Φ代表"末尾筆為丨"。 ④ 標志漢字、可用簡碼 例:人人(完成)3 (完成) 白白(完成)8 (完成) ⑤ 多字詞語、順位碼鍵 例:獨特j.Φ、jΦ十于、(完成)837436614(完成) 獨立性j)史、丨j激_ (完成)8374499236(完成) 獨樹一幟^JΦ、木又寸一巾口八(完成)83746〇11723(完成) 2、說明: ① 依序編列、交分守則:依拆分漢字規(guī)則,順序裁截字配,按編碼規(guī)則,一并考慮字配交 穿與分步使用的信息,順次序進行編碼。如漢字"量",拆分成"日"一"一"一"門"一"半《 -"二"(二與棗交穿,11),編碼為[717611](完成);如漢字"蘋",拆分成"廿"一"分 步"(干)一"v" 一 "干",編碼為[1191](完成)。 ② 本位不支、再填析辨:漢字的字配碼、交穿及分步信息碼編列完成后的編碼叫做本位 碼。如果多漢字的本位碼重疊,即重碼,識別信息量不夠,不足于區(qū)分兩個及以上的漢字, 就要分析漢字結(jié)構(gòu),辨識末筆的筆畫,填列結(jié)構(gòu)編碼和末筆畫編碼。如漢字"囚",拆分成 "囚"一"門人一",本位碼為[731];漢字"四",拆分成"四"一"門兒一",本位碼也為[731], 兩漢字重碼,需分別填列結(jié)構(gòu)碼與末筆畫碼。"囚"一"門人一"& "結(jié)構(gòu)-@ 8代表全包 圍、末筆即\-4",編碼為[731&M]; "四"一"門兒一" & "結(jié)構(gòu)8代表全包圍、末筆即 L_5",編碼為[731&迎]。全包圍、半包圍結(jié)構(gòu)的漢字,有時末筆是全包圍、半包圍結(jié)構(gòu)的末 筆畫,筆畫碼雷同,辨識作用差,在這里特別規(guī)定:全包圍、半包圍結(jié)構(gòu)的漢字,其末筆碼為 被包圍部分的末筆碼。因此"囚"字末筆畫是末筆碼為"4" 四"字末筆畫是"L", 末筆碼為"5"。 ③ 成字字配、續(xù)拆補碼:成字字配是一些特殊漢字,既是字配又是漢字,本身已有的編 碼不足以與同類字配區(qū)分開來,而它的漢字屬性又須有確定的編碼,這就需按筆順方向繼 續(xù)進行拆解,同樣遵循"順序分塊、少大優(yōu)先、能離不接、能接不穿"的原則。但是對成字字配 的編碼,首先涉及到字配塊或成字分解就是分步使用,所以也要遵循:"分步報關(guān)"、"交穿降 級"的編碼規(guī)則,它的編碼過程叫"續(xù)拆補碼",就是"成字字配"一"報關(guān)"一"拆解"一"補 碼"一"成字字配本位碼"。本位碼如果與其它漢字重碼,要加以區(qū)分,則考慮拆解后的字 配相對位置及末筆畫的信息。成字字配都是獨體結(jié)構(gòu)的特殊漢字,其結(jié)構(gòu)信息是雷同的, 可是拆解的字配間有一個相對的位置布局,為成字字配的相對結(jié)構(gòu),類型與編碼參照數(shù)配 碼結(jié)構(gòu)的說明和規(guī)定。如字配"兒"拆解成"?、j、L","匕"拆解成"?、j、L","幾"拆 解成"曝、j、乙",本位碼都是[335],考慮相對結(jié)構(gòu)與末筆畫編碼后,其數(shù)配碼分別為:兒 [335&65],匕[335&95],幾[335&05]。 ④ 標志漢字、可用簡碼:標志漢字只有10個,因為使用頻率高,用所在區(qū)類的一個數(shù)碼 做編碼,輸入時可一位編碼加結(jié)束鍵,稱簡碼。 ⑤ 多字詞語、順位碼鍵:多字詞語指兩個字以上的詞語,其編碼是按照詞語的順序,將 每個漢字的編碼依次排列,不考慮漢字結(jié)構(gòu)與末筆的析辨碼,即順位編列詞語漢字的本位 碼就可以了。 本發(fā)明的有益效果如下:本發(fā)明對字配的分類與編碼有規(guī)律性,與數(shù)字鍵位對應(yīng),不用 記鍵盤,助記詞方便記憶;漢字拆分直觀,編碼方法簡練,能迅速掌握,上手就用;輸入速度 快、重碼少,能直接處理繁體、異體漢字,輸入漢語詞同樣迅速快捷,中文錄入適應(yīng)面廣,方 便使用;符合學(xué)習(xí)漢字的規(guī)律,能輕松拆分字配而轉(zhuǎn)化成數(shù)配碼輸入,推廣普及性好;用于 小型移動電子設(shè)備具有優(yōu)勢,在檢索、排序、字?詞典工具有極大的實用價值。 【具體實施方式】 下面結(jié)合表1~表5對本發(fā)明作進一步說明。 實施例,參照表1~表5 :1、根據(jù)漢字字形編碼,設(shè)置了 192個字配,分門別類與1一9、 〇十個數(shù)碼相對應(yīng),所述字配與數(shù)字鍵位的對應(yīng)關(guān)系如下表1所示; 表1
設(shè)置了5種漢字結(jié)構(gòu),分別與6、7、8、9、0五個數(shù)碼相對應(yīng),所述漢字結(jié)構(gòu)類型的編碼與 數(shù)字鍵位的對應(yīng)關(guān)系如下表2所示; 表2 :
設(shè)置的數(shù)配碼漢字輸入法鍵盤,就是輸入設(shè)備的數(shù)字鍵盤,字配、漢字結(jié)構(gòu)的數(shù)碼與鍵 位--對應(yīng)。 2、 將漢字拆分成字配,設(shè)置了拆分規(guī)則方法:"順序分塊,少大優(yōu)先,能離不接,能接不 穿。"依順序拆得各字配:"順序分塊,少大優(yōu)先",即在筆順方向的規(guī)定下,按漢字結(jié)構(gòu)特點, 先把漢字劃分成沒有交穿的、各自分立的單元,即先把漢字劃分成一個或多個字配塊,劃分 字配塊的規(guī)則是優(yōu)先選擇劃分出字配塊數(shù)量最少的方案; 如果所述字配塊已經(jīng)是一個獨立的字配,則直接取其對應(yīng)的數(shù)字鍵位;如果所述字配 塊是交穿結(jié)構(gòu)的字配,需要繼續(xù)拆分,在同一序位拆分字配塊的規(guī)則是將含字畫數(shù)最多的 字配拆分出來; 所有字配塊的拆分原則是"能離不接,能接不穿",即能順序在有間距的地方獨立地裁 截成字配,就不要在相連相接處拆分或裁截字配,相離拆分優(yōu)先于在相連相接處裁截;能順 序在字配與字配相連處裁截,就不要拆分成字配與字配相交穿的狀態(tài);優(yōu)先選擇在相連相 接處裁截字配,否則才選擇將字配拆分成交穿狀態(tài);最終拆分成唯一的字配組合,與數(shù)字鍵 位--對應(yīng)。 例: