專利名稱:普及型漢字編碼“杞”碼法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬漢字編碼方法,特別是“
”(音jié)字筆形代碼。其編碼規(guī)則是取漢字起筆的常用部首讀音字母加四筆(前二筆加末二筆)“
”字的筆形代碼,如果漢字起筆不在所收的部首內(nèi),則取五筆(前三筆加末二筆)“
”字筆形代碼?!?
”字的筆形代碼是指橫1、豎2、撇3、捺4、左折5、右折6,這六個代碼正好是“
”字的筆形代碼(簡稱“
”碼)。
目前的漢字編碼輸入方案很多,除“拼音碼”和“五筆畫”碼容易掌握、規(guī)則簡單外,其余的漢字編碼都需經(jīng)過較長時間的培訓(xùn)才能正確使用。但“拼音碼”對讀不準(zhǔn)音和不會讀的字輸入存在較大的困難,且還要使用簡碼,人為地增加了使用規(guī)則,從而增加使用者的難度,重碼又較多。王永民的“五筆字型”輸入法分兩種方案1、“五筆畫”簡易輸入法,即每個字取前四筆和末筆的筆形代碼,不足五筆的以“0”代,雖易學(xué)、易記、易用,適合于初學(xué)者使用,缺點是重碼多;
2、“五筆字型”高效輸入法,需學(xué)習(xí)熟記130個字根的位置和漢字的折分規(guī)則,只供經(jīng)培訓(xùn)的專業(yè)人員用。
以上這些漢字編碼方案,遠(yuǎn)還達(dá)不到廣泛、普及使用的要求。
本發(fā)明提供了一種普及型漢字編碼法-“
”碼法,其編碼規(guī)則簡單,重碼較少,易學(xué)、易記、易用,定碼速度快,不受讀音限制,對任何漢字都能見字誤碼,查字快速,具有小學(xué)三年級以上文化的使用者,很快就能熟悉并正確使用。
本發(fā)明的方法是將漢字部首字母化,即精選35個漢字中出現(xiàn)最多的部首,賦予其部首字母讀音代碼作碼元(見表2漢字部首代碼表);漢字“
”碼筆形數(shù)字法,即把漢字的筆形分六種橫(包括提)、豎、撇(包括左向點)、捺(包括右向點)、左折、右折,分別以1、2、3、4、5、6的代碼表示(見表1漢字“
”字筆形代碼表)。
“
”碼取碼方法1、字的起筆(即書寫時的第一筆)不在表2所列常見部首內(nèi)時,按寫字的筆順依表1取五筆(前三筆加末二筆)“
”字的筆形代碼,不足五筆的全取。
例部-41452,干-112,乏-3454,盛-13521;
2、字的起筆在表2所列常見部首內(nèi)時,先取相應(yīng)部首代碼,后按寫字的筆順依表1取四筆(前二筆加末二筆)“
”字的筆形代碼,不足四筆的全取。
例萍-C4412,逛-G1154,馬-M,伐-R1634;
3、漢字的筆順從習(xí)慣,一般以《辭?!窞闇?zhǔn),基本規(guī)律是先橫后豎,從左到右,從上到下,先外后里,封口在后,捺筆在后,點筆在后,先橫后撇,左右先寫,中間先寫,橫勾先寫(見表3漢字書寫筆順基本規(guī)律表);《辭海》沒有明確的,參考《漢字正字小字匯》。有些字的筆順不容易確定,如果在你確定的筆形碼镎也壞揭業(yè)淖鄭梢栽諏硪槐市溫肜鋝檎遙值謀市溫肟剎慰肌逗鶴摯燜儼樽質(zhì)植帷貳 附表如下表1漢字“杞”字筆形代碼表
表2漢字部首代碼表表3漢字書寫筆順基本規(guī)律表
本“
”碼的碼長,最短一位,最長五位,平均4.86位,對《GB2312-80》的全部一、二級6763個漢字編碼統(tǒng)計,使用碼數(shù)共3497個,平均每個碼與1.93個漢字相對應(yīng),重碼較少,其中無重碼字占總數(shù)的31.76%,一碼對應(yīng)五字以下占總數(shù)的78.6%,一碼對應(yīng)十字以上的小于10%;對于一碼對應(yīng)二字以上的重碼字,作為計算機(jī)的漢字輸入碼時,可按高頻先見或采取對號選擇的方法得到。并與傳統(tǒng)的筆劃筆順、部首、四角號碼、漢語拼音等編碼比較,具有簡單、易學(xué)、易用、定碼速度快、重碼較少、查字快速的一種普及型漢字編碼。適用于1、可供各類人員特別是非專業(yè)人員作為漢字輸入碼在計算機(jī)、電子打字機(jī)使用;
2、可供廣大學(xué)生、干部、科技人員、工人,作為漢字檢字法,用于各種字、詞典等工具書作正文或索引的編排,提高查檢效率;
3、可供圖書情報部門用于中文文獻(xiàn)字順目錄的組織。
權(quán)利要求
1.一種普及型的漢字編碼法,其特征在于編碼原則是精選35個漢字中高頻出現(xiàn)的部首字母化,“杞”碼筆形取橫1、豎2、撇3、捺4、左折5、右折6代碼數(shù)字法。
2.如權(quán)利要求1所述的“
”碼法,其特征在于所述的35個漢字部首及其代碼為表3所示。
3.如權(quán)利要求1所述的“
”碼法,其特征在于所述的漢字“
”字筆形及其代碼為表1所示。
4.如權(quán)利要求1所述的“
”碼法,其特征在于所述的漢字書寫筆順基本規(guī)律為表3所示。
5.如權(quán)利要求1-4所述的“
”碼法,其特征在于“
”碼取碼是無表2所列常見部首的,按寫字的筆順依表1取五筆(前三筆加末二筆),不足五筆的全取;有表2所列常見部首的,先取相應(yīng)部首代碼,后按寫字的筆順依表1取四筆(前二筆加末二筆),不足四筆的全取。
全文摘要
本發(fā)明是一種普及型的漢字編碼法,全部漢字筆形可分為橫、豎、撇、捺、左向折、右向折六種,恰好為“杞”字的筆形,故稱“杞”碼法。其特點是把精選的常用漢字部首字母化,筆形數(shù)字法,構(gòu)成輸入碼。
文檔編號G06F3/023GK1033423SQ8810260
公開日1989年6月14日 申請日期1988年4月30日 優(yōu)先權(quán)日1988年4月30日
發(fā)明者李冠盛 申請人:廣西民族學(xué)院