專(zhuān)利名稱:東方漢字字根編碼法及東方漢字兼容外文編碼鍵盤(pán)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明為東方漢字字根編碼法,它是一種新穎的形位編碼法,以及依據(jù)這一方法設(shè)計(jì)的東方漢字兼容外文編碼鍵盤(pán)。
漢字編碼的科學(xué)性和實(shí)用性是我國(guó)目前要解決漢字信息處理,實(shí)現(xiàn)計(jì)算機(jī)漢化的關(guān)鍵和難點(diǎn)。為此,人們作出了大量的研究,如拼音法,音形法等,然而現(xiàn)有這些編碼法要么重碼太多,計(jì)算機(jī)識(shí)別困難,鍵入速度太慢,要么就是對(duì)計(jì)算機(jī)人員不光具有準(zhǔn)確掌握漢語(yǔ)拼音知識(shí)的能力,同時(shí)還要具備分拆漢字的能力,這樣就增加了學(xué)會(huì)使用的難度,上機(jī)實(shí)用性差,達(dá)不到漢字編碼簡(jiǎn)練,鍵入速度快,實(shí)用易學(xué),易普及的目的。
中國(guó)專(zhuān)利局已授予發(fā)明專(zhuān)利權(quán)的“優(yōu)化五筆字型編碼法及其鍵盤(pán)”。在我國(guó)漢字信息處理上確實(shí)向前邁進(jìn)了一大步,尤其是它運(yùn)用現(xiàn)有26個(gè)英文字母的標(biāo)準(zhǔn)鍵盤(pán),根據(jù)漢字筆劃順劃,字根結(jié)構(gòu),使?jié)h字輸入達(dá)到每分鐘120-150個(gè)字,這對(duì)我國(guó)實(shí)現(xiàn)漢字信息處理現(xiàn)代化是一個(gè)很大的鼓舞,但正是由于它立足于利用原裝26個(gè)英文字母鍵盤(pán)來(lái)對(duì)漢字進(jìn)行信息處理,因而使得它對(duì)漢字上千個(gè)字根優(yōu)化有限,就是在它優(yōu)化的字根范圍內(nèi),也不得不增加若干區(qū)分或轉(zhuǎn)譯層次,使其編碼復(fù)雜化,如它的同位字根編碼為“<鍵位代碼>+<首筆代碼>+<第二筆筆劃代碼>+<末筆筆劃代碼>”,因而帶來(lái)漢字編碼處理程序較長(zhǎng)。又如在輸入漢字前,首先要考慮漢字經(jīng)分解后的字根數(shù),對(duì)于超過(guò)四個(gè)字根或少于四個(gè)字根的漢字其編碼程序的處理不一樣,這樣就要求操作者輸入漢字時(shí)首先要把漢字拆分為若干字根,根據(jù)字根量,才能準(zhǔn)確輸入。
本發(fā)明提出的東方漢字字根編碼法以及東方漢字兼容外文編碼鍵盤(pán),是本人經(jīng)過(guò)八年多的努力探索研究而成的。東方漢字字根編碼法是一種新穎的形位編碼法。
其形-是指漢字的字根形和結(jié)構(gòu)形。漢字的字根形有三種一筆獨(dú)立的,如“丶、一、丨、丿、乙等”;幾筆不交接的,如“八、冫、川、彡、巛等”;幾筆交接穿插的,如“丁、十、日、月、中、母、冊(cè)、又等”;漢字的結(jié)構(gòu)形有九種獨(dú)體形,如“大、目、木、口等”;夾形,如“坐、巫、兆等”;穿插形,如“秉、夷、吏等”;上下形,如“音、意、琴、晶等”;左右形,如“行、微、部、韶等”;半包圍形,如“慶、屋、司、武、栽等”;開(kāi)口形,如“兇、醫(yī)、成、同等”;全包圍形,如“園、因、團(tuán)等”;載托形,如“運(yùn)、爬、趕、題、處等”。
其位-是指字根在漢字結(jié)構(gòu)中的位置次第。如“部”和“陪”字,均有三個(gè)相同的字根“立、口、阝”,因字根所處的位置不同,書(shū)寫(xiě)時(shí),其先后次第也不同,而構(gòu)成了兩個(gè)不同讀音,不同含意的字。又如“景”和“晾”字,不僅字根相同,書(shū)寫(xiě)時(shí),其次第也相同,因其字根“日”所處的位置不同,結(jié)構(gòu)形不同,而構(gòu)成了兩個(gè)不同讀音,不同含意的字。再如“林”和“森”字,其字根只有一個(gè)相同的“木”,因其字根量的不同,結(jié)構(gòu)形不同,而構(gòu)成了兩個(gè)不同讀音,含意相近似的字。
字根是構(gòu)成漢字的基本單元,相同或不同的字根之間相互并列、重疊、穿插、交接組合在一起,因其字根量的不同,字根組合方式不同,字根所處的位置不同,書(shū)寫(xiě)時(shí)的次第不同就是產(chǎn)生成千上萬(wàn)個(gè)漢字的基本原理和方法。
一、本發(fā)明就是在上述基本原理和方法的指導(dǎo)下,為實(shí)現(xiàn)漢字快速編碼,在構(gòu)字單元的選擇上,采取了下列優(yōu)化措施1.首先將1000左右的字根用于對(duì)8000多個(gè)漢字實(shí)施分拆統(tǒng)計(jì),精選出構(gòu)字能力強(qiáng)的字根,作為一個(gè)構(gòu)字單元。
2.對(duì)8000多個(gè)漢字,按一般書(shū)寫(xiě)漢字的規(guī)律和習(xí)慣,根據(jù)字根所處位置的頻率,優(yōu)化出次第在前三位頻率較高的字根,作為一個(gè)構(gòu)字單元。
3.將含有四個(gè)以上字根的漢字,經(jīng)過(guò)綜合分析研究,選其部分漢字或兩個(gè)以上的字根,作為一個(gè)構(gòu)字單元,以便減少擊鍵次數(shù)。
4.將人們比較容易分析為兩個(gè)字根的部分獨(dú)體字,不作為一個(gè)構(gòu)字單元,分作為兩個(gè)構(gòu)字單元,減少其構(gòu)字單元數(shù)量。
5.將漢字或字根的簡(jiǎn)寫(xiě)體或繁寫(xiě)體,變異體,變向體,均作為同一個(gè)構(gòu)字單元。
這樣就形成了“東方漢字字根編碼總表”。(
圖1)二、在字鍵和鍵盤(pán)的設(shè)計(jì)上,采取了以下幾種手段1.將較常用的漢字分別選作每個(gè)字鍵的鍵名,并稱作母字根。其余的漢字字根按其使用頻率的高低分兩行依次排列,這些字根稱作子字根。并將這些漢字字根刻印在每個(gè)鍵帽上,有了明顯的標(biāo)記,就有利于見(jiàn)字編碼和快速操作。
2.將音、形、意相近的漢字字根盡最大可能編入到同一個(gè)字鍵里,使其共用一個(gè)組配代碼,便于實(shí)現(xiàn)聯(lián)想或盲打。
3.為使每個(gè)字鍵帽上和整個(gè)鍵盤(pán)的清晰度更佳,將總表中的部分漢字字根的簡(jiǎn)寫(xiě)體或繁寫(xiě)體,變異體,變向體剔除不刻印在字鍵帽上,但應(yīng)參加該字鍵組配漢字編碼。
4.依據(jù)字根所處位置的次第頻率和構(gòu)字詞能力的強(qiáng)弱以及手指擊鍵功能的靈敏度,在鍵盤(pán)設(shè)計(jì)上體現(xiàn)科學(xué)、合理的布局,把鍵盤(pán)設(shè)計(jì)成60個(gè)鍵位,并分成左右兩個(gè)區(qū),共12行,10列,這樣就可實(shí)現(xiàn)如下編碼口訣“金木水火土,日月山石川。人民心目事,由己言二句。中國(guó)大開(kāi)發(fā),八方用力氣。子女小習(xí)書(shū),央(養(yǎng))才非一夕。工廠干生產(chǎn),重(種)禾長(zhǎng)東西。門(mén)口見(jiàn)牛魚(yú),豐衣又足食”。從而大大提高人們的速記能力和擊鍵速率,做到易學(xué)、易記、易用。若將編碼鍵盤(pán)實(shí)體和編碼方法印刷在一張紙上,使人人手中一份,便可以做到隨時(shí)學(xué),隨時(shí)自我進(jìn)行漢字編碼模擬訓(xùn)練,這對(duì)計(jì)算機(jī)的普及和應(yīng)用必將起到很大的推動(dòng)作用。
5.為了達(dá)到一機(jī)多用,其外文字符在字鍵中的分布是西文字母按通用英文打字機(jī)鍵盤(pán)排列次序依次排列,其字符刻印在字鍵帽的左下角;俄文字母按通用的俄文打字機(jī)鍵盤(pán)排列(其中有4個(gè)字母略有改動(dòng)),其字符刻印在字鍵帽的左上角;日文五十音圖字符每段從左到右,每行從上至下依次排列,其平假名字符刻印在字鍵帽中的右上角,片假名字符刻印在字鍵帽中的右下角。同時(shí)將鍵帽上的漢文、西文、俄文、日文字符用四種顏色加以區(qū)別。
這樣便設(shè)計(jì)成了“東方漢字兼容外文編碼鍵盤(pán)”。(圖2)三.漢字編碼方法及漢字鍵入程序1.在漢字編碼方法上,應(yīng)按東方漢字字根編碼總表中最大的字根進(jìn)行編碼。每個(gè)字鍵的鍵名,即母字根只擊該鍵一次,作為該字的信息編碼。其后的漢字,依排列次第分別連擊二、三、四次鍵作為該字的信息編碼。例如鍵名“西”其后字根是“雨、兩、酉、、”,其鍵入程序是擊一次鍵顯示“西”,連擊二次鍵顯示“雨”,連擊三次鍵顯示“兩”,連擊四次鍵顯示“酉”。后面兩個(gè)字根不能直接鍵入顯示,只作為提示須與其它字鍵中的字根相組配后才能顯示所需的漢字。其它字鍵中的字根本身不成為其漢字都是這樣處理。
2.若漢字是由兩個(gè)以上字鍵中的漢字字根相組配,編碼時(shí),不論該漢字字根在鍵中的次第均作為同一個(gè)編碼單元,只擊該鍵一次。編碼順序按書(shū)寫(xiě)漢字的一般規(guī)律和習(xí)慣進(jìn)行,即先上后下,先左后右,先外后里,先載托后乘載的原則。被分拆為兩個(gè)字根的獨(dú)體字,按書(shū)寫(xiě)第一筆的字根為先。例“秉”字,先擊“禾”字根所在鍵,后擊“彐”字根所在鍵。
3.由四個(gè)以上字根構(gòu)成的漢字,一般只取前三個(gè)字根即可。若遇前三個(gè)字根取了后,屏幕提醒顯示出二個(gè)漢字,若需前面的字,可不經(jīng)處理繼續(xù)進(jìn)行操作,若需后面的字,即按選擇鍵即可。若顯示三個(gè)以上的漢字,則按所需的字,加擊末尾字根所在鍵即可。例“裂”字,編碼順序是“一、夕、刂、衣”若只取前三個(gè)字根,得到的是“列、烈、裂”三個(gè)字,此時(shí)應(yīng)加擊“衣”所在鍵。
4.對(duì)漢字構(gòu)成的詞組、成語(yǔ)、短語(yǔ)、專(zhuān)用語(yǔ)、名人詩(shī)詞等實(shí)現(xiàn)簡(jiǎn)碼快速編碼方法。由兩個(gè)字或三個(gè)字構(gòu)成的詞組,則依漢字組詞先后次序共取四個(gè)字根,第一個(gè)漢字須取前兩個(gè)字根,若第一個(gè)字是一個(gè)字根,則取第二個(gè)字的前兩個(gè)字根,若第二個(gè)字也是一個(gè)字根,則取第三個(gè)字的前兩個(gè)字根。例“人民”,按一下“詞語(yǔ)”功能鍵,然后擊“人”、“民”所在鍵?!伴L(zhǎng)城”則擊“長(zhǎng)”、“土、戊”所在鍵?!靶律眲t擊“立、木”、“生”所在鍵。“說(shuō)明”則擊“讠、丷”、“日、月”所在鍵?!昂D蠉u”則擊“氵、”,“十”、“
”所在鍵。由四個(gè)漢字以上構(gòu)成的詞語(yǔ)均每字只取前一個(gè)字根。例“一箭雙雕”則擊“一、、又、冂”所在鍵?!爸腥A人民共和國(guó)萬(wàn)歲”則擊“中、亻、人、民、、禾、國(guó)、萬(wàn)、山”所在鍵即可。
本發(fā)明可對(duì)《新華字典》和《現(xiàn)代漢語(yǔ)詞典》所收編的全部漢字進(jìn)行編碼,平均每字擊鍵次數(shù)不到三次,一字最多只擊四次(不含空位鍵)。重碼少,便于取舍。
本發(fā)明可以建立一整套編碼系列,如漢字信息碼本,詞匯信息碼本,成語(yǔ)信息碼本,專(zhuān)用詞語(yǔ)信息碼本,名人詩(shī)詞信息碼本,漢語(yǔ)主題詞信息碼本等。
由上述可以看出本發(fā)明提出的東方漢字字根編碼法是一種適應(yīng)能力較強(qiáng)的一種編碼方法,其最大的優(yōu)點(diǎn)是從漢字字形結(jié)構(gòu)出發(fā),完全符合漢字本質(zhì)特征,而且直觀,易學(xué),實(shí)用。其鍵盤(pán)不僅是具有純漢字信息處理功能,同時(shí)又具有國(guó)際上最廣泛、最常用的幾種文字信息處理功能。它是一種比較理想的國(guó)際通用鍵盤(pán),必將發(fā)揮應(yīng)有的作用。
權(quán)利要求
1.本發(fā)明為一種東方漢字字根編碼法,其特征在于它是依據(jù)漢字的字根形,漢字的結(jié)構(gòu)形和字根在漢字結(jié)構(gòu)中所處的位置,次第及數(shù)量而對(duì)漢字及詞語(yǔ)進(jìn)行編碼。
2.根據(jù)權(quán)利要求1所述的編碼法,其特征在于依據(jù)這種編碼方法對(duì)漢字分拆歸并,擇優(yōu)精選出組合字詞能力強(qiáng),次第在前四位頻率高的漢字字根,組成了《東方漢字字根編碼總表》。
3.根據(jù)權(quán)利要求1和2所述的編碼總表,其特征在于將編碼總表中除去部分漢字字根的簡(jiǎn)寫(xiě)體,繁寫(xiě)體,變異體和變向體,均按編碼總表將漢字字根分別刻印在相對(duì)應(yīng)的60個(gè)字鍵帽上,這樣就構(gòu)成了《東方漢字兼容外文編碼鍵盤(pán)》。
4.根據(jù)權(quán)利要求1所述的編碼法,其特征在于將漢字字根形歸納為三種類(lèi)型,即一筆獨(dú)立型;幾筆不交接型;幾筆交接穿插型。每種類(lèi)型包括若干筆畫(huà)形態(tài)。
5.根據(jù)權(quán)利要求1所述的編碼法,其特征在于將漢字結(jié)構(gòu)形歸納為九種類(lèi)型,即獨(dú)體形;夾形;穿插形;載托形;上下形;左右形;半包圍形;開(kāi)口形;全包圍形。每種類(lèi)型包括若干結(jié)構(gòu)形態(tài)。
6.根據(jù)權(quán)利要求1所述的編碼方法,其特征在于編碼順序以書(shū)寫(xiě)漢字的一般規(guī)律和習(xí)慣,以書(shū)寫(xiě)第一筆的字根為先,即先上后下,先左后右,先外后里,先載托后乘載的原則進(jìn)行。
7.根據(jù)權(quán)利要求1和3,其特征在于將60個(gè)字鍵劃為十二行,十列,依次從中至兩邊,從下至上讀為“金木水火土,日月山石川,人民心目事,由已言二句。中國(guó)大開(kāi)發(fā),八方用力氣。子女小習(xí)書(shū),央才非一夕。工廠干生產(chǎn),重禾長(zhǎng)東西。門(mén)口見(jiàn)牛魚(yú),豐衣又足食。”以每一個(gè)字鍵名形成編碼口訣。
8.根據(jù)權(quán)利要求1和3,其特征在于外文字符在字鍵中的分布是西文字符按通用英文打字機(jī)鍵盤(pán)排列次序依次排列,其字符刻印在字鍵帽的左下角;俄文字符按通用的俄文打字機(jī)鍵盤(pán)排列次序依次排列,其字符刻印在字鍵帽的左上角;日文五十音圖字符每段從左到右,每行從上至下依次排列,其平假名字符刻印在字鍵帽的右上角,片假名字符刻印在字鍵帽的右下角。每字鍵中將漢、西、俄、日文字符用不同的顏色加于區(qū)別,以便鍵盤(pán)一目了然。
9.根據(jù)權(quán)利要求1和3,其特征在于對(duì)漢字進(jìn)行編碼時(shí),必須是按東方漢字字根編碼總表中最大的字根進(jìn)行編碼。
10.根據(jù)權(quán)利要求1和3,其特征在于作鍵名的漢字,擊該鍵一次作為該字的信息代碼,其后的漢字則按字鍵中上行在前,下行接后的次第分別連擊該鍵二、三、四次鍵作為該字的輸入信息代碼。若與其它字鍵中的漢字字根相組配編碼時(shí)不論其漢字字根在該鍵中的次第,一律以該鍵名為代碼,即只擊該鍵一次作為該鍵中所有漢字字根的組配代碼。
11.根據(jù)權(quán)利要求1和3,其特征在于對(duì)漢字進(jìn)行編碼時(shí),按漢字一般書(shū)寫(xiě)規(guī)律和習(xí)慣,只取前三個(gè)字根即可。若屏幕上出現(xiàn)兩個(gè)以上的漢字,經(jīng)提示后,若需前一個(gè)字,可不必處理,若需后面的字,則取末尾字根。
12.根據(jù)權(quán)利要求1和3,其特征在于對(duì)《新華字典》和《現(xiàn)代漢語(yǔ)詞典》所收編的全部漢字可以進(jìn)行編碼,碼長(zhǎng)不超過(guò)四個(gè)代碼,平均每字擊鍵次數(shù)不到三次,重碼少易取舍,形成一套東方漢字信息編碼本。
13.根據(jù)權(quán)利要求1和3,其特征在于增加漢字詞語(yǔ)、西文、俄文、日文功能鍵,只須調(diào)檔,即可按其所需文種進(jìn)行編碼。
14.根據(jù)權(quán)利要求1和3,其特征在于對(duì)漢語(yǔ)詞組,成語(yǔ),短語(yǔ),專(zhuān)用詞語(yǔ),名人詩(shī)詞實(shí)現(xiàn)簡(jiǎn)碼快速輸入檢出,其編碼方法是依詞語(yǔ)的漢字次第分別取每字的一至二個(gè)字根進(jìn)行編碼。這樣可根據(jù)需要建立詞匯信息碼本,成語(yǔ)信息碼本,漢語(yǔ)主題詞信息碼本等,從而建立一整套中文編碼系列。
全文摘要
本發(fā)明為《東方漢字字根編碼法》以及依據(jù)這一方法設(shè)計(jì)的《東方漢字兼容外文編碼鍵盤(pán)》。這一編碼法主要根據(jù)漢字的字根形,漢字的結(jié)構(gòu)形和字根在漢字結(jié)構(gòu)中的位置,次第和數(shù)量對(duì)漢字進(jìn)行編碼,其鍵盤(pán)為60個(gè)字鍵,可對(duì)《新華字典》和《現(xiàn)代漢語(yǔ)詞典》所收編的全部漢字進(jìn)行編碼,平均每字擊鍵次數(shù)不到三次,為了使鍵盤(pán)具有多種功能,將西文、俄文、日文字符也布局在鍵盤(pán)上。采用這一新的漢字編碼法使?jié)h字編碼更簡(jiǎn)練,操作直觀,易學(xué),輸入鍵入率高,為我國(guó)漢字信息處理計(jì)算機(jī)化將起很大的作用。
文檔編號(hào)G06F3/023GK1035013SQ8810976
公開(kāi)日1989年8月23日 申請(qǐng)日期1988年12月29日 優(yōu)先權(quán)日1988年12月29日
發(fā)明者李向東 申請(qǐng)人:李向東