專利名稱:聲部角漢字輸入法及分碼對接輸入技術的制作方法
技術領域:
本發(fā)明涉及計算機中文信息處理技術,具體地說是涉及通過計算機通用小鍵盤實現(xiàn)的漢字輸入法。
目前的計算機漢字輸入法有幾百種,使用較普遍、影響較廣的也有十幾種。眾多的輸入法可歸位三大類音碼、形碼和音形碼,音碼雖易學但重碼多輸入速度不快,且不懂讀的字就無法輸入,形碼重碼率低利于盲打,輸入速度快,但要記大量字根,需較長時間專門訓練才能掌握,音形碼介于兩者之間,比較易學,輸入速度也比較快。音形碼中,交大李碼、自然碼、粟碼等輸入法都是很優(yōu)秀的輸入法。
已往的輸入法皆是一次性連續(xù)輸入完一個字或詞的碼(包括簡碼),對于音形碼類輸入法來說要在音與形之間進行切換,無形中增加用戶額外的腦力負擔。
我國中文處理信息用的字符集已由原來的《信息交換用漢字編碼字符集(基本集)》的6736個漢字和符號擴展到《CJK統(tǒng)一漢字編碼字符集》的20902個漢字和符號,通用詞由原來的5000多條增至40000多條,單純用字母或單純用數(shù)字作編碼都無法避免地會造成很多的重碼,不利于漢字的輸入。如果字母和數(shù)字兩者皆用作編碼就可以比較有效地解決重碼問題,但鍵盤中的數(shù)字鍵離基本鍵位較遠,手指擊鍵跨度較大,會增加輸入操作的難度。
本發(fā)明的目的是針對上面所述中存在的問題,提供一種簡單易學、實用高效,使用戶能夠輕松自如、快速準確地輸入漢字的優(yōu)秀的漢字輸入方法。它既可以按照傳統(tǒng)的方法來輸入,又可以按照超越傳統(tǒng)的的分碼對接的方法來輸入。
本發(fā)明是通過下面方案實現(xiàn)的聲部角漢字輸入法也是屬于音形碼類的輸入法,取碼簡易,輸入快捷,它提取漢字中最容易提取的特征信息元作編碼,其單字完整碼為三碼或四碼,第一碼取字的本身讀音的聲母為代碼,第二碼取字的部首為代碼,第三、第四碼取除部首以外所剩的部分的右上、右下角的角形為代碼,所取的各部分的碼均是字的最突出的、顯而易取的部分。其輸入效率達到甚至高于形碼類輸入法的,而其學習難度卻低于拼音類輸入法的。
1.聲碼的取法聲碼即聲母碼,取漢字的普通話讀音的聲母為代碼,零聲母的取音節(jié)第一個字母為代碼,雙字母聲母的,zh取O,ch取V,sh取I,首字母為y的,其后第一個字母是a、e、o的取Y,其后第一個字母是i、u的取U。這些碼分別對應26個字母。
2.部碼的取法部碼即部首碼,一般取漢字的部首讀音的聲母為代碼,為避免重碼,有6個部首以其形取碼,山取E,扌取F,纟取W,日取O,月取D,木取P(樹木的外形象P)。根據(jù)取部原則取不到部首的字(即無部首的字),包括不能分的字和分字后取不到部首的字,其部首碼就取英文字母之首字母A來代替。為方便取碼,不易混淆,有少數(shù)幾個部首比較少用或沒有傳統(tǒng)名稱的,參照《新華字典》的做法,將其隨與其形似的部首歸入同一部,巳隨己歸入J,曰隨日歸入O,支隨攵歸入W,豕和豸隨犭歸入Q,彐隨山歸入E,廴隨辶歸入Z,糸和幺隨纟歸入W,士隨土歸入T。單筆部首中,橫、豎、撇、點及帶鉤的折筆可以作部首,捺筆和其它折筆不能作部首,“一”取H,“丨”取I,“丿”取P,“丶”取D,鉤“乙 乚乛 ”取G?!办帷笔恰盎稹钡牧硪环N形式,取H。所采用的部首完全同于《新華字典》的。根據(jù)分字原則和取部原則來取部碼可實現(xiàn)取部的唯一性,即一個漢字只取一個部碼。分字原則①離散關系可分,如“法”分為“氵”和“去”。②相連關系可分,如“禾”分為“丿”和“木”。③交叉關系不分,如“禺、果、隸”等不能分。
取部原則①先上后下、先左后右、先外后內原則。如“芯”取“艸”為其部首,“想”分為“相”和“心”,其上部不能作部首取下部“心”為部首“釗”取“钅”為部首,“到”分為“至”和“刂”,其左部不能作部首取右部“刂”作部首;“這”取“辶”為部首,“翅”分為“支”和“羽”,其外面部分不能作部首取里面部分“羽”作部首。②沒有部首的(包括不能分的字和從兩可分處劃分皆取不到部首的字),如“禺、隸”和“冀、贏”,部首碼取A代替。
3.角碼的取法角碼即角形碼,取字形除了部首外所剩的部分(沒部首的取整字)的右上、右下角的角形為代碼,用0~9表示。角碼的取法遵循角形與數(shù)字形狀相似的原則。如“丨”形似“1”所以取1,“口”形似“0”所以取0。注意角形碼取的是筆形并非筆畫,所以要優(yōu)考慮整個筆形,多數(shù)以其下部為特征,如“夷”字其筆形下部為八所以取8,不能按交叉筆形取碼。
取角原則①要遵循分字原則。即取角時同樣要遵循“離散可分,相連可分,相交不分”原則。②單角不復。當只有一個角形時就只取一個角形,不重復取角,如“廠”只取右上的角碼2,“日”只能取一個角碼0。③從大優(yōu)先。如“人”的筆形是八字形取8,不能取捺筆為筆形。
4.漢字的編碼(1)聲部角編碼單字聲部角輸入法中,第一碼取字的聲母碼(聲碼),第二碼取字的部首碼(部碼)、第三、第四碼取除部首以外所剩部分(無部首的取整字)的右上角和右下角的角形碼(角碼),如爆BH05。第一碼取聲碼,“見”音見碼,第二碼取部碼,見字見碼,第三、第四碼取角碼,角碼以其形為特征,見角見碼。
雙字詞第一、第二碼分別取這兩字的聲碼,第三、第四碼分別取這兩字的部碼。
三字詞分別取這三個字的聲碼。
四字詞或四字以上詞取前三字及末字的聲碼。
即三字或三字以上的詞只取聲碼,兩字詞取聲碼和部碼,單字取聲碼、部碼和角碼。單字還有一級簡碼和二級簡碼。單字與詞之間不會有重碼,三字詞與其他詞之間不會有重碼??梢詫Α禖JK統(tǒng)一漢字編碼字符集》的20902個漢字和符號進行編碼,在國家標準GB2312-80內的漢字僅有少量重碼。
(2)部角聲編碼部角聲編碼的字碼保持與聲部角編碼的字碼一致,只是順序改變,將聲部角編碼的首碼移到后面作末碼。如“爆”字聲部角碼為BH05,而部角聲碼為H05B。
下面介紹本發(fā)明的一個實施方案——聲部角碼漢字輸入系統(tǒng)。
聲部角碼漢字輸入系統(tǒng)包括三種輸入方式聲部角普通輸入方式、聲部角分碼對接輸入方式、部角聲輸入方式。
①聲部角普通輸入方式。輸入字或詞的聲部角編碼,不足四碼補空格鍵結束。字詞可混合輸入,無需轉換。聲部角普通輸入法取漢字三種不同層次的碼,第一層次為聲碼,第二層次為部碼,第三層次為角碼,當輸入時,無須先判斷是字還是詞,而是可以一邊輸入第一層次的碼一邊進行判斷,不能往后延續(xù)取第一層次的碼時,才回頭取第二層次的碼,取了第二層次的碼還不能輸入時,才再取第三層次的碼。
單字聲碼+部碼+首角碼+末角碼雙字詞第一字聲碼+第二字聲碼+第一字部碼+第二字部碼三字詞第一字聲碼+第二字聲碼+第三字聲碼+空格鍵四字詞或四字以上詞第一字聲碼+第二字聲碼+第三字聲碼+末字聲碼②部角聲輸入方式。輸入字的部角聲編碼,這種方式只能輸入單字,當遇到不懂得讀的字可采用這一方式輸入,也可用這一方式來查閱。部角聲輸入方式可與聲部角輸入方式混合使用,無需轉換,系統(tǒng)會自動識別,當擊完部首碼(字母)后,接著第二碼擊角形碼(數(shù)字)時,提示行便立即自動顯示所有前兩碼是這兩碼的字及所剩的碼,補擊所剩的碼便可輸入。這種方式適合輸入不會讀的字。
③聲部角分碼對接輸入方式開機狀態(tài)為普通輸入方式,輸入法的指示框中會顯示聲部角(I),擊一次轉換鍵鍵(<CTRL>+“\”)后,轉為分碼對接輸入方式,輸入法指示框中會顯示聲部角(II)。
分碼對接輸入方式并不象普通方式那樣一次連續(xù)全部輸入完一個字的字碼或一個詞的詞碼,而是把一個字的字碼或一個詞的詞碼分成兩部分,分作兩次來進行輸入,第一次先輸入整句、整段或整篇的所有字或詞的聲母碼,象輸入英文字母一樣,這些碼均在熒屏中顯示出來,系統(tǒng)并非把它們當作完整的詞碼來執(zhí)行而是自動地將它們存儲下來。將光標移至要對接處,之后再補輸入各字或詞所剩的碼,系統(tǒng)會自動識別,自動對接成完整字碼或詞碼而輸出漢字,得到的漢字自動對應覆蓋在熒屏中的聲母碼。當補擊的是一個字母碼加數(shù)字碼或是一個數(shù)字碼加空格鍵或是單單補擊空格鍵,光標會自動后移一位,系統(tǒng)就自動地截取一個聲母碼作為單字的首碼并自動將補輸?shù)拇a對接上去而輸出單字;當補擊的是兩個字母碼,光標會自動后移兩位,系統(tǒng)就自動地截取兩個聲母碼作雙字詞的前兩碼并自動將補輸?shù)拇a對接上去而輸出雙字詞;當補擊的是“;”鍵,光標會自動后移三位,系統(tǒng)就自動截取三個聲母碼作三字詞碼而輸出三字詞,當補擊的是“′”鍵,光標會自動后移四位,系統(tǒng)就自動截取四個聲母碼作多字詞碼而輸出多字詞。(注意“;”鍵和“′”鍵在分碼對接方式下其功能分別改三字詞識別鍵和多字詞識別鍵,但若光標后無碼對接其功能依舊)。數(shù)字、字母、標點符號等可在第一次鍵碼時一并輸入,第二次鍵碼時用右向方向鍵跳過。
聲部角普通輸入方式和分碼對接輸入方式皆適合于看打、聽打和想打,分碼對接方式尤其適合于看打,聲部角分碼對接輸入方式第一次單純輸入音,輸入音的最容易取的部分——聲碼,使得用戶擊鍵速度可以保持與閱讀速度的一致,第二次補輸入的單純是漢字的形,使得用戶能專心取形碼,避免聲形間頻繁地來回切換,因而能夠提高輸入速度,同時減輕腦力負擔。
本發(fā)明與現(xiàn)有的輸入法相比,有如下的優(yōu)點1.取碼簡易,輸入方便快捷。影響漢字輸入速度的因素主要有兩個用戶獲得漢字輸入碼的速度和用戶擊鍵的速度。
①所取的碼簡單,為人熟識。第一碼只取字的讀音的聲母碼,無須考慮變化較多的韻母,第二碼取部首碼,部首比部件簡單,取部首比取部件容易得多,第三、第四碼取角碼,角碼形象直觀,見字見碼。其學習難度還底于拼音類輸入法的,而且一旦學識就很難忘記。
②取碼順序順人們的思維習慣、觀察習慣和閱讀習慣。任何輸入法都要先“讀”,“讀”而產(chǎn)生“音”,聲部角第一碼取“音”,取最簡的音——聲母,雙字詞也是先輸入這兩個字的聲碼,才輸入這兩個字的部碼,比較接近人們的思維習慣、閱讀習慣??醋滞ǔO瓤床渴?。角形只考慮右上、右下角不考慮其它部分。音乃字之外殼,聲母乃字音之首,字形乃字之身軀,部首乃字形之首,右上右下角部分乃所剩部分的頭部與尾部,不但所取的字的每一碼都是字的各部分中最“顯眼”的部分,而且是按照人的思維習慣、觀察習慣逐層地截取字的最明顯的部分,先從音中截取聲母,再從形中截取部首,然后從所剩部分中截取頭部尾部,這是一件很簡單容易的事。
③碼元編排合理、科學。聲部角輸入法既利用字母也利用數(shù)字作編碼,數(shù)字鍵離基本鍵位“ASDFGHJKL;”較遠,手指的擊鍵跨度較大,看起來這種輸入法似乎不好用,而實際上卻不然,雖然聲部角輸入法既利用字母也利用數(shù)字作編碼,但由于單字利用數(shù)字作編碼,使得詞容量擴大,有很多原本應按單字輸入的卻可以按詞來輸入,輸入詞無需利用數(shù)字鍵,單字也僅僅是后半部分利用數(shù)字作編碼,前半部分還是利用字母作編碼,常用的單字又有一級簡碼、二級簡碼,也不用數(shù)字鍵,實際上數(shù)字編碼部分等于起到存放不常用的字的作用,所以對常用的字基本可純用字母鍵輸入,通用字才用字母鍵輔以數(shù)字鍵輸入,所以,對于一般的輸入,絕大多數(shù)只需擊字母鍵。利用字母和數(shù)字作編碼,還可以有效地減少重碼。如此安排使得越常用的字就用越少的鍵輸入,使得動態(tài)碼長縮短,平均輸入一個字只需1.5鍵。
④所取的碼與鍵名聯(lián)系直接,便于擊鍵。漢字聲母基本同于鍵名,“見”音見鍵。部首也取其讀音的聲母為代碼,見部見鍵。角形與數(shù)字相似,見角見鍵。由于所取的碼與鍵名聯(lián)系直接,減少頭腦的思考環(huán)節(jié),節(jié)省時間,提高擊鍵的準確率和速度,所以使得其效率達到甚至高于形碼類的輸入法。
2.記憶量少,簡單易學。聲母基本與鍵名相同,只需記幾個特殊安排的聲碼,不象拼音碼類那樣要記35個韻母及韻母所對應的鍵,一“讀”出音就能很快很準確地取到聲碼,比所有音碼類輸入法都簡單易學。部首完全同《新華字典》的,不增一部,人們熟悉,部首碼是取部首讀音的聲母代碼,角碼根據(jù)形似原則來取碼,形象直觀,不用怎么去記,比任何形碼類輸入法都簡單易學。雖然有聲碼,有部碼,有角碼,看起來似乎有很多東西要記,其實不然,要記的東西很少,看一遍基本能記,而且一旦學識,很難遺忘,不象五筆型輸入法、雙拼輸入法等那樣不經(jīng)常使用很快遺忘。
3.有利于保護視力。不用專注于稿件,基本不用看熒屏,不象形碼那樣要長期專注于稿件,要很仔細、很瑣碎地拆字,也不象音碼那樣要頻頻地看提示,視線經(jīng)常在主屏、提示行、稿件之間不停切換。不用瑣碎分字,取碼容易,碼與鍵聯(lián)系直接,可以輕松自如地打字。
4.重碼率低。單字僅有少量重碼,發(fā)生重碼的多數(shù)是不常用的字,單字與詞之間絕對無重碼,三字詞與雙字詞、多字詞之間絕對無重碼。詞的重碼很少。重碼中,當鍵入其它鍵時會自動選最前面的字,方便操作。
5.適用范圍廣。聲部角輸入法,對音的要求不高,對形的要求也不高,所以既適合于看打,也適合于想打與聽打,還配備有部角聲輸入方式,不會讀的字也能輸入。對于漢字的讀法,各種方言與普通話都有區(qū)別,但其區(qū)別主要體現(xiàn)在韻母上,聲母多數(shù)保持不變,聲部角輸入法只取聲母不取韻母,使得其適應范圍廣,設有容錯輸入方式,對普通話不準的人特別是南方人,用此功能,z與zh,c與ch,s與sh不用區(qū)分也能輸入。既能輸入簡體字,又能輸入繁體字。既適合專業(yè)打字員使用,也適合一般的人員使用,只要有小學一、二年級水平就能夠很好地使用。
6.分碼對接方式突破傳統(tǒng)的輸入模式,并非把字碼或詞碼連續(xù)一次輸入完,而是把字碼或詞碼分隔起來輸入,先輸入整句、整段或整篇的字詞的音的部分,然后再補輸入形的部分,把本來要由人腦進行的音與形之間的切換工作改由計算機來替代,從而減輕用戶的腦力負擔,使用戶能夠輕松自如的進行漢字輸入。
圖1是聲母、角形與鍵位對照簡圖。每格上面部分是鍵名,數(shù)字鍵中的下面部分是角形,字母鍵中的下面部分是聲母。
圖2是聲部角輸入法部首定義表。
圖3是聲部角輸入法角形定義表。
權利要求
1.一種通過計算機通用小鍵盤實現(xiàn)的漢字輸入法,其特征在于該漢字輸入法所取的漢字的字碼是漢字的三個層次的碼——聲母碼、部首碼和角碼,輸入時,單字按“聲母碼+部首碼+右上角碼+右下角碼”的順序輸入,不足四鍵的字及簡碼字補空格鍵結束,雙字詞只須輸入各字的聲母碼加各字的部首碼,三字詞的只須輸入各字的聲母碼加空格鍵結束,多字詞的只須輸入前三字及末字的聲母碼。
2.一種通過計算機通用小鍵盤實現(xiàn)的漢字輸入法,其特征在于該漢字輸入法所取的漢字的碼完全同權利要求1所述的漢字輸入法所取的漢字的碼,輸入單字按照“部首碼+右上角碼+右下角碼+聲母碼”的順序輸入,這種輸入法,既可單獨運用,也可嵌入權利要求1所述的漢字輸入法系統(tǒng)中,與其在一起混合使用,無須轉換。
3.一種通過計算機通用小鍵盤實現(xiàn)的漢字輸入法,其特征在于該漢字輸入法所取的漢字的字詞碼完全同權利要求1所述的漢字輸入法所取的漢字的字詞碼,輸入時采用分碼對接形式,先輸入整句、整段或整篇的字或詞的聲母碼,然后將光標移至要對接處,之后再補輸入這些字或詞所剩的碼,系統(tǒng)會自動識別,自動對接成完整的字詞碼而輸出漢字,得到的漢字自動對應覆蓋在熒屏中的聲母碼。
4.根據(jù)權利要求1、2、3所述的漢字輸入法,其特征在于所取的聲母碼就是漢字讀音的聲母的代碼,零聲母的取音節(jié)的首字母作代碼,雙字母聲母的,zh取O、sh取I、ch取V,首字母為y的其后第一個字母為i或u的取U,其余的取Y。
5.根據(jù)權利要求l、2、3所述的漢字輸入法,其特征在于所取的部首碼就是漢字的部首的讀音的聲母的代碼,為避免有些鍵位負擔過重,有六個部首按其形取部,“山”取E,“扌”取F,“纟”取W,“日”取O,“月”取D,“木”取P,根據(jù)取部原則取不到部首的字其部首碼取英文字母之首字母A代替。
6.根據(jù)權利要求l、2、3所述的漢字輸入法,其特征在于所取的角碼就是漢字的字形除了部首之外所剩的部分的右上角、右下角的角形的代碼,按照角形與數(shù)字形狀特征相似的特點編排,“丨”取1,“一”取2,“ㄋ”取3,“十”取4,“”取5,“丶”取6,“フ”取7,“八”取8,“乂”取9,“口”取0。
全文摘要
聲部角漢字輸入法屬計算機中文信息處理技術,它提取漢字中的最容易提取的特征信息元作編碼,單字第一碼取字的讀音的聲母碼,第二碼取部首碼,第三、第四碼取除部首以外所剩部分的右上、右下角的角形碼,雙字詞取各字的聲母碼加各字的部首碼,三字詞取各字的聲母碼,多字詞取前三字及末字的聲母碼。還可用部角聲方式輸入不懂讀的字。還可用分碼對接輸入形式進行更方便的輸入。本輸入法簡單易學,實用高效,適用于不同層次的人使用。
文檔編號G06F3/023GK1341882SQ0111482
公開日2002年3月27日 申請日期2001年6月20日 優(yōu)先權日2001年6月20日
發(fā)明者黃湘 申請人:黃湘