專利名稱:一種計算機漢字輸入編碼方法
技術領域:
本發(fā)明屬于計算機漢字輸入編碼領域。
其技術背景是,在信息社會飛速發(fā)展的今天,漢字錄入技能是每一個中國人的最基本的技能之一,如何快速掌握一個錄入漢字的技能是很多人關心的熱門話題,拼音輸入法易學,但拼音輸入法受方言的限制和并且有太多的重字重碼,且輸入速度也慢,也有許多種輸入法都需要記憶眾多的字根和輸入規(guī)則,要花較長的時間學習和記憶,漢字輸入技術還沒有解決“易學的打不快,打得快的不易學″這一難題,市場上還急需老少皆宜、易學易用的漢字輸入法。
本發(fā)明的目的在于提供一種易學易用的計算機漢字輸入方法,為實現(xiàn)上述目的,本發(fā)明采用的技術方案為用計算機鍵盤上的26個英文字母、10個阿拉伯數(shù)字以及“,”、“。”、“;”等符號作為漢字編碼的基本碼元,以點(丶)、豎(丨)、撇(丿)、橫(一)、捺(乀)、橫折()、豎折(乚)七個筆畫作為漢字的基本筆畫,由兩個或兩個以上的筆畫構(gòu)成的部件作為基本字元,每一個筆畫或字元分別對應于一個碼元,且在編碼時將漢字的拼音中的第一個字母定義為該漢字音碼,將漢字分為獨體字和組合字,組合字中又包含有筆畫字和準組合字,獨體字的第一筆畫和最后一個筆畫所對應的碼元分別作為該獨體字的首部碼和尾部碼,組合字的前幾個筆畫組成的最小字元和組合字的后幾個筆畫組成的最小字元所對應的碼元分別作為該組合字的首部碼和尾部碼,筆畫字是由一個字元和一個筆畫組成,在筆畫字中筆畫碼可作為首部碼或尾部碼(在組合字和準組合字中筆畫碼不能單獨作為首部碼或尾部碼),準組合字是由一個字元和一個既非一個獨立的字元又非一個筆畫的部分組成,這部分在字的首部或尾部時,其首部碼或尾部碼就是該準組合字的音碼。單字的編碼由三個碼組成第一碼為音碼,第二碼為首部碼,第三碼為尾部碼,碼長為3,而詞組的最大碼長為4,其規(guī)則為二字詞的編碼由第一個字和第二個字的音碼以及第一個字和第二個字的首部碼按順序排列而成;三字詞的編碼由第一個字、第二個字和第三個字的音碼以及第三個字的首部碼按順序排列而成;四個或四個以上的字組成的詞組的編碼由第一個字、第二個字、第三個字以及倒數(shù)第一個字的音碼按順序排列而成。當一個獨體字作為一個組合字的一部分組成一個組合字時,且當這個獨體字出現(xiàn)在組合字的首部時,獨體字的音碼作為這個組合字的首部碼,當這個獨體字出現(xiàn)在組合字的尾部時,獨體字的音碼作為這個組合字的尾部碼,特別地,中文小寫數(shù)字“一、二、三、四、五、六、七、八、九、十、”的編碼分別為其所對應的阿拉伯數(shù)字“111、222、333、444、555、666、777、888、999、000”。本方法適用于計算機鍵盤輸入漢字等場合,不需要拆字,只看漢字的首尾,且重碼率低,編碼空間大,輸入速度高,方便易學。
下面通過實施例并通過附圖進一步說明本發(fā)明
圖1字元鍵盤分布示意2首部碼和尾部碼示意圖實施例如圖1所示,將漢字的基本筆畫、偏旁部首或漢字的若干筆畫組成的部件作為漢字的基本字元,分別對應于計算機鍵盤上字母鍵、數(shù)字鍵以及符號鍵,所對應的字母、數(shù)字、符號作為漢字編碼的碼元,即給每一個字元賦一個值,例如“丷”、“刂”、“扌”、“艸”等等都是一個字元,它們分別對應的碼元為2、I、9、7,筆畫“橫”對應的碼元為“1”,筆畫“捺”對應的碼元為“8”,由此可知,獨體字“來”字的編碼為“L 1 8”,如圖2所示。再例如組合字“前”字的編碼為“Q 2 I”,如圖2所示。如上所述,當一個獨體字作為一個組合字的一部分組成一個組合字時,且當這個獨體字出現(xiàn)在組合字的首部時,獨體字的音碼作為這個組合字的首部碼,當這個獨體字出現(xiàn)在組合字的尾部時,獨體字的音碼作為這個組合字的尾部碼,如“體”字的后一部分是一個獨體字“本(Ben)”字,故B作為“體”字的尾部碼,則“體”字的編碼為“T T B”;“黑”字是一個準組合字,它是由字元“灬”和其上面的部分組成,而其上面的部分既不是一個字元(在圖1中找不到),也不是一個筆畫,這一部分所對應的碼元就是“黑”字的音碼“H”,即“黑”字的編碼為“HHV”;筆畫字是由一個字元和一個筆畫組成(除了字元部分,剩下的只有一個筆畫),如“個”字是由一個“人”字和一個“豎”筆畫組成,此時“豎”的筆畫碼“I”作為其尾部碼,故“個”字的編碼為“GRI”。除此之外,本發(fā)明還可按照前述規(guī)則對詞組進行編碼,如詞組“工作(GongZou)”的編碼為“G Z 1 T”(1為工字的首部碼,T為作字的首部碼),詞組“解放軍(Jie Fang Jun)”的編碼為“J F J D”(D為軍字的首部碼),依此類推。
本發(fā)明簡單易行,操作方便,不需要拆字,只看首尾,且重碼率低,編碼空間大,詞組數(shù)目多,輸入速度高,方便易學,特別適合少年兒童和中老年人打字使用,也適用于專業(yè)人員打字。
權(quán)利要求
1.一種計算機漢字輸入編碼方法,其特征在于用計算機鍵盤上的26個英文字母、10個阿拉伯數(shù)字以及“,”、“?!薄ⅰ?;”等符號作為漢字編碼的基本碼元,以點(丶)、豎(丨)、撇(丿)、橫(一)、捺(乀)、橫折()、豎折(乚)七個筆畫作為漢字的基本筆畫,由兩個或兩個以上的筆畫構(gòu)成的部件作為基本字元,每一個筆畫或字元分別對應于一個碼元,且在編碼時將漢字的拼音中的第一個字母定義為該漢字音碼,將漢字分為獨體字和組合字,組合字中又包含有筆畫字和準組合字,獨體字的第一筆畫和最后一個筆畫所對應的碼元分別作為該獨體字的首部碼和尾部碼,組合字的前幾個筆畫組成的最小字元和組合字的后幾個筆畫組成的最小字元所對應的碼元分別作為該組合字的首部碼和尾部碼,筆畫字是由一個字元和一個筆畫組成,在筆畫字中筆畫碼可作為首部碼或尾部碼,準組合字是由一個字元和一個既非一個獨立的字元又非一個筆畫的部分組成,這部分在字的首部或尾部時,其首部碼或尾部碼就是該準組合字的音碼。單個漢字的編碼由三個碼組成第一碼為音碼,第二碼為首部碼,第三碼為尾部碼,碼長為3,而詞組編碼的碼長為4。
2.根據(jù)權(quán)利要求1所述的一種計算機漢字輸入編碼方法,其特征在于當一個獨體字作為一個組合字的一部分組成一個組合字時,且當這個獨體字出現(xiàn)在組合字的首部或尾部時,獨體字的音碼作為這個組合字的首部碼或尾部碼。
3.根據(jù)權(quán)利要求1所述的一種計算機漢字輸入編碼方法,其特征在于二字詞的編碼由第一個字和第二個字的音碼以及第一個字和第二個字的首部碼按順序排列而成,三字詞的編碼由第一個字、第二個字和第三個字的音碼以及第三個字的首部碼按順序排列而成,四個或四個以上的字組成的詞組的編碼由第一個字、第二個字、第三個字以及倒數(shù)第一個字的音碼按順序排列而成。
4.根據(jù)權(quán)利要求1所述的一種計算機漢字輸入編碼方法,其特征在于中文小寫數(shù)字“一、二、三、四、五、六、七、八、九、十、”的編碼中的第一碼、第二碼、第三碼分別都為其所對應的阿拉伯數(shù)字“1、2、3、4、5、6、7、8、9、0”。
5.根據(jù)權(quán)利要求1所述的一種計算機漢字輸入編碼方法,其特征在于由U、V、I三個字母開頭的編碼,其編碼長度大于4。
全文摘要
一種計算機漢字輸入編碼方法,其特征在于用計算機鍵盤上的26個英文字母、10個阿拉伯數(shù)字以及“,”、“?!薄ⅰ?;”等符號作為漢字編碼的基本碼元,以點、豎、撇、橫、捺、橫折、豎折等七個筆畫作為漢字的基本筆畫,由兩個或兩個以上的筆畫構(gòu)成的部件作為基本字元,每一個筆畫或字元分別對應于一個碼元,且在編碼時將漢字的拼音中的第一個字母定義為該漢字音碼,獨體字的第一筆畫和最后一個筆畫所對應的碼元分別作為該獨體字的首部碼和尾部碼,組合字的前幾個筆畫和后幾個筆畫組成的最小字元所對應的碼元作為該組合字的首部碼和尾部碼,其編碼由音碼、首部碼、尾部碼組成。本方法不需要拆字,且重碼率低,編碼空間大,方便易學。
文檔編號G06F3/023GK1808352SQ200610008778
公開日2006年7月26日 申請日期2006年2月10日 優(yōu)先權(quán)日2006年2月10日
發(fā)明者曹湖海, 孫玉華, 曹世鐸 申請人:孫玉華