專利名稱:同補碼的制作方法
同補碼是漢字詞字同步、形音互補輸入碼的簡稱。它是以《現(xiàn)代漢語通用字筆順規(guī)范》中的筆畫式和序號式以及漢字拼音全碼為基礎開發(fā)出來的漢字詞字輸入可半盲打的普及碼系統(tǒng),其特征為字碼直接采用國家規(guī)范的筆順碼和漢字全拼碼;給部首在字首,部首筆畫多于三筆的字,增加一個由部首首筆,部首碼標識和余部筆順構成的部首碼,它們的筆順碼可以保留,也可以刪除;部首碼和筆順碼總稱部首筆順碼;在拼音碼后面接上部首筆順碼,稱為拼音部首筆順碼;把拼音字母碼一對一地按照國際通行的對應關系轉換成數(shù)字碼,再后接部首筆順碼,稱為數(shù)字拼音部首筆順碼;詞碼是使用上述字碼,按照″每字首碼+末字全碼″的詞碼形成規(guī)則構成的,與字碼對應,有部首筆順詞碼、拼音部首筆順詞碼和數(shù)字拼音部首筆順詞碼;上述字碼和詞碼的全碼,需經(jīng)如下的截碼處理后,才能成為輸入碼(a)取全碼的首位代碼作為全碼分類的根據(jù),給全碼分類,(b)分類后的各類分別按漢字的詞字使用頻率從高頻到低頻排序,(c)取各類中作為分類根據(jù)的代碼,作為各類中排在最前面的,在指定的重碼數(shù)以內(nèi)(含指定重碼數(shù))的字的輸入碼,(d)復制并保存輸入碼,(e)分類根據(jù)加長一位,給全碼重新分類,(f)重復(b)-(e),直到輸入碼碼長等于指定的最長碼長,(h)按結構優(yōu)先原則優(yōu)化輸入碼;供鍵選的同碼字和同碼詞分開,分行同步顯示,有豎行和橫行兩種基本的顯示格式。
本輸入碼系統(tǒng)有如下的特點和優(yōu)點(1)作為本輸入碼系統(tǒng)基礎的字碼筆順碼和拼音全碼的形成規(guī)則完全符合國家規(guī)范,沒有改動國家規(guī)范,也沒有在國家規(guī)范之外,增加點什么;(2)部首采用流傳最廣的《新華字典》的部首,給部首在字首,部首筆畫多于三筆的字,增加一個部首碼,有如下特點和優(yōu)點①沒有改動筆順碼的形成規(guī)則;②可以縮短輸入碼碼長(七千個一二級漢字的純筆順碼的平均碼長為5.20位,最長碼長9位,增加了部首碼的部首筆順碼的平均碼長為4.57位,縮短了0.63位,最長碼長7位,縮短了2位);③可以把漢字的傳統(tǒng)文化(部首)保存在現(xiàn)代科技中;④符合用戶輸入心理(例如″鱸″字.部首″魚″有八筆,在七千個一二級漢字中,″魚″部字有65個。″鱸″字的輸入碼至少要九位″352512112″,取部首碼,四位就可以了″3021″。在微機中,由于存儲容量日益增大,筆順碼和部首碼可以并存,熟悉本輸入碼系統(tǒng)的用戶,對部首筆畫多的字,幾乎都選擇部首碼來輸入。所以說,增加部首碼,符合用戶輸入心理)。
(3)在拼音碼的后面,接上筆順碼或部首碼,徹底解決了拼音碼重碼過多,翻屏頻繁,尋找麻煩的問題.在需要時,在拼音全碼后,增加一筆,最多兩筆的筆順碼或部首碼,就可以不翻屏地找到七千個漢字中的任意一個。在一次只能顯示五六個漢字,而且只能用數(shù)字輸入拼音字母的手機上,少數(shù)字需要增加三筆,才能不翻屏地找到,但這些都是發(fā)短信息時不用,或者,可以不用的字。
(4)本輸入碼系統(tǒng)是一個可半盲打的輸入碼系統(tǒng)。用戶可以閉著雙眼,按詞碼或字碼的形成規(guī)則,輸入想要輸入的詞或字的長碼(部首筆順字碼的長碼指定為7位,其他指定為6位),該詞或字就會顯示在當前的屏幕上,即使按照全碼,輸入比長碼長的編碼,長碼后面的編碼,只是無效而已,所需要的詞或字,不再從屏幕上跑掉.由于顯示的常常不只是所需的詞字,還有它們的同碼詞字,需要鍵選,所以稱為半盲打。
(5)由于半盲打碼(即長碼)的碼長較長,本輸入碼系統(tǒng)還設置了一種比短碼長,比長碼短的結構碼,并提出了相應的優(yōu)化輸入碼的″結構優(yōu)先″原則.在本輸入系統(tǒng)中,所謂″結構″,對于部首筆順碼,字是指字的部件,詞是指詞的字數(shù)和末字部件;對于拼音部首筆順碼和數(shù)字拼音部首筆順碼,字是指字的音碼和后繼形碼的界面,詞是指字數(shù)和末字音碼和形碼的界面.本系統(tǒng)是在頻率優(yōu)先的基礎上自動編制輸入碼的,″結構優(yōu)先″可以使輸入碼得到優(yōu)化,更加符合輸入者的輸入心理.例如按字頻″表″排在第87位,″刊″排在第1242位,經(jīng)系統(tǒng)自動編碼,″表″的輸入碼為″112″,″刊″的輸入碼為″1122″,而漢字輸入者的筆順碼輸入心理,是字的部件結構心理,在輸入″表″時,輸入的第一個心理單位是″1121″,不是″112″,″刊″的第一個輸人心理單位是″112″,不是″1122″。在這種情況下,輸入者在輸入″表″和″刊″時,都會感到別扭。所以,需要在頻率的基礎上進行結構優(yōu)化把″表″安排在″1121″碼位上,″表″在″112″的碼位讓給″刊″。這就是″結構碼″和″結構優(yōu)化″。
(6)由于漢字的部件還沒有嚴格的國家規(guī)范,所以,本輸入碼系統(tǒng)在結構優(yōu)化時,遵循″一目了然″原則,對部件結構不一目了然的字,使用頻率高的安排在4碼的碼位上,安排不下的,由系統(tǒng)自動安排。4位碼是本輸入碼系統(tǒng)的入門碼位.在這個碼位上可找到將近三千個字或詞,其中包含大部分的高頻詞字。
(7)由于部首筆順碼的字碼和詞碼的重碼率高達百分之七八十,供鍵選的同碼字和同碼詞需要分開,分行同步顯示。這不僅是技術上的需要,也符合輸入者的輸入心理。一個輸入者的每次輸入是字,還是詞,在輸入前都有一個確定的想法,要輸入字,可以只注意顯示出來的字行,要輸入詞,可以只注意顯示出來的詞行。這應該說比字詞混合在一行中顯示更符合輸入心理,因而,輸入效果會更好.
(8)本輸入碼系統(tǒng)的詞碼和字碼的形成規(guī)則統(tǒng)一,碼長可調(diào),重碼數(shù)可指定,能滿足微機、掌上電腦和手機各種屏幕顯示規(guī)格的需求,是一種符合國家規(guī)范,沒有超越人們漢字常識的規(guī)則,可以無師自通,不受方言影響,可以在所有機型上通用的漢字詞字輸入碼.在微機上,可以單手使用數(shù)字小鍵盤,完成漢字詞字、數(shù)字、英語字母和符號的輸入。
權利要求
1.同補碼是漢字詞字同步、形音互補輸入碼的簡稱.它是以《現(xiàn)代漢語通用字筆順規(guī)范》中的筆畫式和序號式以及漢字拼音全碼為基礎開發(fā)出來的漢字詞字輸入可半盲打的普及碼系統(tǒng),其中部首碼的部首采用《新華字典》的部首,其特征在于(1)字形碼是由一(橫,提),ㄧ(豎,豎鉤)丿(撇),、(點,捺)和乛(折)五個基本筆畫,或者,由1(橫,提),2(豎,豎鉤),3(撇),4(點,捺)和5(折)五個基筆畫的序號編制的筆順碼;(2)給部首在字首,部首筆畫多于三筆的字,增加一個由部首首筆,部首碼標識和余部筆順構成的部首碼,它們的筆順碼可以保留,也可以刪除;部首碼和筆順碼總稱部首筆順碼;(3)字音碼是在漢字拼音全碼后面接上部首筆順碼,或者,把漢字拼音全碼的拼音字母一對一地按照國際通行的對應關系轉換成數(shù)字,再后接部首筆順碼,前者稱為拼音部首筆順碼,后者稱為數(shù)字拼音部首筆順碼;(4)詞碼是使用上述字碼,按照″每字首碼+末字全碼″的詞碼形成規(guī)則構成的,與字碼對應,有部首筆順詞碼、拼音部首筆順詞碼和數(shù)字拼音部首筆順詞碼;(5)上述字碼和詞碼的全碼,經(jīng)如下處理后,成為輸入碼(a)取全碼的首位代碼作為全碼分類的根據(jù),給全碼分類,(b)分類后的各類分別按漢字的詞字使用頻率從高頻到低頻排序,(c)取各類中作為分類根據(jù)的代碼,作為各類中排在最前面的,在指定的重碼數(shù)以內(nèi)(含指定重碼數(shù))的字的輸入碼,(d)復制并保存輸入碼,(e)分類根據(jù)加長一位,給全碼重新分類,(f)重復(b)-(e),直到輸入碼碼長等于指定的最長碼長,(h)按結構優(yōu)先原則優(yōu)化輸入碼;(6)供鍵選用的同碼字和同碼詞,在屏幕的鍵選提示區(qū)中顯示時,彼此分開,分行同步顯示,有豎行顯示和橫行顯示兩種基本的顯示格式;(7)鍵選前,先輸入鍵選標識。
2.根據(jù)權利要求1所述輸入方法,其特征在于詞字碼長可以調(diào)整,重碼數(shù)和最長碼長都可以指定。
3.根據(jù)權利要求1所述輸入方法,其特征在于采用不同的鍵選標識,可實現(xiàn)如下多種功能(1)按需要調(diào)用備用字碼表中的備用字,并使其轉入當前字碼表;(2)按需要調(diào)用任意一個備用專業(yè)詞碼表中的備用專業(yè)詞,并使其轉入當前通用詞碼表,或者,把任意一個備用的專業(yè)詞碼表,暫時地或永久地轉成當前詞碼表,當前的通用詞碼表轉成備用碼表,需要時再復原;(3)可以查閱與當前輸入相關的字典、詞典、書目、檔案和資料等數(shù)據(jù)庫。
4.根據(jù)權利要求1所述輸入方法,其特征在于可以定義和輸入由中西文字、數(shù)字和符號混合組成的詞組或字符串。
全文摘要
同補碼是漢字詞字同步、形音互補輸入碼的簡稱。它是以《現(xiàn)代漢語通用字筆順規(guī)范》中的筆畫式和序號式以及漢字拼音全碼為基礎開發(fā)出來的漢字詞字輸入可半盲打的普及碼系統(tǒng)。詞碼和字碼的形成規(guī)則統(tǒng)一,碼長可調(diào),重碼數(shù)可指定,能滿足微機、掌上電腦和手機各種屏幕顯示規(guī)格的需求,成為各機通用的輸入碼。同補碼在拼音和數(shù)字拼音全碼后加一至二位筆順碼,大體免除了各種機型上翻屏尋找的麻煩。
文檔編號G06F3/023GK1489027SQ02143670
公開日2004年4月14日 申請日期2002年10月8日 優(yōu)先權日2002年10月8日
發(fā)明者邱國權 申請人:邱國權, 周煒