專利名稱:“三合一”漢字編碼及鍵盤輸入法的制作方法
技術領域:
本發(fā)明屬于漢字編碼及計算機漢字輸入技術領域。
背景技術:
現(xiàn)有技術中的編碼輸入法大致有四大類音碼、形碼、音形結(jié)合碼和數(shù)碼。其中數(shù)碼較少使用。音碼的優(yōu)點是易學,符合文字規(guī)范和思維習慣,缺點是字重碼率高,輸入速度慢,不認識的字無法輸入。形碼的優(yōu)點是重碼率低,輸入速度快,不認識的字也能輸入,缺點是規(guī)則復雜,學習難度大,且易偏離文字規(guī)范。音形結(jié)合碼與形碼相比降低了記憶難度,與音碼相比又減少了單字重碼率,因此得到了一些編碼研究者的青睞。
CN91107428.7公開了名為“漢字地首音碼”的音形結(jié)合碼鍵盤輸入法方案。該方案采用字音、偏旁部首名稱以及去掉偏旁部首后剩余部分的首尾字形名稱的拼音首字母組成漢字的4鍵等長碼。這個方案主要采用碼元的拼音首字母安排鍵位,對于無音和無名稱的碼元則用筆畫編碼,采用的7種筆畫也都用其名稱的拼音首字母安排鍵位。
CN88102811.8公開了“八筆首音(傻瓜)碼漢字輸入方法”,也是一種音形結(jié)合碼。它將漢字的筆畫歸類為八種,分別以其名稱的漢語拼音首字母來安排鍵位,依次取漢字的拼音首字母以及首筆、次筆、末筆為第一、二、三、四碼。
CN90102877.0公開了另一種類似的音形結(jié)合碼。它也先取漢字的拼音首字母,然后按書寫規(guī)則取部分或全部漢字字根的拼音首字母組成漢字的編碼。它也命名了八種筆畫,按其名稱的拼音首字母安排鍵位。
上述三種方案,由于主要采用有音碼元(字根)按拼音首字母、無音碼元(字根)采用筆畫名稱的拼音首字母來安排鍵位,因此具有易學易記的優(yōu)點。但它們具有一些共同的、不可克服的缺陷。第一,它們都是單字編碼,沒有考慮詞編碼。雖然本技術領域的技術人員能夠在這些方案的基礎上增加詞編碼輸入,但實際上,由于詞編碼與字編碼混用編碼空間,字與詞之間不可避免地會發(fā)生沖突而增加重碼,因此容納詞碼的空間很有限,不可能采用大詞庫。第二,它們難于或者很不方便輸入不認識的字,更不可能適用于大字符集。第三,它們沒有很好地考慮與現(xiàn)行漢字教學規(guī)律相結(jié)合。
事實上,字碼與詞碼的沖突,是現(xiàn)有技術中絕大多數(shù)方案的共同缺陷。不消除這種沖突,就不可能做到既采用大詞庫而又保持低重碼率。
要能夠簡單、快速地輸入常用字,同時又要適用于大字符集甚至全漢字集,就要解決常用字與非常用字之間的沖突。據(jù)有關統(tǒng)計,3755個一級字占了99.9%的使用頻度。漢字輸入法當然首先要重點保證常用字的方便、快速輸入,但也不能將其它非常用字(多達幾萬個)棄置不顧。顯然,任何一種單一類型的漢字編碼輸入法都不可能很好地解決常用字與非常用字的沖突。音碼、音形結(jié)合碼、形碼之間也不存在簡單的孰優(yōu)孰劣之分,因為它們各自具有不同的優(yōu)勢及適用范圍認識的字和詞語,用音碼(或音形結(jié)合碼)輸入更符合思維習慣,不認識的字只能用形碼輸入。
現(xiàn)有技術中除音碼(全拼)外,其它漢字編碼方案都未能實現(xiàn)與現(xiàn)行語文基礎教學規(guī)律高度一致。
發(fā)明內(nèi)容
本發(fā)明的目的是要設計一種建立在漢字基礎知識之上、與語文基礎教學規(guī)律高度一致的組合式編碼系統(tǒng),將音碼、形碼和音形結(jié)合碼等不同類型的多種編碼組合成一個統(tǒng)一體,依靠碼元、鍵元及編碼方式的科學組合,在漢字鍵盤輸入時實現(xiàn)各類編碼的不切換混用,使它們各盡所能、優(yōu)勢互補用相對簡單、重碼率低的音形結(jié)合碼作為主要輸入方式,輸入認識的字和詞語,用音碼和形碼作為輔助輸入方式,前者用于輸入常用字(認識的字),后者可輸入全部漢字、但主要用于輸入不認識的字;使不同階層的使用者以及同一使用者在其接受語文基礎教育的不同階段均能用上與其語文知識水平相適應的編碼,而所有種類的編碼又都同屬于一個統(tǒng)一的編碼系統(tǒng),各編碼間的銜接具有與語文基礎教育同步的、循序漸進的基本特征。
本發(fā)明取名“三合一”,有兩層含意一是集音碼、形碼和音形結(jié)合碼等三種類型的多種編碼于一體;二是以一攬子解決大字符集/全漢字集的鍵盤輸入、漢語字典的直接翻頁檢字以及為電腦輔助識字奠定基礎三個問題為目的。
本發(fā)明采用如下技術方案
根據(jù)現(xiàn)行漢字教學內(nèi)容與要求,采用《漢語拼音方案》26個拼音字母、漢字的橫、豎、撇、點(捺)和折5種基本筆畫、《漢字統(tǒng)一部首表(草案)》201個部首以及常見的非部首單部件字(獨體字)作為碼元;
采用普通英文鍵盤的26個英文字母鍵作為鍵元;
將漢字的5種基本筆畫分配在6個英文字母鍵上,其中包括I、U、V三個非拼音首字母鍵以及A、E、O三個所含字數(shù)少的拼音首字母鍵;
將26個拼音字母與26個英文字母鍵一一對應,其中ü分配在v鍵上;
將所有成字部首和非部首成字部件(獨體字)按其拼音首字母分配在相應的英文字母鍵上;
將大部分非成字部首按其名稱中的關鍵字的拼音首字母分配鍵位;
將少量的非成字部首分配在指定鍵位;
將2個非成字部首(匚、凵)按“形托”方式分配鍵位;
按照后面詳細說明的編碼規(guī)則組成音形結(jié)合碼、形碼、筆畫碼和拼音碼,其中音形結(jié)合碼第一碼是拼音首字母,形碼和筆畫碼第一碼是筆畫,使音形結(jié)合碼與形碼及筆畫碼自然分開;筆畫碼各位碼均為筆畫,而形碼中絕大多數(shù)至少含有一個拼音首字母,使筆畫碼與形碼也自然分開;音形結(jié)合碼字碼的第三碼是筆畫,詞碼的第三碼是拼音首字母,使字碼與詞碼自然分開;
全部編碼組成一個統(tǒng)一的輸入系統(tǒng),其中音形結(jié)合碼為主要輸入方式,包括字碼和詞碼,用于輸入常用字和詞語,其它為輔助輸入方法,只包括字碼,形碼和筆畫碼可通用于大字符集直至全漢字集;各種輸入方式無須切換,隨機使用。
與現(xiàn)有技術相比,本發(fā)明利用碼元、鍵元和編碼方式的科學組合,實現(xiàn)了字碼空間和詞碼空間基本不交叉,常用字的編碼空間和非常用字的編碼空間也基本不交叉,解決了字碼與詞碼之間以及常用字與非常用字之間的沖突,在編碼層次具有三個優(yōu)點
(1)多種編碼的兼容性——含有音形結(jié)合碼、形碼、筆畫碼和拼音碼(全拼)等不同種類的編碼,且互不沖突,不經(jīng)切換即可隨機使用任意一種編碼;
(2)字符集的開放性——在編碼規(guī)則不作任何修改的前提下即可通用于國標基本集、CJK大字符集直至全漢字集,而且字符集的擴大對常用字的編碼及其快速輸入不產(chǎn)生任何影響;
(3)字、詞編碼的獨立性——音形結(jié)合碼為主要輸入方式,包括字碼和詞碼,二者的編碼思路一致,但又互不沖突,也不與其它各種字碼沖突,因此,無論詞庫如何擴大,都極少與字重碼,適合大詞庫編碼。
從使用角度來看,本發(fā)明具有下列優(yōu)點
(1)與語文基礎教育同步初學漢語拼音和漢字,即可使用拼音或筆畫碼輸入漢字;學習漢字部首后,可隨機地(無須切換)改用重碼率低的音形結(jié)合碼,并可輸入詞語,輸入效率隨之提高;這種提高屬于″無級變速″,也就是說,能夠確定部首的字和已經(jīng)知道的詞語,用音形結(jié)合碼輸入,尚未掌握部首的字,仍用拼音或筆畫輸入,掌握的部首和詞語越多,輸入效率越高;經(jīng)常使用三合一,對所學的語文基礎知識(指漢字部首、筆順、拼音和詞匯等)還可起到復習、鞏固和糾錯的作用。
(2)輕松入門,在使用中提高與國民教育背景相適應,完全采用規(guī)范的漢語拼音、筆畫、部首和成字部件為碼元,并主要根據(jù)拼音首字母來安排部件的鍵位,容易記憶;音形結(jié)合碼字碼和形碼第三碼都是只取字身首筆,大大降低了漢字拆分難度,實際上并不需要對漢字作嚴格拆分;非部首成字部件只用于末位碼,又全部對應拼音首字母鍵,因此不必特別記憶;三合一最難的地方,也就是確定漢字的部首(但這應該是語文基礎教育階段要學的內(nèi)容),而大部分字的部首一目了然,只有小部分字的部首不好確定;更重要的是,并不需要把所有字的部首、筆畫和部件都弄清、記住以后才能使用本發(fā)明,知道多少算多少,記住多少算多少,先用起來,在使用中提高,因為還有拼音和筆畫碼可供隨機使用,不會有打不出來的字;必要時可用萬能鍵,提示欄也可全程顯示字和詞的編碼,這樣就會越用越熟練。
(3)詞為主導,高速輸入可采用超大詞庫,又能保持低重碼率;采用以詞為主的輸入方式,輸入速度可滿足專業(yè)錄入員的使用要求。
(4)多種編碼優(yōu)勢互補,通用性好以低重碼率的音形結(jié)合碼為主要輸入方式,同時配備拼音、筆畫碼和形碼作為輔助輸入方式,各種編碼互不沖突,可不切換地隨機使用;音形結(jié)合碼用于輸入認識的字和詞語,音碼可用于輸入認識的、又尚未掌握其音形結(jié)合碼的漢字,筆畫碼和形碼通用于大漢字集直至全漢字集(6萬字以上),主要用于輸入不常用字(音形結(jié)合碼與形碼的唯一區(qū)別是前者第一碼用拼音首字母,后者第一碼用部首首筆,學會一種另一種自然就會);可方便地輸入常用符號;形碼還可用于字典檢索,實現(xiàn)直接翻頁檢字,鍵盤輸入與字典檢索方法統(tǒng)一。
本發(fā)明具有規(guī)范性、易學性、高效性和通用性。
具體實施例方式
下面進一步說明本發(fā)明的具體實施方式
。
將漢字的橫、豎、撇、點(捺)和折5種基本筆畫分配在6個英文字母鍵上,作為筆畫的輸入代碼,具體分配如下
A——與其它筆畫相交的橫(稱為交叉橫,如王字第二筆)
E——不與其它筆畫相交的橫(稱為非交橫,如王字首筆和末筆)
I——豎
O——撇
U——點(捺)
V——折(全部帶有轉(zhuǎn)折的筆畫,如小字第一筆、犭的第二筆等)
將201個漢字部首主要按照部首名稱的漢語拼音首字母分配在26個英文字母鍵上,作為部首的輸入代碼,具體分配如下
A——讠
B——匕宀勹疒卜(
)八(丷)比貝[貝]白髟鼻
C——廠(
)匚寸車[車]臣蟲赤辰齒[齒]長[長镸]
D——刀(刂)大歹(歺)斗[門]豆癶鼎
E——阝[阜邑]卩(
)兒耳而
F——口纟[糸]父風[風]方缶飛[飛]
非
G——亠干巛工廣弓戈甘瓜艮谷龜[龜]革骨鬼鬲高鼓
H——灬火戶禾虍(虎)黑黃
I——氵
J——廴丬[爿]钅幾(
)巾(
屮)己見[貝]斤臼角金韭
K——口
L——亻力龍[龍]立耒老(耂)鹵[鹵]里鹿隸
M——門[門]馬[馬]木毛目皿矛母米麥[麥]黽[黽]面麻
N——廾忄()女牛鳥[鳥]
O——
P——艸[艸]纟片疋(
)皮
Q——冫犭犬氣欠青齊[齊]
R——人(入)彳日(日
)肉
S——厶饣殳礻罒十士山尸水(氺)手()氏示石矢生舌色豕身食首鼠黍
T——冖冂(
)土田
U—— 凵扌
V——辶[辵]
W——無(
)攵(夂攴)兀(尢尣)王韋[韋]瓦文毋
X——彐(
)小()夕心穴西(
)血辛香
Y——聿(肀
)衤又弋幺月(
)牙玉業(yè)頁[貝]衣羊(
)羽酉言雨魚[魚]音龠
Z——子(孑)支止爪(爫)至竹自舟走足()豸隹
將按拼音首字母劃分的22組非部首成字部件分配在22個英文字母鍵上,作為非部首成字部件的輸入代碼,具體分配如下
A——凹
B——不幣巴辦本丙半必百秉
C——才川叉尺丑斥匆冊成產(chǎn)串垂承
D——丁刁丹東[柬]電氐丟
E——二
F——凡豐夫乏弗發(fā)甫
G——個丐更果
H——互乎亥
J——九及久孓井巨今戔甲夾柬兼
K——開
L——了令樂吏兩[兩]來良
M——末滅民
N——乃廿內(nèi)年農(nóng)
P——平
Q——七千且丘曲求
R——刃壬冉
S——三上勺卅少升氏書世四術申史失甩司戍束事肅[肅]甚
T——乇天太屯凸頭
W——萬丸亡衛(wèi)五勿烏[烏]為[為][爲]未戊我
X——下習鄉(xiāng)象
Y——一乙于丫義也尤夭尹予由央永亞[亞]夷曳亦嚴臾禺禹用
Z——孓丈之專中正乍主再朱兆州重
利用上述鍵盤的字、詞輸入方法如下(為敘述方便,將一個漢字去掉部首后的剩余部分稱為字身)
1.音形結(jié)合碼單字輸入
音形結(jié)合碼字碼的編碼字符集是GB2312-80基本集,為4位等長碼。
部首字拼音首字母、首筆、次筆、末筆
例如魚——YOVE
其它字拼音首字母、部首、字身首筆、字身末部件
例如字——ZBVZ(拼音首字母Z、部首“宀”,字身首筆折,字身末部件
也即字身本身“子”)
蟮——SCUK(拼音首字母S、部首“蟲”,字身首筆點,字身末部件
“口”)
整——ZAIZ(拼音首字母Z、部首非交橫、字身首筆豎、字身末部
件“正”)如果字身末部件屬于非部首非成字結(jié)構(gòu),則以部件末筆代替。例如聘——PEIV(字身末部件“
”用末筆折代替)為——WUOU(拼音首字母W、部首點、字身首筆撇、字身末部件也即字身本身
用末筆代替)
2.音形結(jié)合碼詞組輸入
音形結(jié)合碼詞碼為4位等長碼。
二字詞組依次鍵入二個字的前兩碼
例如蟮魚——SCYO(蟮、蟲、魚、丿)
三字詞組依次鍵入三個字的第一碼和末字的第二碼
例如科學家——KXJB(科、學、家、宀)
四及以上字詞組依次鍵入前三和末字的第一碼
例如漢語拼音——HYPY
3.形碼單字輸入
形碼只編字碼,不編詞碼。其字碼為4位等長碼,編碼字符集可根據(jù)需要擴大直至全漢字集。
部首字首筆、次筆、三筆、末筆
例如魚——OVIE
其它字部首首筆、部首、字身首筆、字身末部件(與音形結(jié)合碼的唯一
區(qū)別是用部首首筆代替漢字的拼音首字母)例如字——UBVZ(部首首筆點、部首“宀”、字身首筆折、字身末部件
即字身本身“子”)(對照音形結(jié)合碼ZBVZ)
蟮——ICUK(部首首筆豎、部首“蟲”、字身首筆點、字身末部件“口”)
瞰——IMVW(部首首筆豎、部首“目”、字身首筆折、字身末部件
“攵”)
夔——UBEW(部首首筆點、部首倒八字、字身首筆非交橫、字身末
部件“夂”)
如果字身末部件屬于非部首非成字結(jié)構(gòu),則以部件末筆代替。
例如降——VEOI(字身末部件
用部件末筆豎代替)
4.筆畫碼單字輸入
形碼只編字碼,不編詞碼。其字碼為4位等長碼,編碼字符集可根據(jù)需要擴大直至全漢字集。
首筆、次筆、三筆、末筆
例如歪——EOIE(首筆非交橫、次筆撇、三筆豎、末筆非交橫)
5.拼音碼單字輸入
拼音碼只編字碼,不編詞碼。其字碼為6位不等長碼,編碼字符集是GB2312-80基本集。
按漢語拼音方案依次鍵入漢字的拼音字母。
因為其它各種編碼均為4位等長碼,需要用軟件方式實現(xiàn)拼音碼的最長6位碼長如果鍵元組合為后面指定的22組編碼之一,自動將碼長延長至6位(不足6碼時加打空格鍵)。需要延長碼長的22組編碼列表如下
當然,拼音碼也可以采用簡化方式超過4個字母時只取前4個字母。
6.非漢字字符輸入
非漢字字符按照字符的漢語名稱取三碼加打空格鍵二字名稱依次取前字拼音首字母、后字拼音首字母和后字部首;三字名稱取各字的拼音首字母;超過三字則取前二和末字拼音首字母。
例如∴——SYR(所以)
ω——OMG(歐米伽)
∞——WQD(無窮大)
∮——HJF(環(huán)積分)
℃——SSD(攝氏度)
7.簡碼
字的一級簡碼取拼音首字母加空格鍵;字的二級簡碼按兩種方法組成,其一為拼音首字母加首筆加空格鍵,其二為首筆加拼音首字母加空格鍵;二字詞簡碼依次取兩個字的拼音首字母加空格鍵;三字詞簡碼依次取三個字的拼音首字母加空格鍵。
8.萬能鍵
無論使用何種輸入法,都可以用萬能鍵“?”來代替不能確定的碼。但第一碼不能用“?”鍵。舉例鱉--by?w(假如不知余部“敝”的首筆)
舉例--j?ll(假如不知“舉”字部首)
剛愎自用--g?zy (假如不知“愎”字的拼音首字母)
9.進一步的簡化方式
作為一個簡化的實施例,可以將只用于音形結(jié)合碼字碼末位碼和形碼末位碼的非部首成字部件全部用末筆代替。如此,“三合一”漢字輸入法的碼元就可以只包括拼音字母、部首和筆畫。雖然簡化方案的音形結(jié)合碼的字碼和形碼的重碼率會略有升高,但由于可以采用大詞庫(例如6萬條詞語以上)并保持低重碼,以及最常用字用簡碼輸入,輸入速度仍然可以保證專業(yè)錄入員的使用要求。
此外,由于部首尚沒有統(tǒng)一標準,當然可以在《漢字統(tǒng)一部首表(草案)》201個部首的基礎上作適當刪減,例如可以采用新華字典的189個部首。此類變化并不超出本發(fā)明的范圍。
附加說明
本發(fā)明與申請?zhí)?6109150.9的“漢字詞綜合編碼及鍵盤輸入法”的主要區(qū)別在于后者采用了30個鍵,其中包括4個非字母鍵,而本發(fā)明只采用26個英文字母鍵。由于全部采用字母鍵,本發(fā)明的通用性更好。但是,編碼鍵元減少也導致設計難度大幅度增加,尤其是減少的鍵元全部是非拼音首字母鍵,而非拼音首字母鍵在避免字碼與詞碼之間的沖突以及不同種類編碼之間的沖突方面具有決定性作用。因此,與申請?zhí)?6109150.9公布的方案相比,本發(fā)明具有新穎性和創(chuàng)造性。
權(quán)利要求
1.一種集音形結(jié)合碼、字形碼及拼音碼等多種編碼于一個輸入系統(tǒng)之中的計算機漢字輸入方法,其特征在于
將漢字的橫、豎、撇、點(捺)和折5種基本筆畫分配在普通英文鍵盤的6個字母鍵上,作為筆畫的輸入代碼,具體分配如下
A與其它筆畫相交的橫,E不與其它筆畫相交的橫,I豎,O撇,U點(捺),V折;
將《漢字統(tǒng)一部首表(草案)》中規(guī)定的201個漢字部首以成字部首按拼音首字母、大部分非成字部首按其名稱關鍵字的拼音首字母以及少數(shù)非成字部首指定鍵位的方法劃分成26組,分配在同一普通英文鍵盤的26個字母鍵上,作為部首的輸入代碼,具體分配如下
A讠,B匕宀勹疒卜(
)八(丷)比貝[貝]白髟鼻,C廠(
)匚寸車[車]臣蟲赤辰齒[齒]長[長镸]
D刀(刂)大歹(歺)斗[鬥]豆癶鼎,E阝[阜邑]卩(
)兒耳而,F(xiàn)口纟[糸]父風[風]方缶飛[飛]
非,G亠干巛工廣弓戈甘瓜艮谷龜[龜]革骨鬼鬲高鼓,H灬火戶禾(虎)黑黃,I氵,J廴丬[爿]钅幾(
)巾(
屮)己見[見]斤臼角金韭,K口,L亻力龍[龍]立耒老(耂鹵[鹵]里鹿隸,M門[門]馬[馬]木毛目皿矛母米麥[麥]黽[黽]面麻,N廾忄()女牛鳥[鳥],O,P艸[艸]彡片疋(
)皮,Q冫犭犬氣欠青齊[齊],R人(入)彳日(日
)肉,S厶饣殳礻罒十士山尸水(氺)手()氏示石矢生舌色豕身食首鼠黍,T冖冂(
)土田,U 凵扌,V辶[辵],W無(
)攵(夂攴)兀(尢尣)王韋[韋]瓦文毋,X彐(
)小()夕心穴西(
)血辛香,Y聿(肀
)衤又弋幺月(
)牙玉業(yè)頁[頁]衣羊(
)羽酉言雨魚[魚]音龠,Z子(孑)支止爪(爫)至竹自舟走足()豸隹;
將按拼音首字母劃分的22組非部首成字部件也分配在同一普通英文鍵盤的22個字母鍵上,作為非部首成字部件的輸入代碼,具體分配如下
A凹,B不幣巴辦本丙半必百秉,C才川叉尺丑斥匆冊成產(chǎn)串垂承,D丁刁丹東[柬]電氐丟,E二,F(xiàn)凡豐夫乏弗發(fā)甫,G個丐更果,H互乎亥,J九及久孓井巨今戔甲夾柬兼,K開,L了令樂吏兩[兩]來良,M末滅民,N乃廿內(nèi)年農(nóng),P平,Q七千且丘曲求,R刃壬冉,S三上勺卅少升氏書世四術申史失甩司戍束事肅[肅]甚,T乇天太屯凸頭,W萬丸亡衛(wèi)五勿烏[烏]為[為][爲]未戊我,X下習鄉(xiāng)象,Y一乙于丫義也尤天尹予由央永亞[亞]夷曳亦嚴臾禺禹用,Z孓丈之專中正乍主再朱兆州重;
將拼音字母也分配在同一普通英文鍵盤的英文字母鍵上,與英文字母一一對應,其中ü對應V鍵;
利用上述鍵盤的字、詞輸入方法如下
音形結(jié)合碼單字輸入
(1)部首字拼音首字母、首筆、次筆、末筆,
(2)其它字拼音首字母、部首、字身首筆、字身末部件;音形結(jié)合碼詞組輸入
(1)二字詞組依次鍵入二個字的前兩碼,
(2)三字詞組依次鍵入三個字的第一碼和末字的第二碼,
(3)四及以上字詞組依次鍵入前三和末字的第一碼形碼單字輸入
(1)部首字首筆、次筆、三筆、末筆;
(2)其它字部首首筆、部首、字身首筆、字身末部件;
筆畫碼單字輸入首筆、次筆、三筆、末筆;
拼音碼單字輸入按漢語拼音方案依次鍵入漢字的拼音字母;
非漢字字符輸入按照字符的漢語名稱取三碼加打空格鍵,其中二字名稱依次取前字拼音首字母、后字拼音首字母和后字部首;三字名稱取各字的拼音首字母;超過三字則取前二和末字拼音首字母。
2.根據(jù)權(quán)利要求1所述的漢字輸入法,其特征在于,所述的拼音碼中的CHAN、CHEN、CHON、CHUA、GUAN、HUAN、JIAN、JION、KUAN、LIAN、NIAN、QIAN、QION、SHAN、SHEN、SHUA、XIAN、XION、ZHAN、ZHEN、ZHON、ZHUA等22組編碼采用軟件方法將其碼長自動延長至最長6碼。
3.根據(jù)權(quán)利要求1所述的漢字輸入法,其特征在于,所述的拼音碼當碼長超過4位時只取前4碼。
4.根據(jù)權(quán)利要求1所述的漢字輸入法,其特征在于,所有非部首成字部件均可用字身末筆代替。
5.根據(jù)權(quán)利要求1所述的漢字輸入法,其特征在于,所述的音形結(jié)合碼字碼和形碼當末部件為非部首非成字結(jié)構(gòu)時,用部件末筆代替。
全文摘要
本發(fā)明公開了一種集音形結(jié)合碼、形碼、筆畫碼和拼音碼等多種編碼于一體的計算機漢字輸入方法。該輸入方法利用碼元、鍵元及編碼方式的科學組合,實現(xiàn)了多種編碼的不切換混合使用,使多種輸入方式各盡所能、優(yōu)勢互補用重碼率低的音形結(jié)合碼作為主要輸入方式,輸入認識的字和詞語,用漢語拼音和形碼作為輔助輸入方式,前者用于輸入常用字,后者可用于輸入全部漢字。該方案完全采用規(guī)范的漢語拼音、漢字筆畫、部首以及成字部件為碼元,26個英文字母鍵為鍵元,并主要根據(jù)拼音首字母來安排部件的鍵位,通用于國標基本集、CJK大字符集直至全漢字集,并適用于大詞庫。
文檔編號G06F3/023GK1467614SQ0312138
公開日2004年1月14日 申請日期2003年3月27日 優(yōu)先權(quán)日2003年3月27日
發(fā)明者劉春華 申請人:劉春華