專(zhuān)利名稱(chēng):一種計(jì)算機(jī)漢字?jǐn)?shù)字筆畫(huà)的輸入方法及鍵盤(pán)技術(shù)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種漢字輸入方法,特別是指一種計(jì)算機(jī)漢字?jǐn)?shù)字筆畫(huà)輸入方法及其鍵盤(pán)。
背景技術(shù):
廣泛使用的漢字輸入方法主要有拼音、拆字、筆畫(huà)三類(lèi),拼音法因?yàn)椴捎矛F(xiàn)成的漢語(yǔ)拼音作為編碼元素且因其與電腦建盤(pán)上的英文字母正好契合,以所謂的零記憶,不用專(zhuān)門(mén)學(xué)習(xí)的優(yōu)勢(shì)而擁有大量的使用者,但因其與字型不涉,故不在此細(xì)論;拆字(字根)法與筆畫(huà)(首尾)法的共同之處在于提高了編碼的聚合度,縮減了碼串的長(zhǎng)度,使打字的速度得以加快,但其識(shí)別度并沒(méi)有相應(yīng)提高,也因此無(wú)法解決重碼問(wèn)題,只能依靠區(qū)別碼、識(shí)別碼、 小碼、尾碼、加碼之類(lèi)的方式來(lái)提高識(shí)別度,使節(jié)約的擊鍵次數(shù)和時(shí)間又還了回去,無(wú)形中還增加了記憶負(fù)擔(dān),而且打字的過(guò)程中還要不斷地思考怎么拆?什么字根?在什么位置? 出字后待屏又是什么編號(hào)?用不用翻頁(yè)?等等,用這種方法打字,總讓人覺(jué)得不從識(shí)字階段的小學(xué)時(shí)期開(kāi)始,實(shí)難全面掌握,是它的先天缺陷;另外從規(guī)范角度講在用的字根表類(lèi)幾乎都存在不合規(guī)的問(wèn)題,國(guó)標(biāo)規(guī)范部件五百多個(gè),如果沒(méi)有自定規(guī)則實(shí)際上是沒(méi)有什么使用價(jià)值的;再則拆字(字根)法的前提是把漢字分成兩大塊,能拆則拆,不能拆的則用其它的方法處理,事實(shí)上它是用兩套方法在打字,必然是兩種思維方式,再加上拆與不拆的分辨,使打字變成了復(fù)雜的腦力活動(dòng),且思維繁雜,長(zhǎng)期堅(jiān)持使用尚可,若有間斷,則多半會(huì)遺忘,大都無(wú)法兼顧易學(xué)、高效、科學(xué)的矛盾。漢字由最早的象形符號(hào),在漫長(zhǎng)的歷史長(zhǎng)河中,經(jīng)過(guò)自然的淘磨和人為的改造,逐步演變成方方正正繁復(fù)龐雜的筆畫(huà)結(jié)構(gòu)體系,尤其是經(jīng)過(guò)簡(jiǎn)化后的漢字,無(wú)疑是以筆畫(huà)為基礎(chǔ),以筆畫(huà)結(jié)構(gòu)為主體的符號(hào)系統(tǒng),僅以構(gòu)字機(jī)理講,傳統(tǒng)的“六書(shū)”之理,難以全面覆蓋和解釋我們正在使用的文字,如果僵硬套用更是一種理解和記憶的負(fù)擔(dān)。為了對(duì)付這些符號(hào),準(zhǔn)確地說(shuō)是為了讓它們?cè)谛畔⒒瘯r(shí)代發(fā)揮更大的作用,人們又發(fā)明了一大堆新的符號(hào)和名詞,象什么部件、構(gòu)件、義件、基礎(chǔ)部件、字根、字素、字構(gòu)、字符、字塊、字架、子字等等, 各取所需,自成一體,自定規(guī)則。漢字太偉大了,偉大到伴隨人類(lèi)數(shù)千年,從簡(jiǎn)單的點(diǎn)、線(xiàn)到完美的體系,不敢想象沒(méi)有它我們會(huì)是一種什么狀態(tài);漢字太復(fù)雜了,復(fù)雜到我們無(wú)法用現(xiàn)代信息理論最簡(jiǎn)單的 0、1對(duì)它進(jìn)行表達(dá);漢字太零亂無(wú)序了,無(wú)序的難以找到任何的規(guī)律可循;幾十年的苦苦追尋,無(wú)數(shù)人的舍已鉆研,然而眾人期盼的局面并沒(méi)有出現(xiàn),我們?nèi)匀辉谧指砝锴笏鳎辉谄^去尾(首三尾一)中尋覓,代表國(guó)家在漢字信息化時(shí)代的特征與形象的所謂“國(guó)碼”至今仍不見(jiàn)蹤影,王碼稱(chēng)得上是“國(guó)碼”,事實(shí)上也具有“國(guó)碼”的地位,細(xì)究卻難達(dá)“國(guó)碼”的水平與高度,但有了上述的基礎(chǔ),使得我們已經(jīng)站在巨人的肩膀上面,卻拿不出與此相匹配的成果,這是一種無(wú)奈,也是一種說(shuō)不清顏色的幽默,在腦識(shí)別年代,我們把祖先留下的漢字奉為神靈,認(rèn)識(shí)它是一種榮耀,會(huì)使用它更是一種人身價(jià)值的提升,隨著機(jī)器識(shí)別時(shí)代的來(lái)臨,對(duì)這個(gè)神靈我們有了些許陌生并產(chǎn)生了些怨恨,怨恨中又潛藏著某些希冀,總好象是創(chuàng)造出這些眾多方形塊的先賢們?cè)诤臀覀冮_(kāi)著一個(gè)玩笑,千古不變?cè)缇痛嬖诘耐嫘?,似乎他們?cè)缇椭烙行畔⒒@么一檔子事,由他們創(chuàng)造出的這些個(gè)方塊塊,一定是要進(jìn)入到一個(gè)也是小方塊的叫作計(jì)算機(jī)的機(jī)器中,他們已經(jīng)為這一步留有契機(jī),但這是一個(gè)智慧的楔子, 它似有似無(wú),若隱若現(xiàn),讓無(wú)數(shù)后來(lái)人為之著迷,廢寢忘食,甚至舍命求之。一套好的編碼應(yīng)該具備的特征只有一個(gè),這就是簡(jiǎn)單,當(dāng)然這只針對(duì)漢字的計(jì)算機(jī)輸入而言,其實(shí)碼的本意就是詭異玄秘、不明就里、云里霧里,它就是只讓兩個(gè)人(或者兩方面)可以知其義,并且是無(wú)法接觸的兩個(gè)人(或兩方面),他們很可能是腳心對(duì)腳心在地球的兩頭站著,也可能是相面而立,任何第三人(或第三方)既是手握其中也無(wú)從知其函義的一種東西,所以才有破譯一說(shuō),而我們所說(shuō)的漢字編碼,則恰恰桿反,它是要讓所有人都知其義,不讓第三人知道的碼和讓所有人都知道的碼,有一個(gè)共同的特點(diǎn)就是一個(gè)字 “難”,雖然不一樣的目的,但相同的難度。有一個(gè)好的設(shè)計(jì)思想,找到一個(gè)好的實(shí)現(xiàn)路徑,采用一種簡(jiǎn)明的表達(dá)方式,是編出好碼的前提,這就是所謂的碼元最??;碼串最短;記量最少;規(guī)則最簡(jiǎn)。一碼多義是任何編碼的極忌,在漢字編碼中表現(xiàn)的就是一碼多字(重碼),解決不了重碼的方案不能說(shuō)是好方案,但好方案實(shí)在是太難以得到,這也是無(wú)數(shù)碼人(編碼者) 在進(jìn)行了無(wú)數(shù)次探索后,仍得不到滿(mǎn)意的結(jié)果而感嘆“無(wú)重碼是一個(gè)天大的誤區(qū)”,這是正論、是自嘲、還是無(wú)奈,誰(shuí)又說(shuō)的清?最直接的原因,就是我們對(duì)如何“把漢字弄進(jìn)機(jī)器”的方法研究的太透了,而對(duì)漢字本身我們卻太缺乏研究了,漢字的深?yuàn)W、神秘、玄異,決定了從本質(zhì)上剖折它的難度,不下一番深功夫是不會(huì)有收荻的。在計(jì)算機(jī)鍵盤(pán)( 個(gè)字母鍵)輸入的重碼問(wèn)題還沒(méi)有得到有效解決的情況下,然而技術(shù)進(jìn)步的速度卻絲毫沒(méi)有減慢,發(fā)達(dá)國(guó)家沒(méi)有給我們?nèi)魏螜C(jī)會(huì),鋪天蓋地的手持設(shè)備, 各式各樣的嵌入式設(shè)備,已經(jīng)掌握在云云眾生之手,這些設(shè)備的輸入鍵大多只是九個(gè)數(shù)字, 這無(wú)疑是漢字的無(wú)重碼輸入變的更加艱難和渺茫,雖經(jīng)多年探研,也出了不少好的方案和技術(shù),但均有一個(gè)共同的不足之處,就是要么規(guī)則繁復(fù),要么記憶量太大,總之不易掌握,難以普及,再則舊的方案移植在小鍵盤(pán)也有諸多障礙,致使幾億人不得不用外國(guó)人幫我們創(chuàng)造的輸入法,當(dāng)然這是需要大量的銀兩來(lái)買(mǎi)的。把大鍵盤(pán)上的方案簡(jiǎn)單改版到數(shù)字鍵上,實(shí)踐證明可行度不高,在用的“首三尾一”方案有先天缺陷而難以提高。而對(duì)于以筆劃為編碼元素的方案來(lái)說(shuō),從理論上講在9位小數(shù)字鍵盤(pán)上是有用武之地的。公認(rèn)的現(xiàn)實(shí)趨向是重編程輕編碼,編程和智能的確可以使“漢字進(jìn)入計(jì)算機(jī)”這一過(guò)程有了很多便捷之法,但說(shuō)到底這只是一種輔助之法,不能解決本質(zhì)問(wèn)題,好的輸入方案應(yīng)該在編碼設(shè)計(jì)階段就賜除掉與文字輸入本身無(wú)關(guān)的任何附贅,一種能夠在不同鍵位的鍵盤(pán)上,采用同一編碼方案的輸入方法亟待出現(xiàn),也就是人們渴望已久的漢字“通碼”,它所擔(dān)負(fù)的責(zé)任和意義不僅是“把漢字弄進(jìn)機(jī)器中”這樣簡(jiǎn)單的操作技術(shù)層面,而是關(guān)乎漢字字符集(字庫(kù))的編建,中文信息化,網(wǎng)絡(luò)傳輸?shù)鹊奶嵘?,在期盼已久的中文操作系統(tǒng)無(wú)法短期出殼的情況下,也只能寄望于編碼的提高來(lái)彌補(bǔ)之。
發(fā)明內(nèi)容
本發(fā)明的設(shè)計(jì)思想是一筆一畫(huà)寫(xiě)字,兩畫(huà)一碼打字,鍵盤(pán)作筆,屏幕如紙。本發(fā)明的實(shí)現(xiàn)路徑是讓每個(gè)漢字都有一個(gè)編碼;給每個(gè)漢字唯一一個(gè)編碼。
本發(fā)明的最終日的是中文輸入簡(jiǎn)單、規(guī)范、科學(xué)、高效、純符號(hào)化。1、本發(fā)明的理論支撐,如權(quán)利要求1、2所述,一種計(jì)算機(jī)漢字?jǐn)?shù)字筆劃輸入方法, 其特征在于本發(fā)明是建立在嚴(yán)謹(jǐn)?shù)臄?shù)字統(tǒng)計(jì)、嚴(yán)密的數(shù)據(jù)計(jì)算、嚴(yán)格的結(jié)構(gòu)分析基礎(chǔ)之上,選擇當(dāng)前正在使用的一萬(wàn)個(gè)漢字作為樣本和數(shù)據(jù)來(lái)源,對(duì)筆劃、筆劃結(jié)構(gòu)、筆劃相鄰、筆劃相交、筆劃重復(fù)、筆劃連接、筆劃位置、筆劃變異、筆劃演變等項(xiàng)進(jìn)行深入探討和精確的資料統(tǒng)計(jì),對(duì)筆劃進(jìn)行分析可以發(fā)現(xiàn)一些帶有普遍和規(guī)律性的現(xiàn)象即由筆劃組成漢字的過(guò)程,就是筆劃的相鄰、相交、重復(fù)、相連的不斷組合。在對(duì)采集的數(shù)據(jù)進(jìn)行綜合分析的基礎(chǔ)上,從以下幾個(gè)方面入手進(jìn)行研討筆劃的數(shù)量這本來(lái)是不成問(wèn)題的,國(guó)標(biāo)規(guī)范有明確的數(shù)字公布,但由于常用的輸入法中有說(shuō)5個(gè)的,有說(shuō)6個(gè)的,有說(shuō)8個(gè)的,總之是各取所需,不知究競(jìng),其實(shí)是采用模糊技術(shù),除了把折筆為一類(lèi),還把橫和提不分、點(diǎn)和捺不分、折和鉤不分,對(duì)折筆的歸類(lèi)方法也是各種各樣,容易引起混亂,這種做法的直接結(jié)果是編碼的識(shí)別度更差,使編碼質(zhì)量降低, 其實(shí)20個(gè)折筆劃和4個(gè)鉤筆劃,如果使用得當(dāng),對(duì)提高編碼的離散度是有益的,所以本發(fā)明采用規(guī)范的31個(gè)筆劃作為基本的編碼元素。相鄰度筆劃與其它筆劃在漢字中前后相隨出現(xiàn)的程度,即一筆劃可以與多少其余筆劃在組字時(shí)相鄰(相鄰度高的筆劃其編碼離散度也高,反之相鄰度低的筆劃編碼離散度也低)。相鄰率筆劃與另一筆劃相鄰后在漢字中出現(xiàn)的次數(shù)(相鄰率高的筆劃其編碼區(qū)別度低,反之則高)相交度筆劃與其它筆劃在漢字中相交的程度,即一筆劃可以與多少其余筆劃在組字時(shí)相交(相交度高的筆劃其編碼聚合度高,反之則低)。相交率筆劃與另一筆劃相交后在漢字中出現(xiàn)的次數(shù)(相交度高的筆劃其編碼區(qū)別度低,反之則高)。首筆率筆劃在漢字的第一筆出現(xiàn)的次數(shù)(首筆率高的筆劃編碼的碼位集中度高,反之分散度高)。次筆率筆劃在漢字的第二筆出現(xiàn)的次數(shù)(次筆率高的筆劃編碼的碼位集中度高,反之分散度高)。重復(fù)率筆畫(huà)在組字時(shí)連續(xù)出現(xiàn)在同一位置的幾率,雙重、三重、四重的都有,重復(fù)結(jié)構(gòu)對(duì)編碼十分不利,如果兩個(gè)字中出現(xiàn)相同的筆畫(huà)重復(fù)結(jié)構(gòu),會(huì)使碼串變的很長(zhǎng),如不采取措施,重碼不可避免,重復(fù)結(jié)構(gòu)在文字中出現(xiàn)的頻率還是很高的,好在重復(fù)的范圍不大, 僅有6個(gè)筆畫(huà)丨.j .、.人. < .(橫、豎、撇、點(diǎn)、撇折橫、撇折點(diǎn))有重復(fù)現(xiàn)象;還有一種重復(fù)現(xiàn)象也很普遍,就是筆畫(huà)結(jié)構(gòu)(部件)的重復(fù),它也是編碼的一個(gè)難題,也應(yīng)引起重視。相連不同的筆畫(huà)首尾相接形成閉環(huán),這種結(jié)構(gòu)很特殊,也很穩(wěn)定,漢字中大量出現(xiàn),其實(shí)就是一個(gè)完整的口字或者方框,利用好這個(gè)結(jié)構(gòu)可以給編碼帶來(lái)很大便利;相同的筆畫(huà)(撇與撇)首尾相連則以重復(fù)論之。由于電算能力不足,不得已先進(jìn)行手算,粗略的數(shù)字統(tǒng)計(jì)分析結(jié)果顯示撇筆畫(huà)的相鄰度高,橫筆畫(huà)的相鄰率高;橫筆畫(huà)的相交度和相交率都很高,撇筆畫(huà)次之;這對(duì)于如何解決碼離散問(wèn)題有重要的參考作用。在第一筆(首筆)出現(xiàn)的筆畫(huà)14個(gè),不足全部筆畫(huà)的一半,離散度不算高;第二筆 (次筆)出現(xiàn)的筆畫(huà)26個(gè),幾乎是全部筆畫(huà)都可以在第二筆中出現(xiàn),只有少數(shù)的三連折筆畫(huà)無(wú)法在第二筆出現(xiàn),有足夠高的離散度,我們知道,一字編碼的第一碼是決定該字在鍵盤(pán)的哪個(gè)鍵位上,也是決定某鍵位的容字?jǐn)?shù)量多少的關(guān)鍵,所以把出現(xiàn)筆畫(huà)較多的筆次作為編碼的首碼,就可以最大限度的離散碼位,使文字更均勻地分布在各個(gè)鍵位上,同時(shí)也可起到分散碼元素,從而增加識(shí)別度,提高編碼質(zhì)量。有了上述理論的支持,運(yùn)用在編碼中必定會(huì)有良效。2、本發(fā)明是一種計(jì)算機(jī)漢字?jǐn)?shù)字筆畫(huà)輸入方法及其鍵盤(pán)技術(shù),可以在各種不同鍵位的鍵盤(pán)上用同一編碼輸入漢字,如權(quán)利要求3所述其特征是,把漢字的筆畫(huà)分為四大類(lèi)。漢字是由筆畫(huà)組成的,這是漢字在幾千年的發(fā)展演變中唯一不變的事實(shí),本發(fā)明以漢字的筆畫(huà)為基礎(chǔ),以筆畫(huà)在組合成漢字時(shí)的狀態(tài)為依據(jù),把筆畫(huà)分為單、復(fù)、交、連四類(lèi),以這四類(lèi)不同狀態(tài)的筆畫(huà)作為編碼元素。單單獨(dú)存在于字中的筆畫(huà),如工、三、上、人等,這類(lèi)筆畫(huà)具有數(shù)量大、碼區(qū)別度高、識(shí)別性強(qiáng)的特點(diǎn),所有筆畫(huà)都可以獨(dú)立存在于字中。復(fù)組字時(shí)連續(xù)在同一位置出現(xiàn)的筆畫(huà),如須字中的撇、目字中的橫、學(xué)字中的點(diǎn)等,這類(lèi)筆畫(huà)表現(xiàn)為區(qū)別度低,是重碼的一個(gè)重要根源,如果相同結(jié)構(gòu)在不同的字中出現(xiàn), 會(huì)使碼串增長(zhǎng),識(shí)別度減弱,但可重復(fù)的筆畫(huà)數(shù)卻較少,僅有6個(gè)。除了筆畫(huà)的重復(fù),還有另外一些為數(shù)不少的筆畫(huà)結(jié)構(gòu)(部件)的重復(fù),如從、林、絲、呂等,這種結(jié)構(gòu)更使編碼的重碼率提高。交筆畫(huà)在組字時(shí)相互穿過(guò)對(duì)方,形成交叉點(diǎn),這類(lèi)筆畫(huà)可分為兩種情況,筆畫(huà)與筆畫(huà)相交為單交如上、又、土、干等;筆畫(huà)與多筆畫(huà)相交為連交如豐、拜、聿、甘、世等。交叉后的筆畫(huà),往往形成一個(gè)較穩(wěn)定的結(jié)構(gòu)體,它在字構(gòu)框架中,有強(qiáng)烈的支撐作用,且具有容易辨識(shí),不具歧義等優(yōu)勢(shì),把它作為一個(gè)整體進(jìn)行編碼,可以增強(qiáng)筆畫(huà)碼的聚合度,再者數(shù)量龐大,百分之八十的字中都有交叉存在,23個(gè)筆畫(huà)都可與別的筆畫(huà)發(fā)生交叉,這一點(diǎn)不可忽視。連筆畫(huà)在組字時(shí)首尾相連形成的閉環(huán),表現(xiàn)為大小不等的口字,口字結(jié)構(gòu)是漢字作為方塊字的最佳體現(xiàn)形式,也是字形顯示出端莊、穩(wěn)正,把它作為一個(gè)整體進(jìn)行編碼,是縮短碼串長(zhǎng)度的靈巧之法,且易識(shí)易辨,唯一性強(qiáng)。3、本發(fā)明是一種計(jì)算機(jī)漢字?jǐn)?shù)字筆畫(huà)輸入方法,如權(quán)利要求4所述,其特征是對(duì)四類(lèi)不同狀態(tài)的筆畫(huà)進(jìn)行編碼,給每個(gè)筆畫(huà)分別編制兩種碼,正碼和交碼。規(guī)則是正碼獨(dú)立存在筆畫(huà)的編碼;交碼即交重碼,筆畫(huà)交叉、重復(fù)時(shí)的編碼;單交依其筆順取一碼;連交的筆畫(huà)取交叉點(diǎn)(筆畫(huà)穿過(guò)其它筆畫(huà))多的筆畫(huà)一碼,交叉點(diǎn)相同依筆順,筆畫(huà)重復(fù)作為整體取一碼;重復(fù)的筆畫(huà)結(jié)構(gòu)(部件)作為整體取碼9 ;閉環(huán)結(jié)構(gòu)的口作為整體取碼9。因?yàn)殒I9位上的幾個(gè)筆畫(huà)都是無(wú)交叉筆畫(huà),增添兩個(gè)結(jié)構(gòu)碼以使各鍵位上的容字
量趨平。
8
4、一種計(jì)算機(jī)漢字?jǐn)?shù)字筆畫(huà)輸入方法,如權(quán)利要求5、6所述,其特征是把筆畫(huà)按照特定規(guī)律分配給不同的鍵,在9位數(shù)字鍵盤(pán)上每鍵三個(gè)筆畫(huà),其中均包含一個(gè)組字量大的、一個(gè)組字量小的、一個(gè)組字量居中的筆畫(huà),使得各鍵的字?jǐn)?shù)基本平衡;在立字母鍵上每鍵一個(gè)筆畫(huà),遵循人體工程學(xué)原理,把組字量大的筆畫(huà)放在鍵盤(pán)居中位置,把組字量小的筆畫(huà)放在鍵盤(pán)邊緣位置,以提高雙手的擊鍵速度和輸入效率,筆畫(huà)與數(shù)字鍵的對(duì)應(yīng)映射關(guān)系[正碼]筆畫(huà)(交碼)[1]- x J (5) [2] [ < |、(6) [3] J > ” (7)[4]J (8) [5] ),(1) [6] L ^L (2)[7] ζ L (3) [8]、乙勹[9] 3飛 3 ( 口)筆畫(huà)與字母鍵的對(duì)應(yīng)映像關(guān)系[正碼]筆畫(huà)(交碼)[q] x (t) [w] < (y) [e] > (U) [r] 7 ⑴[t] > (q) [y] n (w) [u] L (e) [i]乙(r) [ο]飛(口)[ρ] ” (ν)[a]-(g) [s] [ (h) [d] J (j) [f]、(k)[g] . (a) [h] L (s) [j] ζ (d) [k]、⑴[1] 3 ^ (疊)[ζ] j (b) [χ]、、(η) [c] ι (m) [ν] J (ρ)[b],(ζ) [η] L (χ) [m] (c)在48位中文鍵盤(pán)上只要依照鍵蓋上的筆畫(huà)標(biāo)注直接擊鍵即可完成輸入,與英文打字無(wú)異,真正實(shí)現(xiàn)了中文輸入英文化。漢字非常的無(wú)規(guī),甚至讓人感覺(jué)到“凌亂”,一畫(huà)可為一字,四十畫(huà)也是一字,其結(jié)構(gòu)上下左右多少無(wú)常,筆畫(huà)密者數(shù)上,疏者一二,要在這其中尋覓可循之規(guī)律,不下功夫是難有收益的;漢字的筆畫(huà)也然,有的筆畫(huà)百分之八十的字都需要,而有的筆畫(huà)僅與三五字有涉,更有甚者,有一個(gè)筆畫(huà)僅在一個(gè)字中出現(xiàn),實(shí)在讓人覺(jué)得無(wú)存在必要,所以把筆畫(huà)作為編碼依據(jù)同樣有難以平衡數(shù)量的問(wèn)題,本發(fā)明把一些組字度低的筆畫(huà)適當(dāng)歸并,筆畫(huà)id MU. KM, -m U^:取碼相同,與同形的筆畫(huà)同編一碼,由于涉及的字?jǐn)?shù)極少,對(duì)碼串質(zhì)量無(wú)任何影響。漢字的同構(gòu)現(xiàn)象非常普遍,相同的結(jié)構(gòu)在不同的字中出現(xiàn), 必然給編碼帶來(lái)不便,使重碼現(xiàn)象難以避免,我們只能深入挖握相同中的不同,發(fā)現(xiàn)弊中隱利,從而弊中取利。漢字的筆畫(huà)是異常智慧的產(chǎn)物,由它所構(gòu)成的漢字,更是一龐雜無(wú)序的符號(hào)系統(tǒng), 人們習(xí)慣把它們歸為一種的折筆畫(huà),不但有著二十多個(gè)的龐大數(shù)量,也是一個(gè)變化無(wú)常的筆畫(huà)群體,它們長(zhǎng)期被視為漢字編碼的累贅,實(shí)際上折筆在組碼時(shí)發(fā)揮的離散作用不可小覷。漢字的變化我們從兩方面可以說(shuō)明漢字的變化,一是漢字本身的變化,在長(zhǎng)期的演變過(guò)程中,由于各種原因,政治進(jìn)步、經(jīng)濟(jì)發(fā)展、軍事斗爭(zhēng)、文化教化等,使?jié)h字無(wú)論字形、 字義、字音都發(fā)生了巨大的變化,我們只能以國(guó)家規(guī)范的簡(jiǎn)化字為準(zhǔn);二是組成漢字的筆畫(huà)的變化,漢字中的筆畫(huà),在不同的字中往往表現(xiàn)為不同的形態(tài),有的是為了讓度位置,有的是為了平衡結(jié)構(gòu),有的是為了空間上的美觀(guān)協(xié)調(diào),一些筆畫(huà)必須做一些讓度與變化,這就產(chǎn)生了筆畫(huà)的變異,常見(jiàn)的有捺點(diǎn)互變、撇點(diǎn)互變、橫點(diǎn)互變、橫提互變、橫撇互變、撇捺互變等,還有不同字體間筆畫(huà)的變化象宋體與楷體的心字,其鉤筆就不同,這無(wú)形中給筆畫(huà)類(lèi)的編碼帶來(lái)麻煩,使編碼產(chǎn)生二義性,本發(fā)明在慎審統(tǒng)計(jì)分析后,采用實(shí)際存在的筆畫(huà)為依據(jù)編碼,即變?yōu)樯毒鸵郎稙閾?jù)編碼,這樣使編碼免生歧義,如小字的編碼為348而非848。5、一種計(jì)算機(jī)漢字?jǐn)?shù)字筆畫(huà)輸入方法及其鍵盤(pán),如權(quán)利要求7所述,其特征是第一碼是決定該碼串存放在哪個(gè)鍵位上的關(guān)鍵,依據(jù)詳細(xì)的數(shù)據(jù)統(tǒng)計(jì)結(jié)果,31個(gè)筆畫(huà)在一萬(wàn)字中第一筆出現(xiàn)的筆畫(huà)(首筆率)有14個(gè),不足百分之五十,而在第二筆出現(xiàn)的筆畫(huà)(次筆率)則多達(dá)沈個(gè),幾乎是筆畫(huà)的全部,僅有少數(shù)幾個(gè)三連折的筆畫(huà)無(wú)法在第二筆出現(xiàn),這就說(shuō)明,把第二筆的筆畫(huà)作為編碼的第一位,可以更好地提高碼離散性,降低優(yōu)質(zhì)碼位的空閑率,從而減少重碼。本發(fā)明采用了以國(guó)標(biāo)規(guī)范的筆順為序,進(jìn)行提取碼串,具體方法是偶數(shù)碼+奇數(shù)碼+余碼偶數(shù)碼整字編碼的第2、4、6、8碼;奇數(shù)碼整字編碼的第1、3、5、7碼;余碼重復(fù)的首筆碼與交叉結(jié)構(gòu)剩余筆畫(huà)的碼。統(tǒng)計(jì)數(shù)據(jù)表明,上述方式得到的碼串,不但提高了編碼的聚合度(減短碼長(zhǎng),減少擊鍵次數(shù)),同時(shí)也加強(qiáng)了編碼的區(qū)別度(增加了碼的離散性,拒絕了重碼現(xiàn)象),其最終效果是,對(duì)筆畫(huà)多的字,尤其是20畫(huà)以上的字,僅用其偶數(shù)碼就可以準(zhǔn)確地給予識(shí)別;對(duì)于筆畫(huà)少的字,8畫(huà)以下的字,加上奇數(shù)碼即可辨識(shí)大部分,少數(shù)字再續(xù)打余碼即可全部析出,真正做到了無(wú)重碼輸入,使中文輸入與英文輸入有相同的感受。從而使復(fù)雜難記的字,其編碼很簡(jiǎn)單;易記易認(rèn)的字,由于平時(shí)對(duì)其筆畫(huà)結(jié)構(gòu)就了熟于心,打滿(mǎn)全部筆畫(huà)也不覺(jué)困難,這就是偶奇式取碼方式的雙向趨益收獲,在碼串質(zhì)量提高的同時(shí),碼位利用率也相應(yīng)提高,在 9鍵位鍵盤(pán)上三碼碼位只有幾個(gè)空閑,四碼字4000多,最長(zhǎng)的六碼字只有800多個(gè),碼位閑置率相當(dāng)?shù)?,在大鍵盤(pán)上各項(xiàng)指標(biāo)更優(yōu),且消滅了重碼,讓人煩惱的拆、找、翻頁(yè)等累贅全部消遁,加之漢字的筆畫(huà)組合多數(shù)具有陰陽(yáng)相間、左右對(duì)稱(chēng)、上下呼應(yīng)的關(guān)系,操作時(shí)只要掌握了這些規(guī)律,偶數(shù)碼的提取就會(huì)很順手,有時(shí)比一筆一畫(huà)取碼還顯容易,且不易出錯(cuò),同時(shí)偶奇碼的學(xué)習(xí)功能也不可忽視,如能配合識(shí)字教學(xué),做到識(shí)字辨碼同步,相輔相成,加深記憶,必有奇效,一夕掌握,終生受益。
圖1是編碼表共有四項(xiàng)內(nèi)容1、鍵名一鍵即出的字,在9位數(shù)字鍵盤(pán)上是一 1億2乃3人4八5兒6己7乙8 口 9。在沈位字母鍵盤(pán)上是Hq 他w 火e 多r 和t 見(jiàn)y 山u 乙1 口 ο 與ρ一 a 你s 不d J^f 我g 中h 己j 家k 的1是ζ億χ乃c頂ν Ab兒η月m—鍵字中包含有三種類(lèi)型,一筆畫(huà)字、一鍵即出的字、部分高頻字。2、正碼筆畫(huà)獨(dú)立存在于字中的編碼。3、筆畫(huà)組成漢字的最小單位,表中把它們分為三個(gè)區(qū),用①②③表示,一區(qū)為組字量大的相關(guān)筆畫(huà),三區(qū)為組字量小的筆畫(huà);二區(qū)為組字量居中的筆畫(huà)。這種筆畫(huà)編排序列,是經(jīng)過(guò)無(wú)數(shù)次試驗(yàn)、數(shù)千次計(jì)算分析的結(jié)果,每個(gè)筆畫(huà)都逐一在所有位置上安排過(guò),最后綜合考慮最長(zhǎng)碼長(zhǎng)、碼位空置、高頻字優(yōu)先、重碼拒絕、等諸項(xiàng)平衡并反復(fù)比較優(yōu)化后的結(jié)果,因?yàn)樵谡w設(shè)計(jì)時(shí)有很多無(wú)法回避的多重矛盾,比如重碼與碼串長(zhǎng)度、高頻字前置與碼串長(zhǎng)度都存在著難以調(diào)合的沖突,它兼顧了筆畫(huà)組字規(guī)律和有利記憶等多方面的需求, 比如四個(gè)鉤筆畫(huà)不打散,集中放在鍵盤(pán)左下角,由于它們組字量不大,既便于記憶,又不影響輸入速度,常用(組字量大)筆畫(huà)則集中放在居中位置,擊鍵方便,大量的折筆畫(huà)也作了精心排布,盡量做到易記易操作,顯然它不是最佳的,但是可以說(shuō)是最合適的。4、交碼交重碼,筆畫(huà)交叉、重復(fù)后的編碼,和正碼一樣,其數(shù)值與數(shù)字鍵盤(pán)上的標(biāo)注相同。5、疊重疊的筆畫(huà)結(jié)構(gòu)(部件)的編碼。編碼表有一個(gè)顯著的特點(diǎn)就是具有柔性設(shè)計(jì)安排,可以在不同位數(shù)的鍵盤(pán)上使用,而不改變其值,在數(shù)字鍵盤(pán)上,每鍵位三個(gè)筆畫(huà);在字母鍵盤(pán)上,每鍵位一個(gè)筆畫(huà);在中文鍵盤(pán)上直接標(biāo)注筆畫(huà)。實(shí)施方式本發(fā)明力求讓中文輸入簡(jiǎn)單,如權(quán)利要求8、9所述,只要會(huì)寫(xiě)的字,記住了筆順, 僅此就可打字,與字形、字義、字音皆無(wú)任何關(guān)聯(lián),使打字變的簡(jiǎn)單、清爽,只與筆畫(huà)有關(guān), 出錯(cuò)機(jī)率降低到只有筆順一處,且極易糾正。另外還有關(guān)于筆順的歧義,其實(shí)大多與個(gè)人書(shū)寫(xiě)習(xí)慣有關(guān),真正有不同或者更高的見(jiàn)解,只能進(jìn)行理論上的探討或存疑,執(zhí)行層面應(yīng)該無(wú)異議,一切按國(guó)標(biāo)規(guī)范辦是本發(fā)明的依據(jù)。由于單字輸入的效率極高,且全過(guò)程實(shí)現(xiàn)了純符號(hào)化,不與音、形、義發(fā)生任何聯(lián)系,故本發(fā)明尤其適合工商、稅務(wù)、公安、統(tǒng)計(jì)、科研、醫(yī)療衛(wèi)生、識(shí)字教學(xué)、對(duì)外漢語(yǔ)教學(xué)等行業(yè)使用,并可嵌入各種手持設(shè)備、游戲設(shè)備、自動(dòng)控制設(shè)備以及各類(lèi)操作系統(tǒng)中。筆畫(huà)的編碼就是筆畫(huà)的計(jì)算機(jī)表示方式,是本發(fā)明的核心,通過(guò)各類(lèi)筆畫(huà)的編碼, 就可以把筆畫(huà)輸入到計(jì)算機(jī)中,并由它拼合成我們需要的漢字或詞語(yǔ)后顯示在屏幕上。1、單字的編碼和輸入將漢字的筆畫(huà)(含交、重后的筆畫(huà)結(jié)構(gòu)體),按照偶先奇后的原則,依書(shū)寫(xiě)順序排列,把筆畫(huà)替換為相應(yīng)的編碼(在手機(jī)鍵盤(pán)上為數(shù)字,在電腦鍵盤(pán)上為字母,在中文鍵盤(pán)上為與筆畫(huà)相同的符號(hào)),形成漢字的編碼,依筆順順序把它逐個(gè)輸入到計(jì)算機(jī),至需要的字出現(xiàn)為止,按確認(rèn)鍵即可得到相應(yīng)的漢字,例輸入“載”字,在9位數(shù)字鍵它的全碼是觀(guān)56,實(shí)際輸入觀(guān)5即可出載字;在沈位字母鍵盤(pán)上它的全碼是skgh,實(shí)際輸入skg即可出字;在48位中文鍵盤(pán)上直接擊相應(yīng)的符號(hào)鍵即可。部分漢字的在數(shù)字鍵上的編碼鐵5343 中 62 承 8344 髖 682585 己 7 齄 99126跟2353 再 3165 姓 3166 斬 72213 九 47 符;3592惕8978 注 7114 接 8818 愚 6686 緣 747 O 1111285 我 53 斜 45853 飯 4733 毀洸123 柬 8642、詞語(yǔ)與短句的輸入輸入第一字的編碼出字后不確認(rèn),繼續(xù)輸入第二字、第三字的編碼,依次類(lèi)推直至全詞或全句出完后按確認(rèn)即可,在這個(gè)過(guò)程中越往后需要輸入的碼數(shù)越少,節(jié)省擊鍵次數(shù), 提高輸入效率。
11
3、功能鍵在9鍵位鍵盤(pán)上,(0)鍵為確認(rèn)[回車(chē)]鍵;(*)鍵為刪除鍵;⑷鍵為空格鍵;在沈位和48位鍵盤(pán)上則不改變其功能鍵設(shè)置。4、記碼技巧在實(shí)際操作過(guò)程中,只要注意總結(jié),很容易發(fā)現(xiàn)一些帶有規(guī)律性的東西。(1)取右整字取右邊的筆畫(huà),如覺(jué)字的碼3366全部來(lái)自右半邊的筆畫(huà)取碼;部件取右邊的筆畫(huà),如俊字的碼觀(guān)883中三個(gè)8全部來(lái)自部件的右半邊;取左取左多數(shù)是部件取左,如峻字的碼7633中的633都來(lái)自部件的左半邊;還有許多取左下、取右上的大量字例使用者自己可以總結(jié)挖握。(2)常用部首的編碼部首在漢字中既大量出現(xiàn)、又相對(duì)穩(wěn)定,記住了它們的編碼將會(huì)給你帶來(lái)極大便利,如木3耳25王5 口 9車(chē)2革16鹿(在上)1213鹿(在左)1211 鼻9912魚(yú)45馬8女6月7日1舟58骨6825身25等。一些字在作為部首時(shí)與單獨(dú)為字時(shí)的筆畫(huà)發(fā)生了變化如求8385和救823、豕 73114和逐72511、禾54和秒583、木35和材35583等這種現(xiàn)象普遍存在,應(yīng)當(dāng)引起注意。(3)特殊結(jié)構(gòu)的編碼一些特殊的筆畫(huà)結(jié)構(gòu),同時(shí)也是本發(fā)明的重點(diǎn)之處,熟悉了它們的編碼,對(duì)整個(gè)編碼體系就能運(yùn)用自如,戈字結(jié)構(gòu),這個(gè)結(jié)構(gòu)的特點(diǎn)在于第一筆很早就出現(xiàn),往往在字的前三畫(huà),而后兩筆卻出現(xiàn)的很晚,往往在字的最后,本身它也比較穩(wěn)定,在多種組合方式的字中都有出現(xiàn),對(duì)于具備這種特性的一類(lèi)結(jié)構(gòu)來(lái)說(shuō),只要牢記其編碼只與筆畫(huà)有關(guān),只與筆畫(huà)的單、復(fù)、交的形態(tài)有關(guān),不要在拆字的思維里考慮打轉(zhuǎn)就行,它的編碼就是交叉點(diǎn)多的筆畫(huà)斜鉤的編碼 6,排序也是斜鉤的筆順順序,戔和戈結(jié)構(gòu)相似,而弋字結(jié)構(gòu)則不同,是單交叉其編碼是依筆順先后為序即5,一定要注意區(qū)別。束字結(jié)構(gòu),相似的字型還有串字、棗字的上部、制字的左部、刺字的左部、來(lái)字等, 長(zhǎng)豎的筆順在后而不是第一筆,口字交叉后已經(jīng)不完整,不能再用口來(lái)編碼,它們的編碼分別是束 642、串 226、棗 6423、制 2236、刺 68423、來(lái) 3386。未字結(jié)構(gòu),相似的字型還有本字、末字、耕字等,中間長(zhǎng)豎筆順在前,編碼為未 3645、本 364、末 36455、耕 356。里字結(jié)構(gòu),相似字型禺字等,中間長(zhǎng)豎穿過(guò)三橫成一個(gè)多交結(jié)構(gòu),編碼為里612、禺 6682。黑字結(jié)構(gòu),相似字型熏字、柬字等,字中心的點(diǎn)和撇筆順在長(zhǎng)豎之前,編碼為黑 6312、熏 231386、柬 864。冉字結(jié)構(gòu),相似字型再字、禹字等,連交的交叉點(diǎn)相同時(shí),就以交叉點(diǎn)相同筆畫(huà)的筆順先后取碼,編碼為冉3656、再3165、禹沈832。母字結(jié)構(gòu),相似字型毋字、份字、貫字等,這種結(jié)構(gòu)筆順比較難辨,連交以交叉點(diǎn)數(shù)為序取碼,編碼為母8383、毋3537、Π} 5326、貫23568。丹字結(jié)構(gòu),相似字型舟字,交叉使三個(gè)筆畫(huà)變?yōu)橐淮a,編碼為丹8573、舟5838。聿字結(jié)構(gòu),相似字型隸字、肅字、康字、庸字、尹字、事字等,特征是一畫(huà)穿過(guò)多筆畫(huà),最多達(dá)6畫(huà),編碼為聿6255、隸83874、肅33628、康1874、庸1沘336、尹5725、事822。曲字結(jié)構(gòu),相似字型典字、鹿字、西字、酉字等,取交叉點(diǎn)多的筆畫(huà)的碼,編碼為曲221、鹿 12138、西 2112、酉 25121。兼字結(jié)構(gòu),相關(guān)字型謙字等,注意辨別交叉點(diǎn),編碼為兼3248、謙53M。黹字結(jié)構(gòu),相關(guān)字型敝字等,復(fù)雜字型的筆順記憶,編碼為黹8133、敝33818?;プ纸Y(jié)構(gòu),相關(guān)字型彖字、篆字、緣字、發(fā)字等,注意辨別基本筆畫(huà),編碼為互611、 彖 4736、篆 6114、緣 747、發(fā) 828。鏈字結(jié)構(gòu),相似字型隨字、御字、髓字等,左中右結(jié)構(gòu)的字筆順不能顛倒,編碼為鏈 5253、隨 2255、御 21177、髓 682511。另外一些筆順易混的字如萬(wàn)字的筆順是橫、折、撇,而不是橫、撇、折,快字中豎心的筆順是點(diǎn)、點(diǎn)、豎,而不是點(diǎn)、豎、點(diǎn)等。(4)重復(fù)的編碼重復(fù)是一個(gè)復(fù)雜的筆畫(huà)結(jié)合過(guò)程,盡管它涉及的筆畫(huà)數(shù)量很少, 但是它的組字?jǐn)?shù)量卻不少,組合形式也是變化無(wú)常,各式各樣,比如須字的撇筆,我們認(rèn)定它為重復(fù)是順理成章的,也很清楚明了,易辨易識(shí);而原字的撇筆,如果說(shuō)它是重復(fù)就有些別扭,也不易識(shí)別,這就給我們界定重復(fù)增加了些許難度,也就是說(shuō)我們所說(shuō)的重復(fù),不是無(wú)條件的重復(fù),而是有條件限制的重復(fù),這個(gè)限制條件就是在同一位置連續(xù)出現(xiàn)的筆畫(huà)。 也就是說(shuō)連續(xù)但不同位的不能認(rèn)定為重復(fù),比如直字的四橫、順字的兩豎、亥字的兩撇、圖字的兩點(diǎn)等,都應(yīng)該是我們所要求的重復(fù);而瘦字的兩撇、家字的頭兩點(diǎn)、快字豎心的兩點(diǎn)、 止字、非字的兩豎、底字、府字的兩撇等則不宜認(rèn)定為重復(fù);只有這樣,才能做到簡(jiǎn)捷、便認(rèn)、 高效,重復(fù)還從來(lái)沒(méi)有被用來(lái)作為筆畫(huà)分類(lèi)的依據(jù),本發(fā)明獨(dú)創(chuàng)并第一次在漢字編碼時(shí)使用,試用效果是顯著的,希望得到認(rèn)可。(5)筆畫(huà)的三重經(jīng)常可以看到三重甚至四重的筆畫(huà)如辰、乍、肆字中的三橫四橫;豕、勿字的三撇;心、雨字中的三點(diǎn)四點(diǎn)等,它們的一個(gè)共同特征就是整齊、同位、易辨, 都是所在字的主要組成部分,如果把它們?cè)俜珠_(kāi)反而顯得有些麻煩,然而它們的筆順卻不連貫,對(duì)于這種三重、四重的筆畫(huà)組合,只要位置相同,我們就認(rèn)定它為一個(gè)重復(fù),這樣更有利于編碼的易辨性,也對(duì)整體壓縮碼長(zhǎng)有益。技術(shù)擴(kuò)展經(jīng)過(guò)分析不難看出,上述所謂的數(shù)字筆畫(huà),只不過(guò)是表面的、簡(jiǎn)單的,甚至可以說(shuō)是“偽數(shù)字化”的,它只能解決表層顯示問(wèn)題,并不是真正的漢字?jǐn)?shù)字化,不能解決本質(zhì)問(wèn)題,但它可以說(shuō)是一個(gè)開(kāi)端,要想實(shí)現(xiàn)從機(jī)內(nèi)碼存儲(chǔ)開(kāi)始,到模型計(jì)算,到機(jī)外顯示,需要做大量的理論突破,首先要做的就是筆畫(huà)數(shù)字化,不是用一個(gè)阿拉伯?dāng)?shù)字代表筆畫(huà),如權(quán)利要求10所述,其特征是要用計(jì)算機(jī)的二進(jìn)制數(shù)字1和0來(lái)表術(shù)筆畫(huà),建立相應(yīng)的數(shù)學(xué)表達(dá)式, 為數(shù)字化漢字打下一個(gè)好的基礎(chǔ)。用五位二進(jìn)制數(shù)字的0和1來(lái)表述筆畫(huà)00000- 00001 丨 00010 j 00100、01000 χ 10000 L 11000 ^01100、00110 ^ 00011 ^00101 <01001 10001 ” 10010 > 10100 π 11100 L01110 乙 00111 Λ 01011 j10011 、 10101 1 11001 J 11010 y 10110 L11110 11101 11011 ι 10111 L 01111 勹11111、11010 '、|
用四位二進(jìn)制數(shù)字的0和1來(lái)表述筆畫(huà)在字中的具體位置0000 左 0001 中 0010 右 0100 上 1000 下 1010 左上 0101 左中1100左下0011右上1001右中0110右下1110上中0111下中用三位二進(jìn)制數(shù)字的0和1來(lái)表述筆畫(huà)在字中的狀態(tài)000單 001交 010 二交 100三交 111四交 110重101三重 011四重用一位二進(jìn)制數(shù)字的0和1來(lái)表述筆畫(huà)的形狀0 短1 長(zhǎng)這樣我們就可以用二進(jìn)制字符準(zhǔn)確表術(shù)漢字中的每一個(gè)筆畫(huà),從而得出漢字的數(shù)字化表達(dá)式,比如0000000010001這個(gè)字符串所表達(dá)的內(nèi)容是在正中間單獨(dú)的一長(zhǎng)橫;0001010100010這個(gè)字符串所表達(dá)的內(nèi)容是在左上角的一個(gè)單交叉的短撇;這樣我們用一個(gè)十三位的二進(jìn)制0和1的字符串,就可以完整地表達(dá)筆畫(huà)在字中的全部信息,通過(guò)對(duì)漢字每一個(gè)筆畫(huà)的詳細(xì)描術(shù),并嵌入到芯片中,再經(jīng)過(guò)簡(jiǎn)單機(jī)內(nèi)計(jì)算, 就可得出我們所需要的字來(lái),理想的中文數(shù)字化才能實(shí)現(xiàn),漢字輸入(把漢字弄到計(jì)算機(jī)內(nèi))才能徹底擺脫那一大堆繁復(fù)龐雜的累贅,象輸入英文一樣打漢字,最終實(shí)現(xiàn)漢字的無(wú)編碼輸入,人(字)機(jī)無(wú)障礙直接交流。
權(quán)利要求
1.一種計(jì)算機(jī)漢字?jǐn)?shù)字筆畫(huà)輸入方法,其特征在于用一套編碼在不同鍵位的鍵盤(pán)上輸入漢字。
2.如權(quán)利要求1所述的一種計(jì)算機(jī)漢字?jǐn)?shù)字筆畫(huà)輸入方法,其特征在于以漢字的筆畫(huà)作為基本輸入單元和編碼元素。對(duì)筆畫(huà)進(jìn)行分析可以發(fā)現(xiàn)一些帶有普遍和規(guī)律性的現(xiàn)象即由筆畫(huà)組成漢字的過(guò)程,就是筆畫(huà)的相鄰、相交、重復(fù)、相連的不斷變化與組合。相鄰度筆畫(huà)與其它筆畫(huà)在漢字中前后相隨出現(xiàn)的程度,即一筆畫(huà)可以與多少其余筆畫(huà)在組字時(shí)相鄰(相鄰度高的筆畫(huà)其編碼離散度也高,反之相鄰度低的筆畫(huà)編碼離散度也低)。相鄰率筆畫(huà)與另一筆畫(huà)相鄰后在漢字中出現(xiàn)的次數(shù)(相鄰率高的筆畫(huà)其編碼區(qū)別度低,反之則高)相交度筆畫(huà)與其它筆畫(huà)在漢字中相交的程度,即一筆畫(huà)可以與多少其余筆畫(huà)在組字時(shí)相交(相交度高的筆畫(huà)其編碼聚合度高,反之則低)。相交率筆畫(huà)與另一筆畫(huà)相交后在漢字中出現(xiàn)的次數(shù)(相交度高的筆畫(huà)其編碼區(qū)別度低,反之則高)。首筆率筆畫(huà)在漢字的第一筆出現(xiàn)的次數(shù)(首筆率高的筆畫(huà)編碼的碼位集中度高,反之分散度)。次筆率筆畫(huà)在漢字的第二筆出現(xiàn)的次數(shù)(次筆率高的筆畫(huà)編碼的碼位集中度高,反之分散度高)。重復(fù)率筆畫(huà)在組字時(shí)連續(xù)出現(xiàn)在同一位置的幾率,雙重、三重、四重的都有, 如果兩個(gè)字中出現(xiàn)相同的筆畫(huà)重復(fù)結(jié)構(gòu),會(huì)使碼串變的很長(zhǎng),如不采取措施,重碼不可避免,重復(fù)結(jié)構(gòu)在文字中現(xiàn)的頻率還是很高的,好在重復(fù)的范圍不大,僅有6個(gè)筆畫(huà)丨.).、.< .(橫、豎、撇、點(diǎn)、撇折橫、撇折點(diǎn))有重復(fù)現(xiàn)象;還有一種重復(fù)現(xiàn)象也很普遍,就是筆畫(huà)結(jié)構(gòu)(部件)的重復(fù),它也是編碼的一個(gè)難題。
3.如權(quán)利要求1所述的一種計(jì)算機(jī)漢字?jǐn)?shù)字筆畫(huà)輸入方法,其特征在于根據(jù)筆畫(huà)在組字時(shí)不同狀態(tài),把筆畫(huà)分為單、復(fù)、交、連四種類(lèi)形,單…獨(dú)立存在于漢字中的筆畫(huà);復(fù)…連續(xù)在同一位置出現(xiàn)的筆畫(huà)和筆畫(huà)結(jié)構(gòu)(部件);交…筆畫(huà)與筆畫(huà)相互交叉,依交叉點(diǎn)(筆畫(huà)穿過(guò)其它筆畫(huà))數(shù)量的不同把交叉分為兩種,筆畫(huà)相交為單交、筆畫(huà)與多筆畫(huà)相交為連交;連…筆畫(huà)首尾相連接形成閉環(huán),表現(xiàn)為漢字的口(含各式各樣大小不同的完整的口和框)。
4.如權(quán)利要求3所述的一種計(jì)算機(jī)漢字?jǐn)?shù)字筆畫(huà)輸入方法,其特征在于依據(jù)筆畫(huà)在組字時(shí)的不同狀態(tài)給筆畫(huà)分別編出[正碼]和[交碼],形成一套在各種鍵位的鍵盤(pán)上都能使用的通用編碼,逐步實(shí)現(xiàn)中文信息傳輸?shù)耐ùa,這是一種不改變漢字的組字結(jié)構(gòu)和完整性,以筆畫(huà)在整字中的自然狀態(tài)為依據(jù)的編碼方式,可以在不增加任何思維和記憶負(fù)擔(dān)的前提下,實(shí)現(xiàn)對(duì)漢字無(wú)歧義的精確編碼,并且在最短的碼位上達(dá)到最強(qiáng)的識(shí)別度,真正做到使?jié)h字無(wú)重碼輸入。規(guī)則是正碼…筆畫(huà)單獨(dú)存在時(shí)的編碼;交碼…交重碼,筆畫(huà)交叉、重復(fù)后的編碼,單交時(shí)取筆順在前的筆畫(huà)一碼;連交時(shí)取交叉點(diǎn)(筆畫(huà)穿過(guò)其它筆畫(huà)數(shù))多的筆畫(huà)一碼(交叉點(diǎn)相同時(shí)依筆順);重復(fù)的筆畫(huà)作為整體取一碼;口…作為整體取碼9 ;重疊的筆畫(huà)結(jié)構(gòu)(部件)…作為整體取碼9。
5.一種漢字輸入方法,把漢字的筆畫(huà)按特定規(guī)律分配在不不同的鍵位上。
6.如權(quán)利要求5所述的一種計(jì)算機(jī)漢字輸入方法,其特征在于在不同的鍵盤(pán)上把筆畫(huà)有規(guī)律的進(jìn)行分配,其映射安排以[正碼]筆畫(huà)(交碼)的形式列舉(1)筆畫(huà)在9位鍵盤(pán)(手機(jī))上的分布 [11--L J (5) [2] [ (6) [3] J 廣(7) [4]"、7 J (8) [5] χ ^ (1) [6] Z^ L (2) [7] ζ L (3) [8]、乙勹(4) [9] 3飛3 ( 口)(2)筆畫(huà)在沈位鍵盤(pán)(電腦)上的分布[q] χ (t) [w] < (y) [e] > (u) [r] 7 ⑴ 7[t] > (q) [ν] ι (w) [u] L (e) [i]乙(r) [ο]飛(口)[ρ]勹(ν)[a]-(g)[s] [ (h) [d] J (j) [f] .、(k)[g] τ (a) [h] L (s) [j] ζ (d) [k]、(f) [1] V)(疊) [ζ] j (b) [χ] 1、(η) [c] ι (m) [ν] J (ρ)[b]y (ζ) [η] L (x) [m] (c)(3)筆畫(huà)在48位鍵盤(pán)(中文鍵盤(pán))的鍵蓋上有顯示,只要按照標(biāo)識(shí)直接擊鍵即可,與英文輸入相同,完全實(shí)現(xiàn)了中文輸入的簡(jiǎn)單、輕松、自然。
7.如權(quán)利要求4、6所述的一種計(jì)算機(jī)漢字?jǐn)?shù)字筆畫(huà)輸入方法,其特征在于 依據(jù)編碼規(guī)則和筆畫(huà)鍵位分布,其取碼方法是按照偶數(shù)碼+奇數(shù)碼+余碼的順序提取漢字的編碼(單字編碼最長(zhǎng)6碼,一碼字即[鍵名字]9個(gè),在沈位字母鍵盤(pán)上為沈個(gè),分別取自一筆畫(huà)字、一碼即出的字和少量高頻字)。 偶數(shù)碼…漢字整字的第2、4、6、8…碼; 奇數(shù)碼…漢字整字的第1、3、5、7…碼;余碼…重疊的筆畫(huà)結(jié)構(gòu)(部件)的首碼和交、重結(jié)構(gòu)剩余筆畫(huà)的碼。 這種“偶”先“奇”后的取碼方式,可以最大限度的提高碼串質(zhì)量,在提高了編碼的聚合度(減短碼長(zhǎng),減少擊鍵次數(shù))的同時(shí),也強(qiáng)化了編碼的區(qū)別度(增加碼的離散性,消滅了重碼)其最終效果是對(duì)筆畫(huà)多的字(20畫(huà)以上)僅用其偶數(shù)碼就可以準(zhǔn)確地加以識(shí)別;對(duì)筆畫(huà)少的字(8畫(huà)以下)再續(xù)打奇數(shù)碼即可辯識(shí)絕大部分;少數(shù)不能析出的字,加打余碼后即可全部識(shí)別,直接感覺(jué)是復(fù)雜難記的字其編碼變的很簡(jiǎn)單,易記易認(rèn)的字因平時(shí)對(duì)其筆畫(huà)結(jié)構(gòu)就了熟于心,打滿(mǎn)全部筆畫(huà)也不覺(jué)困難,這就是偶奇碼的雙向趨益功能。
8.打字以漢字書(shū)寫(xiě)筆順為序,按“偶”先“奇”后原則依次輸入漢字的編碼,所需的字出現(xiàn)時(shí)按確認(rèn)鍵即可,輸入詞組或短句時(shí)在第一字出現(xiàn)時(shí),不按確認(rèn)鍵,繼續(xù)輸入第二、 三……字的碼,后面的字不需輸完全碼即可見(jiàn)字,且越靠后所需的碼越少,減少擊鍵次數(shù), 節(jié)約時(shí)間。例輸入“載”字,在9鍵位的鍵盤(pán)上它的全碼是觀(guān)56,實(shí)際輸入觀(guān)5即出字,在沈位鍵盤(pán)上它的全碼是skgn,實(shí)際輸入skg即出字, 在48位中文鍵盤(pán)上直接擊該筆畫(huà)的鍵即可出字。不同結(jié)構(gòu)漢字的編碼如鐵 5343 中 62 承 8344 髖 682585 己 7 齄 99126 跟 2353 再 3165 姓 3166 斬 72213 九 47 符;3592 惕 8978 注 7114 接 8818 愚 6686 緣 747 O 1111 ii 285 我 53 斜 45853 飯 4733 毀洸123 柬 864
9.功能鍵在9鍵位鍵盤(pán)上,(0)鍵為確認(rèn)[回車(chē)]鍵;(*)鍵為刪除鍵;(#)鍵為空格鍵;在沈位和48位鍵盤(pán)上則不改變其功能鍵設(shè)置。
10.技術(shù)擴(kuò)展經(jīng)過(guò)分析不難看出,上述所謂的數(shù)字筆畫(huà),只不過(guò)是表面的、簡(jiǎn)單的,甚至可以說(shuō)是“偽數(shù)字化”的,它只能解決表層顯示問(wèn)題,并不是真正的漢字?jǐn)?shù)字化,不能解決本質(zhì)問(wèn)題,但它可以說(shuō)是一個(gè)開(kāi)端,要想實(shí)現(xiàn)從機(jī)內(nèi)碼存儲(chǔ)開(kāi)始,到模型計(jì)算,到機(jī)外顯示, 需要做大量的理論突破,首先要做的就是筆畫(huà)數(shù)字化,不是用一個(gè)阿拉伯?dāng)?shù)字代表筆畫(huà),而是要用計(jì)算機(jī)的二進(jìn)制數(shù)字1和0來(lái)表術(shù)筆畫(huà),建立相應(yīng)的數(shù)學(xué)表達(dá)式,為數(shù)字化漢字打下一個(gè)好的基礎(chǔ)。用五位二進(jìn)制數(shù)字的0和1來(lái)表術(shù)漢字的筆畫(huà) 00000- 00001 丨 00010 j 00100 V OlOOOx 10000 L 11000 ,01100、 00110 ^ 00011 x00101 < 01001〉10001 7 IOOlOO IOlOOn IIIOOl 01110 乙 00111 飛 01011 ] 10011、10101 1 11001 j 11010 10110 L 11110 11101 彳 110111 10111 L 01111 勹 11111、11010 H 用四位二進(jìn)制數(shù)字的0和1來(lái)表術(shù)筆畫(huà)在漢字中的位置 0000 左 0001 中 0010 右 0100 上 1000 下 1100左下0011右上 1001右中 0110右下1110上中用三位二進(jìn)制數(shù)字的0和1來(lái)表述筆畫(huà)在字中的狀態(tài) 000單 001交 010 二交 100三交 111四交 110重用一位二進(jìn)制數(shù)字的0和1來(lái)表述筆畫(huà)的形狀 0短 1長(zhǎng)這樣我們就可以用二進(jìn)制字符準(zhǔn)確表術(shù)漢字中的每一個(gè)筆畫(huà),從而得出漢字的數(shù)字化表達(dá)式,比如0000000010001這個(gè)字符串所表達(dá)的內(nèi)容是在正中間單獨(dú)的一長(zhǎng)橫; 0001010100010這個(gè)字符串所表達(dá)的內(nèi)容是在左上角的一個(gè)單交叉的短撇; 通過(guò)對(duì)漢字每一個(gè)筆畫(huà)的詳細(xì)描術(shù),并嵌入到芯片中,再經(jīng)過(guò)簡(jiǎn)單機(jī)內(nèi)計(jì)算,就可得出我們所需要的字來(lái),理想的中文數(shù)字化才能實(shí)現(xiàn),漢字輸入(把漢字弄到計(jì)算機(jī)內(nèi))才能徹底擺脫那一大堆繁復(fù)龐雜的累贅,象輸入英文一樣打漢字,最終實(shí)現(xiàn)漢字無(wú)編碼輸入,人 (字)機(jī)無(wú)障礙直接交流。
全文摘要
本發(fā)明公布一種計(jì)算機(jī)數(shù)字筆畫(huà)的輸入方法及鍵盤(pán)技術(shù),屬于漢字信息技術(shù)領(lǐng)域,以組成漢字的筆畫(huà)為編碼元素,依筆畫(huà)在漢字中的不同狀態(tài),把筆畫(huà)分為單、復(fù)、交、連四類(lèi),給每個(gè)筆畫(huà)分別編正碼和交碼,并循特定規(guī)律把筆畫(huà)分配于鍵位上,按國(guó)標(biāo)規(guī)范的筆順順序,以偶先奇后的方式完成輸入,是用一套編碼在不同鍵位的鍵盤(pán)上輸入漢字的通碼,實(shí)現(xiàn)了中文無(wú)重碼輸入,軟件可以嵌入各種手持設(shè)備、游戲設(shè)備、自動(dòng)控制設(shè)備和各類(lèi)操作系統(tǒng)中,為漢字?jǐn)?shù)字化奠定基礎(chǔ)。
文檔編號(hào)G06F3/023GK102253726SQ20111005285
公開(kāi)日2011年11月23日 申請(qǐng)日期2011年3月7日 優(yōu)先權(quán)日2011年3月7日
發(fā)明者狄鐵超 申請(qǐng)人:狄鐵超