欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

嵌合字根式中文輸入法的制作方法

文檔序號:6375881閱讀:218來源:國知局
專利名稱:嵌合字根式中文輸入法的制作方法
技術(shù)領(lǐng)域
本發(fā)明關(guān)于一種在電子裝置的鍵盤上輸入中文文字方法,特別是關(guān)于一種建立于特殊鍵盤對應(yīng)規(guī)則的輸入法。
背景技術(shù)
如何將中文輸入計 算機(jī)或其他電子設(shè)備一直是令人困擾的問題。由于中文字并非由字母組成,中文輸入必須仰賴一層額外的轉(zhuǎn)換才能將一組鍵盤鍵入的順序(輸入鍵組)對應(yīng)到內(nèi)存的中文字。傳統(tǒng)上,我們以兩種方式實踐這個對應(yīng)一是以字的讀音為標(biāo)準(zhǔn),將音轉(zhuǎn)換成拼音符號,再以簡單的鍵盤對應(yīng)輸入。拼音式輸入法的最大優(yōu)點是容易學(xué)習(xí),每個人根據(jù)日??谡Z的使用習(xí)慣便可輕易上手。但是拼音式輸入法也有一些缺點,其中最嚴(yán)重的是使用者必須分心在眾多同音字中挑選出正確的字,使得這類輸入法的速度無法提升。另一種輸入法的途徑是將中文字依照特定的規(guī)則拆解成若干字根,再將字根分組,對應(yīng)到鍵盤位置。這類字形式輸入法的速度相對較快,但是有一個致命的缺點難學(xué)易忘。以字形為基礎(chǔ)的輸入法在臺灣有倉頡、大易、嘸蝦米等,在中國大陸有五筆、鄭碼、二筆等輸入法。中文字的構(gòu)造遵循著若干基本規(guī)則。一個字往往能夠用直覺拆解成一些基本的構(gòu)件,例如「明」可拆成「日」「月」、「呆」可拆成「口」「木」,符合直觀,每個人都能操作。也有某些輸入法為了避免龐大字根表的記憶困難,主張以基本筆劃、或是兩個基本筆劃合并的組合作為拆字的單元。但是用筆劃拆字,并不符合我們對中文字的直觀。我們相信,如果要超越中文眾多同音字的限制,仍必須以字根為單元將每個字拆分編碼。以字形為基礎(chǔ)的輸入法包含兩套關(guān)鍵規(guī)則將文字拆解成字根的「拆字規(guī)則」,與將字根對應(yīng)到鍵盤位置的「對應(yīng)規(guī)則」。如果要使「拆字規(guī)則」符合直觀、好記好學(xué),所使用的中文字根數(shù)目一般在一百以上。如何將這許多看似無關(guān)的字根對應(yīng)到實際鍵盤位置是一個棘手的問題。這一部分往往也是初學(xué)一種輸入法的人最難以克服的障礙。為了方便學(xué)習(xí),各種拆字式輸入法都設(shè)計了某種便于記憶學(xué)習(xí)的字根對應(yīng)規(guī)則。一般的做法是先確定每個鍵的代表中文字,稱之為「碼元」,然后再將形狀類似的字根指定到同一碼元的位置。以倉頡輸入法為例,其碼元是日(A)、月(B)、金(C)、木(D)、水(E)、火(F)、土(G)、竹(H)、戈(I)、十(J)、大(K)、中(L)、一(M)、弓(N)、人(O)、心(P)、手(Q)、口(R)、尸(S)、廿(T)、山(U)、女(V)、田(W)、卜(Y)。通常碼元與其對應(yīng)的英文字母并無關(guān),為了讓用戶容易記憶,作者或許會設(shè)計一些可供聯(lián)想的口訣。例如倉頡碼有一種口訣是「日頭、月餅、金星…」;“頭”表示“頭一個字母”,即是A ;“餅”與“星”則依諧音對應(yīng)到B與C。一旦碼元與字根的對應(yīng)確立后,可以依照不同拆碼原則產(chǎn)生各式輸入法。以倉頡碼為例,它衍生出速成、快倉、全倉、易頡、大新、亂倉打鳥、輕松等眾多輸入法。而基于五筆鍵盤衍生出的輸入法也有極點五筆、華夏五筆、搜狗五筆等等。由此看來,鍵盤對應(yīng)規(guī)則可說是輸入法的靈魂。

發(fā)明內(nèi)容
為了克服一般字根表難背難學(xué)的缺點,本發(fā)明提出一種將字根嵌合成一般中文字,使字根能符合直觀地對應(yīng)到鍵盤字母的方法。若要以字根為單元拆解中文字,大致需要上百個字根才能符合直觀。換言之,如果只用26個英文字母鍵進(jìn)行編碼,每一個鍵位必需對應(yīng)數(shù)個字根。如果能夠找出一組25或26個中文字,每一個字分別能與一個英文字母產(chǎn)生聯(lián)想,同時其本身又由一組字根構(gòu)成,那么我們就可以輕易地記憶這些字根以及它們所對應(yīng)的鍵盤位置。本發(fā)明提出一種符合直觀的字根鍵盤設(shè)計方法。許多中文字是直接由字根嵌合而成,換言之,其本身可以拆解成若干個符合直觀的字根。而這個中文字本身的意義又可以直接譯成英文然后自然地對應(yīng)到鍵盤。舉例來說“早"這個字由“日"與“十"兩個字根組成。通過[早一 Early]的中英對照,我們可以很直觀地將“日"與"十"這兩個字根對 應(yīng)到“E "這個鍵盤位置。又如“釣"可以拆成“金"、“勹"與“、",而“釣魚"的英譯是“Fishing ",因此鍵盤上的“F "就代表“金"、“勹"與“、"這三個字根。我們考慮所有常用的嵌合式中文字,在其中挑出一組作為碼元,它們必須同時符合二個條件(一)嵌合出這組碼元的字根無重復(fù),(二)每一個碼元對應(yīng)到一個字詞,這個字詞的英文翻譯的頭一個字母無重復(fù)。例如根據(jù)這個方法,可以選出如圖1所示的25個碼元,分別對應(yīng)到不同的英文字母(“X "保留為其他用途),因此使用者只要記熟這25個字與其英文意涵,便掌握了鍵盤上六十多個字根的位置。相較于一般輸入法,本發(fā)明不但降低了將字根對應(yīng)到碼元的記憶負(fù)擔(dān),同時因為碼元本身代表的六十多個字根提供了更廣泛的模擬基礎(chǔ),未被碼元涵蓋的字根可以更直覺地經(jīng)由聯(lián)想與碼元連接。在拆字規(guī)則方面,本發(fā)明舍棄將每一個字完全拆分成字根的傳統(tǒng)模式,對于每一個中文字,依其第一筆劃與最末筆劃所屬的字根取兩碼,再加上由其讀音的聲母對應(yīng)的鍵盤,這三碼即形成此一中文字的編碼。雖然這種固定三碼長度的法則會產(chǎn)生若干重碼,但是拆字的規(guī)則大為簡化,便于學(xué)習(xí)。三碼可以產(chǎn)生一萬多種組合,相較于拼音式輸入法只有一千多種發(fā)音組合,選字需求將大幅降低,使用者可進(jìn)一步依賴智能選字系統(tǒng)滿足所需。


圖1顯示依本發(fā)明較佳實施例的鍵盤對應(yīng)。圖2顯示依本發(fā)明較佳實施例的英文聯(lián)想規(guī)則。圖3A,3B, 3C,3D顯示依本發(fā)明較佳實施例的字根涵蓋對應(yīng)規(guī)則。圖4顯示本發(fā)明尋找一組對應(yīng)于英文鍵盤的碼元的算法預(yù)先建立的「候選字庫」示意圖。圖5顯示依本發(fā)明尋找一組對應(yīng)于英文鍵盤的碼元的算法流程圖。圖6A,6B,6C顯示若干依本發(fā)明算法所產(chǎn)生的對應(yīng)碼元。附圖標(biāo)記說明510--------選出一組嵌合字「候選字庫」520--------記錄每個字包含的字根
530--------附加對應(yīng)的英文意義并記錄首字母540--------隨機(jī)由「候選字庫」中選取一字加入「選定字集」550-------將「候選字庫」中具有與「選定字集」相同字根的字移除560--------「選定字集」的字?jǐn)?shù)是否已達(dá)25570--------以匹配程序(matching)檢查「選定字集」中每個字是否可對應(yīng)到一
不同的英文首字母571--------輸出「選定字集」580--------「候選字庫」中是否仍有字可選
590--------加載原始「候選字庫」
具體實施例方式要依照嵌合字根原理設(shè)計一套輸入法首先必須選出認(rèn)為可用的簡單中文字,同時將其包含的字根與可能對應(yīng)的英文字母表列出來。我們稱這些字為「候選字庫」。例如我們考慮“案”這個字,它可以直觀地被拆解成女”、“木”這三個字根,而通過[案例一Case]與[答案一 Answer]這兩項中英對應(yīng),我們可以選擇C或A作為“案"的代表鍵。當(dāng)然,如果有需要,我們也可以考慮更多相對比較不自然的中英文對照以尋求更多的鍵盤對應(yīng),例如可以加入[提案一 Proposal]讓P也可能代表“案"。圖4列出更多的例子,但是它只顯示可供我們選擇的眾多候選字中的一小部分,我們省略了較罕用字(如“嵌”)、不能直覺地被拆解的字(如“世”)、找不到妥適英文對應(yīng)的字(如“系”)、字根數(shù)過多的字(如“慮”);實際上考慮的「候選字庫」超過三百個字。接著必須就每一個英文字母對應(yīng)的中文字中選定一個作為碼元,要求所選出的碼元中沒有重復(fù)字根。為此,我們建立一個「隨機(jī)算法」(Randomized Algorithm)。開始時,建立一個空的「選定字集」,然后在不引進(jìn)重復(fù)字根的條件下,隨機(jī)從「候選字庫」中挑出一個字加入。如此反復(fù),直到「選定字集」中包含了 25個字為止。此時再以「匹配」(Matching)算法檢查這25個字是否能對應(yīng)到不同的英文字母。以上過程中如果失敗或遇到無字可選的情況,就重新開始。流程圖如圖5。實務(wù)上,我們也可以先以人工選定一些較符合直觀的字,再以計算機(jī)輔助完成剩余的選擇。圖1顯示一組依照以上規(guī)則所選出的鍵盤對應(yīng)規(guī)則。實踐本發(fā)明的方法,可以產(chǎn)生多種不同的碼元組合。圖6顯示了更多例子。選定碼元組合后,我們的鍵盤上就對應(yīng)了數(shù)十個字根。但是數(shù)目還不夠。以圖1的碼元組合為例,“工"、“乙”、“刀”等字根就在基本字根的涵蓋之外。但是我們可以將它們指派到形狀相似的字根上,例如以“土”代表“工"、以“1_”代表“乙”、以“力”代表“刀”。如此規(guī)定后,幾乎所有常用字根都能被直覺地對應(yīng)到基本字根。圖3顯示了一個將各種字根變化對應(yīng)到基本字根的規(guī)則。因為本發(fā)明并不將每一個中文字完全拆解取碼,而是取包含首尾兩筆劃的兩個字根,即使少了某些在其他輸入法中被使用的字根,單是由筆劃也能夠得出合理的編碼。任何一個中文輸入系統(tǒng)無非只是一個碼表。依照規(guī)定的字根對應(yīng)與簡單的取碼規(guī)則對所有中文字建立出碼表后,我們的工作就接近完成。剩下的工作是建立一個智能選字的機(jī)制;包括對大量語料庫進(jìn)行分析統(tǒng)計,找出字與字之間出現(xiàn)的機(jī)率,以及對單一使用者新輸入的字進(jìn)行學(xué)習(xí)。這些工作都有大量公開且成熟的技術(shù)與文件可參考,因此不再贅言。上述實施例僅為例示性說明本發(fā)明的原理及其功效,而非用于限制本發(fā)明。本發(fā)明亦可藉由其他不同的具體實例加以實施或應(yīng)用,任何熟悉此技術(shù)的人員均可在不違背本發(fā)明的精神及范疇下,對上述實施例進(jìn)行修飾與變化。因此,本發(fā)明的權(quán)利保護(hù)范圍,應(yīng)如所述的申請專利范圍所列。
權(quán)利要求
1.一種中文輸入法,執(zhí)行于具有各式鍵盤的電子裝置,其特征在于用一種使用嵌合字根方法將字根組合為中文字,再依其英文翻譯對應(yīng)到鍵盤位置,其步驟包括有設(shè)計一鍵盤對應(yīng)表,供用戶記憶鍵盤與字根的對應(yīng)關(guān)系;規(guī)定取碼的拆解規(guī)則,并依此規(guī)則建立中文字集的碼表;接收使用者的輸入鍵組,由碼表中找出對應(yīng)中文字。
2.如權(quán)利要求1項所述的嵌合字根式輸入法,其特征在于字根與鍵盤對應(yīng)規(guī)則來自將數(shù)個字根嵌合為一個中文字,再依該字的英文意涵對應(yīng)至鍵盤位置。
全文摘要
一種便于記憶的鍵盤對應(yīng)規(guī)則的產(chǎn)生方法及衍生出的輸入法,執(zhí)行于具有數(shù)字輸入組件及英文字母輸入組件的電子裝置,該電子裝置中存儲有與按鍵上的字碼相對應(yīng)的中文字庫,該方法包括如下步驟創(chuàng)造一個對應(yīng)表,令其相對于每一個英文鍵盤有一個便于記憶的中文字,而此中文字又可以直接被拆解為數(shù)個字根;將中文文字依其第一筆畫、最后筆畫、與讀音的聲母,分別對應(yīng)為“首字根”、“尾字根”、與“音字根”三碼,每一碼由一個鍵盤位置產(chǎn)生;使用者輸入三碼后可調(diào)出預(yù)存的對應(yīng)中文字組選擇所需的輸入字。
文檔編號G06F3/023GK102999169SQ201210313088
公開日2013年3月27日 申請日期2012年8月29日 優(yōu)先權(quán)日2011年9月16日
發(fā)明者馬自恒 申請人:馬自恒
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
大姚县| 分宜县| 灵武市| 额敏县| 贵阳市| 田林县| 庄河市| 桐梓县| 印江| 四川省| 凌云县| 呼伦贝尔市| 唐海县| 梧州市| 贵定县| 拜城县| 贵德县| 大埔区| 漯河市| 苗栗县| 庆阳市| 井陉县| 武汉市| 双柏县| 秦安县| 蓝山县| 资溪县| 澄城县| 托克托县| 富顺县| 萍乡市| 诏安县| 临泉县| 建瓯市| 广平县| 应用必备| 白水县| 镇康县| 崇左市| 正阳县| 临猗县|