專利名稱::一種首末碼漢字輸入方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及一種漢字輸入方法,尤其是涉及一種用于計(jì)算機(jī)、手機(jī)等電子定義備的拼形類漢字輸入法。
背景技術(shù):
:目前,用于計(jì)算機(jī)、手機(jī)等電子定義備的漢字輸入法,大致有拼形類、拼音類、音形類、形音類、數(shù)字類等。中國(guó)專利85100837號(hào)公開的《優(yōu)化五筆字型編碼法及其漢字輸入鍵盤》是拼形類的一個(gè)代表,重碼率較低,包括其它一些人們熟知的拼形類漢字輸入法在內(nèi),還存在以下缺陷(1)需記憶大量的字根,需要太多強(qiáng)制記憶,較難掌握;(2)漢字拆分難度大,難以準(zhǔn)確認(rèn)定;(3)忘得快,這些拼形類漢字輸入法完全是硬性確定某字的編碼是什么,按其本身的編碼方法使人容易在可能出現(xiàn)的幾種漢字分拆的情況下作出錯(cuò)誤的選擇;(4)有些輸入法重碼較多,主要表現(xiàn)為兩個(gè)方面,有的編碼方法重碼總數(shù)太多,有的在較多的重碼中,一個(gè)重碼包含較多重碼字,多的可達(dá)8個(gè)以上,且沒有對(duì)所有規(guī)范漢字進(jìn)行編碼,編碼不能容納較多詞組。中國(guó)專利98101731.2號(hào)公開的《大自然漢字鍵盤及其輸入方法》是音形類的代表,其除使用26個(gè)字母編碼以外,還需使用其他符號(hào)編碼,符號(hào)代表的字根難以掌握,影響輸入效率。
發(fā)明內(nèi)容本發(fā)明的目的在于提供一種取碼直觀,較易記憶,重碼率低,且輸入效率較高的首末碼漢字輸入方法。本發(fā)明的目的是通過以下技術(shù)方案實(shí)現(xiàn)的(一)字根選擇規(guī)則(1)以常用漢字的偏旁、部首,或出現(xiàn)頻率較高的筆畫型(如“_”、“_”等),作為字根;(2)為便于實(shí)現(xiàn)編碼字根最大化,降低漢字分解難度的偏旁、部首、筆畫型,作為字根,如“矛”、“巫”、、“爪”、“求”、“尸”、“卩”、等;(3)將組字能力極低的偏旁或部首(如等),予以淘汰,不作為字根;(4)將有兩種或多種“變形”的偏旁、部首或筆畫型,歸入同一個(gè)字根,例如西(覀)、四(罒)、雨、月大、幾(_、如“微”字中)、又纟(纟,如“轡”字中)、小、亅(,如“豹”字中)、冂、人、八、火(“如偏旁“衤”中、如“飛”字中、如“鄹”字中)、_(如“站”字中)、(,如“豢”字中)、木(如“新”字中)、車足(_)、禾土(_)、竹(_)、牛卩(,如“衛(wèi)”字中)、兒(,如“羌”字中;,如“輝”字中;,如“尬”字中)、尸(,如“君”字中)、求(,如“裘”字中)、水(氺,如“錄”字中;,如“暴”字中;,如“犀”字中)匕如“化”字中)、(,如“貫”字中)、王(、王,如“全”字中,上“橫”比第二“橫”短)。但在編碼當(dāng)中,不能將“刀”類推為字根“_”,將“_”類推為字根“卩”。除以上情況外,還有一些在取碼筆畫最大化當(dāng)中,結(jié)構(gòu)形態(tài)相近的筆畫型,歸入結(jié)構(gòu)形態(tài)相近的字根如“殳”字中的歸入字根“幾”,“凹”字中的歸入字根“冂”,“身”字中的歸入字根“月”,“即”字中的歸入字根“厶”,“敝”字中的歸入字根“_”,“臉”字中的“_”歸入字根“_”,“業(yè)”字中的“_”歸入字根“_”(“業(yè)”字中的筆畫型“_”,“點(diǎn)”、“撇”和“橫”之間有間隙),“良”字中的歸入字根以上列出的字根,不能作類推,如不能以“尹”字中看作“尸”的“變形”;“衛(wèi)”字中可看作“卩”的“變形”,而類推“烏”字中的筆畫型可看作;不能以“貫”字中可看作的“變形”,而類推“緣”字中也為字根(5)將組字能力較低的偏旁或部首歸并入其他形態(tài)相近似的字根,如沒有定義字根“夂”,“條”字首取字根為“_”,而“復(fù)”字末取字根為“又”;沒有定義字根“廣”,“廣”字首取字根為“亠”,“擴(kuò)”字末取字根為“廠”。沒有作為字根的偏旁、部首,其筆畫都將歸入“一”、“丨”、“丿”、“丶”、“乙”這些基本筆畫。按照以上規(guī)則選定字根,數(shù)量宜為100-130個(gè),優(yōu)選105-120個(gè)。(二)字根鍵位布置規(guī)則(1)按照組字能力確定,組字能力≥100字的在首偏旁字根(如“氵”、“廾”、“口”“木”、“扌”、“亻”等),盡可能處在不同鍵位里,并兼顧各碼位的容量平衡,以降低重碼率,如把字根“辶”安排在字根“氵”所在鍵位里(因兩者一個(gè)在字首,一個(gè)在字末,是不會(huì)發(fā)生重碼的)。(2)當(dāng)把組字能力≤100的在首偏旁字根安排鍵位時(shí),既考慮是否和鍵位里主要在首偏旁有較多同部首而發(fā)生重碼,也考慮是否有筆畫形態(tài)相近問題(如把字根“口”安排在字根“口”所在鍵位里,會(huì)發(fā)生27個(gè)重碼;改把字根“口”安排在字根“目”所在鍵位里就會(huì)相應(yīng)減少些)。(3)組字能力≥100的在末部首字根盡可能處在不同鍵位里,但可與主要在首偏旁安排在同一鍵位。(4)為便于記憶,盡可能將字根定義在與主要字根(鍵名字根)名稱“近聲”或“近形”的字母鍵位上,如“丶”的名稱讀音含有聲母“D”,故定義在“D”鍵上;“木”讀音含有聲母“M”,故定義在“M”鍵上,“氵”名稱讀音含有聲母“sh”,故定義在“S”鍵上;以此類推,“土”定義在“T”鍵上,“日”定義在“R”鍵上,“忄”定義在“X”鍵上,“竹”定義在“Z”鍵上;“目”近形于“E”(檢測(cè)眼睛視力的圖形),定義在“E”鍵上;“钅”近形于“W”(象金元寶),定義在“W”鍵上;“艸”近形于“Y”(象草),定義在“Y”鍵上;“口”近形于“O”,定義在“O”鍵上;“阝”近形于“P”,定義在“P”鍵上;“女”字近形于“V”,定義在“V”鍵上;“冂”近形于小寫“N”(n),定義在“N”鍵上;“乙”近形于“G”,定義在“G”鍵上;“丿”近形于“J”,定義在“J”鍵上等;“一”近形于“F”(“F”含有兩“橫”),定義在“F”鍵上。(5)盡量使各點(diǎn)擊對(duì)應(yīng)鍵位的手指工作量基本平衡,如包含字和詞較少的鍵位“B”鍵,就能減輕左食指工作量(因左食指需點(diǎn)擊六個(gè)鍵位);如包含字和詞較少的鍵位“N”鍵,就能減輕右食指工作量(因右食指需點(diǎn)擊六個(gè)鍵位)。(6)為提高輸入效率,將含有“一”、“丨”、“丿”、“丶”“乙”五種使用頻率高的基本筆畫的字根,定義在最方便食指、中指點(diǎn)擊的鍵位上;更進(jìn)一步,將組字能力≥300的偏旁所在的字根定義在最方便食指、中指點(diǎn)擊的鍵位上。(7)盡可能布置在各字母鍵上,但為減少重碼,除各字母鍵外,也可啟用少量其它字符鍵,例如使用率較低的標(biāo)點(diǎn)符號(hào)鍵“”鍵和“?”鍵等。本發(fā)明也適用于數(shù)字鍵盤的漢字輸入,此時(shí),所述字根自然應(yīng)當(dāng)定義在數(shù)字鍵上。另外一個(gè)改進(jìn)方案是,增設(shè)“重碼鍵”將鍵盤上的空格鍵位置一分為二,左為重碼鍵,當(dāng)出現(xiàn)重碼時(shí),可在輸入編碼后補(bǔ)擊重碼鍵,以提高輸入效率;右為空格鍵。(三)取碼編碼規(guī)則首先按照筆順以字的在首筆畫實(shí)行首碼字根最大化;并用未取筆畫按倒數(shù)順序以末筆實(shí)行末碼字根最大化;接著用未取筆畫按筆順實(shí)行第二碼字根最大化;然后用未取筆畫按筆順實(shí)行第三碼字根最大化。在編碼過程中,編碼按順數(shù)碼位排列,而在實(shí)現(xiàn)字根最大化時(shí),則按首碼、末碼、第二碼、第三碼的次序進(jìn)行,在發(fā)生被取碼筆畫相矛盾時(shí),后者依次讓前者。這樣做,也是為了突出首末字根在進(jìn)行詞組編碼時(shí),能夠直觀化,這種取碼方法,本發(fā)明者稱之為四碼位最大化首末碼,簡(jiǎn)稱首末碼;本發(fā)明之漢字輸入法,可稱之為首末碼漢字輸入法。當(dāng)漢字編碼不足四碼時(shí),后面補(bǔ)空格鍵。對(duì)于詞匯的輸入,可采用以下編碼規(guī)則,以提高輸入速度雙字詞,取第一字的首、末碼為詞的第一、二碼,取第二字的首、末碼為三、四碼,共四碼位。三字詞,取各字首碼為詞的第一、二、三碼,取第三字末碼為詞的末碼,共四碼位。四字或四字以上詞組編碼取前三字和最后一字首碼,共四碼位。本發(fā)明的積極效果在于,編碼取碼具有唯一性強(qiáng)、直觀、易記等特點(diǎn),重碼率低。圖1為本發(fā)明一實(shí)施例的鍵名字根在鍵盤上的分布圖。具體實(shí)施例方式以下結(jié)合實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳細(xì)說明。根據(jù)前述字根選定規(guī)則,本實(shí)施例選定字根113個(gè);按照前述字根鍵位布置規(guī)則,布置在26個(gè)字母鍵及2個(gè)標(biāo)點(diǎn)符號(hào)鍵“”鍵和“?”鍵(分別命名為“火”鍵(所在鍵位標(biāo)記草體“火”字)和“月”鍵(所在鍵位標(biāo)記草體“月”字)。在輸入“”(冒號(hào))時(shí),在后補(bǔ)點(diǎn)擊空格鍵,在輸入“;”(分號(hào))時(shí),在后補(bǔ)擊重碼鍵;在輸入“?”時(shí),在后補(bǔ)點(diǎn)擊空格鍵,在輸入“/”時(shí),在后補(bǔ)點(diǎn)擊重碼鍵。本實(shí)施例也適用于數(shù)字鍵盤的漢字輸入,此時(shí),所述字根布置在數(shù)字鍵上。本實(shí)施例的鍵名字根在鍵盤上的分布參見圖1。所述113個(gè)字根在鍵盤上的位置,如下表所示<tablesnum="0002"></tables>[以上字根中為在“家”字末筆畫型;為在偏旁“衤”(“捺”變“點(diǎn)”)中、“聚”字末筆畫型][注解“齒”在編碼中分解為、“__”;偏旁分解為“丶”;“面”字分解為“一”、;“革”分解為“艸”、;“馬”字分解為、“一”;偏旁或部首“車”在首分解為、“一”,在末分解為“一”、;偏旁叫“衤”分解為“_”、;偏旁“礻”分解為“_”、“丶”;偏旁“犭”分解為、“丿”;“雨”分解為“一”、;“舟”分解為、“丶”;“骨”分解為“月”。]取碼編碼方法,如前所述,首先按照筆順以字的在首筆畫實(shí)行首碼字根最大化;并用未取筆畫按倒數(shù)順序以末筆實(shí)行末碼字根最大化;接著用未取筆畫按筆順實(shí)行第二碼字根最大化;然后用未取筆畫按筆順實(shí)行第三碼字根最大化。在編碼過程中,編碼按順數(shù)碼位排列,而在實(shí)現(xiàn)字根最大化時(shí),則按首碼、末碼、第二碼、第三碼的次序進(jìn)行,在發(fā)生被取碼筆畫相矛盾時(shí),后者依次讓前者。編碼舉例例如“偉”字依次分解為“亻”、“一”(為第二“橫”)、、“十”,編碼為”kFGI”,依次擊打“K”、“F”、“G”、“I”鍵即可;”愛”字依次分解為“爫”、“冖”、“フ”、“大”,編碼為”JQGC”。首末碼只有一個(gè)或兩個(gè)字根的字,其編碼為點(diǎn)擊字根所在鍵位加聲母組成。例如”口”字編碼為”O(jiān)K”(“K”為聲母);”從”字編碼為“KKC”(“C”為聲母).當(dāng)漢字編碼不足四碼時(shí),后面補(bǔ)空格鍵。如“辦”字編碼為“UDD”,在輸入編碼后補(bǔ)空格鍵。本實(shí)施例還專門設(shè)有“重碼鍵”將現(xiàn)有鍵盤上的空格鍵位置一分為二,右為空格鍵,左為重碼鍵,重碼鍵上標(biāo)記草體“重”字。在實(shí)際編碼中,多數(shù)為兩個(gè)字(詞)重碼,少數(shù)重碼為三個(gè)字(詞)以上,針對(duì)這種情況,特采取不同的方法對(duì)待(在輸入編碼為重碼時(shí),讓電腦屏幕底格同時(shí)顯示所有的同編碼字或詞)(1)漢字編碼出現(xiàn)的重碼為四個(gè)碼位,且只有兩個(gè)字(詞)為重碼,以最常見字(詞)為本碼字(詞),在輸入該編碼時(shí),電腦屏幕內(nèi)容同時(shí)顯示該字(詞)完成輸入;而需要輸入重碼字(詞)時(shí),補(bǔ)點(diǎn)擊重碼鍵,電腦屏幕內(nèi)容顯示的本碼字(詞)切換成重碼字(詞),重碼字(詞)在屏幕底格編號(hào)為“2”。(2)給漢字編碼中出現(xiàn)的重碼為三個(gè)碼位以內(nèi),且只有兩個(gè)字為重碼,在輸入編碼后補(bǔ)空格鍵為輸入本碼字;再補(bǔ)擊重碼鍵,本碼字切換成重碼字,也可在輸入編碼后只補(bǔ)擊重碼鍵便可輸入該字,重碼字編號(hào)也為“2”。(3)漢字編碼中出現(xiàn)的重碼有三個(gè)字(詞)以上(這時(shí)不必管編碼多少碼位),該編碼所有的字(詞)用阿拉伯?dāng)?shù)“1”、“2”等給以編號(hào),最常見編號(hào)為“1”,次常見編號(hào)為“2”(詞可定義在字后考慮),依次類推,在輸入該編碼中的字(詞)時(shí),在編碼后補(bǔ)擊對(duì)應(yīng)的編號(hào)為輸入所選擇的字(詞)[補(bǔ)空格鍵也可代替補(bǔ)編號(hào)“1”,四碼位字(詞)這時(shí)必為五次擊鍵輸入]。設(shè)計(jì)重碼鍵還可專門進(jìn)行重碼字(詞)切換輸入,但不包括本碼字(詞)或編號(hào)為“1”的字(詞)[因這些字(詞)可利用空格鍵]。如已輸入一個(gè)重碼,點(diǎn)擊一次重碼鍵,即為完成輸入編號(hào)為“2”的重碼字(詞);點(diǎn)擊二次重碼鍵,即為切換成對(duì)應(yīng)編號(hào)為“3”的重碼字(詞),如此類推,重碼鍵可輪流將重碼中編號(hào)為“2”以后的所有重碼字(詞)切換輸入。在給漢字編碼當(dāng)中,還存在筆順這一大問題需要解決。當(dāng)前“漢字規(guī)范筆順”不能較好地滿足漢字信息處理要求。通過大量的試編碼實(shí)踐,為了實(shí)現(xiàn)取碼字根最大化、唯一性,必須做到取碼時(shí)漢字筆畫順序唯一性、統(tǒng)一性;同時(shí)又能讓這種唯一性、統(tǒng)一性的筆畫順序大多數(shù)符合現(xiàn)行的《漢字筆順規(guī)范》,但當(dāng)給出一種規(guī)定時(shí),就要求不能有例外,如給出“從左到中,至右”的規(guī)定,“非”字就不能以“丨”為先,而是以“三”為先,鑒此,本實(shí)施例對(duì)筆順作如下特別規(guī)定(一)從左到中,至右如“非”字依次分解為“三”、“丨”、“丨”、“三”,編碼為“THHT”;“止”字依次分解為“丨”、“丨”、“二”,編碼為“”;“臧”字依次分解為“乚”、“一”、“丿”、“丶”,編碼為“GFJD”;“將”字依次分解為“冫”、“丨”、“夕”、“寸”,編碼為“AHUL”;在以“撇”、“捺”或“點(diǎn)”對(duì)稱排列在兩邊時(shí),按以下兩種情況處理(1)中間定位兩偏旁筆畫型,先中間,后兩邊如“水”、、“承”、(“鰥”字中)、(“巫”字中)、(“幽”字中)、(“率”字中)、(“蘗”字中)、(“燮”字中)、(“亦”字中)、(“業(yè)”字中)“辦”、(“梁”字中)等,“水”依次分解為“亅”、,編碼為“LSS”;“率”字依次分解為“亠”、“厶”、“十”,編碼為“AGBI”;“幽”字依次分解為“山”、“厶”、“厶”,編碼為“BGBB”;“業(yè)“字依次分解為“丨”、“丨”、“_”,編碼為;“辦”字依次分解為“力”、“丶”、“丶”,編碼為“UDD”;(2)兩邊在上夾中交或夸筆畫型,先兩邊和“橫”(含“橫折”、“豎折橫”等),后中間,如、“半”、“米”、(“夾”字中)、“坐”、(“敝”字中)、“兆”、(“脊”字中)、(“谷”字中)、(“塽”字中)等,如“米”,在字首,依次分解為“_”、“小”,在字末,依次分解為“丷”、“木”;“兆”字依次分解為、“兒”,編碼為“SWZ”;“坐”字依次分解為“人”、“人”、“土”,編碼為“KKT”;“敝”字依次分解為“_”、“冂”、“八”、“乂”,編碼為“ZNKC”等;(二)從上到下,如“皮”字(在不設(shè)字根時(shí)),依次分解為“乛”、“丨”、“丿”;(三)兩筆畫相交,先“橫”(含“橫折”、“橫折豎”、“豎折橫”),后“豎”(含“豎折”、“豎撇”)或“撇”如“十”、(參見“降”字中)、(參見“也”字中)、(參見“五”字中)、“巾”、“子”、“韋”、“聿”、(參見“庸”字中)、(參見“勤”字中)、“_”(參見“澤”字中)、(參見“隹”字中)、(參見“青”字中)、(參見“垂”字中)、“七”、(參見“逆”字中)、(參見“屯”字中)、“屮”(參見“蚩”字中)、(參見“虐”字中)、“九”、“力”等。即如“五”字依次分解為“一”、“_”、“丨”、“一”,編碼為“FGHF”;“子”字依次分解為“乛”、“一”、“亅",編碼為“GFL”;“青”字依次分解為“三”、“丨”、“月”,編碼為;“逆”字依次分解為“_”、“_”、“丿”、“辶”,編碼為“BJS”;“虐”字依次分解為“丨”、“一”、“_”,編碼為“HFGG”;“九”字依次分解為“乙”、“丿”,編碼為“GJJ”等;但在“冂”框、框、“囗”框、“囗”字、框與“橫”相交時(shí)有特例,以“冂”、、“囗““囗”、等結(jié)構(gòu)看成在上,為先,“橫”看成在下,為后,規(guī)定為從上到下。如“冊(cè)”字依次分解為“冂”、“冂”、“一”,編碼為“NNF”;“尹”字依次分解為“尸”、“一”,編碼為“PFY”;“衰”字依次分解為“亠”、“口”、“一”、,編碼為“AOFW”;“母”字依次分解為、“亠”、“、”,編碼為“EAD”等;(四)兩筆畫相接,若有出頭時(shí),出頭者為先,若無出頭成左上角時(shí),看成先角上,后角下如“卩”、等,其左上角無筆畫出頭,因此象“氏”字依次分解為“丿”、“_”、編碼為“JGV”,而象“及”、“乃”等字左上角有筆畫出頭,因此以出頭的筆畫“ㄋ”為先;(五)全包圍,左上右包圍、上左包圍、上右包圍字型,先外后里如“國(guó)”、“母”、“同”、“問”、“廳”、“司”等;(六)左下右包圍,左下包圍,上左下包圍字型,先里后外如“畫”“運(yùn)”(參見“甚”字中)、(參見“曷”字中)、“也”、“區(qū)”等,即如“畫”字依次分解為“一”“日”“丨”“__”,編碼為“FRHB”;“運(yùn)”字依次分解為“二”“厶”“辶”,編碼為;“甚”字依次分解為“艸”“三“”八““_”,編碼為“YTKG”;“也”字依次分解為“丨”、“乚”,編碼為“GHG”;“區(qū)”字依次分解為“一”、“乂”、“_”,編碼為“FCG”等;而對(duì)于一些特殊的近于左下包圍但卻難以認(rèn)定為左下包圍結(jié)構(gòu)的筆畫型,如(1)漢字組字中,把筆畫“_”右上的筆畫看作被筆畫“_”左下包圍筆畫型,以筆畫“_”右上的筆畫為先,如“與”、“丐”、“鳥”等字,若不設(shè)字根“鳥”時(shí),“鳥”字的筆順依次為“丿”、“_”、“丶”、“_”、“一”,而不是以“丶”作為末筆(參見第七條規(guī)定);(2)象“比”字的左部筆畫型及“匕”字等,同樣看作左下包圍筆畫型,先里后外;(3)對(duì)于“鬼”“尬”、“氈”、“旭”、“飛”等字中有筆畫“_”或“乚”,不視為左下包圍筆畫型,把這些筆畫看作在左部分筆畫,以左部筆畫為先,如“尬”字依次分解為“一”、“兒”、“人”、“丨”,編碼為“FWKH”。(4)由多筆畫組成的偏旁“辶”、“廴”等看作左下包圍,除此而外,象“處”字中筆畫型、“昶”字中筆畫型等由多筆畫組合的筆畫型不視為左下包圍筆畫型。(七)“點(diǎn)”在上部或左上,筆順為先,如“衣”、“為”、“門”等;“點(diǎn)”在右上或字里,筆順為后,如“發(fā)”“瓦”等。如“為”字,依次分解為“丶”、“力”、“丶”,編碼為“DUD”;“發(fā)”字依次分解為“人”、“フ”、“丶”,編碼為“GKGD”,若不設(shè)字根“門”時(shí),“門”字依次分解為“丶”、“丨”等。為便于實(shí)現(xiàn)取碼字根最大化,對(duì)于漢字的筆畫結(jié)構(gòu)的認(rèn)定,本實(shí)施例還有下列規(guī)定(一)除字根“亅”之外,所有“折”均看作字根“乙”;(二)“提筆”看作“橫”,如“刁”字;但“橫”不為“提筆”,如“事”字中的筆畫型不為字根“扌”[特別說明“轡”字右邊“纟”(底下筆畫為“橫”)仍認(rèn)定為字根“纟”,因其在筆畫結(jié)構(gòu)上完全相同]。(三)“亦”在字整體上部或部首上部時(shí),筆畫型均為兩“豎”如“跡”字,分解為“亠”、“丨”、“丨”、“辶”,編碼為“AHHS”;“奕”字分解為“亠”、“丨”、“丨”、“大”,編碼為“AHHC”等。(四)方框內(nèi)包有一筆畫者,認(rèn)定為“囗”框,不為“口”字。如“象”字中筆畫為“囗”框;“柬”字中筆畫型為“囗”框(“囗”框作為部首在字末時(shí),規(guī)定以“囗”框?yàn)槟┕P字根最大化,但不類推框);(五)“二“、“三”、“_”等字根中,處在最底下的“橫”為不短于上部的“橫”,并且對(duì)于字根“三”,上面第一“橫”還須不短于處在中間位置的“橫”,否則都不認(rèn)定為該字根,如“羋”字首筆畫型為,不為字根“三”,因其第一“橫”短于中間的“橫”;“作”字末筆畫型不為字根“三”,因其最底下的“橫”短于第一“橫”;而“宜”字末筆畫型卻為字根“三”,是因其最底下的“橫”為不短于上部的“橫”;另外,筆畫型(參見“妻”字中)、(參見“捷”字中)以在筆畫型“_”中間位置的“橫”為最長(zhǎng);筆畫型“聿”以底下位置的“橫”為最長(zhǎng),即“妻”字第一碼確定取字根為“_”等;“垂”字以筆畫型“艸”中的“橫”為最長(zhǎng),“垂”字第二碼確定取字根也為“_”等;(六)漢字中存在多個(gè)“橫”的筆畫時(shí),以最長(zhǎng)的“橫”為被取字根“十”、“大”、“木”、“廾”、“_”(字根“_”針對(duì)底下的“橫”)的筆畫,因此“缽”字末筆字根最大化不認(rèn)為是“十”,而是“一”。(七)“豎鉤”(“亅”)變“豎”(“丨”)則依“豎”,“豎”變“豎鉤”則依“豎鉤”(不包括“亦”在上時(shí)),如“犀”字中依“丨”看作字根“_”;(八)漢字中有許多以“橫撇”和“豎”筆畫相接,如“千”、“垂”、“幣”、“禾”等字中的筆畫型,這種筆畫型實(shí)現(xiàn)取碼字根最大化時(shí),如果定為字根“亻”(單人旁),就會(huì)有許多漢字被拆散;而象“裁”字中,若以第三碼取筆畫型認(rèn)定為字根“人”,以及“夜”字末碼取筆畫型認(rèn)定為字根“人”,都屬于反拆漢字,很難理解;又如“庹”字,若取末筆畫型為字根“八”,“后”、“差”等字,若取筆畫型為字根“_”,都是不能支持的。因此特別規(guī)定只以偏旁或部首“亻”、“人”、“八”、“丷”、“_”(如“失”字首)、能夠理解為同一種筆畫型的(如“家”字末筆畫型)、以及能夠理解為同一種筆畫型的[(如“聚”字末、偏旁“衤”(“捺”變“點(diǎn)”)中筆畫型]認(rèn)定為字根。所述字根,一般為筆畫相連,或?yàn)楣P畫相交,或?yàn)楣P順相連,或?yàn)楣P畫位置相連續(xù),不存在被中插筆畫隔分;如字根被中插筆畫隔分,應(yīng)是“撇”、“捺”或“點(diǎn)”對(duì)稱排列在中插筆畫兩邊,筆順相連,如“八”、“丷”等。舉例如下“柬”字首取字根“木”、“十”和“八”相連不為隔分;“策”字末取字根“木”、“小”與“一”相交,不為隔分;“宣”字末取字根“三”,筆順相連,不存在隔分;“辰”字首取字根“三”,筆畫不連,筆順不連,但位置相連續(xù),不存在隔分,認(rèn)定為字根;“水”字末取字根雖被中插隔分,但筆順相連且對(duì)稱在兩邊,認(rèn)定為字根;“于”字首取字根為“二”不為隔分;“工”字首取字根不為“二”,因“二”被“丨”中插隔分,筆畫不連不交,筆順不連,筆畫位置不連續(xù);“兼”字末筆畫型“_”,筆順雖相連,但被左邊“丨”隔分,且不是以字根(“小”的變形)中的“丨”對(duì)稱排列,而是以筆畫型對(duì)稱排列,因此,“兼”字末取字根不為“小”,而為“八”。漢字中,象“武”字中的,筆畫位置處在上面的“一”偏向筆畫位置處在下面的“一”的一邊,這種“偏位移”現(xiàn)象有很多,如“裁”等字中的,其筆畫型“十”就在筆畫“一”的上面有“偏位移”,“戢”字中的,其筆畫型就在筆畫“一”的下面有“偏位移”;“我”字中的,其筆畫型就在與筆畫“一”相交有“偏位移”,還有“丑”字中的,其筆畫型“十”在筆畫“一”的上面也稍有“偏位移”;當(dāng)然,,或許“旭”、“尬”等字中的筆畫型也要討論是否可看作有“偏位移”現(xiàn)象,這些偏旁或部首在漢字組字結(jié)構(gòu)中應(yīng)仍為原偏旁或部首,在編碼時(shí)仍須看作原字根。筆畫結(jié)構(gòu)“亠”在漢字組字結(jié)構(gòu)中沒有出現(xiàn)“偏位移”,但當(dāng)它作為字根在實(shí)現(xiàn)取碼最大化時(shí),就有“點(diǎn)”在筆畫“橫”上“偏位移”現(xiàn)象,如“伏”、“國(guó)”、“浦”、“試”等字末最大化筆畫型,是否可以認(rèn)定為字根“亠”呢?如果認(rèn)定,這將拆散許多的類似漢字。如果認(rèn)定“偏位移”,筆畫型全被認(rèn)定為字根“亠”;如果不認(rèn)定“偏位移”,象“作”字末的,上“橫”應(yīng)偏移一邊,也稍有類似現(xiàn)象,是否也要否定為字根“二”呢、“戢”字中的、“戒”字中的等不認(rèn)定為字根,從而使分拆取碼有違漢字本義上的筆畫結(jié)構(gòu),且對(duì)于“丑”字中的是否存在“偏位移”,則需要用尺來量了。綜合以上考慮,特規(guī)定除字根“亠”外,承認(rèn)所有的“偏位移”,把字根“亠”稱作“不可偏位移性”。在實(shí)際編碼中還會(huì)看到,還有某些“偏位移”并不能理解為漢字筆畫結(jié)構(gòu),如“臼”字末最大化筆畫型“韭”字末筆畫型,“凸”字末筆畫型,“亟”字末筆畫型等,但也可看作最大化字根“二”;如“友”字在首最大化筆畫型,也可看作最大化字根“大”。如果說象“長(zhǎng)”字首筆畫型可用被筆畫“一”中插隔分,來否定為字根,或者說筆畫“丿”、筆畫“_”在構(gòu)字布局中完全不同,那么又如象“賁”字首筆畫型是否要看作字根“土”呢?象“周”字首筆畫型是否要看作字根“月”呢?象“豸”字中首筆畫型(“點(diǎn)”和“撇”沒有間隙)是否要看作字根“爫”呢?象“佳”字末筆畫型(筆畫“一”和“土”在結(jié)構(gòu)上應(yīng)存在間隙,只是筆畫間布局緊湊,不明顯而已)是否要看作字根“王”呢?等等。為此,特規(guī)定由某偏旁、部首或說構(gòu)字部件確定為某字根的筆畫構(gòu)成,其筆畫原為與整體中某些筆畫相連或相隔的,而出現(xiàn)在漢字取碼字根最大化當(dāng)中,筆畫型有極似其形卻為該筆畫間相隔或相連的,不為該字根。詞組編碼雙字詞組編碼,取第一字首、末碼為詞的第一、二碼,取第二字首、末碼為三、四碼,共四碼位,例如“學(xué)習(xí)”依次分解為“_”、“亅”、“乙”、“冫”,編碼為“ZLGA”。三字詞組編碼,取各字首碼為詞的第一、二、三碼,取第三字末碼為詞的末碼,共四碼位,例如“湖南省”依次分解為“氵”、“十”、“小”、“目”,編碼為“SIZE”。四字以上詞組編碼,取前三字和最后一字首碼,共四碼位,例如“馬到成功依次分解為“一”、“廠”、“一”,編碼為“PFCF”。字母看作一碼全碼字,輸入時(shí),按本字母鍵并在后補(bǔ)空格鍵(為字母小寫),如輸入多個(gè)字母組成的拼音時(shí),只能按同樣方法逐字輸入用以表示,如接連出現(xiàn)兩個(gè)拼音,在前一個(gè)拼音完成輸入后再補(bǔ)一次空格鍵。本實(shí)施例編碼方案,以《現(xiàn)代漢語(yǔ)詞典》為依據(jù),能對(duì)所有規(guī)范漢字進(jìn)行編碼,存在的重碼僅有408個(gè),能容納大量詞組。本發(fā)明的保護(hù)范圍不能認(rèn)為只局限于上述具體實(shí)施方式。對(duì)所屬
技術(shù)領(lǐng)域:
的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的基本前提下,還可以做出若干簡(jiǎn)單推演或等同替換,這些等同替換方案仍然將被視為在本發(fā)明的保護(hù)范圍之內(nèi)。權(quán)利要求1.一種首末碼漢字輸入方法,其特征在于(一)字根選擇規(guī)則(1)以常用漢字的偏旁、部首,或出現(xiàn)頻率較高的筆畫型,作為字根;(2)以便于實(shí)現(xiàn)編碼字根最大化,降低漢字拆分難度的偏旁、部首、筆畫型,作為字根;(3)將組字能力極低的偏旁或部首,予以淘汰,不作為字根;(4)將有兩種或多種“變形”的偏旁、部首或筆畫型,歸入同一個(gè)字根;(5)將組字能力較低的偏旁或部首歸并入其他形態(tài)相近似的字根,沒有作為字根的偏旁、部首,其筆畫都?xì)w入“一”、“丨”、“丿”、“丶”、“乙”這些基本筆畫字根本;(二)字根鍵位布置規(guī)則(1)按照組字能力確定,組字能力≥100的在首偏旁字根,盡可能處在不同鍵位里,并兼顧各碼位的容量平衡;(2)當(dāng)把組字能力≤100的在首偏旁字根安排鍵位時(shí),既考慮是否和鍵名字根有較多同部首而發(fā)生重碼,也考慮是否有筆畫形態(tài)相近問題;(3)組字能力≥100的在末部首字根盡可能處在不同鍵位里,但可與鍵名字根安排在同一鍵位;(4)盡可能將鍵名字根定義在“近聲”或“近形”的字母鍵位上;(5)盡量使各點(diǎn)擊對(duì)應(yīng)鍵位的手指工作量基本平衡;(6)將含有“一”、“丨”、“丿”、“丶”“乙”五種使用頻率高的基本筆畫的字根,定義在最方便食指、中指點(diǎn)擊的鍵位上;將組字能力≥300的偏旁或部首所在的字根定義在最方便食指、中指點(diǎn)擊的鍵位上;(7)盡可能布置在各字母鍵上;(三)取碼編碼規(guī)則首先按照筆順以字的在首筆畫實(shí)行首碼字根最大化;并用未取筆畫按倒數(shù)順序以末筆實(shí)行末碼字根最大化;接著用未取筆畫按筆順實(shí)行第二碼字根最大化;然后用未取筆畫按筆順實(shí)行第三碼字根最大化。在編碼過程中,編碼按順數(shù)碼位排列,而在實(shí)現(xiàn)字根最大化時(shí),則按首碼、末碼、第二碼、第三碼的次序進(jìn)行,在發(fā)生被取碼筆畫相矛盾時(shí),后者依次讓前者;當(dāng)漢字編碼不足四碼時(shí),后面補(bǔ)空格鍵。2.如權(quán)利要求1所述的首末碼漢字輸入方法,其特征在于,選定的字根為為100-130個(gè)。3.如權(quán)利要求2所述的首末碼漢字輸入方法,其特征在于,選定的字根為105-120個(gè)。4.如權(quán)利要求3所述的首末碼漢字輸入方法,其特征在于,選定的字根為113個(gè),所述字根在鍵盤上的位置如下表所示。5.如權(quán)利要求1-4之一所述的首末碼漢字輸入方法,其特征在于,雙字詞組編碼,取第一字的首、末碼為詞的第一、二碼,取第二字的首、末碼為三、四碼,共四碼位;三字詞組編碼取各字首碼為詞的第一、二、三碼,取第三字末碼為詞的末碼,共四碼位;四字或四字以上詞組編碼取前三字和最后一字首碼,共四碼位。6.如權(quán)利要求1-4之一所述的首末碼漢字輸入方法,其特征在于,將鍵盤上的空格鍵位置一分為二,左為重碼鍵,當(dāng)出現(xiàn)重碼時(shí),在輸入編碼后補(bǔ)點(diǎn)擊重碼鍵,右為空格鍵。7,如權(quán)利要求1-4之一所述的首末碼漢字輸入方法,其特征在于,對(duì)編碼取字根時(shí)的筆順還有如下規(guī)定(一)從左到中,至右;在以“撇”、“捺”或“點(diǎn)”對(duì)稱排列在兩邊時(shí),按以下兩種情況處理(1)中間定位兩偏旁筆畫型,先中間,后兩邊;(2)兩邊在上夾中交或夸筆畫型,先兩邊和“橫”,后中間;(二)從上到下;(三)兩筆畫相交,先“橫”后“豎”或“撇”;但在“冂”框、框、“囗”框、“口”字、框與“橫”相交時(shí),“冂”、“囗“、“口”、結(jié)構(gòu)看成在上,為先,“橫”看成在下,為后,理解為從上到下;(四)兩筆畫相接,若有出頭時(shí),出頭者為先,若無出頭成左上角時(shí)看成先角上,后角下;(五)全包圍,左上右包圍、上左包圍、上右包圍字型,先外后里;(六)左下右包圍,左下包圍,上左下包圍字型,先里后外;對(duì)于一些特殊的近于左下包圍但卻難以認(rèn)定為左下包圍結(jié)構(gòu)的筆畫型,作如下規(guī)定(1)漢字組字中,把筆畫右上的筆畫看作被筆畫左下包圍筆畫型,以筆畫右上的筆畫為先;(2)象“比”字的左部筆畫型以及“匕”字等,同樣看作左下包圍筆畫型,先里后外;(3)對(duì)于“鬼”“尬”、“氈”、“旭”、“飛”字,其中有筆畫或“乚”,不視為左下包圍筆畫型,把這些筆畫看作在左部分筆畫,以左部筆畫為先;(4)由多筆畫組成的偏旁“辶”、“廴”看作左下包圍,除此以外,其他類似由多筆畫組合的筆畫型不視為左下包圍筆畫型;(七)“點(diǎn)”在上部或左上,筆順為先。8.如權(quán)利要求1-4之一所述的漢字輸入方法,其特征在于,對(duì)漢字的筆畫結(jié)構(gòu)的認(rèn)定還有如下規(guī)定(一)除字根“”之外,所有“折”均看作字根“乙”;(二)“提筆”看作“橫”,但“橫”不為“提筆”,不過不包括“轡”字中的“纟”;(三)“亦”在字整體上部或部首上部時(shí),筆畫型均為兩“豎”;(四)方框內(nèi)包有一筆畫者,認(rèn)定為“囗”框,不為“口”字;(五)字根“二“、“三”、“_”,處在最底下的“橫”為不短于上部的“橫”,并且對(duì)于字根“三”,上面第一“橫”還須不短于處在中間位置的“橫”,否則不認(rèn)定為該字根;(六)漢字中存在多個(gè)“橫”的筆畫時(shí),以最長(zhǎng)的“橫”作為被取字根“十”、“大”、“木”、“廾”、“_”的筆畫;(七)“豎鉤”變“豎”則依“豎”,“豎”變“豎鉤”則依“豎鉤”,但不包括“亦”在上時(shí)。9.如權(quán)利要求1或2所述的漢字輸入方法,其特征在于所述字根,一般為筆畫相連,或?yàn)楣P畫相交,或?yàn)楣P順相連,或?yàn)楣P畫位置相連續(xù),不存在被中插筆畫隔分;如字根被中插筆畫隔分,應(yīng)是“撇”、“捺”或“點(diǎn)”對(duì)稱排列在中插筆畫兩邊,筆順相連。全文摘要本發(fā)明公開了一種首末碼漢字輸入方法,其選定字根為100-130個(gè),定義在通用鍵盤的字母鍵及選定的標(biāo)點(diǎn)符號(hào)鍵上;編碼規(guī)則首先按照筆順以字的在首筆畫實(shí)行首碼字根最大化;并用未取筆畫按倒數(shù)順序以末筆實(shí)行末碼字根最大化;接著用未取筆畫按筆順實(shí)行第二碼字根最大化;然后用未取筆畫按筆順實(shí)行第三碼字根最大化。在編碼過程中,編碼按順數(shù)碼位排列,而在實(shí)現(xiàn)字根最大化時(shí),則按首碼、末碼、第二碼、第三碼的次序進(jìn)行,在發(fā)生被取碼筆畫相矛盾時(shí),后者依次讓前者。本發(fā)明漢字拆分較易,重碼率低,直觀,易記,好學(xué)。文檔編號(hào)G06F3/023GK101086687SQ20071003539公開日2007年12月12日申請(qǐng)日期2007年7月19日優(yōu)先權(quán)日2007年7月19日發(fā)明者劉飛林申請(qǐng)人:劉飛林