專利名稱::計算機(jī)漢字輸入坐標(biāo)碼編碼方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及一種計算機(jī)漢字輸入編碼方法。形碼,是目前廣泛應(yīng)用的一類計算機(jī)漢字輸入方法,它的典型代表是″五筆字型″,″五筆字型″以漢字的″拼形″特性做為它的理論根據(jù),從字形入手,見形識碼,完全避開漢字的讀音。它克服了″音碼″不知道讀音或讀音不準(zhǔn)便無法正確輸入的缺點(diǎn),具有重碼率低,輸入快的優(yōu)點(diǎn)。形碼,靠提取漢字的形特征信息進(jìn)行編碼,一般都拆分漢字,形碼的設(shè)計思想可概括為首先,基于″某種認(rèn)識″確定漢字的拆分結(jié)果---即″字根集″;然后,根據(jù)字根集反過來解決″漢字的拆分″問題,以及編碼和輸入等問題,″字根集″是形碼的核心,不同的形碼本質(zhì)上是″字根集″的不同,漢字的拆分方法也因之不同。不足之處是記憶難,它的一百多個字根含有很多非字部件,而且沒有規(guī)律性,記憶負(fù)擔(dān)重;學(xué)習(xí)難,漢字的結(jié)構(gòu)規(guī)律是客觀存在的,五筆字型的字根集無疑也是漢字構(gòu)成的主要部分,但是,將字根集定義成唯一的漢字結(jié)構(gòu)單元,用它去機(jī)械地硬性拆分漢字,便偏離了漢字的結(jié)構(gòu)規(guī)律,也遠(yuǎn)離了人們的文字習(xí)慣,典型的例子就是″相交筆畫被拆分,基本漢字被拆開″,如此,人們深厚的母語文字知識用不上,長年的文字習(xí)慣不被認(rèn)同,不僅造成了學(xué)習(xí)上的困難,也造成了心理上的隔膜。為解決以上編碼方法之不足,本發(fā)明的目的提供一種計算機(jī)漢字輸入坐標(biāo)碼編碼方法,利用漢字的結(jié)構(gòu)特點(diǎn),建立拆分原則,不使用″字根集″,可以實(shí)現(xiàn)計算機(jī)快速編碼輸入,重碼率低,便于記憶,便于學(xué)習(xí)的目的。本發(fā)明計算機(jī)漢字輸入坐標(biāo)碼編碼方法,其內(nèi)容包括1.坐標(biāo)碼無″字根集″的拆字方法五個不拆分原則;漢字拆分的依據(jù)--型元集;漢字拆分的相關(guān)因素;漢字的拆分規(guī)則。2.坐標(biāo)碼的編碼方法用于編碼和輸入的信息;坐標(biāo)碼與鍵盤的對應(yīng)關(guān)系;編碼規(guī)則。其中坐標(biāo)碼無″字根集″的拆字方法和坐標(biāo)碼的編碼方法分別說明如下為什么叫坐標(biāo)碼漢字可以看成是分布于某一空間的點(diǎn)陣,為漢字編碼其實(shí)質(zhì)就是尋找一個坐標(biāo),該坐標(biāo)應(yīng)可以很好地離散漢字(重碼率低),并使之具有唯一性(一字一碼),只要能建立這樣一個坐標(biāo),設(shè)甘思想是不受約束的。鑒于這一認(rèn)識,本碼取名為″坐標(biāo)碼″。一.漢字的基本筆畫有五種橫,豎,撇,捺,折.其中橫包括″提″;豎包括″左豎鉤″亅;捺包括″點(diǎn)″、。筆畫之間的組合方式有三種(1)相交筆畫之間彼此交越的組合方式稱相交,如十,九,豐;(2)離散筆畫之間彼此分離的組合方式稱離散,如氵,彡,兒,川,灬;(3)粘連筆畫之間彼此相連但不交越的組合方式稱粘連。粘連又分三種A.直連筆畫橫、豎以及折的橫、豎段之間的粘連方式稱直連。如丁,衛(wèi),山,支;B.斜連相粘連的一方是撇、捺或是折的撇捺斷的粘連方式稱斜連。如人,不,,亻;C.端連筆畫連于彼此端點(diǎn)的粘連方式稱端連;如凸,冂,廠,幾,凹,口。二.五個不拆分原則型坐標(biāo)碼將筆畫的組合體稱為″型″?;拘妥鴺?biāo)碼中,漢字的基本結(jié)構(gòu)單位稱為″基本型″。坐標(biāo)碼認(rèn)為將漢字還原成筆畫而取碼的方法是最不可取的,它最大限度地丟失了漢字的結(jié)構(gòu)信息。坐標(biāo)碼總結(jié)出五個不拆分原則。1.一個筆畫不允許拆成兩截,斷在兩個型中。原因單一筆畫理應(yīng)完整。2.相交叉的筆畫不允許拆分,如豐,十,又,原因″交叉″是一種緊密的組合方式。3.相端連的筆畫不允許拆分,如弓,廠,口,凸。原因″端連″也是一種緊密型組合方式。4.由兩筆構(gòu)成的漢字和常用非字偏旁不允許拆成筆畫,如人,兒,丁,亻,冖,阝,讠,刂,冫,等。原因由筆畫的原始功能推理而得。5.至少被某一筆畫完全隔離的,結(jié)構(gòu)上對稱分布并被包容的,兩個單筆畫不允許拆出組成一個型。如平,不可以拆成″干與丷″;木,不可以拆成″十與八″,原因文字學(xué)指出″漢字的結(jié)構(gòu)是一種積木式結(jié)構(gòu)″這五個不拆分原則在一定程度上保護(hù)了漢字的結(jié)構(gòu),但這還不足以成為一種方法。三.型元集1.型元集的產(chǎn)生文字學(xué)指出″漢字由合體字與獨(dú)體字組成,而且在早期的漢字中,合體字完全由獨(dú)體字構(gòu)成″??梢娫缙跐h字的基本結(jié)構(gòu)單元就是漢字,即不可拆分的獨(dú)體字,漢字的結(jié)構(gòu)規(guī)律呈現(xiàn)出完全的″文字性″。漢字發(fā)展到今天,它的結(jié)構(gòu)規(guī)律也再變化,但是″文字性″仍然是它最重要的內(nèi)容,此內(nèi)容可表述如下″漢字結(jié)構(gòu)是以基本漢字和常用非字偏旁為主,輔之以眾多的使用頻率很低的部件所構(gòu)成″。根據(jù)漢字結(jié)構(gòu)規(guī)律的″文字性″,結(jié)合″易于記憶″的設(shè)計原則和″限制拆分″的設(shè)計思想,坐標(biāo)碼將″結(jié)構(gòu)不可再拆分的漢字和常用非字偏旁″做為漢字拆分的依據(jù)。型元坐標(biāo)碼將結(jié)構(gòu)不可再拆分的漢字和常用非字偏旁稱″型元″,型元的總和稱型元集。型元集由三部分組成(1)符合五個不拆分原則的漢字和常用非字偏旁如十,九,口,廠,乙,木,等。(2)拆不出(1)中型元的漢字和常用非字偏旁,也是型元,如非,年,永,承等。(3)含有型元,但在坐標(biāo)碼的拆分規(guī)則中不允許拆分的漢字和常用非字偏旁,也是型元。如函,成,飛,王,失等。對于國標(biāo)GB2312(80)字符集,共有型元334個,其中漢字279個,常用偏旁55個,詳見附表。2.型元集的易記性型元集所含型元的數(shù)量并不少,但記憶起來十分容易,原因有兩條第一,它具有文字性,279個字型元是結(jié)構(gòu)最簡單的漢字,而且絕大多數(shù)是常用漢字;55個常用非字偏旁雖不是漢字,但由于它的常用性,它們實(shí)際上是一種″準(zhǔn)文字″,人們對它們的熟悉程序不低于常用漢字,所以型元集易于掌握。第二,它具有規(guī)律性,型元具有結(jié)構(gòu)不可再拆分的特點(diǎn),而且型元集是此類漢字,及常用非字偏旁的集合,所以型元的鑒別十分容易,″文字性″使型元集易于掌握,″規(guī)律性″使型元集易于區(qū)別,二者使型元集具有″易記性″。四.漢字拆分的關(guān)聯(lián)因素1.型的分類與性質(zhì)坐標(biāo)碼研究發(fā)現(xiàn),一個型在漢字中的″穩(wěn)定性″---既做″基本型″能力的大小,與構(gòu)成它的筆畫數(shù)有關(guān),也與筆畫間的組合方式有關(guān),坐標(biāo)碼根據(jù)筆畫數(shù)和組合方式將漢字中的型分類如下(1)單型僅有一個筆畫的型稱″單型″,型元集有兩個單型型元,一和乙。性質(zhì)單型的穩(wěn)定性最弱,只有特殊情況下才可以做基本型。(2)偶型由兩筆構(gòu)成的型稱″偶型″。如偶型元,人,兒,八,七,亠,等。性質(zhì)偶型的性質(zhì)很特殊,漢字結(jié)構(gòu)不確定因素集中地反映在偶型的身上。偶型的″穩(wěn)定性″居于單型和成型之間,偶型可否作基本型受諸多因素的影響。(3)成型由三筆及三筆以上筆畫構(gòu)成的型稱″成型″,成型根據(jù)筆畫之間的組合方式又分為三種1)正閉合型至少三面是由橫,豎線段構(gòu)成的閉合型及與之相交叉的筆畫稱″正閉合型″。如口,開,用,中,田等,2)相交型筆畫間含有相交關(guān)系的成型稱″相交型″。如木,寸,豐,才,等。3)堆積型筆畫間僅含粘連,離散關(guān)系的成型稱″堆積型″。如彡,巛,灬,立,火等。性質(zhì)成型的″穩(wěn)定性″比較強(qiáng),以成型元而言,一般情況下它們都是基本型,只有特殊情況下,成型元也可以不是基本型。2.型的部位關(guān)系部位關(guān)系是指漢字中型之間彼此的位置關(guān)系,漢字結(jié)構(gòu)的部位關(guān)系共有四種單一關(guān)系,上下關(guān)系,左右關(guān)系,內(nèi)外關(guān)系,(1)單一關(guān)系即孤立的關(guān)系如人,七,十,大。(2)上下關(guān)系型之間是上下排列的位置關(guān)系,如呂,古,竿,急,等。(3)左右關(guān)系型之同是左右排列的位置關(guān)系,如雙,林,葉,徹,等。(4)內(nèi)外關(guān)系型之間呈內(nèi)外分布的位置關(guān)系,如國,同,右,兇等。坐標(biāo)碼認(rèn)為上下,左右部位關(guān)系中的型,彼此之間相對獨(dú)立,是一種并列關(guān)系,適宜拆分;而內(nèi)外關(guān)系中的型,彼此之間存在一種聯(lián)系,相對而言獨(dú)立性較差,對拆分有一定的約束。3.型之同的″連接關(guān)系″″連接關(guān)系″是指兩型之間的接觸方式,即筆畫之間的連接方式。型之間的連接關(guān)系分為兩類″離散″與″粘連″。離散,顯然是有利于拆分的條件。粘連,根據(jù)情況又可分為三種具體情況(1)正閉合,兩個型若組成正閉合型,則兩個型之間的粘連方式稱″正閉<p>表1注CELMET是三維網(wǎng)狀多孔件,由SumitomoElectricIndustriesLtd.制造;#7是型號,表示每單位長度(1英寸)微孔數(shù)為50-70。B.存在粘連情況(直連或是斜連)或內(nèi)外關(guān)系時,偶型元是基本型的一部分,不可拆。如函(),辰(廠),亥(亠),午(十),貝(人),今(人),嚴(yán)(廠)等,簡而言之,此種情況下有一種外在約束(或是內(nèi)外關(guān)系,或是粘連關(guān)系),偶型元便不能自保,成為基本型的一部分,(2)當(dāng)對方為相交型時(正閉合型,見后述的準(zhǔn)型元)A.在斜連或離散情況下,不論部位關(guān)系如何,雙方均是基本型,可拆。如發(fā),,又;匆勹,B.在直連情況下,上下,左右部位關(guān)系可拆,雙方均為基本型;內(nèi)外部位關(guān)系不可拆,型元是基本型的一部分。如擊,,;叟,又;皮不可拆,″又″是字型元的一部分。簡而言之,對方為相交型時,一種外界的約束束縛不了偶型元,兩種外界的約束才能使雙方成為一個基本型。規(guī)則3-4″當(dāng)型元是單筆型元′一′和′乙′時,僅當(dāng)(1)對方是成型;(2)彼此離散;(3)不為內(nèi)外關(guān)系。三個條件均滿足時,可拆,雙方均為基本型。否則不可拆?!迦琨愐唬?;絲,一;乞,不可拆,是偶型;丞,不可拆,雙方粘連。六.拆字規(guī)則的擴(kuò)展規(guī)則1~3是坐標(biāo)碼的基本拆字規(guī)則,以此為基礎(chǔ)還可以得到一些其它的結(jié)論。1.單筆畫做基本型的條件坐標(biāo)碼中,單筆畫是可以做基本型的,但條件很嚴(yán)格。規(guī)則4單筆畫撇、捺不允許單獨(dú)做基本型;單筆畫橫、豎、折可以單獨(dú)做基本型,但要同時滿足下面三個條件第一.與相鄰型不為內(nèi)外關(guān)系;第二.與相鄰型不粘連;第三.相鄰型是型元。如私,禾,;孔子,乚;日,丨,日言,亠,一,一口;旦日,一。2.關(guān)于″一″的規(guī)則″一″很特殊,即是筆畫橫,又是型元壹″。漢字中有許多字是由某字與″一″組成的,如王一,土;天一,大;千,一;再一,冉;生牛,一;正一,止;丙一,內(nèi);亞一,業(yè);滅一,火;土十,一;閂門,一,酉西,一等等。為保護(hù)漢字結(jié)構(gòu)的完整性,規(guī)則5當(dāng)″一″與其它型元相組合時,″一″在拆分過程中以筆畫橫對待,拆分結(jié)果不受它的型元身份的影響,拆分結(jié)果是基本型,″一″是型元;否則,就是筆畫橫。如亙,一,日,一;″一″是型元。生,不可拆,″一″是筆畫。3.準(zhǔn)型元坐標(biāo)碼將漢字的型分為型元和非型元,基本型也分為型元基本型和非型元基本型,坐標(biāo)碼以型元集為核心,判定非型元型是否是基本型的拆字方法,是一種智能化的方法,也是獨(dú)一無二的。以往的碼,漢字的拆分結(jié)果必須是字根,字根是必須死記硬背的,而坐標(biāo)碼是不要求記憶非型元的,坐標(biāo)碼的這種拆分方法,其優(yōu)點(diǎn)是明顯的,第一,它只須記憶″文字性″的東西,這就擁有了易記憶的基礎(chǔ)。(型元集還具有″規(guī)律性″)第二,它承認(rèn)的漢字基本結(jié)構(gòu)單元是開放的(型元也可,非型元也可)所以,它的拆分結(jié)果容易符合漢字的結(jié)構(gòu)特點(diǎn)。事實(shí)上,目前得到公認(rèn)的,文字學(xué)界統(tǒng)計出來的六百余個構(gòu)字部件,反映在坐標(biāo)碼中,除少部分可以繼續(xù)拆分外,其中最常用,最主要的部分便反映在型元集中;另一部分約二百個使用頻率低,文字性差的構(gòu)字部件便以非型元基本型的形式出現(xiàn),而這一部分在坐標(biāo)碼中恰恰是不需要記憶的。這也就是坐標(biāo)碼既符合漢字的結(jié)構(gòu)規(guī)律,又易學(xué)易記的原因之一。成型元是型元集的主體,它具有兩個特征(1)文字性,(2)結(jié)構(gòu)的穩(wěn)定性。漢字的結(jié)構(gòu)中有一種型,它不具文字性(不是漢字,也不常用),卻具有成型元的穩(wěn)定性,對拆分一些漢字很有幫助,坐標(biāo)碼稱之為″準(zhǔn)型元″,準(zhǔn)型元有兩種。(1)正閉合型正閉合型,筆畫之間結(jié)合緊密,邊界清晰易于判別,所以坐標(biāo)碼將之做為準(zhǔn)型元。如鹿中″″,革中″″,面中″″。(2)成型元與某一筆畫交,連而成,由拆分規(guī)則,此單筆畫是不可拆分的,同時坐標(biāo)碼認(rèn)為此型的獨(dú)立性不應(yīng)低于型中的成型元,所以將之列入準(zhǔn)型元。如囪中,老中,系中。規(guī)則6″準(zhǔn)型元在漢字拆分上,其功能等同于成型元″。準(zhǔn)型元與型元的區(qū)別有兩點(diǎn)第一、準(zhǔn)型元不具備文字性;第二、鍵盤輸入方式不同,見后。引入準(zhǔn)型元后,坐標(biāo)碼的拆字手段更加完善。如“考、面”均無型元,引入準(zhǔn)型元后,拆分簡單而合理???,面,4.型層型層是基本型的組合體,是可拆的;同時型層的結(jié)構(gòu)完整性也更強(qiáng),判定非型元型是否是基本型的能力也更強(qiáng),規(guī)則7型層與單筆畫″橫,豎,折″相組合時,單筆畫是基本型。如買,乛,大(頭是型層)。司,一,口,(是型層)。5特例規(guī)則8(1)″一″與″相交型型元″粘連的情況當(dāng)″一″與型元相粘連時,根據(jù)規(guī)則4,5,″一″是不可拆的。但是,當(dāng)″一″相交型型元″粘連成非字型時,由于整體非字,如得中于,徐中禾,所以人們很容易識別出整體中的相交型型元,而且這樣做也便于取碼。為兼顧理論的嚴(yán)謹(jǐn)和實(shí)際的需求,坐標(biāo)碼將此種情況做為特例,并規(guī)定如下當(dāng)條件1)″一″與″相交型型元″粘連,但不是內(nèi)外關(guān)系;2)兩者之和是非字型,且不與第三者上下粘連,均被滿足時,′一′可拆,雙方均是基本型。如徐彳,,一,木;得彳,日,一,寸,余,一,木。(2)關(guān)于″一″的優(yōu)選方案″一″畢竟是型元,所以在一些場合,在不違反理論的前提下,″一″的拆分是一種優(yōu)選方案。如咸拆成″戊,一,口″正確;拆成″戌,口″錯誤。司,拆成″,一,口″正確,拆成″,口″錯誤。合,拆成″,一,口″正確,拆成″口″錯誤。規(guī)則9拆分漢字出現(xiàn)兩種情況時,根據(jù)下述順序拆分(1)對于型元″型元優(yōu)于非型元;成型元優(yōu)于偶型元;正選型元優(yōu)于歸并型元″。如″卡″,有二種情況″上與卜″和″與下″;是卜的歸并型元,所以第一種正確。又如″圭″,有″土與土″和″十與王″;根據(jù)″成型元優(yōu)于偶型元″,所以第一種正確。(2)對于連接關(guān)系″離散優(yōu)于粘連;斜連優(yōu)于直連″。如敖中″″,有兩種情況″與″和″與萬″;根據(jù)″斜連優(yōu)于直連″,所以第一種正確。解決了漢字拆分這一問題之后,便可以進(jìn)行漢字的編碼與輸入了,在編碼與輸入環(huán)節(jié)上,坐標(biāo)碼具有音碼的優(yōu)點(diǎn);簡單,直觀。在坐標(biāo)碼中,漢字的特征信息元就是基本型,型元集有334個型元,加上非型元基本型的存在,基本型的形式很多,如果和以往的碼一樣,將基本型的形式歸并在鍵位上進(jìn)行輸入,將會帶來很重的記憶負(fù)擔(dān),坐標(biāo)碼將不是一個好的漢字輸入法。坐標(biāo)碼在其漢字拆分方法的基礎(chǔ)上,形成了自己的獨(dú)特的編碼理論和方法,它不是輸入″基本型″這一特征信息元,而是輸入特征信息元″基本型″的特征信息,形象地說,它是漢字拆分后的″音形碼″。七.用于編碼和輸入的信息坐標(biāo)碼采用兩種信息進(jìn)行編碼與輸入,(1)音信息;(2)序碼1.音信息音信息,型元基本型碼名的第一個拼音字母,稱音信息,什么是″碼名″呢?型元分兩種,一種是字型元,一種是偏旁型元,對字型元而言,碼名就是該字本身,對于偏旁型元而言,坐標(biāo)碼根據(jù)它們俗名的特點(diǎn),用一個字做它們的碼名,音信息實(shí)際上就是碼名的聲母或是韻母的第一個字母,它不涉及漢語拼音的″平,卷舌音″,也不涉及″四聲″,所以它不受發(fā)音是否準(zhǔn)確的干擾。關(guān)于偏旁型元的碼名常用非字偏旁一般都有一個約定俗成的俗名,其取名的方法可歸納為三種(1)偏旁是某一合體字的一部分,用該合體字為偏旁取名,這叫″合體字名稱″。如趙中″″,稱趙字旁;虎中″″,稱虎字頭;(2)根據(jù)偏旁的特征取名,這叫″形特征名稱″,如巛,稱三拐,彡,稱三撇;口,稱方框。(3)根據(jù)偏旁與某字的聯(lián)系取名(是某字的古形或變形),這叫″同源名稱″。如忄與,稱豎心旁,(是心的古形),氵,稱三點(diǎn)水,(是水的古形);牛與稱牛字旁,(牛的變形)。在坐標(biāo)標(biāo)碼中,一般地具有″合體字名稱″的偏旁型元,它的″碼名″就是該合體字;具有″形特征名稱″的偏旁型元,它的″碼名″就取俗名的中心字;具有″同源名稱″的偏旁型元,它的″碼名″就是它的同源字。具體見下表。偏旁型元的碼名序號偏旁型元俗名類型碼名字母01亠文字頭合體字文W02廴建之兒合體字建J03丬將字旁合體字將J04廾弄字底合體字弄N05宀寶字蓋合體字寶B06彐尋字頭合體字尋X07疒病字頭合體字病B08虎字頭合體字虎H09春字頭合體字春C10卷字頭合體字卷J11祭字頭合體字祭J12癶登字頭合體字登D13趙字旁合體字趙Z14青字頭合體字青Q15共字頭合體字共G16冂同字匡合體字同T17灰字頭合體字灰H18勹包字頭合體字包B19衣字底合體字衣Y20出字頭合體字出C21冫兩點(diǎn)水形特征點(diǎn)D22冖禿寶蓋形特征禿T23三框欄形特征框K24口方框形特征方F25彡三撇形特征撇P26巛三拐形特征拐G27纟亂絞絲形特征亂L28采形特征采C29形特征刀D30讠言字旁同源言Y31刂立刀同源刀D32丷倒八字同源八B33私字同源私S34卩單耳刀形特征耳E35阝雙耳刀形特征耳E36忄豎心同源心X37辶走之兒同源走Z38小反小同源小X39攵反文同源文W40夂折文同源文W41犭反犬同源犬Q42饣食字旁同源食S43礻示補(bǔ)兒同源示S44牛牛字旁同源牛N45爫爪字頭同源爪Z46衤衣補(bǔ)兒同源衣Y47竹字頭同源竹Z48足足定旁同源足Z49钅金字旁同源金J50四四字頭同源四S51灬同源火H氵,扌,艸,亻4個偏旁型元的音信息是定義的。見后2.序碼坐標(biāo)碼通過″序碼″來提取漢字結(jié)構(gòu)的″形信息″。序碼″有規(guī)律的兩筆筆畫的組合稱序碼″。坐標(biāo)碼采用下述三種序碼(1)音序碼基本型的第一,二兩筆組合稱″音序碼″。(2)端序碼基本型或是型層,合體字的首末筆畫的組合稱″端序碼″。(3)全序碼全序碼由兩碼構(gòu)成,首碼即基本型的″音序碼″,次碼即基本型余部的″端序碼″。即提取基本型的第1,2,3末,筆畫編碼。它們的使用方法將在編碼規(guī)則中述及。序碼的可行性我們知道每一個人均可以正確書出自己并不認(rèn)識的漢字,因?yàn)椤骞P順″是漢字中最基本的常識,而且序碼所涉及的筆畫僅為兩個位置特殊的筆畫,所以說序碼具有簡單易行性。序碼的意義序碼的形式很簡單,卻是坐標(biāo)碼不可缺少的理論支柱之一。第一,它解決了非型元基本型的輸入問題。第二,它可以進(jìn)入漢字結(jié)構(gòu)的內(nèi)部,準(zhǔn)確地提取形信息,保證了編碼信息的多樣性與完備性。第三,它的引入,使得坐標(biāo)碼可以不用以往碼所使用的″特征信息元?dú)w并后輸入″的形信息輸入方法,使坐標(biāo)碼的輸入環(huán)節(jié)異常簡單,方便,坐標(biāo)碼的鍵盤內(nèi)容比音碼中的雙拼雙音方法的鍵盤內(nèi)容還要簡單。序碼的基礎(chǔ)---筆順筆順寫正楷字時,下筆的先后順序叫″筆順″。筆順,是人們長期書寫經(jīng)驗(yàn)的總結(jié),是實(shí)踐中形成的,有如下主要規(guī)則從上到下三言豆分早呂;從左到右以葉川塊形朋;先橫后豎十寸井正豐木;先撇后捺人入八尺火爪;先中間后兩邊小承辦水永亦;從外到內(nèi)飛月風(fēng)向內(nèi)間;從里到外兇函這遠(yuǎn)建;先主體后串心韋冊豐串書;先主體后點(diǎn)點(diǎn)我發(fā)犬威龍;先點(diǎn)點(diǎn)后主體義主為;八.型元的變形與歸并在坐標(biāo)碼中,型元存在歸并現(xiàn)象,歸并有兩種情況。1.歸并的雙方形狀差異較大如忄與,尤與尢,聿與肀,這種歸并常見于漢字字典之中,有其歸并的道理。在坐標(biāo)碼中,只承認(rèn)型元?dú)w并表中列出的情況。2.歸并的雙方結(jié)構(gòu)相似漢字是一種方塊文字,不論漢字結(jié)構(gòu)的繁簡,也不論漢字筆畫的多少,漢字的外形都是一個方塊,為保持方塊內(nèi)部的平衡,構(gòu)字的″基本型″就只能做一些改變---變得或大或小,或長或扁,以適應(yīng)方塊的要求;一些筆畫也因此做一定的改動,以避免筆畫間的覆壓。如材中的″木-″;撬中的″-毛″;鳩中的″-九″。(1)對于含″折″筆的″非交叉″偶型元,由于″折″筆的形態(tài)很多,而且非交叉的兩筆型其結(jié)構(gòu)特征點(diǎn)又少,所以坐標(biāo)碼規(guī)定″含折筆的非交叉偶型元,只要折筆發(fā)生形變,型元?dú)w并表又未承認(rèn),兩個型就不能歸并,變化后的型是一個非型元型?!迦缫娭小濉澹筒皇桥夹驮遑纭?。(2)對余下的型元坐標(biāo)碼規(guī)定下述兩種情況下可以自然歸并,而且不列入型元并表。A.全等型歸并若型元的某一筆畫發(fā)生形變,但整體的結(jié)構(gòu)關(guān)系不變,筆畫的種類也未變,則稱這兩個型是″全等型″可以歸并如又--;八-;毛-;王-;木-。B.復(fù)縱筆型歸并按運(yùn)筆方向?qū)⒇Q,豎撇及折的豎段,稱為″縱向筆畫或線段″,一個型元如果含有兩個及兩個以上的″長的″″縱向筆畫或線段″,當(dāng)″縱向筆畫或線段″形變,但仍為″縱向筆畫或線段″時,允許兩個型歸并。如甩--;用--;開-;井--亦;月-;。注″月″與″″在坐標(biāo)碼中,是有規(guī)律可循的,在上下關(guān)系中,認(rèn)為是″″,而在左右關(guān)系時,認(rèn)為是″月″,如明,朋,胃,娟,復(fù)縱筆型允許歸并,是因?yàn)榇祟愋偷慕Y(jié)構(gòu)特征點(diǎn)多,變化一點(diǎn)之后,仍然易于識別,仍然相近,所以坐標(biāo)碼認(rèn)為它們可以自然歸并。其它情況其它的變形,僅當(dāng)型元?dú)w并表承認(rèn)的情況可以歸并,否則不可以歸并。相歸并的型元有何不同輸入時,它們的″音″信息相同,但它們的″序碼″將有所不同(全等形不變)。九.坐標(biāo)碼的鍵盤鍵盤用來輸入漢字的編碼信息,坐標(biāo)碼的鍵盤非常簡單,它的內(nèi)容少于音碼的″雙拼雙音″,詳見附錄中的坐標(biāo)碼鍵盤示意圖。坐標(biāo)碼鍵盤由四部分組成1英文字母用以輸入型元的″音″信息″-第一個拼音字母。英文字母位置不變。2序碼用以輸入″形″信息-序碼。將鍵盤上的25個個英文字母(N不用)分成五個區(qū),對應(yīng)序碼的首筆″橫,豎,撇,捺,折″,每個區(qū)按″橫,豎,撇,捺,折″順序從中間向兩側(cè)排列對應(yīng)序碼的次筆,這樣25個序碼元對應(yīng)了25個英文字母,構(gòu)成了″序碼鍵盤″。由于″序碼鍵盤″極簡單又極富規(guī)律,所以無須記憶,容易掌握,3.一級簡碼坐標(biāo)碼的26個一級簡碼,被組成5句話定義在26個字母鍵上,輸入時一字一鍵,用以提高單字輸入的速度。4.6個特殊型元型元艸,木,氵,扌,月,亻的音信息是定義的,借以離散漢字,減少重碼,定義關(guān)系如下氵-U;扌-l;艸-A;木-V;亻-O;月-P序碼和鍵盤的對應(yīng)關(guān)系如下序碼(首筆/次筆)一/一一/丨一/丿一/丶一/字母GFDSA序碼(首筆/次筆)丨/一丨/丨丨/丿丨/丶丨/字母HJKLM<p>表7</tables>注CELMET是三維網(wǎng)狀多孔件,由SumitomoElectricIndustriesLtd.制造;#7是型號,表示每單位長度(1英寸)微孔數(shù)為50-70。爽大,DZZZ座廣,人,人,土;GRRT2.特殊情況(1)特殊的型元漢字在鍵位上的分布(即第1碼的分布情況)是不均勻的。V,U,I,不是漢語拼音,只是序碼鍵位,所以鍵位上的漢字極少;O.P.A鍵位上的漢宇也很少,如A鍵,不算序碼的話只有一個″凹″字,為了充分地利用鍵位,更好地離散漢字減少重碼,坐標(biāo)碼將漢字中最大的6個型元部首氵,木,扌,艸,月,亻,采用定義的方式放在上述6個鍵位上,如此,它們的輸入也就與本身無關(guān)。對應(yīng)關(guān)系如下氵-U;扌-I;艸-A;木-V;亻-O;月-P。(2)特殊情況的編碼規(guī)則上述6個鍵位和K鍵上的漢字,第1個基本型絕大部分是一樣的,即氵,扌,艸,木,亻,月,口。若按一般情況取碼,雙型字的第3碼,三型字的第4碼(端序碼)首筆將失去離散漢字的功能,為此,坐標(biāo)碼將首基本型為上述6個型元(不包括″月″)的漢字,做為特殊情況,單立編碼規(guī)則。1)單型字(包括偏旁)多型字編碼規(guī)則同一般情況。2)雙型字碼長為4,第1,2碼,同一般情況;第3,4碼,取″次基本型″的全序碼″。實(shí)際上,后三碼就是″次基本型″的″全碼″。3)三型字碼長為4,第1,2,3碼,同一般情況;第4碼,取后兩個基本型的″端序碼″。詞組編碼規(guī)則單字取碼,取的是基本型的特征信息,詞組取碼則以單字的拼音首字母為主。由于詞組輸入方式更多地引入整字的拼音首字母,徹底地消除了單字的端序碼,所以詞組方式下的坐標(biāo)碼文字性更顯著,取碼更直觀,快速,這是坐標(biāo)碼可以快速輸入漢字的另一個理論根據(jù)。雙字詞每個字取其全碼的前兩個碼如坐標(biāo),RRVY人民,RW*MB三字詞第1,2,3碼分別是三個字的拼音首字母。第4碼取末字全碼的首碼。如自行車ZXCC中草藥ZCYA多字詞順序提取第1,2,3,末字的拼音首字母。如經(jīng)濟(jì)特區(qū)JJTQ艱苦奮斗JKFD本發(fā)明之優(yōu)點(diǎn)編碼方法簡單,易于實(shí)現(xiàn)計算機(jī)漢字快速輸入,重碼率低,便于記憶,便于學(xué)習(xí)。具體實(shí)施例方式例1″月″,″禾″字月,是滿是五個不拆分原則的字型元,碼長為3,月YQ*G*禾,含有型元″木″,但根據(jù)規(guī)則″單筆畫撇不可以單獨(dú)做基本型″,所以,″禾″也是字型元碼長為3,禾HT*L*月,禾兩字第1個碼是它們的″音信息″,第2,3碼是它們的″全序碼″。例2″所″字″所″含有兩個基本型,一個是型元基本型″斤″,一個是非型元基本型″″。編碼為所E*JT*R*例3″科″字″科″含有三個型元基本型,禾,,十編碼為HDSR*,第四碼補(bǔ)的是整字的端序碼R*。例4″攀″字攀,有6個型元基本型,為″木,,,木,大,手″。編碼順序提取第1,2,3末,基本型編碼;攀MZZS。例5″考″字考,根據(jù)″準(zhǔn)型元″予以拆分,含有兩個非型元基本型″″,編碼完全由序碼構(gòu)成考F*A*D*A*權(quán)利要求1.一種計算機(jī)漢字輸入坐標(biāo)碼編碼方法,其特征是該編碼方法由坐標(biāo)碼無″字根集″的拆字方法及坐標(biāo)碼的編碼方法兩部分組成,坐標(biāo)碼無″字根集″的拆字方法由五個不拆分原則;漢字拆分的依據(jù)--型元集;漢字拆分的相關(guān)因素;漢字的拆分規(guī)則組成,坐標(biāo)碼的編碼方法由用于編碼和輸入的信息;坐標(biāo)碼與鍵盤的對應(yīng)關(guān)系編碼規(guī)則組成;其中型元集由三部分組成(1)符合五個不拆分原則的漢字和常用非字偏旁;(2)拆不出(1)中型元的漢字和常用非字偏旁,也是型元;(3)含有型元,但在坐標(biāo)碼的拆分規(guī)則中不允許拆分的漢字和常用非字偏旁,也是型元對于國標(biāo)GB2312(80)字符集,共有型元334個,其中漢字279個,常用偏旁55個;漢字拆分的相關(guān)因素由型的分類與性質(zhì),型的部位關(guān)系,型之間的連接關(guān)系所組成;其中用于編碼和輸入的信息由″音信息″和″序碼″組成。2.按權(quán)利要求1所述之編碼方法,其特征在于所述之五個不拆分原則為(1)一個筆畫不允許拆成兩截,斷在兩個型中,原因單一筆畫理應(yīng)完整;(2)相交叉的筆畫不允許拆分,原因″交叉″是一種緊密的組合方式;(3)相端連的筆畫不允許拆分,原因″端連″也是一種緊密型組合方式;(4)由兩筆構(gòu)成的漢字和常用非字偏旁不允許拆成筆畫,原因由筆畫的原始功能推理而得;(5)至少被某一筆畫完全隔離的,結(jié)構(gòu)上對稱分布并被包容的,兩個單筆畫不允許拆出組成一個型,原因文字學(xué)指出″漢字的結(jié)構(gòu)是一種積木式結(jié)構(gòu)″。3.按權(quán)利要求1所述之編碼方法,其特征在于漢字拆分的相關(guān)因素一型的分類與性質(zhì)為一個型在漢字中的″穩(wěn)定性″---既做″基本型″能力的大小,與構(gòu)成它的筆畫數(shù)有關(guān),也與筆畫間的組合方式有關(guān),坐標(biāo)碼根據(jù)筆畫數(shù)和組合方式將漢字中的型分類如下(1)單型僅有一個筆畫的型稱″單型″,型元集有兩個單型型元,一和乙。性質(zhì)單型的穩(wěn)定性最弱,只有特殊情況下才可以做基本型;(2)偶型由兩筆構(gòu)成的型稱″偶型″;性質(zhì)偶型的性質(zhì)很特殊,漢字結(jié)構(gòu)不確定因素集中地反映在偶型的身上。偶型的″穩(wěn)定性″居于單型和成型之間,偶型可否作基本型受諸多因素的影響,(3)成型由三筆及三筆以上筆畫構(gòu)成的型稱″成型″,成型根據(jù)筆畫之間的組合方式又分為三種1)正閉合型至少三面是由橫,豎線段構(gòu)成的閉合型及與之相交叉的筆畫稱″正閉合型″;2)相交型筆畫間含有相交關(guān)系的成型稱″相交型″3)堆積型筆畫間僅含粘連,離散關(guān)系的成型稱″堆積型″性質(zhì)成型的″穩(wěn)定性″比較強(qiáng),以成型元而言,一般情況下它們都是基本型,只有特殊情況下,成型元也可以不是基本型。4.按權(quán)利要求1所述之編碼方法,其特征在于漢字折分的相關(guān)因素--型的部位關(guān)系,部位關(guān)系是指漢字中型之間彼此的位置關(guān)系,漢字結(jié)構(gòu)的部位關(guān)系共有四種單一關(guān)系,上下關(guān)系,左右關(guān)系,內(nèi)外關(guān)系,坐標(biāo)碼認(rèn)為上下,左右部位關(guān)系中的型,彼此之間相對獨(dú)立,是一種并列關(guān)系,適宜拆分;而內(nèi)外關(guān)系中的型,彼此之間存在一種聯(lián)系,相對而言獨(dú)立性較差,對拆分有一定的約束。5.按權(quán)利要求1所述之編碼方法,其特征在于漢字折分的相關(guān)因素--型之間的″連接關(guān)系″,″連接關(guān)系″是指兩型之間的接觸方式,即筆畫之間的連接方式,型之間的連接關(guān)系分為兩類″離散″與″粘連″,離散,顯然是有利于拆分的條件;粘連,根據(jù)情況又可分為三種具體情況(1)正閉合兩個型若組成正閉合型,則兩個型之間的粘連方式稱″正閉合″;(2)直連兩型之間相粘連筆畫之間的關(guān)系,均為直連關(guān)系時,兩型之同是″直連″關(guān)系;(3)斜連兩型之間相粘連筆畫之間的關(guān)系,存在斜連關(guān)系時,兩型之間就是″斜連″關(guān)系;坐標(biāo)碼認(rèn)為,正閉合是型之間緊密的粘連方式;直連是比較緊密的連接方式,斜連是最弱的粘連方式。6.按權(quán)利要求1所述之編碼方法,其特征在于漢字的折分規(guī)則為規(guī)則1完全由型元組成的漢字和型層,型元均是基本型,可拆;規(guī)則2拆不出型元的漢字和常用非字偏旁,即無型元做為判定依據(jù)時,其本身也是型元,不可拆;規(guī)則3當(dāng)型元和非型元型相組合時,型元不一定是基本型,拆分結(jié)果與(1)型的類別(2)部位關(guān)系,(3)連接關(guān)系三者有關(guān);1)型與型之間有四種連接方式,對于正閉合″坐標(biāo)碼規(guī)定規(guī)則3-1型與型為正閉合關(guān)系時,僅當(dāng)雙方均為型元時可拆,兩者都是基本型,否則不可拆;2)對于型之同的″離散″和″直連″″斜連″三種連接方式,坐標(biāo)碼有如下規(guī)則規(guī)則3-2當(dāng)型元是成型元時,只要對方不是單型,即可拆分,雙方均為基本型″;規(guī)則3-3當(dāng)型元是偶型元時,拆分結(jié)果將取決于″型的類別,部位關(guān)系和連接關(guān)系″三個因素″;①當(dāng)對方為偶型和堆積型時即不粘連也不是內(nèi)外關(guān)系時,雙方均是基本型,可拆;存在粘連情況(直連或是斜連)或內(nèi)外關(guān)系時,偶型元是基本型的一部分,不可拆;②當(dāng)對方為相交型時在斜連或離散情況下,不論部位關(guān)系如何,雙方均是基本型,可拆;在直連情況下,上下,左右部位關(guān)系可拆,雙方均為基本型;內(nèi)外部位關(guān)系不可拆,型元是基本型的一部分;規(guī)則3-4″當(dāng)型元是單筆型元′一′和′乙′時,僅當(dāng)(1)對方是成型;(2)彼此離散;(3)不為內(nèi)外關(guān)系,三個條件均滿足時,可拆,雙方均為基本型,否則不可拆規(guī)則4單筆畫撇、捺不允許單獨(dú)做基本型;單筆畫橫、豎、折可以單獨(dú)做基本型,但要同時滿足下面三個條件與相鄰型不為內(nèi)外關(guān)系;與相鄰型不粘連;相鄰型是型元;規(guī)則5當(dāng)″一″與其它型元相組合時,″一″在拆分過程中以筆畫橫對待,拆分結(jié)果不受它的型元身份的影響,拆分結(jié)果是基本型,″一″是型元;否則,就是筆畫橫;規(guī)則6準(zhǔn)型元在漢字拆分上,其功能等同于成型元;規(guī)則7型層與單筆畫″橫,豎,折″相組合時,單筆畫是基本型;規(guī)則8拆分漢字出現(xiàn)兩種情況時,根據(jù)下述順序拆分(1)對于型元″型元優(yōu)于非型元;成型元優(yōu)于偶型元;正選型元優(yōu)于歸并型元″;(2)對于連接關(guān)系″離散優(yōu)于粘連;斜連優(yōu)于直連″;7.按權(quán)利要求1所述之編碼方法,其特征在于用于編碼和輸入的信息--為音信息和序碼,音信息是型元基本型碼名的第一個拼音字母;序碼為有規(guī)律的兩筆筆畫的組合,它們是漢字特征信息元″基本型″的特征信息。8.按權(quán)利要求1所述之編碼方法,其特征在于坐標(biāo)碼與鍵盤的對應(yīng)關(guān)系為音信息與鍵盤字母一一對應(yīng),序碼對應(yīng)關(guān)系如下序碼(首筆/次筆)一/一一/丨一/丿一/丶一/字母GFDSA序碼(首筆/次筆)丨/一丨/丨丨/丿丨/丶丨/字母HJKLM序碼(首筆/次筆)丿/一丿/丨丿/丿丿/丶丿/字母TREWQ序碼(首筆/次筆)丶/一丶/一|丶/丿丶/丶丶/字母YUIOP序碼(首筆/次筆)/一/丨/丿/丶/字母BVCXZ。9.按權(quán)利要求1所述之編碼方法,其特征在于編碼規(guī)則為單字編碼規(guī)則和詞組編碼規(guī)則,其中單字編碼規(guī)則一般情況為單型字碼長為3,由字型元的音和全序碼組成,即″音″+″全序碼″+空格雙型字碼長為4,第1,2碼,按筆順提取基本型的″音″或″音序碼″,第3,4碼,按筆順提取基本型各自的″端序碼″;三型字碼長為4,第1,2,3碼,按筆順提取三個基本型的″音″或″音序碼″,第4碼取整字的″端序碼″;多型字碼長為4,按筆順提取第1,2,3末基本型的″音″或″音序碼″;特殊情況為坐標(biāo)碼將首基本型為艸,木,氵,,亻,口6個型元的漢字做為特殊情況,單立編碼規(guī)則,單型字與多型字編碼規(guī)則同一般情況;雙型字碼長為4,第1,2碼,同一般情況;第3,4碼,取″次基本型″的全序碼″三型字碼長為4,第1,2,3碼同一般情況,第4碼取后兩個基本型的端序碼;詞組編碼規(guī)則雙字詞每個字取其全碼的前兩個碼;三字詞第1,2,3碼分別是三個字的拼音首字母,第4碼取末字全碼的首碼;多字詞順序提取第1,2,3,末字的拼音首字母。全文摘要本發(fā)明屬于一種計算機(jī)漢字輸入之編碼方法,本編碼方法由坐標(biāo)碼無“字根集”的拆分方法與坐標(biāo)碼的編碼方法所組成,其拆分方法包括坐標(biāo)碼五個不拆分原則,漢字拆分依據(jù)---型元型,漢字拆分相關(guān)因素,漢字拆分規(guī)則,其編碼方法有編碼和輸入的信息,坐標(biāo)碼與鍵盤的對應(yīng)關(guān)系,編碼規(guī)則等。優(yōu)點(diǎn):編碼方法簡單,易于實(shí)現(xiàn)計算機(jī)漢字快速輸入、重碼率低,便于記憶,便于學(xué)習(xí)。文檔編號G06F3/023GK1173660SQ9611952公開日1998年2月18日申請日期1996年10月31日優(yōu)先權(quán)日1996年10月31日發(fā)明者葉平申請人:葉平