專利名稱:自然快速漢字輸入法的制作方法
眾所周知,目前編創(chuàng)出來的漢字輸入法并不少,但是真正可推出使用的沒有幾個。五筆輸入法算是目前的嬌嬌者,它是專職人員普遍使用的輸入法,也是計算機培訓(xùn)時唯一選用的輸入法,它的優(yōu)點是快,它的缺點是拆字極不規(guī)范,學(xué)起來、用起來很麻煩,要記那么些古怪的字根,學(xué)會了以后,如果常不用或掉開手,學(xué)了也似乎別學(xué),不能隨時想用就用。最簡單和不用學(xué)的漢字輸入法,當(dāng)然是漢拼了,但是漢拼要求拼音準(zhǔn),拼不準(zhǔn)無法輸入漢字,且重碼普遍、重碼字太多。拼不準(zhǔn)要查字典,拼準(zhǔn)了,又常常要翻頁選字,實在是太慢!由此,人們感嘆,為什么外國人輸入英文是那么簡單、不會有任何困難,而中國人輸入漢字卻這么難!為什么中國人輸漢字還要當(dāng)一門技術(shù)來培訓(xùn)呢?人們在期待著一個真正簡單、自然與快捷的漢字輸入法出世。
自然快速漢字輸入法是以基本編碼方法為核心的計算機漢字輸入法,屬于計算機軟件技術(shù)。本漢字輸入法以不斷找出偏首(為主)、非偏首最小成字(為輔)為基本思路建立編碼體,以只拆分不拆解為拆字基本原則,以拆大或拆少為基本拆字方法,以取成字編碼體發(fā)音首母、類成字編碼體發(fā)音首母、非成字編碼體稱謂發(fā)音首母或首筆劃發(fā)音首母為編碼體碼母進(jìn)行漢字編碼,具有自然、簡單(幾乎不用學(xué),不用培訓(xùn),也不用記)、標(biāo)準(zhǔn)(符合國標(biāo)拆字)、最大容錯(幾乎按你平時的拆分即可取音編碼)和快速(雖重碼稍多一點,但拆字和編碼自然、簡單、標(biāo)準(zhǔn),故與五筆幾乎一樣快)之特性,是音形碼類的典范,也將是未來的國標(biāo)漢字輸入法。自然快速漢字輸入法把漢字輸入看成是一門可自然、普遍和隨便使用的普通或日常工具,不把它看成是一門需要培訓(xùn)的計算機技術(shù)工具。本漢字輸入法的出現(xiàn),也為小學(xué)結(jié)合漢字結(jié)構(gòu)學(xué)習(xí),開設(shè)計算機基礎(chǔ)(漢字輸入)課程奠定了基礎(chǔ)。本法的內(nèi)容包括漢字編碼的基本方法(核心)和簡碼、詞碼、容錯碼、萬能鍵碼等。
一、基本方法漢字輸入不可能像英符輸入一樣,單擊鍵盤上的相應(yīng)鍵便可鍵入。漢字輸入必須在確定的編碼方案下,在相應(yīng)的軟件支持下,組合擊鍵方可鍵入,也就是說漢字必須編碼輸入。漢字編碼方案(或方法)是漢字輸入法的核心,分析和綜合當(dāng)前所有的漢字輸入法,可清楚地看出,漢字輸入法的編碼類別有三類,形碼、音碼和形音碼。五筆是形碼類的代表,漢拼是音碼類的代表,形音碼類目前無合適的代表。
實踐證明,只有利用拆字來編碼(依形編碼),才有可能最大程度地實現(xiàn)其漢字的快速輸入;只有利用漢語拼音來編碼(依音編碼)才有可能最大程度地實現(xiàn)其漢字的自然和簡單化輸入;只有把兩者很好地結(jié)合起來,揚長避短,才有可能實現(xiàn)其漢字既自然、簡單,又快速的輸入。目前是有結(jié)合兩者創(chuàng)編出來的音形碼輸入法,但其都不怎么樣好。
本漢字輸入法是形碼和音碼方法結(jié)合而產(chǎn)生的音形碼輸入法。其基本方法的內(nèi)容自然包括拆字和取碼、編碼兩部分。
(一)拆字本輸入法的拆字是在從整字體中或構(gòu)字體中不斷地拆出偏旁部首(以后簡稱偏首)的思路之基礎(chǔ)上建立起來的,以找到本法編碼的結(jié)構(gòu)依據(jù)(即編碼體)為目標(biāo)的方法體系,是依形用音編碼的首要前提。其內(nèi)容包括拆字所遵從的基本原則、拆字的目標(biāo)—即編碼體和拆字方法。
1、拆字必須遵從的基本原則原則之一,只允許拆分不允許拆解。即只允許分開筆劃拆字,不允許解開筆劃來拆字。也就是說,只能把相互間沒有筆劃交織的構(gòu)字體拆分開,不能把相互間有筆劃交織的構(gòu)字體拆解開。
例如,“我”字中的 和“戈”雖都是本法中的編碼體,但按本原則卻不能被拆出;“埋”字中的“里”由于按本原則不可再拆,故“埋”只能拆成“土、里”;“老”字按本原則只可拆成“十、 匕”;“夫”不能拆成“二、人”。
原則之二,本身不是編碼體(編碼體的解釋見后)的漢字必須拆字編碼,本身是編碼體的漢字直接依音取碼編碼。
從其內(nèi)容可看出本拆字基本原則完全體現(xiàn)了國標(biāo)拆字所蘊含的基本規(guī)則。國標(biāo)拆字就是我們大家平時拆字的標(biāo)準(zhǔn)化和統(tǒng)一化。
2、編碼體編碼體是本法編碼的結(jié)構(gòu)依據(jù),是從國標(biāo)拆字中提取和匯總出來的基本構(gòu)字體,也是本法拆字思路的產(chǎn)物。
本法所稱或所用的編碼體包括非成字和類成字偏首編碼體、成字編碼體、非成字非偏首編碼體。
(1)非成字和類成字偏首編碼體是指字典偏首表中所有的非成字偏首體和類成字偏首體,以及少數(shù)個別非偏首類成字體。
例如、丷、、 (類屬于刀)、 (類屬于疋)、 (類屬于衣)、 爫(類屬于爪)、牜()、 (類屬于又)、 (類屬于 (類屬于竹)、 (類屬于匕)、 (不是偏首)。 讠、礻、衤、匚、冂、丿等。
(2)成字編碼體是指按只拆分不拆解原則不能再拆分出更小成字體的所有一體最小成字體及由最小成字體加一筆劃所形成的一體小成字體。所謂的一體就是指成字體明顯是一個整體,不是分散體(即不是左右分開型或上下分開型或內(nèi)外分開型體)。此外,“白、木、火、禾、田、魚、目、自、且、蟲”也是成字編碼體。
例如刀、刃、里(不可拆分)、勿、匆、夫、馬、鬼、兔、廿、乂、幺、匕、七、又、止(不是成字)、半、電、千、干、土、我、廣、央、尢、尤、無、皿、血、烏、鳥、巾、幣、義、夕、歹、人、個、正、水、方、萬、王、立、習(xí)、等。扎、印不是一體字,所以不為成字編碼體。
本類編碼體,只需要記幾個字(只記是編碼體,不記其取碼,也可在鍵盤旁貼一小紙條提示而不用記)。
(3)非偏首非成字編碼體是既非偏首又非成字,既再拆不出偏首、又再拆不出成字的不可再拆(或被認(rèn)為是一體的)構(gòu)字體,實際上,就是拆出偏首編碼體和成字編碼體后余留下來的不可分和一體構(gòu)字體。
例如, 、、、 (大約就這么幾個)等。注意,五種單筆劃屬偏首編碼體,不歸在本類。本類編碼體也不需要記,臨時界定和判斷即可,用的時間長了,就象五筆的字根一樣會記牢。
上邊三類編碼體實際上幾乎就是國標(biāo)拆字或我們一般拆字拆出的結(jié)構(gòu)體,不信大家試拆看。
3、拆分方法很簡單,可表述為在遵從基本原則的前提下,把漢字拆成全是編碼體,且使所拆出的編碼體盡可能的大,或盡可能的少。注意,不能拆出非編碼體。
從以上介紹的基本原則、編碼體和拆分字方法可看出本輸入法的拆字是幾乎完全符合國標(biāo)拆字法。下邊舉例說明如何用本輸入法的拆分原則和拆分方法來拆分漢字。
“韶”→立、日、刀、口(本來“音”也是偏首,但按定義,它不是偏首編碼體);蔥→艸、匆、心(“艸”是偏首編碼體,“匆”是非偏首最小成字編碼體,“匆”內(nèi)含的“勹”是偏首編碼體,但按取大原則應(yīng)拆成如此);羽→習(xí)、習(xí)(冫是偏首編碼體,習(xí)是非偏首最小成字編碼體,取大應(yīng)拆成如此);空→宀、八、工;繩→纟、口、電;羈→四、廿、 月、馬 是非成字非部首編碼體);國→囗、王、丶;賠→ 人、立、口;彩→爫、 木、彡。從這些例證可看出本輸入法拆字的特點是簡單、適度、規(guī)范和標(biāo)準(zhǔn)。
(二)編碼體的取碼和漢字編碼本輸入法是依形用音編碼的輸入法。所謂的用音就是利用拼音給編碼體取碼,然后根據(jù)漢字的編碼體給漢字編碼。
1、編碼體的取碼成字編碼體、類成字編碼體取其發(fā)音的首母為其碼母;非成字編碼體有稱謂的取其稱謂發(fā)音的首母為其碼母(除個別例外),無稱謂的取其首筆稱謂發(fā)音的首母為其碼母。注意上述各類中都包含有偏首和非偏首兩類編碼體在內(nèi)。
非成字偏首的稱謂是刂(側(cè)刀)、艸(草字頭)、 忄(樹心)、宀(寶蓋頭)、冖(軍字頭)、冫氵灬(統(tǒng)稱滴水)、亻彳(立人)、扌(例外,取0,需記下)、廴(健字旁)、辶(車車)、疒(病字頭)、亠(高字頭)、(虎字頭)、纟(紐絲)、夂(反文)、阝(耳朵)。
勹、 匚、凵、卩( )、巛、厶、丨、 丶、丿、一、等取首筆稱謂發(fā)音首母。
編碼體的碼母雖說是拼音取之,但因任何拼不準(zhǔn)音的漢字其拼音首母一定能拼準(zhǔn),且又編碼體必競是少數(shù),故不存在拼不出編碼體首母的情況。編碼體取碼實質(zhì)上與五筆字根的取碼沒什么不同,只是不需要死記。
2、漢字的基本編碼(1)本身是編碼體的漢字的基本編碼編碼方法是取其拼音的各音母為其基本編碼或取其拼音首母為其基本編碼(兩種都是本類漢字的編碼,任其選擇)。
本身是編碼體的漢字不多(約小幾十個),且都是常見的基本漢字或因難拆而拆不出的漢字,故不存在拼不準(zhǔn)音(或碼母)的情況,打的多了,也是像五筆成字字根一樣,一見字不拼音即知編碼。
(2)非編碼體漢字的基本編碼非編碼體漢字都要拆字編碼。其編碼方法是拆出的編碼體為四個或四個以下的漢字,順序取其各編碼體的碼母組合成為其漢字編碼;多于四個編碼體的漢字,順序取其前四編碼體的碼母為其漢字編碼。
注意,本輸入法雖說是依音取碼,但實質(zhì)上并不是拼音編碼。
自然取碼是本編碼方法的最大優(yōu)點。
3、補碼經(jīng)拼音和拆字編碼后,有一部分漢字的編碼不足四碼,故需要補足四碼,這樣才能使重碼最少。本法補碼的方法也很簡單、自然,不需要什么理解和記憶。
(1)依字型取補碼漢字的字型可分為五種,即可分為上下型、左右型、方正型(本型漢字的編碼體有四個,不需要依型編碼)、半包型、全包型和一體型。分別取S(上)X(下)、z(左)Y(右)、YT(一體)、bb(半包)、Qb(全包);或a(above)b(below)、L(left)R(right)、ob(one body)、hc(half close)、wc(whole cloce)。取后者,重碼少。到究取何,最終決定于實踐。
例鄧-ZY、音-SX、我-YT、包、建-BB、國-QB。
依字型補碼的方法是不足四碼的漢字,短幾碼依其字型順序取幾個字型碼,大多數(shù)漢字可補夠四碼。
(2)依未筆補碼由于少數(shù)(二、三十來個)是編碼體的漢字如果采取發(fā)音“首”母編碼時只能編一碼。所以,補上字形碼還不夠四碼,須再補一末筆劃碼(取其稱謂發(fā)音首母)。
二、其它內(nèi)容(一)容錯碼對于有些漢字,人們在編碼時,因歧誤或失誤,易于產(chǎn)生錯誤編碼,由于輸入法是一門工具,所以,一般漢字輸入法都會在一定程度范圍內(nèi)容許輸入者產(chǎn)生某些錯誤的編碼,并在軟件方面支持這種容錯碼。所以,容錯碼就是在各種輸入法中容許其編錯的碼。本輸入法也支持(或容許)一定情況下的錯誤編碼,且以最大的胸懷做到最大的容許。到究多大程度,大家用中知。例“拔”應(yīng)拆成“扌、、又、丶”,但有人可能拆成 友、丶”或 又”;“棋”本應(yīng)拆成“木 八”,但有人拆成“木、艸、三、八”(受五筆影響)。
(二)簡碼各種漢字輸入法幾乎都有簡碼,且簡碼編制的方法差不多。所謂簡碼,就是其漢字編碼為一、二、三碼的漢字編碼。同樣本法也有簡碼,其編制方法是取其選定漢字的前一碼或前二碼或前三碼為其簡碼。每個選定的漢字只有一個簡碼。
(三)詞碼本輸入法同其他方法一樣,也有詞碼。其詞碼編法是二字詞取每個字的各前兩編碼為其詞碼;三字詞取其前兩字的各前一編碼和后一字的前兩編碼為其詞碼;四字詞取其各字的各前一編碼為其詞碼;四字以上詞取前四字的各前一編碼為其詞碼。
(四)萬能鍵碼由于本輸入法有空碼鍵,也編了一萬能鍵碼。所謂的萬能鍵碼就是可替代漢字編碼中任一碼,以查所替代碼為任意碼的所有漢字??商娲粋€碼,也可替代兩個、或三個、或四個碼。
縱觀本漢字輸入法的內(nèi)容,可知自然快速漢字輸入法具有以下特性1.自然和標(biāo)準(zhǔn)化由于本輸入法折字原則、方法和折分出的編碼體都符合國標(biāo)折字所含的原則和要求,且能利用漢語拼音來取碼,進(jìn)而編碼,從而做到取源于自然、法于標(biāo)準(zhǔn)。
2.簡單由于只拆分不拆解,拆出的是偏首、成字體、非偏首非成字體,不是像五筆字根一樣的古怪編碼體,且依音編碼,故幾乎不用學(xué),也不用記什么。
3.快速本法折字比五筆簡單、快,取碼與五筆方式相同而本質(zhì)不同,用熟了后也見編碼體見字型便知碼母,但重碼比五筆稍多一點,故總體上來說,本輸入法速度與五筆幾乎一樣快。
4.普遍可用不用多說,由于本輸入法的簡單自然和標(biāo)準(zhǔn),不用培訓(xùn)和怎么學(xué),自己一看便會用,故具有全面推廣使用的價值,可望成為中國的標(biāo)準(zhǔn)漢字輸入法。由于標(biāo)準(zhǔn)、簡單,所以也為小學(xué)結(jié)合小學(xué)漢字學(xué)習(xí)計算機基礎(chǔ)知識奠定了基礎(chǔ)。
依據(jù)本輸入法的編碼方法建立碼庫并放入漢操系統(tǒng)下,便可利用漢操系統(tǒng)中的輸入法程序(只需加一語句)便可實現(xiàn)漢字輸入。
以本輸入法建立的碼庫放入漢操系統(tǒng)中,只要加一語句,便可用原輸入法程序?qū)崿F(xiàn)本輸入法輸入漢字。
權(quán)利要求
本專利申要求如下一、拆字本輸入法的拆字是在從整字體中或構(gòu)字體中不斷地拆出偏旁部首(以后簡稱偏首)的思路之基礎(chǔ)上建立起來的,以找到本法編碼結(jié)構(gòu)依據(jù)(即編碼體)為目標(biāo)的方法體系,是依形用音編碼的首要前提。其內(nèi)容包括拆字所遵從的基本原則、拆字的目標(biāo)一及編碼體和拆字方法。1、拆字必須遵從的基本原則原則之一,只允許拆分不允許拆解。即只允許分開筆劃拆字,不允許解開筆劃來拆字。也就是說,只能把相互間沒有筆劃交織的構(gòu)字體拆分開,不能把相互間有筆劃交織的構(gòu)字體拆解開。原則之二,本身不是編碼體(編碼體的解釋見后)的漢字必須拆字編碼,本身是編碼體的漢字直接依音取碼編碼。2、編碼體編碼體是本法編碼的結(jié)構(gòu)依據(jù),是從國標(biāo)拆字中提取和匯總出來的基本構(gòu)字體,也是本法拆字思路的產(chǎn)物。本法所稱或所用的編碼體包括非成字和類成字偏首編碼體、成字編碼體、非成字非偏首編碼體。(1)非成字和類成字偏首編碼體是指字典偏首表中所有的非成字偏首體和類成字偏首體,以及少數(shù)個別非偏首類成字體。(2)成字編碼體是指按只拆分不拆解原則不能再拆分出更小成字體的所有一體最小成字體及由最小成字體加一筆劃所形成的一體小成字體。所謂的一體就是指成字體明顯是一個整體,不是分散體(即不是左右分開型、上下分開型、內(nèi)外分開型體)。此外,“白、木、火、禾、田、魚、目、自、且”也是成字編碼體。(3)非偏首非成字編碼體是既非偏首又非成字,既再拆不出偏首、又再拆不出成字的不可再拆(或被認(rèn)為是一體的)構(gòu)字體,實際上,就是拆出偏首編碼體和成字編碼體后余留下來的不可分和一體構(gòu)字體。3、拆分方法很簡單,可表述為在遵從基本原則的前提下,把漢字拆成全是編碼體,且使所拆出的編碼體盡可能的大,或盡可能的少。注意,不能拆出非編碼體。
二、編碼體的取碼和漢字編碼本輸入法是依形用音編碼的輸入法。所謂的用音就是利用發(fā)音給編碼體取碼,然后根據(jù)漢字的編碼體給漢字編碼。1、編碼體的取碼成字編碼體、類成字編碼體取其發(fā)音的首母為其碼母;非成字編碼體中可有稱謂的取其稱謂發(fā)音的首母為其碼母(除個別例外),無稱謂的取其首筆稱謂發(fā)音的首母為其碼母。注意上述各類中都包含有偏首和非偏首兩類編碼體在內(nèi)。非成字偏首的稱謂是(側(cè)刀)、(草字頭)、(樹心)、(寶蓋頭)、(軍字頭)、(統(tǒng)稱滴水)、(立人)、(例外,取O,需記下)、(健字旁)、(車車)、(病字頭)、(高字頭)、(虎字頭);等取首筆稱謂發(fā)音首母。2、漢字編碼(1)是編碼體的漢字編碼編碼方法是取其拼音“各音母”為其編碼或取其發(fā)音“首母”為其編碼(任意)。因為本類編碼漢字不多(約小幾十個),出現(xiàn)的頻率高,且?guī)缀醵寄芷礈?zhǔn),所以打的多了,就像五筆成字字根一樣,一見字不拼音即知編碼。再說難拆字都在本類中,難拆的字拆字編碼比拼音編碼麻煩和慢(不信拆一拆)。(2)非編碼體漢字的編碼非編碼體漢字都要拆字編碼。其編碼方法是拆出的編碼體為四個或四個以下的漢字,順序取其各編碼體的碼母組合成為其漢字編碼;多于四個編碼體的漢字,順序取其前四編碼體的碼母為其漢字編碼。3、補碼經(jīng)拼音和拆字編碼后,有一部分漢字的編碼不足四碼,故需要補足四碼,這樣才能使重碼最少。本法補碼的方法也很簡單、自然,不需要什么理解和記憶。(1)依字型取補碼漢字的字型可分為五種,即可分為上下型、左右型、方正型(本型漢字的編碼體有四個,不需要依型編碼)、半包型、全包型和一體型。分別取S(上)X(下)、z(左)Y(右)、YT(一體)、bb(半包)、Qb(全包);或a(above)b(below)、L(left)R(right)、ob(one body)、hc(half close)、wc(whole cloce)。取后者,重碼少。到究取何,最終決定于實踐。依字型補碼的方法是不足四碼的漢字,短幾碼依其字型順序取幾個字型碼,大多數(shù)漢字可補夠四碼。(2)依未筆補碼由于少數(shù)(二、三十來個)是編碼體的漢字如果采取發(fā)音“首”母編碼時只能編一碼。所以,補上字形碼還不夠四碼,須再補一末筆劃碼(取其稱謂發(fā)音首母)。
全文摘要
自然快速漢字輸入法是以基本編碼方法為核心的計算機漢字輸入法,本法是以不斷找出偏首(為主)、非偏首最小成字(為輔)為基本思路而建立編碼體(該編碼體可以說也就是國標(biāo)拆字拆出的結(jié)構(gòu)單元);以只拆分不拆解為拆字基本原則(也就是國標(biāo)拆字的基本原則);以拆大或拆多為基本方法;以取成字編碼體發(fā)音首母、類成字編碼體發(fā)音首母、非成字編碼體稱謂發(fā)音首母或首筆劃發(fā)音首母為編碼體碼母,進(jìn)而編碼;具有自然、簡單(幾乎不用學(xué),更不用培訓(xùn),也不用記)、標(biāo)準(zhǔn)(符合國標(biāo)拆字要求)、最大容錯(幾乎按你的拆分即可取音編碼)快速(雖重碼稍多一點,但拆字和編碼自然、簡單、標(biāo)準(zhǔn),故與五筆幾乎一樣快)之特性的音形碼類漢字輸入法。是音形碼類的典范,是未來的國標(biāo)漢字輸入法。自然快速漢字輸入法真正把漢字輸入看成是一門可自然、普遍和隨便使用的普通或日常工具,不把它看成是一門需要培訓(xùn)的計算機技術(shù)工具。
文檔編號G06F17/28GK1896925SQ20051008159
公開日2007年1月17日 申請日期2005年7月15日 優(yōu)先權(quán)日2005年7月15日
發(fā)明者李志剛 申請人:李志剛