專利名稱:一種計算機鍵盤形象碼漢字編碼輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于一種計算機鍵盤漢字形碼輸入方法。
背景技術(shù):
計算機鍵盤漢字形碼輸入方法都是將漢字拆分為部件(有的稱為“字根”,本發(fā)明稱為“字梁”),然后按照一定的規(guī)律將部件對應(yīng)在鍵盤字母上,再通過取碼方法實現(xiàn)漢字輸入。
申請?zhí)枮?5104165.7的發(fā)明將漢字拆分成字梁,并用分類碼與識別碼分別表示每一個字梁,這樣,分類碼(為主)和識別碼(為輔)就構(gòu)成了漢字的鍵盤輸入編碼。由于分類碼是根據(jù)字梁的方向、形狀、筆順以及字梁的互補組合綜合考慮確定的易于記憶的相關(guān)字母,識別碼為字梁讀音的拼音首字母或相關(guān)字母,使得該發(fā)明有效地解決了漢字鍵盤輸入編碼減少記憶與縮短碼長之間的矛盾,從而可用于編制字典、詞曲或其他書刊目錄,用于查字;制成漢字輸入軟件,用于鍵盤漢字輸入。
以上發(fā)明的發(fā)明者正是本人。由于多種原因,以上發(fā)明沒有有效地在市場上進行推廣應(yīng)用。它還存在著許多可以改進的地方。例如,以上發(fā)明涉及到的漢字范圍主要是GB2312-80中的6763個漢字,對6763以外的漢字缺少必要的字梁及其對應(yīng)鍵位。漢字拆分規(guī)則還需完善,選取的字梁還需添加或刪除,字梁的類別還需進一步優(yōu)化調(diào)整等等。
發(fā)明內(nèi)容
本發(fā)明是在申請?zhí)枮?5104165.7的背景技術(shù)的基礎(chǔ)上進行的改進。其內(nèi)容包括漢字拆分、鍵位映射、取碼方法三個組成部分。
3.1漢字拆分 漢字拆分是字形編碼的一個重要方面,本發(fā)明的目標(biāo)是做到直觀、自然。為此,必須首先弄清楚漢字結(jié)構(gòu)與人腦自然感覺之間的關(guān)系,然后再通過漢字拆分實踐來總結(jié)漢字拆分規(guī)律,制定拆分規(guī)則,歸納漢字拆分類型。本標(biāo)題下包括漢字拆分相關(guān)問題的處理方法、漢字拆分規(guī)律總結(jié)、漢字拆分規(guī)則制定、漢字拆分類型歸納、難點問題處理五個部分。
1漢字拆分相關(guān)問題的處理方法 (1)筆畫跨筆組合問題 “國”中的“囗”是由第一筆、第二筆和最后一筆組合而成,中間跨了幾筆,這就是筆畫跨筆組合。跨筆組合違反了書寫漢字的筆畫順序,之所以要這樣,觀察以下例子可以看出原因。
國(冂干丶一一)巫(丅人人一)束(一口
)………(絕對按照筆畫順序拆分) 國(囗王丶)巫(工人人)束(木口)…………(拆分方式包含跨筆組合) 應(yīng)該明白,書寫漢字強調(diào)的是怎樣才能較好地安排空間以及筆尖轉(zhuǎn)移是否方便;而字形編碼的漢字拆分強調(diào)的則是要便于視覺分辨,以利于快速地提取信息,減輕腦力負(fù)擔(dān)。
書寫漢字與拆分漢字是兩種不同的生理作業(yè),生理的需要就是按照省力的模式進行。正確的書寫順序滿足的是書寫方式下的生理需要,正確的拆分方式滿足的是拆分方式下的生理需要。這兩種生理需求有重合的地方,也有不同之點。
進而言之,跨筆組合出來的結(jié)構(gòu)往往是比較牢固的結(jié)構(gòu),并且與被跨過的結(jié)構(gòu)視覺差異大,彼此容易分離。例如,在“束”中,跨筆組合出來的“木”與被跨過的“口”,前者為枝丫形,后者為折環(huán)形,視覺差異明顯;在“垂”中,跨筆組合出來的
與被跨過的“卄”,前者為多橫一豎交叉,后者為一橫多豎交叉,同樣視覺差異明顯。
遵循視覺差異就是遵循直觀、自然。整體上遵循書寫順序是必須的,但過分地強調(diào)書寫順序而違反直觀則是不可取的。因此本文后邊制定的拆分規(guī)則中有“書寫原則”和“直觀原則”。以下再舉幾個例子作進一步的說明。
“再”的正確拆分方式為“再(一冂土)”,跨筆組合拆分方式“再(王冂)”是勉強的和不正確的。因為“再”中“王”的均衡性已經(jīng)失去,特別是“王”的中間一橫已被“冂”牢牢地限制在框內(nèi),使“王”失去了直觀性,從而使人腦難于捕捉。
“屬”的正確拆分方式為“屬(尸丿口
)”,跨筆組合拆分方式“屬(尸丿蟲冂)”是勉強的和不正確的。因為“蟲”是一個由折環(huán)形“口”與枝丫形
組成的特征不純的復(fù)合結(jié)構(gòu),牢固性差,被“冂”隔開后,就完全失去了原本就不牢固的整體性,變得不直觀。
“蚩”的正確拆分方式為“蚩(屮一蟲)”,跨筆組合拆分方式“蚩(凵
口)”是錯誤的和不正確的。因為該字不是這樣寫的(“一”和“蟲”是分離的)。
(2)筆畫順序組合問題 依據(jù)書寫順序,一個筆畫可以與前邊的筆畫組合成字梁,也可以與后邊的筆畫組合成字梁,例如,“羊”中的第一個橫筆可以與“丷”組合成“”,也可以與后邊的
組合成
順序出現(xiàn)的筆畫應(yīng)該如何組合,主要應(yīng)考慮兩點,一是應(yīng)有利于視覺分割,二是應(yīng)使拆分出來的字梁數(shù)目最少。怎樣拆分有利于視覺分割將在拆分規(guī)律中予以介紹。使拆分出來的字梁數(shù)目最少(即“最少原則”)是實現(xiàn)漢字拆分方式趨向唯一的必要條件之一。例如 下(丅丶),卞(亠卜)……………………………………(正確符合最少原則) 卞(丶丅丶)…………………………………………………(錯誤違反最少原則) (3)字梁拿取順序問題 字梁的拿取順序是從上到下、從左到右、從外到內(nèi)、從中央到兩邊、從整體到局部。具體例子如下。
從上到下義(丶乂),支(十又),幽(幺幺山),尾(尸毛),這(文之),式(弋工) 從左到右環(huán)(王不),成(
),樹(木又寸),冊(
一) 從外到內(nèi)困(囗木),叉(又丶),問(門口),區(qū)(匚乂),刁(
),氏(
) 從中間到兩邊辦(力八),兆(兒
),脊(人
月),率(亠幺
十) 從整體到局部巫(工人人),重(
日),束(木口),屯(七凵),琢(王豕丶) 以上例子反映了絕大多數(shù)情況,以下例子能夠針對性地說明問題。
拿取順序斷(幺幺
斤),繼(糹幺幺
),斷(米斤),亾(人) 書寫順序斷(幺幺一幺幺斤),繼(糹幺幺一幺幺),斷(米斤),亾(人) 在拿取順序中,“斷”中的
取的是書寫順序中的“一”的順序;“繼”中的
取的是書寫順序中的“”的順序。拿取“一”時,“一”與“”結(jié)合成了
拿取“”時,“”與“一”結(jié)合成了
所以最終拿取結(jié)果如上。
拿取順序夞(夕卜口匕),幷(
干),囍(士口口)歰(刀丶止止) 書寫順序夞(夕卜口匕),幷(
干),囍(士口口士口口)歰(刀丶止刀丶止) 為什么“夞”、“幷”的拿取順序是從上到下,而“囍”、“歰”的拿取順序是從左到右?因為書寫順序如此。
以上例子說明,字梁的拿取順序取決于漢字的書寫順序。也就是說,書寫順序(即“書寫原則”)是漢字拆分的重要依據(jù)。以下再舉幾個例子作進一步的說明。
拿取順序式(弋工),武(二止
),殲(歹人人戈),殱(歹土非
) 書寫順序式(一工
),武(二止
),殲(歹人人一非
),殱(歹土非
) 拿取順序弒(乂木丶弋),魊(白
厶戈),拔(扌又丶) 書寫順序弒(乂木丶一工
),魊(白
厶一口
),拔(扌又丶) 2漢字拆分規(guī)律總結(jié) 根據(jù)字梁刺激人腦對人腦生理的影響,可將字梁分為點睛形字梁(如“夾”中的“丷”)、枝丫形字梁(如“束”中的“木”)和折環(huán)形字梁(如“束”中的“口”)。這三種字梁刺激人腦對人腦的影響截然不同。三種刺激類型的組合形式如下。
刺激類型不同點晴形——枝丫形;枝丫形——折環(huán)形;折環(huán)形——點晴形 刺激類型相同點晴形——點晴形;折環(huán)形——折環(huán)形;枝丫形——枝丫形 (1)刺激類型不同 刺激類型不同的字梁交織在一起時,容易區(qū)分。具體例子如下。
點晴形與枝丫形的例子如辦(力八),丸(九丶),羊(丷
),來(未丷)。其中“羊”涉及到筆畫順序組合問題。由于“丷”為短筆畫即點睛形,
為長筆畫即枝丫形,兩者視覺差異明顯,故“羊(丷
)”為正確拆分,“羊(
)”為錯誤拆分。
枝丫形與折環(huán)形的例子如因(囗大),亙(二曰),百(
日),虧(二),艮(彐
),丑(
十),者(耂日),束(木口),妻(十女),央(大),缶(午凵)。其中“百”、“缶”涉及到筆畫順序組合問題。由于
“午”為枝丫形,“日”、“凵”為折環(huán)形,兩種不同的結(jié)構(gòu)視覺差異明顯,故“百(
日)”、“缶(午凵)”為正確拆分,“百(一白)”、“缶(
山)”為錯誤拆分。
折環(huán)形與點晴形的例子如凡(幾丶),卵(
卩丶),雨(一巾
),戶(丶尸)。
(2)刺激類型相同 刺激類型相同的,點晴形與點晴形交織在一起的情況比較少見。例如雨(一巾
),為(丶力丶)。
折環(huán)形與折環(huán)形交織在一起的情況也不多。例如回(囗口),巨(匚
),電(日乚),屯(七凵),出(屮凵)。枝丫形與枝丫形交織在一起的情況較為復(fù)雜。以下是典型例子。
矢(大),無(
乚)……………………………(正確“大”、
為相交形,結(jié)構(gòu)牢固) 矢(丿天),矢(
人),無(二
)…………(錯誤) 畢(日卄
)…………………………………………(正確“卄”、
為相交形,結(jié)構(gòu)牢固) 畢(日十)…………………………………………(錯誤“”的牢固性不如“卄”和
) 余(人
),舍(人干口)…………………(正確
“干”為相連形,結(jié)構(gòu)牢固) 余(
朩),舍(
十口)………………………(錯誤
為相離形,結(jié)構(gòu)不牢固) 相同刺激類型交織在一起進行分割時,相交優(yōu)于相連,相連優(yōu)于相離,同為相連,順序優(yōu)先。
“屮”是相交結(jié)構(gòu),“山”是相連結(jié)構(gòu),即“出(屮凵)”為正確拆分,“出(凵山)”為錯誤拆分。此為相交優(yōu)于相連?!爱叀敝械牡箶?shù)第二個橫筆可以與前邊的“卄”組合成“”,
也可以與后邊的“十”組合成
但相交優(yōu)于相連,所以“畢(日卄
)”為正確拆分,“畢(日
十)”為錯誤拆分。
個別例外情況“輌(車一冂山)”為正確拆分。
是相連結(jié)構(gòu),
是相離結(jié)構(gòu),即“余(人
)”為正確拆分,“余(
朩)”為錯誤拆分。此為相連優(yōu)于相離。
“”是相連結(jié)構(gòu),“天”也是相連結(jié)構(gòu),但“”順序在先,即“矢(大)”為正確拆分,“矢(丿天)”為錯誤拆分。此為同為相連,順序優(yōu)先。
同為相交或相離的情況極少,如“垂(
卄)”,“亖(二二)”。
(3)字梁結(jié)構(gòu)的牢固性 拆分的界線是由字梁結(jié)構(gòu)的緊密性和牢固性所決定的。從牢固到不牢固依次為 筆畫>環(huán)狀相連形字梁>平行流線相離形字梁>相交形字梁>其他相連形字梁>其他相離形字梁 一般情況下,人們都把“乙”、“ㄑ”、
當(dāng)作一筆,而把“了”、
“ ”、
當(dāng)作兩筆。這兩者之間的界線實在是太不明朗了。為了使單筆畫與多筆畫界線分明,筆者建議把落筆后不提起所形成的線條當(dāng)作一筆看待。有了這樣的認(rèn)識,
不能拆分為“丿”和“”、“ ”不拆分為
和“止”就容易理解了。
環(huán)狀相連形字梁如“囗”、
等的牢固性僅次于筆畫,以上已有較多的例子涉及到,在此不再重復(fù)。中間有橫筆的環(huán)狀相連形字梁如“日”、“月”、“”也具有較強的牢固性。拆分例子如下 電(日乚),曱(日丨),甴(日丨),叀(十日厶)…………(正確“日”是牢固結(jié)構(gòu)) 電(囗七),曱(囗丅),甴(囗丄),叀(一由厶)…………(錯誤直觀性欠佳) 甩(月乚),尹(丿),丑(
十),冊(冂卄),冃(冂二),冄(冂二)………(正確) 以上拆分舉例中尚未提到平行流線相離形字梁。平行流線相離形字梁主要包括“二”、“三”、
“彡”、
“川”。拆分例子如下。
亍(二亅),丌(一
),疆(弓土三田),匆(勹
丶)………………(正確) 亍(一丁),丌(
丨),疆(弓土一一),匆(勹丿乂)………………(錯誤) 尨(乚彡丶),淵(氵
米),州(
川)………………………………(正確) 尨(七
丶),淵(氵丿米丨),州(
丶丨丨)………………………(錯誤) 有些字梁如“立”、“業(yè)”,因其出現(xiàn)率高、眼熟、在漢字中所處位置特殊等原因,雖然構(gòu)件相離,但在人們的意識中是一個緊密牢固的整體,即其牢固程度與相連等同,甚至高于相連,例如 辛(立十),親(立朩),產(chǎn)(立丿),嚴(yán)(一業(yè)丿)……………(正確) 辛(
干),親(
),產(chǎn)(
廠),嚴(yán)(一
廠)………………(錯誤) 個別例外情況“竒(
口)”是正確的拆分方式。因為“竒(立口丿)”不直觀。
相交形字梁、其他相連形字梁、其他相離形字梁在以上拆分舉例中都涉及到,此處不再重復(fù)。
另外,牢固性較強的字梁其抗變形的能力一般也較強。例如,“木”是一個結(jié)構(gòu)牢固的字梁,在“束”中“木”發(fā)生了變形,但它給人獨立性或整體性仍然較強。牢固性較弱的字梁其抗變形的能力一般也較弱。例如,“合”的拆分方式是“合(
口)”,而“亼”的拆分方式則是“亼(人一)”。因為
是一個不固牢的離散結(jié)構(gòu),橫筆的位置改變后原來的面貌就完全失去了。其他類似情況對比說明如下 襄(亠口口
),竵(立一口丅),死(歹匕)……………………(正確) 襄(
口
),竵(立
丅),死(一夕匕)…………………(錯誤) 由于
是離散結(jié)構(gòu),而“歹”是相連結(jié)構(gòu),牢固程度不一樣,所以在發(fā)生變形時,處理方法就有所不同。
(4)筆畫輕重的影響 筆畫由輕到重的順序是撇、橫、豎、捺、折、點。較輕的筆畫對人腦的刺激相對較弱,人腦較難捕獲。例如在不看稿打字時,“殊”中“朱”上的撇輕而短,人腦較難捕獲,因此“殊”的拆分方式被確定為“殊(歹朱)”,而不是“殊(歹丿未)。
較重的筆畫對人腦的刺激相對較強,人腦較易捕獲。例如“琢”中的點雖然占據(jù)的面積較小,但它是對“豕”的點綴,筆畫較重,人腦較易捕獲,因而“琢”的拆分方式被確定為“琢(王豕丶)”,而不是“琢(王豖)”。
以上從多個方面和不同的角度總結(jié)了漢字拆分的一般規(guī)律,這是制定拆分規(guī)則的前提。
3漢字拆分規(guī)則制定 (1)拆分原則 拆分原則包括書寫原則、直觀原則和最少原則(以下簡稱“三原則”)。書寫原則就是總體上必須按照書寫順序拆分漢字;直觀原則就是拆分漢字要直觀自然;最少原則就是必須使拆分出來的字梁數(shù)目最少。
(2)拆分規(guī)則 通俗地講就是,順序感覺依次拿,緊密牢固不分家。順序感覺依次拿指的是總體上根據(jù)書寫順序結(jié)合空間位置,憑感覺依次最大限度地拿取。緊密牢固不分家指的是緊密牢固的結(jié)構(gòu)一般不拆散。
反映漢字拆分規(guī)則的典型拆分方式列舉如下。
①長(丿
),美(丷王大),肺(月一巾)…(對反映正確的書寫方式,符合書寫原則) 長(
丿),美(),肺(月亠巾)…(錯書寫方式不正確導(dǎo)致拆分不正確) ②百(
日),亍(二亅),全(人王),本(木一)…(對直觀、自然,符合直觀原則) 百(一白),亍(一丁),全(
土),本(
人)…(錯不直觀、別扭,違反直觀原則) ③卞(亠卜),會(
),亙(二日),束(木口)…(對符合最少原則) 卞(丶丅丶),會(人二厶),亙(一日一),束(一口
)…(錯違反最少原則) ④因(囗大),乘(禾
匕),平(干丷)…(對總體上遵循書寫順序,直觀、自然) 因(冂大一),乘(千
匕人),平(一丷十)…(錯絕對遵循書寫順序,不直觀、煩瑣)。
[特別說明]花了那么長的篇幅討論漢字拆分,拆分規(guī)則就這么幾句普普通通的話,這些話即使不說出來,人們也知道。有的讀者可能會產(chǎn)生疑惑,在這里筆者要特別強調(diào)的是,這正是我們追求的目標(biāo)——沒有規(guī)則就是最好的規(guī)則。人腦是一個刺激感應(yīng)體,漢字拆分的最佳方式應(yīng)該與這個感應(yīng)體相吻合、相適應(yīng)。如果能做到這一點,還要那些起干擾作用的拆分規(guī)則做什么? 4漢字拆分類型歸納 本發(fā)明中的漢字拆分強調(diào)的是拿取而不是書寫,用拿的思維觀察本發(fā)明的漢字拆分例子,許多疑問就可迎忍而解。為了便于進一步理清思路,筆者將漢字拆分類型歸納為如下19種。
(1)字梁與字梁之間具有明顯的分割溝,按溝進行分割拆分。如 收(丩攵),部(立口阝),長(丿
),過(寸辶),鼠(臼
)戶(丶尸),總(丷口心),燕(廿
口灬),余(人
) (2)筆畫較短的字梁與筆畫較長的字梁搭配,按長短不同進行分割拆分。如 關(guān)(丷天),羊(丷
),著(丷
目),美(丷王大),南(十門丷干),丫(丷丨),蘭(丷三),半(丷
) (3)一個字梁包圍另一個字梁,兩者自然拆開。如 因(囗大),兇(乂凵),叵(匚口),問(門口),岡(冂乂),幽(幺幺山),離(文凵冂厶),腦(用文凵),禽(人文凵厶) (4)后一個字梁是對前一個字梁的點綴,并呈現(xiàn)離散狀態(tài),兩者自然拆開。如 叉(又丶),卵(
卩丶),凡(幾丶),太(大丶),犬(大丶),下(丅丶),雨(一巾
),為(丶力丶),刃(刀丶) (5)筆畫較短的對稱性字梁夾在筆畫較長的字梁的兩邊,呈現(xiàn)對望狀態(tài),兩者自然拆開。如 辦(力八),兆(兒
),脊(人
月),率(亠幺
十),承(了三
),函(了
凵),丞(了
一),求(
丶) (6)兩種形態(tài)特色不同的字梁鑲嵌在一起,呈現(xiàn)離散狀態(tài),形態(tài)特色不同的自然分開,形態(tài)特色相同的自然組合。如 亙(二曰),疆(弓土三田),巫(工人人),淵(氵
米),乘(禾
匕),乖(千
匕) (7)筆畫較短的字梁與筆畫較長的字梁鑲嵌在一起,呈現(xiàn)離散狀態(tài),兩者自然拆開。如 平(干丷),來(未丷),夾(夫丷),乎(
丷),州(
川),嗇(土丷囗口),金(人王丷) (8)兩個字梁呈連接狀態(tài),從連接的地方斷開。如 開(一廾),亞(一業(yè)),互(一
),直(十且),步(止
),卡(上卜),彖(
),乍(
),矢(大),氏(
),勿(勹
),后(
),所(
斤),爪( 丨),無(
乚),尺(尸),百(
日),首(
目),市(亠巾) (9)一個離散形字梁與另一個字梁相接,從相連處斷開。如 亍(二亅),元(二兒),蒙(艸冖二
),京(
小),辛(立十),親(立朩),辰(廠二
) (10)一個字梁與一個環(huán)形字梁的內(nèi)側(cè)相接,環(huán)形與非環(huán)形自然拆開。如 面(
囗
),曲(囗卄),丑(
十),臣(匚丨
丨),出(屮凵),而(
冂
),缶(午凵) (11)一個字梁與另一個字梁的邊緣或端口相接,從相接處斷開。如 產(chǎn)(立丿),嚴(yán)(一業(yè)丿),艮(彐
),即(彐
卩) (12)一個字梁搭掛在另一個字梁的斜線上,從斜線處拆開。如 孝(耂子),老(耂匕),考(耂一),者(耂日),名(夕口) (13)后一個字梁是對前一個字梁的點綴并呈相交狀態(tài),將點綴的字梁拆開。如 丸(九丶),斥(斤丶),琢(王豕丶),匆(勹
丶),本(木一),必(心丿),及(
) (14)兩個呈啞鈴形的字梁鑲嵌交織在一起,根據(jù)緊密狀態(tài)進行拆解。如 垂(
卄),華(艸
卄) (15)一個環(huán)形字梁與一個枝丫形字梁鑲嵌交織在一起,將環(huán)形與枝丫形拆開。如 束(木口),吏(丈口),柬(木
),重(
曰),刺(木冂刂),棗(木冂
),屯(七凵),事(
口),惠(
日心),夷(大弓),秉(禾) (16)一個十字形字梁插在一個環(huán)形字梁的中間,將十字形字梁拆開。如 妻(十女),囊(十口冖
),叓(十口又),専(十日寸),曺(十日日) (17)一個離散形字梁與另一個字梁相交,將兩者分開。如 衷(
丨
),衰(
一
),顫(
口日貝) (18)一個環(huán)形或折彎形字梁與另一個字梁相交,將兩者分開。如 中(口丨),免(
口
),冊(
一),丹(
亠),冉(冂土),央(大),典(八),決(冫
人),樂(
小),牙(
亅丿),舛(夕
丨),鹿(廣
匕),甩(月乚),臾(臼人),鬼(白
厶),禺(日冂
),黑(
土灬),更(一日
),尹(丿),聿(
),隸(氺),兼(
),肅(丨
八),制(
巾刂),肺(用一巾),捷(扌一
),韋(二
),書(
丶),農(nóng)(冖
),鶴(冖亻丶鳥),沈(氵冖
),東(
小),練(纟
),專(二
丶),發(fā)(丿又丶),姊(女
丨丿) (19)一個帶有橫筆的字梁與一個帶有斜鉤的字梁相交,位置在肩部,將兩者分開。如 成(
),栽(土木
),我(
),曦(日丷王
),武(二止
),截(土亻丶
),哉(土口
),越(土
) 5難點問題處理 追求拆分直觀是我們的愿望,但要使所有漢字都能直觀地進行拆分幾乎是不可能的。例如,在“副”中,
作為一個整體不拆分比較直觀,但在“豆”中,
作為一個整體不拆分就不直觀了。再如,在“控”中,“穴”作為一個整體不拆分比較直觀,但單獨的“穴”字不拆分就不直觀了。這里存在著一個均衡點的問題??傮w上把握均衡,個別地方的不理想是難以避免的。以下所舉例子都是特殊情況,也是難點。
①拆分規(guī)則必須既能反映漢字拆分的自然感覺,又能限制漢字拆分的隨意性。但因字梁選取的限制,使得這個愿望無法百分之百地實現(xiàn)。例如 衷(
丨
),衰(
一
),顫(
口日貝)………(正確,但第一次不容易想到) 衷(亠中
),顫(亠回日貝)……………………………(錯誤,因“中”、“回”不是字梁) 衷(亠口丨
),衰(亠口一
),顫(亠口口貝)…(錯誤,違反拆分原則的最少原則) 會(
),禽(人文凵厶),食(
彐
)……………(正確,但第一次不容易想到) 會(人二厶),禽(
一乂厶),
食(人丶彐
)………(錯誤,違反拆分原則的最少原則) 所幸的是,這種情況特別少,以上是僅有的例子。
②少數(shù)漢字,書寫是從中間向兩邊展開,而拆分則是從左至右拿取。例如 燕(廿口
匕灬),夔(自止巳八夂),齊(亠刀丫
)…(正確的書寫順序) 燕(廿
口灬),夔(
止目夂),齊(
刀丨
)…(正確的拆分方式) ③極個別漢字,可考慮用更簡明的拆分方法處理。例如 哥(
口
口)……………………………………………(正確的書寫方式) 哥(于口口)………………………………………………(更簡明的處理方式) ④書寫方式錯誤是漢字拆分過程中的一種常見現(xiàn)象。例如 長(丿
),美(丷王大),肺(月一巾)………(正確,符合正確的書寫方式) 長(
丿),美(),肺(月亠巾)………(錯誤,書寫方式不正確導(dǎo)致拆分不正確) 對于這種情況,能否進行容錯處理呢?不能。對這種錯誤進行容錯,不僅縱容了錯誤繼續(xù)延續(xù)下去,而且使整個漢字拆分定型體系變得不清晰,容易造成思想混亂,最終加重腦力負(fù)擔(dān)。
⑤極個別漢字,因其結(jié)構(gòu)的特殊性造成視覺分辨困難,以至絕大部分人都寫錯了,這種情況可以容錯。例如 尷(九
皿),尬(九人
),丏(
)……………(正確,容錯方式) 尷(乚
皿),尬(乚
人
),丏(丅
)……………(正確,正常方式) 對“尷尬”二字,筆者測試過10個人(均為大學(xué)或大學(xué)以上學(xué)歷),竟然沒有一人寫對(都把“尢”當(dāng)成了“九”)。把“丐”放在眼前對照著寫,筆者也測試了10個人,能一次性寫對的人只有1個。
⑥個別不直觀的拆分方式單獨列出。例如 雀(
亻丶
),昜(日萬
),叢(業(yè)丷干又),壽(乛口寸),粛(丨
八),旊(方
乙),歓(
亻丶人),亜(
),丣(一
匚
),畱(一
匚田),枾(木十
),乗(禾),簔( 亠一
),與(
一
八) ⑦極少數(shù)還帶有圖畫性質(zhì)的漢字可進行特別處理并單獨列出。例如 凸(丄),凹(凵),龜(丿乚),黽(口日乚),嬽(女罒罒大),為(丶力
灬),爲(wèi)(爫
灬) 3.2鍵位映射 漢字結(jié)構(gòu)塊有多種特征,形態(tài)意境是一種能被人腦自然吸收并抽象化的特征。本發(fā)明依據(jù)這種特征分析漢字結(jié)構(gòu)塊得到38個意境類別,然后按照意境相關(guān)位置互補的原則合并為26類對應(yīng)26個字母,結(jié)果見表1。表1中對應(yīng)字母稱為字梁的分類碼,其中大小寫字母都是指同一鍵位。 表1字梁分類碼對照關(guān)系表
識別碼是指字梁的拼音首字母,沒有讀音的字梁識別碼用a表示。字梁識別碼見表2。 表2字梁識別碼對照關(guān)系表
(續(xù)表)
3.3取碼方法 本發(fā)明的取碼方法是,單字依次取字梁的分類碼,碼長不足三碼加識別碼和分號,不足四碼加空格,超過四碼取前三碼和最后一碼。雙字詞組每字取前二碼。三字詞組,前一字取前二碼,后二字各取前一碼。四字及四字以上的詞組,取前三字和最后一字的前一碼。單字及詞組取碼舉例見表3。
表3取碼方法舉例
由一個字梁組成的漢字稱為單梁字,由兩個字梁組成的漢字稱為雙梁字,由三個或三個以上的字梁組成的漢字稱為多梁字。如下31個構(gòu)字頻率較高的字梁稱為高字梁。
人阝月
山石蟲忄土扌日讠訁宀艸口尸钅釒木
彳犭亻王疒氵女禾纟糹 在雙梁字中,分類碼取完后,依次取首字梁的識別碼,若首字梁是高字梁,則取尾字梁的識別碼,若首尾字梁都是高字梁,則用v作為識別碼。當(dāng)然,雙梁字的識別碼也可取一個完整漢字的拼音首字母。
常用字的編碼后半部分往往可以省略并且會提前顯示在前邊,這時可以直接按空格鍵送出。為了手指移動方便,凡是能用2選擇上屏的都可以用點號鍵“.”代替,凡是能用3選擇上屏的都可以用撇號鍵“/”代替。
對于數(shù)字小鍵盤如手機鍵盤,鍵盤輸入碼的英文字母方式不變。至于鍵盤字母與數(shù)字的對應(yīng)關(guān)系,即隨手機的鍵面設(shè)置而定。
4差異與效果 本發(fā)明與申請?zhí)枮?5104165.7的背景技術(shù)(以下簡稱背景技術(shù))相比,拆分規(guī)則更加系統(tǒng)完善,選取的字梁更加合理,字梁與鍵盤字母的對應(yīng)關(guān)系更加科學(xué),識別碼詳盡列出,適用范圍擴大到GBK字符集,取碼規(guī)則更加人性化。具體地講,在拆分規(guī)則方面,背景技術(shù)只有簡短的概括性描述和少量的拆分示例,對復(fù)雜的漢字結(jié)構(gòu)沒有形成系統(tǒng)的處理方法,沒有總結(jié)出漢字拆分規(guī)律,沒有對漢字拆分類型進行系統(tǒng)化分類,沒有摘取出漢字拆分中的難點問題。而本發(fā)明對復(fù)雜的漢字結(jié)構(gòu)形成了一整套系統(tǒng)化的處理方法,全面地總結(jié)了漢字拆分的規(guī)律,將漢字拆分類型歸納為19種,將漢字拆分中的難點問題單獨摘取了出來。這些都是極為難得的突破與創(chuàng)新。
在鍵位映射方面,背景技術(shù)列出的字梁為346個,主要是針對GB2312-80字符集的。本發(fā)明去掉其中3個,增加104個,即本發(fā)明列出的字梁為447個,適用范圍擴大到GBK字符集。對于分類碼鍵盤字母映射,本發(fā)明所做的工作主要是延伸、補充和優(yōu)化,對識別碼鍵盤映射,背景技術(shù)只用了描述性語言,沒有明確列出,本發(fā)明即詳盡列出,并去掉了背景技術(shù)中的“特別相像的字梁其識別碼用其像形字母”的規(guī)定。本發(fā)明在背景技術(shù)基礎(chǔ)上所做的修改雖然在感覺上不是特別明顯,但這些修改是保證該編碼方案成為最佳編碼方案的一種唯一選擇,是極為難得的突破與創(chuàng)新。
在取碼方法方面,本發(fā)明增加了對數(shù)字小鍵盤如手機鍵盤取碼方法的說明,其他沒有差異。
綜合而論,本發(fā)明與背景技術(shù)或其他鍵盤輸入形碼相比,漢字拆分規(guī)則、選取的字梁、字梁對應(yīng)的字母鍵位、取碼方法都達到了無法否定的唯一性,從而使得本發(fā)明有可能成為漢字形碼的最佳方式,這是本發(fā)明的實質(zhì)性突破與創(chuàng)新。本發(fā)明即形象碼具有與心相應(yīng)、與神相隨、形神合一、自然浮現(xiàn)、永不遺忘的神奇效果。
具體實施例方式具體實施方式
部分地陳述了本發(fā)明的研究思路和步驟,并對認(rèn)識本發(fā)明是否是字形編碼的最佳形式有一定的幫助。
5.1分類碼的推導(dǎo)過程 第一步,根據(jù)自然感覺即以上所述的漢字拆分三原則和19種拆分類型拆分漢字,然后以形態(tài)意境為依據(jù)進行劃分,得到38個形態(tài)意境比較鮮明的類別,結(jié)果見表4。
第二步,統(tǒng)計每一個類別在漢字首位、二位和末位的出現(xiàn)數(shù)。一個或一類字梁在漢字中可能出現(xiàn)在首位,如“口”、“咬”中的“口”,可能出現(xiàn)在二位,如“扣”、“拐”中的“口”,可能出現(xiàn)在末位,如“扣”、“炯”、“熔”中的“口”。“口”出現(xiàn)在首位的字?jǐn)?shù),稱為首位出現(xiàn)數(shù),出現(xiàn)在二位的字?jǐn)?shù),稱為二位出現(xiàn)數(shù),出現(xiàn)在末位的字?jǐn)?shù),稱為末位出現(xiàn)數(shù)。其中,“口”中的“口”只計算首位出現(xiàn)數(shù);“扣”中的“口”既計算二位出現(xiàn)數(shù),又計算末位出現(xiàn)數(shù)。位置出現(xiàn)數(shù)除以研究范圍的總字?jǐn)?shù),稱為位置出現(xiàn)率。
以GB2312-80字符集為例,該字符集共有6763個漢字(以下簡稱6763漢字)。6763漢字按常用和次常用分為一級漢字和二級漢字,一級漢字有3755個,二級漢字有3008個。26個字母每個字母代表的字梁在3755個漢字中首位或二位上的出現(xiàn)數(shù)的理想值應(yīng)為144個(3755/26),在3008個漢字中的理想值應(yīng)為116個(3008/26),在6763個漢字中的理想值應(yīng)為260個(144+116)。
表4的第3、4、5列是字梁的38個類別在6763漢字中首位、二位和末位上的出現(xiàn)數(shù)的統(tǒng)計結(jié)果。表4字梁的38個形態(tài)意境類別
(續(xù)表)
注“土”、“工”、“王”、“生”、“正”、“車”、“魚”、“馬”、“鳥”、“立”、“止”、“業(yè)”、“子”、
“且”、“耳”、“”作為左偏旁時,其最后的一橫往往變?yōu)樘?如“地”);“木”、“耒”、“禾”、“釆”、“米”、“夫”、“火”、“貝”、“文”作為左偏旁時,其最后的一捺往往變?yōu)辄c(如“機”);“九”、“幾”、“兒”、
“七”、“毛”、“ ”作為左偏旁時,其中的彎鉤往往變?yōu)樘?如“鳩”);“氺”、“羽”、
中的鉤有時缺省(如“犀”)。這些變形字梁未單列。
第三步,搭配歸位與代碼安排。字梁類別多于26類,而鍵盤上只有26個字母,因此還必須進行搭配。搭配的總原則是位置互補、意境相關(guān)。具體實現(xiàn)步驟如下。
1.第(1)至第(14)類,首位出現(xiàn)數(shù)和二位出現(xiàn)數(shù),有的接近理想值,有的與理想值相差不是太大,可先定型。除(11)之外,每一類都找到了形態(tài)意境相關(guān)的代表字母(已在最左列列出)。
2.第(15)類,首位出現(xiàn)數(shù)超出理想值較多,二位出現(xiàn)數(shù)則太小,應(yīng)找一個首位出現(xiàn)數(shù)小二位出現(xiàn)數(shù)大的類與之搭配,合乎該條件的有(33)至(38)。但從形態(tài)意境上考慮,(34)、(35)、(36)、(37)已有最佳搭配(后面陸續(xù)有說明),剩下可考慮的有(33)、(38)。權(quán)衡得失,(38)更合適。(15)的三點對應(yīng)W的三個頂點,(38)為雙手合抱之形,字母W也有雙手合抱之意。故此,(15)與(38)可以定型,代表字母為W。
3.第(16)類,首位出現(xiàn)數(shù)超出理想值,二位出現(xiàn)數(shù)接近理想值,末位尚有較大的空間,能填補該空間的類別有(33)、(34)、(35)、(36)、(37)。但只有(36)與(16)的搭配最協(xié)調(diào)。并且(16)與N(有兩豎)有一定的相關(guān)性,而n則是(36)的最佳代表字母。故此,(16)與(36)可以定型,代表字母為N和n。
4.第(17)類,首位出現(xiàn)數(shù)已超出理想值,二位和末位尚有一定的空間可以利用。在(33)至(38)中尋找,只有(37)最合適。兩者均為倒樹丫伸展形態(tài),用單腳外伸的字母R表示,感覺極為舒服,可以定型。
5.第(18)類,首位出現(xiàn)數(shù)與理想值相當(dāng),二位與末位有較大空缺。在(30)、(33)至(38)中尋找,只有(34)最合適。(18)與T形態(tài)相關(guān),(34)與t形態(tài)吻合。故此,(18)與(34)可以定型,代表字母為T和t。
6.第(19)類,首位出現(xiàn)數(shù)與理想值相當(dāng),二位與末位有空缺。在(30)、(33)至(38)中尋找,排除已有最佳搭配的(30)、(34)、(35)、(36)、(37)、(38)(已有說明或即將說明),最后只剩下(33)了。(33)與字母Q有一定程度的相關(guān)性。故此,可將(19)與(33)定型,代表字母為Q。
7.第(20)類,首位與二位均接近理想值,末位有較大空缺。在(33)至(38)中尋找,只有(35)最協(xié)調(diào)。(20)為鍋蓋形態(tài),與字母M形態(tài)相合,(35)的四字形態(tài),與封閉的M相一致。故此,(20)與(35)可以定型,代表字母為M。
8.第(21)類,首位出現(xiàn)數(shù)接近理想值,二位與末位有空缺。在(30)至(38)中尋找,只有(30)最協(xié)調(diào)。(21)的形態(tài)為橫下垂吊向左飄,與字母F相合,(30)為“十”字相交向左飄,與字母f相合。故此,(21)與(30)可以定型,代表字母為F和f。
9.第(22)類,首位有少量空缺,二位與末位接近理想值。在(28)至(32)中尋找,只有(32)最合適。兩者都與字母P形態(tài)相關(guān)。故此,(22)與(32)可以定型,代表字母為P。
10.第(24)類與第(29)類搭配后,首位、二位、末位出現(xiàn)數(shù)均與理想值接近或相差不是太大。(24)與B形態(tài)吻合,(29)與b筆順一致。故此,(24)與(29)可以定型,代表字母為B和b。
11.(23)、(25)、(26)的二位出現(xiàn)數(shù)接近理想值,首位和末位有空缺。(31)首位出現(xiàn)數(shù)比二位、末位大。(27)首位、二位、末位出現(xiàn)數(shù)相差不大。(28)首位出現(xiàn)數(shù)大,二位小,末位為空。
總的來說,(31)、(27)、(28)的位置出現(xiàn)數(shù)沒有達到非常顯著的差異。因此,若單從位置出現(xiàn)數(shù)上考慮,無法找到有較強說服力的搭配方案。在形態(tài)意境上,這6類之間也無相關(guān)性可言。再從形態(tài)意境沖突性上考慮,即(26)與(28)無沖突,(25)與(27)無沖突。(23)與(31)搭配尚有輕微的不滿意。那么,能否將(31)加到或交換到其他已經(jīng)定型的類別上去呢?找遍整個類別,只有(12)可以考慮,但感覺仍不夠理想。最終按表4排列搭配定型。最左列為代表字母,其中G中有一橫表示橫的感覺;U表示旋轉(zhuǎn)U形;K表示傾斜K形。
至此,38個意境類別已合并為26類了。其中26個字母中只有C還未使用,(11)尚未安排對應(yīng)字母。于是(11)用C表示也就無話可說了。
5.2字梁的篩選 出現(xiàn)數(shù)越多、結(jié)構(gòu)越緊湊、在漢字中占據(jù)的面積越小的字梁,它的形態(tài)意境往往越鮮明,人們就越容易把它當(dāng)作拆分單位看待,拆分漢字時就不會把它拆散。這正是字形編碼選取拆分單位的有利條件。但是,并不是所有的情況都是這么理想。例如,一個從未學(xué)過任何字形編碼的人,可能會把“石”拆分為“
口”,而將“磊”拆分為“石石石”。前者是因“石”字中環(huán)形結(jié)構(gòu)“口”與枝丫形結(jié)構(gòu)
視覺差異較大的緣故,后者是因“石”在“磊”中占據(jù)的面積較小的緣故。一方面,生理感覺要遵循,另一方面,拆分單位也應(yīng)該固定下來。因此,必須對字梁進行篩選。
這里選擇了若干個具有代表性的字梁,在添加和刪除的分析中闡明字梁選取的標(biāo)準(zhǔn)和尺度。
1.在類別“丶亠亡
立
六文亦
方
廣”中未見到“辛”、“衣”、“產(chǎn)”、“亥”、“玄”,什么原因? 不列入“辛”的理由有三點,一是在6763漢字中含“辛”的字(辛辯辣辨瓣辮辜辭宰辟鋅滓莘梓)較少;二是“辛”在漢字中占據(jù)的面積稍大。三是“辛”拆分為“立”和“十”后,其編碼為df,而在碼表中df幾乎為空缺。不列入“衣”、“產(chǎn)”、“亥”、“玄”的理由與“辛”類似。
2.能否將“酋”從拆分單位中去掉? “酋”在漢字中的面積稍大,其中的“口”特別刺眼,恨不得把它從“酋”中取出來,但是,若真的要拆分“酋”,又感到特別棘手“酋”拆分為“丷”和“酉”則不直觀,拆分為“”和剩余部分,則這個剩余部分沒有位置安排。幸好還有一個結(jié)構(gòu)“尊”為不拆分“酋”找到了額外的理由。因為“尊”的前二碼是vj,而以vj開始的僅有兩個不常用的字“疔”和“疴”?!扒酢辈徊鸱?,“尊”和“遵”正好填補過來,并讓出了寶貴的vo空間(以vo開始的常用字較多)。
3.一個從未學(xué)過任何字形編碼的人很容易把“京”拆分為“亠’、“口”、“小”,但本發(fā)明卻把
列為拆分單位,如何解釋? 把
列為拆分單位的理由有四點,一是在6763漢字中含
的字(鯨享亨郭烹孰熟敦廓衰衷亭亮膏毫豪顫哀高敲京就醇驚墩壕搞掠篙景晾影諄諒蓑哼嚎鎬停瓊凜涼淳稿膻鶉塾憝廩毫稟鷲崞嵩礅懔憬暾顥葶蒿藁嚆蹴鐓锿犒槨榱檁槁椋僦濠澶灝婷嬗縞)較多;二是
在漢字中占據(jù)的面積不大(約為漢字面積的1/4);二是若把
拆分為“亠”和“口”,其編碼為do,而在碼表中,do本來就不少(不算“亠”、“口”組成的do,有50多個);四是若
不拆分,一方面可使28個字由碼長4碼變?yōu)榇a長3碼,另一方面,
與相連的結(jié)構(gòu)可組成db、dg、dh、dm、dr、du、dy代碼,這些代碼都在不同程度上填補了空缺。類似情況還有
“石”、“貝”等。
[特別說明]
“酋”、“石”、“西”、“酉”這幾個結(jié)構(gòu),前三個是拆分還是不拆分,筆者整整琢磨了十年時間,根據(jù)這十年的使用感受來看,筆者認(rèn)為還是不拆分為宜。
4.“矢”未被列為拆分單位,而“失”、“朱”卻被列為拆分單位,如何解釋? 6763漢字中含“矢”的字有44個(矢矯短知智矩矮矬矧雉榘族蜘埃挨簇唉肄疑侯醫(yī)疾癡嫉矣猴喉凝旖堠篌誒蔟蒺嗾踟鏃俟翳瘊糇緱彘嶷)。雖然從“矢”在漢字中占據(jù)的面積及其自身結(jié)構(gòu)緊湊性上考慮,有將“矢”列為拆分單位的沖動,但基于以下兩點原因,“矢”還是不列為拆分單位為宜。
其一,在與本發(fā)明關(guān)聯(lián)的碼表中,包括“矢(大)”的編碼qa在內(nèi),前二碼為qa的共32個,偏移理想值(理想值為10個)22個,符合最大偏移量不得大于30個(參見“漢字編碼優(yōu)劣評測方法的探討”一文,該文即將發(fā)表在《中文信息學(xué)報》上)的要求。
其二,若將“矢”列為拆分單位,最容易想到的是將其與“人入火貝大天夭夫失癶
”放在一起,但這樣就降低了“人入火貝大天夭夫失癶
”的意境清晰度和鮮明性。
若“失”和“朱”不列為拆分單位,則它們的拆分方式為“失(丿夫)”和“朱(丿未)”,當(dāng)不看稿輸入“秩”、“殊”等字時,明顯地感到捕捉困難?!笆А?、“朱”分別如一束枝丫,只有一個視覺焦點,輕而短的一撇所形成的刺激量難以把人腦的注意力從視覺焦點上拉過去。正如在看到或者想到一個人的一瞬間,捕捉的焦點是其面部,而不會先注意那個人左邊的耳朵,除非那個耳朵特別刺眼。數(shù)年以前,保持意境清晰度和鮮明性的意識比較強烈,對這個問題的認(rèn)識深度不夠,沒有把“失”、“朱”列為拆分單位。目前把“失”、“朱”列為拆分單位的意識已經(jīng)明顯地占據(jù)了上風(fēng)。
5.為何“貝”是拆分單位而“見”卻不是? 6763漢字中含“貝”的字有近200個,其中“貝”處于字首位置的就有35個。若“貝”拆分為“”、“人”,則其代碼應(yīng)為UA,那么在與本發(fā)明關(guān)聯(lián)的碼表中將會有53(35+18)個字的前二碼為UA,偏移理想值(理想值為10個)43個,嚴(yán)重超出了最大偏移量不得大于30個的要求。因而毫無疑問,“貝”應(yīng)列為拆分單位。
6763漢字中含“見”的字只有30個,其中“見”處于字首位置的字僅有“見”一個字?!耙姟痹跐h字中占據(jù)的面積大、結(jié)構(gòu)緊湊性差、出現(xiàn)數(shù)量少、形態(tài)意境為復(fù)合型,使得“見”不宜作為拆分單位。
6.含有
的字僅有“首”一個基本型,所涉及到的字在6763漢字中只有6個(首道馘夔馗艏),為何將其列為拆分單位? 其一,在“首”中兩個視覺焦點非常明朗,一個是
另一個是“目”;其二,
處在一種鮮明的形態(tài)意境之中。因此,
列為拆分單位理由十分充足。
7.結(jié)構(gòu)
在6763漢字中僅有兩個(拽曳),能否從拆分單位中去掉?
所處的形態(tài)意境(戔戈弋
)十分鮮明,去掉其中任何一個,都會極大地增加腦力負(fù)擔(dān)。請體會 R←戔戈弋
(一個不缺,思考量和記憶量最小) R←戔戈弋
(缺少
思考量和記憶量增大) R←戔戈弋
(缺少
和
思考量和記憶量更大) 8.能否將
列為拆分單位? 6763漢字中含“北”的字(北背冀乖燕乘剩嵊邶驥褙)有11個?!氨薄痹诮Y(jié)構(gòu)上雖然為分離型,但卻具有較強的凝聚性,容易被人當(dāng)作一個整體看待,因而很想將其列為拆分單位。問題是,“北”列為拆分單位后,放在哪里呢?最容易想到的是將其與“忄非
片
卜爿
丩丬
川
丨業(yè)止上丄”放在一起,但從意境吻合程度上看,總還是有些不滿意。所以“北”暫時沒有列為拆分單位。
9.在字梁與鍵盤字母的映射表中怎么沒見到
的結(jié)構(gòu)比較緊湊,按理應(yīng)該列為拆分單位,但在映射表中卻沒有合適的位置。由于在GBK字符集20902個漢字中只有一個漢字“臨”含有
并且
處在末位,當(dāng)輸入
和
時(即輸入h和k時),“臨”就已經(jīng)提前顯示出來了,因而
列不列為拆分單位也就不那么重要了。本發(fā)明所述的方案是將
拆分為“口”和“丨”。
5.3關(guān)于取碼的疑問解答 1.拼音首字母是一種腦力消耗較大的非意境特征,為何取碼時還要使用這種特征? 在腦力消耗小的意境特征不夠用的情況下,尋找其他特征來補充是必要的,拼音首字母作為識別碼處于分類碼之后,是一種補充。多梁字無需識別碼,雙梁字大多數(shù)可以省略識別碼按簡碼形式輸入。單梁字的識別碼雖然處在較重要的第二位置不能省略,但由于單梁字只有一個字梁,刺激面積大、時間長,并且分類碼和識別碼緊貼在一起,容易形成一個意識整體,使得這個特征的缺陷表現(xiàn)不出來。
2.雙梁字的識別碼為什么不優(yōu)先考慮取一個完整漢字的拼音首字母? 一是避免了不知字音的煩惱,二是字梁的出現(xiàn)頻度要比一個完整漢字高,頻度越高,刺激的次數(shù)就越多,反應(yīng)速度自然就越快。
3.雙梁字的識別碼為什么不取固定位置? 雙梁字的識別碼若取固定位置(如尾字梁),就可以取消26個高字梁,雙梁字的編碼規(guī)則也會變得更簡單。但如果這樣,重碼就會增加。26個高字梁看起來似乎很難記住,其實這是多余的擔(dān)心。由于高字梁出現(xiàn)頻度高,一般憑感覺就能知曉。再說,在實際打字過程中,雙梁字的識別碼用得很少,萬一不知道,還可以看一下提示行。
識別碼不取固定位置的具體原因舉例說明如下。
“漢”、“汝”的分類碼相同,并且首字梁相同,“把”、“扎”的分類碼相同,并且首字梁相同,這說明識別碼不宜固定在首位。
“這”、“跡”的分類碼相同,并且尾字梁相同,這說明識別碼不宜固定在尾位。
“葉”中的“十”、“吞”中的“天”對人腦的刺激要比“口”更有特色,更易于引起人腦注意。但它們的位置有時在首位,有時在尾位,這說明識別碼不宜固定位置。
4.詞組取碼有何講究? 四字及四字以上的詞組雖然是每字取一碼,但在實際運用過程中,很少有人會按照這種方式輸入漢字。原因是人腦捕獲字形的反應(yīng)速度跟不上每字取一碼的節(jié)奏。因此,三字詞組第一字是取前二碼。四字詞組如“毫無疑問”,除了按四字詞組的方式編碼外,還被拆成了“毫無”和“疑問”兩個雙字詞組。兩個雙字詞組與一個四字詞組相比,擊鍵次數(shù)雖然多了一倍,但符合生理節(jié)奏,反應(yīng)速度快,感覺舒暢。
四字詞組還可考慮采用前一字取前二碼,后三字共取二碼的做法。
5.對于繁體字中的“言”怎么處理? 在GBK字符集中,“言”只有出現(xiàn)在一個完整結(jié)構(gòu)的左邊并且可以換成“讠”時才能當(dāng)作字梁對待。例如 誣(訁工人人LIAA)獄(犭訁大丶SLAD)(“訁”是字梁) 誣(讠工人人LIAA)獄(犭讠大丶SLAD)(“讠”是字梁) 爕(火亠二火ADGA)詧(
亠二口ADGO)(“言”不是字梁) 信(亻亠二口ADGO) (“言”不是字梁) [特別說明]“言”的處理是一個難點。對GBK字符集或BIG5字符集,結(jié)構(gòu)“言”應(yīng)該如何處理,還有待進一步觀察。
6.數(shù)字小鍵盤(如手機鍵盤)的取碼規(guī)則如何變通? 目前數(shù)字小鍵盤的字母順序排列方式與標(biāo)準(zhǔn)電腦鍵盤完全不同?,F(xiàn)在無論是電腦還是手機,人們接觸都非常頻繁。在電腦鍵盤上熟悉的字母位置到手機上卻找不到,這是對人腦的傷害。因此,筆者主張將數(shù)字小鍵盤上的英文字母排列順序改為與標(biāo)準(zhǔn)電腦鍵盤一致。
在小鍵盤上輸入漢字與在大鍵盤上輸入漢字一樣,如“中國”的編碼是OHOU,在手機鍵盤上的按鍵是6468,也是OHOU,因為手機鍵面上的“6”鍵上有M、N、O三個字母,“4”鍵上有G、H、I三個字母,“8”鍵上有T、U、V三個字母。輸入6468,屏幕顯示 1.中國 2.中期 3.中共 4.忠實 5.黜 6.噎 按0鍵,再按1鍵,即“中國”上屏。
權(quán)利要求
1、一種計算機鍵盤漢字形碼輸入方法一般有三個組成部分,一是拆分規(guī)則,二是拆分單位與鍵盤字母的映射關(guān)系列表或描述,三是取碼方法,本發(fā)明的特點在于
拆分規(guī)則為,一整套與人腦的自然感覺相吻合的原則和規(guī)則,其中的原則是書寫原則、直觀原則和最少原則,其中的規(guī)則是順序感覺依次拿,緊密牢固不分家;
拆分單位與鍵盤字母的映射關(guān)系如下
分類碼鍵盤映射字母拆分單位
a 人入火貝大天夭夫失
貝
b 阝弓乃
子孑
了魚
鳥
烏
勹
夕
魚烏
c 月
用
甫耳且
目
円
d 丶亠亡
立
六文亦
方
廣
e 山屮
巾彐
五
正車車
f 石歹萬
廠丅
十ナ
g 蟲
酉西覀
三二一
h 忄非卝
片
卜爿
丩丬
川
丨業(yè)止上丄凸
丱
i 土士工干
千
耂
j 扌手
寸于
丁
亅刂
k 日曰
爫
l 讠饣
乚
乙己已巳
巴
言飠
m 宀穴
虍
灬罒皿四
n 艸卄廾甘廿井
卅世
幾
九
兒
卌
o 口囗
p 尸
羽馬力
卩刀
乛馬
q 钅
生 牜牛午
田甲由申母毋毌釒
r 木朩未朱末耒戔戈弋
乀乁
s 彳犭豸身舟
白鄉(xiāng)
斤
彡
丿
t 亻
匕
七乇毛
u 王壬
豐
門
冂
凵凹匚
丯門
v 疒豕乑
水氺
巛巜ㄑ
冫
酋
丷八
w 氵
心臼也乜
x 女丈
夂
攵
久又
マ乂
夊
卐卍
y 禾
釆米
衤礻不
小
z 纟彑
幺
厶
之辶廴
糹
識別碼鍵盤映射字母拆分單位
a 癶
屮
彐
丅
ナ
覀
卝
丩
丬
丄
耂
亅
爫
乚
卄廾
卩
朩
乑
丷巛巜ㄑ
マ乂
釆
彑
廴
円
丱
卌
乀乁
丯
夊
卐卍
b 宀疒阝八巴白貝卜不匕
勹貝
c 艸蟲廠車川寸
車
d 亻大歹刀丁
丶
e 兒耳二冫
f 犭方非豐
夫甫
夂攵囗
g干甘戈工弓廣
毌
h禾火一虍
j鄉(xiāng)钅幾甲巾斤井久九臼戔孑己
釒糹
k囗
l立力了六耒刂
m木馬毛門米皿末母目乜
馬
門
n女乃鳥廿牛牜
鳥
p片爿冖丿
q七千且酋
r日人入壬
s石尸山彳氵忄三上申身生十士世卅厶水氺豕饣礻丨彡
灬四罒巳
手
凵飠
t扌土天田乇
u月于羽曰魚
魚魚
w王萬未文烏毋五午亡
x西夕鄉(xiāng)小心穴冂
y讠也業(yè)已乙亦用由酉又夭幺弋衤匚
訁
z正之止舟丈豸子
辶
取碼方法為
單字依次取字梁的分類碼,碼長不足3碼加識別碼和分號,不足4碼加空格,超過4碼取前三碼和最后一碼,雙字詞組每字取前二碼,三字詞組,前一字取前二碼,后二字各取前一碼,四字及四字以上的詞組,取前三字和最后一字的前一碼,其中由一個字梁組成的漢字稱為單梁字,由兩個字梁組成的漢字稱為雙梁字,由三個或三個以上的字梁組成的漢字稱為多梁字,如下31個構(gòu)字頻率較高的字梁稱為高字梁
人阝月
山石蟲忄土寸日讠訁宀艸口尸钅釒木
彳犭亻王疒氵女禾纟糹
在雙梁字中,分類碼取完后,依次取首字梁的識別碼,若首字梁是高字梁,則取尾字梁的識別碼,若首尾字梁都是高字梁,則用v作為識別碼,當(dāng)然,雙梁字的識別碼也可取一個完整漢字的拼音首字母;
常用字的編碼后半部分往往可以省略并且會提前顯示在前邊,這時可以直接按空格鍵送出,為了手指移動方便,凡是能用2選擇上屏的都可以用點號鍵“.”代替,凡是能用3選擇上屏的都可以用撇號鍵“/”代替;
對于數(shù)字小鍵盤如手機鍵盤,輸入碼就是鍵面上的英文字母鍵位。
全文摘要
本發(fā)明屬于計算機鍵盤漢字形碼輸入方法。它按書寫原則、直觀原則和最少原則以及順序感覺依次拿、緊密牢固不分家的規(guī)則將漢字拆分為字梁,然后按照字梁的形態(tài)意境進行劃分得到38個意境類別,再依據(jù)意境相關(guān)、位置互補的原則進行搭配合并為26類分別對應(yīng)在26個相關(guān)字母上。這26個字母稱為字梁的分類碼,字梁的拼音首字母或相關(guān)字母稱為字梁的識別碼。取碼方法是,依次取字梁的分類碼,多于四碼取前三碼和最后一碼,少于三碼還需加識別碼。該發(fā)明既可作為字典、詞典的檢索方法,也可作為漢字的鍵盤輸入方法。
文檔編號G06F3/023GK101051246SQ20061007442
公開日2007年10月10日 申請日期2006年4月8日 優(yōu)先權(quán)日2006年4月8日
發(fā)明者孫基壽 申請人:孫基壽