欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種漢字形符輸入系統(tǒng)的制作方法

文檔序號(hào):6605999閱讀:331來(lái)源:國(guó)知局
專利名稱:一種漢字形符輸入系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明屬于中文信息處理領(lǐng)域,為漢字提供了一種查字法、排序法、造字法,為計(jì)算機(jī)提供了一種漢字輸入方法。
現(xiàn)有的技術(shù)資料見(jiàn)于中國(guó)專利申請(qǐng)《一種圖形文字的輸入方法及其鍵盤》,申請(qǐng)?zhí)?5110690.2,它提出了采用字元作為漢字的輸入碼元;與本發(fā)明有關(guān)的漢字結(jié)構(gòu)理論研究可參考本人所撰《漢字的字元結(jié)構(gòu)》,該文詳細(xì)論述了漢字形體結(jié)構(gòu)的基本單元是字元,并深入探討了漢字的結(jié)構(gòu)層次,給出了漢字各級(jí)構(gòu)件明確的定義和分類,建立起筆劃、部件、塊件、塊組、單字等層層具有字元特征的漢字構(gòu)件系統(tǒng),實(shí)現(xiàn)了漢字各級(jí)構(gòu)件確定和歸類的系統(tǒng)性、客觀性,本發(fā)明在此基礎(chǔ)上對(duì)前一申請(qǐng)進(jìn)行改進(jìn),與本發(fā)明相關(guān)的內(nèi)容可參考該文,必須指出本發(fā)明不受該文限制。
眾多的國(guó)內(nèi)外漢字研究者對(duì)漢字字形進(jìn)行分析后,獲得的構(gòu)件數(shù)就有驚人的差異105、128、160、166、177、205、250、255、256、297、300、320、344、370、496、500、504、512、588、686,等等。而本發(fā)明在GB2310-80的6763字中初步找到的部件只有320種左右,為什么會(huì)有這么大的差異呢?原因是多方面的,一個(gè)主要的原因還是,在不同的選取準(zhǔn)則下,有的不僅挑選了一些部件,還選取了組合塊件,甚至塊件組合,有的則是先硬性確定了一些“優(yōu)選”構(gòu)件,對(duì)其它構(gòu)件進(jìn)行了人為處理,因此在編碼界廣泛存在“人工部件”和“自然部件”的提法。本發(fā)明希望構(gòu)件的多少與記憶的難易間不存在對(duì)立的關(guān)系,最好能實(shí)現(xiàn)音碼那樣“無(wú)編碼”的形碼方案。
本發(fā)明的目的在于通過(guò)對(duì)漢字進(jìn)行科學(xué)分析,根據(jù)包括簡(jiǎn)、繁兩體漢字以及日本、南朝鮮漢字在內(nèi)的全體漢字的結(jié)體構(gòu)形原理,提供一組源自漢字本身的形符作為基礎(chǔ)代號(hào),使得漢字能直觀方便地由平面圖形轉(zhuǎn)換成一串有序的、線性的形符集合,為漢字信息處理提供一種容易操作的方法。
本發(fā)明的優(yōu)點(diǎn)在于它找到了漢字的拼形符號(hào),可以實(shí)現(xiàn)漢字的形符鍵盤,所有構(gòu)件遵循相同的結(jié)構(gòu)原理且與形符相對(duì)應(yīng),記憶量少、操作簡(jiǎn)便。
本發(fā)明通過(guò)如下方法實(shí)現(xiàn)字元是漢字的形符,結(jié)構(gòu)簡(jiǎn)單、形體規(guī)范、數(shù)目較少、容易識(shí)記,對(duì)應(yīng)著漢字的組成構(gòu)件,可以作為漢字的輸入碼元,根據(jù)漢字的形體特征可以建立漢字的字元屬性字典,可以提取字元信息編成漢字的字元代碼,而且字元可以和鍵位建立對(duì)應(yīng)關(guān)系,還可以用來(lái)標(biāo)識(shí)鍵盤,采用這樣的字元鍵盤通過(guò)敲擊字元代碼來(lái)輸入漢字。
字元由漢字“田”蛻變而來(lái),反映了漢字“田”上各直線段在不同取舍情形下的64種狀態(tài),基本結(jié)構(gòu)有 以及這19種結(jié)構(gòu)單元的各種方位圖。經(jīng)過(guò)整理,字元分為3類,共55種(1)零維字元一丨; 為了按照首尾一貫、既科學(xué)又方便的原則來(lái)分解所有的漢字,本發(fā)明選取部件作為漢字分解的基本構(gòu)件。
漢字中只有一個(gè)部件的“單質(zhì)”并不多,大多是若干部件拼合而成的“混合物”。要從“混合物”中將“單質(zhì)”離析出來(lái),首先要了解“混合物”的組成。單個(gè)的組合塊件就是最簡(jiǎn)單的“混合物”,更復(fù)雜的漢字可以先分解成若干個(gè)塊件,然后逐個(gè)將部件離析出來(lái)。由此可見(jiàn)部件離析是對(duì)漢字很自然的分解,與一般形碼的部件拆分是不同的概念。
一般情況下,漢字的分解只需遵循一個(gè)準(zhǔn)則按照各部件首筆的先后順序離析。例如 根據(jù)部件的定義,將漢字的全部部件列舉出來(lái)是完全沒(méi)有必要的,而且將來(lái)新造的漢字難免出現(xiàn)新的部件,但是為了便于使用,本發(fā)明還是針對(duì)GB2310-80中6763個(gè)漢字的部件根據(jù)其零階字元進(jìn)行了歸類,可以參看附表,其它未列出的部件可以按照相同的方法分析。
部件根據(jù)其字元特征可細(xì)分為兩類(1)元形部件 這類部件與字元字符相近,可直接根據(jù)其形狀取相應(yīng)的字元代碼,同元異形部件可據(jù)此進(jìn)行歸類。例如 (2)衍生部件 這類部件與衍生字符相近,具有多層次的字元特征。同元衍生部件具有相同的零階字元,可據(jù)此進(jìn)行歸類。例如 可以用字元式(字元盒子)來(lái)描述部件的結(jié)構(gòu),下面舉幾個(gè)例子。
部件的字元式實(shí)際上是部件的一種編碼,漢字全部部件的字元式集合構(gòu)成漢字的字元屬性字典。
漢字按照各部件首筆的先后離析出部件后,依次輸入各部件字元式的全部或部分元素即可輸入相應(yīng)的漢字(括號(hào)可以省略)。例如中十(口丨)或十口丨或十口或十丨 或口丨沖二十(口丨)或二十口丨或二十口或二十丨 或二口丨 一般情況下,漢字按照各部件首筆的先后離析成部件的組合后,依次輸入各部件的零階字元即可輸入相應(yīng)的漢字。例如
據(jù)本發(fā)明統(tǒng)計(jì),國(guó)標(biāo)GB2310-80中一級(jí)字平均每字4.05個(gè)部件,前1000高頻字平均每字3.26個(gè)部件。部件編碼的平均碼長(zhǎng)較短,一般不多于四碼,因此對(duì)于不少于四個(gè)部件的漢字,可選取各部件的零階字元,通常只取一、二、三、末部件的零階字元,對(duì)于少于四個(gè)部件的單字,除了選取各部件的零階字元外,可以考慮追加衍生部件的取代字元,也可以考慮追加單字的字型字元作為輔助碼元。
為提高輸入效律,詞語(yǔ)也可以采用字元編碼輸入計(jì)算機(jī),各類詞的碼長(zhǎng)均不超過(guò)四碼,可采用如下方法a.雙字詞的編碼=第一字一二碼+第二字一二碼 b.三字詞的編碼=第一字一二碼+第二字一碼+第三字一碼例沖擊力=沖(二十)擊(土)力(十)可行性=可(丁口)行(一)性(川)c.四字以上詞的編碼=第一字一碼+第二字一碼+第三字一碼+末字一碼例無(wú)中生有=無(wú)(干) 中(十) 生(土) 有(十)中華人民共和國(guó)=中(十) 華(丁)人 國(guó)(口)d.雙字詞三字詞中單部件字可以只取一碼,也可以追加輔助碼元補(bǔ)足碼長(zhǎng)。例漂浮=漂(三工)浮(三十)畫冊(cè)=畫(一田)冊(cè)(十)畫冊(cè)=畫(一田) 畫冊(cè)=畫(一田)冊(cè)(十冂)畫冊(cè)=畫(一田)冊(cè)(十一)中國(guó)人=中(十口)國(guó)(口) 中國(guó)人=中(十丨)國(guó)(口) 字元“十”所對(duì)應(yīng)的構(gòu)件較多,其中有5類衍生構(gòu)件的字元式至少有一個(gè)一階字元是一維字元,根據(jù)這種情況可分別用一級(jí)衍生字符“卄卅 豐井”對(duì)應(yīng)相應(yīng)的構(gòu)件并作為碼元,這些碼元也可以選作漢字的形符。例如件亻(T)牛 件亻(T)牛 件亻(T)牛 漢字有了自己的一套形符,因此我們可以設(shè)計(jì)輸入漢字的中文鍵盤,在鍵面上標(biāo)識(shí)形符,通過(guò)輸入漢字的形符代碼來(lái)輸入漢字。
借助普通西文小鍵盤輸入漢字,通常要建立漢字與拉丁字母所構(gòu)成的字符串之間的對(duì)應(yīng)關(guān)系,這種對(duì)應(yīng)關(guān)系要求直觀、自然、簡(jiǎn)單,字元輸入法可以達(dá)到這種要求。首先,字元編碼本身就是一種字符串,字元完全可以象字母一樣標(biāo)識(shí)在鍵面上;其次,字元與字母之間還可以建立一種對(duì)應(yīng)關(guān)系,字元多達(dá)55個(gè),字母只有26個(gè)。這種對(duì)應(yīng)關(guān)系不可能是一一對(duì)應(yīng),更不可能是唯一的。
本發(fā)明下面提供一種方案,對(duì)于熟知英文鍵面的人來(lái)說(shuō),使用中文字元鍵盤輸入字元編碼和敲打字母基本上是一回事。字元與字母建立如下對(duì)應(yīng)關(guān)系 字母“IRPS”沒(méi)有對(duì)應(yīng)的字元,可以安排它們與碼元“ 豐豐”相對(duì)應(yīng)。
本發(fā)明下面還提供另一種較好的方案,字母和形符建立如下對(duì)應(yīng)關(guān)系 這種方案將零維字元都安排在一個(gè)鍵上,因?yàn)榱憔S部件都是直線段,大寫字母“I”也是直線段,小寫字母“i”還有一個(gè)點(diǎn)。
在同一鍵盤上兼容漢字形符和拉丁字母的輸入,這才是真正的中西文鍵盤,用這樣的鍵盤輸入漢字可以兼容漢語(yǔ)拼音,有兩種基本方法一種方法是形音輸入法形符代碼+音符代碼例如千=干+QIAN另一種方法是音形輸入法音符代碼+形符代碼例如千=QIAN+干漢字部件明細(xì)表
權(quán)利要求
1.一種漢字形符輸入方法,其特征在于采用漢字的形符作為漢字的輸入碼元,形符對(duì)應(yīng)著漢字的組成構(gòu)件,形符可以和鍵位建立對(duì)應(yīng)關(guān)系,通過(guò)輸入形符代碼來(lái)輸入漢字。
2.根據(jù)權(quán)利要求1的一種漢字輸入方法,其特征在于所述漢字的形符是指字元,包括 及這19種結(jié)構(gòu)單元的各種方位圖。
3.根據(jù)權(quán)利要求1的一種漢字輸入方法,其特征在于選取部件作為漢字編碼的基本構(gòu)件,部件的結(jié)構(gòu)可用字元式表達(dá),漢字按照各部件首筆的先后分解,依次輸入各部件字元式的全部或部分元素即可輸入相應(yīng)的漢字。
4.根據(jù)權(quán)利要求1、2和3的一種漢字輸入方法,其特征在于選取各部件的零階字元作為漢字輸入的基本碼元,對(duì)于不少于四個(gè)部件的漢字,通常只取一、二、三、末部件的零階字元,對(duì)于少于四個(gè)部件的單字,可以追加衍生部件的取代字元,也可以追加單字的字型字元作為輔助碼元。
5.根據(jù)權(quán)利要求1、2、3和4的一種漢字輸入方法,其特征在于詞語(yǔ)采用字元編碼輸入計(jì)算機(jī)a.雙字詞的編碼=第一字一二碼+第二字一二碼b.三字詞的編碼=第一字一二碼+第二字一碼+第三字一碼c.四字以上詞的編碼=第一字一碼+第二字一碼+第三字一碼+末字一碼d.雙字詞、三字詞中單部件字可以只取一碼,也可以追加輔助碼元補(bǔ)足碼長(zhǎng)。
6.根據(jù)權(quán)利要求1和3的一種漢字輸入方法,其特征在于增加“廾卅 豐井”作為漢字的形符。
7.根據(jù)權(quán)利要求1的一種漢字形符鍵盤,其特征在于采用漢字的形符作為鍵元,在鍵面上標(biāo)識(shí)漢字的形符,建立形符與拉丁字母間的對(duì)應(yīng)關(guān)系,借用普通西文小鍵盤輸入漢字。
8.根據(jù)權(quán)利要求1和7的一種漢字輸入方法,其特征在于字母和形符建立如下對(duì)應(yīng)關(guān)系
9.根據(jù)權(quán)利要求1和7的一種漢字輸入方法,其特征在于字母和形符建立如下對(duì)應(yīng)關(guān)系
10.根據(jù)權(quán)利要求1的一種漢字輸入方法,其特征在于在同一鍵盤上兼容漢字形符和拉丁字母的輸入,用這樣的鍵盤可以兼容漢語(yǔ)拼音輸入漢字,有兩種基本方法(1)形音輸入法形符代碼+音符代碼(2)音形輸入法音符代碼+形符代碼
全文摘要
本發(fā)明為漢字提供查字法、排序法、造字法、輸入法。根據(jù)漢字結(jié)體構(gòu)形原理,找到了漢字的拼形符號(hào)(字元),實(shí)現(xiàn)了漢字的形符鍵盤。漢字可轉(zhuǎn)換成字元集合,串:十(二(口口)丨)。字元可以作為輸入碼元,科(干
文檔編號(hào)G06F3/02GK1285539SQ9911173
公開(kāi)日2001年2月28日 申請(qǐng)日期1999年8月20日 優(yōu)先權(quán)日1999年8月20日
發(fā)明者胡敬禹 申請(qǐng)人:胡敬禹
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
梅河口市| 曲沃县| 江油市| 海安县| 鱼台县| 瑞丽市| 丰都县| 邻水| 小金县| 泰顺县| 郑州市| 沂源县| 治多县| 平定县| 义乌市| 尼勒克县| 扎赉特旗| 高州市| 桐城市| 曲靖市| 廉江市| 南开区| 思南县| 荣成市| 盈江县| 堆龙德庆县| 渑池县| 丰顺县| 西乡县| 鄯善县| 吉水县| 当涂县| 富阳市| 西城区| 称多县| 兴安盟| 吉林市| 合山市| 河东区| 固始县| 隆林|