欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

漢字通輸入法的制作方法

文檔序號:6361699閱讀:310來源:國知局
專利名稱:漢字通輸入法的制作方法
技術(shù)領(lǐng)域
本發(fā)明是涉及漢字通輸入法(新概念輸入法),具體的說是涉及漢字的輸入方法、漢字的編碼方法和漢字字符定義方法以及漢字庫的構(gòu)成。
目前信息社會中,計算機(jī)日益普及到人類社會的各個方面,在中文信息化中,漢字的輸入仍是一個制約性的問題,現(xiàn)有眾多的漢字輸入法(實際上是漢字編碼法),未能也不可能解決全部可用漢字的輸入,漢字的輸入還遠(yuǎn)沒有解決,還仃留在初、中級輸入使用階段,只能湊合著用。漢字進(jìn)入計算機(jī)也已有20余年,人們還在討論漢字的編碼方法。仍沒有一個被大家接受的方便使用的無同碼的編碼輸入法。就連在國內(nèi)流行較廣的‘五筆字型’,不但至今不為國家教委和國家語委所認(rèn)可,并受到教育界有識之士的強(qiáng)力抵制。最近在2001年11月28日光明日報上發(fā)表了張在云的文章“我看‘五筆字型’存在的問題”,和12月26日錢玉趾的“‘五筆字型’現(xiàn)象的困惑”等文又對五筆字型提出否定意見。另一個問題是,同其它文字比較,漢字在計算機(jī)中處于不平等的地位,不能象英文、俄文等文字那樣自由輸入任何要使用的單字,即使是新產(chǎn)生字的科技用字也可以輸入。而漢字則只能輸入使用較少的一部分漢字,許多漢字不能輸入和使用,把漢字的輸入使用限制在漢字庫的范圍內(nèi),幾次擴(kuò)大漢字庫也未能解決對漢字的缺字需求,比如,新的科技用字噁等及其它偶用字。這不是因為漢字的輸入有難以解決的高新技術(shù)問題,而是現(xiàn)行的漢字輸入理論和方法存在嚴(yán)重問題,漢字字符的定義和漢字字符集構(gòu)成存在不合理性,在漢字進(jìn)入計算機(jī)之初,把漢字定義為圖形字符,使?jié)h字能進(jìn)入計算機(jī)是漢字輸入突破性的一步。但是把要輸入的每一個漢字都定義為圖形字符,使?jié)h字等同于英、俄文的字母,把全部漢字的輸入歸結(jié)為以字符方式輸入,就偏離了一般文字(如英、俄文)輸入的原理和方法。沒有按照漢字構(gòu)字法輸入漢字,這樣的定義和等同導(dǎo)致了漢字輸入的嚴(yán)重問題。把每一個漢字都定義為漢字字符并列入字符集(漢字庫),就把每一個漢字作為輸入單位,取消了漢字的構(gòu)字過程,定義一個漢字,輸入一個漢字,不定義就不能輸入,把漢字的輸入限制在被定義的字符范圍內(nèi),大大限制了漢字的輸入使用量,把每一個漢字都定義為漢字字符并列入字符集(漢字庫),是不應(yīng)該的、不合理的、不必要的和不可能的,因為它包括不了全部漢字或絕大部分漢字,同時也增加了漢字編碼的難度和重碼率。由于這樣定義漢字字符,就把漢字的輸入方法誤導(dǎo)為單純的編碼方法,把‘XX碼’說成‘XX輸入法’,進(jìn)入了編碼的死胡同,徘徊不前,人們再也沒有研究和解決漢字的輸入方式,使?jié)h字的輸入至今沒有較徹底解決。
為了克服漢字輸入法中存在的問題,使?jié)h字輸入法走出漢字編碼的死胡同,本發(fā)明根據(jù)漢字構(gòu)字法的理論和方法,對漢字的輸入法進(jìn)行了較大的改革,賦予漢字輸入法以新的概念和新的方法,提出創(chuàng)立一種全新的漢字編碼輸入法——漢字通輸入法。即按照漢字構(gòu)字法的原理進(jìn)行輸入,本發(fā)明的核心是將合成漢字一分為二成兩個基本漢字,進(jìn)行字符定義、漢字編碼、漢字輸入。是真正從解決漢字輸入方式的意義上研究和解決漢字的輸入法,不是用漢字的編碼方法替代漢字輸入法,是類似于字母文字輸入法的漢字輸入法,它克服了現(xiàn)有漢字輸入法中存在的問題。本輸入法以解決全部可用漢字的輸入為出發(fā)點(diǎn),而不是只解決部分漢字的輸入,改革后的漢字字符集(漢字庫)只需要5%的漢字字符,就可輸入全部可用的繁、簡體漢字和新生漢字。
本發(fā)明引入了漢字構(gòu)字法,根據(jù)漢字構(gòu)字法原理,將漢字分為兩大類基本字和合成字。根據(jù)漢字的發(fā)展歷史,漢字最初由六書的象形、指事、形聲和會意造字法造漢字,甲骨文字可讀的有1226個,其中形聲和會意組成的合成字占三分之二以上,后由六書的形聲、會意構(gòu)字法逐漸構(gòu)字,發(fā)展到現(xiàn)在的5萬余字。漢字構(gòu)字法不是由字母拼組,是由‘字組字’拼組漢字,最具有代表性的是占漢字95%以上的形聲字,就是由一半表聲一半表形(意)的兩個基本漢字拼組合成的,會意字也全是兩字組成的合成字,這樣一來,合成字將占漢字的99%以上?,F(xiàn)代科技的新生字也是這樣拼組合成的。由此可見,漢字的發(fā)展也是由其構(gòu)字法構(gòu)字的,因此,漢字可分為兩類,漢字用以構(gòu)字的原創(chuàng)字可稱為基本字,由基本字(原創(chuàng)字)合成的字可稱為合成字,漢字的基本字和合成字的界限雖不很明顯,為了簡便起見,可將現(xiàn)代漢字一次性一分為二切分后的漢字定為基本字,這樣一分為二成的基本字約為2000-2500字,其中包括300多個獨(dú)體漢字,只占漢字的5%左右,合成字占95%以上,可由5%的基本字拼組成95%的合成漢字,輸入100%的可用漢字。
將漢字的輸入方式分為兩種字符方式和非字符的拼組方式,基本字以字符方式輸入,合成字一分為二成兩個基本字,由基本字‘字組字’合二而一拼組輸入。漢字的輸入將不受漢字庫的限制,可拼組輸入任何想要輸入的漢字,比如,漢字庫中沒有的新科技用字噁等均可拼組輸入。它們是人工生產(chǎn)的放射性元素,是金屬元素,故用‘钅’(釒)字傍,加上相應(yīng)的表音字,就合成了這些新字。
將漢字分為字符和非字符兩種形式基本字定義為漢字字符(圖形字符),合成字不定義為漢字字符,由基本字‘字組字’合二而一拼組輸入。改革后的漢字字符集(漢字庫)的漢字字符量可壓縮至2500字左右的小型漢字庫,除作少量補(bǔ)充外,都是現(xiàn)行漢字庫中的字符,且不再需要擴(kuò)大,也就是說只需要5%的漢字字符,就可輸入全部可用的繁、簡體漢字和新生漢字,從理論上計算,按本輸入法可輸入數(shù)百萬以上的漢字,是現(xiàn)有漢字的100倍,既大大壓縮了漢字字符量,又極大地擴(kuò)大了漢字輸入量,且穩(wěn)定了漢字庫。是對漢字庫的重大改革。
漢字編碼方法分為兩種基本碼和合成碼,對作為漢字字符的基本字直接編碼,以字符方式輸入,合成字的編碼由基本字的編碼組成,以拼組方式輸入,漢字的編碼可減至2500個左右。但是,基本字的數(shù)量仍然很多,且字型復(fù)雜,難以用鍵盤鍵位直接定義漢字字符,還必須通過編碼才能輸入。經(jīng)對漢字結(jié)構(gòu)的分析研究表明,漢字都是由一些簡單的‘筆畫的組合’—簡單的偏旁部首—構(gòu)成,本發(fā)明就是提取組字最多的‘筆畫的組合’作為漢字‘字型字母’和‘類字母’,為方便用拼音字母表示,取26個作為字母,其余的同字母相似的作為類字母,它們的數(shù)不多,容易記憶和使用。利用這些字母和類字母對漢字進(jìn)行編碼,漢字部件也可用這些字母和類字母進(jìn)行編碼,使?jié)h字的編碼接近字母化。利用數(shù)字表示的漢字的筆形及其變形對漢字編碼更簡化了漢字的編碼。本輸入法的編碼方法采用了字母化和筆形化的方法,分別用a-z表示的26個‘字型字母’及類字母和用1-9表示的9個漢字筆形及其變形,對漢字庫中的數(shù)千漢字進(jìn)行編碼即可輸入全部可用的繁、簡體漢字,簡化了漢字編碼,經(jīng)小學(xué)2-3年級學(xué)生試用,很快就可學(xué)會,且不易忘記。
5.本輸入法不但簡化了漢字的編碼和輸入,也提高了漢字的編碼和輸入速度,因為其普及碼和簡碼主要是對常用字設(shè)計的,而常用的3800-5000字可覆蓋99.99%的動態(tài)使用率,可簡便快速地輸入常用字。采用不同的碼長和編碼方法輸入不同的漢字,可方便不同用戶的使用,常用字的編碼要盡量短,以減少編碼的時間和精力,提高效率,分清單字和詞組,減少重碼和相互干擾。非常用字和偶用字一般為合成字,編碼和輸入方法較復(fù)雜些,但能夠輸入全部漢字,做到不缺字。
6.本編碼方法也可以對大的漢字庫進(jìn)行逐字編碼,已利用本發(fā)明的兩種編碼方法在Win98上生成漢字輸入法,可無同碼地輸入21003個漢字和27000條詞組,其指標(biāo)如下數(shù)字編碼名稱 國標(biāo) 漢字通1)逐字輸入平均碼長(碼/字) <6<62)逐字輸入重碼率 (%) <803)字詞混合碼長碼/字<42.26用字母編碼逐字輸入的重碼率為0,國標(biāo)為<8%。
本輸入法突破了漢字庫的限制,利用較少的有限的漢字字符輸入無限的漢字,可實現(xiàn)半無字庫半無編碼的自由輸入漢字。是漢字輸入法的重大突破和革命,是漢字輸入法的創(chuàng)新。可從根本上較徹底解決漢字的輸入。
為了證明本編碼的易學(xué)、易用性,從小學(xué)生就可學(xué)會使用,編輯了一種用1-9數(shù)字編碼和用a-z字母編碼查字的‘漢語電子字典’,含繁簡體漢字13500余字,可用兩種編碼方法無同碼地查繁簡體字,還可以按拼音查字,經(jīng)小學(xué)2-3年級學(xué)生在電腦上進(jìn)行了試用,他們很快就能學(xué)會,也很喜歡用。學(xué)會了查字法就學(xué)會了漢字輸入法。
關(guān)于字形符的說明,由于漢字字形復(fù)雜,常有兩個漢字只是漢字各部件的平面位置排列不同,而構(gòu)成完全不同的兩個漢字,例如吧和邑;豈和屺;員和唄;只和叭;旭和旮等等,造成兩個漢字的編碼完全相同,對這些兩兩編碼相同而字形不同的漢字,編碼時在次常用字后面用字形符加以區(qū)別,由于這種字的數(shù)量不多,且往往只有兩個字相同,操作者無需考慮,照常編碼輸入,如有這種同碼,由計算機(jī)給出提示,以便選擇。并利用這一規(guī)則消除由各種因素造成的少量同碼,達(dá)到無同碼地輸入。
以下,結(jié)合實例對本發(fā)明的編碼方法加以敘述1.數(shù)字碼2)基本字及常用字的編碼一-1;口-6;個-82;馬-551;可-162;本-781;權(quán)-7854;詞-45516;資-4828;整-77181;2)合成字的編碼喆-716716(吉-716);鰓-3796795(魚-379,思-6795);椙-786161(木-78,昌-6161);拫-75119(扌-7,艮-5119);啝-63786(口-6,和-3786);钅杜-397871(钅-39,杜-7871)。
3)詞組的編碼勞動-143113;勞動生產(chǎn)率-143134;國家-694414;國家經(jīng)濟(jì)建設(shè)-694594;革命根據(jù)地-117877。
2.字母碼1)基本字和常用字的編碼一-y;口-o;個-rp;馬-zgy;可-go;本-my;權(quán)-mz;詞-nlgo;資-erur;整-mvya;2)合成字的編碼喆-toto(吉-to);鰓-dvhovl;(魚-dvh,思-ovl);椙-mqq(木-m,昌-qq);拫-fzex(扌-f,艮-zex);啝-opmo(口o,和-pmo);钅杜-jmt(钅-j,杜-mt)。
3)詞組的編碼中國-opon;中國人-opor;中國人民-oorg;上海-ryss;上海市-ryse;革命根據(jù)地-crmt;勞動生產(chǎn)率-cepe;國家經(jīng)濟(jì)建設(shè)-okln。
字母及類字母表字母及類字母A [山] 止 屮 N [丶] ㄟB [八] 丷 0 [口] 囗 C [艸] 廿 卝 廾 P [丿] 丨 亅D [刀] 卩 勹 巜 刂  ク リ Q [日] 曰 E [二] 亠 丄 冫R [人] 入 亻  卜  F [扌] 干 戈S [三] 氵 彡 G [了] 丁 丅 コ ㄋ T [土] 士 七H [火] 灬  U [月] 冂 I [廠] 廣 V [十] 乂 ナ J [钅] W [王] 豐 戔 非 K [宀] 冖 X [小] 川 忄  巛 L [幺]  匕 Y [一] M [木] Z [乙] 又 辶 字形符- =/ [ ]獨(dú)體型 上下型左右型包容型復(fù)合型數(shù)字代碼表1 一 艸 丆2 | 亅 冂 山3 丿 勹 ク  金4 丶  亠 言 宀5 乙 乛 幺  ㄋ ㄥ 6 口 囗 7 十 七 乂 ナ 扌8 人 入 八 丷 亻  卜9 三 小 氵 彡 灬 字形符- =/ [ ]獨(dú)體型 上下型左右型包容型復(fù)合型
權(quán)利要求
1.一種漢字通輸入法(新概念輸入法),其特征在于所說的漢字通輸入法是新概念的漢字輸入方法、漢字編碼方法和漢字字符定義方法以及漢字字符集的構(gòu)成,將漢字分為基本漢字和合成漢字兩種字,分別進(jìn)行編碼和輸入。把基本漢字定義為漢字字符,以字符方式輸入,基本漢字又包括獨(dú)體基本漢字和合體基本漢字,合成漢字由兩個基本漢字拼組合成輸入。
2.根據(jù)權(quán)利要求1所述的漢字通輸入法,其特征在于所說的漢字通是將基本漢字按整字編碼進(jìn)行輸入,而合成漢字是按上下、左右、內(nèi)外一分為二成兩個字分別編碼,進(jìn)行拼組輸入。
3.根據(jù)權(quán)利要求1和2所述的漢字通輸入法,其特征在于所說的漢字通輸入法是將漢字分解為用1-9表示的九種筆形碼或用a-z表示的26種字形字母碼進(jìn)行編碼輸入。
4.根據(jù)權(quán)利要求1、2和3所述的漢字通輸入法,其特征在于所說的漢字通輸入法是將基本漢字定義為漢字字符,并列入漢字字符集(漢字庫),合成字則不定義為漢字字符(1)基本字作為單獨(dú)漢字使用時,利用現(xiàn)行標(biāo)準(zhǔn)以字符方式進(jìn)行輸入。(2)基本字作為合成漢字的半字使用時,定義為半字字符列入字符集,在輸入合成字時,由兩個基本字拼組成合成字輸入。或者在輸入時由智能軟件將標(biāo)準(zhǔn)基本漢字轉(zhuǎn)化為上下型、左右型或內(nèi)外型進(jìn)行拼組輸入。
5.根據(jù)權(quán)利要求1、2和3所述的漢字通輸入法,其特征在于所說的漢字通輸入法是將難分為兩個基本漢字的獨(dú)體字,按習(xí)慣的寫字筆順編碼輸入,數(shù)字碼最多取1、2、3、4和末碼共5碼,不足5碼的,有幾碼取幾碼。字母碼最多取1、2、3和末碼共4碼。不足4碼的,有幾碼取幾碼。
6.根據(jù)權(quán)利要求1、2和3所述的漢字通輸入法,其特征在于所說的漢字通輸入法是用a--z字母對漢字編碼,將漢字的編碼方法分為通用碼(標(biāo)準(zhǔn)碼)和普及碼(常用碼)兩種1)通用碼(標(biāo)準(zhǔn)碼)對基本字和合成字分別進(jìn)行編碼,適用于全部合成漢字的輸入。(1)基本字的編碼取每個字的1、2、末3碼組成基本字的編碼,進(jìn)行輸入,不足3碼的,有幾碼取幾碼。(2)合成字的編碼將合成字按上下、左右、內(nèi)外一分為二成兩個基本字,分別按基本字編碼,由兩個基本字拼組輸入。2)普及碼(常用碼)適用于一般常用漢字,漢字通輸入法是將合體基本漢字一分為二成兩個漢字分別用字母碼取碼,第一字取1、末2個字母碼,第二個字取1、末2碼,共取4碼,組成合體字的編碼,取碼方法如下。(1)第一字為1碼時,取1碼,第二個字取1、2、末3碼,共取4碼,不足4碼的,有幾碼取幾碼。(2)第一字為2碼以上時,取1、末2碼,第二個字取1、末2碼,共取4碼。不足4碼的,有幾碼取幾碼。(3)第一字為3碼以上時,第二個為1碼時,第一字取1、2、末3碼,第二字取1碼,共取4碼。
7.根據(jù)權(quán)利要求1、2和3所述的漢字通輸入法,其特征在于所說的漢字通輸入法是用1--9數(shù)字對漢字編碼,將漢字的編碼方法分為通用碼(標(biāo)準(zhǔn)碼)和普及碼(常用碼)兩種1)通用碼(標(biāo)準(zhǔn)碼)對基本字和合成字分別進(jìn)行編碼,適用于全部合成字的輸入。(1)基本字的編碼合體基本字按上下、左右、內(nèi)外一分為二成兩個字,取每個字的1、末2碼組成基本字的編碼,進(jìn)行輸入,不足4碼的,有幾碼取幾碼。(2)合成字的編碼將合成字按上下、左右、內(nèi)外一分為二成兩個基本字,分別按基本字編碼,由兩個基本字拼組輸入。2)普及碼(常用碼)適用于一般常用漢字,漢字通輸入法是將合體基本漢字一分為二成兩個漢字分別用數(shù)字碼取碼,第一字取1、末2個數(shù)字碼,第二個字取1、2、末3碼,共取5碼,組成合體字的編碼,取碼方法如下。(1)第一字為1碼時,取1碼,第二個字取1、2、3、末4碼,共取5碼,不足5碼的,有幾碼取幾碼。(2)第一字為2碼以上時,取1、末2碼,第二個字取1、2、末3碼,共取5碼,不足5碼的,有幾碼取幾碼。(3)第一字為4碼以上時,第二個為1碼時,第一字取1、2、3、末4碼,第二字取1碼,共取5碼。
8.根據(jù)權(quán)利要求1、2、3、4、5、和6所述的漢字通輸入法,其特征在于所說的漢字通輸入法的詞組是取各個字的編碼或編碼的一部分組成詞組的編碼,用a-z字母編碼輸入時,取碼方法如下1)二字詞的編碼是取第一字和第二字的1、末碼,組成該詞組的編碼;2)三字詞的編碼是取第一字的1、末碼和第二、三字的第一碼,組成該詞組的編碼;3)四字以上詞組的編碼是取第一、二、三、末字的第一碼,組成該詞組的編碼。
9.根據(jù)權(quán)利要求1、2、3、4、5、和7所述的漢字通輸入法,其特征在于所說的漢字通輸入法的詞組是取各個字的編碼或編碼的一部分組成詞組的編碼,用1-9數(shù)字編碼輸入時,取碼方法如下組成該詞組的編碼。1)二字詞的編碼是取第一字和第二字的1、2、末碼,組成該詞組的編碼;2)三字詞的編碼是取第一字的1、2末碼和第二字的1末碼和第三字的第1碼,組成該詞組的編碼;3)四字以上詞組的編碼是取第一字取1、2、末3碼,取第二、三、末字的第一碼,組成該詞組的編碼。
10.根據(jù)權(quán)利要求1、2、3、4、5、6和7所述的漢字通輸入法,其特征在于所說的漢字通輸入法的簡碼是取各個字編碼的一部分組成該字的簡碼,用于輸入常用的漢字,簡碼的取法如下1)用1-9數(shù)字編碼輸入時的簡碼取碼方法是(1)最常用漢字,取該字的第1碼或取第一半字的第一碼和第二半字的第1碼或取第一半字的第一碼和第二半字的第1、末碼作為其簡碼。(2)常用漢字,取該合體字的第一半字的1、末碼和第二半字的1、末碼共4碼作為其簡碼。2)用a-z字母編碼輸入時的簡碼取碼方法是(1)最常用漢字,取該字的第一碼或取該合體字的第一半字的第1碼和第二半字的第1碼作為其簡碼。(2)常用漢字,取該合體字的第一半字的1碼和第二半字的1、末碼作為其簡碼。
全文摘要
本專利是以全新的概念創(chuàng)立了新概念輸入法——漢字通輸入法。它包括新的漢字輸入方法、編碼方法和漢字庫的構(gòu)成。本輸入法的編碼方法采用了字母化和筆形化的方法,大大簡化了漢字的編碼。還用本編碼方法編輯了一種用1-9數(shù)字編碼和用a-z字母編碼查字的‘漢語電子字典’,含繁簡體漢字13500余字,可用兩種編碼方法無同碼地查繁簡體字,還可以按拼音查字,經(jīng)小學(xué)2-3年級學(xué)生在電腦上進(jìn)行了試用,他們很快就能學(xué)會。本輸入法可不受漢字庫的限制輸入全部可用的繁、簡體漢字,可實現(xiàn)半無字庫和半無編碼的自由輸入漢字,是漢字輸入法的重大突破和革命,是漢字輸入法的創(chuàng)新,可從根本上較徹底解決漢字的輸入。
文檔編號G06F3/023GK1414459SQ0213660
公開日2003年4月30日 申請日期2002年8月22日 優(yōu)先權(quán)日2002年8月22日
發(fā)明者武守義 申請人:武守義
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
定襄县| 东丽区| 老河口市| 交口县| 东宁县| 镇康县| 丹棱县| 平潭县| 获嘉县| 金昌市| 三都| 曲水县| 永寿县| 青铜峡市| 康保县| 永靖县| 社会| 夹江县| 宁蒗| 阿尔山市| 青神县| 桂林市| 阜新市| 许昌县| 双牌县| 阳江市| 钟祥市| 常德市| 上思县| 永胜县| 张掖市| 开封县| 浦东新区| 调兵山市| 麟游县| 宣武区| 太原市| 普陀区| 太原市| 衡阳县| 通州市|