欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

四筆序音漢字編碼方法

文檔序號(hào):6601554閱讀:798來源:國(guó)知局
專利名稱:四筆序音漢字編碼方法
技術(shù)領(lǐng)域
本發(fā)明是關(guān)于計(jì)算機(jī)漢字編碼技術(shù)的一種方法。
目前漢字編碼有多種方案,如拼音碼、五筆字型碼等,這些方案已經(jīng)利用了漢字的筆畫、字根、拼音、結(jié)構(gòu)等特征,并為社會(huì)所公知。但是,作為漢字的計(jì)算機(jī)輸入技術(shù)其存在的主要問題是如何解決規(guī)范、標(biāo)準(zhǔn)、高效、快速、簡(jiǎn)單、易學(xué)等問題。所謂規(guī)范,是指編碼規(guī)則明確,不存在或很少存在歧解的問題;標(biāo)準(zhǔn)是指編碼規(guī)則應(yīng)該依據(jù)一些最普通而又最明確,為大多數(shù)人能了解的一些漢字的基本特征而制定;高效是體現(xiàn)在編碼長(zhǎng)度上不宜過長(zhǎng),理論上講,用現(xiàn)有常用字符來表達(dá),要區(qū)分每個(gè)漢字且沒有重碼,一般需要三個(gè)字符,而實(shí)際上難以嚴(yán)格做到這一點(diǎn),作為一個(gè)編碼方案如果其平均輸入效率達(dá)到三鍵或少于三健一字,就應(yīng)該視為高效的;快速是要盡量減少重碼,提高輸入速度;簡(jiǎn)單易學(xué)就是要編碼規(guī)則盡量少,記憶量少且便于聯(lián)想,并用盡量減少特例與特殊情況下的不規(guī)則處理。應(yīng)該說為了同時(shí)解決以上問題,仍需要研究更好的編碼方法。
在現(xiàn)行編碼方案中,如五筆字型,由漢字到編碼先要拆分成字根,由字根聯(lián)想到筆畫,再由筆畫到代碼。這樣,要確定一個(gè)漢字的編碼需要了解兩個(gè)過程,一是由漢字到字根的拆分方法,二是由字根到代碼的定義方法。在這兩個(gè)過程中,使用者不僅要熟悉大量的字根,并且有些字根不常用甚至與習(xí)慣不一致;還要熟悉編碼規(guī)則,在這些編碼規(guī)則中有時(shí)根據(jù)不同情況采取了不同的拆分方法和代碼定義方法,即特殊情況,這樣產(chǎn)生的結(jié)果一方面是編碼規(guī)則復(fù)雜化、多樣化,難免讓使用者,尤其是初學(xué)者感到不明確或者有多解性;另一方面是大量的記憶給學(xué)習(xí)和使用帶來了不便,如果想達(dá)到熟練程度,人們不得不花費(fèi)大量時(shí)間去練習(xí)。
還有一些現(xiàn)行方案采用了漢字的某些不明確或不易被人掌握的特征,如有的方案在定義字根代碼時(shí),有時(shí)采用字根的形狀為依據(jù),有時(shí)采用字根的拼音為依據(jù),這種定義實(shí)際上是采用雙重標(biāo)準(zhǔn)或多重標(biāo)準(zhǔn),具有不確定性,有的方案采用漢字的音調(diào)、結(jié)構(gòu)等特征,而這些特征往往不容易被使用者所掌握,如音調(diào)很多人說不準(zhǔn);另外,在使用字根作為編碼依據(jù)的方法中,幾乎都無(wú)法解決字根與代碼一一對(duì)應(yīng)的問題。
在高效、快速方面現(xiàn)行許多方案都達(dá)到了比較好的目標(biāo)、但是,有的方法缺少良好的可操作性,例如雖然定義了二碼、三碼等簡(jiǎn)單碼字,但在輸入某一漢字時(shí)如何知道它是不是簡(jiǎn)碼。字?這對(duì)初學(xué)者而言仍不簡(jiǎn)單。解決這一問題需要在計(jì)算機(jī)程序設(shè)計(jì)方面給予配合,并且有的程序已經(jīng)較好的做到了這一點(diǎn)。
規(guī)范化和標(biāo)準(zhǔn)化的問題解決了,簡(jiǎn)單易學(xué)的目的也就實(shí)現(xiàn)了。
本發(fā)明是希望通過尋找和利用漢字的一些基本而又明確的特征及這些特征的組合進(jìn)行單字和詞組編碼,達(dá)到簡(jiǎn)化編碼規(guī)則,增加標(biāo)準(zhǔn)程度,減少記憶成分,提高編碼效率的目的。
本發(fā)明是這樣實(shí)現(xiàn)的,利用漢字的字首、字尾筆畫或字首、字尾字根,或結(jié)合漢字拼音進(jìn)行單字或詞組編碼。
在確定字首、字尾筆畫及字首、字尾字根時(shí)利用了筆序的概念,在絕大多數(shù)情況下筆序有明確的定義且為人們所熟悉,因此以字首、字尾為特征,從根本上改變了漢字拆分成字根代碼的過程和方法,并且字首、字尾特征突出,實(shí)現(xiàn)了規(guī)則簡(jiǎn)單、代碼明確的標(biāo)準(zhǔn)要求。
由于具體利用字首、字尾筆畫時(shí),一般取四筆,其中字首、字尾各取二筆,加上筆序、拼音的特征,所以本發(fā)明提出的方法稱為四筆序音漢字編碼方法。
作為上述方法的具體實(shí)施方案,可以采取以下步驟1、將漢字的基本筆畫,如點(diǎn)、橫、豎、撇、折、捺、鉤等,歸成五種類型①、( ),點(diǎn),包括提、捺;②一,橫;③丨,豎;④丿,撇;⑤(∠乛  ),折,包括前四類筆畫以外的其它筆畫,如豎折、撇折,橫鉤、豎鉤、橫折鉤、橫彎鉤等。
這樣,所有的漢字基本筆畫可由以上五類為代表,作為該編碼方案的基本筆畫類型。
2、前述五類基本筆畫按序進(jìn)行兩兩排列,分配到25個(gè)字母健上,定義如下q丶丶w丶一e丶丨r丶丿t丶y一丶u一一i一丨o一丿p一a丨丶s丨一d丨丨f丨丿g丨h丿丶j丿一k丿丨l丿丿m丿x丶c一v丨b丿n英文字母“z”在定義中未用,編碼中另有用途。按照上述定義,25個(gè)英文字符與筆畫排列形成了一一對(duì)應(yīng)關(guān)系,稱為筆畫排列碼,簡(jiǎn)稱筆畫碼。筆畫碼在鍵盤上是按順序排列的,容易記憶。
3、選擇少量漢字偏旁或部首作為編碼特征,這些偏旁或部首稱為編碼字根,并將其分配到數(shù)字0-9及除z以外的25個(gè)英文字母健上,定義如下1木 2、火 3、土(士) 4、金 5、氵6、日(曰) 7、月( ) 8、山 9、石 0、田q、饣 w、攵 e、兒 r、子(孑) t、寸y、蟲 u、馬 i、十 o、又 p、幾a、口 s、忄 d、艸() f、目 g、巾h、犭 j、八 k、人 i、禾 m、王x、讠 c、 v、 b、女 n、大以上是按字母在鍵盤上的順序排列的,括號(hào)內(nèi)表示同碼字根。按照上述定義減少了字根數(shù)量,并且編碼字根與其代碼之間形成了一一對(duì)應(yīng)關(guān)系,稱為字根碼。
4、對(duì)單個(gè)漢字進(jìn)行編碼,其方法是(1)從字首和字尾各取二筆筆畫,共四筆,其中第一筆與第二筆的排列碼構(gòu)成該字第一位編碼,倒數(shù)第二筆與倒數(shù)第一筆的排列碼構(gòu)成該字第二位編碼,不足四筆時(shí)按以下原則處理對(duì)于單筆字,取該筆畫的重復(fù)筆畫排列碼作為第一位編碼,即補(bǔ)上一筆,然后第二位編碼用z作為補(bǔ)碼;對(duì)于二筆字,第一位編碼為筆畫排列碼,第二位編碼用z作為補(bǔ)碼;對(duì)于三筆字,第一位編碼為前二筆的筆畫排列碼,第二位編碼取第三筆的重復(fù)筆畫排列碼;(2)字首若為編碼字根則優(yōu)先取字根碼取代字首筆畫排列碼構(gòu)成第一位編碼,字尾若為編碼字根則優(yōu)先取字根碼取代字尾筆畫排列碼構(gòu)成第二位編碼;(3)對(duì)于編碼字根所代表的漢字,第一位編碼為字根碼,第二位編碼用z作為補(bǔ)碼;(4)根據(jù)字首、字尾所確的二位單字編碼稱為筆序碼,它與拼音相結(jié)合,即按順序取該字拼音碼的第一、第二位字母作為該字的第三位和第四位編碼,拼音碼只有一位字母時(shí),第二位用空格代替,這樣可構(gòu)成該字的四位完整編碼,稱其為四筆序音碼,簡(jiǎn)稱四筆碼或序音碼。
在輸入拼音碼時(shí)進(jìn)行了以下簡(jiǎn)化和修改。
①zh、ch、sh分別由z、c、s代替作為一位;②ang、eng、ing、ong都由g代替作為一位;③ü由u代替。
由于對(duì)拼音碼只進(jìn)行了少量簡(jiǎn)化和修改,所以沒有增加過多的記憶量。
5、對(duì)偏旁字進(jìn)行編碼對(duì)于部分偏旁(字庫(kù)中有定義的),可按一般單字編碼方法取前第一位和第二位筆畫碼,然后,拼音碼部分用兩位字符zz作為補(bǔ)碼。
6、對(duì)詞組進(jìn)行編碼的方法是選取詞組的第一字的筆序碼和詞尾字的筆序碼形成詞組編碼??梢允珍洷M量多的兩字和多字詞組,有利于提高編碼效率和輸入速度。
對(duì)以上編碼實(shí)施方案,特別說明以下幾點(diǎn)(1)取字首、字尾筆畫碼或字首、字尾字根碼時(shí),一般情況下,不能重復(fù)利用字根或筆畫特征,如“自”取“ ”之后,第二位則不能取“目”;(2)取字首、字尾字根時(shí)要符合獨(dú)立性原則,即用一條封閉曲線將編碼字根包圍起來其中不包括其它筆畫,并且也不與其它筆畫相交,如“老”字的字首不能作為“土”;(3)使用四筆序音編碼時(shí)可以采用簡(jiǎn)碼,即在不出現(xiàn)重碼的情況下,對(duì)于某些字可只取前一、二或三位作為該字編碼,并且在設(shè)計(jì)計(jì)算機(jī)程序時(shí)可進(jìn)行屏幕追蹤顯示,不需專門記憶,大多數(shù)漢字可采用簡(jiǎn)碼,提高編碼效率;
(4)該編碼方法重碼率較低,且重碼字中大多數(shù)為兩字重碼,這樣,在確定單字編碼時(shí)常用字可取簡(jiǎn)碼,不常用字仍采用全碼,即四位序音碼,可以更進(jìn)一步減少重碼率。
(5)拼音、字根和筆畫代碼可一律采用小寫體。
采用上述漢字編碼方法,直接使用字首、字尾筆畫排列碼或字首、字尾字根碼作為編碼依據(jù),避免了由漢字到字根的拆分過程,使編碼方法得到了簡(jiǎn)化;采用字首、字尾筆畫排列碼或字首、字尾字根碼其特征明確,規(guī)則單一,避免了編碼規(guī)則的多解性;筆畫排列和編碼字根與其代碼之間分別形成了一一對(duì)應(yīng)關(guān)系,分布有序,減少了字根數(shù)量及記憶量;筆畫、筆序、編碼字根、拼音等都屬于漢字基本特征,且編碼字根都是常用偏旁和部首,容易被人們所掌握,符合日常習(xí)慣及標(biāo)準(zhǔn)化要求,不額外增加人們的學(xué)習(xí)內(nèi)容,采用簡(jiǎn)碼與全碼相結(jié)合的方式,大大減少了重碼率,達(dá)到了較高目標(biāo),采用簡(jiǎn)碼、詞組編碼,并盡量擴(kuò)大詞組數(shù)量,提高了編碼效率和輸入速度,平均編碼效率可在三鍵以下。
申請(qǐng)人認(rèn)為,以上方法與現(xiàn)行方法相比,如五筆字型,主要有以下不同(1)兩種方法雖然都采用了筆畫及筆畫排列的形式,但是,本方法限定為字首筆畫和字首筆畫排列或字尾筆畫和字尾筆畫排列,而五筆字型中沒有這種特征;本方法中筆畫排列碼直接用于單字或詞組編碼,而五筆字型中用于字根分類;本方法中筆畫排列碼用在單字或詞組編碼中是嚴(yán)格對(duì)應(yīng)的,而在五筆字型中是不嚴(yán)格的。
(2)兩種方法雖然都采用了字根的概念,但是,本方法中特指字首和字尾字根,而五筆字型中不是利用這種特征;本方法中采用少量字根,而五筆字型中包括了大量字根;本方法中字根與其代碼一一對(duì)應(yīng),而五筆字型一碼多用,本方法中采用的字根比較常用、標(biāo)準(zhǔn),五筆字型中采用了一些非常用或非標(biāo)準(zhǔn)字根。
(3)編碼方法不同,本方法強(qiáng)調(diào)字首、字尾特征,尤其強(qiáng)調(diào)字首、字尾筆畫特征,并且與筆序、拼音相結(jié)合,是區(qū)別于現(xiàn)行方法的主要依據(jù)。筆畫碼在單字和詞組編碼中的應(yīng)用占主要地位。
(4)本方法的改進(jìn)產(chǎn)生了積極、突出的效果。
以上方法已進(jìn)行了充分公開,據(jù)此人們可以確定單字或詞組編碼,并可設(shè)計(jì)有關(guān)計(jì)算機(jī)程序。
權(quán)利要求
1.關(guān)于計(jì)算機(jī)漢字編碼的一種方法,將漢字筆畫劃分成五種基本類型,然后兩兩排列形成一組,同時(shí)選擇部分漢字偏旁和部首作為編碼字根,將這些筆畫排列和編碼字根分別分配到計(jì)算機(jī)鍵盤的數(shù)字和字符鍵上形成對(duì)應(yīng)代碼,在此基礎(chǔ)上進(jìn)行單字和詞組編碼,本發(fā)明的主要特征在于利用漢字的字首、字尾筆畫或字首、字尾字根,或結(jié)合漢字拼音對(duì)單字和詞組進(jìn)行編碼。
2.按照權(quán)利要求1所述的方法,在利用字首、字尾字根時(shí),是按漢字書寫筆序從字首、字尾各取二筆筆畫,共四筆,其中前二筆的筆畫排列碼作為一位漢字編碼,后二筆的筆畫排列碼作為另一位漢字編碼,不足四筆時(shí)采用補(bǔ)筆和補(bǔ)碼方式處理。
3.按照權(quán)利要求1所述的方法,字首、字尾字根是按漢字書寫筆序和字根獨(dú)立性要求從字首、字尾選取的,其特征是選用了少量字根作為編碼字根,且與其代碼之間形成一一對(duì)應(yīng)關(guān)系。
4.按照權(quán)利要求1所述的方法,利用字首、字尾字根時(shí)具有優(yōu)先性,即字首、字尾遇到編碼字根時(shí),要優(yōu)先取字根碼代替筆畫排列碼。
5.按照權(quán)利要求1所述的方法,在筆序碼與拼音碼相結(jié)合時(shí),一般按序選用漢字拼音的前二位字母,拼音字母可保持原碼,簡(jiǎn)化碼或修改碼,也可省略。
6.按照權(quán)利要求1所述的方法,詞組編碼是利用詞組的第一字和未尾字的筆序碼組成的。
全文摘要
本發(fā)明是關(guān)于計(jì)算機(jī)漢字編碼的一種方法。目前,漢字編碼方法存在的主要問題是如何解決規(guī)范、標(biāo)準(zhǔn)、高效、快速、簡(jiǎn)單、易學(xué)等問題。本發(fā)明是利用漢字的字首、字尾筆畫或字首、字尾字根,或結(jié)合漢字拼音對(duì)單字和詞組進(jìn)行編碼。具體的編碼方式是從字首、字尾各取二筆,共四筆,確定筆序碼,或優(yōu)先利用字首、字尾的字根碼作為筆序碼,利用筆序碼或再結(jié)合漢字拼音形成單字或詞組編碼。具有特征明確、規(guī)則單一、記憶量少、重碼率低等特點(diǎn)。
文檔編號(hào)G06F3/023GK1132366SQ95110379
公開日1996年10月2日 申請(qǐng)日期1995年3月25日 優(yōu)先權(quán)日1995年3月25日
發(fā)明者張興民 申請(qǐng)人:張興民
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
洛川县| 漳浦县| 内江市| 常宁市| 和硕县| 昌黎县| 苗栗县| 宣化县| 恩平市| 毕节市| 弥勒县| 白玉县| 兴山县| 凤凰县| 滨海县| 嵊州市| 岳阳市| 三亚市| 梅河口市| 洛隆县| 沙洋县| 通榆县| 武穴市| 阳信县| 新野县| 进贤县| 眉山市| 龙里县| 南雄市| 观塘区| 麦盖提县| 车险| 壤塘县| 永嘉县| 昌都县| 米泉市| 武汉市| 海安县| 固安县| 布拖县| 霍林郭勒市|