欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

漢字全息編碼的制作方法

文檔序號:98756閱讀:4181來源:國知局
專利名稱:漢字全息編碼的制作方法
漢字全息編碼是一種漢字信息處理技術(shù)。
漢字不是拼音文字,在檢索、打印、通訊等方面效率不高,特別是在電子計(jì)算機(jī)上的應(yīng)用存在很大的困難,必須找到理想的漢字信息處理方法。漢字全息編碼正是為了這一目的而創(chuàng)造的。
為解決漢字信息處理問題,國內(nèi)外提出的漢字編碼方案不下五百種。漢字全息編碼的獨(dú)到之處在于
1.編碼容量大而無重碼;
2.具有見碼知字地可讀性。
漢字全息編碼通過筆形碼表明每個(gè)漢字的全部筆形,通過結(jié)構(gòu)碼反映漢字中筆畫的結(jié)構(gòu)關(guān)系,通過變碼反映漢字中構(gòu)件的部位關(guān)系,從而排除了重碼并達(dá)到字碼的可讀性。編碼的原理如下
一、字形編碼按字形編碼,排除按字音編碼時(shí)因同音字造成重碼的可能性。
二、筆形分類用26個(gè)字母分別代表漢字中各種筆形,分為三種類型
1、基本型橫、豎、撇、捺、點(diǎn)五種基本筆畫分別用a、b、c、d、e表示。字母a在英文中有“一”的意義,剛好對應(yīng)筆畫“橫”,其他則依次用b、c、d、e表示。
2、直觀型字母n表示“ㄇ”,u表示“ㄩ”,t表示“十”,l表示“し”,r表示“
”,x表示“ㄨ”,o表示“口”等等可以直觀對應(yīng)的筆形。
3、聯(lián)想型指那些可以用一句“口訣”來概括或提示的筆形。例如字母k表示“撇捺撇點(diǎn)撇橫人”的筆形,即“
”,“ㄑ”,“
”,“ㄑ”,“”,“人”等筆形。再如字母q表示“書為(為)偉(偉)力左缺框”的筆形?!皶鵀閭チΑ狈謩e用來提示包含在這四個(gè)字中的“
力”等近似筆形,“左缺框”表示“
”,“ユ”等左邊有缺口的框形筆形,都用q作為代碼。又如字母s表示“活三點(diǎn)及鼎巧馬”的筆形,即“氵”,“氵”,“
”,“三”,“
”,“彡”,“
”,“ㄋ”,“ㄣ”,“
”,“ㄅ”,“
”等十二種筆形。其中前六種都是三筆的筆形,概括為“活三點(diǎn)”;后六種都是折筆的筆形,分別用“及鼎巧馬”四個(gè)字來提示,“及”字包含“
”和它的近形“ㄋ”,“鼎”字包含“ㄣ”和它的近形“
”,“巧”字包含“ㄅ”,“馬”字包含“
”,都用s作代碼。
三、標(biāo)碼順次以筆順的先后作為標(biāo)碼的次序,使?jié)h字有規(guī)律地依次由方塊形的平面信息轉(zhuǎn)變?yōu)橹本€形的線性信息;反之,可由線性信息依次還原成平面信息。例如“可”字在標(biāo)碼時(shí)“一”用a表示,“口”用o表示,“亅”用b表示,依次排列編出該字的字碼為“aob”;該字碼在還原成漢字時(shí)可將“aob”所代表的筆形“一口亅”依次組合即得“可”字。
四、固定筆順對為數(shù)不多但有爭議的筆順用“組合碼”函定表示,從而達(dá)到唯一性。例如“方”字中“勹”的筆順有兩可的情況,有的先寫“丿”后寫“”,有的則先寫“”后寫“丿”,為此用組合碼cu固定表示“勹”。“方”字的編碼就唯一確定為mcu,其中m代表“亠”,cu代表“勹”,避免了這類筆形在筆順上的分歧。組合碼由基本代碼派生組成,只要掌握了基本代碼就自然能記住組合碼。
五,結(jié)構(gòu)顯示用“結(jié)構(gòu)碼”表明字形結(jié)構(gòu)上的微小差別,防止重碼,加強(qiáng)可讀性。結(jié)構(gòu)碼由個(gè)位數(shù)表示。例如“甲”、“申”兩字都是先寫出構(gòu)件“曰”,再寫豎筆“丨”;“曰”的代碼為oe,“丨”的代碼為b,按筆順編碼都是“oeb”,形成異字同碼,即重碼。但“甲”字中豎筆有2個(gè)交點(diǎn),而“申”字中豎筆有3個(gè)交點(diǎn),因此輔以結(jié)構(gòu)碼,用“oeb2”表示“甲”,“oeb3”表示“申”,并不重碼。反之,在見到“oeb2”時(shí),知道該字的豎筆有2個(gè)交點(diǎn);在見到“oeb3”時(shí),知道該字的豎筆有3個(gè)交點(diǎn),不至于“甲”“申”不分。
六、以少制多漢字的筆形遠(yuǎn)遠(yuǎn)超過26種,如果每個(gè)字母只代表一種筆形,那么26個(gè)字母是不夠用的。因此必須使每個(gè)字母所代表的筆形至少在兩種以上,并且必須使各個(gè)字母所代表的筆形在字碼中只能銜接成一種筆形,達(dá)到唯一性。例如字母q代表“
”,“
”,“
”,“力”,“
”,“ユ”等六種筆形,字母S代表“氵”,“
”,“
”,“三”,“
”,“彡”,“
”,“ㄋ”,“ㄣ”,“
”,“ㄅ”,“
”,等十二種筆形,當(dāng)q和s編在一起時(shí)只可能銜接成一種筆形“弓”;反之,“弓”也只能用qs來編碼。
七、縮短碼位據(jù)統(tǒng)計(jì),一九五二年教育部公布的二千個(gè)常用字,平均每個(gè)字有11.2筆,其中17筆以上的有221個(gè),有的字筆畫多達(dá)27筆以上。如果用“一筆一碼”的方法編碼,則字碼太長,不切實(shí)用。因此必須采取縮短碼位的措施。
1.縮略碼縮略碼是全碼的縮略形式,有記憶聯(lián)系,且數(shù)量不多,共占36個(gè)漢字,都是使用頻率高或編碼較難的漢字。例如“和”字的全碼為“dtko”,其縮略碼為“do”,是取全碼的首尾兩碼縮略而成?!澳稀弊值娜a為“tniat”,其縮略碼為“tnt”,是取全碼的首中尾三碼縮略而成。
2.對稱碼對稱碼是取y作為代碼,表示右部與左部對稱或同形的筆形。例如“臼”字中“亻”的代碼為y,“-”的代碼為e,合在一起“
”用ye表示;右邊的“
”與左邊的“
”對稱,用對稱碼y表示,“一”用a表示,“臼”字的字碼為yeya。因此用四位碼就能表示六畫的“臼”字。再如“朋”字中左邊的“月”用nj表示,其中“
”的代碼為n,“
”的代碼為j,合在一起“月”即為nj;右邊的“月”與左邊的“月”同形,用對稱碼y表示,“朋”字的字碼為“njy”。因此用三位碼就能表示八畫的“朋”字。
3.同形碼同形碼是取字母z作為代碼,表示下部與上部相同的筆形。例如“炎”字中上面的“火”用ik表示,其中“丷”的代碼為i,“人”的代碼為k,合在一起“火”即為ik;下面的“火”與上面的“火”同形,用同形碼Z表示,“炎”字的字碼為“ikz”。因此用三位碼就能表示八畫的“炎”字。
4、組合碼如前所述,組合碼用來固定表示有爭議的筆順,此外還有簡化編碼和縮短碼位的作用。例如“受”字中的“
”用組合碼dea表示,“又”用組合碼rd表示,合在一起“受”的字碼為deard,因此用五位碼就能表示八畫的“受”字。
八、偏旁變碼有少量偏旁部首在漢字中位置不同構(gòu)成的字也不同,必須用“變碼”來區(qū)別對待。例如“唄”與“員”都是由“口”,“ㄇ”,“人”三個(gè)構(gòu)件組成,但這兩字中“口”的位置不同,因此用字母O表示口字旁的“口”,用字母nu表示口字頭的“口”,nu在這里是“口”的變碼,相當(dāng)于“ㄇ”(=n)和“ㄩ”(=u)的疊加形式。于是“onk”表示口字旁的“唄”,“nunk”表示口字頭的“員”。“變碼”是原碼的變體,起到加強(qiáng)可讀性和防止重碼的作用。
漢字全息編碼的筆形代碼和標(biāo)碼方法
一、筆形代碼
A、基本代碼
(一)筆形碼
說明
1.編碼按筆順進(jìn)行,優(yōu)先采用筆畫多的筆形碼。例如“大”字,不按“一丿丶”而按“丶”編碼,即“大”=td。用雙線劃出的復(fù)筆形,不能拆開編碼。例如“區(qū)”字,不按“一ㄨ乚”而按“匚ㄨ”
編碼,即“區(qū)”=wx。
2.豎撇用b,斜撇用c。折筆筆形內(nèi)的撇一律用c。
3.d包括由捺退縮所成之點(diǎn)。
4.e包括與豎筆相接的短橫以及在封閉的左缺框內(nèi)僅有的一橫或一豎。
5.筆形“勹”只有在上下結(jié)構(gòu)的最上部位以及在鳥類字頭中用f標(biāo)碼,其他情況用cu標(biāo)碼。例如“沒”=sfrd,其中f=勹;再加“鳥”=fesa,其中f=勹。但“勿”=cucc,其中cu=勹。
6.s中的“彡”只在右旁時(shí)使用,在其他部位時(shí)用ccc標(biāo)碼。例如“形”=ahs,但“須”=cccank,“參”=wetdccc。
7.u還用作大口框以及“西、
、酉”等筆形或字形中的尾碼。例如“國”=nageu,“西”=ahu,“票”=ahumbi,“酉”=ahau。
8.w中豎折的橫部明顯較長;l中豎折的豎部較長或豎部與橫部的長短相仿。
9.一位碼的字在右欄“一碼字”中都已表明,其他字的字碼最少應(yīng)該是兩位。例如“口”用作獨(dú)體字時(shí),其字碼不是o,而是nu。再如“士”用作獨(dú)體字時(shí),其字碼不是g而是ta。
10.字碼的首位是z時(shí),應(yīng)在z前加a。例如“乙”=az,“迅”=azted。
(二)結(jié)構(gòu)碼
結(jié)構(gòu)碼用個(gè)位數(shù)表示,寫在有關(guān)字母之后,一般用來指出該字母所代表的筆形穿過前序筆形時(shí)產(chǎn)生的交點(diǎn)數(shù)。
例出=ub1u,甲=oeb2 申=oeb3
結(jié)構(gòu)碼“5”還用來辨別少量容易混淆的字形。
例干=at,但于=at5
結(jié)構(gòu)碼“8”還用來表示前序筆形在上部。
例仌=k8k
B、派生代碼
(一)組合碼
1.ai
丌(亓) 24.gx 走
2.aiwyia 亞 25.hef
3.aom 豆 26.hepd 茣
4.aonv 鬲 27.ii 灬
(變亦)
5.ax 丈 28.iiayeya 鑿
6.ba (青表隹) 29.inbikx 敝
7.bab
30.jz 蟲
8.bk 末 31.ktk
夾(
)
9.buib
32.k8k 仌
10.cty
33.ld
11.cu 勹(方敖) 34.lr 耳
12.cx 夂夂夕夂(處夜) 35.me 宀
13.daf 堯 36.merd
14.dea
37.mex 定
15.du
(留) 38.mt 辛
16.ea
39.myy
17.eaecti 冞 40.ngg 里
18.ee 冫(斗頭於扵) 41.ngii 黑
19.ej 疒 42.niu 凸
20.erqi
43.nl
21.es
44.oe 日曰曰
22.ev 礻 45.oex 是
23.ew 衤 46.oi 四罒
47.oj 目 60.tp 車
48.ojj 貝 61.tz

49.oorlk
62.uiu 凹
50.ox 足
63.us 心
51.qh
64.vrx 虍
52.ql 巳
(民) 65.wa 纟
53.qu 已 66.ws 糸
54.qw 己
(改) 67.wv
(互貫毋)
55.rby 厤 68.wy
56.rd 又又
(圣鄧久涇)69.xe 弋(試武)
57.rs
70.xz 丸
58.ru 萬
71.yny
59.tda 太 72.yxy
說明
1.括號中為字例。
2.筆形“冫”只在“斗、頭、於、扵”字形中用ee標(biāo)碼,其他情況用j標(biāo)碼。
3.“曰”用作獨(dú)體字時(shí),其字碼不是oe而是nau。
4.用雙線劃出的組合碼筆形,即使其前筆與后筆之間還有筆畫,也不能拆開編碼。例如“式”字,不按“一工
丶”而按“弋工”編碼,即“式”=xeam。再如“夜”字,不按“亠亻ク丶
”而按“亠亻夂丶”編碼,即“夜”=mycxe。
(二)縮略碼
1.雨 ajj 3.車 aoet 5.的 ce
2.兩 ankk 4.豐 bsbyaom 6.樂 ceoti
7.鬼 cfwe 17.堇 heba 27.骨 nn
8.舟 cne 18.革 het 28.門 qey
9.身 cnsc 19.金 kaa 29.馬 rpii
10.鼻 cojai 20.命 kab 30.尞 tdibi
11.得 cye 21.這 md 31.南 tnt
12.我 de 22.垂 mhg 32.齒 vmkaku
13.和 do 23.龍 mials 33.女 wr
14.永 ek 24.這 mjd 34.母 wve
15.魚 fa 25.就 mole 35.
wwawwl
16.魚 fii 26.
nju 36.鳥 yqeii
注組合碼和縮略碼共108個(gè),都是從基本代碼派生而來,有一定的記憶聯(lián)系。只要掌握了基本代碼,就自然能記住組合碼和縮略碼。
二、標(biāo)碼方法
1.每字都按楷書筆順進(jìn)行。
2.標(biāo)碼時(shí)優(yōu)先采用縮略碼或組合碼,其次是選用筆形碼。筆形碼中,優(yōu)先使用筆畫多的代碼。例如“獻(xiàn)”字在編碼時(shí)首先標(biāo)出“南”的縮略碼“tnt”,余部“犬”中的“”用代表復(fù)筆的筆形碼“t”表示,“
”和“丶”分別用代表單筆的筆形碼“d”和“e”表示,“獻(xiàn)”字的字碼為“tnttde”。再如“申”字中的“曰”有組合碼,即“oe”,因此“申”字在編碼時(shí)首先標(biāo)出“oe”,再標(biāo)余部“丨”,用筆形碼“b”表示,但“丨”穿過前序筆形有3個(gè)交點(diǎn),所以還得加上結(jié)構(gòu)碼“3”,“申”字的字碼為“oeb3”。
3.凡是不用結(jié)構(gòu)碼而能編出字碼時(shí),則一律不考慮結(jié)構(gòu)碼,例如“天”字的字碼為atd,而不是mk1。
4.用字母dd作為標(biāo)點(diǎn)符號的專用標(biāo)記。
例如逗號,=ddc 句號。=ddo 問號?=ddqe同一個(gè)字重疊出現(xiàn)時(shí)后者可用“se”表示。
例如等等=fftate se
與已有技術(shù)相比,漢字全息編碼具有的優(yōu)點(diǎn)或效果如下
1.編碼容量大,足以涵蓋〔辭?!炒笞值渖系娜孔中巍?br>2.一個(gè)字碼只對應(yīng)一個(gè)漢字,無重碼。對〔辭海〕大字典中一萬六千多個(gè)漢字全部編碼后得到證實(shí)。
3.編譯雙解,既能見字知碼又能見碼知字。
4.繁體字、異體字、簡體字都能編出各自的代碼,各不相同。
5.輸入設(shè)備簡便,既可單獨(dú)用英文鍵盤輸入也可同時(shí)用英文鍵盤和特殊鍵盤輸入。特殊鍵盤共108鍵,其中72鍵用于組合碼(以12鍵×6按字母表或筆畫順序排列),36鍵用于縮略碼(以12鍵×3按字母表或筆畫順序排列)。
6.代碼對應(yīng)筆形有直觀性或記憶聯(lián)系。
7.以明顯少于筆畫數(shù)的碼位來反映漢字字形的全部信息。字碼的碼位不長,最少為1位,最多為15位和16位(兩者總共不到十個(gè)漢字)。一般書報(bào)文章每百字的平均碼位通常不超過5位,十個(gè)最常用字的平均碼位為2.1位,一百個(gè)高頻字的平均碼位為3.45位。
權(quán)利要求
1、本發(fā)明屬于漢字信息處理技術(shù),是一種按字形、筆順用26個(gè)字母作為筆形代碼的編碼系統(tǒng),其特征在于通過筆形碼表明各個(gè)漢字的全部筆形,通過結(jié)構(gòu)碼反映漢字筆畫的結(jié)構(gòu)關(guān)系,通過變碼反映漢字構(gòu)件的部位關(guān)系,通過組合碼固定表示有爭議的筆順,通過縮略碼、對稱碼、同形碼等簡化編碼和縮短碼位,從而達(dá)到既能見字知碼又能見碼知字,確保字形不同編出的字碼也不同。
2、如權(quán)利要求
1所屬的一種編碼系統(tǒng),其特征在于字母對應(yīng)筆形具有直觀性或記憶聯(lián)系。例如x=ㄨ,u=ㄩ,a=一等等。
3、如權(quán)利要求
1所屬的一種編碼系統(tǒng),其特征在于以個(gè)位數(shù)作為結(jié)構(gòu)碼,用來表示筆畫交點(diǎn)或辨別少量容易混淆的字形。
4、如權(quán)利要求
1所屬的一種編碼系統(tǒng),其特征在于通過變碼反映出構(gòu)件在字中的部位,起到防止重碼和加強(qiáng)可讀性的作用。
5、如權(quán)利要求
1所屬的一種編碼系統(tǒng),其特征在于從基本代碼派生出組合碼,用來固定表示有爭議的筆順或簡化編碼和縮短碼位。
6、如權(quán)利要求
1所屬的一種編碼系統(tǒng),其特征在于設(shè)置了縮略碼,縮略碼是全碼的縮略形式,用來固定表示一些使用頻率高或編碼較難的字,并起到簡化編碼、縮短碼位的作用。
7、如權(quán)利要求
1所屬的一種編碼系統(tǒng),其特征在于固定使用一個(gè)字母作為對稱碼,用來表示右部與左部對稱或相同的筆形,起到簡化編碼、縮短碼位的作用。
8、如權(quán)利要求
1所屬的一種編碼系統(tǒng),其特征在于固定使用一個(gè)字母作為同形碼,用來表示下部與上部相同的筆形,起到簡化編碼、縮短碼位的作用。
9、如權(quán)利要求
1所屬的一種編碼系統(tǒng),其特征在于固定使用兩個(gè)字母作為標(biāo)點(diǎn)符號的專用標(biāo)記。
10、如權(quán)利要求
1所屬的一種編碼系統(tǒng),其特征在于既可單獨(dú)用英文鍵盤輸入也可同時(shí)用英文鍵盤和特殊鍵盤輸入,后者專供輸入組合碼和縮略碼之用。
專利摘要
漢字全息編碼是一種按筆順、筆形用26個(gè)字母作為筆形代碼的編碼系統(tǒng),其特征在于既能見字知碼又能見碼知字,以明顯少于筆畫數(shù)的碼位來反映漢字字形的全部信息。字母作為代碼對應(yīng)筆形具有直觀性或記憶聯(lián)系。此外,通過結(jié)構(gòu)碼(個(gè)位數(shù))表示筆畫交點(diǎn)或字形的細(xì)微差別,通過變碼表示構(gòu)件處于字中的部位,從而確保字形不同字碼也不同,排除了重碼。字碼的碼位不長,最少為1位,最多為15位和16位(兩者總共不到十個(gè)漢字)。一般書報(bào)文章每百字的平均碼位通常不超過5位。
文檔編號G06F3/023GK86102528SQ86102528
公開日1988年4月13日 申請日期1986年10月4日
發(fā)明者包祖剛, 沈丹仙, 包祖學(xué) 申請人:包祖剛, 包祖學(xué), 沈丹仙導(dǎo)出引文BiBTeX, EndNote, RefMan
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
如皋市| 广灵县| 凭祥市| 明溪县| 乐平市| 舞钢市| 辽阳市| 峨眉山市| 武安市| 富锦市| 宁晋县| 潞城市| 拉孜县| 镇雄县| 越西县| 阳新县| 唐海县| 文成县| 吴桥县| 宁陵县| 囊谦县| 平度市| 田阳县| 合水县| 鹰潭市| 高安市| 固镇县| 司法| 台南市| 长宁县| 肇源县| 揭西县| 镇赉县| 曲靖市| 收藏| 涟水县| 商南县| 东明县| 河池市| 祁门县| 宁强县|