,有時特別加以區(qū)別。如果起筆相同, 據(jù)筆畫數(shù)安排在同一字配區(qū),則編碼相同,"小"與"Μ/"同為2, "人"與"同為3, "彐"與 同為0。如果起筆不同,就加以區(qū)別,相應(yīng)安置在起筆所在的位置,編碼自然是不相 同的;例如"八"為3, "、,'則為9 3六》為3, "刀"則為0, "?"則為2 門"為7, " 則為3。但是個別特殊情況下,"門"和《Π'月"和,<肖,,又難以區(qū)分,為減少特殊記憶, 增加易識易記性,規(guī)定"月"和《琴,,都是,,與"二"的組合,即把"月"和"轉(zhuǎn)"都拆分 成"門,,與"二",其余相關(guān)"門"和"Π,,的漢字,皆認(rèn)為是字配"門"的組合,如"用"是 ''門',+'中,、"周',是"門十一口',、" 網(wǎng)"是"門乂乂',等。 ⑤ 特殊安排:為減少某數(shù)碼的字配量,盡量避免漢字重碼現(xiàn)象,或便于記憶,按類識別, 個別字配未能按字畫數(shù)與起筆分配在相應(yīng)的區(qū)類上,而是歸納合并安排在叫法、源義相近 的字配所在位置,如:"耳"應(yīng)在多筆畫橫起筆的位置,但與"卩、卩、歸納合并后,安 排在三畫內(nèi)折起筆的位置;"十、應(yīng)在三畫內(nèi)橫起筆的位置,為減少重碼,安排在 多筆畫橫起筆的位置;"千、夂、+、Π"應(yīng)在三畫內(nèi)撇起筆的位置,為合理分配3碼與8碼 的資源,安排在多筆畫撇起筆的位置;、夂、v、a"應(yīng)在三畫內(nèi)點(diǎn)起筆類的位置,為減少 與"的沖突,安排在多筆畫點(diǎn)起筆類的位置;"女、刀、習(xí)、力、3"應(yīng)在三畫內(nèi)折起筆的位 置,為減輕5碼字配多的壓力,安排在多筆畫折起筆的位置;"巾、門、η、肉"安排在一 起,以方便記憶等。 ⑥ 標(biāo)志漢字:每個數(shù)碼有一個使用頻率高的漢字做標(biāo)志,它既是字配又是漢字,代表分 區(qū)與起筆筆畫,排在字配和助記詞的第一位,方便對字配編碼的記憶。 ⑦ 助記詞:為方便對字配編碼的熟記,每個數(shù)碼對應(yīng)一句字配的助記詞,包涵有字配 區(qū)、類、名稱等合并歸納信息,由讀音去聯(lián)想所對應(yīng)的字配。 6、 成字字配:即指可以獨(dú)立成字的字配。它既是字配又是漢字,或者既是漢字又是字 配。如:口、兒、門、弓、白等等。 7、 非成字字配:不能獨(dú)立成字的字配。如:子、彳、夂等等。 8、 交穿字配:字配與字配交叉重疊、囫圇一體,發(fā)生交穿的這一字配,叫交穿字配。這種 交重一體的構(gòu)成,叫交穿結(jié)構(gòu)。如漢字"內(nèi)",是字配"門"與"人"交穿構(gòu)成的,"人"是發(fā)生 交穿的字配,叫交穿字配;"內(nèi)"是交穿結(jié)構(gòu)。 9、字配塊:漢字是由字配這些構(gòu)字單位組成的,有間距的、相對獨(dú)立的每一個字配或字 配交穿結(jié)構(gòu),叫做一個字配塊。如:漢字"嬸"中,"女" 字配分別是兩個字配塊,"申" 這個交穿結(jié)構(gòu)是一個字配塊。 10、 字形:構(gòu)成方塊漢字的二維圖形。漢字可以看成是由一系列筆畫組成的,但此法描 述過于繁瑣,在數(shù)配碼中,也可形象簡略地說,漢字是由字配排列組合而成。將排列組合歸 納為幾種型式,稱漢字結(jié)構(gòu)。 11、 漢字?jǐn)?shù)配碼結(jié)構(gòu):字配構(gòu)成漢字時分布排列的規(guī)則和類型方式;或者說漢字的字 配塊排布構(gòu)成的型式。 最基本的排布只有兩種,第一種是字配塊之間獨(dú)立排布、相互分離或有間距,這種漢字 數(shù)配碼結(jié)構(gòu)稱合體結(jié)構(gòu)。 另一種為字配塊本身就是漢字,即字配與字配的交穿結(jié)構(gòu)或成字字配本身,這種漢字 數(shù)配碼結(jié)構(gòu)稱為獨(dú)體結(jié)構(gòu),其跟合體結(jié)構(gòu)相對。合體結(jié)構(gòu)又分為左右、上下、全包圍、半包 圍、框架結(jié)構(gòu)等。 為方便記憶與辨識,將漢字結(jié)構(gòu)歸納整合,容易判斷的左右、上下、全包圍、半包圍四種 結(jié)構(gòu),分別作為一種型式,把不容易判斷的獨(dú)體與框架等其它結(jié)構(gòu),歸并為一種型式,即除 容易判斷的四種型式外,都是其它結(jié)構(gòu)型式。這樣,共分成以下五種型式,在表2的基礎(chǔ)上 添加例字形成表5如下,然后進(jìn)行編碼,這就是數(shù)配碼對漢字結(jié)構(gòu)的規(guī)范與確認(rèn)。 表5 漢字?jǐn)?shù)配碼結(jié)構(gòu)編碼
進(jìn)一步的,判斷所述漢字?jǐn)?shù)配碼結(jié)構(gòu),首先看字配塊之間是否分離或有無間距,如是合 體結(jié)構(gòu),看排布方式屬于哪種類型。如字配之間膠合、無間距或相交穿、囫圇一體,則為其它 類型;或者說字配不是左右、上下、全包圍、半包圍的排列型式,則為其它類型。象"皿"字, 字配無間距,屬獨(dú)體(其它)類型,結(jié)構(gòu)編碼四"字,字配有間距,屬全包圍類型,結(jié)構(gòu) 編碼" 8";"坐"字,字配有間距,又不屬"左右、上下、全包圍、半包圍"型,則屬其它類型,結(jié) 構(gòu)編碼"0"。 二、漢字的拆分 漢字是由字配排列組合而成,相反按規(guī)則也能把漢字拆分成各種字配。如果在拆分漢 字時沒有對順序與方法的規(guī)定,拆分的結(jié)果將不是唯一的,這沒有參考、使用價(jià)值。根據(jù)描 述漢字的規(guī)律和字配的特點(diǎn),制定漢字的拆分規(guī)則,得到唯一的拆分結(jié)果。 1、拆分規(guī)則: 漢字拆分規(guī)則 順序分塊例:目正:門三 誤:口二 少大優(yōu)先例:燦正:火1LI誤人丨U 能離不接例:往正:Hi十一 誤十一 能接不穿例:甲正:門中 誤:日丨 2、說明: ① 順序分塊:漢字的拆分是按筆順的方向去裁截字配。順序指裁截字配的方向及給字 配編碼的序位。分塊是指在順序的規(guī)定下,按漢字結(jié)構(gòu)特點(diǎn),先把漢字劃分成沒有交穿的、 各自分立的單元,這些單元有些是獨(dú)立的字配,有些則是字配與字配相互交重一體的交穿 結(jié)構(gòu),即先把漢字劃分成字配塊。交穿結(jié)構(gòu)的字配塊,需要繼續(xù)拆分,最終將漢字拆分成符 合規(guī)則要求、結(jié)果唯一的字配組合。對一部分漢字,分塊就是拆分,通過分塊一步就能把它 拆分成各自獨(dú)立的字配,并確定每個字配的序位。如"漢"字,分成" "又"兩塊,就是把 "漢"字拆分成了" "又"兩個字配。另一部分漢字,字配與字配之間有的相互交連,把交 連部分看成一個單元塊,按順序與規(guī)則再繼續(xù)拆分。如"策"字,分成"、^ 朿"三 塊,"朿"是字配與字配交穿的字配塊,需要繼續(xù)拆分。順序分塊時,關(guān)鍵是按筆順的方向把 握次序,如拆分"坐"字,拆分的字配塊次序是"人"一"人"一"十"一"一";不能違反筆順 方向的次序拆解成"十"一"人"一"人"一"一",或者其它型式,正確的結(jié)果是唯一的,而不 是隨意的。 ② 少大優(yōu)先:將漢字拆分成字配,獨(dú)立的字配塊要盡量到最少;在同一序位裁截的字 配,要盡量到最大,即選取字畫數(shù)最多的字配。這就要求分解單元塊到最少,每個單元塊拆 分的字配數(shù)為最少,字配盡量到最大。少大優(yōu)先的原則,除獨(dú)立塊少、字配大外,還包括附加 規(guī)則少、簡便度高的原則。如將"應(yīng)"字拆分成"廣"一"i",而不是"、"一"廠"一"、,,《 -"一"。如拆分"甘"字,字配塊的次序?yàn)?廿"一"二",不能拆成"廿"一"一",雖然拆分 的字配數(shù)量相等,但是存在差異;因?yàn)樽峙?廿"未寫成時,中間已插入"一","廿"自身筆順 間斷,就開始了下一個序位字配的書寫,實(shí)際上還為"#"與"二"的組合;如果硬是拆解成 "廿" 一"一",書寫"廿"未完成時中間插入"一",筆順間斷交錯,要完成"廿"時,已經(jīng)包含了 "一",屬于"廿"字配的分步使用,需要對這種特殊情況下的使用做出處理標(biāo)記,附加分步報(bào) 關(guān)的使用規(guī)則,這就違反了附加規(guī)則少、簡便度高的原則。但將"戒"字分解成"戈"一"升", 即是分步使用"戈"字配,也是簡便度最高的拆分方法。 ③ 能離不接:將漢字拆分成最少個數(shù)的字配,能順序在有間距的地方獨(dú)立地裁截成字 配,就不要在相連相接處拆分或裁截字配,相離拆分優(yōu)先于在相連相接處裁截。如一般情 況下將"衣"字拆分成"丄代'',而不是拆分成"廣"?尺",這是因?yàn)槎颊J(rèn)為"歌"與 字配"1"有較遠(yuǎn)的距離感。又如"遂"字,正確的拆分是《μ" "j " "1_",而不是 "V" "7- "承" "1_";在這里注意少大優(yōu)先規(guī)則中拆分的每一序位取字配最大,在第一序 位,Μ〃最大,但"'與"尸"不明顯是相離的。 ④ 能接不穿:在每一個單元塊,拆分成同樣個數(shù)的字配,能順序在字配與字配相連處裁 截,就不要拆分成字配與字配相交穿的狀態(tài);優(yōu)先考慮在相連相接處裁截字配,實(shí)在不行才 將字配拆分成交穿狀態(tài)。也就是按序位,能裁截成與前后序位相離、相接的字配,就不要拆 分成與前后序位字配相交穿的狀態(tài)。比方將"里"分解成"門""牛w "二"的型式,而不要 分解成"日" "丨" "二"的狀態(tài);因?yàn)楸緛砜梢栽谛蛭?的位置拆成"門" "中",兩字配不發(fā) 生交穿,就要避免拆解成"日" "丨",使序位2的位置發(fā)生交穿情況。又比方將"春"分解成 "聲"日",而不要分解成"三" "人" "日"有交穿的狀態(tài)。如果字配交穿使用,還要 附加遵循交穿降級的規(guī)則。拆分裁截字配的優(yōu)先順序是:相離一相接或相連一相交或相穿。 ⑤ 在分解漢字時,遇到字配與字配相互交穿的單元塊,要繼續(xù)拆分出對應(yīng)序位的字配, 同樣遵循順序分塊、少大優(yōu)先、能離不接、能接不穿的規(guī)則。有時換一個角度分析這些單元 塊,可能字配之間不是交穿的狀態(tài)。如"耒"字拆分成"豐" "八"