,而不是交穿的"三""小"。 如果字配與字配的交穿不可避免,則盡量按少大原則,拆分出數(shù)量少、筆畫多的字配來(lái)。 "曹"字拆分成"絲" "門" "日"、而不是"一""門""丑""日";"束"字拆分成"木""口"、 而不是"一" " 口""小";"甫"字也是一樣,可以"甫"一"豐、門、、",不可以"甫"一"一、 門、午、、"。如果拆分時(shí),出現(xiàn)兩種字配數(shù)量相等的可能情況,象"聿"字,可拆分成"3" "牛",也可拆分成"肀" "二",但兩種情況是有差異的,"聿"一"彐"+ "手" + "交穿",或 "聿"一"分步"+ "二"+ "交穿"+ "肀",顯然第二種情況復(fù)雜,附加規(guī)則多,不宜采用,第 一種情況簡(jiǎn)潔明了,故是唯一結(jié)果選擇,其結(jié)果是少大優(yōu)先規(guī)則所決定的。又如拆分"季" 字,在序位1字配取最大為"千",序位2字配取最大為"八",序位3字配取最大為"子", "季"一"千"+ "八"+ "子",這是正確的;可是仍拆分成三個(gè)字配,序位1字配取"廠',不是 最大,則序位2字配取"木",序位3字配取"子","季"一"j"+ "木"+ "子",這是錯(cuò)誤的,違 背了少大優(yōu)先規(guī)則。因?yàn)槌鸱值淖峙鋽?shù)量最少外,還要按序位保證字配最大,拆分"季" 字,序位1最大的字配是"千",而不是"J"。 ⑥ 正確使用字配。漢字的有些部件,比如偏旁部首,跟字配形似,但是沒有被選中做字 配,因其本身并不是字配,可以進(jìn)一步拆分,跟字配是有區(qū)別的,要注意區(qū)別與正確拆分。不 是字配的偏旁部首有方框"口"、"酉"字等,分別和字配"口"、字配"西"形似。方框必定包 含其它字配,拆分成"口"一"門、一",不能當(dāng)字配"口"使用;"口"字配內(nèi)不能包含有其它字 配,但有時(shí)可能被其它字配交穿,明確區(qū)別才能正確判斷。"酉"字是"西"與"一"字配的組 合,并且是包涵關(guān)系,不能當(dāng)字配"西"使用,也不能簡(jiǎn)單拆解成"西、一"。例如有關(guān)的漢字 "曾",拆成"曾"一"、/、口、、\日"是錯(cuò)誤的,拆分成"曾"一"、/、門、'一、日"是正確的; 漢字"回"拆分成"回"一"門、口、一"是正確的,拆成"回"一" 口、口"是錯(cuò)誤的;漢字"醚" 拆分成"醚"一"西、米、1_"是錯(cuò)誤的,拆分成"醚"一"西、一、米、;L"也是錯(cuò)誤的,之后有專 門的編碼規(guī)則。還有前面涉及到對(duì)個(gè)別字配的具體規(guī)定:"月和寫都是一?與二的組合,即 把月和_都拆分成Γ1與二,其余相關(guān)門和Γ3的漢字,皆認(rèn)為是字配門的組合。"一定要遵 守規(guī)定,才能使?jié)h字得到唯一的拆分結(jié)果。例如"肯"字,拆分成"肯"一"止、廠]、二"是 正確的,拆分成"肯"一"止、門、二"是錯(cuò)誤的;漢字"用",拆分成"用"一"門、中"是正確 的,拆分成"用"一"門、牛"是錯(cuò)誤的。 ⑦ 以上四條規(guī)則,其重要性是按先后次序而來(lái)的,又是相互制約的,如果次序顛倒,單 獨(dú)強(qiáng)調(diào)某一規(guī)則,就失去了拆分規(guī)則的意義,拆分的結(jié)果也就失去唯一性。對(duì)規(guī)則重要性的 充分理解,是漢字正確拆分的關(guān)鍵。第一,筆順方向決定了每個(gè)字配的序位,這是按字配的 起筆而言的。第二,漢字劃分單元,最后分解成字配,這始終是從整體考慮,看字形結(jié)構(gòu);從 大處著眼,留最大的字配;從復(fù)雜處著手,正確拆解交穿著的字配。第三,少大優(yōu)先原則,突 出了少與大的優(yōu)先地位,拆分的字配數(shù)量到最少,使結(jié)果具有唯一性,并且首先要保證字配 數(shù)量最少,然后才按序位爭(zhēng)取字配最大,同時(shí)要考慮附加規(guī)則最少。如將"卑"拆分,首先考 慮字配數(shù)最少,拆成"白、千",而不要拆解成"j、門、產(chǎn)、十",這不能體現(xiàn)少大優(yōu)先;又如將 "目"拆分成"門、三",而不要拆解成"口、二",雖然字配數(shù)量相同,第一種情況是按序拆分 的,然而第二種情況拆解出的"口 "字配是分步完成的,多了分步使用的附加規(guī)則,其實(shí)際上 它是偏旁方框"口",并不是字配。第四,裁截字配能離不接、能接不穿,是因?yàn)榇笞峙渲g往 往是有距離的;而字配交穿使用,是有附加編碼規(guī)則的,增加了復(fù)雜度;這兩項(xiàng)規(guī)定是確保 拆分簡(jiǎn)單化、字配數(shù)量最少化、字配最大化。如將"夫"拆分成"? " 就比拆分成"二、 人"或"一、少、\"簡(jiǎn)單明了,并且沒有歧義。第五,規(guī)則具有先后的連續(xù)性、約束性,拆分 結(jié)果具有唯一性;唯一的、正確的拆分結(jié)果必然是順序拆分的、字配數(shù)最少、字配最大、附加 規(guī)則最少、簡(jiǎn)便度最高的結(jié)果。 三、漢字的編碼規(guī)則 按順序?qū)⒉鸱值臐h字的字配編碼羅列出來(lái),還不能提供漢字本身更多的信息,勢(shì)必造 成嚴(yán)重的重碼現(xiàn)象。如:同是"日"與"木"兩個(gè)字配,編碼是"7"和"6",則可以組成"杲…果" 兩個(gè)不同的漢字,這是沒有信息區(qū)別字配相交與不相交的情況;如:同是"口"與"八"兩個(gè) 字配,編碼是"2"和"3",則可以組成"叭""只"兩個(gè)不同的漢字,這是沒有信息區(qū)別字配橫 向排列與縱向排列的情況,即沒有漢字結(jié)構(gòu)信息;又例如:同是"2"與"3"兩個(gè)編碼,可以有 "只""機(jī)""兄""少""嘰""叱"等漢字組合,沒有足夠的信息量是難以區(qū)別的。為納入漢 字的主要信息,減少重碼現(xiàn)象,在對(duì)漢字編碼時(shí)遵循以下統(tǒng)一規(guī)則。 1、 編碼規(guī)則: 漢字編碼規(guī)則 交穿降級(jí)例:里正:門豐二_ [7611] 誤:門中·二[761] 分步報(bào)關(guān)例:誡正:、乙_升戈[45泛16] 誤:、乙戈升[4561] 結(jié)構(gòu)可析例:機(jī)口八(左右6) [23+泛碼] 只口八(上下7) [23+Z碼] 末筆識(shí)辨例:只口八(? 7末筆4) [23+7+4碼] 兄口兒(Φ7末筆5) [23+7+豆碼] 其中,代表"交穿降級(jí)",_代表"分步報(bào)關(guān)",①代表"結(jié)構(gòu)類型為上下結(jié)構(gòu)"。 2、 說(shuō)明: ①交穿降級(jí):交穿字配,要降級(jí)使用,就是不僅使用原編碼,還需要多使用一次原編碼, 即連續(xù)使用兩次原字配的編碼,來(lái)表示它是交穿字配,以區(qū)別原字配的編碼。如:字配人的 編碼為3,發(fā)生交穿后降級(jí)使用,其交穿字配的編碼為33 ;字配木的編碼為6,發(fā)生交穿后編 碼降級(jí),用66兩個(gè)編碼表示交穿的字配"木"。 ② 字配的獨(dú)立性:在數(shù)配碼中,字配是構(gòu)成楷書漢字的基本獨(dú)立單位,即是獨(dú)立塊。基 于強(qiáng)調(diào)字配的獨(dú)立性,對(duì)交穿情況編碼的表達(dá),就是交穿降級(jí)規(guī)則。但是,字配構(gòu)成漢字的 復(fù)雜性不但體現(xiàn)在不同的排列組合及交穿使用上,而且還體現(xiàn)在同一字配,在不同的漢字 書寫時(shí),其筆順是大不相同的。如"匕"字配,在"化"、"畢"等漢字的書寫時(shí),筆畫的順序皆 為"j"一"L";而在"龍"、"寵"等漢字中,其筆畫的順序皆為"L"一"j"。或者說(shuō),在順 序拆分漢字時(shí),遇到和字配筆順不同、形狀卻相同的單元塊,如拆分漢字"方" "萬(wàn)",都相遇 "勹"單元塊,與字配包字頭"勹"的形狀相同,雖然筆順不同,卻是連續(xù)的筆畫完成的獨(dú)立 塊,并沒有與其它字配相互交穿,可做為獨(dú)立字配使用,編碼是一樣的。這樣,一次性使用 字配獨(dú)立塊,只考慮其形狀的字配編碼,不再考慮字配塊的具體筆順。又例如"為"字中的 "力",它的筆順是"" "刁"而不是"刁" "可它卻是連續(xù)筆畫完成的獨(dú)立塊,未與其它 字配發(fā)生交穿,形狀與"力"字配是相同的,故使用"力"字配的編碼。如果拆分交穿結(jié)構(gòu)的 字配塊,不允許拆分出形狀相同而筆順不同的字配來(lái),以保證原字配的獨(dú)立性與拆分結(jié)果 的唯一性。如"毋"的拆分結(jié)果是"〇·、j、曝、一、暴",而不是"〇1、少、_",因?yàn)榻淮┙Y(jié)構(gòu) 字配塊的筆順決定了是拆分不出"少"字配的。 ③ 需要注意:有些漢字的偏旁,形狀相似,但筆順不同,它是字配相接或相交穿的字配 塊,在拆分這些偏旁為字配時(shí),則分別對(duì)待。如"車"字的筆順是"一、乙、一、丨","$:,,字旁 的筆順則是"一、乙、丨、一";拆分成字配時(shí),將"車"字拆分成"七、十"兩字配交穿,編碼是 "166";而"f,,字旁則較復(fù)雜,可拆分成"七、丨、一",字配"丨"與"一"都發(fā)生了交穿,編 碼應(yīng)為"12211",使用非常不便,易混淆。特別規(guī)定:用"車"字的編碼代表a·*,字旁的編 碼,即"車"七、十、_" = "166"。又如"牛"字的筆順是"J、一、一、丨","奪" 字旁的筆順是"j、一、丨、一"字頭(或稱牛字頭)的筆順是"j、一、丨、一";拆分成 字配分別是"牛"一"J、豐","# "一"J、#","&"一 "J、十、一";編碼則分別應(yīng)該是: "牛"一36、"# "一31、"~'一361 ;在字、詞典中用部首檢字時(shí)可能沒有區(qū)別,但在數(shù)配碼 中,區(qū)別是明顯和嚴(yán)格的;可是"字旁的編碼如果為"31",與"月"字旁、"閆"字底的編 碼就是相同的,它們的組字能力非常強(qiáng),會(huì)造成嚴(yán)重重碼現(xiàn)象;為避免這種現(xiàn)象,并且要?dú)w 類、簡(jiǎn)化記憶,特別規(guī)定:用"牛"字的編碼" 36 "代表" "字旁、" "字頭的編碼,即"牛" ="奪,,="止,,="J、豐" ="36