數(shù)配碼漢字輸入法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于漢字、漢語詞輸入法領(lǐng)域,具體涉及通過鍵盤輸入設(shè)備對(duì)計(jì)算機(jī)、IPD、 手機(jī)、學(xué)習(xí)機(jī)、電子字?詞典等電子產(chǎn)品進(jìn)行漢字、漢語詞輸入的一種數(shù)配碼漢字輸入法技 術(shù)。
【背景技術(shù)】
[0002] 目前常用的漢字錄入方法多種多樣,其中,1、漢字輸入法通常是指中文輸入技術(shù), 通過語音、手寫、掃描或者編碼將漢字輸入到計(jì)算機(jī)等電子設(shè)備中去。中文輸入技術(shù)發(fā)展 到今天,每種方法在速度效率、智能程度、難易程度、普及推廣等方面各具特點(diǎn),提供給用戶 選擇使用,為計(jì)算機(jī)的普及和互聯(lián)網(wǎng)、通訊的廣泛應(yīng)用做出了重大貢獻(xiàn)。2、語音輸入漢字, 對(duì)口音要求極高,且對(duì)環(huán)境安靜程度要求高,另外不能在要求安靜的環(huán)境中使用,應(yīng)用面很 窄;3、手寫輸入漢字,辨識(shí)率低,重碼率很高;4、掃描輸入漢字,局限于規(guī)范文字的文稿;5、 漢語拼音編碼的拼音輸入法,因同音字很多,一次不能確定,需要再次選擇,效率相對(duì)較低; 6、漢字字形編碼的筆畫輸入法,便于掌握,但速度慢、重碼多;7、漢字字形編碼的另一類字 根、字元等輸入法,速度快,但要記憶大量的字根、字元等,掌握難度大,不利于普及,也不方 便小鍵盤使用。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明所要解決的技術(shù)問題是提供了一種簡(jiǎn)單易學(xué)、方便使用、輸入速度快、重碼 少,并能直接處理繁、異體漢字的數(shù)配碼漢字輸入法。 本發(fā)明采用如下技術(shù)方案: 一種數(shù)配碼漢字輸入法,其根據(jù)漢字字形編碼,設(shè)置了 192個(gè)字配、5種漢字結(jié)構(gòu)類型, 其數(shù)字鍵位設(shè)置如下: ①字配的鍵位設(shè)置 設(shè)置了 192個(gè)字配,按字配首筆畫、筆畫數(shù)、特征歸納,分門別類與1一9、0十個(gè)數(shù)碼相 對(duì)應(yīng),稱字配編碼,所述字配與數(shù)字鍵位的對(duì)應(yīng)關(guān)系如下表1所示: 表1
②漢字結(jié)構(gòu)類型的鍵位設(shè)置 設(shè)置了 5種漢字結(jié)構(gòu)類型,分別與6、7、8、9、0五個(gè)數(shù)碼相對(duì)應(yīng),稱漢字結(jié)構(gòu)編碼,所述 漢字結(jié)構(gòu)類型的編碼與數(shù)字鍵位的對(duì)應(yīng)關(guān)系如下表2所示: 表2
所述數(shù)字鍵位即輸入設(shè)備的數(shù)字鍵盤,所述字配、漢字結(jié)構(gòu)類型的編碼與所述數(shù)字鍵 位--對(duì)應(yīng); ③ 使用上述數(shù)字鍵位設(shè)置拆分漢字,其規(guī)則如下: a) "順序分塊,少大優(yōu)先",即在筆順方向的規(guī)定下,按漢字結(jié)構(gòu)特點(diǎn),先把漢字劃分成 沒有交穿的、各自分立的單元,即先把漢字劃分成一個(gè)或多個(gè)字配塊,劃分字配塊的規(guī)則是 優(yōu)先選擇劃分出字配塊數(shù)量最少的方案; 如果所述字配塊已經(jīng)是一個(gè)獨(dú)立的字配,則直接取其對(duì)應(yīng)的數(shù)字鍵位;如果所述字配 塊是交穿結(jié)構(gòu)的字配,需要繼續(xù)拆分,在同一序位拆分字配塊的規(guī)則是將含字畫數(shù)最多的 字配拆分出來; b) 所有字配塊的拆分原則是"能離不接,能接不穿",即能順序在有間距的地方獨(dú)立地 裁截成字配,就不要在相連相接處拆分或裁截字配,相離拆分優(yōu)先于在相連相接處裁截;能 順序在字配與字配相連處裁截,就不要拆分成字配與字配相交穿的狀態(tài);優(yōu)先選擇在相連 相接處裁截字配,否則才選擇將字配拆分成交穿狀態(tài);最終拆分成唯一的字配組合,與數(shù)字 鍵位--對(duì)應(yīng); ④ 將上述拆分好的字配組合所對(duì)應(yīng)的數(shù)字鍵位按如下漢字編碼規(guī)則進(jìn)行排列: 首先按書寫順序排列對(duì)應(yīng)每個(gè)字配的數(shù)字鍵位,在此基礎(chǔ)上,遵循如下漢字編碼規(guī)則 為"交穿降級(jí)、分步報(bào)關(guān)、結(jié)構(gòu)可析、末筆識(shí)辨",具體要求是: a) 所述交穿降級(jí),即相互交穿的字配,后一個(gè)字配連續(xù)使用兩次該字配對(duì)應(yīng)的數(shù)字鍵 位; b) 所述分步報(bào)關(guān),即按照書寫順序,該字配被分步使用時(shí),在用時(shí)與之后分別使用一次 該字配對(duì)應(yīng)的數(shù)字鍵位; c) 所述結(jié)構(gòu)可析、末筆識(shí)辨,即當(dāng)不同漢字拆分好的字配對(duì)應(yīng)的數(shù)字鍵位相同時(shí),所述 漢字要添加其漢字結(jié)構(gòu)類型對(duì)應(yīng)的數(shù)字鍵位和/或該漢字的末筆畫碼;當(dāng)然,當(dāng)不同漢字 拆分好的字配對(duì)應(yīng)的數(shù)字鍵位相同時(shí),優(yōu)選的方案是在所述漢字的編碼后添加其漢字結(jié)構(gòu) 類型對(duì)應(yīng)的數(shù)字鍵位和該漢字的末筆畫碼; 本發(fā)明將漢字拆分成所述字配并對(duì)應(yīng)數(shù)字鍵位組成數(shù)碼,這組數(shù)碼稱本位碼,當(dāng)兩個(gè) 及以上漢字的本位碼出現(xiàn)相同時(shí),則要在輸入時(shí)添加該漢字結(jié)構(gòu)類型對(duì)應(yīng)的數(shù)字鍵位和末 筆畫編碼。 這樣,對(duì)漢字的字配及交穿的、分步使用的字配和漢字結(jié)構(gòu)類型、末筆畫信息的情況進(jìn) 行編碼,形成的編碼稱數(shù)配碼,在數(shù)字鍵位按相應(yīng)的鍵即可完成漢字的輸入。 所述末筆畫碼即漢字最后一筆的筆畫所對(duì)應(yīng)的鍵位,其對(duì)應(yīng)關(guān)系根據(jù)字配與數(shù)字鍵位 的關(guān)系設(shè)置。 作為對(duì)本發(fā)明的進(jìn)一步限定,所述全包圍及半包圍結(jié)構(gòu)的漢字,辨識(shí)所述末筆畫碼是 指辨識(shí)被包圍部分的末筆畫碼。 作為對(duì)本發(fā)明的進(jìn)一步限定,當(dāng)輸入的是成字字配時(shí),所述成字字配編碼的過程方法 為"續(xù)拆補(bǔ)碼";所述成字字配既是字配又是漢字,本身已有的編碼不足以與同類字配區(qū)分 開來,而它的漢字屬性又須有確定的編碼; 所述續(xù)拆補(bǔ)碼,即對(duì)涉及到的成字進(jìn)行分解,相當(dāng)于將原本一個(gè)字配"分步"使用,故只 有先使用一次該成字字配對(duì)應(yīng)的數(shù)字鍵位,再按一般漢字的編碼過程編碼,同樣需按筆順 方向繼續(xù)進(jìn)行拆解,且同樣遵循漢字拆分和編碼規(guī)則。 作為對(duì)本發(fā)明的進(jìn)一步限定,所述①字配的鍵位設(shè)置中的10個(gè)標(biāo)志漢字,分別用10個(gè) 數(shù)字鍵位直接表示,稱為簡(jiǎn)碼。 作為對(duì)本發(fā)明的進(jìn)一步限定,當(dāng)輸入多字詞語時(shí),順位碼鍵,即兩字及以上的語詞,其 編碼按照詞語的順序,將字配的編碼依次排列,不考慮漢字結(jié)構(gòu)與末筆畫的辨析碼,對(duì)應(yīng)鍵 位輸入即可。 作為對(duì)本發(fā)明的進(jìn)一步限定,在所述拆分漢字的規(guī)則中,以下漢字的拆分、編碼代表相 應(yīng)類別的部首: 月=_ =π、二=31 ;車=f=七、十、籙=166 ; 牛=奪=止=J、豐=36 ;羊=尹=至=丄;:.、.豐=96〇 本發(fā)明系統(tǒng)詳細(xì)的說明與解釋如下: 本發(fā)明設(shè)置了 192個(gè)字配,分門別類與1 一9、0十個(gè)數(shù)碼相對(duì)應(yīng);設(shè)置了 5種漢字結(jié)構(gòu), 分別與6、7、8、9、0五個(gè)數(shù)碼相對(duì)應(yīng);設(shè)置的數(shù)配碼漢字輸入法鍵盤,就是輸入設(shè)備的數(shù)字 鍵盤,字配、漢字結(jié)構(gòu)的數(shù)碼與鍵位--對(duì)應(yīng)。 具體實(shí)現(xiàn)的步驟是:設(shè)置拆分規(guī)則方法,將漢字拆分成字配;設(shè)置了漢字編碼規(guī)則方 法,規(guī)范字配的交穿、分步使用的情況及漢字結(jié)構(gòu)、末筆畫信息的編碼;按編碼流程不同的 要求,就可以對(duì)漢字及漢語詞進(jìn)行編碼,這種編碼稱數(shù)配碼。鍵入數(shù)配碼,完成漢字、漢語詞 的輸入。 具體概念、鍵位設(shè)置及實(shí)現(xiàn)步驟如下: 一、概念和術(shù)語 1、 字配:由筆畫組成的、經(jīng)篩選規(guī)定的、具有很強(qiáng)組配漢字功能、且數(shù)字化的構(gòu)字單位。 是由筆畫按筆順連續(xù)書寫的、結(jié)構(gòu)相對(duì)不變的獨(dú)立構(gòu)成;筆畫有時(shí)是最小的字配。 2、 筆畫:是構(gòu)成漢字楷書字形的最小連筆單位。依據(jù)筆勢(shì)和走向,筆畫的形狀有數(shù)十 種,可以歸納為最基本的五種,其排列順序是橫、豎、)、撇、點(diǎn)、折,分別用數(shù)碼1、2、3、4、5 表示;筆畫的形狀簡(jiǎn)稱筆形,具體歸納的五種基本筆畫的形狀如下表3所示: 表3 漢字的五種筆畫及編碼
3、 筆順:書寫每個(gè)漢字時(shí)筆畫的次序和方向。 4、 字配的編碼:將字配按首筆畫的規(guī)律、筆畫數(shù)的多少及其它特性劃區(qū)分類,分別用 1一9、0十個(gè)數(shù)碼表示,稱字配編碼。字配的編碼與數(shù)字鍵位相對(duì)應(yīng)。它具有規(guī)律性、代表 性、易記性的特點(diǎn)。 對(duì)表1進(jìn)行了擴(kuò)展,添加了易識(shí)別的字配和助記詞,形成表4如下:
5、字配編碼說明: ① 分區(qū):將十個(gè)數(shù)碼,五個(gè)一組,分為兩個(gè)區(qū):三畫內(nèi)字配區(qū)與多筆畫字配區(qū)。三畫內(nèi) 字配區(qū)為1、2、3、4、5五個(gè)數(shù)碼,除字配"耳"在4畫以上,其余均為三畫內(nèi)字配;多筆畫字 配區(qū)為6、7、8、9、0五個(gè)數(shù)碼,大多為4畫以上的字配,少數(shù)字配為3畫,個(gè)別為2畫字配。 ② 分類為三畫內(nèi)橫起筆類;6為多筆畫橫起筆類字配; 2為三畫內(nèi)豎起筆類;7為多筆畫豎起筆類字配; 3為三畫內(nèi)撇起筆類;8為多筆畫撇起筆類字配; 4為三畫內(nèi)點(diǎn)起筆類;9為多筆畫點(diǎn)起筆類字配; 5為三畫內(nèi)折起筆類;0為多筆畫折起筆類字配。 ③ 合并安置:將使用頻率高、筆畫基本相同的字配合并安置,由易識(shí)易記的字配代表 其他幾個(gè)變形,如:"廠、7"可同時(shí)記憶,"工、T、丁、5、干、于"可同時(shí)記憶、"^、十、少、 H豐、產(chǎn)"可同時(shí)記憶,"又、Y7、'"可同時(shí)記憶;也有將幾個(gè)叫法、源義、形狀 相近的字配合并安置,由易識(shí)易記的字配代表,如:"卩、Ρ、β、爭(zhēng)、耳"可同時(shí)記憶,"水、 氺、摩"可同時(shí)記憶,"鄉(xiāng)、幺、I:、厶"可同時(shí)記憶,"火、,、、、、中"可同時(shí)記憶,"夂、夂、夕、 廠、·1、乂、九"可同時(shí)記憶等。 ④ 遵從習(xí)慣又有區(qū)別:字典、詞典的檢索,經(jīng)常將"小"與"Μ/","人"與"彐"與 "刀"與""ij","八"與"、"門"和"Η,,"月"和"殍,,等不加以區(qū)分,視 為同一部首,在漢字字配的編碼中有時(shí)遵從這個(gè)習(xí)慣