專利名稱:雙筆號(hào)碼查字法及其字母表示式的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及漢字編碼方法,特別地,涉及雙筆號(hào)碼查字法及其字母表示式。
目前,用于漢字字詞典中查字的方法主要有部首法、筆數(shù)筆形法、漢語拼音法和四角號(hào)碼法等幾種。
部首法是一種有悠久歷史的方法。它的優(yōu)點(diǎn)是簡(jiǎn)單易學(xué),無需懂得漢字的讀音。缺點(diǎn)是1、有些字的部首不明確。2、除了標(biāo)準(zhǔn)部首外還有變形部首。3、查字速度太慢,查一個(gè)字需經(jīng)三道程序①根據(jù)部首的筆畫數(shù)查同部首字的起始頁碼。②根據(jù)同部首字的起始頁碼查字的頁碼。③根據(jù)字的頁碼在字詞典正文中查字。
筆數(shù)筆形法也是一種歷史悠久的方法。它的優(yōu)點(diǎn)也是簡(jiǎn)單易學(xué),無需懂得漢字的讀音。缺點(diǎn)是速度太慢,查一個(gè)字也需經(jīng)三道程序①根據(jù)字的筆畫數(shù)查首筆或前兩筆筆畫形狀相同的字的起始頁碼。②在首筆或前兩筆筆形相同的那部分漢字中找到要查的字的頁碼。③根據(jù)字的頁碼在字詞典正文中查字。
漢語拼音法是一種較新的方法。它的優(yōu)點(diǎn)是查字速度要比部首法和筆數(shù)筆形法快一些,查一個(gè)字只需兩道程序①在漢語拼音音節(jié)中查同音節(jié)字的起始頁碼。②根據(jù)同音節(jié)字的起始頁碼在字詞典正文中查字。也可只經(jīng)一道程序直接根據(jù)漢語拼音的字母排列順序在字詞典正文中查字。但按字母順序查字要比按數(shù)碼順序查字不便,且同音節(jié)的漢字一般很多,查字的速度還是不夠快。此外,若不懂要查的字的讀音,就不能按此法查。
四角號(hào)碼法也是一種較新的方法。它的優(yōu)點(diǎn)是在目前使用的查字法中,一般情況下,它是最快的一種方法。查字只需一道程序,亦無需懂得漢字的讀音。缺點(diǎn)是①規(guī)則太多。②同一號(hào)碼的變形筆形較多。③取角方法不易掌握,學(xué)習(xí)四角號(hào)碼查字法一般需要進(jìn)行很多練習(xí)才能熟練。④號(hào)碼分布不夠均勻,有些號(hào)碼(包括附號(hào))同碼字太多,例如在《現(xiàn)代漢語詞典》中44227這個(gè)碼就有48個(gè)同碼字。
此外,近年來出現(xiàn)的用于計(jì)算機(jī)漢字輸入的各種編碼方案,包括字母碼和數(shù)字碼,從理論上說均可應(yīng)用于字詞典查字,但實(shí)際上在這方面基本上沒有實(shí)用價(jià)值。原因是這些方法比起以上介紹的幾種方法來,一般來說,不是規(guī)則顯得更繁瑣,就是要記背一些緒如字元字根之類的內(nèi)容。查字詞典的一個(gè)特點(diǎn)是間歇性,對(duì)于復(fù)雜繁瑣的方法一般人是難以記住的。有些方案雖然也很簡(jiǎn)單,例如王永民的五筆畫編碼法。但其同碼字太多,查起字來速度比以上幾種方法更慢。
本發(fā)明的目的是要提供一種比現(xiàn)有的查字法更簡(jiǎn)單易學(xué),更快速準(zhǔn)確的查字法。
本發(fā)明的雙筆號(hào)碼查字法,是一種漢字編碼方法,其特點(diǎn)是將字典劃分的“橫、豎、撇、點(diǎn)、折”五種筆畫再合并為“正、斜”兩種類型,并取漢字的偶數(shù)筆畫進(jìn)行分組,利用雙筆畫構(gòu)成的不同組合來給漢字編碼。本發(fā)明只有下列幾條規(guī)則1、以兩筆為一組取漢字的前八個(gè)筆畫,不足八筆時(shí)全取,所取得的筆畫數(shù)為奇數(shù)時(shí),重復(fù)取最后一筆使之成為偶數(shù)。
2、每組的兩個(gè)筆畫分為前筆和后筆,將前筆的筆形劃分為兩類1、正筆。包括橫(提)和豎。2、斜筆。包括撇、點(diǎn)(捺)和折。將后筆的筆形劃分為五類1、橫(提)。2、豎。3、撇。4、點(diǎn)(捺)。5、折。這五種筆形以《現(xiàn)代漢語詞典》所劃分的為準(zhǔn)。與《新華字典》僅有一點(diǎn)不同豎鉤在《新華字典》中劃為豎,這里把它劃分為折。
3、每組筆畫的前筆和后筆的各種筆形可構(gòu)成十種組合,分別以0至9這十個(gè)數(shù)字中的一個(gè)代表。見圖1。
4、根據(jù)以上方法,所取的漢字筆畫組數(shù)會(huì)少至一組,多至四組不等,從而所得的各個(gè)漢字的號(hào)碼長(zhǎng)短不等,為了使每個(gè)漢字的號(hào)碼長(zhǎng)度相等,以便于排序,規(guī)定當(dāng)一個(gè)漢字的號(hào)碼不足四碼時(shí),在后面用零補(bǔ)足四碼。這四個(gè)號(hào)碼,叫做漢字的雙筆號(hào)碼。這種雙筆號(hào)碼,就象四角號(hào)碼一樣,可用來給字詞典中的字頭排序。
5、為了減少同碼字,可再取一個(gè)號(hào)碼作為附號(hào)。這只需對(duì)超過八筆的字多取一組筆畫(共兩筆,若只有一筆可取時(shí)重復(fù)取該筆)則可。不超過八筆的字,附號(hào)為零。
本發(fā)明可有多種用途,若用于電腦輸入漢字,則只需有數(shù)字鍵則可,若用于電信,可不必死記硬背。但是,本發(fā)明特別適用于字詞典查字,所以直接將其稱之為“雙筆號(hào)碼查字法”。
雙筆號(hào)碼查字法不涉及讀音,用雙筆號(hào)碼查字法查字只需一道程序,這點(diǎn)與四角號(hào)碼法相似,因此速度要比部首法,筆數(shù)筆形法,漢語拼音法快得多。而與四角號(hào)碼法相比,雙筆號(hào)碼法的規(guī)則要簡(jiǎn)便得多,所涉及的筆形和筆順知識(shí)與通用字典相一致,已為人們所掌握,不會(huì)出現(xiàn)四角號(hào)碼在取角的筆形時(shí)的往往會(huì)有的模糊不清、難于確定的情況。此外,由于雙筆號(hào)碼的同碼字比四角號(hào)碼的同碼字少,所以查字速度也比四角號(hào)碼法快。雙筆號(hào)碼查字法的易學(xué)性是十分明顯的,只需用幾個(gè)字練習(xí)過一遍就可以掌握了。因此,有利于在小學(xué)低年級(jí)就開始學(xué)習(xí)運(yùn)用。而且,小學(xué)中往往有一些人對(duì)某些漢字的筆順寫得不夠正確,由于雙筆號(hào)碼字典可對(duì)容易寫錯(cuò)的各種筆順均編上碼,使得按不規(guī)范筆順編碼也能查到字,這些字后面標(biāo)上正確的編碼。所以,這種字典還可以使學(xué)生得以糾正筆順錯(cuò)誤。
本發(fā)明的雙筆號(hào)碼查字法還有一個(gè)特點(diǎn),就是可以很簡(jiǎn)便地轉(zhuǎn)變?yōu)樽帜阜绞?,用于在英文鍵盤上進(jìn)行漢字輸入。這只要將漢字按數(shù)碼方式所取的每組筆畫(兩筆為一組)的前筆也象后筆一樣,劃分為“橫、豎、撇、點(diǎn)、折”五種類型則可。此時(shí)前后筆就可組成二十五種組合,分別用英文字母中除了M之外的二十五個(gè)字母來代表就得到雙筆碼的字母式。將前筆的五種筆形作為行標(biāo),后筆的五種筆形作為列標(biāo),則二十五種筆畫組合與二十五個(gè)字母的一一對(duì)應(yīng)關(guān)系見圖2。
圖2中英文字母的位置是根據(jù)其在英文鍵盤上的相關(guān)位置而排列的,這使得在輸入漢字時(shí)不必記憶編碼。
下面結(jié)合實(shí)施例對(duì)本發(fā)明的雙筆號(hào)碼查字法及其字母表示式的用法作進(jìn)一步的描述。
我們舉“大潮”兩字的編碼作為例子。
“大”字的第一筆是第一組筆畫的前筆,應(yīng)按兩類劃分屬“正”筆,第二筆是第一組筆畫的后筆,應(yīng)劃分為五類,屬“撇”筆,所以第一組筆畫為“正撇”。其代號(hào)為3。第三筆是第二組筆畫的前筆,按兩類劃分,屬“斜”筆。這個(gè)字只取得三筆,為奇數(shù),所以重復(fù)取最后一筆,并按五類劃分為“點(diǎn)”筆,這是第二組筆畫的后筆,所以第二組筆畫為“斜點(diǎn)”,其代號(hào)為9。用零補(bǔ)足號(hào)碼,得“大”字的四個(gè)號(hào)碼為3900,五個(gè)號(hào)碼為39000。
“潮”字超過八筆,只取前八筆得“斜點(diǎn)、正橫、正豎、斜橫”,所以其四個(gè)號(hào)碼為9126。接下去再取兩筆為“正橫”,所以五碼為91261。
不必背誦圖1的表。只需記住當(dāng)前筆為正筆時(shí)取上行數(shù)字,為斜筆時(shí)取下行數(shù)字則可。而上行數(shù)字正好是后筆的橫、豎、撇、點(diǎn)、折的排列順序號(hào),下行數(shù)字則是它們的順序號(hào)加上五。
雙筆碼的字母式可以很簡(jiǎn)便地在鍵盤上輸入漢字。鍵盤上的字母排列見圖3。
圖3中用粗線將除M之外其余25個(gè)英文字母分為五組。即圖2中的五行(N的位置特殊),按逆時(shí)針方向注上行標(biāo)一,丨,丿,丶,
。再以由中間向兩旁的順序注上列標(biāo)一,丨,丿,丶,
。
用雙筆碼字母式給漢字編碼時(shí)最多取四碼(按四次鍵),不足四碼的字加空格鍵結(jié)束。在鍵盤上輸入漢字時(shí)并不需要將筆畫組合轉(zhuǎn)換為字母,亦無需記憶字母在鍵盤上的位置,只需根據(jù)“前筆定行,后筆定列”的規(guī)則按鍵則可。若有同碼字,將在屏幕提示行上按使用頻度的順序顯示出來,再加按順序號(hào)則可輸入所需的漢字。本輸入法同碼字不多,因而可獲得理想的速度。而其易學(xué)易記性也是明顯的,每一個(gè)會(huì)寫漢字的人均可在幾分鐘內(nèi)掌握且不會(huì)忘記。這為千家萬戶使用中文計(jì)算機(jī)提供了便利。
例如輸入“大”字,在“一”行“丿”列按下第一鍵(此鍵是K字母鍵),再在“丶”行“丶”列(因筆畫數(shù)為奇數(shù)重復(fù)末筆)按下第二鍵(此鍵是S字母鍵),由于不足四鍵,加按一下空格鍵,這樣就完成了“大”字的輸入。
圖1、十種筆畫組合與數(shù)字對(duì)應(yīng)表。
圖2、二十五種筆畫組合與字母對(duì)應(yīng)表。
圖3、注有行標(biāo)、列標(biāo)的鍵位圖。
權(quán)利要求
1.一種漢字編碼方法,它包括數(shù)字碼和字母碼兩種方式。其特征是將字典劃分的“橫、豎、撇、點(diǎn)、折”五種筆畫再合并為“正、斜”兩種類型,并取漢字的偶數(shù)筆畫進(jìn)行分組,利用雙筆畫構(gòu)成的不同組合來給漢字編碼。
2.根據(jù)權(quán)利要求1的方法,其特征是取漢字的前八個(gè)筆畫,不足八筆時(shí)全取,所取得的筆畫數(shù)為奇數(shù)時(shí)重復(fù)取最后一筆使之成為偶數(shù)。
3.根據(jù)權(quán)利要求2的方法,其特征是將取得的筆畫按書寫順序每?jī)晒P分為一組。
4.根據(jù)權(quán)利要求1、2、3的方法,其特征是將每組筆畫的前筆劃分為“正、斜”兩種類型,后筆劃分為“橫、豎、撇、點(diǎn)、折”五種類型。
5.根據(jù)權(quán)利要求1和4的方法,其特征是將每組筆畫的前后筆的各種筆形組成十種組合,分別用0至9這十個(gè)數(shù)字來代表,使每個(gè)漢字可編成一到四個(gè)不同的數(shù)碼。
6.根據(jù)權(quán)利要求5的方法,其特征是對(duì)于不足四碼的漢字,在其編碼后面用零來補(bǔ)足四碼。
7.根據(jù)權(quán)利要求2、3、4、5、6的方法,其特征是對(duì)于超過八筆的漢字,再取相繼的兩個(gè)筆畫,在其編碼后面增加一個(gè)數(shù)碼,使這些漢字成為五碼字,其余漢字在其編碼后面補(bǔ)充一個(gè)零,使之也成為五碼字。
8.根據(jù)權(quán)利要求1、2、3的方法,其特征是將每組筆畫的前后兩筆均劃分為“橫、豎、撇、點(diǎn)、折”五種類型。
9.根據(jù)權(quán)利要求1和8的方法,其特征是將每組筆畫的前后筆的各種筆形組成二十五種組合,分別用英文字母中除了M之外的二十五個(gè)字母來代表,使每個(gè)漢字可編成一至四個(gè)不同的字母碼。
全文摘要
雙筆號(hào)碼查字法及其字母表示式是一種漢字編碼方法,分為兩種方式。本發(fā)明將漢字筆畫每?jī)晒P分為一組,在數(shù)字編碼方式時(shí),將每組筆畫的前筆筆形分為兩種類型,后筆筆形分為五種類型,用數(shù)字代表前后筆所構(gòu)成的十種組合。在字母編碼方式時(shí),前后筆的筆形均分為五種類型,用英文字母代表前后筆所構(gòu)成的二十五種組合。本發(fā)明特別簡(jiǎn)單易學(xué),用幾個(gè)漢字練習(xí)過一遍則可掌握??捎糜谔幚砀鞣N中文信息,尤其適用于字詞典的查字。
文檔編號(hào)G06F3/023GK1077296SQ9211319
公開日1993年10月13日 申請(qǐng)日期1992年11月13日 優(yōu)先權(quán)日1992年11月13日
發(fā)明者劉萬程 申請(qǐng)人:劉萬程