專利名稱:一種適合于漢語(yǔ)拼音輸入的小型數(shù)字鍵盤(pán)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及到一種電話機(jī)、移動(dòng)電話機(jī)、傳真機(jī)等需用數(shù)字鍵輸入漢字的設(shè)備的小型數(shù)字鍵盤(pán)設(shè)計(jì),屬于信息、通信及電子、電腦類產(chǎn)品。
■技術(shù)背景隨著手機(jī)功能的擴(kuò)展,尤其是短信交流方式的出現(xiàn),提高在手機(jī)上輸入文字的速度已成為移動(dòng)終端設(shè)備制造廠商研究的一個(gè)技術(shù)熱點(diǎn)。在文字輸入的方式上,大致有三種鍵盤(pán)輸入、手寫(xiě)輸入、語(yǔ)音輸入,本發(fā)明內(nèi)容涉及的是主流的鍵盤(pán)輸入方式。
鍵盤(pán)輸入最基本的原理就是把字母疊加地定義在數(shù)字按鍵上,當(dāng)手機(jī)等設(shè)備運(yùn)行輸入法程序時(shí),將輸入的按鍵信息轉(zhuǎn)換為相應(yīng)的字母信息。具體有兩種轉(zhuǎn)換方式,比較原始低效的方式是以字母為基本轉(zhuǎn)換單位,由于一個(gè)按鍵上定義有多個(gè)字母,就要通過(guò)重復(fù)按鍵一次或多次以確定所要鍵入的字母,連續(xù)輸入同一按鍵上的兩個(gè)字母還必須等待延時(shí),改進(jìn)后的方式是以單詞作為基本轉(zhuǎn)換單位,單詞中的各字母只需按鍵一次,按完之后再在有限的幾個(gè)單詞組合中選擇即可,本發(fā)明就是后者為背景的。為了敘述的方便,先對(duì)所以使用的概念作一個(gè)定義1)拼音串——漢語(yǔ)中各個(gè)漢字的拼音注音,如“愛(ài)”的拼音串是“ai”,“老”的拼音串是“l(fā)ao”;2)按鍵序列——包含拼音串中各字母的輸入按鍵的有序集;3)拼音串重碼——多個(gè)拼音串有著相同的按鍵序列;4)重度——同一按鍵序列對(duì)應(yīng)的不同拼音串的個(gè)數(shù),拼音串重碼按重度不同,稱之為二重碼,三重碼等,重度為一時(shí)就不成為拼音串重碼。
目前手機(jī)上所使用的漢字輸入法主要有拼音和筆劃輸入法?,F(xiàn)代漢語(yǔ)拼音方案在漢字國(guó)際標(biāo)準(zhǔn)化和漢語(yǔ)教學(xué)中有著不可替代的地位,其權(quán)威性、普及度、易學(xué)性、易用性都是其它輸入法所不能比擬的。在拼音輸入法中,拼音串就等同于英文中的單詞,但是兩者又有很大的不同,主要體現(xiàn)在(1)漢語(yǔ)拼音中所使用的拼音串一共有406個(gè),而英文單詞則有上萬(wàn)個(gè);
(2)漢語(yǔ)拼音的平均信息熵遠(yuǎn)遠(yuǎn)低于英文;(3)漢語(yǔ)拼音中各個(gè)字母的出現(xiàn)有很強(qiáng)的規(guī)律性,而在英文單詞中基本沒(méi)有。
通過(guò)以上比較,在理論上漢語(yǔ)拼音應(yīng)該比英語(yǔ)更適合在按鍵較少的小型數(shù)字鍵盤(pán)上錄入??墒?,實(shí)際使用情況并非如此,目前手機(jī)上的拼音輸入法甚至比只用了五個(gè)按鍵的筆劃輸入法還要慢,主要體現(xiàn)在以下幾點(diǎn)上(1)出現(xiàn)拼音串重碼的按鍵序列很多,而且重度很高,最高有六重碼;(2)無(wú)法方便快捷地輸入音調(diào);(3)在以詞語(yǔ)或者整句方式輸入時(shí),會(huì)引起相鄰拼音串切分的難題,拼音串重碼的缺陷也會(huì)以乘數(shù)的形式被放大,以至此類輸入方式無(wú)法讓用戶接受。
經(jīng)研究后發(fā)現(xiàn),以上缺點(diǎn)都是由于目前手機(jī)鍵盤(pán)上的鍵面字母排列組合不夠合理引起的。
■發(fā)明目的本發(fā)明在充分研究漢語(yǔ)拼音規(guī)律的基礎(chǔ)上,重新安排小型數(shù)字鍵盤(pán)鍵面字母的排列組合方式,設(shè)計(jì)出一種更適合拼音輸入的小型數(shù)字鍵盤(pán),以克服目前手機(jī)或移動(dòng)電話機(jī)上普遍使用的小型數(shù)字鍵盤(pán)在輸入漢語(yǔ)拼音時(shí)的種種缺點(diǎn),使得小型數(shù)字鍵盤(pán)上可以流暢快速地使用拼音輸入法輸入漢字。
■發(fā)明內(nèi)容這里說(shuō)的小型數(shù)字鍵盤(pán)是指由“1”、“2”、“3”、“4”、“5”、“6”、“7”、“8”、“9”、“0”十個(gè)數(shù)字鍵和“*、#”兩個(gè)符號(hào)鍵組成,同時(shí)拼音字母分別定義在不同的按鍵上,通過(guò)接觸轉(zhuǎn)換裝置可以輸入文字信息。為了提高在小型鍵盤(pán)上以漢語(yǔ)拼音輸入法輸入漢字的效率,本發(fā)明提出了順乎漢語(yǔ)拼音輸入規(guī)律的字母排列。先對(duì)拼音規(guī)律做一下梳理,以明確鍵盤(pán)字母定義方式的原理所在。
1.增補(bǔ)字母的分離定義及字母的劃分漢語(yǔ)拼音中韻母一共有35個(gè),數(shù)目雖多,但都是由a、u、e、i、o、v(ü)、n、g這幾個(gè)字母組合而成的;聲母以及輔助聲母一共有23個(gè),它們分別是b、p、m、f、d、t、n、l、g、k、h、j、q、x、z、c、s、r、w、y、zh、ch、sh。注意到zh、ch、sh中的h和韻母中出現(xiàn)的n和g,它們與聲母n、g、h的含義是截然不同的,這就是現(xiàn)代漢語(yǔ)拼音相對(duì)于26個(gè)拉丁字母的增補(bǔ)部分,在本文中稱之為增補(bǔ)字母。
如果把增補(bǔ)字母h、n、g分離定義在#鍵或*鍵上,會(huì)產(chǎn)生非常好的效果1)h、n、g這三個(gè)字母本身在輸入時(shí)是不會(huì)相互混淆的,也不會(huì)與輸入法定義的一些功能發(fā)生沖突。h的輸入只可能是出現(xiàn)在輸入序列的第二位,而且前一個(gè)輸入序列必須是z、c、s所在的按鍵;n的輸入只能跟在a、o、e、i、u的輸入之后,而且一般出現(xiàn)在輸入序列的第三位和第三位以后,只在輸入拼音串a(chǎn)n和en時(shí)會(huì)在第二位使用,只要保證a和e所在的按鍵上沒(méi)有z、c、s就不會(huì)和zh、ch、sh的輸入相混淆;g的輸入時(shí)機(jī)更為特定,只會(huì)在n之后輸入;輸入法定義的功能就可以定義在輸入序列的首位。
2)可以使26個(gè)字母的使用功能單純化,便于使用算法來(lái)優(yōu)化其最佳分布方案。增補(bǔ)字母被分離后,26個(gè)字母就可以嚴(yán)格地分成兩類——韻母字母(a、u、e、i、o、v)和聲母字母(b、p、m、f、d、t、n、l、g、k、h、j、q、x、z、c、s、r、w、y),大致上對(duì)應(yīng)了拉丁字母中的元音字母和輔音字母。這樣,在輸入時(shí),有聲母鍵、韻母鍵,再輔之以增補(bǔ)字母鍵,一目了然,輸入過(guò)程也實(shí)現(xiàn)了優(yōu)化。
3)增補(bǔ)字母沒(méi)有定義在數(shù)字鍵上,不會(huì)影響鍵盤(pán)在輸入英文時(shí)的使用,即使是把hng直接定義在傳統(tǒng)手機(jī)鍵盤(pán)的“*”“#”鍵上,也可以取得立竿見(jiàn)影的效果,很大程度地減少拼音串重碼的重度和出現(xiàn)的機(jī)率。略舉兩例即可說(shuō)明這一點(diǎn)在傳統(tǒng)手機(jī)鍵盤(pán)中輸入序列“7426”,會(huì)有pian、shao、qiao、qian、shan、piao六個(gè)拼音串與之匹配,如果把hng定義在#鍵上,輸入的情況就變成742#——pian、qian,7#26——shao,7426——qiao、piao,7#2#——shan;傳統(tǒng)鍵盤(pán)中輸入序列“726”,會(huì)有rao、ran、pao、pan、sao、san六個(gè)拼音串與之對(duì)應(yīng),定義hng在#鍵上之后,輸入情況就變?yōu)?26——rao、pao、sao,72#——ran、pan、san。
漢語(yǔ)拼音中絕大部分拼音串是由一個(gè)聲母和一個(gè)韻母相拼而成的。設(shè)有兩個(gè)按鍵序列S1和S2分別用于輸入聲母和韻母,S1對(duì)應(yīng)的不同聲母?jìng)€(gè)數(shù)為m,S2對(duì)應(yīng)的不同韻母?jìng)€(gè)數(shù)為n,當(dāng)S1+S2結(jié)合成一個(gè)拼音串的按鍵序列S3時(shí),由排列組合的乘法原理可知S3對(duì)應(yīng)的拼音串的個(gè)數(shù)至多為m×n。因此,為了減少同一按鍵序列對(duì)應(yīng)的拼音串的重度和數(shù)量,就要盡可能使m和n的值變小。在任意一個(gè)拼音串中必定是聲母在前韻母在后,由于已經(jīng)將會(huì)發(fā)生混淆的增補(bǔ)字母分離出來(lái),并且三個(gè)增補(bǔ)字母本身因?yàn)槭褂玫臅r(shí)機(jī)和場(chǎng)合不同,相互間也是不會(huì)發(fā)生混淆的,因此聲母字母和韻母字母基本不會(huì)發(fā)生相互影響,可以先分開(kāi)考慮其分布。
2.韻母字母的鍵位定義韻母字母只有6個(gè),只要把6個(gè)韻母字母隨意地定義在6個(gè)不同的數(shù)字鍵上,就可以保證所有韻母都有唯一的輸入序列,這就已經(jīng)達(dá)到了最佳的效果。但考慮到以下兩個(gè)情況,韻母字母的定義還是有文章可作1)那些沒(méi)有被定義上韻母字母的數(shù)字鍵在輸入中會(huì)形成按鍵冗余,如果把這種按鍵冗余好好利用,就可以進(jìn)一步提高輸入效率。
2)字母v的使用機(jī)率非常低,僅僅在兩個(gè)拼音串lv、nv中被使用到;對(duì)于第一點(diǎn),需要對(duì)按鍵冗余進(jìn)行具體說(shuō)明。觀察406個(gè)拼音串,可以發(fā)現(xiàn),所有的拼音串的第二位及第二位之后的字母一定是韻母字母或者增補(bǔ)字母,絕不可能出現(xiàn)聲母字母,如果一個(gè)數(shù)字按鍵上沒(méi)有定義韻母字母,那這個(gè)按鍵在輸入完拼音串的首個(gè)字母后就絕不可能再參與拼音串的輸入,如果此時(shí)這些按鍵沒(méi)有定義其它的功用,就會(huì)被閑置,這就是一種冗余。要把這種冗余利用起來(lái),可以考慮把與拼音輸入法相關(guān)的一些功能定義到這些按鍵上。
首先想到是選字的功能。在輸入時(shí),會(huì)有一組符合當(dāng)前拼音串輸入的漢字備選,要完成對(duì)備選字的選擇一般有兩種方法第一種方法是給每個(gè)備選字標(biāo)上數(shù)字,按下某個(gè)狀態(tài)轉(zhuǎn)換鍵后,再按下對(duì)應(yīng)的數(shù)字鍵就可選擇對(duì)應(yīng)的備選字;第二種方法是用方向鍵控制光標(biāo)進(jìn)行選擇。兩種方法的目的都是為了避免選字所按下的按鍵與拼音串輸入按鍵相混淆。要產(chǎn)生備選字,至少要輸入拼音串中的一個(gè)字母,此功能在使用時(shí)機(jī)上正好與冗余鍵相符。習(xí)慣上的備選字都用由1開(kāi)始的數(shù)字進(jìn)行標(biāo)號(hào)的,根據(jù)普通手機(jī)屏幕的尺寸和字體大小,一般可以顯示5個(gè)備選字,少了會(huì)導(dǎo)致用戶頻繁翻頁(yè),多了字體會(huì)太小也不利于用戶查找。五個(gè)備選字一般都會(huì)依次用數(shù)字1、2、3、4、5標(biāo)出,所以對(duì)應(yīng)的冗余鍵是1、2、3、4、5這五個(gè)數(shù)字鍵會(huì)比較合適。
另一個(gè)功能是音調(diào)的輸入。漢語(yǔ)拼音中有五個(gè)音調(diào),第一聲、第二聲、第三聲、第四聲和輕聲。習(xí)慣上,音調(diào)也都是在拼音碼后輸入的,所以也可以定義到冗余鍵上,同樣也會(huì)很自然地與1、2、3、4、5這五個(gè)數(shù)字鍵相對(duì)應(yīng),1、2、3、4鍵對(duì)應(yīng)一、二、三、四聲,5鍵對(duì)應(yīng)輕聲。音調(diào)在漢語(yǔ)中變化比較多,尤其輕聲,能夠完全把握的人不多,也可以靈活地把5鍵定義成音調(diào)的模糊鍵。輸入音調(diào)在單字輸入法中減少同音字的個(gè)數(shù),同時(shí)也可以把鍵盤(pán)由拼音串輸入狀態(tài)轉(zhuǎn)換為數(shù)字鍵選字狀態(tài);在詞語(yǔ)輸入法中,可以增加輸入信息量,同時(shí)也可以有效地把詞語(yǔ)中各個(gè)字的拼音串分隔開(kāi)來(lái)。
綜上,應(yīng)該讓數(shù)字鍵1、2、3、4、5成為冗余鍵,用來(lái)定義音調(diào)或者選字功能,為了使數(shù)字鍵1、2、3、4、5成為冗余鍵,就不能在其上定義韻母字母,故6個(gè)韻母字母就只能定義在數(shù)字鍵6、7、8、9、0這五個(gè)按鍵上。由于字母v的使用機(jī)率非常低,可將字母v與某個(gè)合適的韻母字母共用一個(gè)按鍵,這個(gè)韻母字母所要滿足的條件就是作為單韻母使用時(shí),與聲母的結(jié)合能力比較差,經(jīng)過(guò)比較后發(fā)現(xiàn)字母“o”滿足這一條件,“v”和“o”定義在同一個(gè)按鍵上,其它四個(gè)韻母字母分別定義在另四個(gè)按鍵上,這樣的定義方式相比較把6個(gè)韻母定義在6個(gè)不同按鍵上的方式,只是引起了兩個(gè)二重拼音重碼的出現(xiàn),基本不會(huì)影響輸入效率。
3.聲母字母的鍵位定義首先,因?yàn)閦h、ch、sh是由z、c、s和增補(bǔ)字母h的組合而成的,所以只要把z、c、s相錯(cuò)地定義在不同的數(shù)字鍵上,按鍵序列與zh、ch、sh就會(huì)產(chǎn)生一一對(duì)應(yīng)的關(guān)系,加之韻母的輸入也是唯一的,這樣就不存在拼音串重碼的問(wèn)題。
接下來(lái)的問(wèn)題就是如何把20個(gè)聲母字母分配到十個(gè)數(shù)字鍵上的問(wèn)題。為了使得發(fā)一個(gè)按鍵對(duì)應(yīng)的不同聲母數(shù)目盡可能少,應(yīng)該盡可能將其分散,最佳方案是將其平均分為十組定義到每個(gè)鍵盤(pán)上,每個(gè)按鍵上只有兩個(gè)聲母。這樣根據(jù)乘法原則可知,同一按鍵序列對(duì)應(yīng)拼音串至多有2×1=2個(gè),如此一安排,在輸入時(shí)所產(chǎn)生的拼音串重碼的重度至多為二,其余的拼音串都有唯一的輸入序列與之對(duì)應(yīng),和在PC鍵盤(pán)上作輸入沒(méi)有區(qū)別。
注音到并不是任選兩個(gè)聲母和韻母相拼都可以得到有效的拼音串的,事實(shí)上,在這20個(gè)聲母字母和35個(gè)韻母的20×35=700個(gè)拼法中,只有338種是漢語(yǔ)發(fā)音中拼音串,就會(huì)有這種情況產(chǎn)生比如“f”和“z”都定義在3鍵上,“e”定義在6鍵,輸入序列“36”可能產(chǎn)生的拼音串組合有“fe”和“ze”,但是因?yàn)榘l(fā)音“fe”并沒(méi)有在現(xiàn)代漢語(yǔ)拼音中使用,本來(lái)會(huì)產(chǎn)生拼音串重碼的地方卻沒(méi)有產(chǎn)生,若換成是“l(fā)”和“z”定義在3鍵上,輸入序列“36”下就會(huì)有一個(gè)拼音串重碼出現(xiàn)——“l(fā)e”和“ze”。因此,聲母分組方案還有很大的優(yōu)化空間。如果粗略地去看待這個(gè)優(yōu)化問(wèn)題,很容易簡(jiǎn)單地把優(yōu)化目標(biāo)設(shè)定為如何使拼音串重碼的總數(shù)最少。這個(gè)優(yōu)化目標(biāo)把所要涉及的338個(gè)拼音串同等看待了,其實(shí)各個(gè)拼音的使用頻率是各不相同的,例如拼音串ji和nou,前者在GB2312中有118個(gè)漢字對(duì)應(yīng),而后者則只有一個(gè)“耨”字相對(duì)應(yīng)。在優(yōu)化模型中必須要考慮各個(gè)拼音串的使用頻率是不同的,使得使用頻率高的拼音串的輸入更為方便。拼音串的使用頻率由兩個(gè)因素決定,一是與該拼音串對(duì)應(yīng)的漢字的個(gè)數(shù),然后是這些漢字在行文時(shí)的使用頻率。如果嚴(yán)格地照這兩個(gè)因素去分析,模型的難度和復(fù)雜程度會(huì)非常大,難以求解。本發(fā)明采用了一個(gè)折衷的方案,就是去統(tǒng)計(jì)拼音串下的常用漢字的個(gè)數(shù),以此來(lái)大致表征該拼音串使用頻率,GB2312中的一級(jí)漢字就是一個(gè)合適的統(tǒng)計(jì)對(duì)象。在本文中就有以下表達(dá)式成立P(pyi)=G(pyi)M...(1)]]>其中P(pyi)代表拼音串pyi的使用頻率,G(pyi)是拼音串pyi對(duì)應(yīng)的一級(jí)漢字的個(gè)數(shù),M是GB2312中一級(jí)漢字的總數(shù)。
在這個(gè)基礎(chǔ)上,我們建立了兩種優(yōu)化模型單字輸入最優(yōu)模型和詞語(yǔ)輸入最優(yōu)模型。
3.1.單字輸入最優(yōu)模型在以單字方式輸入時(shí),因拼音串重碼所帶來(lái)的不便之處僅僅在于如果目標(biāo)拼音串不是輸入法默認(rèn)選中的那個(gè)拼音串,那得按下*鍵切換到目標(biāo)拼音串。如果目標(biāo)拼音串是被默認(rèn)選中的,那可以認(rèn)為這與無(wú)重碼的情況是一樣的,出現(xiàn)拼音串重碼時(shí)輸入法程序可以把使用頻率比較高那個(gè)拼音串默認(rèn)選中。這樣,單字方式輸入下的優(yōu)化目標(biāo)就是選擇最合適的聲母字母的分組方案,使得輸入時(shí)按下*鍵作拼音串的切換次數(shù)最少。其數(shù)學(xué)模型如下P(chage_probability)=ΣG(pyseconed)M...(2)]]>在上式中,P(chage_probability)是指在輸入時(shí)*鍵被按下的概率,pyseconed是出現(xiàn)拼音串重碼時(shí)所有的末被默認(rèn)選中的拼音串,∑G(pyseconed)是指此類拼音串對(duì)應(yīng)的一級(jí)漢字的總和。該模型為一離散型模型,無(wú)法通過(guò)數(shù)學(xué)計(jì)算求得最優(yōu)解,20個(gè)聲母字母的所有不同分組方案是一個(gè)有窮問(wèn)題,對(duì)G(pyi)進(jìn)行統(tǒng)計(jì)后,可以通過(guò)計(jì)算機(jī)程序窮舉搜索來(lái)找到最優(yōu)解。
在算法中先生成一個(gè)新的分組方案,然后對(duì)分組中的每一對(duì)聲母進(jìn)行分析,通過(guò)G(pyi)統(tǒng)計(jì)表考查它們與每個(gè)韻母結(jié)合的情況,如果發(fā)現(xiàn)此時(shí)會(huì)出現(xiàn)拼音串重碼,就選出其中數(shù)目較小的一個(gè),累加到累計(jì)值中去,十組都分析完后,這個(gè)累計(jì)值就是(2)式中的∑G(pyseconed)。,算法中將所有分組方案的∑G(pyseconed)都時(shí)行計(jì)算,因?yàn)镸為定值,∑G(pyseconed)值最小的那些分組就是最優(yōu)解。
經(jīng)過(guò)對(duì)20個(gè)聲母字母的20!10!×210=654729075]]>種不同的分組方案逐一考查后,得到了以下三個(gè)最優(yōu)解①bs,cm,dw,ft,gj,hp,kq,lr,ny,xz;②bs,cm,dw,ft,gq,hp,jk,lr,ny,xz;③bs,cm,dw,ft,gq,hp,jz,kx,lr,ny;MIN(∑G(pyseconed))=395,M=2815。所以,如果采用以上分組方案,在輸入中用*鍵作切換的機(jī)率是395÷2815≈0.14。
3.2.詞語(yǔ)輸入最優(yōu)模型拼音輸入法最初是以單字方式輸入,逐步升級(jí)為詞語(yǔ)方式甚至是整句方式。如果解決好了拼音碼混淆問(wèn)題和重碼過(guò)多的問(wèn)題,詞組輸入方式在輸入效率上要遠(yuǎn)遠(yuǎn)高出單字輸入方式,詞語(yǔ)輸入模型一定比單字模型更有價(jià)值。該模型下的優(yōu)化目標(biāo)就是選擇合適的聲母分母方案,使得與任意一個(gè)輸入序列對(duì)應(yīng)的詞語(yǔ)數(shù)目最少。
詞語(yǔ)是由單字組合而成,任意的組合方式有億萬(wàn)多種,而漢語(yǔ)中的詞語(yǔ)只是所有的組合中極小的一部分而已。詞組的組合規(guī)律沒(méi)有規(guī)律性,也很難進(jìn)行客觀的統(tǒng)計(jì),不同的人名地名,不同的用語(yǔ)習(xí)慣,都會(huì)影響它,在本模型中,我們認(rèn)為對(duì)于任意兩個(gè)漢字或多個(gè),它們串接而成的字串可以組合成詞的機(jī)率是均等的。設(shè)S輸入序列S是由詞語(yǔ)中各字的拼音串的輸入序列S1、S2、…、Sn串接而成,又設(shè)SM為所有單字的按鍵序列對(duì)應(yīng)的一級(jí)漢字個(gè)數(shù)的平均值,先假設(shè)任意漢字拼接而成的字串都是有效的詞語(yǔ),則輸入序列S對(duì)應(yīng)的詞語(yǔ)的個(gè)數(shù)應(yīng)該是(SM)n,而這(SM)n個(gè)字串是有效詞語(yǔ)的機(jī)率又是相等的,所以只要使得(SM)n盡可能小就可以了,要使(SM)n,只要使SM盡可能小,所以優(yōu)化目標(biāo)最終可以轉(zhuǎn)化為如何對(duì)聲母字母時(shí)行分組,使得所有單字的按鍵序列對(duì)應(yīng)的一級(jí)漢字個(gè)數(shù)的平均值最小。
SM在概率論上又稱數(shù)學(xué)期望SM‾=ΣG(sn)*P(sn)=ΣG(sn)*G(sn)M=ΣG(sn)2M...(3)]]>使用算法尋優(yōu)后得到了一個(gè)唯一的最優(yōu)解bs,cm,dw,fz,gx,hq,jk,lr,ny,pt。
MIN(ΣG(sn)2)=63797,MIN(SM‾)=637972815≈22.66.]]>3.3規(guī)律總結(jié)由于統(tǒng)計(jì)方式的問(wèn)題,所得的最優(yōu)解一定不是絕對(duì)的科學(xué)和嚴(yán)謹(jǐn),但從以上兩模型中,我們也可以總結(jié)出一些普遍的規(guī)律。
在漢語(yǔ)拼音中,聲母是有分類的,分為它采用語(yǔ)音學(xué)中的發(fā)音部位排列法,依次為唇音b、p、m、f,舌尖音d、t、n、l,舌根音g、k、h,舌面音j、q、x,舌尖前音z、c、s。以下是詞語(yǔ)輸入最優(yōu)模型的最優(yōu)解和次優(yōu)解①bc,dw,fz,gj,hq,kx,lr,ms,ny,pt;②bc,dw,fz,gq,hx,jk,lr,ms,ny,pt;③bc,dw,fz,gx,hq,jk,lr,ms,ny,pt;④bs,cf,dw,gx,hq,jk,lr,mz,ny,pt;
⑤bs,cm,dw,fz,gx,hq,jk,lr,ny,pt;以及單字模型的三個(gè)最優(yōu)解①bs,cm,dw,ft,gj,hp,kq,lr,ny,xz;②bs,cm,dw,ft,gq,hp,jk,lr,ny,xz;③bs,cm,dw,ft,gq,hp,jz,kx,lr,ny;可以發(fā)現(xiàn),同一組的聲母一定是不會(huì)被分配到同一個(gè)按鍵上的,同一類型的聲母在于韻母相結(jié)合時(shí)有一致性,這個(gè)規(guī)律也可以簡(jiǎn)單地從下表上直觀地反應(yīng)出來(lái),此表為聲母和韻母結(jié)合表,有“●”的單元格表示該行上的聲母可以行該列上的韻母相拼,沒(méi)有就表示不能相拼。
續(xù)表 在上表中,可以發(fā)現(xiàn),同類型的聲母所結(jié)合的韻母大致上是重疊的,這在語(yǔ)音學(xué)上也是可以得到合理解釋的,人們總是習(xí)慣在同一類型的開(kāi)口音后再發(fā)出特定類型的閉口音。在做聲母排列時(shí),只要避免把同組的聲母組合到一起,只對(duì)組內(nèi)聲母作相互調(diào)整,拼音串重碼的控制效果不會(huì)相差太大。
4.最終排列方案最終排列方案的形成要堅(jiān)持兩大原則,一是效率原則,二是易用原則,效率就是最大可能地遵守前文效率分析的結(jié)果,易用就是使得各字母在鍵面上的排列趨于簡(jiǎn)單化,便于用戶熟悉和掌握。首先是聲母字母的排列,框架上采用了詞語(yǔ)模型的最優(yōu)解,但為了照顧易用性,對(duì)個(gè)別字母作了組內(nèi)的微調(diào),這樣,聲母按bpmf,dtnl,gkh,jqx,zcs,wyr為組別,有規(guī)律地呈縱向排列在鍵盤(pán)各列上,一目了然,詳見(jiàn)附圖1。在這個(gè)分布中,各類型的聲母都整齊地排列(除了tp有點(diǎn)不規(guī)則),既遵守了規(guī)律性又不失對(duì)稱之美,只要學(xué)習(xí)過(guò)漢語(yǔ)拼音的用戶在一兩分鐘之內(nèi)便可熟悉各個(gè)字母在按鍵上的位置。z c s定義在最右邊一例是考慮到經(jīng)常要輸入zh ch sh,所以把它們和增補(bǔ)字母h放在同一列上會(huì)方便輸入。
再來(lái)落實(shí)聲母,因?yàn)橛衋i、ou、ao、ei、er、an、en拼音串的存在,以及l(fā)v和nv的輸入,韻母和哪個(gè)聲母字母分組放在一起還是有所講究的,組合不同會(huì)導(dǎo)致在輸入這些拼音串時(shí)產(chǎn)生的拼音串重碼數(shù)目的不同,應(yīng)當(dāng)避免產(chǎn)生三重碼。另一個(gè)需要重點(diǎn)考慮的就是排列的規(guī)律性,如果規(guī)律性強(qiáng),鍵面字母就比較好記憶,用戶上手容易。
最后,經(jīng)過(guò)細(xì)致的排查和調(diào)整,找到了如附圖2所示的鍵面字母排列,即符合上文所述的各個(gè)要求,又有較強(qiáng)的規(guī)律性。這樣方案下,只產(chǎn)生了一個(gè)不可避免的三重碼,就是ou,lu,ru,因?yàn)閡是可以和任何一個(gè)聲母字母相拼的,所以此處三重碼是不可避免的。在規(guī)律性方面,按a、o、e、i、u、v的口訣,大致遵循了由下至上,由左至右的排列規(guī)律。
這種字母定義鍵盤(pán)的方式尊重了漢語(yǔ)拼音的規(guī)律性,實(shí)現(xiàn)了漢語(yǔ)拼音輸入的簡(jiǎn)化,減少了拼音輸入的重碼。
■
圖1是本發(fā)明的聲母字母排列示意圖。
圖2是本發(fā)明的最終排列方案示意圖。
■具體實(shí)施方式
電話機(jī)、移動(dòng)電話機(jī)的產(chǎn)品制造商可以如附圖2所示來(lái)印制鍵盤(pán),然后以此鍵盤(pán)為基礎(chǔ),開(kāi)發(fā)出各種快速高效的漢字拼音輸入法程序。所附軟盤(pán)中就有一個(gè)關(guān)于本發(fā)明鍵盤(pán)的以單字方式錄入的拼音輸入法演示程序可供參考。
權(quán)利要求
1.一種適合于漢語(yǔ)拼音輸入的小型數(shù)字鍵盤(pán),其特征在于zh、ch、sh中的h以及韻母中出現(xiàn)的n和g定義在“*”鍵或“#”鍵上。
2.如權(quán)利要求1所述的小型數(shù)字鍵盤(pán),其特征在于聲母字母和韻母字母按如下方式定義在鍵盤(pán)的具體的按鍵上d、w定義在“1”鍵上,t、p定義在“2”鍵上,b、z定義在“3”鍵上,n、y定義在“4”鍵上,g、j定義在“5”鍵上,m、c、u定義在“6”鍵上,l、r、o、v定義在“7”鍵上,k、q、e定義在“8”鍵上,f、s、i定義在“9”鍵上,h、x、a定義在“0”鍵上。
全文摘要
本發(fā)明公開(kāi)了一種適合于漢語(yǔ)拼音輸入的小型數(shù)字鍵盤(pán)。本發(fā)明在充分研究漢語(yǔ)拼音規(guī)律的基礎(chǔ)上,重新安排小型數(shù)字鍵盤(pán)鍵面字母的排列組合方式,設(shè)計(jì)出一種更適合拼音輸入的小型數(shù)字鍵盤(pán),以克服目前手機(jī)或移動(dòng)電話機(jī)上普遍使用的小型數(shù)字鍵盤(pán)在輸入漢語(yǔ)拼音時(shí)的種種缺點(diǎn),使得小型數(shù)字鍵盤(pán)上可以流暢快速地使用拼音輸入法輸入漢字。
文檔編號(hào)H04M1/23GK1801054SQ200510091829
公開(kāi)日2006年7月12日 申請(qǐng)日期2005年8月8日 優(yōu)先權(quán)日2004年8月23日
發(fā)明者徐彥銘 申請(qǐng)人:徐彥銘