專利名稱:中文輸入方法
本發(fā)明涉及中國(guó)語(yǔ)言文字的輸入方法(以下稱為中文輸入方法),特別是涉及應(yīng)用標(biāo)音字母輸入中文情況下的同音字處理方法。
在處理中文的信息處理系統(tǒng)中,中文鍵盤(pán)是必須的,作為這種鍵盤(pán)輸入方法,一般是采用把中文漢字的形狀、讀法、或使二者組合的代碼化方法。
表示中文讀法的標(biāo)音字母,有中國(guó)政府制訂了的拼音和在此制訂之前就已經(jīng)使用的注音?,F(xiàn)在中國(guó)以拼音為主,標(biāo)音主要是老年人和在一部分地區(qū)使用。
中文的讀法除了一部分文字外,具有原則上是一個(gè)中文字對(duì)應(yīng)一個(gè)音節(jié),而沒(méi)有其它讀法的優(yōu)點(diǎn)。但是具有相同讀法、即具有相同音節(jié)的同音字很多,特別是在一部分相當(dāng)日語(yǔ)假名書(shū)寫(xiě)的使用頻度很高的文字中,存在很多由一個(gè)文字構(gòu)成的單字詞,并且大都有許多同音字,還有兩個(gè)文字以上的詞也有同音詞,但其數(shù)量很少。
因此,根據(jù)鍵入標(biāo)音字母(例如拼音)輸入上述同音字時(shí),一般在操作上是從順序表示的多個(gè)同音字中選擇所需的一個(gè)字。
然而,用這種方法存在著每當(dāng)反復(fù)輸入相同的字時(shí),必須重復(fù)進(jìn)行上述選擇操作的缺點(diǎn)。因此,一般在進(jìn)行同音字的學(xué)習(xí)處理時(shí),若把使用頻度有很大差別的同音字之間用同一方法處理,這反倒成為使輸入變成復(fù)雜的一個(gè)原因。
關(guān)于中文字的使用頻度根據(jù)最近的調(diào)查,在一般的圖書(shū)和報(bào)紙等方面,大約使用6,000個(gè)漢字,但是使用頻度程度很高的60個(gè)字出現(xiàn)次數(shù)為30%以上,使用最多的“的”字出現(xiàn)次數(shù)為4%以上。過(guò)去的中文輸入方法沒(méi)有采用考慮到這些使用頻度的同音字學(xué)習(xí)方法。
本發(fā)明的目的在于提供一種把各個(gè)同音字根據(jù)使用頻度和實(shí)際狀況加以分類,而改善了上述缺點(diǎn)的中文輸入方法。
本發(fā)明的中文輸入方法,在把鍵入的標(biāo)音字母序列變換成中文文字序列的中文輸入方法中,具有一個(gè)同音字表,它對(duì)于中文的n個(gè)同音字,把使用頻度最高的一個(gè)字作為A類,把使用頻度適中的m個(gè)字(m≤n-1)作為B類,把使用頻度低的l個(gè)字(l≤n-m-1)作為C類。具有把從前述B類的m個(gè)字中選擇一個(gè)字時(shí),以剛剛選擇過(guò)的字開(kāi)始順序地進(jìn)行顯示的第一手段,和從上述C類的l個(gè)字當(dāng)中選擇一個(gè)字時(shí)根據(jù)前面已經(jīng)確定的順序、順次地進(jìn)行顯示的第二手段。從上述n個(gè)同音字中選擇一個(gè)字時(shí),最初顯示上述A類的一個(gè)字,而后,當(dāng)A類的這個(gè)字不相符時(shí),根據(jù)上述第一手段檢索B類的m個(gè)字。當(dāng)上述A類和上述B類的各個(gè)字都不相符時(shí),根據(jù)上述第二手段檢索上述C類的l個(gè)字來(lái)實(shí)現(xiàn)。
根據(jù)本發(fā)明的中文輸入方法,最初顯示使用頻度最高的一個(gè)字,當(dāng)其不是所需字時(shí),再?gòu)氖褂妙l度適中的字中,從剛剛選擇過(guò)的字開(kāi)始順序顯示,因?yàn)樽隽诉@種操作判斷,故不必要象過(guò)去那樣,每當(dāng)輸入同一個(gè)字時(shí),要重復(fù)進(jìn)行同一選擇操作。就是說(shuō),即使最初顯示的字不是所需字時(shí),那么兩次以后顯示的字成為所需字的程度一定很高,由于這種學(xué)習(xí)功能的作用,所以能夠期待極大節(jié)省復(fù)雜操作的高速中文輸入。
圖1為根據(jù)本發(fā)明的中文輸入方法的一個(gè)實(shí)施例的框圖;圖2為動(dòng)作步驟的流程圖;圖3為同音字表例的說(shuō)明圖;圖4為把同音字加以分類例的說(shuō)明圖。
實(shí)現(xiàn)本發(fā)明的最佳方案以下對(duì)于本發(fā)明的中文輸入方法參照設(shè)計(jì)圖予以說(shuō)明。
圖1為本發(fā)明的一個(gè)實(shí)施例的框圖,在該圖中的中文輸入方法,由扔有拼音鍵1a,并能輸入中文標(biāo)音字母序列(拼音字母序列)的輸入部1、暫存含有各種控制信號(hào)的輸入信號(hào)100的輸入緩沖區(qū)部2、把拼音字母序列變換成中文漢字序列的變換部3、擁有拼音字母序列與中文漢字序列對(duì)應(yīng)表的字典部4、控制拼音字母序列和中文漢字序列顯示的顯示控制部5、和顯示它們的顯示部6構(gòu)成。
輸入部1含有拼音鍵1a,輸出包含與拼音字母共存的各種控制信號(hào)的輸入信號(hào)100。
緩沖區(qū)部2接收輸入信號(hào)100,并輸出將其識(shí)別后要顯示成為拼音的輸入數(shù)據(jù)101和指示從拼音到中文漢字變換的變換控制信號(hào)106。
變換部3包括字典存取手段3a、讀出數(shù)據(jù)緩沖區(qū)3b和變換控制手段3C。字典存取手段3a接收輸入數(shù)據(jù)101,并根據(jù)控制信號(hào)106輸出檢索信號(hào)102。另外,變換控制手段3C根據(jù)變換控制信號(hào)106輸出變換指示信號(hào)107和顯示指示信號(hào)108。讀出數(shù)據(jù)緩沖區(qū)3b接收讀出數(shù)據(jù)103并暫時(shí)保存,根據(jù)變換信號(hào)107從中選擇一個(gè)字作為變換數(shù)據(jù)104輸出(關(guān)于選擇方法在后邊敘述)。
字典部4包含同音字表4a,該表含有拼音字母和中文漢字的對(duì)應(yīng)表,把對(duì)應(yīng)檢索信號(hào)102的中文漢字作為讀出數(shù)據(jù)103輸出。
顯示控制部5包含輸入數(shù)據(jù)顯示緩沖區(qū)5a、變換數(shù)據(jù)顯示緩沖區(qū)5b和顯示緩沖區(qū)5C。并且,輸入數(shù)據(jù)顯示緩沖區(qū)5a及變換數(shù)據(jù)顯示緩沖區(qū)5b分別接收輸入數(shù)據(jù)101和變換數(shù)據(jù)104并暫存它們。顯示緩沖區(qū)5C把如上所述保存的輸入數(shù)據(jù)101及變換數(shù)據(jù)104根據(jù)顯示指示信號(hào)108進(jìn)行輸入,并把其作為顯示信號(hào)105輸出。
顯示部6接收上述的顯示信號(hào)105,在顯示器顯示它們,并能識(shí)別操作過(guò)程。
圖2為表示上述中文輸入方法動(dòng)作步驟的流程圖。在該圖中處理21是鍵入標(biāo)音字母序列的操作,接下去處理22,是判斷是否把在處理21鍵入了的標(biāo)音字母序列變換成為中文漢字,當(dāng)不作變換時(shí)返回到處理21,繼續(xù)鍵入標(biāo)音字母序列,當(dāng)進(jìn)行變換時(shí)轉(zhuǎn)移到處理23。
處理23顯示A類的字,處理24判斷被顯示的A類的字是否是所需字。當(dāng)是所需字時(shí),轉(zhuǎn)移到處理25,當(dāng)不是所需字時(shí)轉(zhuǎn)移到處理27。
處理25把顯示的所需字寫(xiě)入文件,根據(jù)這個(gè)處理標(biāo)音字母被置換成中文漢字。
處理27把B類的字按照上述順序進(jìn)行顯示,處理28判斷被顯示的B類字是否是所需字,當(dāng)是所需字時(shí)轉(zhuǎn)移到處理29,當(dāng)不是所需字時(shí),轉(zhuǎn)移到處理30。
處理29改寫(xiě)上述的參照標(biāo)記,即把在處理28已確定的所需字,在下面的檢索時(shí)改寫(xiě)成最初顯示的參照標(biāo)記,然后轉(zhuǎn)移到前述的處理25。
處理30判斷B類的字是否已全部顯示過(guò)了,若還有沒(méi)有顯示的字時(shí),轉(zhuǎn)移到上述處理27,當(dāng)全都顯示過(guò)時(shí),轉(zhuǎn)移到處理31。
處理31把C類的詞按照原來(lái)已經(jīng)規(guī)定的順序進(jìn)行顯示,處理32判斷被顯示的C類的字是否是所需字,當(dāng)其是所需字時(shí),轉(zhuǎn)移到處理25,當(dāng)不是所需字時(shí),轉(zhuǎn)移到處理33。
處理33判斷是否C類的字已全部顯示過(guò)了,當(dāng)還有沒(méi)顯示的字時(shí),轉(zhuǎn)移到上述處理31,當(dāng)已全部顯示過(guò)時(shí),轉(zhuǎn)移到處理34。
處理34指示所需字不存在于同音字表4a中(例如表示〔?〕同時(shí)寫(xiě)入文件)。
處理26為判斷是否繼續(xù)進(jìn)行中文輸入,當(dāng)繼續(xù)時(shí)返回到處理21并重復(fù)進(jìn)行上述操作。
上述的中文輸入方法,把有序的同音字作為候補(bǔ)所需字順次地顯示,一邊判斷其是否是所需字,一邊進(jìn)行中文輸入。
根據(jù)字典存取手段3a輸出的檢索信號(hào)102,所讀出的讀出數(shù)據(jù)103包含同音字。而對(duì)于讀出數(shù)據(jù)緩沖區(qū)3b,則暫存了所需的同音字表4a。
圖3為上述同音字表4a的一部分說(shuō)明圖。在該圖中,同音字表4a由檢索時(shí) 存放索引的標(biāo)音字母域10,存放A類中文漢字的域11、存放B類中文漢字的域12和存放C類中文漢字的域13組成,并且域12中的每個(gè)同音字都包含了其在B類檢索中所處顯示順序的參考標(biāo)記域12a(學(xué)習(xí)域)。
A類存放的字,是在同音字中使用頻度最高的一個(gè)字。當(dāng)鍵入域10中的索引時(shí),將首先顯示該字。存放在B類的字是在同音字中具有中等使用頻度的一些字,檢索B類的字時(shí),根據(jù)域12a的參考標(biāo)記所指示的順序進(jìn)行顯示。即從剛剛選擇了的字開(kāi)始順序地顯示。每當(dāng)操作選中所需字時(shí)需改寫(xiě)參考標(biāo)記。存放在C類的字是在同音字中具有使用頻度較低的一些字,檢索這些字時(shí)和通常的字典一樣,根據(jù)原來(lái)確定的順序來(lái)顯示。
下面,讀出數(shù)據(jù)緩沖區(qū)3b,把暫存的如上述同音字表的內(nèi)容,根據(jù)變換控制手段3C輸出的變換指示信號(hào)107,作為變換數(shù)據(jù)104順序輸出。另外變換控制手段3C輸出顯示指示信號(hào)108,通過(guò)顯示控制部5,把上述變換數(shù)據(jù)104順次在顯示部6顯示,即參照?qǐng)D2的處理模塊41把A類的同音字、處理模塊42把B類的同音字、處理模塊43把C類的同音字分別順序表示,并根據(jù)操作的判斷進(jìn)行動(dòng)作。
圖4是把中文的同音字(特別是單字詞)加以分類的例子,在該圖中,A類中表示的字為部分相當(dāng)于日文的假名書(shū)寫(xiě)的字,它們都是使用頻度很高的字。
在本實(shí)例中,就部分相當(dāng)于日文假名書(shū)寫(xiě)的中文單字詞為主予以說(shuō)明,關(guān)于兩個(gè)字以上的詞也能夠采用上述同樣的方法實(shí)現(xiàn)中文輸入。
權(quán)利要求
在將鍵入的中文標(biāo)音字母序列變換成中文漢字序列的中文輸入方法中,具有如下特征對(duì)于中文的n個(gè)同音字,具有把使用頻度最高的一個(gè)字作為A類,把使用頻度適中的m個(gè)字(m≤n-1)作為B類,把使用頻度低的l個(gè)字(l≤n-m-1)作為C類的同音字表。具有從上述B類的m個(gè)字中選擇一個(gè)字時(shí),以剛剛選擇過(guò)的字為開(kāi)始,順序進(jìn)行顯示的第一手段和從上述C類的l個(gè)字中選擇一個(gè)字時(shí),根據(jù)原來(lái)已經(jīng)確定的順序,順次地進(jìn)行顯示的第二手段。從上述n個(gè)同音字中選擇一個(gè)字時(shí),最初顯示上述A類的一個(gè)字,當(dāng)與上述A類的這個(gè)字不相符時(shí),根據(jù)前述第一手段檢索前述B類的m個(gè)字,當(dāng)前述A類和B類的各個(gè)字都不相符時(shí),根據(jù)前述第二手段檢索前述C類的l個(gè)字。
專利摘要
本發(fā)明披露了一種把鍵入的中文拼音字母序列變換成中文漢字序列時(shí)對(duì)同音字的處理方法。該方法具有一個(gè)同音字表,對(duì)幾個(gè)中文同音字,把使用頻度最高的一個(gè)字作為A類,把使用頻度適中的m個(gè)字作為B類,把使用頻度較低的1個(gè)字作為C類。當(dāng)從n個(gè)同音字中選擇一個(gè)字時(shí),首先顯示A類的一個(gè)字,當(dāng)這個(gè)字不是所需字時(shí),再根據(jù)特定的方法檢索B類的m個(gè)字,當(dāng)A類和B類的字都不是所需字時(shí),再根據(jù)原已確定的順序檢索C類的1個(gè)字,由此實(shí)現(xiàn)高速的中文輸入。
文檔編號(hào)G06F17/22GK87104535SQ87104535
公開(kāi)日1988年4月27日 申請(qǐng)日期1987年6月12日
發(fā)明者伊藤英俊, 楠井健 申請(qǐng)人:日本電氣株式會(huì)社導(dǎo)出引文BiBTeX, EndNote, RefMan