專利名稱:一種在簡體中文模式下查詢繁體中文的方法
技術領域:
本發(fā)明涉及一種在簡體中文模式下查詢繁體中文的方法。
為克服現(xiàn)有技術存在的缺點,本發(fā)明提供了一種簡體中文模式下查詢繁體中文的方法,首先在電子信息裝置內(nèi)設置簡繁體中文對應索引表該簡繁體中文對應索引表由復數(shù)組簡繁體中文對應索引所組成,各組簡繁體中文對應索引分別用以儲存簡體中文碼值及與該簡體中文碼值對應的繁體中文碼值,且各組簡繁體中文對應索引的索引內(nèi)容是根據(jù)簡體中文碼值排序而成的;然后再進行單字的查找,根據(jù)簡繁體中文對應索引表進行二分法程序,以找出使用者輸入的簡體中文的第一個索引,且依該索引次序依序?qū)⑺饕齼?nèi)容中的繁體中文碼值暫存于該電子信息裝置中的繁體中文暫存索引表,直到索引內(nèi)容中的簡體中文不是使用者所輸入的簡體中文為止。
上述的步驟是由使用者通過電子信息裝置輸入簡體中文,隨即進行步驟S1,令該電子信息裝置進行二分法搜尋程序,即先從該簡繁體中文對應索引表的總數(shù)索引10內(nèi)取出其儲存內(nèi)容,以取得所有簡繁體中文對應索引的總索引數(shù)值high,作為索引表的索引上限值,另設定一索引下限值low,并將low設定為零,接著進至步驟S2。
在步驟S2中,由該電子信息裝置設定索引個數(shù)暫定值mid,并將mid設定為“(low+high)÷2”,用以指定目前在簡繁體中文對應索引表中具有mid個索引,接著進行至步驟S3。
在步驟S3中,由該電子信息裝置判斷l(xiāng)ow是否小于或等于high,若否,則進至步驟S8;反之,若low小于或等于high則進至步驟S4。
在步驟S4中,由該電子信息裝置判斷該簡繁體中文對應索引表中第high個索引的索引內(nèi)容是否為使用者輸入在該電子信息裝置中的簡體中文碼值,若是,則進至步驟S8;反之,若否,則進至步驟S5。
在步驟S5中,由該電子信息裝置判斷該取得索引內(nèi)容的簡體中文碼值是否大于使用者輸入的簡體中文碼值,若是,則進至步驟S7;反之,若否,則進至步驟S6。
在步驟S6中,由于該電子信息裝置所取得索引內(nèi)容的簡體中文碼值小于使用者所輸入的簡體中文碼值,故將low設定為(mid+1),并返回步驟S2。
在步驟S7中,由于該電子信息裝置所取得索引內(nèi)容的簡體中文碼值大于使用者輸入的簡體中文碼值,故將high設定為(mid-1),并返回該步驟S2。
在步驟S8中,由該電子信息裝置判斷該簡繁體中文對應索引表中的第mid個索引的索引內(nèi)容是否為使用者輸入在該電子信息裝置中的簡體中文碼值,若是,則進至步驟S9;反之,若不是使用者輸入在該電子信息裝置中的簡體中文碼值,則進至步驟S10。
在步驟S9中,由于該電子信息裝置所取得索引內(nèi)容的簡體中文碼值為使用者輸入的簡體中文碼值,故將mid設定為(mid-1),并返回步驟S8。
在步驟S10中,由該電子信息裝置判斷該簡繁體中文對應索引表中的第hi gh個索引的索引內(nèi)容是否為使用者輸入在該電子信息裝置中的簡體中文碼值,若不是,則結(jié)束該二分法找尋程序;反之,若是,則進至步驟S11。
在步驟S11中,由該電子信息裝置將該簡繁體中文對應索引表中的第mid個索引內(nèi)的繁體中文碼值存入該電子信息裝置中的繁體中文暫存索引表,并進至步驟S12。
在步驟S12中,由該電子信息裝置將high設定為(high-1)以及將mid設定為(mid+1),并返回步驟S10。
上述方法還包括詞組的查找,根據(jù)使用者所輸入的簡體中文詞組自簡繁體中文對應索引表中依序找出對應的繁體中文字碼詞組,建立起對應結(jié)構(gòu)表,并根據(jù)該對應結(jié)構(gòu)表依序找出該簡體中文詞組所對應的繁體中文字碼詞組。
上述步驟,可分為兩部分,①建立起對應結(jié)構(gòu)表進行步驟S110,先設定默認值i,并將i設定為零,以作為該繁體中文暫存索引表的索引指針值,接著進至步驟S111。
在步驟S111中,由該電子信息裝置判斷該繁體中文暫存索引表的索引內(nèi)容是否為空,若否,進至步驟S112,若是,則結(jié)束程序。
在步驟S112中,自該繁體中文暫存索引表中取出第i個索引的索引內(nèi)容,即取出所對應的繁體中文碼值,接著進至步驟S113。
在步驟S113中,由該電子信息裝置將取得的繁體中文碼值儲存在該對應結(jié)構(gòu)表中,接著進至步驟S114。
在步驟S114中,由該電子信息裝置將i設定為(i+1),并返回該步驟S111。
根據(jù)上述步驟S111至步驟S114以建立對應結(jié)構(gòu)表,使每一個所對應的繁體中文字可對應一個結(jié)構(gòu)表,在對應結(jié)構(gòu)表建立完成后,隨即進行步驟S20,由該電子信息裝置自該對應結(jié)構(gòu)表中依序取出待查詢的繁體中文詞組,接著進至步驟②。
②根據(jù)該對應結(jié)構(gòu)表依序找出繁體中文字碼詞組步驟S20進至步驟S21,在步驟S21中,由該電子信息裝置判斷該取得的繁體中文詞組是否為使用者所需的繁體中文詞組,若是,則結(jié)束簡繁體中文詞組替換程序;若否,則進至步驟S22。
在步驟S22中,由該電子信息裝置判斷使用者所輸入的簡體中文詞組是否均完成繁體替換程序,若是,則結(jié)束簡繁體中文詞組替換程序;若否,則返回該步驟S20。
與現(xiàn)有技術相比,本發(fā)明的優(yōu)點是1、本發(fā)明是根據(jù)簡體與繁體中文的一對多關系建立的簡繁體中文對應索引表,因此,可以找出與簡體中文對應的所有繁體中文,效率高而且正確率高。
2、本發(fā)明可適用于具有簡繁體中文處理功能的電子信息裝置,例如筆記型計算機、桌上型計算機、行動電話、電子辭典或個人數(shù)字助理等,適用范圍廣。
參見
圖1,該簡繁體中文對應索引表預先建立在電子信息裝置中,由復數(shù)組簡繁體中文對應索引11、12、13、14等組成,分別用以儲存簡體中文碼值及與該簡體中文碼值對應的繁體中文碼值,且各組簡繁體中文對應索引的索引內(nèi)容是根據(jù)簡體中文碼值排序而成的。該簡繁體中文對應索引表中還有一總數(shù)索引10,用以儲存該簡繁體中文對應索引表所有簡繁體中文對應索引11、12、13、14等的索引總數(shù)。本實施例的簡繁體中文對應索引表中的復數(shù)組簡繁體中文對應索引11、12、13、14等的索引內(nèi)容是由四個字節(jié)(byte)所組成,且其中前兩個字節(jié)用以儲存簡體中文碼值,后兩個字節(jié)則用以儲存與該簡體中文碼值對應的繁體中文碼值,同時,該簡體中文碼值以及繁體中文碼值均采用unicode碼值。所說的總數(shù)索引10的索引內(nèi)容由兩個字節(jié)所組成。
參見圖2,具體說明簡體中文字”干”在該簡繁體中文對應索引表中的儲存結(jié)構(gòu),該簡體中文字”干”對應的所有繁體中文字包括“乾”、“幹”、“榦”,因此在簡繁體中文對應索引表中依序形成三個簡繁體中文對應索引20、21、22,而各組簡繁體中文對應索引20、21、22的索引內(nèi)容均分別儲存該簡體中文字”干”的碼值及與該簡體中文字”干“的碼值對應的繁體中文字”乾”、”幹”及”榦”的碼值。
參見圖3,查找一個簡體中文字所對應的所有繁體文字的步驟是由使用者通過電子信息裝置輸入一簡體中文詞組,例如“軀干”后,隨即進行步驟S1,令該電子信息裝置進行二分法搜尋程序,即先自該簡繁體中文對應索引表的總數(shù)索引10內(nèi)取出其儲存內(nèi)容,以取得所有簡繁體中文對應索引的總索引數(shù)值high(以下簡稱為high),作為索引表的索引上限值,另設定索引下限值low(以下簡稱為low),并將low設定為零,接著進至步驟S2。
在步驟S2中,由該電子信息裝置設定索引個數(shù)暫定值mid(以下簡稱為mid),并將mid設定為“(low+high)÷2”,用以指定目前在簡繁體中文對應索引表中具有mid個索引,接著進行至步驟S3。
在步驟S3中,由該電子信息裝置判斷l(xiāng)ow是否小于或等于high,若否,則進至步驟S8;反之,若low小于或等于high則進至步驟S4。
在步驟S4中,由該電子信息裝置判斷該簡繁體中文對應索引表中第high個索引的索引內(nèi)容是否為使用者輸入在該電子信息裝置中的簡體中文碼值,若是,則進至步驟S8;反之,若否,則進至步驟S5。
在步驟S5中,由該電子信息裝置判斷該取得索引內(nèi)容的簡體中文碼值是否大于使用者輸入的簡體中文碼值,若是,則進至步驟S7;反之,若否,則進至步驟S6。
在步驟S6中,由于該電子信息裝置所取得索引內(nèi)容的簡體中文碼值小于使用者所輸入的簡體中文碼值,故將low設定為(mid+1),并返回步驟S2。
在步驟S7中,由于該電子信息裝置所取得索引內(nèi)容的簡體中文碼值大于使用者輸入的簡體中文碼值,故將high設定為(mid-1),并返回該步驟S2。
在步驟S8中,由該電子信息裝置判斷該簡繁體中文對應索引表中的第mid個索引的索引內(nèi)容是否為使用者輸入在該電子信息裝置中的簡體中文碼值,若是,則進至步驟S9;反之,若不是使用者輸入在該電子信息裝置中的簡體中文碼值,則進至步驟S10。
在步驟S9中,由于該電子信息裝置所取得索引內(nèi)容的簡體中文碼值為使用者輸入的簡體中文碼值,故將mid設定為(mid-1),并返回步驟S8。
在步驟S10中,由該電子信息裝置判斷該簡繁體中文對應索引表中的第high個索引的索引內(nèi)容是否為使用者輸入在該電子信息裝置中的簡體中文碼值,若不是,則結(jié)束該二分法找尋程序;反之,若是,則進至步驟S11。
在步驟S11中,由該電子信息裝置將該簡繁體中文對應索引表中的第mid個索引內(nèi)的繁體中文碼值存入該電子信息裝置中的繁體中文暫存索引表,并進至步驟S12。
在步驟S12中,由該電子信息裝置將high設定為(high-1)以及將mid設定為(mid+1),并返回步驟S10。
上面所說的步驟S1至步驟S12所進行的是二分法找尋程序。因為該簡繁體中文對應索引表的各個簡繁體中文對應索引表均依照簡體中文碼值排序,因此若使用者所輸入的簡體中文在該簡繁體中文對應索引表中具有對應的繁體中文時,利用此二分法找尋程序向前依序找尋就可以取得該簡體中文字的第一個索引;然后從找出的第一個索引開始將找尋到的繁體中文依序儲存在中文暫存索引表,直到所找到的索引的簡體中文不是使用者所輸入的簡體中文為止。
參見圖4,在本實施例中,步驟S1至步驟S12經(jīng)過兩次循環(huán)操作,所建立的繁體中文暫存索引表中找出了待查詢簡體中文詞組中各個簡體中文字所對應的繁體中文字,“驅(qū)”只有“軀”一個對應的繁體字,而無對應的其它繁體字,“干”已找出了三個備選繁體字,并將它們儲存在中文暫存索引表中,它們是0乾1幹和2榦。
參見圖5,根據(jù)使用者輸入的簡體中文建立了繁體中文暫存索引表之后,隨即進行步驟S110,即由該電子信息裝置根據(jù)使用者所輸入的簡體中文詞組建立對應結(jié)構(gòu)表,先設定默認值i,并將i設定為零,以作為該繁體中文暫存索引表的索引指針值,接著進至步驟S111。
在步驟S111中,由該電子信息裝置判斷該繁體中文暫存索引表的索引內(nèi)容是否為空,若否,進至步驟S112,若是,則結(jié)束程序。
在步驟S112中,從該繁體中文暫存索引表中取出第i個索引的索引內(nèi)容,即取出所對應的繁體中文碼值,接著進至步驟S113。
在步驟S113中,由該電子信息裝置將取得的繁體中文碼值儲存在該對應結(jié)構(gòu)表中,接著進至步驟S114。
在步驟S114中,由該電子信息裝置將i設定為(i+1),并返回該步驟S111。
根據(jù)上述步驟S111至步驟S114以建立對應結(jié)構(gòu)表,使每一個所對應的繁體中文字可對應一個結(jié)構(gòu)表,即,對于各個待查詢詞組均會有一個結(jié)構(gòu)數(shù)組來對應,以供該電子信息裝置查詢之用。
參見圖6,對應結(jié)構(gòu)表中包括軀乾、軀幹和軀榦。
參見圖7,在對應結(jié)構(gòu)表建立完成后,隨即進行步驟S20,由該電子信息裝置從該對應結(jié)構(gòu)表中依序取出待查詢的繁體中文詞組,接著進至步驟S21。
在步驟S21中,由該電子信息裝置判斷該取得的繁體中文詞組是否為使用者所需的繁體中文詞組,若是,則結(jié)束簡繁體中文詞組替換程序;若否,則進至步驟S22。
在步驟S22中,由該電子信息裝置判斷使用者所輸入的簡體中文詞組是否均完成繁體替換程序,若是,則結(jié)束簡繁體中文詞組替換程序;若否,則返回該步驟S20。
由上述各步驟S111至S114以及步驟S20至步驟S23可知,若一個待查詢詞組中有3個文字且依次有n1、n2以及n3個對應繁體中文字,則其所需查詢的次數(shù)為(n1+1)×(n2+1)×(n3+1)。以詞組“軀干”舉例說明的,文字“軀”只有“軀”一個對應的繁體字,并無對應的其它繁體文字(即n1=1),而文字“干”具有三個對應的繁體文字“乾”、“幹”、“榦”(即n2=3),故該詞組“軀干”查詢的次數(shù)為(1+1)×(3+1)=8,其包含進行簡繁體中文替換前詞組本身的查詢,這樣就可以得確保查詢的中文詞組的各種組合均可查到。
參見圖8,實際操作中,使用者由電子信息裝置輸入簡體中文詞組后,該電子信息裝置就會根據(jù)輸入的簡體中文詞組找出所有與之對應的繁體中文詞組并顯示出來,供使用者選擇。
權利要求
1.一種在簡體中文模式下查詢繁體中文的方法,其特征在于首先在電子信息裝置內(nèi)設置簡繁體中文對應索引表,該簡繁體中文對應索引表由復數(shù)組簡繁體中文對應索引所組成,各組簡繁體中文對應索引分別用以儲存簡體中文碼值及與該簡體中文碼值對應的繁體中文碼值,且各組簡繁體中文對應索引的索引內(nèi)容是根據(jù)簡體中文碼值排序而成的;然后再進行單字的查找,根據(jù)簡繁體中文對應索引表進行二分法程序,以找出使用者輸入的簡體中文的第一個索引,且依該索引次序依序?qū)⒃撍饕齼?nèi)容中的繁體中文碼值暫存在該電子信息裝置中的繁體中文暫存索引表,直到索引內(nèi)容中的簡體中文不是使用者所輸入的簡體中文為止。
2.根據(jù)權利要求1所述的一種在簡體中文模式下查詢繁體中文的方法,其特征在于上述的步驟是,由使用者通過電子信息裝置輸入簡體中文,隨即進行步驟S1,令該電子信息裝置進行二分法搜尋程序,即先從該簡繁體中文對應索引表的總數(shù)索引10內(nèi)取出其儲存內(nèi)容,以取得所有簡繁體中文對應索引的總索引數(shù)值high,作為索引表的索引上限值,另設定一索引下限值low,并將low設定為零,接著進至步驟S2;在步驟S2中,由該電子信息裝置設定索引個數(shù)暫定值mid,并將mid設定為“(low+high)÷2”,用以指定目前在簡繁體中文對應索引表中具有mid個索引,接著進行至步驟S3;在步驟S3中,由該電子信息裝置判斷l(xiāng)ow是否小于或等于high,若否,則進至步驟S8,反之,若low小于或等于high則進至步驟S4;在步驟S4中,由該電子信息裝置判斷該簡繁體中文對應索引表中第high個索引的索引內(nèi)容是否為使用者輸入在該電子信息裝置中的簡體中文碼值,若是,則進至步驟S8,反之,若否,則進至步驟S5;在步驟S5中,由該電子信息裝置判斷該取得索引內(nèi)容的簡體中文碼值是否大于使用者輸入的簡體中文碼值,若是,則進至步驟S7;反之,若否,則進至步驟S6;在步驟S6中,由于該電子信息裝置所取得索引內(nèi)容的簡體中文碼值小于使用者所輸入的簡體中文碼值,故將low設定為(mid+1),并返回步驟S2;在步驟S7中,由于該電子信息裝置所取得索引內(nèi)容的簡體中文碼值大于使用者輸入的簡體中文碼值,故將high設定為(mid-1),并返回該步驟S2;在步驟S8中,由該電子信息裝置判斷該簡繁體中文對應索引表中的第mid個索引的索引內(nèi)容是否為使用者輸入在該電子信息裝置中的簡體中文碼值,若是,則進至步驟S9;反之,若不是使用者輸入在該電子信息裝置中的簡體中文碼值,則進至步驟S10;在步驟S9中,由于該電子信息裝置所取得索引內(nèi)容的簡體中文碼值為使用者輸入的簡體中文碼值,故將mid設定為(mid-1),并返回步驟S8;在步驟S10中,由該電子信息裝置判斷該簡繁體中文對應索引表中的第high個索引的索引內(nèi)容是否為使用者輸入在該電子信息裝置中的簡體中文碼值,.若不是,則結(jié)束該二分法找尋程序;反之,若是,則進至步驟S11;在步驟S11中,由該電子信息裝置將該簡繁體中文對應索引表中的第mid個索引內(nèi)的繁體中文碼值存入該電子信息裝置中的繁體中文暫存索引表,并進至步驟S12;在步驟S12中,由該電子信息裝置將high設定為(high-1)以及將mid設定為(mid+1),并返回步驟S10。
3.根據(jù)權利要求1或2所述的一在種簡體中文模式下查詢繁體中文的方法,其特征在于所述方法還包括詞組的查找,根據(jù)使用者所輸入的簡體中文詞組從簡繁體中文對應索引表中依序找出對應的繁體中文字碼詞組,建立起對應結(jié)構(gòu)表,并根據(jù)該對應結(jié)構(gòu)表依序找出該簡體中文詞組所對應的繁體中文字碼詞組。
4.根據(jù)權利要求3所述的一種在簡體中文模式下查詢繁體中文的方法,其特征在于所述步驟可分為兩部分,①建立起對應結(jié)構(gòu)表,進行步驟S110,先設定默認值i,并將i設定為零,以作為該繁體中文暫存索引表的索引指針值,接著進至步驟S111;在步驟S111中,由該電子信息裝置判斷該繁體中文暫存索引表的索引內(nèi)容是否為空,若否,進至步驟S112,若是,則結(jié)束程序;在步驟S112中,自該繁體中文暫存索引表中取出第i個索引的索引內(nèi)容,亦即取出所對應的繁體中文碼值,接著進至步驟S113;在步驟S113中,由該電子信息裝置將取得的繁體中文碼值儲存在該對應結(jié)構(gòu)表中,接著進至步驟S114;在步驟S114中,由該電子信息裝置將i設定為(i+1),并返回該步驟S111;根據(jù)上述步驟S111至步驟S114以建立對應結(jié)構(gòu)表,使每一個所對應的繁體中文字可對應一個結(jié)構(gòu)表,在對應結(jié)構(gòu)表建立完成后,隨即進行步驟S20,由該電子信息裝置從該對應結(jié)構(gòu)表中依序取出待查詢的繁體中文詞組,接著進至步驟②;②根據(jù)該對應結(jié)構(gòu)表依序找出繁體中文字碼詞組由步驟S20進至步驟S21,在步驟S21中,由該電子信息裝置判斷該取得的繁體中文詞組是否為使用者所需的繁體中文詞組,若是,則結(jié)束簡繁體中文詞組替換程序,若否,則進至步驟S22;在步驟S22中,由該電子信息裝置判斷使用者所輸入的簡體中文詞組是否均完成繁體替換程序,若是,則結(jié)束簡繁體中文詞組替換程序,若否,則返回該步驟S20。
全文摘要
本發(fā)明涉及一種在簡體中文模式下查詢繁體中文的方法?,F(xiàn)在掌上型電子信息裝置所提供的簡繁體中文的切換處理方法存在著效率較低且正確率低的缺點。本發(fā)明的技術方案是,首先在電子信息裝置內(nèi)設置簡繁體中文對應索引表;然后再進行單字的查找,根據(jù)簡繁體中文對應索引表進行二分法程序,以找出使用者輸入的簡體中文的第一個索引,且依該索引次序依序?qū)⒃撍饕齼?nèi)容中的繁體中文碼值暫存在該電子信息裝置中的繁體中文暫存索引表,直到索引內(nèi)容中的簡體中文不是使用者所輸入的簡體中文為止。
文檔編號G06F9/44GK1452099SQ0310809
公開日2003年10月29日 申請日期2003年5月27日 優(yōu)先權日2003年5月27日
發(fā)明者陳淮琰, 李國慶 申請人:無敵科技(西安)有限公司