欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種輸入糾錯方法及裝置與流程

文檔序號:12118495閱讀:來源:國知局

技術(shù)特征:

1.一種輸入糾錯方法,其特征在于,包括:

判斷輸入的詞語字符串是否為全拼音;

若是,則對所述詞語字符串的全拼音進(jìn)行拼音糾錯處理,并將糾錯后的全拼音反查為漢字,得到第一糾錯結(jié)果;否則,對所述詞語字符串進(jìn)行分詞處理,在分詞處理的結(jié)果中分詞個數(shù)大于1時,將所述詞語字符串轉(zhuǎn)成全拼音,并對轉(zhuǎn)成的所述全拼音進(jìn)行拼音糾錯處理,并將糾錯后的全拼音反查為漢字,得到第二糾錯結(jié)果。

2.根據(jù)權(quán)利要求1所述的輸入糾錯方法,其特征在于,根據(jù)拼音反查表將糾錯后的全拼音反查為漢字;所述方法還包括:預(yù)先建立拼音反查表,包括:

提供訓(xùn)練語料;

對訓(xùn)練語料進(jìn)行分詞以得到詞語列表;

在詞語列表的基礎(chǔ)上利用拼音反查表生成工具生成拼音反查表。

3.根據(jù)權(quán)利要求1所述的輸入糾錯方法,其特征在于,在分詞處理的結(jié)果中分詞個數(shù)大于1時,所述將所述詞語字符串轉(zhuǎn)成全拼音,包括:

在不改變所述詞語字符串中各分詞出現(xiàn)順序的情況下,將所述詞語字符串中的漢字分詞轉(zhuǎn)換成拼音,再與所述詞語字符串中已有的拼音一起,組成所述詞語字符串對應(yīng)的全拼音。

4.根據(jù)權(quán)利要求2所述的輸入糾錯方法,其特征在于,所述方法還包括:預(yù)先建立詞頻表,包括:

提供訓(xùn)練語料;

對訓(xùn)練語料進(jìn)行分詞以得到詞語列表;

采用統(tǒng)計的方式根據(jù)詞語列表得到詞頻表;

對任一詞語字符串的全拼音進(jìn)行拼音糾錯處理,并將糾錯后的全拼音反查為漢字,得到糾錯結(jié)果,包括:

根據(jù)拼音反查表判斷所述任一詞語字符串的全拼音的拼寫是否正確;

若是,則根據(jù)所述任一詞語字符串的全拼音獲取同音的詞語列表,基于獲取的同音的詞語列表得到糾錯結(jié)果;

若否,則根據(jù)所述任一詞語字符串的全拼音與拼音反查表中的每個拼音之間的相似度,確定出糾錯結(jié)果。

5.根據(jù)權(quán)利要求4所述的輸入糾錯方法,其特征在于,所述基于獲取的同音的詞語列表得到糾錯結(jié)果,包括:

判斷獲取的同音的詞語列表是否為空,若是,則得到的糾錯結(jié)果為空,否則將獲取的同音的詞語列表中的詞語作為糾錯結(jié)果;

所述根據(jù)所述詞語字符串的全拼音與拼音反查表中的每個拼音之間的相似度,確定出糾錯結(jié)果,包括:

依次計算所述詞語字符串的全拼音與拼音反查表中的每個拼音之間的相似度;

對于計算出的相似度大于設(shè)定相似度閾值的情況,將拼音反查表中的拼音對應(yīng)的詞語列表中的詞語作為糾錯結(jié)果。

6.根據(jù)權(quán)利要求4所述的輸入糾錯方法,其特征在于,所述方法,還包括:

若分詞處理的結(jié)果中分詞的個數(shù)為1,則將用戶輸入的詞語字符串作為第二糾錯結(jié)果。

7.根據(jù)權(quán)利要求6所述的輸入糾錯方法,其特征在于,所述方法還包括:

根據(jù)第一糾錯結(jié)果或者第二糾錯結(jié)果進(jìn)行相應(yīng)的提示。

8.根據(jù)權(quán)利要求7所述的輸入糾錯方法,其特征在于,根據(jù)第一糾錯結(jié)果進(jìn)行相應(yīng)的提示,包括:

判斷第一糾錯結(jié)果是否為空,若是,則提示用戶所輸入的詞語字符串所對應(yīng)的漢字詞語數(shù)目超過一個或者用戶所輸入的詞語字符串有誤,否則將糾錯結(jié)果中的詞語按照在詞頻表中的詞頻從大到小的排列輸出設(shè)定個數(shù)的詞語以提示給用戶。

9.根據(jù)權(quán)利要求7所述的輸入糾錯方法,其特征在于,根據(jù)第二糾錯結(jié)果進(jìn)行相應(yīng)的提示,包括:

若第二糾錯結(jié)果為空,則提示用戶所輸入的詞語字符串所對應(yīng)的漢字詞語數(shù)目超過一個或者用戶所輸入的詞語字符串中的拼音有誤;

若第二糾錯結(jié)果中詞語的個數(shù)為1,則將第二糾錯結(jié)果中的詞語輸出以提示給用戶;

若第二糾錯結(jié)果中詞語的個數(shù)大于1,則根據(jù)第二糾錯結(jié)果中各詞語與所述輸入的詞語字符串中的漢字詞語字符串之間的相似度確定將第二糾錯結(jié)果中的各詞語向用戶進(jìn)行提示的方式,并進(jìn)行提示。

10.根據(jù)權(quán)利要求9所述的輸入糾錯方法,其特征在于,所述根據(jù)第二糾錯結(jié)果中各詞語與所述輸入的詞語字符串中的漢字詞語字符串之間的相似度確定將第二糾錯結(jié)果中的各詞語向用戶進(jìn)行提示的方式,并進(jìn)行提示,包括:

分別計算第二糾錯結(jié)果中各詞語與所述輸入的詞語字符串中的漢字詞語字符串之間的相似度;

若計算出的第二糾錯結(jié)果中各詞語對應(yīng)的所述相似度數(shù)值均一致,則將第二糾錯結(jié)果中的各詞語按照在詞頻表中的詞頻從大到小的排列輸出設(shè)定個數(shù)的詞語以提示給用戶,否則將第二糾錯結(jié)果中的各詞語按照相似度從大到小輸出設(shè)定個數(shù)的詞語以提示給用戶。

11.根據(jù)權(quán)利要求9或10所述的輸入糾錯方法,其特征在于,所述輸入的詞語字符串中的漢字詞語字符串的獲取過程包括:在分詞處理的結(jié)果中分詞個數(shù)大于1的情況下,依次記錄所述輸入的詞語字符串的分詞中的所有漢字分詞并組成漢字詞語字符串。

12.一種輸入糾錯裝置,其特征在于,包括:

判斷模塊,用于判斷輸入的詞語字符串是否為全拼音;若是,則將所述詞語字符串的全拼音發(fā)送給糾錯模塊進(jìn)行處理,得到第一糾錯結(jié)果;否則,將所述詞語字符串發(fā)送給分詞模塊進(jìn)行分詞處理;

分詞模塊,用于對判斷模塊發(fā)來的詞語字符串進(jìn)行分詞處理,在分詞處理的結(jié)果中分詞個數(shù)大于1時,將所述詞語字符串發(fā)送給轉(zhuǎn)換模塊;

轉(zhuǎn)換模塊,用于將分詞模塊發(fā)來的詞語字符串轉(zhuǎn)成全拼音并將轉(zhuǎn)成的全拼音發(fā)送給糾錯模塊進(jìn)行處理,得到第二糾錯結(jié)果;

糾錯模塊,用于對判斷模塊或者轉(zhuǎn)換模塊發(fā)來的全拼音進(jìn)行拼音糾錯處理,并將糾錯后的全拼音反查為漢字,得到相應(yīng)的糾錯結(jié)果。

13.根據(jù)權(quán)利要求12所述的輸入糾錯裝置,其特征在于,所述糾錯模塊,具體用于:根據(jù)拼音反查表將糾錯后的全拼音反查為漢字;

所述裝置還包括:

建立模塊,用于:提供訓(xùn)練語料;對訓(xùn)練語料進(jìn)行分詞以得到詞語列表;在詞語列表的基礎(chǔ)上利用拼音反查表生成工具生成拼音反查表。

14.根據(jù)權(quán)利要求12所述的輸入糾錯裝置,其特征在于,所述轉(zhuǎn)換模塊,具體用于:

在不改變所述詞語字符串中各分詞出現(xiàn)順序的情況下,將所述詞語字符串中的漢字分詞轉(zhuǎn)換成拼音,再與所述詞語字符串中已有的拼音一起,組成所述詞語字符串對應(yīng)的全拼音。

15.根據(jù)權(quán)利要求13所述的輸入糾錯裝置,其特征在于,所述建立模塊,還用于:采用統(tǒng)計的方式根據(jù)詞語列表得到詞頻表;

所述糾錯模塊,包括:

拼寫檢查單元,用于對任一詞語字符串的全拼音進(jìn)行拼音糾錯處理時,根據(jù)拼音反查表判斷所述任一詞語字符串的全拼音的拼寫是否正確;若是,則調(diào)用第一處理單元,否則調(diào)用第二處理單元;

第一處理單元,用于根據(jù)所述任一詞語字符串的全拼音獲取同音的詞語列表,基于獲取的同音的詞語列表得到糾錯結(jié)果;

第二處理單元,用于根據(jù)所述任一詞語字符串的全拼音與拼音反查表中的每個拼音之間的相似度,確定出糾錯結(jié)果。

16.根據(jù)權(quán)利要求15所述的輸入糾錯裝置,其特征在于,所述第一處理單元,具體用于:

判斷獲取的同音的詞語列表是否為空,若是,則得到的糾錯結(jié)果為空,否則將獲取的同音的詞語列表中的詞語作為糾錯結(jié)果;

所述第二處理單元,具體用于:

依次計算所述詞語字符串的全拼音與拼音反查表中的每個拼音之間的相似度;對于計算出的相似度大于設(shè)定相似度閾值的情況,將拼音反查表中的拼音對應(yīng)的詞語列表中的詞語作為糾錯結(jié)果。

17.根據(jù)權(quán)利要求15所述的輸入糾錯裝置,其特征在于,所述分詞模塊,還用于:若分詞處理的結(jié)果中分詞的個數(shù)為1,則將用戶輸入的詞語字符串作為第二糾錯結(jié)果。

18.根據(jù)權(quán)利要求17所述的輸入糾錯裝置,其特征在于,所述裝置還包括:

提示模塊,用于根據(jù)第一糾錯結(jié)果或者第二糾錯結(jié)果進(jìn)行相應(yīng)的提示。

19.根據(jù)權(quán)利要求18所述的輸入糾錯裝置,其特征在于,所述提示模塊,具體用于:

判斷第一糾錯結(jié)果是否為空,若是,則提示用戶所輸入的詞語字符串所對應(yīng)的漢字詞語數(shù)目超過一個或者用戶所輸入的詞語字符串有誤,否則將糾錯結(jié)果中的詞語按照在詞頻表中的詞頻從大到小的排列輸出設(shè)定個數(shù)的詞語以提示給用戶。

20.根據(jù)權(quán)利要求18所述的輸入糾錯裝置,其特征在于,所述提示模塊,具體用于:

若第二糾錯結(jié)果為空,則提示用戶所輸入的詞語字符串所對應(yīng)的漢字詞語數(shù)目超過一個或者用戶所輸入的詞語字符串中的拼音有誤;

若第二糾錯結(jié)果中詞語的個數(shù)為1,則將第二糾錯結(jié)果中的詞語輸出以提示給用戶;

若第二糾錯結(jié)果中詞語的個數(shù)大于1,則根據(jù)第二糾錯結(jié)果中各詞語與所述輸入的詞語字符串中的漢字詞語字符串之間的相似度確定將第二糾錯結(jié)果中的各詞語向用戶進(jìn)行提示的方式,并進(jìn)行提示。

21.根據(jù)權(quán)利要求20所述的輸入糾錯裝置,其特征在于,所述提示模塊,在根據(jù)第二糾錯結(jié)果中各詞語與所述輸入的詞語字符串中的漢字詞語字符串之間的相似度確定將第二糾錯結(jié)果中的各詞語向用戶進(jìn)行提示的方式時,具體用于:

分別計算第二糾錯結(jié)果中各詞語與所述輸入的詞語字符串中的漢字詞語字符串之間的相似度;

若計算出的第二糾錯結(jié)果中各詞語對應(yīng)的所述相似度數(shù)值均一致,則將第二糾錯結(jié)果中的各詞語按照在詞頻表中的詞頻從大到小的排列輸出設(shè)定個數(shù)的詞語以提示給用戶,否則將第二糾錯結(jié)果中的各詞語按照相似度從大到小輸出設(shè)定個數(shù)的詞語以提示給用戶。

22.根據(jù)權(quán)利要求20或21所述的輸入糾錯裝置,其特征在于,所述分詞模塊,還用于:在分詞處理的結(jié)果中分詞個數(shù)大于1的情況下,依次記錄所述輸入的詞語字符串的分詞中的所有漢字分詞并組成漢字詞語字符串,發(fā)送給所述提示模塊。

當(dāng)前第2頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
黄冈市| 丰台区| 华蓥市| 靖安县| 肃宁县| 西贡区| 肥城市| 鸡西市| 海原县| 黄骅市| 石首市| 永福县| 固原市| 南部县| 云霄县| 卢龙县| 昆明市| 上林县| 茶陵县| 同仁县| 楚雄市| 麟游县| 翁牛特旗| 宁安市| 县级市| 沾益县| 郯城县| 武穴市| 都安| 阳新县| 莲花县| 辉县市| 玉屏| 陆良县| 广灵县| 镇赉县| 阿城市| 巴彦淖尔市| 长兴县| 伊春市| 咸丰县|