欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

中文內容拼寫校正的方法

文檔序號:6587668閱讀:277來源:國知局
專利名稱:中文內容拼寫校正的方法
技術領域
本發(fā)明涉及一種中文輸入法,尤其是一種采用近似音字詞組來提供使用者校正的 中文內容拼寫校正的方法。
背景技術
近年來,由于華人世界的經濟快速發(fā)展,使得全球興起一股中文學習風潮。這種風 潮之下,各種學習中文的電子設備也跟著快速地發(fā)展與普及化。其中,如電子辭典、PDA、PC 等為最基本的中文學習的電子產品平臺。這些電子產品,皆可讓人們進行中文查詢或輸入。由于中文為象形文字體系,其與英文不同,無法見字而直接讀出來,因而需要注音 系統(tǒng)的輔助。自1982年8月1日國際標準化組織發(fā)出國際標準IS07098《文獻工作-中文 羅馬字母拼寫法》文件以規(guī)定拼寫漢語以漢語拼音為國際標準后,漢語拼音即成為國際標 準而廣泛通行于世界各國。漢語拼音成為國際標準雖數(shù)十年,仍然會由于個人的學習因素 而產生各種不同的“拼音錯誤”問題。對使用者來講,如何能快速地以自己習慣的方式獲得 他自己想要的結果,成為使用者最關注的事情。于是,使用者對于這種因為拼音輸入錯誤導 致的字詞的輸出結果不符合自己想要的,會產生不愉快的感覺。也就是,在使用者必須輸入 多次才有可能找到自己想要的字詞情況下,會使得輸入的速度變慢進而導致學習速度的降 低,甚至因為使用挫折而降低學習的意愿。舉例來說,當使用者采用拼音法輸入某中文字詞,如“拼音(pinyin) ”,卻不小心或 者因輸入拼音錯誤而輸入成“平因(Pinyin)”時,一般的系統(tǒng)所對應出來的輸出即會輸出 “平因”而非“拼音”。此時,使用者必須要重新輸入,會浪費很多時間。面對此種問題,先前技術已采用所謂的模糊技術(Fuzzy Technology)來處理因為 輸入錯誤的問題。其基本的作法,不外乎是根據(jù)拼音系統(tǒng)本身的易混淆音,以提供相關的拼 字結果列表,來供使用者選擇。例如,發(fā)明專利“中文漢字輸入矯正方法及系統(tǒng)”,其提供了 一聲母混淆音數(shù)據(jù)庫與韻母混淆音數(shù)據(jù)庫,當?shù)谝淮蔚钠匆糨斎氲妮敵鼋Y果不符合使用者 的需求時,通過使用者提供矯正指令后,系統(tǒng)即輸出混淆音的相關輸出,再讓使用者進行選 擇。這種技術,已經進一步改進了只能提供正確的輸入以獲得想要的輸出的結果。不 過,在使用時,其矯正的動作會在使用者確認系統(tǒng)輸出使用者所輸入的拼音后的中文輸出 “錯誤”后,再由使用者輸入指令進行矯正,對于許多常常發(fā)生錯誤的使用者來說,仍然會造 成很大的困擾。如何能夠讓使用者的習慣以及雖然發(fā)生錯誤的狀況下,能夠快速地適應使 用者的習慣,進而快速地產生使用者所想要的字詞,成為漢語拼音輸入法可改進的空間。

發(fā)明內容
本發(fā)明為解決背景技術中存在的上述技術問題,而提出一種中文內容拼寫校正的方法。本發(fā)明的技術解決方案是本發(fā)明為一種中文內容拼寫校正的方法,其特殊之處在于1)建立漢字轉拼音序列數(shù)據(jù)庫、近音關系替換表和常用組合對照表;2)接收中文內容;3)從漢字轉拼音序列數(shù)據(jù)庫中取得中文內容的拼音序列;4)根據(jù)近音關系替換表替換拼音序列的拼音序列組合;5)根據(jù)常用組合對照表取得對應于拼音序列組合的匹配字詞組合;6)輸出匹配字詞組合。上述拼音采取通用拼音、國音第一式、國音第二式、威翟拼音、耶魯拼音、臺語甲式、華語甲式、華語乙式或注音二式。上述近音關系替換表是根據(jù)聲母相近音與韻母相近音建立。上述拼音對照表是根據(jù)常用字詞組合建立。本發(fā)明還提供另一種中文內容拼寫校正的方法,其特殊之處在于該方法包含以 下步驟1)建立近音關系替換表和常用組合對照表;2)接收原始拼音序列;3)根據(jù)近音關系替換表取得替換原始拼音序列的修正拼音序列組合;4)根據(jù)常用組合對照表取得對應于修正拼音序列的匹配字詞組合;5)輸出匹配字詞組合。上述拼音采取通用拼音、國音第一式、國音第二式、威翟拼音、耶魯拼音、臺語甲 式、華語甲式、華語乙式或注音二式。上述近音關系替換表是根據(jù)聲母相近音與韻母相近音建立。上述拼音對照表是根據(jù)常用字詞組合建立。本發(fā)明利用漢語拼音以及拼音發(fā)音規(guī)則的特性并結合常用字詞的組合規(guī)則,來將 使用者所輸入的中文內容或者拼音序列的字詞組通過拼音的近音關系替換表的查詢加以 擴大,再通過拼音與漢字常用字詞組合的常用組合對照表將擴大的近音的拼音組取得擴大 的近音關系的中文字詞,提供使用者校正輸入的中文或者拼音內容,由此達到方便使用者 選擇正確字詞的目的。


圖1為漢字轉拼音序列數(shù)據(jù)庫示范例;圖2為近音關系替換表示范例;圖3為常用字詞對照表示范例;圖4為本發(fā)明中文內容拼寫校正方法,輸入中文字流程圖;圖5為本發(fā)明中文內容拼寫校正方法,輸入拼音流程圖。
具體實施例方式一般人在輸入拼音時,難免會因為拼寫錯誤,或者因為對拼音不熟等因素,而發(fā)生 輸入不對的拼音。這點對電子產品的設計來講,非常不容易處理。因為,電子產品無法很 “準確地”每次都猜到使用者的“錯誤”所在。先前技術也不斷地在電子產品上,以模糊、個 人化記憶的方式來解決這個問題。本發(fā)明的解決方式回歸到使用者可能發(fā)生錯誤的情境,來提供使用者可能的正確詞句,來解決使用者自行發(fā)生的錯誤。為了達到上述的目的,首先要建立三個數(shù)據(jù)庫,分別為1.根據(jù)相應的漢字與其漢語拼音序列對照的數(shù)據(jù)庫_漢字轉拼音序列數(shù)據(jù)庫; 2.根據(jù)中文發(fā)音的近音關系建立的拼音替換表-近音關系替換表;3.常用字詞組合的拼音 漢字對照表_常用組合對照表。將這三個對照表加以充分運用,即可實現(xiàn)本發(fā)明欲達成的 目的。以下,先說明此三個對照表。首先,參見圖1,漢字轉拼音序列數(shù)據(jù)庫包含了每個中文文字的拼音內容數(shù)據(jù)。如 “拼”的對照拼音序列為“Pin” ;“音”的對照拼音序列為“yin” ;“的”的對照拼音序列為 “de”;“方”的對照拼音序列為“fang”;“法”的對照拼音序列為“fa”;“無”的對照拼音序列 為“mi” ;“敵”的對照拼音序列為“di” ;“電”的對照拼音序列為“dian” ;“子”的對照拼音 序列為“zi” ;“辭”的對照拼音序列為“ci” ;“典”的對照拼音序列為“dian” ;“世”的對照 拼音序列為“ shi ” ;“界,,的對照拼音序列為“ jie” ;“第”的對照拼音序列為“di ” ;“一”的 對照拼音序列為“yi”,等等。接著,參見圖2,拼音的近音關系替換表包含兩個部份聲母相近音與韻母相近 音。相近音的替換表建立,采取人類的輸入習慣以及拼音習慣來制作。例如,圖4中,在聲 母中,T的近似音為“η” ;"ζ"的近似音為“zh”;“c”的近似音為“ch”;“s”的近似音為 “sh” ;“zh”的近似音為“ j” ;“ch”的近似音為V,;“sh”的近似音為“X” ;“η”的近似音為 T ;“f ”的近似音為“h” ;“r,,的近似音為T ;“m,,的近似音為“n”,等等。在韻母中,“η”的近似音為“ng”;“im”的近似音為“en”;“l(fā)”的近似音為“V”;“in” 的近似音為“ing” ;"en"的近似音為“eng” ;"ao"的近似音為“ou”,等等。以上的聲母與韻母的近似音,可能把使用者所輸入的字詞,經過排列組合后,可以 重新組成多組的拼音。不過,這些拼音實際上還是會對照到固定的詞句當中。由于一般人 在思考時,多半是以詞句作為思考的基礎,因此,以詞句為基礎的輸入法目前在市面上多屬 主流。也就是,在輸入的時候,以詞句為基礎來做進一步的篩選時,將可把一些不大可能出 現(xiàn)的拼音轉漢字詞句的組合刪除掉,形成比較接近使用者想輸入的可能詞句。參見圖3,其根據(jù)目前市面上的常用字詞組合,建立其拼音對照表。即建立可通過 拼音查找漢字常用字詞組的對照,讓系統(tǒng)可以拼音找到相對應的漢字字詞組合。拼音的字 詞組,多半與漢字字詞組的對應關系為一對一的關系,少有一對多的情形。因此,在選擇上 相對比較容易。此外,漢字轉拼音序列數(shù)據(jù)庫、近音關系替換表與常用組合對照表,均可根據(jù)使用 者所應用的電子產品特性來進行擴充。例如,使用者所采用的電子產品屬于可擴充記憶卡 或其它具有可增加數(shù)據(jù)庫內容的擴充內存的產品。如此,可將對照表依實際的需求進行擴 充,例如,采取使用者自行輸入的方式,或采取網絡下載的方式來進行擴充。圖3中的范例指出,“pinyin”對照了“拼音”的字詞組;“pinyin”對照了“拼音”的字詞組;“fangfa”對照了 “方法”的字詞組;“midi”對照了 “無敵”的字詞組;“dianzi” 對照了“電子”的字詞組;“cidian”對照了“辭典”的字詞組;“shijie”對照了“世界”的字 詞組;“diyi”對照了“第一”的字詞組;“gaoxin”對照了“高薪”的字詞組;“gaoxing”對照 了 “高興”的字詞組;“gouxin”對照了 “勾心”或“夠新”的字詞組;“gouxing”對照了 “夠 腥”的字詞組,等等。
以下將說明本發(fā)明如何運用以上三種不同的數(shù)據(jù)庫以達到本發(fā)明所欲達到的目 的。參見圖4,當使用者直接通過其它輸入法,如手寫、注音、倉頡、行列、大易、簡易、自 然…各種不同的輸入法輸入中文字詞后,當使用者認為所輸入的字詞組非其所需要的字詞 組時,即可采用圖4的流程來獲得其所需要的字詞組。步驟110 接收中文內容。如上所述,由使用者通過某些輸入法輸入中文內容。例如,使用者輸入“高興”兩字。步驟120 取得中文內容的拼音序列。接下來,即通過圖1所說明的漢字轉拼音序列數(shù)據(jù)庫來取得步驟110輸入的中文 內容所對應的拼音序列?!案吲d”兩字所對應的拼音序列為“gaoxing”。步驟130 根據(jù)近音關系替換表替換拼音序列的拼音序列組合。此步驟通過圖2所說明的近音關系替換表,將聲母與韻母的可能組合找出,在 “gaoxing”的范例中,“ao”的近似音為“uo”,而“xing”的近似音為“xin”,因此,有四組近 似拼音序列,分別為:"gaoxin", "gaoxing", "gouxin", “gouxing,,。步驟140 根據(jù)常用組合對照表取得與該拼音序列組合的匹配字詞組合。接下來,即運用圖3的常用組合對照表,查找“gaoxin”,“gaoxing”,“gouxin”, “gouxing”這四個可能的字詞組,結果找到與之對應的字詞組合為“高薪”,“高興”,“勾 心”,“夠新”,“夠腥”幾組漢字。步驟150 輸出匹配字詞組合。接下來,即輸出“高薪”,“高興”,“勾心”,“夠新”,“夠腥”幾組漢字詞,供用戶選擇。圖4說明了本發(fā)明如何運用1.漢字轉拼音序列數(shù)據(jù)庫;2.近音關系替換表;3.常 用組合對照表,這三個數(shù)據(jù)庫來達到本發(fā)明的目的。其基本精神在于,將使用者所輸入的中 文字詞,通過圖2的近音關系替換表擴大到近似音字詞的可能范圍,再通過圖3的常用組合 對照表將對應的漢字輸出,即可產生多組近似音的漢字,來讓使用者查找到想要的數(shù)據(jù),解 決使用者可能發(fā)生的輸入錯誤問題。接著,如果用戶輸入的是拼音,則采用圖5的流程來進行處理,其直接根據(jù)輸入的 拼音在替換表中尋找對應的替換關系,得到所有可能的替換序列。步驟說明如下步驟210 接收拼音內容。由使用者輸入法輸入拼音內容。例如,使用者輸入“gaoxing”。步驟220 根據(jù)近音關系替換表替換拼音序列的拼音序列組合。此步驟通過圖2所說明的拼音的近音關系替換表,將聲母與韻母的可能組合找 出,在“gaoxing”的范例中,"ao"的近似音為“uo”,而“xing”的近似音為“xin”,因此,有 四組近似拼音序列,分別為“gaoxin”,“gaoxing", “gouxin”,“gouxing”。步驟230 根據(jù)常用組合照表取得與拼音序列組合的匹配字詞組合。接下來,即運用圖3的常用組合對照表,查找“gaoxin”,“gaoxing”,“gouxin”, “gouxing”這四個可能的字詞組,結果找到與之對應的字詞組合為“高薪”,“高興”,“勾 心”,“夠新”,“夠腥”幾組漢字。 步驟240 輸出匹配字詞組合。
接下來,即輸出“高薪”,“高興”,“勾心”,“夠新”,“夠腥”幾組漢字詞,供用戶選擇。 參見圖5,只需運用1.拼音的近音關系替換表;2.常用組合對照表,這兩個數(shù)據(jù)庫 即可達到本發(fā)明的目的。其基本精神同樣在于,將使用者所輸入的拼音字詞,通過圖2的近 音關系替換表擴大到近似音字詞的可能范圍,再通過圖3的常用組合對照表將對應的漢字 輸出,即可產生多組近似音的漢字,讓使用者查找到想要的數(shù)據(jù),解決使用者可能發(fā)生的輸 入錯誤問題。以上實施例,以漢語拼音的實施例來說明本發(fā)明。實務上,熟習本發(fā)明技術領域 的相關技術人員,當可輕易采用本發(fā)明直接運用到其它的拼音方法,例如,通用拼音、國音 第一式、國音第二式、威翟拼音、耶魯拼音、臺語甲式、華語甲式、華語乙式、注音二式等拼音 方法。通過將不同的拼音方法分別建立1.根據(jù)相應的漢字與其漢語拼音序列對照的數(shù)據(jù) 庫;2.根據(jù)中文發(fā)音的近音關系建立的拼音替換表-拼音的近音關系替換表;3.常用字詞 組合的拼音漢字對照表,這三個對照表。再采取本發(fā)明的流程,即可實現(xiàn)同樣的功能。
權利要求
一種中文內容拼寫校正的方法,其特征在于該方法包含以下步驟1)建立漢字轉拼音序列數(shù)據(jù)庫、近音關系替換表和常用組合對照表;2)接收中文內容;3)從漢字轉拼音序列數(shù)據(jù)庫中取得中文內容的拼音序列;4)根據(jù)近音關系替換表替換拼音序列的拼音序列組合;5)根據(jù)常用組合對照表取得對應于拼音序列組合的匹配字詞組合;6)輸出匹配字詞組合。
2.根據(jù)權利要求1所述的中文內容拼寫校正的方法,其特征在于所述拼音采取通用 拼音、國音第一式、國音第二式、威翟拼音、耶魯拼音、臺語甲式、華語甲式、華語乙式或注音■——ο
3.根據(jù)權利要求1所述的中文內容拼寫校正的方法,其特征在于所述近音關系替換 表是根據(jù)聲母相近音與韻母相近音建立。
4.根據(jù)權利要求1所述的中文內容拼寫校正的方法,其特征在于所述拼音對照表是 根據(jù)常用字詞組合建立。
5.一種中文內容拼寫校正的方法,其特征在于該方法包含以下步驟1)建立近音關系替換表和常用組合對照表;2)接收原始拼音序列;3)根據(jù)近音關系替換表取得替換原始拼音序列的修正拼音序列組合;4)根據(jù)常用組合對照表取得對應于修正拼音序列的匹配字詞組合;5)輸出匹配字詞組合。
6.根據(jù)權利要求5所述的中文內容拼寫校正的方法,其特征在于所述拼音采取通用 拼音、國音第一式、國音第二式、威翟拼音、耶魯拼音、臺語甲式、華語甲式、華語乙式或注音■——ο
7.根據(jù)權利要求5所述的中文內容拼寫校正的方法,其特征在于所述近音關系替換 表是根據(jù)聲母相近音與韻母相近音建立。
8.根據(jù)權利要求5所述的中文內容拼寫校正的方法,其特征在于所述拼音對照表是 根據(jù)常用字詞組合建立。
全文摘要
本發(fā)明涉及一種中文內容拼寫校正的方法,利用漢語拼音以及拼音發(fā)音規(guī)則的特性并結合常用字詞的組合規(guī)則,來將使用者所輸入的中文內容或者拼音序列的字詞組通過拼音的近音關系替換表的查詢加以擴大,再通過拼音與漢字常用字詞組合的常用組合對照表將擴大的近音的拼音組取得擴大的近音關系的中文字詞,提供使用者校正輸入的中文或者拼音內容,由此達到方便使用者選擇正確字詞的目的。
文檔編號G06F17/30GK101819469SQ200910309378
公開日2010年9月1日 申請日期2009年11月6日 優(yōu)先權日2009年11月6日
發(fā)明者劉巍, 陳國強, 陳淮琰 申請人:無敵科技(西安)有限公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
景东| 会宁县| 简阳市| 紫金县| 无锡市| 扶风县| 临高县| 靖西县| 北辰区| 汤原县| 平度市| 治县。| 惠东县| 垣曲县| 南郑县| 汝阳县| 遵化市| 纳雍县| 永嘉县| 基隆市| 三穗县| 林芝县| 石门县| 绥棱县| 泽州县| 清丰县| 临沂市| 永顺县| 灵武市| 富宁县| 石棉县| 自治县| 公安县| 蒙自县| 珠海市| 鹤峰县| 长沙县| 金平| 台山市| 谷城县| 康保县|