專利名稱:漢語語音數(shù)字化裝置的制作方法
技術(shù)領(lǐng)域:
本實用新型涉及漢語語音處理技術(shù)領(lǐng)域,具體為一種漢語語音數(shù)字化裝置。
背景技術(shù):
21世紀(jì)人類進入數(shù)字化時代,正向自動化的宏偉目標(biāo)前進。由于人腦與電腦的關(guān)系實質(zhì)是語音與數(shù)碼的關(guān)系,故語言與數(shù)字的轉(zhuǎn)換,成為當(dāng) 代科技發(fā)展的瓶頸。為了實現(xiàn)人機對話,就必須探索和謀求語言的數(shù)字化。專利號為ZL 2005 1 0020845 1. 8的發(fā)明專利“漢語語音編碼輸入法”將我國漢語的21個聲母和35個 韻母分別用十個阿拉伯?dāng)?shù)字來表示,這種編碼不用依靠拉丁字母,更加易學(xué)易記易掌握,不 認(rèn)識中國字的人只要會講漢語普通話,即可按讀音用數(shù)字輸入,有利于中文的識字學(xué)習(xí)。更 有利于加快中文編程、軟件漢化、文字識別、文字通訊、語音與文本的相互轉(zhuǎn)換等等工作的 進程。但用此法也必須操作數(shù)字鍵盤,目前尚未見直接將漢語語音轉(zhuǎn)換為數(shù)字的裝置。
實用新型內(nèi)容本實用新型的目的是設(shè)計一種漢語語音數(shù)字化裝置,直接將漢語語音轉(zhuǎn)換為數(shù)字 代碼。本實用新型設(shè)計的漢語語音數(shù)字化裝置,包括與計算機連接的聲碼器和調(diào)碼器, 計算機內(nèi)有與中央處理器相連接的暫存模塊、數(shù)字編碼存儲器。聲碼器為十個分別對上述十組聲母或韻母發(fā)音特點敏感的聲碼傳感器,調(diào)碼器為 四個對漢語語音的四個聲調(diào)敏感的調(diào)碼傳感器,即有對b、p、m、f敏感的聲碼傳感器I,對d、t、n、1敏感的聲碼傳感器II,對g、k、h敏感的聲碼傳感器III,對2、(、8、讓、(^、1~、吐敏感的聲碼傳感器IV,對j、q、x敏感的聲碼傳感器V,對 U、ua、uo> uai、uei、uan、uen、uang、ueng 敏感的聲碼傳感器 VI,對 i、ia> ie、iao> iou、ian> in、iang> ing、iong、yu> yue> yuan、yun 敏感白勺聲石馬傳 感器VII,對e、ei、en、eng敏感的聲碼傳感器VIII,對a、ai、ao、an、ang敏感的聲碼傳感器IX,對o、ou、ong敏感的聲碼傳感器X ;以及對陰平聲調(diào)敏感的調(diào)碼傳感器①,對陽平聲調(diào)敏感的調(diào)碼傳感器②,對上聲聲調(diào)敏感的調(diào)碼傳感器③,[0022]對去聲聲調(diào)敏感的調(diào)碼傳感器④。各聲碼傳感器和調(diào)碼傳感器接入計算機的暫存模塊。在接收漢語語音時,間隔分開的每個語音單元中的各單音的聲母和韻母發(fā)音特點 和聲調(diào)特點,聲碼傳感器I X中的某個和調(diào)碼傳感器① ④中的某個送出信號,對于單音 的單元聲碼傳感器I X中的某個和調(diào)碼傳感器① ④中的某個送出的信號到暫存模塊, 得到由該聲碼傳感器和調(diào)碼傳感器對應(yīng)的數(shù)字即得到該單音語音單元的數(shù)字編碼,由中央 處理器送入數(shù)字編碼存儲器。對于連續(xù)多個漢語語音單元中央處理器將連續(xù)得到的該語音 單元中各個語音信號的數(shù)字編碼依次按各音的聲碼在前、各音的調(diào)碼在后,組成該語音單 元的數(shù)字編碼送入數(shù)字編碼存儲器。計算機內(nèi)還有與中央處理器連接的漢語語音編碼數(shù)據(jù)庫,使本裝置成為語音漢字 錄入裝置。漢語語音數(shù)字編碼數(shù)據(jù)庫中每個漢語語音的編碼包括聲碼和調(diào)碼,用0至9十個阿拉伯?dāng)?shù)字作為聲碼,即1 b、p、m、f2 d、t、n、l3 g、k、h4 ζ、c、s、zh、ch、r、sh5 j、q、x6 u> ua> uo> uai> uei> uan> uen> uang> ueng7 i> ia> ie> iao> iou> ian> in> iang> ing> iong> yu> yue> yuan> yun8 e、ei、en、eng9 a、ai、ao、an、ang0 o、ou、ong陰平、陽平、上聲、去聲4種聲調(diào)分別用1至4四個阿拉伯?dāng)?shù)字作為調(diào)碼,即1 陰平2 陽平3 上聲4 去聲。每個漢語語音的編碼由一個聲碼和一個調(diào)碼組成。單個漢語語音、或多個漢語語音集裝的常用詞匯、短語作為一個單元語音集裝編 碼,同一單元的各漢語語音的聲碼順序在前、該單元的各漢語語音的調(diào)碼順序在后,組成詞 匯或短語的語音集裝編碼。計算機的中央處理器將數(shù)字編碼存儲器中的語音單元的數(shù)字編碼,和漢語語音編 碼數(shù)據(jù)庫所存的單個字、或多個字的常用詞匯、短語的數(shù)字代碼比較,得到該語音單元的數(shù) 字編碼對應(yīng)的漢字,即可確認(rèn),在屏幕顯示,或錄入到特定文件中。本實用新型漢語語音數(shù)字化裝置的優(yōu)點為1、漢語語音直接轉(zhuǎn)換為數(shù)字編碼,方 便快捷,便于進行語音漢字輸入;2、因漢語語音直接轉(zhuǎn)換為數(shù)字代碼,有利于計算機編程或 計算機控制等處理;如可用于對實用電器如冰箱、空調(diào)、電視機等的語音控制;3、以各漢語 語音或詞組短語的數(shù)字編碼為基礎(chǔ)可編制與多國文字語言相對照的國際詞庫。
圖1為本漢語語音數(shù)字化裝置實施例結(jié)構(gòu)框圖。
具體實施方式
本漢語語音數(shù)字化裝置實施例如圖1所示,包括計算機,還有與計算機連接的聲 碼器和調(diào)碼器,計算機內(nèi)有與中央處理器相連接的暫存模塊、數(shù)字編碼存儲器和漢語語音 編碼數(shù)據(jù)庫。聲碼器為十個分別對上述十組聲母或韻母發(fā)音特點敏感的聲碼傳感器,調(diào)碼器為 四個對漢語語音的四個聲調(diào)敏感的調(diào)碼傳感器,即有對b、p、m、f敏感的聲碼傳感器I,對d、t、n、1敏感的聲碼傳感器II,對g、k、h敏感的聲碼傳感器III,對z、c、s、zh、ch、r、sh敏感的聲碼傳感器IV,對j、q、x敏感的聲碼傳感器V,對 U、ua、uo> uai、uei、uan、uen、uang、ueng 敏感的聲碼傳感器 VI,對 i、ia> ie、iao> iou、ian> in、iang> ing、iong、yu> yue> yuan、yun 敏感白勺聲石馬傳 感器VII,對e、ei、en、eng敏感的聲碼傳感器VIII,對a、ai、ao、an、ang敏感的聲碼傳感器IX,對o、ou、ong敏感的聲碼傳感器X ;以及對陰平聲調(diào)敏感的調(diào)碼傳感器①,對陽平聲調(diào)敏感的調(diào)碼傳感器②,對上聲聲調(diào)敏感的調(diào)碼傳感器③,對去聲聲調(diào)敏感的調(diào)碼傳感器④。各聲碼傳感器和調(diào)碼傳感器接入計算機的暫存模塊。漢語語音數(shù)字編碼數(shù)據(jù)庫中每個字的編碼包括聲碼和調(diào)碼,用0至9十個阿拉伯?dāng)?shù)字作為聲碼,即1 b、p、m、f2 d、t、n、l3 g、k、h4 ζ、c、s、zh、ch、r、sh5 j、q、x6 u> ua> uo> uai> uei> uan> uen> uang> ueng7 i> ia> ie> iao> iou> ian> in> iang> ing> iong> yu> yue> yuan> yun8 e、ei、en、eng9 a、ai、ao、an、ang0 o、ou、ong[0078]陰平、陽平、上聲、去聲4種聲調(diào)分別用1至4四個阿拉伯?dāng)?shù)字作為調(diào)碼,即1 陰平2 陽平3 上聲4 去聲。每個字的編碼由一個聲碼和一個調(diào)碼組成。單個字、或多個字集裝的常用詞匯、短語作為一個單元編碼,各字的聲碼在前、各 字的調(diào)碼在后,組成詞匯或短語的編碼。本裝置要將語音“famingzhuanliheshi yongxlnxingzhuanli ”轉(zhuǎn)換為漢字錄入,輸 出時分為“ fami ngzhuanli heshi yongxlnxi ngzhuanli,,三個語音單元相互之間有間隔。發(fā)出“famingzhuanli ”的語音,依次聲碼傳感器I對噴發(fā)式發(fā)音f、m發(fā)出信號, 聲碼傳感器IV對阻擦式發(fā)音Zh發(fā)出信號,聲碼傳感器II對彈發(fā)式發(fā)音1發(fā)出信號,送入 暫存模塊,在此依次得到“Kmi ngzhuanli”的聲碼為1142 ;與此同時調(diào)碼傳感器①②①④ 依次對這4個音的聲調(diào)陰平,陽平,陰平,去聲發(fā)出相應(yīng)信號,送入暫存模塊,在此依次得到 調(diào)碼為1214。中央處理器提取暫存模塊聲碼和調(diào)碼,按聲碼在前、調(diào)碼在后順序排列,得到 “發(fā)明專利”的數(shù)字編碼11421214送入數(shù)字編碼存儲器?!癶6”只有單音,聲碼傳感器III對h發(fā)出相應(yīng)信號,調(diào)碼傳感器②對其聲調(diào)陰平發(fā) 出相應(yīng)信號送入暫存模塊,得到相應(yīng)的聲碼3和調(diào)碼2,中央處理器將“h6”的數(shù)字編碼32 送入數(shù)字編碼存儲器。同樣,可得到 “shiy6ngxlnxingzhu0nli” 的數(shù)字編碼為 475542241214。""Famingzhuanl iheshiyongxlnxingzhuanl i "數(shù)字編碼“11421214 32475542241214”存儲于數(shù)字編碼存儲器。中央處理器將該數(shù)字編碼與漢語語音編碼數(shù)據(jù)庫比較,因“11421214”對應(yīng)的4字 無重碼,直接得到其對應(yīng)的漢字“發(fā)明專利”,同樣“475542241114”對應(yīng)的6字也無重碼, 直接得到其對應(yīng)的漢字“實用新型專利”。數(shù)字編碼“32”對應(yīng)的常用漢字有和、何、合、盒、 禾、河、核、菏、涸、頌、閡、劾等十余個,中央處理器將前后三個單元同時考慮,其智能判斷該 單音單元的對應(yīng)的漢字為“和”。在漢語語音數(shù)字編碼數(shù)據(jù)庫內(nèi)對多個重音字設(shè)定其中最常用的單個字為單字編 碼,其它的同音字均設(shè)定只在集裝的詞匯中出現(xiàn)。本例中只有“和”為單個語音的漢字。或者,在漢語語音數(shù)字編碼數(shù)據(jù)庫內(nèi)對于重音的不同漢字,存儲有以包括該字組 成的詞匯或者以該字字形說明語音與漢字關(guān)系的集裝名,在語音輸入有重音字的單個語音 時,間隔后補讀該字的集裝名,由此確定該代碼對應(yīng)的漢字?!昂汀钡募b名為“和平的和”本裝置將語音“ fami ngzhuanli heshi yongxlnxi ngzhuanli ”轉(zhuǎn)換為漢字“發(fā)明專利 和實用新型專利”在顯示屏顯示,確認(rèn)后在相關(guān)文件中錄入。因為本漢語語音編碼數(shù)據(jù)庫中有大量4字或4字以上的詞組或短語,基本沒有重 碼,單音大多只是連詞,故中央處理器的智能判斷根據(jù)前后詞組能準(zhǔn)確得到單音對應(yīng)的漢 字,而極少誤碼。本裝置可安裝于實用電器如冰箱、空調(diào)、電視機、計算器等,即可實現(xiàn)語音控制。 如安裝了本裝置的電視機選臺時,可直接講“ zhdngytog y t<5 i ”、“ zhdngytog wiitcS i ”、"fenghuang WisM ”等等,本裝置的中央處理器可將語音轉(zhuǎn)換為數(shù)字編碼47721112, 47621132、13644244,數(shù)字編碼直接用于控制電視機的接收頻率,實現(xiàn)語音控制電視機換 臺為中央一臺、中央五臺或鳳凰衛(wèi)視等等。計算器上安裝本裝置即可成為口令式計算器, 只要講“s0nshiwiiCh6ngyi liii”(三十五乘以六),本裝置將其轉(zhuǎn)為數(shù)字編碼446123 4723 24——其中“乘以”可設(shè)為一個雙音集裝單元——顯示器上即可出現(xiàn)結(jié)果“210”。 上述實施例,僅為對本實用新型的目的、技術(shù)方案和有益效果進一步詳細(xì)說明的 具體個例,本實用新型并非限定于此。凡在本實用新型的公開的范圍之內(nèi)所做的任何修改、 等同替換、改進等,均包含在本實用新型的保護范圍之內(nèi)。
權(quán)利要求漢語語音數(shù)字化裝置,包括計算機,其特征在于還包括有與計算機連接的聲碼器和調(diào)碼器,計算機內(nèi)有與中央處理器相連接的暫存模塊、數(shù)字編碼存儲器;聲碼器為十個分別對十組聲母或韻母發(fā)音特點敏感的聲碼傳感器,調(diào)碼器為四個對漢語語音的四個聲調(diào)敏感的調(diào)碼傳感器,即有對b、p、m、f敏感的聲碼傳感器I,對d、t、n、l敏感的聲碼傳感器II,對g、k、h敏感的聲碼傳感器III,對z、c、s、zh、ch、r、sh敏感的聲碼傳感器IV,對j、q、x敏感的聲碼傳感器V,對u、ua、uo、uai、uei、uan、uen、uang、ueng敏感的聲碼傳感器VI,對i、ia、ie、iao、iou、ian、in、iang、ing、iong、yu、yue、yuan、yun敏感的聲碼傳感器VII,對e、ei、en、eng敏感的聲碼傳感器VIII,對a、ai、ao、an、ang敏感的聲碼傳感器IX,對o、ou、ong敏感的聲碼傳感器X;以及對陰平聲調(diào)敏感的調(diào)碼傳感器①,對陽平聲調(diào)敏感的調(diào)碼傳感器②,對上聲聲調(diào)敏感的調(diào)碼傳感器③,對去聲聲調(diào)敏感的調(diào)碼傳感器④;各聲碼傳感器和調(diào)碼傳感器接入計算機的暫存模塊;所述計算機內(nèi)還有與中央處理器連接的漢語語音編碼數(shù)據(jù)庫,該庫中每個字的編碼包括聲碼和調(diào)碼,用0至9十個阿拉伯?dāng)?shù)字作為聲碼,即1b、p、m、f2d、t、n、l3g、k、h4z、c、s、zh、ch、r、sh 5j、q、x6u、ua、uo、uai、uei、uan、uen、uang、ueng7i、ia、ie、iao、iou、ian、in、iang、ing、iong、yu、yue、yuan、yun8e、ei、en、eng9a、ai、ao、an、ang0o、ou、ong陰平、陽平、上聲、去聲4種聲調(diào)分別用1至4四個阿拉伯?dāng)?shù)字作為調(diào)碼,即1陰平2陽平3上聲4去聲每個字的編碼由一個聲碼和一個調(diào)碼組成;單個字或多個字集裝的常用詞匯、短語作為一個單元編碼,各字的聲碼在前、各字的調(diào)碼在后,組成詞匯或短語的編碼。
2.根據(jù)權(quán)利要求1所述的漢語語音數(shù)字化裝置,其特征在于在漢語語音數(shù)字編碼數(shù)據(jù)庫內(nèi)對多個重音字設(shè)定其中最常用的單個字為單字編碼,其 它的同音字均設(shè)定只在集裝的詞匯中出現(xiàn)。
3.根據(jù)權(quán)利要求1所述的漢語語音數(shù)字化裝置,其特征在于在漢語語音數(shù)字編碼數(shù)據(jù)庫內(nèi)對于重音的不同漢字,存儲有以包括該字組成的詞匯或 者以該字字形說明語音與漢字關(guān)系的集裝名。
專利摘要本實用新型為漢語語音數(shù)字化裝置,本裝置包括與計算機連接的聲碼器和調(diào)碼器,計算機內(nèi)有與中央處理器相連接的暫存模塊、數(shù)字編碼存儲器。聲碼器為十個聲碼傳感器,調(diào)碼器為四個調(diào)碼傳感器,各接入計算機的暫存模塊。每個語音編碼為一個聲碼和一個調(diào)碼,聲碼為0-9的數(shù)字,調(diào)碼為1-4的數(shù)字。詞匯短語作為單元編碼,各單元編碼的各音聲碼在前調(diào)碼在后。語音輸入時,語音單元之間有間隔,聲碼傳感器和調(diào)碼傳感器在接收一個語音單元時,對各音送出特定信號,得到各音的聲碼和調(diào)碼,從而得到該單元的數(shù)字編碼。計算機內(nèi)還有漢語語音編碼數(shù)據(jù)庫,可將語音數(shù)字編碼轉(zhuǎn)為漢字錄入。本裝置將漢語語音直接轉(zhuǎn)換為數(shù)字編碼,方便快捷,利于計算機處理。
文檔編號G06F17/28GK201732370SQ200920141310
公開日2011年2月2日 申請日期2009年9月11日 優(yōu)先權(quán)日2009年9月11日
發(fā)明者潘昌仁 申請人:潘昌仁;閆俊峰