專利名稱:語音識(shí)別裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語音識(shí)別裝置以及存儲(chǔ)有用于實(shí)現(xiàn)該語音識(shí)別裝置的計(jì) 算機(jī)程序的存儲(chǔ)產(chǎn)品,該語音識(shí)別裝置用于按發(fā)音單元識(shí)別基于發(fā)聲法 的語音數(shù)據(jù),參照存儲(chǔ)有多個(gè)具有一個(gè)或多個(gè)發(fā)音單元的短語的短語數(shù) 據(jù)庫,比較按發(fā)音單元識(shí)別的結(jié)果與存儲(chǔ)在短語數(shù)據(jù)庫中的短語,并且 識(shí)別所述語音數(shù)據(jù)中包括的由一個(gè)或多個(gè)發(fā)音單元組成的短語。
背景技術(shù):
語音識(shí)別處理已經(jīng)付諸于實(shí)際的應(yīng)用,用于針對(duì)基于說話者產(chǎn)生的 語音的語音數(shù)據(jù)而生成基于發(fā)聲內(nèi)容的文本數(shù)據(jù)。該語音識(shí)別處理生成 的文本數(shù)據(jù)實(shí)際用于各種應(yīng)用,舉例來說,如在呼叫中心記錄對(duì)話內(nèi)容 的語音打字處理。文本數(shù)據(jù)也可以按詞單元生成,且例如用作在呼叫中 心處總結(jié)對(duì)話內(nèi)容的關(guān)鍵詞,從而進(jìn)一步用于檢索相關(guān)內(nèi)容。
在語音識(shí)別處理中,在通過分析基于發(fā)聲法的語音數(shù)據(jù)而獲得的特 征量的基礎(chǔ)上,按發(fā)音單元如音節(jié)識(shí)別語音,并且例如,在諸如詞辨別
(Word Spotting)的方法中,通過參照列出短語的詞典執(zhí)行匹配操作,把 語音識(shí)別為詞典中列出的短語。例如,作為提高識(shí)別率的方法,在日本 特開專利公報(bào)No.ll-7292中公開了增加詞匯的技術(shù)。
發(fā)明內(nèi)容
因此,本發(fā)明的一個(gè)目的是提供一種能夠減少基于由少量音節(jié)組成 的短語的誤識(shí)別的語音識(shí)別裝置。
根據(jù)本發(fā)明的一個(gè)方面,提供一種語音識(shí)別裝置,其用于執(zhí)行按發(fā) 音單元識(shí)別基于發(fā)聲法的語音數(shù)據(jù)的第一識(shí)別處理,參照存儲(chǔ)有多個(gè)由 一個(gè)或多個(gè)發(fā)音單元組成的短語的短語數(shù)據(jù)庫,將該第一識(shí)別處理的結(jié)果與該短語數(shù)據(jù)庫中存儲(chǔ)的短語進(jìn)行比較,并且執(zhí)行識(shí)別所述語音數(shù)據(jù) 中包括的由一個(gè)或多個(gè)發(fā)音單元組成的短語的第二識(shí)別處理。該語音識(shí) 別裝置包括優(yōu)先級(jí)識(shí)別部,該優(yōu)先級(jí)識(shí)別部用于將該第一識(shí)別處理的結(jié) 果與通過在存儲(chǔ)在該短語數(shù)據(jù)庫中的相應(yīng)短語之前和/或之后添加附加短 語而獲得的多個(gè)擴(kuò)展短語進(jìn)行比較,以優(yōu)先于該第二識(shí)別處理,識(shí)別包 括在該語音數(shù)據(jù)中的擴(kuò)展短語。
圖1A、 1B和1C是用于概念性地示出語音識(shí)別處理中的誤識(shí)別的示 例的說明圖2是用于示出根據(jù)一個(gè)實(shí)施方式的語音識(shí)別裝置的配置的框圖3是用于概念性地示出根據(jù)該實(shí)施方式的語音識(shí)別裝置中設(shè)置的 詞形變化(conjugation)詞典數(shù)據(jù)庫的存儲(chǔ)內(nèi)容的說明圖4是用于概念性地示出根據(jù)該實(shí)施方式的語音識(shí)別裝置中設(shè)置的 同現(xiàn)詞典數(shù)據(jù)庫的存儲(chǔ)內(nèi)容的說明圖5是用于示出根據(jù)該實(shí)施方式的語音識(shí)別裝置的語音識(shí)別處理的 操作流程;
圖6是用于示出根據(jù)該實(shí)施方式的語音識(shí)別裝置的短語擴(kuò)展處理的 操作流程;
圖7是用于概念性地示出根據(jù)該實(shí)施方式的語音識(shí)別裝置的短語擴(kuò) 展處理的直方圖8A、 8B、 8C和8D是用于概念性地示出根據(jù)該實(shí)施方式的語音識(shí) 別裝置在英語識(shí)別中的應(yīng)用示例的說明圖;以及
圖9A、 9B、 9C和9D是用于概念性地示出根據(jù)該實(shí)施方式的語音識(shí) 別裝置在漢語識(shí)別中的應(yīng)用示例的說明圖。
具體實(shí)施例方式
在語音識(shí)別處理中,在通過分析基于發(fā)聲法的語音數(shù)據(jù)而獲得的特 征量的基礎(chǔ)上,按發(fā)音單元如音節(jié)識(shí)別語音,并且例如,在諸如詞辨別的方法中,通過參照列出短語的詞典執(zhí)行匹配操作,把語音識(shí)別為詞典
中列出的短語。
然而,存在這樣的問題,S卩,在按發(fā)音單元的識(shí)別之后,在參照詞 典執(zhí)行匹配操作的階段,基于詞典中列出的由少量音節(jié)組成的單詞的不
恰當(dāng)匹配可能導(dǎo)致誤識(shí)別。
圖1A、 1B和1C是用于概念性地示出語音識(shí)別處理中的誤識(shí)別的示 例的說明圖。圖1A示出了 "選択"C t《L、 地域i。5 —番目o 文 字力;消無4 。、 o "C 先 進(jìn)^)《(/、(讀音sentakudekinai tiikitoiu itibanmeno mojiga kienainode sakie susumenai)"的聲音內(nèi)容的不例。圖1B 示出了按發(fā)音單元對(duì)圖1A中的聲音內(nèi)容進(jìn)行識(shí)別的結(jié)果,通過識(shí)別處理 3;《尋了 "廿& t 〈 "C告《^ ^ iz、 § i ^ , 1/、勾or九灼0 i i;力、'§ i《L、
0"C各色夂十十灼^t/、 (i賣音 sentakudekinaitiikitoiuitibanmenomojigakienainodesakiesusumenai)"。圖1C
示出了用于語音識(shí)別的詞典。該詞典列出了諸如發(fā)音為"iti"的數(shù)字"一" 和發(fā)音為"kie"的"消^"這樣的短語。當(dāng)使用圖1C中所示的詞典執(zhí)行對(duì) 圖1B中的聲音內(nèi)容的識(shí)別處理時(shí),發(fā)生誤識(shí)別,即,不僅包括在"。6 (讀音:itiba誕)"中的"H (讀音:iti)"而且包括在""
,二 < "C $ & u ^ u § (讀音sentakudekinaitiiki)"中的"。、6 (讀音 iti)"被識(shí)別為數(shù)字"一"。類似地,出現(xiàn)如下問題,即,不僅""力;嘗 元& L、(讀音mojigakienai)"中的"S ;i (讀音kie)"而且嘗i t W"、(讀音:sakiesus畫nai)"中的"差無(讀音:kie)"被誤識(shí) 別為短語"消無"。如圖1A、 1B和1C中所例示的,常規(guī)語音識(shí)別處理 具有這樣的問題,即,少量音節(jié)組成的詞往往導(dǎo)致誤識(shí)別。盡管在日本 特開專利公報(bào)No.ll-7292中公開了通過增加詞匯來提高識(shí)別率的技術(shù), 但難以通過該技術(shù)消除誤識(shí)別,因?yàn)樯倭恳艄?jié)組成的詞仍然存在。
在對(duì)英語的語音識(shí)別處理的情況下,其中例如發(fā)音單元是由發(fā)音符 號(hào)表示的單元,應(yīng)當(dāng)注意,也可能導(dǎo)致誤識(shí)別,例如把詞"wonderful" 的頭部識(shí)別為詞"one"。
而且,當(dāng)說話者的發(fā)音不清晰時(shí),可能導(dǎo)致誤識(shí)別,例如在識(shí)別"。W/u (一番)(讀音:itiban)"中的 ^ (一)(讀音:iti)"時(shí),把 "、(讀音:i)"識(shí)別為"(讀音:mi)",且把""(一)(讀音:
iti)"識(shí)別為^ (道)(讀音miti)"。
對(duì)通過使用擴(kuò)展短語數(shù)據(jù)庫與多個(gè)擴(kuò)展短語進(jìn)行匹配的識(shí)別處理給 予優(yōu)先級(jí),該擴(kuò)展短語數(shù)據(jù)庫存儲(chǔ)通過在用于存儲(chǔ)諸如詞這樣的短語的 短語數(shù)據(jù)庫中存儲(chǔ)的相應(yīng)短語之前和/或之后添加附加短語而獲得的擴(kuò)展 短語。以這種方式,因?yàn)橄鄬?duì)于與由少量音節(jié)組成的短語的匹配,對(duì)與 具有較大數(shù)目音節(jié)的擴(kuò)展短語的匹配給予優(yōu)先級(jí),所以可以減少基于由 少量音節(jié)組成的短語的誤識(shí)別,例如,把色"。、^ L、 S ("C S & 。
地域)(讀音dekinaitiiki)"中的"L、 6 (讀音iti)"識(shí)別為"^ ^ (一) (讀音iti)"的誤識(shí)別,或者把"、6ti'^ (—番)(讀音itiban)"中
的"、6 (一)(讀音:iti)"識(shí)別為""(道)"的誤識(shí)別。
下面的描述將參照附圖詳細(xì)解釋實(shí)施方式。圖2是用于示出根據(jù)一 個(gè)實(shí)施方式的語音識(shí)別裝置的配置的框圖。圖2中以1標(biāo)出根據(jù)該實(shí)施 方式的語音識(shí)別裝置,其中使用了計(jì)算機(jī)。語音識(shí)別裝置1包括控制
部10,如CPU,其用于控制整個(gè)裝置;輔助存儲(chǔ)部ll,如CDROM驅(qū) 動(dòng)器,其用于從諸如CD-ROM的存儲(chǔ)器產(chǎn)品讀取各種信息,所述存儲(chǔ)器 產(chǎn)品存儲(chǔ)諸如數(shù)據(jù)的各種信息和諸如根據(jù)該實(shí)施方式的計(jì)算機(jī)程序100 的程序;存儲(chǔ)部12,如硬盤,其存儲(chǔ)由輔助存儲(chǔ)部ll讀取的各種信息; 以及存儲(chǔ)器部13,如RAM,其用于存儲(chǔ)生成的臨時(shí)信息。當(dāng)控制部10 使存儲(chǔ)器部13存儲(chǔ)被存儲(chǔ)在存儲(chǔ)部12中的計(jì)算機(jī)程序100且執(zhí)行計(jì)算 機(jī)程序100時(shí),計(jì)算機(jī)操作為根據(jù)本實(shí)施方式的語音識(shí)別裝置1。應(yīng)當(dāng)注 意,盡管控制部IO可以由單個(gè)CPU組成,但當(dāng)控制部IO包括用于執(zhí)行 與語音相關(guān)的各種處理的諸如DSP的子處理器時(shí),可以加速處理。
該語音識(shí)別裝置1還包括聲音接收部14,如麥克風(fēng),其用于接收 說話者發(fā)出的聲音;聲學(xué)處理部15,其用于對(duì)聲音接收部14接收的語音 執(zhí)行各種處理;操作部16,如鼠標(biāo)或鍵盤;輸出部17,如監(jiān)視器或揚(yáng)聲 器;以及通信部18,其要與諸如因特網(wǎng)的通信網(wǎng)絡(luò)連接。該聲學(xué)處理部 15包括增益放大器,其用于放大聲音接收部14接收的聲音;A/D轉(zhuǎn)換器電路,其用于將放大的聲音信號(hào)轉(zhuǎn)換成數(shù)字信號(hào);以及控制電路,如
數(shù)字信號(hào)處理器(DSP),其用于對(duì)語音信號(hào)(為數(shù)字信號(hào))執(zhí)行各種聲
學(xué)處理。
根據(jù)本實(shí)施方式的語音識(shí)別裝置1的存儲(chǔ)部12的存儲(chǔ)區(qū)域的一部分 用作各種數(shù)據(jù)庫,如聲學(xué)模型數(shù)據(jù)庫(聲學(xué)模型DB) 120,其用于以 發(fā)音單元如音節(jié)存儲(chǔ)表示語音數(shù)據(jù)特征的特征量,作為聲學(xué)模型;短語 數(shù)據(jù)庫(短語DB) 121,其用于存儲(chǔ)多個(gè)由一個(gè)或多個(gè)發(fā)音單元組成的 短語;以及擴(kuò)展短語數(shù)據(jù)庫(擴(kuò)展短語DB) 122,其用于存儲(chǔ)通過擴(kuò)展 短語數(shù)據(jù)庫121中存儲(chǔ)的相應(yīng)短語而獲得的多個(gè)擴(kuò)展短語;匹配數(shù)據(jù)庫 (匹配DB) 123,其用于存儲(chǔ)要用于匹配的短語和擴(kuò)展短語;以及識(shí)別 結(jié)果數(shù)據(jù)庫(識(shí)別結(jié)果DB) 124,其用于存儲(chǔ)對(duì)語音數(shù)據(jù)的語音識(shí)別處 理的結(jié)果。
短語數(shù)據(jù)庫121是在語音識(shí)別處理中用作詞典的數(shù)據(jù)庫,并且以相 互關(guān)聯(lián)的方式存儲(chǔ)日語中由一個(gè)或多個(gè)發(fā)音單元組成的"讀音"和"寫 法"。在日語的情況下,發(fā)音單元等于音節(jié)。例如,短語數(shù)據(jù)庫121以相 互關(guān)聯(lián)的方式存儲(chǔ)由一個(gè)發(fā)音單元組成的讀音"i"和寫法"胃"。短語數(shù) 據(jù)庫121還以相互關(guān)聯(lián)的方式存儲(chǔ)由兩個(gè)發(fā)音單元組成的讀音"iti"和寫 法"一"。例如,短語數(shù)據(jù)庫121還以相互關(guān)聯(lián)的方式存儲(chǔ)讀音"kie"和 寫法"消無"。
擴(kuò)展短語數(shù)據(jù)庫122是存儲(chǔ)通過在存儲(chǔ)在短語數(shù)據(jù)庫121中的相應(yīng) 短語之前和/或之后添加附加短語而獲得的擴(kuò)展短語的數(shù)據(jù)庫,并且包括 諸如詞形變化詞典數(shù)據(jù)庫1220和同現(xiàn)詞典數(shù)據(jù)庫1221的數(shù)據(jù)庫。應(yīng)當(dāng) 注意,擴(kuò)展短語數(shù)據(jù)庫122可以不分成諸如詞形變化詞典數(shù)據(jù)庫1220和 同現(xiàn)詞典數(shù)據(jù)庫1221的多個(gè)數(shù)據(jù)庫,而是構(gòu)建為一個(gè)數(shù)據(jù)庫或詳細(xì)分類 的多個(gè)數(shù)據(jù)庫。
圖3是用于概念性示出根據(jù)本實(shí)施方式的語音識(shí)別裝置1中設(shè)置的 詞形變化詞典數(shù)據(jù)庫1220的存儲(chǔ)內(nèi)容的說明圖。詞形變化詞典數(shù)據(jù)庫 1220是用于存儲(chǔ)通過向作為存儲(chǔ)在短語數(shù)據(jù)庫121中的相應(yīng)短語的多個(gè) 詞干添加作為附加短語的后綴而獲得的擴(kuò)展短語的數(shù)據(jù)庫。圖3中所示的示例中存儲(chǔ)的是擴(kuò)展短語的讀音和寫法,所述擴(kuò)展短語例如為通過向 作為短語數(shù)據(jù)庫121中存儲(chǔ)的具有讀音"kie"和寫法"消允"的短語的 詞干"消九"添加作為附加短語的后綴如"& ^ ,,、"法卞"和"3"而
獲得的"消無^ L、(讀音:kienai)"、"消"寸(讀音:kiemasu)"和 "消無3 (讀音kieru)"。詞形變化詞典數(shù)據(jù)庫1220還存儲(chǔ)諸如口語 表達(dá)"消A 6々,/二 (讀音kietyatta)"的擴(kuò)展短語。詞形變化詞典數(shù) 據(jù)庫1220還存儲(chǔ)通過向短語"消無"添加作為附加短語的空字符(空格) 而獲得的擴(kuò)展短語"消無一"。這是為了即便對(duì)于排除后綴的短語"消無 (讀音kie)"的發(fā)音,也能夠?qū)崿F(xiàn)使得使用詞形變化詞典數(shù)據(jù)庫1220 的識(shí)別處理。應(yīng)當(dāng)注意,盡管圖3示出了在詞干后面添加后綴作為附加 短語的示例,但也可以在詞干前面添加前綴作為附加短語。
圖4是用于概念性示出根據(jù)本實(shí)施方式的語音識(shí)別裝置1中設(shè)置的 同現(xiàn)詞典數(shù)據(jù)庫1221的存儲(chǔ)內(nèi)容的說明圖。同現(xiàn)詞典數(shù)據(jù)庫1221是用 于存儲(chǔ)在分別通過在存儲(chǔ)在短語數(shù)據(jù)庫121中的相應(yīng)短語之前和/或之后 添加附加短語而獲得的擴(kuò)展短語中,針對(duì)排除了附加短語的相應(yīng)短語具 有高同現(xiàn)概率的多個(gè)短語的數(shù)據(jù)庫。在圖4所示的示例中,針對(duì)存儲(chǔ)在 短語數(shù)據(jù)庫121的具有讀音"iti"和寫法"一"短語,存儲(chǔ)了諸如"一番 (讀音:itiban)"、"一番目(讀音:itibanme)"、"一枚(讀音:itimai)"、 "一時(shí)(讀音:itiji)"、"朝一 (讀音:asaiti)"和"晝一 (讀音:hiruiti)" 的擴(kuò)展短語的讀音和寫法。
匹配數(shù)據(jù)庫123是其中把短語數(shù)據(jù)庫121的存儲(chǔ)內(nèi)容的一部分的短 語替換為擴(kuò)展短語數(shù)據(jù)庫122中存儲(chǔ)的擴(kuò)展短語的數(shù)據(jù)庫。例如,存儲(chǔ) 在短語數(shù)據(jù)庫121中的將讀音"kie"與寫法"消A "相關(guān)聯(lián)的記錄被替 換為將諸如"kienai"、 "ki函su"和"kieru"的讀音與諸如"消無4' t、"、 "消義主亍"和"消A 3"的寫法相關(guān)聯(lián)的記錄。
接下來,將解釋根據(jù)本實(shí)施方式的語音識(shí)別裝置1的處理。根據(jù)本 實(shí)施方式的語音識(shí)別裝置1使用控制部IO執(zhí)行計(jì)算機(jī)程序100以生成用 于執(zhí)行各種處理(如用于擴(kuò)展短語的短語擴(kuò)展處理和用于基于擴(kuò)展短語 識(shí)別語音的語音識(shí)別處理)的各種程序模塊,并且使用各種程序模塊的功能執(zhí)行下面將要解釋的各種處理。
圖5是用于示出根據(jù)本實(shí)施方式的語音識(shí)別裝置1的語音識(shí)別處理 的操作流程。在用于執(zhí)行計(jì)算機(jī)程序100的控制部10的控制下,語音識(shí)
別裝置1在聲音接收部14處接收說話者產(chǎn)生的語音(S101)。語音識(shí)別 裝置1使用聲學(xué)處理部15放大基于接收到的聲音的模擬信號(hào),并且進(jìn)一 步將該模擬信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)以生成語音數(shù)據(jù)(S102)。
語音識(shí)別裝置1在控制部10的控制下從通過聲學(xué)處理部15的處理 而生成的語音數(shù)據(jù)生成具有預(yù)定時(shí)間長(zhǎng)度的多個(gè)幀。語音識(shí)別裝置1將 以幀為單位的生成語音數(shù)據(jù)(時(shí)間軸上的信號(hào))轉(zhuǎn)換成頻譜(頻率軸上 的信號(hào))。語音識(shí)別裝置1從通過轉(zhuǎn)換獲得的頻譜提取特征量,如功率、 節(jié)距和倒譜,并且將提取的特征量與存儲(chǔ)在聲學(xué)模型數(shù)據(jù)庫120中的聲 學(xué)模型進(jìn)行比較,從而對(duì)語音數(shù)據(jù)按發(fā)音單元執(zhí)行識(shí)別處理(S103)。操 作S103中的按發(fā)音單元的識(shí)別處理是按諸如音節(jié)的發(fā)音單元識(shí)別語音數(shù) 據(jù)的處理。例如,該處理用于識(shí)別表示話者產(chǎn)生的聲音內(nèi)容"選択f多 & L、地域t L、》 一番目O文字力;消A & L、 O f先 進(jìn)灼& L、"的語音數(shù)
據(jù)的發(fā)音內(nèi)容"甘九〈含《^ 6 iz、 § i, l、 ^s' &灼o 6 i;力;§
i & 。 o d s i t十灼& u "。所述識(shí)別處理能夠看作對(duì)存儲(chǔ)在諸如短
語數(shù)據(jù)庫121、擴(kuò)展短語數(shù)據(jù)庫122和匹配數(shù)據(jù)庫123這樣的數(shù)據(jù)庫中的 讀音的識(shí)別。應(yīng)當(dāng)注意,基于特征量的語音部分檢測(cè)處理作為操作S103 中的識(shí)別處理的預(yù)處理而執(zhí)行。該語音部分檢測(cè)處理是用于從語音數(shù)據(jù) 檢測(cè)包括語音的幀的處理。通過僅對(duì)在語音部分檢測(cè)處理中檢測(cè)到包括 語音的部分中的語音數(shù)據(jù)執(zhí)行識(shí)別處理,可以防止在不包括語音的噪聲 部分中誤識(shí)別出語音。
語音識(shí)別裝置1然后在控制部10的控制下比較發(fā)音單元中的語音數(shù) 據(jù)(操作S103中的識(shí)別處理的結(jié)果)與存儲(chǔ)在匹配數(shù)據(jù)庫123中的擴(kuò)展 短語和短語,以執(zhí)行用于識(shí)別包括在語音數(shù)據(jù)中的擴(kuò)展短語和短語的識(shí) 別處理(S04)。操作S104中的識(shí)別處理是用于在發(fā)音單元中的語音數(shù)據(jù) 中識(shí)別一個(gè)或多個(gè)與所述擴(kuò)展短語和所述短語中的任一個(gè)相匹配的發(fā)音 單元串的處理,作為匹配的擴(kuò)展短語或匹配短語。例如,對(duì)發(fā)音單元"廿t < T t & L、 6 t/、 3 t 1/、 3 ^ 6 灼O 6 ^力、'§無& </、 O "C § § A
t 卞 的 & L、 ( 讀 音
sentakudekinait':ikitoiuitibanmenomojigakienainodesakiesusumenai)"中的語
音數(shù)據(jù)執(zhí)行識(shí)別處理,以把發(fā)音單元串"L、 6 九灼(itibanme)"識(shí)別 為"一番目"且把發(fā)音單元串"t無^ ^ (kienai)"識(shí)別為"消無^ 。"。 因?yàn)轭A(yù)先用擴(kuò)展短語代替特定短語,所以根據(jù)本實(shí)施方式的語音識(shí)別裝 置1例如可以消除把發(fā)音單元串"T S "、"、香(dekinaitiiki)"識(shí)別 為"t: S & — ^ S "的誤識(shí)別和把發(fā)音單元串"$多A t十灼4 l、 (sakiesusumenai)"識(shí)別為"$消A t十& & L、"的誤識(shí)別。應(yīng)當(dāng)注意, 當(dāng)使用擴(kuò)展短語識(shí)別發(fā)音單元中的語音數(shù)據(jù)時(shí),語音數(shù)據(jù)可以被識(shí)別為 不包括擴(kuò)展短語的短語的一部分的識(shí)別結(jié)果,或者被識(shí)別為擴(kuò)展短語的 識(shí)別結(jié)果。具體而言,當(dāng)"、6^i灼(itibanme)"被識(shí)別為"一番目" 時(shí),"u 6 Uf九(itibanme)"的部分"。6 (iti)"可能被識(shí)別為"一番 目"中的"一"或者"。6凡灼(itibanme)"可以被識(shí)別為"一番目"。
在操作S104中,匹配數(shù)據(jù)庫123是存儲(chǔ)通過用擴(kuò)展短語代替存儲(chǔ)在 短語數(shù)據(jù)庫121中的相應(yīng)短語的一部分而獲得的短語的數(shù)據(jù)庫。因而, 操作S104中的匹配處理是優(yōu)先于與短語數(shù)據(jù)庫121中存儲(chǔ)的短語進(jìn)行匹 配的識(shí)別處理,而通過與擴(kuò)展短語數(shù)據(jù)庫122中存儲(chǔ)的擴(kuò)展短語進(jìn)行匹 配來執(zhí)行識(shí)別處理的識(shí)別處理。因此,操作S104中的識(shí)別處理可以被發(fā) 展為各種方法,如不使用匹配數(shù)據(jù)庫123,在執(zhí)行與擴(kuò)展短語數(shù)據(jù)庫122 中存儲(chǔ)的擴(kuò)展短語中用于匹配的擴(kuò)展短語進(jìn)行匹配的識(shí)別處理之后,執(zhí) 行與存儲(chǔ)在短語數(shù)據(jù)庫121中的短語進(jìn)行匹配的識(shí)別處理。如上所述, 通過對(duì)基于擴(kuò)展短語的識(shí)別處理給予優(yōu)先級(jí),根據(jù)本發(fā)明的語音識(shí)別裝 置1可以消除基于由少量發(fā)音單元組成的短語的誤識(shí)別。
在操作S104的識(shí)別處理中,計(jì)算表示語音數(shù)據(jù)與任一擴(kuò)展短語之間 的相似度的分?jǐn)?shù),且當(dāng)計(jì)算的分?jǐn)?shù)大于或等于預(yù)定值時(shí),判斷發(fā)音單元 中的語音數(shù)據(jù)和擴(kuò)展短語匹配。通過預(yù)定方法,獲得作為語音數(shù)據(jù)匹配 對(duì)象的部分處的特征量和與擴(kuò)展短語相關(guān)的聲學(xué)模型的特征量之間的相 似度,來計(jì)算表示相似度的分?jǐn)?shù)。應(yīng)當(dāng)注意,并不是簡(jiǎn)單地通過比較語音數(shù)據(jù)的特征量和與擴(kuò)展短語相關(guān)的聲學(xué)模型的特征量,而是通過針對(duì) 短語與組成擴(kuò)展短語的附加短語,單獨(dú)獲得語音數(shù)據(jù)和對(duì)應(yīng)于短語的部 分(例如,對(duì)應(yīng)于詞干的部分)之間的相似度,以及語音數(shù)據(jù)和對(duì)應(yīng)于 附加短語的部分(例如,對(duì)應(yīng)于后綴的部分)之間的相似度,且對(duì)分別 獲得的相似度求和,來計(jì)算整體相似度。在這種情況下,可以通過加權(quán) 或關(guān)注與對(duì)應(yīng)于詞干的部分相關(guān)的相似度來計(jì)算整體相似度。通過使用 加權(quán)來計(jì)算相似度,可以執(zhí)行強(qiáng)調(diào)與排除附加短語的原始短語的匹配程 度的識(shí)別處理。
語音識(shí)別裝置1然后在控制單元10的控制下把操作S104中的識(shí)別 處理的結(jié)果存儲(chǔ)在識(shí)別結(jié)果數(shù)據(jù)庫124中,并且經(jīng)由輸出部17輸出識(shí)別 處理的結(jié)果(S105)。以這種方式執(zhí)行語音識(shí)別處理。
圖6是用于示出根據(jù)本實(shí)施方式的語音識(shí)別裝置1的短語擴(kuò)展處理 的操作流程。在短語擴(kuò)展處理中,例如,基于在語音識(shí)別處理的操作S103 中識(shí)別的發(fā)音單元中的語音數(shù)據(jù)來擴(kuò)展短語。語音識(shí)別裝置1在用于執(zhí) 行計(jì)算機(jī)程序100的控制部10的控制下,比較在語音識(shí)別處理中識(shí)別的 發(fā)音單元中的語音數(shù)據(jù)和存儲(chǔ)在短語數(shù)據(jù)庫121中的短語,并且執(zhí)行用 于識(shí)別語音數(shù)據(jù)中包括的短語的識(shí)別處理(S201)。
在控制部10的控制下,語音識(shí)別裝置1針對(duì)每個(gè)發(fā)音單元數(shù),計(jì)算 與存儲(chǔ)在短語數(shù)據(jù)庫121中的任一短語匹配的短語的總數(shù)(S202)。語音 識(shí)別單元1把所計(jì)算的短語數(shù)目超過預(yù)定值的發(fā)音單元數(shù)設(shè)置為擴(kuò)展基 準(zhǔn)值,該擴(kuò)展基準(zhǔn)值成為提取擴(kuò)展短語的基準(zhǔn)(S203)。設(shè)置的擴(kuò)展基準(zhǔn) 值被存儲(chǔ)在存儲(chǔ)部12中。
下面的描述將詳細(xì)解釋操作S202和S203中的處理。圖7是用于概 念性地示出根據(jù)本實(shí)施方式的語音識(shí)別裝置1的短語擴(kuò)展處理的直方圖。 圖7中例示的直方圖示出了發(fā)音單元數(shù)(在橫軸上示出)與針對(duì)每個(gè)發(fā) 音單元數(shù)的短語總數(shù)(即,發(fā)生頻率)(在縱軸上示出)之間的關(guān)系。艮口, 圖7中的直方圖示出了在操作S202中針對(duì)每個(gè)發(fā)音單元數(shù)計(jì)算的短語總 數(shù)。因?yàn)樵趫D7中所示的直方圖中,發(fā)音單元數(shù)T1、 T2和T6的發(fā)生頻 率超過閾值,所以在操作S203中把Tl、 T2和T6設(shè)置為擴(kuò)展基準(zhǔn)值。應(yīng)當(dāng)理解,本發(fā)明可以以合適的方式投入應(yīng)用,例如,代替把T1、 T2和 T6設(shè)置為擴(kuò)展基準(zhǔn)值,而把小于或等于T6(超過閾值的最大發(fā)音單元數(shù)) 的值即所有的值Tl至T6設(shè)置為擴(kuò)展基準(zhǔn)值,或者可以通過不僅設(shè)置上 限例如T6,而且設(shè)置下限,來設(shè)置擴(kuò)展基準(zhǔn)值。
在操作S202和S203中解釋的處理中,通過針對(duì)每個(gè)發(fā)音單元數(shù)計(jì) 算短語總數(shù)來設(shè)置擴(kuò)展基準(zhǔn)值。除了所述結(jié)構(gòu)之外,還可以針對(duì)每個(gè)短 語計(jì)算短語總數(shù),并把計(jì)算的總數(shù)超過預(yù)設(shè)閾值的短語的發(fā)音單元數(shù)或 者小于或等于所述發(fā)音單元數(shù)的值設(shè)置為擴(kuò)展基準(zhǔn)值。例如,當(dāng)"^6 (iti)"的發(fā)生總數(shù)的總和計(jì)數(shù)超過閾值時(shí),把"L、 6 (iti)"的發(fā)音單元 數(shù)"2"設(shè)置為擴(kuò)展基準(zhǔn)值。也可以同時(shí)結(jié)合針對(duì)每個(gè)發(fā)音單元數(shù)的總和 計(jì)數(shù)和針對(duì)每個(gè)短語的總和計(jì)數(shù)來設(shè)置擴(kuò)展基準(zhǔn)值。
而且,作為操作S202和S203的替代處理,當(dāng)針對(duì)每個(gè)發(fā)音單元數(shù) 計(jì)算的短語數(shù)大于或等于基于其他發(fā)音單元數(shù)計(jì)算的短語數(shù)而預(yù)設(shè)的閾 值時(shí),可以把發(fā)音單元數(shù)或小于或等于該發(fā)音單元數(shù)的值設(shè)置為擴(kuò)展基 準(zhǔn)值。S卩,對(duì)通過從比作為判斷對(duì)象的發(fā)音單元數(shù)大1的發(fā)音單元數(shù)的 出現(xiàn)頻率減去該作為判斷對(duì)象的發(fā)音單元數(shù)的出現(xiàn)頻率而獲得的值,艮口, 變量,與閾值相比較,從而判斷是否把該變量設(shè)置為擴(kuò)展基準(zhǔn)值。例如, 在圖7所示的直方圖中,計(jì)算變量,如通過從T6的出現(xiàn)頻率減去T5的 出現(xiàn)頻率而獲得的值、通過從T5的出現(xiàn)頻率減去T4的出現(xiàn)頻率而獲得 的值、……、通過從T2的出現(xiàn)頻率減去T1的出現(xiàn)頻率而獲得的值,并 且當(dāng)計(jì)算出的變量超過閾值時(shí),把該計(jì)算出的變量設(shè)置為擴(kuò)展基準(zhǔn)值。 代替一系列發(fā)音單元數(shù)之間的比較,本發(fā)明可以以合適的方式投入應(yīng)用, 例如與當(dāng)與其他發(fā)音單元數(shù)的出現(xiàn)頻率的平均值之差大于或等于閾值 時(shí),設(shè)置擴(kuò)展基準(zhǔn)值。本發(fā)明還可以以諸如參照先前的識(shí)別結(jié)果的合適 方式投入應(yīng)用。
再次考慮該操作流程,在設(shè)置擴(kuò)展基準(zhǔn)值之后,在控制部10的控制 下,根據(jù)本實(shí)施方式的語音識(shí)別裝置1從短語數(shù)據(jù)庫121提取發(fā)音單元 數(shù)對(duì)應(yīng)于設(shè)置的擴(kuò)展基準(zhǔn)值的短語(S204)。語音識(shí)別裝置1提取通過向 從諸如詞形變化詞典數(shù)據(jù)庫1220和同現(xiàn)詞典數(shù)據(jù)庫1221的擴(kuò)展短語數(shù)據(jù)庫122提取的短語添加附加短語而獲得的擴(kuò)展短語(S205)。語音識(shí)別 裝置1通過用操作S205中提取的擴(kuò)展短語代替存儲(chǔ)在短語數(shù)據(jù)121的短 語中的發(fā)音單元數(shù)對(duì)應(yīng)于擴(kuò)展基準(zhǔn)值的短語而生成匹配數(shù)據(jù)庫123 (S206)。
根據(jù)本實(shí)施方式的語音識(shí)別裝置1然后從輸出部17輸出短語已被擴(kuò) 展短語替換的事實(shí)和替換的內(nèi)容(S207)。以這種方式執(zhí)行短語擴(kuò)展處理。
每當(dāng)例如執(zhí)行使用圖5解釋的語音識(shí)別處理時(shí),在操作S103中按發(fā) 音單元進(jìn)行識(shí)別處理之后,執(zhí)行短語擴(kuò)展處理。應(yīng)當(dāng)注意,可以基于先 前的識(shí)別結(jié)果而預(yù)先執(zhí)行短語擴(kuò)展處理,并且可以使用包括已經(jīng)執(zhí)行的 短語擴(kuò)展處理的結(jié)果的匹配數(shù)據(jù)庫123執(zhí)行識(shí)別處理。當(dāng)預(yù)先執(zhí)行短語 擴(kuò)展處理時(shí),通過適當(dāng)設(shè)置的事件,如語音識(shí)別裝置1的激活、語音識(shí) 別處理的空閑或各種數(shù)據(jù)庫的更新,來觸發(fā)短語擴(kuò)展處理的執(zhí)行啟動(dòng)。
盡管可以通過人工工作來更新在根據(jù)本實(shí)施方式的語音識(shí)別裝置1 中設(shè)置的擴(kuò)展短語數(shù)據(jù)庫122的存儲(chǔ)內(nèi)容,但也可以把擴(kuò)展短語數(shù)據(jù)庫 122設(shè)計(jì)成,自動(dòng)巡視經(jīng)由通信部18連接的外部網(wǎng)絡(luò)如因特網(wǎng)上的網(wǎng)頁, 并且檢索可以通過文本提取而獲得的數(shù)據(jù),以進(jìn)行自動(dòng)更新。
盡管在上面的實(shí)施方式中已經(jīng)示出了用于日語的語音識(shí)別的實(shí)施方 式,但該實(shí)施方式不限于此,而可以應(yīng)用于日語之外的其他語言,如英 語或漢語。圖8A、 8B、 8C和8D是用于概念性地示出根據(jù)本實(shí)施方式的 語音識(shí)別裝置1識(shí)別英語的應(yīng)用示例的說明圖。圖8A示出了表示說話者 產(chǎn)生的聲音內(nèi)容"I paid one dollar as a price of this wonderfUl paper"的語 音數(shù)據(jù)。圖8B示出了針對(duì)該聲音內(nèi)容按發(fā)音單元的識(shí)別結(jié)果,并且示出 了按發(fā)音單元識(shí)別為"A^乂^t" h/ut、一 A ^
6 t/、卞 "^ "C 。 t ;b A "6 乂 (/、 一 (ai peidu wan daraa azu a puraisu obu disu wandafUru peipaa)"的示例。圖8C示出了短語數(shù)據(jù)庫121 的存儲(chǔ)內(nèi)容的一部分,而圖8D示出了擴(kuò)展短語數(shù)據(jù)庫122的存儲(chǔ)內(nèi)容的 一部分。對(duì)于圖8B中示出的按發(fā)音單元的識(shí)別結(jié)果,根據(jù)本實(shí)施方式的 語音識(shí)別裝置1用諸如"one dollar"(讀音:wandaraa)和"wonderfUl" (讀音wandafiim)的擴(kuò)展短語代替短語"one"(讀音wan),并用諸如"pays"(讀音peizu)和"paid"(讀音peidu)的擴(kuò)展短語代替短 語"pay"(讀音pei),并且執(zhí)行如上所述的語音識(shí)別處理。
圖9A、 9B、 9C和9D是用于概念性地示出根據(jù)本實(shí)施方式的語音識(shí) 別裝置1識(shí)別漢語的應(yīng)用示例的說明圖。圖9A示出了表示說話者產(chǎn)生的 聲音內(nèi)容"八號(hào)有一件事,所以九號(hào)我和他見面一起喝酒了"的語音數(shù) 據(jù)。圖9B示出了針對(duì)該聲音內(nèi)容的按發(fā)音單元的識(shí)別結(jié)果,并且示出了 按發(fā)音單元識(shí)別為"f 一 (± fc、 J: 5 l、 一 i; i /u L — t f ^ i; j; ^〖ib、 》fe^/二一 i;克/u辦;i/b ^ — 6 A—i;丄, 6 (baahao you iijensi-suoi jouhao uoflitaa-jenmien iiti fuujou ra)"的不例。圖 9C示出了短語數(shù)據(jù)庫121的存儲(chǔ)內(nèi)容的一部分且,而9D示出了擴(kuò)展短 語數(shù)據(jù)庫122的存儲(chǔ)內(nèi)容的一部分。對(duì)于圖9B中示出的按發(fā)音單元的識(shí) 別結(jié)果,根據(jù)本實(shí)施方式的語音識(shí)別裝置用諸如"九號(hào)"(讀音jouhao) 和"九點(diǎn)"(讀音joudeien)的擴(kuò)展短語代替短語"九"(讀音jou), 并用諸如"一件"(讀音iijien)和"三件"(讀音sanjien)的擴(kuò)展短 語代替短語"件"(讀音jien),并且執(zhí)行如上所述的語音識(shí)別處理。盡 管為易于解釋起見,在使用圖8A、 8B、 8C、 8D、 9A、 9B、 9C和9D解 釋的示例中,示出了以日語音節(jié)單元為發(fā)音單元的識(shí)別示例,但應(yīng)當(dāng)注 意,本發(fā)明可以以諸如按發(fā)音符號(hào)單元進(jìn)行識(shí)別的合適方式進(jìn)行設(shè)置。
上述實(shí)施方式僅例示了無窮多實(shí)施方式中的一部分,可以適當(dāng)?shù)卦O(shè) 計(jì)各種硬件、軟件等的配置。例如,盡管在上述實(shí)施方式中示出了對(duì)在 語音識(shí)別裝置的聲音接收部處接收的聲音應(yīng)用識(shí)別處理的示例,但該實(shí) 施方式不限于此,而可以應(yīng)用于各種形式,如基于由接收聲音的其他裝 置生成的聲音數(shù)據(jù)的識(shí)別處理。而且,上述短語擴(kuò)展處理和語音識(shí)別處 理可以分別由不同的裝置執(zhí)行。
根據(jù)本實(shí)施方式,優(yōu)先于基于存儲(chǔ)在短語數(shù)據(jù)庫中的短語的識(shí)別, 執(zhí)行通過與擴(kuò)展短語進(jìn)行匹配的識(shí)別處理。因此,因?yàn)橄啾扔谂c由少量 發(fā)音單元組成的短語的匹配,對(duì)與由較多數(shù)發(fā)音單元組成的擴(kuò)展短語的 匹配設(shè)置優(yōu)先級(jí),所以可以消除識(shí)別由少量發(fā)音單元組成的短語的誤識(shí) 別且改善識(shí)別準(zhǔn)確度。根據(jù)本實(shí)施方式,因?yàn)樵谟脭U(kuò)展短語代替具有使大量短語被包括在 按發(fā)音單元的識(shí)別結(jié)果中的發(fā)音單元數(shù)的短語之后執(zhí)行識(shí)別處理,所以 可以用擴(kuò)展短語代替具有更容易導(dǎo)致誤識(shí)別的發(fā)音單元數(shù)的相應(yīng)短語。
根據(jù)本實(shí)施方式,可以用和短語的變化形式關(guān)聯(lián)的擴(kuò)展短語代替短語。
在根據(jù)本發(fā)明的語音識(shí)別裝置和計(jì)算機(jī)程序中,其中按發(fā)音單元識(shí) 別基于發(fā)聲法的語音數(shù)據(jù),參照存儲(chǔ)由一個(gè)或多個(gè)發(fā)音單元組成的短語 的短語數(shù)據(jù)庫,將按發(fā)音單元識(shí)別的語音數(shù)據(jù)與存儲(chǔ)在短語數(shù)據(jù)庫中的 短語進(jìn)行比較,并且執(zhí)行識(shí)別由語音數(shù)據(jù)中包括的一個(gè)或多個(gè)發(fā)音單元 組成的短語的處理,對(duì)與通過在短語數(shù)據(jù)庫中存儲(chǔ)的相應(yīng)短語之前和/或 之后添加附加短語而獲得的擴(kuò)展短語進(jìn)行匹配的識(shí)別處理設(shè)置優(yōu)先級(jí)。
因?yàn)橄擞缮倭堪l(fā)音單元組成的短語且消除了基于由少量發(fā)音單 元組成的短語的誤識(shí)別,本發(fā)明的這種配置確保了諸如改善識(shí)別率的有 益效果。
權(quán)利要求
1、一種語音識(shí)別裝置,其用于執(zhí)行按發(fā)音單元識(shí)別基于發(fā)聲法的語音數(shù)據(jù)的第一識(shí)別處理,將該第一識(shí)別處理的結(jié)果與在存儲(chǔ)有多個(gè)具有一個(gè)或多個(gè)發(fā)音單元的短語的短語數(shù)據(jù)庫中存儲(chǔ)的多個(gè)短語進(jìn)行比較,并且執(zhí)行識(shí)別所述語音數(shù)據(jù)中包括的由一個(gè)或多個(gè)發(fā)音單元組成的短語的第二識(shí)別處理,其特征在于包括優(yōu)先級(jí)識(shí)別部,其用于優(yōu)先于該第二識(shí)別處理,將該第一識(shí)別處理的結(jié)果與通過在存儲(chǔ)在該短語數(shù)據(jù)庫中的相應(yīng)短語之前和/或之后添加附加短語而獲得的多個(gè)擴(kuò)展短語進(jìn)行比較,以識(shí)別包括在該語音數(shù)據(jù)中的擴(kuò)展短語。
2、 根據(jù)權(quán)利要求l所述的語音識(shí)別裝置,其特征在于,所述優(yōu)先級(jí) 識(shí)別部通過用所述擴(kuò)展短語代替存儲(chǔ)在所述短語數(shù)據(jù)庫中的短語,對(duì)與 所述擴(kuò)展短語相關(guān)的識(shí)別處理提供優(yōu)先級(jí)。
3、 一種語音識(shí)別裝置,其用于執(zhí)行按發(fā)音單元識(shí)別基于發(fā)聲法的語 音數(shù)據(jù)的第一識(shí)別處理,將該第一識(shí)別處理的結(jié)果與在存儲(chǔ)有多個(gè)具有 一個(gè)或多個(gè)發(fā)音單元的短語的短語數(shù)據(jù)庫中存儲(chǔ)的多個(gè)短語進(jìn)行比較, 并且執(zhí)行識(shí)別所述語音數(shù)據(jù)中包括的由一個(gè)或多個(gè)發(fā)音單元組成的短語的第二識(shí)別處理,其特征在于包括擴(kuò)展短語數(shù)據(jù)庫,其用于存儲(chǔ)通過在存儲(chǔ)在所述短語數(shù)據(jù)庫中的相 應(yīng)短語之前和/或之后添加附加短語而獲得的多個(gè)擴(kuò)展短語;用于從所述短語數(shù)據(jù)庫提取具有預(yù)定發(fā)音單元數(shù)的短語的短語提取部;用于從所述擴(kuò)展短語數(shù)據(jù)庫提取通過向提取的短語添加附加短語而 獲得的擴(kuò)展短語的擴(kuò)展短語提取部;以及優(yōu)先級(jí)識(shí)別部,其用于優(yōu)先于所述第二識(shí)別處理,將所述第一識(shí)別 處理的結(jié)果與提取的擴(kuò)展短語進(jìn)行比較,以識(shí)別所述語音數(shù)據(jù)中包括的擴(kuò)展短語。
4、 根據(jù)權(quán)利要求3所述的語音識(shí)別裝置,其特征在于還包括設(shè)置部,其用于在所述第一識(shí)別處理的結(jié)果中,基于發(fā)音單元數(shù)和 與存儲(chǔ)在所述短語數(shù)據(jù)庫中的任一短語匹配的短語數(shù)設(shè)置所述預(yù)定數(shù)。
5、 根據(jù)權(quán)利要求3所述的語音識(shí)別裝置,其特征在于,所述擴(kuò)展短語數(shù)據(jù)庫存儲(chǔ)通過向作為所述短語數(shù)據(jù)庫中存儲(chǔ)的相應(yīng)短語的相應(yīng)詞干 添加作為附加短語的后綴和/或前綴而獲得的多個(gè)擴(kuò)展短語。
6、 根據(jù)權(quán)利要求3所述的語音識(shí)別裝置,其特征在于,所述優(yōu)先級(jí) 識(shí)別部通過用所述擴(kuò)展短語代替存儲(chǔ)在所述短語數(shù)據(jù)庫中的短語,對(duì)與 所述擴(kuò)展短語相關(guān)的識(shí)別處理提供優(yōu)先級(jí)。
7、 根據(jù)權(quán)利要求4所述的語音識(shí)別裝置,其特征在于,所述設(shè)置部 把計(jì)算的與所述短語數(shù)據(jù)庫中存儲(chǔ)的任一短語相匹配的短語的總數(shù)超過 預(yù)設(shè)閾值時(shí)的發(fā)音單元數(shù),或者小于或等于所述發(fā)音單元數(shù)的值,設(shè)置 為所述第一識(shí)別處理中的所述預(yù)定數(shù)。
8、 根據(jù)權(quán)利要求4所述的語音識(shí)別裝置,其特征在于,所述設(shè)置部 把計(jì)算的與所述短語數(shù)據(jù)庫中存儲(chǔ)的任一短語相匹配的短語的總數(shù)超過 預(yù)設(shè)閾值時(shí)的短語的發(fā)音單元數(shù),或者小于或等于所述發(fā)音單元數(shù)的值, 設(shè)置為第一識(shí)別處理中的所述預(yù)定數(shù)。
9、 根據(jù)權(quán)利要求4所述的語音識(shí)別裝置,其特征在于,所述設(shè)置部 針對(duì)每個(gè)發(fā)音單元數(shù)計(jì)算與所述短語數(shù)據(jù)庫中存儲(chǔ)的任一短語相匹配的 短語的總數(shù),并且把計(jì)算的短語數(shù)大于或等于基于針對(duì)具有其他發(fā)音單 元數(shù)的短語計(jì)算的數(shù)而預(yù)設(shè)的閾值時(shí)的發(fā)音單元數(shù),或者小于或等于所 述發(fā)音單元數(shù)的值,設(shè)置為所述第一識(shí)別處理中的所述預(yù)定數(shù)。
全文摘要
本發(fā)明提供一種語音識(shí)別裝置,當(dāng)它按發(fā)音單元對(duì)基于說話者產(chǎn)生的語音的語音數(shù)據(jù)如音節(jié)執(zhí)行識(shí)別處理,且進(jìn)一步通過諸如用于與存儲(chǔ)在短語數(shù)據(jù)庫中的短語進(jìn)行匹配的關(guān)鍵詞辨別這樣的方法執(zhí)行識(shí)別時(shí),能夠減小與由少量音節(jié)組成的短語進(jìn)行匹配而導(dǎo)致的誤識(shí)別。該語音識(shí)別裝置執(zhí)行用于對(duì)按發(fā)音單元的識(shí)別處理的結(jié)果與通過在相應(yīng)短語之前和/或之后添加附加短語而獲得的擴(kuò)展短語進(jìn)行比較的識(shí)別處理。
文檔編號(hào)G10L15/08GK101458928SQ20081016635
公開日2009年6月17日 申請(qǐng)日期2008年9月26日 優(yōu)先權(quán)日2007年12月10日
發(fā)明者阿部賢司 申請(qǐng)人:富士通株式會(huì)社