專(zhuān)利名稱(chēng):語(yǔ)音識(shí)別設(shè)備、語(yǔ)音識(shí)別服務(wù)器、語(yǔ)音識(shí)別系統(tǒng)和方法
技術(shù)領(lǐng)域:
與示例性實(shí)施例一致的設(shè)備和方法涉及一種語(yǔ)音識(shí)別設(shè)備、語(yǔ)音識(shí)別服務(wù)器、語(yǔ)音識(shí)別系統(tǒng)和語(yǔ)音識(shí)別方法,更具體地講,涉及一種使用通用語(yǔ)音識(shí)別引擎,準(zhǔn)確地識(shí)別在特定領(lǐng)域使用的有限數(shù)量的詞語(yǔ)的語(yǔ)音識(shí)別設(shè)備、語(yǔ)音識(shí)別服務(wù)器、語(yǔ)音識(shí)別系統(tǒng)和語(yǔ)音識(shí)別方法。
背景技術(shù):
語(yǔ)音識(shí)別技術(shù)被廣泛地用于家用電器(諸如,數(shù)字TV)以及PC和移動(dòng)通信裝置中。尤其是,移動(dòng)通信裝置已采用基于服務(wù)器的語(yǔ)音識(shí)別技術(shù)并提供搜索功能(諸如,網(wǎng)頁(yè)搜索)和用于作為語(yǔ)音輸入SMS功能的功能?;诜?wù)器的語(yǔ)音識(shí)別引擎不僅識(shí)別在所謂特 定領(lǐng)域使用的語(yǔ)言,還識(shí)別在非特定領(lǐng)域的各種詞語(yǔ)??稍赑C、移動(dòng)通信裝置或數(shù)字TV之內(nèi)提供在可識(shí)別詞語(yǔ)方面不受限制的通用語(yǔ)音識(shí)別引擎。如果前述語(yǔ)音識(shí)別引擎被限制在特定領(lǐng)域并具有有限數(shù)量的可識(shí)別詞語(yǔ),則前述語(yǔ)音識(shí)別引擎比起專(zhuān)門(mén)的語(yǔ)音識(shí)別引擎提供更低的識(shí)別率,或在初始識(shí)別詞語(yǔ)時(shí)不太成功。
發(fā)明內(nèi)容
因此,一個(gè)或多個(gè)示例性實(shí)施例提供一種語(yǔ)音識(shí)別設(shè)備、語(yǔ)音識(shí)別服務(wù)器、語(yǔ)音識(shí)別系統(tǒng)和語(yǔ)音識(shí)別方法,其中,所述語(yǔ)音識(shí)別設(shè)備、語(yǔ)音識(shí)別服務(wù)器、語(yǔ)音識(shí)別系統(tǒng)和語(yǔ)音識(shí)別方法使用在可識(shí)別詞語(yǔ)方面不受限制的通用語(yǔ)音識(shí)別引擎準(zhǔn)確地識(shí)別在特定領(lǐng)域使用的有限數(shù)量的詞語(yǔ)。根據(jù)示例性實(shí)施例的一方面,提供一種語(yǔ)音識(shí)別設(shè)備,所述語(yǔ)音識(shí)別設(shè)備包括語(yǔ)音輸入單元,從用戶(hù)接收語(yǔ)音輸入;圖像處理器,處理圖像;顯示單元,在其上顯示圖像處理結(jié)果;控制器,將語(yǔ)音輸入的數(shù)據(jù)和語(yǔ)音可識(shí)別信息發(fā)送到語(yǔ)音識(shí)別引擎,并從語(yǔ)音識(shí)別引擎接收識(shí)別結(jié)果,其中,所述識(shí)別結(jié)果指示輸入語(yǔ)音的數(shù)據(jù)是否對(duì)應(yīng)于語(yǔ)音可識(shí)別信息。語(yǔ)音可識(shí)別信息可包括文本信息。語(yǔ)音可識(shí)別信息可包括作為語(yǔ)音識(shí)別的對(duì)象的多個(gè)詞語(yǔ)。語(yǔ)音可識(shí)別信息可包括圖像或圖像的名稱(chēng)。語(yǔ)音可識(shí)別信息可包括網(wǎng)頁(yè)的鏈接信息或菜單項(xiàng)。語(yǔ)音可識(shí)別信息可包括文本,其中,所述文本具有在語(yǔ)音輸入被接收時(shí)顯示的網(wǎng)頁(yè)或菜單的至少一個(gè)詞語(yǔ)。語(yǔ)音識(shí)別設(shè)備可包括移動(dòng)終端、計(jì)算機(jī)和顯示設(shè)備中的一種。語(yǔ)音識(shí)別弓I擎可在安裝在語(yǔ)音識(shí)別設(shè)備中的裝置中操作。語(yǔ)音識(shí)別引擎可在安裝在外設(shè)于語(yǔ)音識(shí)別設(shè)備的語(yǔ)音識(shí)別服務(wù)器中的裝置中操作??赏ㄟ^(guò)提供一種語(yǔ)音識(shí)別設(shè)備來(lái)實(shí)現(xiàn)另一方面,所述語(yǔ)音識(shí)別設(shè)備包括語(yǔ)音輸入單元,從用戶(hù)接收語(yǔ)音輸入;圖像處理器,處理圖像;顯示單元,顯示處理的圖像;通信單元,與語(yǔ)音識(shí)別服務(wù)器通信;控制器,將語(yǔ)音輸入的數(shù)據(jù)和語(yǔ)音可識(shí)別信息發(fā)送到語(yǔ)音識(shí)別服務(wù)器,并從語(yǔ)音識(shí)別服務(wù)器接收識(shí)別結(jié)果,其中,所述識(shí)別結(jié)果指示語(yǔ)音輸入的數(shù)據(jù)是否對(duì)應(yīng)于語(yǔ)音可識(shí)別信息。語(yǔ)音識(shí)別設(shè)備可還包括存儲(chǔ)單元,在其中存儲(chǔ)語(yǔ)音可識(shí)別信息。根據(jù)示例性實(shí)施例的一方面,提供一種語(yǔ)音識(shí)別服務(wù)器,所述語(yǔ)音識(shí)別服務(wù)器包括通信單元,從語(yǔ)音識(shí)別設(shè)備接收語(yǔ)音輸入數(shù)據(jù)和語(yǔ)音可識(shí)別信息;語(yǔ)音識(shí)別單元,執(zhí)行語(yǔ)音識(shí)別功能,其中,所述語(yǔ)音識(shí)別功能確定語(yǔ)音輸入數(shù)據(jù)是否對(duì)應(yīng)于語(yǔ)音可識(shí)別信息;控制器,控制語(yǔ)音識(shí)別單元執(zhí)行語(yǔ)音識(shí)別功能,并將識(shí)別結(jié)果發(fā)送到語(yǔ)音識(shí)別設(shè)備,其中,所述識(shí)別結(jié)果指示語(yǔ)音輸入數(shù)據(jù)是否對(duì)應(yīng)于語(yǔ)音可識(shí)別信息。語(yǔ)音識(shí)別服務(wù)器可還包括存儲(chǔ)單元,在其中存儲(chǔ)語(yǔ)音可識(shí)別信息。 語(yǔ)音識(shí)別服務(wù)器可還包括識(shí)別調(diào)整器,如果識(shí)別結(jié)果類(lèi)似于語(yǔ)音可識(shí)別信息,則所述識(shí)別調(diào)整器將所述識(shí)別結(jié)果調(diào)整為語(yǔ)音可識(shí)別信息中的最類(lèi)似信息。語(yǔ)音識(shí)別單元可包括基于服務(wù)器的通用語(yǔ)音識(shí)別引擎。語(yǔ)音可識(shí)別信息可包括文本信息。語(yǔ)音可識(shí)別信息可包括作為語(yǔ)音識(shí)別的對(duì)象的多個(gè)詞語(yǔ)。語(yǔ)音可識(shí)別信息可包括圖像或圖像的名稱(chēng)。語(yǔ)音可識(shí)別信息可包括網(wǎng)頁(yè)的鏈接信息或菜單項(xiàng)。根據(jù)示例性實(shí)施例的一方面,提供一種語(yǔ)音識(shí)別系統(tǒng),所述語(yǔ)音識(shí)別系統(tǒng)包括語(yǔ)音識(shí)別設(shè)備,將語(yǔ)音輸入數(shù)據(jù)和語(yǔ)音可識(shí)別信息發(fā)送到語(yǔ)音識(shí)別服務(wù)器,并從語(yǔ)音識(shí)別服務(wù)器接收識(shí)別結(jié)果,其中,所述識(shí)別結(jié)果指示語(yǔ)音輸入數(shù)據(jù)是否對(duì)應(yīng)于語(yǔ)音可識(shí)別信息;語(yǔ)音識(shí)別服務(wù)器,從語(yǔ)音識(shí)別設(shè)備接收語(yǔ)音輸入數(shù)據(jù)和語(yǔ)音可識(shí)別信息,確定語(yǔ)音輸入數(shù)據(jù)是否對(duì)應(yīng)于語(yǔ)音可識(shí)別信息,并將識(shí)別結(jié)果發(fā)送到語(yǔ)音識(shí)別設(shè)備。如果識(shí)別結(jié)果類(lèi)似于語(yǔ)音可識(shí)別信息,則識(shí)別結(jié)果可被調(diào)整為語(yǔ)音可識(shí)別信息中的最類(lèi)似信息。根據(jù)示例性實(shí)施例的一方面,提供一種語(yǔ)音識(shí)別方法,所述語(yǔ)音識(shí)別方法包括通過(guò)語(yǔ)音識(shí)別設(shè)備接收語(yǔ)音輸入;將語(yǔ)音輸入的數(shù)據(jù)和語(yǔ)音可識(shí)別信息發(fā)送到語(yǔ)音識(shí)別服務(wù)器;確定語(yǔ)音輸入的數(shù)據(jù)是否對(duì)應(yīng)于語(yǔ)音可識(shí)別信息;將語(yǔ)音識(shí)別結(jié)果發(fā)送到語(yǔ)音識(shí)別設(shè)備,其中,所述語(yǔ)音識(shí)別結(jié)果指示語(yǔ)音輸入的數(shù)據(jù)是否對(duì)應(yīng)于語(yǔ)音可識(shí)別信息。語(yǔ)音可識(shí)別信息可包括文本信息。語(yǔ)音可識(shí)別信息可包括作為語(yǔ)音識(shí)別的對(duì)象的多個(gè)詞語(yǔ)。語(yǔ)音可識(shí)別信息可包括圖像或圖像的名稱(chēng)。語(yǔ)音可識(shí)別信息可包括網(wǎng)頁(yè)的鏈接信息或菜單項(xiàng)。語(yǔ)音可識(shí)別信息可包括文本,其中,所述文本具有在語(yǔ)音輸入被接收時(shí)顯示的網(wǎng)頁(yè)或菜單的至少一個(gè)詞語(yǔ)。所述確定步驟可包括如果識(shí)別結(jié)果類(lèi)似于語(yǔ)音可識(shí)別信息,則將識(shí)別結(jié)果調(diào)整為語(yǔ)音可識(shí)別信息中的最類(lèi)似信息。
通過(guò)下面結(jié)合附圖對(duì)示例性實(shí)施例的描述,本發(fā)明的上述和/或其他方面將會(huì)變得清楚并更容易理解,其中圖I是根據(jù)示例性實(shí)施例的語(yǔ)音識(shí)別設(shè)備的框圖;圖2是根據(jù)另一示例性實(shí)施例的包括語(yǔ)音識(shí)別設(shè)備和語(yǔ)音識(shí)別服務(wù)器的語(yǔ)音識(shí)別系統(tǒng)的框圖;圖3示出根據(jù)示例性實(shí)施例的顯示語(yǔ)音可識(shí)別信息的網(wǎng)頁(yè)的示例;圖4是根據(jù)示例性實(shí)施例的語(yǔ)音識(shí)別方法的流程圖;以及圖5是根據(jù)另一示例性實(shí)施例的語(yǔ)音識(shí)別方法的流程圖。
具體實(shí)施方式
以下,將參照附圖來(lái)詳細(xì)描述示例性實(shí)施例,從而使本領(lǐng)域的普通技術(shù)人員容易實(shí)現(xiàn)所述示例性實(shí)施例??梢砸愿鞣N形式實(shí)現(xiàn)所述示例性實(shí)施例而不限于在此闡述的示例性實(shí)施例。為了清楚,省略對(duì)公知部分的描述,并且相同的標(biāo)號(hào)始終指示相同的元件。圖I是根據(jù)示例性實(shí)施例的語(yǔ)音識(shí)別設(shè)備的框圖。參照?qǐng)D1,語(yǔ)音識(shí)別設(shè)備100包括語(yǔ)音輸入單元110、控制器120、圖像處理器150、顯示單元160和語(yǔ)音識(shí)別引擎170。語(yǔ)音識(shí)別設(shè)備100可包括移動(dòng)終端、計(jì)算機(jī)或顯示設(shè)備。語(yǔ)音輸入單元110從用戶(hù)接收語(yǔ)音輸入,執(zhí)行模數(shù)(A/D)轉(zhuǎn)換以將輸入的語(yǔ)音轉(zhuǎn)換為數(shù)字格式。圖像處理器150處理由控制器120輸入的信號(hào),以顯示圖像。顯示單元160在其上顯示圖像處理結(jié)果。更具體地講,顯示單元160在其上顯示可由用戶(hù)作為語(yǔ)音發(fā)出的信息。顯示單元160在其上顯示與語(yǔ)音輸入的識(shí)別結(jié)果相應(yīng)的信肩、O語(yǔ)音識(shí)別引擎170可包括由語(yǔ)音識(shí)別設(shè)備100中的單獨(dú)的裝置執(zhí)行的軟件。例如,可在語(yǔ)音識(shí)別設(shè)備100之內(nèi)設(shè)置的芯片上安裝語(yǔ)音識(shí)別引擎170。語(yǔ)音識(shí)別引擎170可包括軟件,其中,所述軟件存儲(chǔ)在閃存中并在語(yǔ)音識(shí)別設(shè)備100的開(kāi)通和操作時(shí),由主存儲(chǔ)器(諸如控制器120)執(zhí)行,而不是由所述單獨(dú)的裝置來(lái)執(zhí)行。圖I示出包括在語(yǔ)音識(shí)別設(shè)備100中的語(yǔ)音識(shí)別引擎170,但是所述語(yǔ)音識(shí)別引擎170不限于此?;蛘?,可在語(yǔ)音識(shí)別設(shè)備100的外部設(shè)置語(yǔ)音識(shí)別引擎170。例如,語(yǔ)音識(shí)別引擎可被設(shè)置在通過(guò)因特網(wǎng)連接的外部語(yǔ)音識(shí)別服務(wù)器中或被設(shè)置在本地網(wǎng)絡(luò)中連接的外部裝置中??刂破?20將通過(guò)語(yǔ)音輸入單元110輸入的語(yǔ)音輸入數(shù)據(jù)和語(yǔ)音可識(shí)別信息發(fā)送到語(yǔ)音識(shí)別引擎170,并從語(yǔ)音識(shí)別引擎170接收語(yǔ)音輸入的識(shí)別結(jié)果。語(yǔ)音輸入數(shù)據(jù)是指用戶(hù)發(fā)出的語(yǔ)音信息。語(yǔ)音可識(shí)別信息可包括在移動(dòng)終端、計(jì)算機(jī)或顯示設(shè)備中提供的文本信息,更具體地講,可被識(shí)別為語(yǔ)音的多個(gè)詞語(yǔ)。例如,當(dāng)用戶(hù)從顯示設(shè)備觀看電影或新聞時(shí),該用戶(hù)會(huì)發(fā)出“音量提高”、“音量降低”或者“大聲一點(diǎn)”或“小聲一點(diǎn)”的聲音以調(diào)整電影或新聞的聲音。用戶(hù)可發(fā)出“上調(diào)頻道”或“下調(diào)頻道”的聲音以改變頻道,或發(fā)出“電源開(kāi)啟”或“電源關(guān)閉”的聲音以控制電源。如上,用于控制顯示設(shè)備并預(yù)先被存儲(chǔ)在顯示設(shè)備中的一組控制命令為語(yǔ)音可識(shí)別信息。如果用戶(hù)發(fā)出“大聲一點(diǎn)”的聲音,則控制器120將語(yǔ)音輸入數(shù)據(jù)“大聲一點(diǎn)”和預(yù)先存儲(chǔ)在顯示設(shè)備中的語(yǔ)音可識(shí)別信息(諸如,“音量提高”、“音量降低”、“大聲一點(diǎn)”、“小聲一點(diǎn)”、“上調(diào)頻道”、“下調(diào)頻道”、“電源開(kāi)啟”和“電源關(guān)閉”)發(fā)送到語(yǔ)音識(shí)別引擎170。然后,語(yǔ)音識(shí)別引擎170從語(yǔ)音輸入數(shù)據(jù)“大聲一點(diǎn)”提取語(yǔ)音特征矢量,并將所述矢量與若干對(duì)應(yīng)于語(yǔ)音可識(shí)別信息的命令進(jìn)行比較。如果確定存在與“大聲一點(diǎn)”相同的語(yǔ)音可識(shí)別信息,則對(duì)應(yīng)于“大聲一點(diǎn)”的控制信息被發(fā)送到控制器120,并且控制器120調(diào)整顯示設(shè)備的聲音??刂菩畔?duì)應(yīng)于針對(duì)控制器120和語(yǔ)音識(shí)別引擎170之間的每個(gè)功能的命令。如果用戶(hù)大概發(fā)出類(lèi)似于“小聲一點(diǎn)” 的聲音,則控制器120將類(lèi)似于“小聲一點(diǎn)”的語(yǔ)音輸入數(shù)據(jù)和語(yǔ)音可識(shí)別信息(諸如,“音量提高”、“音量降低”、“大聲一點(diǎn)”、“小聲一點(diǎn)”、“上調(diào)頻道”、“下調(diào)頻道”、“電源開(kāi)啟”和“電源關(guān)閉”)發(fā)送到語(yǔ)音識(shí)別引擎170。語(yǔ)音識(shí)別引擎170從類(lèi)似于“小聲一點(diǎn)”的語(yǔ)音輸入數(shù)據(jù)提取語(yǔ)音特征矢量,并將所述矢量與若干對(duì)應(yīng)于語(yǔ)音可識(shí)別信息的命令進(jìn)行比較。語(yǔ)音識(shí)別引擎170可確定存在與“小聲一點(diǎn)”類(lèi)似但不相同的語(yǔ)音可識(shí)別信息。如果語(yǔ)音輸入數(shù)據(jù)即使與語(yǔ)音可識(shí)別數(shù)據(jù)不同,卻非常類(lèi)似于語(yǔ)音可識(shí)別數(shù)據(jù),則語(yǔ)音識(shí)別引擎170可調(diào)整語(yǔ)音識(shí)別結(jié)果并將語(yǔ)音輸入數(shù)據(jù)識(shí)別為“小聲一點(diǎn)”。如果語(yǔ)音識(shí)別引擎170將對(duì)應(yīng)于“小聲一點(diǎn)”的控制信息發(fā)送到控制器120,則控制器120調(diào)整顯示設(shè)備的聲音。在前述示例性實(shí)施例中,語(yǔ)音可識(shí)別信息被預(yù)先存儲(chǔ)在移動(dòng)終端、計(jì)算機(jī)或顯示設(shè)備中,但是語(yǔ)音可識(shí)別信息的存儲(chǔ)不限于此。或者,當(dāng)語(yǔ)音識(shí)別設(shè)備100從用戶(hù)接收語(yǔ)音輸入數(shù)據(jù)時(shí),如果顯示單元160顯示計(jì)算機(jī)的網(wǎng)頁(yè)或顯示設(shè)備的菜單,則語(yǔ)音可識(shí)別信息可包括在屏幕中顯示的文本信息(諸如,網(wǎng)頁(yè)的鏈接信息、網(wǎng)頁(yè)的文本信息和菜單的文本信息)。語(yǔ)音可識(shí)別信息可包括各種圖像和圖像的名稱(chēng)。如果語(yǔ)音輸入被接收并且前述信息被顯示在屏幕中,則控制器120將文本連同接收的語(yǔ)音輸入數(shù)據(jù)發(fā)送到語(yǔ)音識(shí)別引擎170,并從語(yǔ)音識(shí)別引擎170接收語(yǔ)音識(shí)別結(jié)果以進(jìn)行操作,其中,所述文本包括從在屏幕中顯示的信息提取的至少一個(gè)詞語(yǔ)。上述示例與從語(yǔ)音識(shí)別引擎170接收語(yǔ)音輸入數(shù)據(jù)和語(yǔ)音可識(shí)別信息的前述示例性實(shí)施例相同,只是所述數(shù)據(jù)沒(méi)有被存儲(chǔ)在語(yǔ)音識(shí)別設(shè)備100中,而是被顯示在顯示單元160上。圖2是根據(jù)另一示例性實(shí)施例的包括語(yǔ)音識(shí)別設(shè)備和語(yǔ)音識(shí)別服務(wù)器的語(yǔ)音識(shí)別系統(tǒng)的框圖。參照?qǐng)D2,語(yǔ)音識(shí)別系統(tǒng)I包括語(yǔ)音識(shí)別設(shè)備100和語(yǔ)音識(shí)別服務(wù)器200。語(yǔ)音識(shí)別設(shè)備100包括語(yǔ)音輸入單元110、控制器120、存儲(chǔ)單元130、通信單元140、圖像處理器150和顯示單元160。語(yǔ)音輸入單元110、控制器120、圖像處理器150和顯示單元160的功能與在圖I中描述的那些相同。存儲(chǔ)單元130在其中存儲(chǔ)語(yǔ)音可識(shí)別信息。如果語(yǔ)音輸入被接收,則存儲(chǔ)單元130可在其中存儲(chǔ)顯示在顯示單元160上的語(yǔ)音可識(shí)別信息。如參照?qǐng)DI的描述,存儲(chǔ)單元130可在其中預(yù)先存儲(chǔ)語(yǔ)音識(shí)別設(shè)備100的控制命令。通信單元140在網(wǎng)絡(luò)300中與語(yǔ)音識(shí)別服務(wù)器200通信。網(wǎng)絡(luò)300可以是有線/無(wú)線網(wǎng)絡(luò)??刂破?20將用戶(hù)輸入的語(yǔ)音輸入數(shù)據(jù)和語(yǔ)音可識(shí)別信息發(fā)送到語(yǔ)音識(shí)別服務(wù)器200,并接收對(duì)應(yīng)于語(yǔ)音識(shí)別的識(shí)別結(jié)果以進(jìn)行操作。語(yǔ)音識(shí)別設(shè)備100的詳細(xì)描述與圖I中的描述相同,并因此不再?gòu)?fù)述。語(yǔ)音識(shí)別服務(wù)器200包括通信單元210、控制器220、語(yǔ)音識(shí)別單元230、存儲(chǔ)單元240和識(shí)別調(diào)整器250。語(yǔ)音識(shí)別服務(wù)器200可包括基于服務(wù)器的通用語(yǔ)音識(shí)別引擎(其在識(shí)別詞語(yǔ)的數(shù)量方面不受限制),而不是受限于識(shí)別詞語(yǔ)的數(shù)量的嵌入式語(yǔ)音識(shí)別引擎。
通信單元210在有線/無(wú)線網(wǎng)絡(luò)300中與語(yǔ)音識(shí)別設(shè)備100通信。語(yǔ)音識(shí)別引擎被安裝在執(zhí)行語(yǔ)音識(shí)別功能的語(yǔ)音識(shí)別單元230中。存儲(chǔ)單元240在其中存儲(chǔ)由語(yǔ)音識(shí)別設(shè)備100發(fā)送的語(yǔ)音可識(shí)別信息。當(dāng)語(yǔ)音識(shí)別單元230執(zhí)行語(yǔ)音識(shí)別功能時(shí),所存儲(chǔ)的語(yǔ)音可識(shí)別信息可被參考??刂破?20控制語(yǔ)音識(shí)別單元230僅相對(duì)于存儲(chǔ)在存儲(chǔ)單元240中的語(yǔ)音可識(shí)別信息,識(shí)別由語(yǔ)音識(shí)別設(shè)備100發(fā)送的語(yǔ)音輸入數(shù)據(jù),并將語(yǔ)音識(shí)別結(jié)果發(fā)送到語(yǔ)音識(shí)別設(shè)備100。如果語(yǔ)音識(shí)別結(jié)果類(lèi)似于存儲(chǔ)在存儲(chǔ)單元240中的語(yǔ)音可識(shí)別信息,則識(shí)別調(diào)整器250將語(yǔ)音識(shí)別結(jié)果調(diào)整為語(yǔ)音可識(shí)別信息中的最類(lèi)似信息。更具體地講,如圖I所示,如果語(yǔ)音識(shí)別服務(wù)器200從語(yǔ)音識(shí)別設(shè)備100接收到具有類(lèi)似于“小聲一點(diǎn)”的發(fā)音的語(yǔ)音輸入數(shù)據(jù)以及語(yǔ)音可識(shí)別信息(諸如,“音量提高”、“音量降低”、“大聲一點(diǎn)”、“小聲一點(diǎn)”、“上調(diào)頻道”、“下調(diào)頻道”、“電源開(kāi)啟”和“電源關(guān)閉”),則語(yǔ)音識(shí)別單元230將所述語(yǔ)音輸入識(shí)別為類(lèi)似于“小聲一點(diǎn)”的發(fā)音。如果控制器220確 定不存在相同的信息但存在類(lèi)似的“小聲一點(diǎn)”,則控制器220控制識(shí)別調(diào)整器250將識(shí)別結(jié)果調(diào)整為“小聲一點(diǎn)”。語(yǔ)音識(shí)別服務(wù)器200將對(duì)應(yīng)于調(diào)整的“小聲一點(diǎn)”的控制信息發(fā)送到語(yǔ)音識(shí)別設(shè)備100,并且語(yǔ)音識(shí)別設(shè)備100接收語(yǔ)音識(shí)別結(jié)果以進(jìn)行操作。圖3示出根據(jù)示例性實(shí)施例的顯示語(yǔ)音可識(shí)別信息的網(wǎng)頁(yè)的示例。參照?qǐng)D3,如果語(yǔ)音識(shí)別設(shè)備100包括計(jì)算機(jī)或移動(dòng)終端,則網(wǎng)頁(yè)被顯示在顯示單元160上。在圖3中,語(yǔ)音可識(shí)別信息是指在語(yǔ)音輸入被從用戶(hù)接收時(shí)顯示的網(wǎng)頁(yè)的鏈接信息、菜單或文本。用戶(hù)通過(guò)使用所述用戶(hù)的語(yǔ)音或鍵盤(pán)從計(jì)算機(jī)的網(wǎng)頁(yè)搜索“紫菜包飯”310。然后,與搜索結(jié)果相應(yīng)的信息320被顯示在網(wǎng)頁(yè)中。然后,用戶(hù)可通過(guò)使用語(yǔ)音信息選擇與搜索結(jié)果相應(yīng)的信息320中的一個(gè)。例如,如果用戶(hù)發(fā)出“智能”的聲音以從上述與搜索結(jié)果相應(yīng)的信息320中選擇在第三鏈接中的“智能紫菜包飯”,則計(jì)算機(jī)的控制器120提取在語(yǔ)音輸入被從用戶(hù)接收時(shí)顯示在屏幕中的“紫菜包飯世界”、“紫菜包飯國(guó)家”、“智能紫菜包飯”……“紫菜包飯?zhí)靽?guó)”,并將它們作為語(yǔ)音可識(shí)別信息與所述語(yǔ)音輸入數(shù)據(jù)“智能” 一起發(fā)送到語(yǔ)音識(shí)別服務(wù)器200。語(yǔ)音識(shí)別服務(wù)器200接收語(yǔ)音輸入數(shù)據(jù)“智能”和語(yǔ)音可識(shí)別信息,并將它們識(shí)別為“智能”。語(yǔ)音識(shí)別服務(wù)器200的控制器220將存儲(chǔ)在存儲(chǔ)單元240中的語(yǔ)音可識(shí)別信息與所述識(shí)別結(jié)果進(jìn)行比較,并確定不存在與“智能”相同的信息,但存在類(lèi)似的信息,即,“智能紫菜包飯”。然后,語(yǔ)音識(shí)別服務(wù)器200的控制器220控制識(shí)別調(diào)整器250將識(shí)別結(jié)果調(diào)整為“智能紫菜包飯”。語(yǔ)音識(shí)別服務(wù)器200將與調(diào)整的“智能紫菜包飯”相應(yīng)的控制信息發(fā)送到語(yǔ)音識(shí)別設(shè)備100。當(dāng)接收到語(yǔ)音識(shí)別結(jié)果時(shí),語(yǔ)音識(shí)別設(shè)備100選擇“智能紫菜包飯”的鏈接并顯示相關(guān)的網(wǎng)頁(yè)。圖4是根據(jù)示例性實(shí)施例的語(yǔ)音識(shí)別方法的流程圖。圖5是根據(jù)示例性實(shí)施例的語(yǔ)音識(shí)別方法的流程圖。參照?qǐng)D4和圖5,語(yǔ)音識(shí)別設(shè)備100從用戶(hù)接收語(yǔ)音輸入(S400)。語(yǔ)音識(shí)別設(shè)備100將語(yǔ)音輸入數(shù)據(jù)和語(yǔ)音可識(shí)別信息發(fā)送到語(yǔ)音識(shí)別服務(wù)器200 (S420)。語(yǔ)音可識(shí)別信息可包括預(yù)先存儲(chǔ)在語(yǔ)音識(shí)別設(shè)備100中的多個(gè)詞語(yǔ)、或在語(yǔ)音輸入被從用戶(hù)接收時(shí)顯示在屏幕中的網(wǎng)頁(yè)或菜單的文本信息。語(yǔ)音可識(shí)別信息可還包括網(wǎng)頁(yè)的圖像或圖像的名稱(chēng)、或網(wǎng)頁(yè)的鏈接信息。當(dāng)接收到語(yǔ)音輸入數(shù)據(jù)和語(yǔ)音可識(shí)別信息時(shí),語(yǔ)音識(shí)別服務(wù)器200僅相對(duì)于語(yǔ)音可識(shí)別信息來(lái)識(shí)別語(yǔ)音輸入數(shù)據(jù)(S440)。更具體地講,通過(guò)使用語(yǔ)音輸入數(shù)據(jù)執(zhí)行語(yǔ)音識(shí)別(S442)。如果語(yǔ)音識(shí)別結(jié)果類(lèi)似卻不同于語(yǔ)音可識(shí)別信息,則語(yǔ)音識(shí)別結(jié)果被調(diào)整以被識(shí)別為最類(lèi)似的語(yǔ)音可識(shí)別信息(S444)。在圖I中示出詳細(xì)的示例性實(shí)施例,將省略描述。語(yǔ)音識(shí)別結(jié)果被發(fā)送到語(yǔ)音識(shí)別設(shè)備100 (S460),并且語(yǔ)音識(shí)別設(shè)備100接收識(shí)別結(jié)果以進(jìn)行操作。因此,在識(shí)別詞語(yǔ)方面不受限制的通用語(yǔ)音識(shí)別引擎可準(zhǔn)確地識(shí)別在特定領(lǐng)域使用的有限數(shù)量的詞語(yǔ)。 如上所述,語(yǔ)音識(shí)別設(shè)備、語(yǔ)音識(shí)別服務(wù)器、語(yǔ)音識(shí)別系統(tǒng)和語(yǔ)音識(shí)別方法可使用在識(shí)別詞語(yǔ)方面不受限制的通用語(yǔ)音識(shí)別引擎,準(zhǔn)確地識(shí)別在特定領(lǐng)域使用的有限數(shù)量的詞語(yǔ)。雖然若干示例性實(shí)施例已被示出并描述,但是本領(lǐng)域的技術(shù)人員將理解,在不脫離本發(fā)明的原則和精神的情況下,可對(duì)那些示例性實(shí)施例進(jìn)行改變,其中,本發(fā)明的范圍在權(quán)利要求及其等同物中限定。
權(quán)利要求
1.一種語(yǔ)音識(shí)別設(shè)備,包括 語(yǔ)音輸入單元,從用戶(hù)接收語(yǔ)音輸入; 圖像處理器,處理圖像; 顯示單元,在其上顯示圖像處理結(jié)果;以及 控制器,將語(yǔ)音輸入的數(shù)據(jù)和語(yǔ)音可識(shí)別信息發(fā)送到語(yǔ)音識(shí)別引擎,并從語(yǔ)音識(shí)別引擎接收識(shí)別結(jié)果,其中,所述識(shí)別結(jié)果指示語(yǔ)音輸入的數(shù)據(jù)是否對(duì)應(yīng)于所述語(yǔ)音可識(shí)別信肩、O
2.如權(quán)利要求I所述的語(yǔ)音識(shí)別設(shè)備,其中,語(yǔ)音可識(shí)別信息包括文本信息。
3.如權(quán)利要求I所述的語(yǔ)音識(shí)別設(shè)備,其中,語(yǔ)音可識(shí)別信息包括作為語(yǔ)音識(shí)別的對(duì)象的多個(gè)詞語(yǔ)。
4.如權(quán)利要求I所述的語(yǔ)音識(shí)別設(shè)備,其中,語(yǔ)音可識(shí)別信息包括圖像或圖像的名稱(chēng)。
5.如權(quán)利要求I所述的語(yǔ)音識(shí)別設(shè)備,其中,語(yǔ)音可識(shí)別信息包括網(wǎng)頁(yè)的鏈接信息或菜單項(xiàng)。
6.如權(quán)利要求I所述的語(yǔ)音識(shí)別設(shè)備,其中,語(yǔ)音可識(shí)別信息包括文本,其中,所述文本包括在語(yǔ)音輸入被接收時(shí)顯示的網(wǎng)頁(yè)或菜單的至少一個(gè)詞語(yǔ)。
7.如權(quán)利要求I所述的語(yǔ)音識(shí)別設(shè)備,其中,語(yǔ)音識(shí)別引擎在安裝在語(yǔ)音識(shí)別設(shè)備中的裝置中操作。
8.如權(quán)利要求I所述的語(yǔ)音識(shí)別設(shè)備,其中,語(yǔ)音識(shí)別引擎在安裝在外設(shè)于語(yǔ)音識(shí)別設(shè)備的語(yǔ)音識(shí)別服務(wù)器中的裝置中操作。
9.一種語(yǔ)音識(shí)別系統(tǒng),包括 如權(quán)利要求I到權(quán)利要求6中的任何一個(gè)權(quán)利要求所述的語(yǔ)音識(shí)別設(shè)備; 語(yǔ)音識(shí)別服務(wù)器,從語(yǔ)音識(shí)別設(shè)備接收語(yǔ)音輸入數(shù)據(jù)和語(yǔ)音可識(shí)別信息,確定語(yǔ)音輸入數(shù)據(jù)是否對(duì)應(yīng)于語(yǔ)音可識(shí)別信息,并將識(shí)別結(jié)果發(fā)送到語(yǔ)音識(shí)別設(shè)備, 其中,語(yǔ)音識(shí)別引擎在安裝在外設(shè)于語(yǔ)音識(shí)別設(shè)備的語(yǔ)音識(shí)別服務(wù)器中的裝置中操作。
10.一種語(yǔ)音識(shí)別方法,包括 通過(guò)語(yǔ)音識(shí)別設(shè)備接收語(yǔ)音輸入; 將語(yǔ)音輸入的數(shù)據(jù)和語(yǔ)音可識(shí)別信息發(fā)送到語(yǔ)音識(shí)別服務(wù)器; 確定語(yǔ)音輸入的數(shù)據(jù)是否對(duì)應(yīng)于語(yǔ)音可識(shí)別信息;以及 將語(yǔ)音識(shí)別結(jié)果發(fā)送到語(yǔ)音識(shí)別設(shè)備,其中,所述語(yǔ)音識(shí)別結(jié)果指示輸入語(yǔ)音的數(shù)據(jù)是否對(duì)應(yīng)于語(yǔ)音可識(shí)別信息。
11.如權(quán)利要求10所述的語(yǔ)音識(shí)別方法,其中,語(yǔ)音可識(shí)別信息包括文本信息。
12.如權(quán)利要求10所述的語(yǔ)音識(shí)別方法,其中,語(yǔ)音可識(shí)別信息包括作為語(yǔ)音識(shí)別的對(duì)象的多個(gè)詞語(yǔ)。
13.如權(quán)利要求10所述的語(yǔ)音識(shí)別方法,其中,語(yǔ)音可識(shí)別信息包括圖像或圖像的名稱(chēng)。
14.如權(quán)利要求10所述的語(yǔ)音識(shí)別方法,其中,語(yǔ)音可識(shí)別信息包括網(wǎng)頁(yè)的鏈接信息或菜單項(xiàng)。
15.如權(quán)利要求10所述的語(yǔ)音識(shí)別方法,其中,語(yǔ)音可識(shí)別信息包括文本,其中,所述文本包括在語(yǔ)音 輸入被接收時(shí)顯示的網(wǎng)頁(yè)或菜單的至少一個(gè)詞語(yǔ)。
全文摘要
一種語(yǔ)音識(shí)別設(shè)備、語(yǔ)音識(shí)別服務(wù)器、語(yǔ)音識(shí)別系統(tǒng)和方法,在其中,通用語(yǔ)音識(shí)別引擎可準(zhǔn)確地識(shí)別在特定領(lǐng)域使用的有限數(shù)量的詞語(yǔ)。
文檔編號(hào)G10L15/30GK102930867SQ20121026078
公開(kāi)日2013年2月13日 申請(qǐng)日期2012年7月25日 優(yōu)先權(quán)日2011年8月8日
發(fā)明者樸殷相 申請(qǐng)人:三星電子株式會(huì)社