備之間傳輸。通信接口 524可以包含調制解調器、網絡接口(如以太網卡)、通信端口、PCMCIA插槽和卡或類似接口。軟件和數據通過通信接口 524以可能是電子的、電磁的、光學的或可以被通信接口 524接收的其他信號的信號形式被傳輸。這些信號通過通信通道526被提供給通信接口 524。通信通道526承載信號并可以使用導線或電纜、光纖、電話線、蜂窩電話鏈路、射頻鏈路或其他通信通道實施。
[0061 ] 在本文中,術語“計算機程序介質”和“計算機可用介質”被用于總體指代諸如可移動存儲單元518、可移動存儲單元522和安裝在硬盤驅動512中的硬盤等介質。計算機程序介質和計算機可用介質也可以指存儲器,例如可能是存儲器半導體的(如動態(tài)隨機存取存儲器等)的主存儲器508和次存儲器510。這些計算機程序產品為計算機系統(tǒng)500提供軟件。
[0062]計算機程序(也被稱為計算機控制邏輯)被存儲在主存儲器508和/或次存儲器510中。計算機程序也可以通過通信接口 524被接收。當被執(zhí)行時,這些計算機程序使計算機系統(tǒng)500能夠實施本文所討論的本發(fā)明的實施方案。具體地說,當被執(zhí)行時,計算機程序使處理器504能夠實施本發(fā)明的實施方案的過程,例如實施可以在如上所述的系統(tǒng)500中實施的由圖3的流程圖300所示的方法和由圖4的流程圖400所示的方法中的步驟。其中,本發(fā)明的實施方案使用軟件實施,該軟件可以被儲存在計算機程序產品中并使用可移動存儲驅動514、接口 520、硬盤驅動512或通信接口 524被加載到計算機系統(tǒng)500內。
[0063]本發(fā)明的實施方案還針對包含儲存在任何計算機可用介質上的軟件的計算機程序產品。當在一個或多個數據處理設備上執(zhí)行時,該軟件使數據處理設備按本文的描述進行操作。本發(fā)明的實施方案采用現在已知或將來的任何計算機可用或計算機可讀介質。計算機可用介質的實例包括,但不限于,主存儲設備(如任何類型的隨機存取存儲器)、次存儲設備(如硬驅動、軟盤、⑶R0M、ZIP盤、磁帶、磁性存儲設備、光存儲設備、MEMS、納米技術存儲設備等)和通信介質(如有線和無線通信網、局域網、廣域網、內部網等)。
[0064]5.結論
[0065]應該認識到,詳細描述章節(jié)而不是概述及摘要章節(jié)旨在用于解釋權利要求。概述和摘要章節(jié)可能闡明一個或多個但并非由發(fā)明者考慮的本發(fā)明的所有示例性實施方案,并且因此,并不旨在以任何方式限制本發(fā)明和所附權利要求。
[0066]上面在功能組成框的輔助下描述了本發(fā)明的實施方案,該功能組成框闡述了特定功能的實施和其間的關系。為方便描述,這些功能組成框的邊界在本文中沒有特意定義。只要其中的特定功能和其間的關系被正確地執(zhí)行,可選的邊界是可以定義的。
[0067]前面對特定實施方案的描述將如此完全的揭示本發(fā)明的一般性質以至于其他人通過應用相關領域技術人員的知識,不用過度的實驗,不脫離本發(fā)明的一般概念,就可以容易地修改和/或調整這些特定實施方案的各種應用。因此,基于本文所呈現的教導和指導,這些調整和修改旨在落入所公開的實施方案的意義和范圍內。應理解,本文中的措辭和術語是出于描述的目的而不是進行限制,因此本說明書的術語和措辭由技術人員根據教導和指導來解釋。
[0068]本發(fā)明的廣度和范圍不應被上面描述的任何示例性實施方案所限制,而是只能根據所附的權利要求和它們的等效物來限定。
【主權項】
1.一種用于語音識別的方法,所述方法包括: 接收表示聲音命令的數據; 基于與一個或多個目標中的每個目標相關的狀態(tài)信息,生成所述一個或多個目標的列表;以及 基于所述聲音命令從所述目標的列表中選擇目標。2.如權利要求1所述的方法,還包括: 在所選擇的目標上執(zhí)行所述聲音命令。3.如權利要求1所述的方法,還包括: 基于所述目標的列表截斷語言模型;以及 使用截斷的語言解碼所述聲音命令。4.如權利要求3所述的方法,其中,對所述語言模型的所述截斷包括:基于所述目標的列表的識別、所述目標的列表的狀態(tài)信息、與所述目標的列表相關的傳感器信息或其組合,去除所述語言模型的一個或多個部分。5.如權利要求1所述的方法,其中,所述接收包括從所述數據去除一個或多個環(huán)境條件。6.如權利要求5所述的方法,其中,所述去除包括從所述數據中消除噪聲、消除回聲、去除混響或其組合。7.如權利要求1所述的方法,其中,所述接收包括從多個位置中的一個位置接收所述數據。8.如權利要求1所述的方法,其中,所述選擇包括基于學習算法挑選所選擇的目標,所述學習算法包含含有所述選擇的目標的一個或多個過去的選擇的學習算法、所述數據從中被接收的位置或其組合。9.如權利要求1所述的方法,其中,所述選擇包括:當出現兩個或多于兩個被選擇的目標時,請求用戶進行澄清,以選擇一個目標。10.一種用于語音識別的裝置,所述裝置包括: 數據接收模塊,所述數據接收模塊被配置為接收表示聲音命令的數據; 列表生成模塊,所述列表生成模塊被配置為基于與一個或多個目標中的每一個目標相關的狀態(tài)信息生成所述一個或多個目標的列表;以及 目標選擇模塊,所述目標選擇模塊被配置為基于所述聲音命令從所述目標的列表中選擇目標。11.如權利要求10所述的裝置,還包括: 任務執(zhí)行模塊,所述任務執(zhí)行模塊被配置為在所選擇的目標上執(zhí)行所述聲音命令。12.如權利要求10所述的裝置,還包括: 語言截斷模塊,所述語言截斷模塊被配置為基于所述目標的列表截斷語言模型;以及 聲音解碼器,所述聲音解碼器被配置為使用所截斷的語言模型解碼所述聲音命令。13.如權利要求12所述的裝置,其中,所述語言截斷模塊被配置為,基于所述目標的列表的識別、所述目標的列表的狀態(tài)信息、與所述目標的列表相關的傳感器信息或其組合,去除所述語言模型中的一個或多個部分。14.如權利要求10所述的裝置,其中,所述數據接收模塊被配置為從所述數據去除一個或多個環(huán)境條件。15.如權利要求10所述的裝置,其中,所述數據接收模塊被配置為從多個位置中的一個位置接收所述數據。16.如權利要求10所述的裝置,還包括: 目標澄清模塊,所述目標澄清模塊被配置為,當所述目標選擇模塊從所述目標的列表中選擇多于一個目標時,確定所選擇的目標; 其中,所述目標選擇模塊被配置為基于學習算法學習如何確定所述所選擇的目標,所述學習算法含有所述所選擇的目標的一個或多個過去的選擇、所述數據從中被接收的位置或其組合。17.一種計算機程序產品,所述計算機程序產品包括其上記錄了計算機程序邏輯的計算機可用介質,當被一個或多個處理器執(zhí)行時,所述計算機程序邏輯將在語音識別系統(tǒng)中處理表示聲音命令的多個數據,所述計算機程序邏輯包括: 第一計算機可讀程序代碼,所述第一計算機可讀程序代碼使處理器能夠接收表示聲音命令的數據; 第二計算機可讀程序代碼,所述第二計算機可讀程序代碼使處理器能夠基于與一個或多個目標中的每一個目標相關的狀態(tài)信息生成所述一個或多個目標的列表;以及 第三計算機可讀程序代碼,所述第三計算機可讀程序代碼使處理器能夠基于所述聲音命令從所述目標的列表中選擇目標。18.如權利要求17所述的計算機程序產品,還包括: 第四計算機可讀程序代碼,所述第四計算機可讀程序代碼使處理器能夠在所選擇的目標上執(zhí)行所述聲音命令。19.如權利要求17所述的計算機程序產品,還包括: 第五計算機可讀程序代碼,所述第五計算機可讀程序代碼使處理器能夠基于所述目標的列表截斷語言模型; 第六計算機可讀程序代碼,所述第六計算機可讀程序代碼使處理器能夠基于所述目標的列表、目標的目標狀態(tài)或傳感器信息截斷所述語言模型;以及 第七計算機可讀程序代碼,所述第七計算機可讀程序代碼使處理器能夠使用所截斷的語言解碼所述聲音命令。20.如權利要求17所述的計算機程序產品,其中,所述第三計算機可讀程序代碼包括,當出現兩個或多于兩個所選擇的目標時,請求用戶澄清以選擇一個目標。
【專利摘要】本發(fā)明的實施方案包含用于聲音命令的語音識別的裝置、方法和系統(tǒng)。所述方法可以包含接收表示語音命令的數據、基于系統(tǒng)內的每一個目標的狀態(tài)信息生成目標列表、以及基于聲音命令從目標列表中選擇目標。
【IPC分類】G10L15/28
【公開號】CN105229727
【申請?zhí)枴緾N201480012314
【發(fā)明人】奧加斯·阿肖克·巴帕特
【申請人】賽普拉斯半導體公司
【公開日】2016年1月6日
【申請日】2014年1月7日
【公告號】DE112014000373T5, US20140195233, WO2014110041A1