欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

語音識別方法及裝置的制造方法

文檔序號:10534809閱讀:433來源:國知局
語音識別方法及裝置的制造方法
【專利摘要】本發(fā)明實施例提供一種語音識別方法及裝置。該方法包括:獲取語音信息對應的目標文本的多個分詞;確定多個分詞中的目標詞;確定多個分詞中各非目標詞與目標詞的關聯(lián)關系;根據(jù)各非目標詞與目標詞的關聯(lián)關系,確定各非目標詞與目標詞的關聯(lián)度;根據(jù)該關聯(lián)度,確定用戶的業(yè)務需求。本發(fā)明實施例通過各非目標詞與目標詞的關聯(lián)度確定用戶的業(yè)務需求,該關聯(lián)度反映出用戶期望獲得該目標詞的該業(yè)務屬性對應的業(yè)務內容的強烈程度,不同的業(yè)務屬性與用戶需求之間的關聯(lián)度不同,通過關聯(lián)度大小可確定出用戶真正的業(yè)務需求,相比于單純通過核心詞或單純從各業(yè)務可識別的分詞的個數(shù)的大小確定語音信息對應的目標業(yè)務,提高了分析語音信息中用戶需求的準確度。
【專利說明】
語音識別方法及裝置
技術領域
[0001] 本發(fā)明實施例涉及語音識別技術領域,尤其涉及一種語音識別方法及裝置。
【背景技術】
[0002] 語音識別是非常重要的人機交互技術,并且語音識別技術已經(jīng)成為了研究熱點。
[0003] 現(xiàn)有技術通過詞法分析、句法分析和語義分析獲得語音信息中的核心詞,通過核 心詞確定語音信息對應的目標業(yè)務,或者通過詞法分析、句法分析和語義分析獲得語音信 息中的多個分詞,確定預設的各業(yè)務可識別的分詞的個數(shù),比較各業(yè)務可識別的分詞的個 數(shù)的大小確定語音信息對應的目標業(yè)務。
[0004] 單純通過核心詞確定語音信息對應的目標業(yè)務,最終可能會出現(xiàn)多個目標業(yè)務, 用戶需要依次查看各目標業(yè)務,并確定各目標業(yè)務是否為其真正期望的業(yè)務;單純從各業(yè) 務可識別的分詞的個數(shù)的大小確定語音信息對應的目標業(yè)務的方法并沒有真正理解用戶 發(fā)出該語音信息的意圖,導致確定的目標業(yè)務可能不是用戶真正期望的業(yè)務;因此,現(xiàn)有技 術無法準確分析出語音信息中的用戶需求。

【發(fā)明內容】

[0005] 本發(fā)明實施例提供一種語音識別方法及裝置,以準確分析語音信息中的用戶需 求。
[0006] 本發(fā)明實施例的一個方面是提供一種語音識別方法,包括:
[0007] 獲取語音信息對應的目標文本的多個分詞;
[0008] 確定所述多個分詞中的目標詞;
[0009] 根據(jù)所述目標詞的業(yè)務屬性,確定所述多個分詞中各非目標詞與所述目標詞的關 聯(lián)關系;
[0010] 根據(jù)所述各非目標詞與所述目標詞的關聯(lián)關系,確定所述各非目標詞與所述目標 詞的關聯(lián)度;
[0011] 根據(jù)所述各非目標詞與所述目標詞的關聯(lián)度,確定用戶的業(yè)務需求。
[0012] 本發(fā)明實施例的另一個方面是提供一種語音識別裝置,包括:
[0013] 分詞處理模塊,用于獲取語音信息對應的目標文本的多個分詞;
[0014]目標詞確定模塊,用于確定所述多個分詞中的目標詞;
[0015] 關聯(lián)關系確定模塊,用于根據(jù)所述目標詞的業(yè)務屬性,確定所述多個分詞中各非 目標詞與所述目標詞的關聯(lián)關系;
[0016] 關聯(lián)度計算模塊,用于根據(jù)所述各非目標詞與所述目標詞的關聯(lián)關系,確定所述 各非目標詞與所述目標詞的關聯(lián)度;
[0017] 業(yè)務需求確定模塊,用于根據(jù)所述各非目標詞與所述目標詞的關聯(lián)度,確定用戶 的業(yè)務需求。
[0018] 本發(fā)明實施例提供的語音識別方法及裝置,通過分析語音信息對應的分詞,確定 分詞中的目標詞和非目標詞,根據(jù)目標詞的業(yè)務屬性確定各非目標詞與目標詞的關聯(lián)關 系,依據(jù)各非目標詞與目標詞的關聯(lián)關系確定各非目標詞與目標詞的關聯(lián)度,從而確定業(yè) 務屬性與用戶需求之間的關聯(lián)度,該關聯(lián)度反映出用戶期望獲得該目標詞的該業(yè)務屬性對 應的業(yè)務內容的強烈程度,不同的業(yè)務屬性與用戶需求之間的關聯(lián)度不同,通過關聯(lián)度大 小可確定出用戶真正的業(yè)務需求,相比于單純通過核心詞確定語音信息對應的目標業(yè)務, 或單純從各業(yè)務可識別的分詞的個數(shù)的大小確定語音信息對應的目標業(yè)務,提高了分析語 音信息中用戶需求的準確度。
【附圖說明】
[0019] 圖1為本發(fā)明實施例提供的語音識別方法流程圖;
[0020] 圖2為本發(fā)明另一實施例提供的語音識別方法流程圖;
[0021 ]圖3為本發(fā)明另一實施例提供的語音識別方法流程圖;
[0022]圖4為本發(fā)明另一實施例提供的語音識別方法流程圖;
[0023]圖5為本發(fā)明實施例提供的語音識別裝置的結構圖;
[0024]圖6為本發(fā)明另一實施例提供的語音識別裝置的結構圖。
【具體實施方式】
[0025] 圖1為本發(fā)明實施例提供的語音識別方法流程圖。現(xiàn)有技術通過分析語音信息的 關鍵詞,根據(jù)關鍵詞分析出擴充的檢索關鍵詞,依據(jù)關鍵詞或擴充的檢索關鍵詞進行檢索 得到的檢索結果可能為多個,用戶需要依次查看每個檢索結果,以判定該檢索結果是否為 其真正想要的查詢結果,因此,降低了對用戶需求的識別精度,針對該技術問題,本發(fā)明實 施例提供了語音識別方法,本發(fā)明實施例提供的語音識別方法的執(zhí)行主體可以為語音識別 裝置,也可以為用于執(zhí)行上述語音識別方法的終端設備或服務器。具體的,該終端設備可以 為智能電視、智能手機、平板電腦、筆記本電腦、超級移動個人計算機(英文 :Ultra-m〇bile Personal Computer,簡稱:UMPC)、上網(wǎng)本、個人數(shù)字助理(英文:Personal Digital Assistant,簡稱:PDA)等終端設備。其中,語音識別裝置可以為上述終端設備或服務器中的 中央處理器(英文:Central Processing Unit,簡稱CPU)或者可以為上述終端設備或服務 器中的控制單元或者功能模塊。
[0026] 本發(fā)明實施例提供的語音識別方法的具體步驟如下:
[0027]步驟S101、獲取語音信息對應的目標文本的多個分詞;
[0028]本發(fā)明實施例的執(zhí)行主體可以為具有一定處理能力的設備,例如服務器,該服務 器與具有通信功能的設備例如移動終端進行無線通信,該移動終端錄制用戶輸入的自然語 言,并將該自然語言對應的語音信息發(fā)送給服務器,該服務器將所述語音信息轉化為目標 文本,轉化的方法可以采用現(xiàn)有技術中的任何一種方法,進一步,該服務器對目標文本進行 分詞處理獲得多個分詞,本發(fā)明實施例不限定對目標文本進行分詞處理的方法,具體可以 采用正向最大匹配方法。例如,用戶輸入的自然語言對應的目標文本是"我想聽小蘋果",采 用正向最大匹配方法將"我想聽小蘋果"分解為"我"、"想"、"聽"、"小蘋果"。
[0029]步驟S102、確定所述多個分詞中的目標詞;
[0030] 該服務器中存儲有多種業(yè)務,例如,影視業(yè)務、音樂業(yè)務、小說業(yè)務等,根據(jù)各業(yè)務 確定該業(yè)務支持的目標詞,例如,影視業(yè)務包括《瑯琊榜》、《小蘋果》等影視節(jié)目,音樂業(yè)務 包括《忘情水》、《小蘋果》等音樂歌曲,小說業(yè)務包括《瑯琊榜》、《完美世界》等小說,則"狼琊 榜"和"小蘋果"是影視業(yè)務支持的目標詞,"忘情水"和"小蘋果"是音樂業(yè)務支持的目標詞, "狼琊榜"和"完美世界"是小說業(yè)務支持的目標詞,該服務器將各業(yè)務支持的目標詞,以及 該目標詞對應的業(yè)務屬性存入知識庫中,則該知識庫中存儲有同一個目標詞的不同業(yè)務屬 性,例如,"小蘋果"既對應有影視屬性,也對應有音樂屬性,"狼琊榜"既對應有影視屬性,也 對應有小說屬性。
[0031] 當該服務器獲取出目標文本的多個分詞后,根據(jù)各分詞查詢該知識庫,若該分詞 與該知識庫中的目標詞匹配,則將該分詞作為該目標文本的目標詞,例如,目標文本"我想 聽小蘋果"分解為"我"、"想""聽""小蘋果" 4個分詞,分詞"小蘋果"是知識庫中的目標詞,分 詞"我"、"想"、"聽"不是知識庫中的目標詞,則將"小蘋果"作為目標文本"我想聽小蘋果"的 目標詞,"我"、"想"、"聽"作為目標文本"我想聽小蘋果"的非目標詞。
[0032] 步驟S103、根據(jù)所述目標詞的業(yè)務屬性,確定所述多個分詞中各非目標詞與所述 目標詞的關聯(lián)關系;
[0033] 在該知識庫中,對應同一目標詞的各業(yè)務屬性存儲有關聯(lián)詞,該關聯(lián)詞包括修飾 詞、動詞、量詞、疑問詞、意圖詞、人稱代詞等,例如,對于"狼琊榜"的影視屬性,"胡歌"是"狼 琊榜"的修飾詞,"看"是"瑯琊榜"的動詞,"第八集"是"瑯琊榜"的量詞,"是不是"、"有沒有" 是"狼琊榜"的疑問詞,"想"、"期待"是"狼琊榜"的意圖詞,"我"是"狼琊榜"的人稱代詞等。
[0034] 另外,關聯(lián)詞的類型確定了該關聯(lián)詞與該目標詞的關聯(lián)關系,例如,"胡歌"是"瑯 琊榜"的修飾詞,"胡歌"和"瑯琊榜"是修飾詞關系;"看"是"瑯琊榜"的動詞,"看"和"瑯琊 榜"是動詞關系;"第八集"是"瑯琊榜"的量詞,"第八集"和"瑯琊榜"是量詞關系。
[0035] 同理,對于目標詞"小蘋果",該知識庫中存儲有其影視屬性對應的關聯(lián)詞,以及音 樂屬性對應的關聯(lián)詞,該影視屬性對應的關聯(lián)詞和該音樂屬性對應的關聯(lián)詞可以不同,例 如,對于"小蘋果"的音樂屬性,"聽"是"小蘋果"的動詞,"看"不是"小蘋果"的動詞,對于"小 蘋果"的影視屬性,"聽"不是"小蘋果"的動詞,"看"是"小蘋果"的動詞。通過"小蘋果"的關 聯(lián)詞的類型可確定該關聯(lián)詞與"小蘋果"的關聯(lián)關系。
[0036] 例如,對于"小蘋果"的音樂屬性,通過該知識庫確定出非目標詞"我"是"小蘋果" 的人稱代詞,"我"和"小蘋果"之間的關聯(lián)關系是人稱代詞關系;非目標詞"想"是"小蘋果" 的意圖詞,"想"和"小蘋果"之間的關聯(lián)關系是意圖詞關系;非目標詞"聽"是"小蘋果"的動 詞,"聽"和"小蘋果"之間的關聯(lián)關系是動詞關系。
[0037] 對于"小蘋果"的影視屬性,非目標詞"我"是"小蘋果"的人稱代詞,"我"和"小蘋 果"之間的關聯(lián)關系是人稱代詞關系;非目標詞"想"是"小蘋果"的意圖詞,"想"和"小蘋果" 之間的關聯(lián)關系是意圖詞關系;非目標詞"聽"不是"小蘋果"的動詞,"聽"和"小蘋果"之間 沒有關耳關關系。
[0038] 步驟S104、根據(jù)所述各非目標詞與所述目標詞的關聯(lián)關系,確定所述各非目標詞 與所述目標詞的關聯(lián)度;
[0039]對于"小蘋果"的音樂屬性,根據(jù)上述步驟S103確定的"我"、"想"、"聽"分別與"小 蘋果"的關聯(lián)關系,確定出"我"、"想"、"聽"與"小蘋果"的關聯(lián)度1;對于"小蘋果"的影視屬 性,根據(jù)上述步驟S103確定的"我"、"想"、"聽"分別與"小蘋果"的關聯(lián)關系,確定出"我"、 "想"、"聽"與"小蘋果"的關聯(lián)度2,具體的關聯(lián)度計算方法將在下面的實施例中詳述。
[0040] 步驟S105、根據(jù)所述各非目標詞與所述目標詞的關聯(lián)度,確定用戶的業(yè)務需求;
[0041] 對于同一目標詞的不同業(yè)務屬性,可獲得各非目標詞與目標詞的不同的關聯(lián)度, 例如,對于"小蘋果"的音樂屬性,"聽"與"小蘋果"之間是動詞關系,對于"小蘋果"的影視屬 性,"聽"與"小蘋果"之間沒有關聯(lián)關系,因此,根據(jù)步驟S104確定出的關聯(lián)度1和關聯(lián)度2不 相同,根據(jù)關聯(lián)度1和關聯(lián)度2的大小可確定出用戶的業(yè)務需求,若關聯(lián)度1大于關聯(lián)度2,則 確定用戶的業(yè)務需求是歌曲"小蘋果",該服務器向移動終端直接返回"小蘋果"的歌曲文 件。
[0042] 依照現(xiàn)有技術,通過對目標文本"我想聽小蘋果"的語義分析、語法分析確定關鍵 詞是"小蘋果",或者根據(jù)該關鍵詞"小蘋果"延伸出擴充的檢索關鍵詞如"影視""音樂",根 據(jù)"小蘋果"、"影視"、"音樂"搜索獲得多個結果,包括歌曲文件"小蘋果"和影視文件"小蘋 果",用戶需要從多個檢索結果中選擇其真正想要的查詢結果,而本發(fā)明實施例可精確獲知 用戶最期望獲得的業(yè)務如歌曲"小蘋果",該服務器向移動終端直接返回"小蘋果"的歌曲文 件即可。
[0043] 本發(fā)明實施例通過分析語音信息對應的分詞,確定分詞中的目標詞和非目標詞, 根據(jù)目標詞的業(yè)務屬性確定各非目標詞與目標詞的關聯(lián)關系,依據(jù)各非目標詞與目標詞的 關聯(lián)關系確定各非目標詞與目標詞的關聯(lián)度,從而確定業(yè)務屬性與用戶需求之間的關聯(lián) 度,該關聯(lián)度反映出用戶期望獲得該目標詞的該業(yè)務屬性對應的業(yè)務內容的強烈程度,不 同的業(yè)務屬性與用戶需求之間的關聯(lián)度不同,通過關聯(lián)度大小可確定出用戶真正的業(yè)務需 求,相比于單純通過核心詞確定語音信息對應的目標業(yè)務,或單純從各業(yè)務可識別的分詞 的個數(shù)的大小確定語音信息對應的目標業(yè)務,提高了分析語音信息中用戶需求的準確度。
[0044] 圖2為本發(fā)明另一實施例提供的語音識別方法流程圖。在上述實施例的基礎上,本 發(fā)明實施例提供的語音識別方法的具體步驟如下:
[0045] 步驟S201、獲取語音信息對應的目標文本的多個分詞;
[0046] 步驟S202、確定所述多個分詞中的目標詞;
[0047] 步驟S201與步驟S101的方法一致,步驟S202與步驟S102的方法一致,此處不再贅 述。
[0048]步驟S203、根據(jù)所述目標詞的業(yè)務屬性,確定所述目標詞左側的非目標詞與所述 目標詞的關聯(lián)關系,和/或,確定所述目標詞右側的非目標詞與所述目標詞的關聯(lián)關系;
[0049] 在上述實施例中,目標文本是"我想聽小蘋果",目標詞是"小蘋果",非目標詞是 "我"、"想"、"聽",確定所述多個分詞中各非目標詞與所述目標詞的關聯(lián)關系的具體方法 為:從"小蘋果"的左側開始依次確定"聽"與"小蘋果"的關聯(lián)關系、"想"與"小蘋果"的關聯(lián) 關系、"我"與"小蘋果"的關聯(lián)關系。
[0050] 又如,目標文本是"瑯琊榜第一集",目標詞是"瑯琊榜",非目標詞是"第一集",從 "瑯琊榜"的右側開始確定"第一集"與"瑯琊榜"的關聯(lián)關系。
[0051] 再如,目標文本是"胡歌的瑯琊榜第一集",目標詞是"狼琊榜",非目標詞是"胡歌" 和"第一集",以"狼琊榜"為中心,分別從右邊和左邊確定各非目標詞與目標詞的關聯(lián)關系, 關聯(lián)關系的確定方法與上述步驟S103-致,此處不再贅述。
[0052] 步驟S204、根據(jù)所述各非目標詞與所述目標詞的關聯(lián)關系,確定所述各非目標詞 與所述目標詞的關聯(lián)度;
[0053]步驟S205、根據(jù)所述各非目標詞與所述目標詞的關聯(lián)度,確定用戶的業(yè)務需求。 [0054] 步驟S204與步驟S104的方法一致,步驟S205與步驟S105的方法一致。
[0055] 本發(fā)明實施例從目標詞的左側開始確定非目標詞與目標詞的關聯(lián)關系,和/或,從 目標詞的右側開始確定非目標詞與目標詞的關聯(lián)關系,保證了各非目標詞與目標詞的關聯(lián) 關系的有序性。
[0056] 圖3為本發(fā)明另一實施例提供的語音識別方法流程圖。在上述實施例的基礎上,本 發(fā)明實施例提供的語音識別方法的具體步驟如下:
[0057]步驟S301、獲取語音信息對應的目標文本的多個分詞;
[0058]步驟S302、確定所述多個分詞中的目標詞;
[0059] 步驟S301與步驟S101的方法一致,步驟S302與步驟S102的方法一致,此處不再贅 述。
[0060] 步驟S303、根據(jù)所述多個分詞中各非目標詞與所述目標詞查詢關系表,所述關系 表包括參考非目標詞與所述目標詞的依賴關系;
[0061] 在本發(fā)明實施例中,關系表具體如表1所示:
[0062] 表 1
[0064] 該關系表包括目標詞、目標詞對應的業(yè)務屬性、每種業(yè)務屬性對應目標詞的多個 參考非目標詞,參考非目標詞包括修飾詞、動詞、量詞、疑問詞和意圖詞,每一類參考非目標 詞可包括多個詞,該關系表可以為上述實施例中的知識庫,本發(fā)明實施例不限定參考非目 標詞的種類,例如,該參考非目標詞還可以包括同位語詞、形容詞、副詞等。另外,參考非目 標詞的類型可確定該參考非目標詞與"小蘋果"的依賴關系,例如,"修飾詞"與"小蘋果"的 依賴關系為修飾詞關系,"動詞"與"小蘋果"的依賴關系為動詞關系。
[0065] 對于目標文本"我想聽小蘋果",根據(jù)非目標詞"我"、"想"、"聽"和目標詞"小蘋果" 查詢該關系表,確定該關系表中對應"小蘋果"的各業(yè)務屬性是否存在與"我"、"想"、"聽"匹 配的參考非目標詞。
[0066] 步驟S304、若所述非目標詞與所述關系表中的參考非目標詞匹配,則所述非目標 詞與所述目標詞的關聯(lián)關系為所述參考非目標詞與所述目標詞的依賴關系;
[0067] 例如,對于"小蘋果"的音樂屬性,該關系表的人稱代詞中包括"我",則"我"和"小 蘋果"之間的關聯(lián)關系是人稱代詞關系;意圖詞中包括"想",則"想"和"小蘋果"之間的關聯(lián) 關系是意圖詞關系;動詞中包括"聽",則"聽"和"小蘋果"之間的關聯(lián)關系是動詞關系。
[0068] 對于"小蘋果"的影視屬性,該關系表的人稱代詞中包括"我",則"我"和"小蘋果" 之間的關聯(lián)關系是人稱代詞關系;意圖詞中包括"想",則"想"和"小蘋果"之間的關聯(lián)關系 是意圖詞關系;動詞中不包括"聽",則"聽"和"小蘋果"之間沒有關聯(lián)關系。
[0069] 步驟S305、根據(jù)所述各非目標詞與所述目標詞的關聯(lián)關系,確定所述各非目標詞 與所述目標詞的關聯(lián)度;
[0070] 步驟S306、根據(jù)所述各非目標詞與所述目標詞的關聯(lián)度,確定用戶的業(yè)務需求。 [0071] 步驟S305與步驟S104的方法一致,步驟S306與步驟S105的方法一致。
[0072]本發(fā)明實施例通過查詢關系表確定各非目標詞與目標詞的關聯(lián)關系,提尚了關聯(lián) 關系的查詢效率。
[0073]圖4為本發(fā)明另一實施例提供的語音識別方法流程圖。在上述任一實施例的基礎 上,根據(jù)所述各非目標詞與所述目標詞的關聯(lián)關系,確定所述各非目標詞與所述目標詞的 關聯(lián)度具體包括如下步驟:
[0074]步驟S401、根據(jù)所述各非目標詞與所述目標詞的關聯(lián)關系確定所述關聯(lián)關系對應 的第一分值;
[0075]所述第一分值包括第一因子和第二因子;第一因子具體為影響因子分數(shù),第二因 子具體為匹配目標可能性分數(shù)。
[0076]步驟S402、依據(jù)所述第一分值計算所述各非目標詞與所述目標詞的關聯(lián)度。
[0077] 所述依據(jù)所述第一分值計算所述各非目標詞與所述目標詞的關聯(lián)度,包括如下步 驟:
[0078] (1)將所述目標文本中第一個非目標詞對應的第一因子乘以所述目標詞的第二分 值獲得第一中間值;
[0079] 假定目標文本中目標詞對應的非目標詞的集合為{分詞1,分詞2,…,分詞N},N為 非目標詞的總數(shù);將分詞1的影響因子分數(shù)?:乘以所述目標詞的第二分值,所述目標詞的第 二分值根據(jù)所述目標詞的長度、所述目標詞與所述非目標詞的依賴程度確定。具體的,本發(fā) 明實施例提供了各目標詞的自身規(guī)則,該自身規(guī)則包括規(guī)則1、規(guī)則2、規(guī)則3,其中,規(guī)則1為 目標詞是否需要單獨出現(xiàn);規(guī)則2為目標詞是否需要與預設的非目標詞同時出現(xiàn);規(guī)則3為 目標詞的長度是否大于閾值。
[0080] 知識庫中預先存儲了需要單獨出現(xiàn)的第一類目標詞和需要與預設的非目標詞同 時出現(xiàn)的第二類目標詞,以及第二類目標詞中各目標詞對應的需要同時出現(xiàn)的預設的非目 標詞。優(yōu)選的,第一類目標詞和第二類目標詞沒有交集,上述3條規(guī)則的優(yōu)先級依次遞減,各 目標詞的自身分值即第二分值根據(jù)該3條規(guī)則確定。
[0081] 以目標詞"小蘋果"為例,"小蘋果"的第二分值對應有初始值,確定"小蘋果"在目 標文本中的第二分值的具體方法如下:
[0082] 步驟1:根據(jù)規(guī)則1查詢知識庫,確定"小蘋果"屬于第一類目標詞,則判斷用戶輸入 的語音信息對應的目標文本是否只有"小蘋果"一個詞,如果是,執(zhí)行步驟2,否則跳轉到步 驟3;
[0083] 步驟2: "小蘋果"在目標文本中的第二分值保持初始值,并跳轉到步驟4;
[0084] 步驟3:將"小蘋果"在目標文本中的第二分值設置為預設值;
[0085] 例如,目標文本是"我想聽小蘋果",目標文本還包括除"小蘋果"之外的詞,則將 "小蘋果"在目標文本中的第二分值設置為預設值,該預設值小于初始值,到此為止不再跳 轉其他步驟。
[0086] 步驟4:根據(jù)規(guī)則2查詢知識庫,確定"小蘋果"不屬于第二類目標詞,執(zhí)行步驟5; [0087]步驟5:判斷"小蘋果"的長度是否大于閾值,若是,"小蘋果"在目標文本中的第二 分值保持初始值,否則,將"小蘋果"在目標文本中的第二分值設置為預設值。
[0088] 可見,若目標詞在目標文本中的第二分值保持初始值,則繼續(xù)執(zhí)行后續(xù)步驟,若目 標詞在目標文本中的第二分值設置為預設值,則不再執(zhí)行后續(xù)步驟。
[0089] 以目標詞"今天"為例,"今天"的第二分值對應有初始值,確定"今天"在目標文本 中的第二分值的具體方法如下:
[0090] 步驟1:根據(jù)規(guī)則1查詢知識庫,確定"今天"不屬于第一類目標詞,轉到步驟2;
[0091 ]步驟2:根據(jù)規(guī)則2查詢知識庫,確定"今天"屬于第二類目標詞,進一步,確定目標 文本中是否出現(xiàn)了目標詞"今天"對應的需要同時出現(xiàn)的預設非目標詞,假設知識庫中存儲 有與"今天"同時出現(xiàn)的預設非目標詞,該預設非目標詞包括"劉德華"、"宋慧喬",如果目標 文本中至少出現(xiàn)了 "劉德華"、"宋慧喬"中的一個,則執(zhí)行步驟3,否則,執(zhí)行步驟4;
[0092]步驟3: "今天"在目標文本中的第二分值保持初始值;并轉到步驟5;
[0093]例如,目標文本是"劉德華的今天",則"今天"在目標文本中的第二分值保持其初 始值;
[0094]步驟4:將"今天"在目標文本中的第二分值設置為預設值,該預設值小于初始值;
[0095]例如,目標文本是"今天明天",目標文本中既沒有出現(xiàn)"劉德華",也沒有出現(xiàn)"宋 慧喬",則將目標詞"今天"在目標文本"今天明天"的第二分值設置為預設值。到此為止不再 跳轉其他步驟。
[0096]步驟5:判斷"今天"的長度是否大于閾值,若是,"今天"在目標文本中的第二分值 保持初始值,否則,將"今天"在目標文本中的第二分值設置為預設值。
[0097] 依據(jù)上述方法確定目標詞的第二分值后,將分詞1的影響因子分數(shù)?:乘以目標詞 的第二分值獲得第一中間值tempscorel,若所述第一中間值大于1,則將所述第一中間值置 為1,若所述第一中間值小于1,則保持所述第一中間值的大小不變。
[0098] (2)將所述目標文本中第二個非目標詞對應的第一因子乘以所述第一中間值獲得 第二中間值;
[0099]將分詞2的影響因子分數(shù)?2乘以所述第一中間值tempscorel獲得第二中間值 tempSC〇re2,若所述第二中間值大于1,則將所述第二中間值置為1,若所述第二中間值小于 1,則保持所述第二中間值的大小不變。
[0100] (3)遍歷所述第二個非目標詞后面的第i個非目標詞,3彡i<N,將所述第i個非目 標詞對應的第一因子乘以第i-1中間值獲得第i中間值,N表示所述目標文本中最后一個非 目標詞的序號;
[0101]依次遍歷所述分詞2之后的分詞直到分詞N,假設當前遍歷的是分詞i,3<i<N,將 所述分詞i的影響因子分數(shù)Pi乘以第i-1中間值tempscore ( i-1)獲得第i中間值 tempscorei,若所述第i中間值大于1,則將所述第i中間值置為1,若所述第i中間值小于1, 則保持所述第i中間值的大小不變,依次類推,直到計算出第N中間值tempscoreN。
[0102] (4)將所述各非目標詞分別對應的第二因子相加后求平均獲得平均值;
[0103] 將所述分詞集合中各個分詞的匹配目標可能性分數(shù)相加后求平均獲得均值 relscore〇
[0104] (5)所述各非目標詞與所述目標詞的關聯(lián)度等于第N中間值與所述平均值的乘積。
[0105] 各非目標詞與所述目標詞的關聯(lián)度f inalscore = relscore*tempscoreN。
[0106] 例如,目標文本"我想聽小蘋果",非目標詞"我"的第一分值包括影響因子分數(shù)Pi 和匹配目標可能性分數(shù)施、非目標詞"想"的第一分值包括影響因子分數(shù)內和匹配目標可能 性分數(shù)M 2,"聽"的第一分值包括影響因子分數(shù)P3和匹配目標可能性分數(shù)M3,將"我"的影響因 子分數(shù)Pi乘以"小蘋果"自身的第二分值獲得第一中間值tempscorei,若所述第一中間值大 于1,則將所述第一中間值置為1,若所述第一中間值小于1,則保持所述第一中間值的大小 不變;將"想"的影響因子分數(shù)P 2乘以所述第一中間值tempscorei獲得第二中間值 tempSC〇re2,若所述第二中間值大于1,則將所述第二中間值置為1,若所述第二中間值小于 1,則保持所述第二中間值的大小不變;將"聽"的影響因子分數(shù)P 3乘以所述第一中間值 tempscore2獲得第三中間值tempscore3,若所述第三中間值大于1,則將所述第三中間值置 為1,若所述第三中間值小于1,則保持所述第三中間值的大小不變。將"我"的匹配目標可能 性分數(shù)%、"想"的匹配目標可能性分數(shù)M 2和"聽"的匹配目標可能性分數(shù)M3相加后求平均獲 得均值relscore,即 relscore = (Mi+M2+M3)/3〇
[0107] 對于"小蘋果"的音樂屬性,"我想聽小蘋果"中非目標詞與目標詞"小蘋果"的關聯(lián) 度1為f inalscore = relscore*tempscoreN;同理,可計算出對于"小蘋果"的影視屬性,"我 想聽小蘋果"中非目標詞與目標詞"小蘋果"的關聯(lián)度2,此處不再贅述。
[0108] 所述目標詞對應多個業(yè)務屬性,各業(yè)務屬性分別對應有所述關聯(lián)度;由于對于"小 蘋果"的音樂屬性,"聽"與"小蘋果"之間是動詞關系,對于"小蘋果"的影視屬性,"聽"與"小 蘋果"之間沒有關聯(lián)關系,因此,根據(jù)上述方法確定出的關聯(lián)度1和關聯(lián)度2不相同。
[0109] 上述實施例中根據(jù)所述各非目標詞與所述目標詞的關聯(lián)度,確定用戶的業(yè)務需求 具體包括:根據(jù)各業(yè)務屬性分別對應的所述關聯(lián)度,確定最大值的關聯(lián)度對應的目標業(yè)務 屬性,將屬于所述目標業(yè)務屬性的業(yè)務作為所述用戶需求的業(yè)務。
[0110] 對于目標文本"我想聽小蘋果",目標詞"小蘋果"同時具有音樂屬性和影視屬性, 對于每個屬性可獲得目標文本"我想聽小蘋果"中各非目標詞與所述目標詞的關聯(lián)度,則目 標文本"我想聽小蘋果"對應有兩個關聯(lián)度,若兩個關聯(lián)度均大于第一閾值,則將兩個關聯(lián) 度放入一個list,并將該list中的分值按照從大到小的順序排序,假如"音樂屬性"對應的 關聯(lián)度大于"影視屬性"對應的關聯(lián)度,則"音樂屬性"對應的關聯(lián)度排在"影視屬性"對應的 關聯(lián)度的前面,"小蘋果"的音樂文件作為用戶的業(yè)務需求,若該list中排在第二位的關聯(lián) 度大于第二閾值,則將第二位的關聯(lián)度對應的業(yè)務屬性所屬的業(yè)務作為備選業(yè)務需求,即 "小蘋果"的影視文件作為用戶的備選業(yè)務需求,以便判定出的用戶的業(yè)務需求不能滿足用 戶實際需求時跳轉到備選業(yè)務需求,將備選業(yè)務需求推送給用戶。
[0111] 本發(fā)明實施例確定了各非目標詞與目標詞的關聯(lián)度的計算方法,提高了關聯(lián)度的 計算精度,進一步提高了語音信息識別中對用戶需求的識別精度。
[0112] 圖5為本發(fā)明實施例提供的語音識別裝置的結構圖。本發(fā)明實施例提供的語音識 別裝置可以執(zhí)行語音識別方法實施例提供的處理流程,如圖5所示,語音識別裝置40包括分 詞處理模塊41、目標詞確定模塊42、關聯(lián)關系確定模塊43、關聯(lián)度計算模塊44、業(yè)務需求確 定模塊45,其中,分詞處理模塊41用于獲取語音信息對應的目標文本的多個分詞;目標詞確 定模塊42用于確定所述多個分詞中的目標詞;關聯(lián)關系確定模塊43用于根據(jù)所述目標詞的 業(yè)務屬性,確定所述多個分詞中各非目標詞與所述目標詞的關聯(lián)關系關聯(lián)度計算模塊44用 于根據(jù)所述各非目標詞與所述目標詞的關聯(lián)關系,確定所述各非目標詞與所述目標詞的關 聯(lián)度;業(yè)務需求確定模塊45用于根據(jù)所述各非目標詞與所述目標詞的關聯(lián)度,確定用戶的 業(yè)務需求。
[0113] 本發(fā)明實施例通過分析語音信息對應的分詞,確定分詞中的目標詞和非目標詞, 根據(jù)目標詞的業(yè)務屬性確定各非目標詞與目標詞的關聯(lián)關系,依據(jù)各非目標詞與目標詞的 關聯(lián)關系確定各非目標詞與目標詞的關聯(lián)度,從而確定業(yè)務屬性與用戶需求之間的關聯(lián) 度,該關聯(lián)度反映出用戶期望獲得該目標詞的該業(yè)務屬性對應的業(yè)務內容的強烈程度,不 同的業(yè)務屬性與用戶需求之間的關聯(lián)度不同,通過關聯(lián)度大小可確定出用戶真正的業(yè)務需 求,相比于單純通過核心詞確定語音信息對應的目標業(yè)務,或單純從各業(yè)務可識別的分詞 的個數(shù)的大小確定語音信息對應的目標業(yè)務,提高了分析語音信息中用戶需求的準確度。
[0114] 圖6為本發(fā)明另一實施例提供的語音識別裝置的結構圖。在上述實施例的基礎上, 關聯(lián)關系確定模塊43具體用于確定所述目標詞左側的非目標詞與所述目標詞的關聯(lián)關系, 和/或,確定所述目標詞右側的非目標詞與所述目標詞的關聯(lián)關系。
[0115] 或者,關聯(lián)關系確定模塊43包括查詢單元431和關聯(lián)關系確定單元432,其中,所述 查詢單元431用于根據(jù)所述多個分詞中各非目標詞與所述目標詞查詢關系表,所述關系表 包括參考非目標詞與所述目標詞的依賴關系;所述關聯(lián)關系確定單元432用于所述非目標 詞與所述關系表中的參考非目標詞匹配時,確定所述非目標詞與所述目標詞的關聯(lián)關系為 所述參考非目標詞與所述目標詞的依賴關系。
[0116] 可選的,關聯(lián)度計算模塊44包括第一分值確定單元441和計算單元442,其中,所述 第一分值確定單元441用于根據(jù)所述各非目標詞與所述目標詞的關聯(lián)關系確定所述關聯(lián)關 系對應的第一分值;所述計算單元442,用于依據(jù)所述第一分值計算所述各非目標詞與所述 目標詞的關聯(lián)度。
[0117] 優(yōu)選的,所述第一分值包括第一因子和第二因子;所述計算單元442具體用于將所 述目標文本中第一個非目標詞對應的第一因子乘以所述目標詞的第二分值獲得第一中間 值,所述目標詞的第二分值根據(jù)所述目標詞的長度、所述目標詞與所述非目標詞的依賴程 度確定;將所述目標文本中第二個非目標詞對應的第一因子乘以所述第一中間值獲得第二 中間值;遍歷所述第二個非目標詞后面的第i個非目標詞,3<i<N,將所述第i個非目標詞 對應的第一因子乘以第i-1中間值獲得第i中間值,N表示所述目標文本中最后一個非目標 詞的序號;將所述各非目標詞分別對應的第二因子相加后求平均獲得平均值;所述各非目 標詞與所述目標詞的關聯(lián)度等于第N中間值與所述平均值的乘積。
[0118] 本發(fā)明實施例提供的語音識別裝置可以具體用于執(zhí)行上述圖1、2、3、4所提供的方 法實施例,具體功能此處不再贅述。
[0119] 本發(fā)明實施例從目標詞的左側開始確定非目標詞與目標詞的關聯(lián)關系,和/或,從 目標詞的右側開始確定非目標詞與目標詞的關聯(lián)關系,保證了各非目標詞與目標詞的關聯(lián) 關系的有序性;通過查詢關系表確定各非目標詞與目標詞的關聯(lián)關系,提尚了關聯(lián)關系的 查詢效率;確定了各非目標詞與目標詞的關聯(lián)度的計算方法,提高了關聯(lián)度的計算精度,進 一步提高了語音信息識別中對用戶需求的識別精度。
[0120] 綜上所述,本發(fā)明實施例通過分析語音信息對應的分詞,確定分詞中的目標詞和 非目標詞,根據(jù)目標詞的業(yè)務屬性確定各非目標詞與目標詞的關聯(lián)關系,依據(jù)各非目標詞 與目標詞的關聯(lián)關系確定各非目標詞與目標詞的關聯(lián)度,從而確定業(yè)務屬性與用戶需求之 間的關聯(lián)度,該關聯(lián)度反映出用戶期望獲得該目標詞的該業(yè)務屬性對應的業(yè)務內容的強烈 程度,不同的業(yè)務屬性與用戶需求之間的關聯(lián)度不同,通過關聯(lián)度大小可確定出用戶真正 的業(yè)務需求,相比于單純通過核心詞確定語音信息對應的目標業(yè)務,或單純從各業(yè)務可識 別的分詞的個數(shù)的大小確定語音信息對應的目標業(yè)務,提高了分析語音信息中用戶需求的 準確度;從目標詞的左側開始確定非目標詞與目標詞的關聯(lián)關系,和/或,從目標詞的右側 開始確定非目標詞與目標詞的關聯(lián)關系,保證了各非目標詞與目標詞的關聯(lián)關系的有序 性;通過查詢關系表確定各非目標詞與目標詞的關聯(lián)關系,提尚了關聯(lián)關系的查詢效率;確 定了各非目標詞與目標詞的關聯(lián)度的計算方法,提高了關聯(lián)度的計算精度,進一步提高了 語音信息識別中對用戶需求的識別精度。
[0121] 在本發(fā)明所提供的幾個實施例中,應該理解到,所揭露的裝置和方法,可以通過其 它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅 僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結 合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的 相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通 信連接,可以是電性,機械或其它的形式。
[0122] 所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯 示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個 網(wǎng)絡單元上。可以根據(jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目 的。
[0123] 另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以 是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單 元既可以采用硬件的形式實現(xiàn),也可以采用硬件加軟件功能單元的形式實現(xiàn)。
[0124] 上述以軟件功能單元的形式實現(xiàn)的集成的單元,可以存儲在一個計算機可讀取存 儲介質中。上述軟件功能單元存儲在一個存儲介質中,包括若干指令用以使得一臺計算機 設備(可以是個人計算機,服務器,或者網(wǎng)絡設備等)或處理器(processor)執(zhí)行本發(fā)明各個 實施例所述方法的部分步驟。而前述的存儲介質包括:U盤、移動硬盤、只讀存儲器(Read-Only Memory ,R0M)、隨機存取存儲器 (Random Access Memory ,RAM)、磁碟或者光盤等各種 可以存儲程序代碼的介質。
[0125] 本領域技術人員可以清楚地了解到,為描述的方便和簡潔,僅以上述各功能模塊 的劃分進行舉例說明,實際應用中,可以根據(jù)需要而將上述功能分配由不同的功能模塊完 成,即將裝置的內部結構劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。上 述描述的裝置的具體工作過程,可以參考前述方法實施例中的對應過程,在此不再贅述。
[0126]最后應說明的是:以上各實施例僅用以說明本發(fā)明的技術方案,而非對其限制;盡 管參照前述各實施例對本發(fā)明進行了詳細的說明,本領域的普通技術人員應當理解:其依 然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分或者全部技術特征進 行等同替換;而這些修改或者替換,并不使相應技術方案的本質脫離本發(fā)明各實施例技術 方案的范圍。
【主權項】
1. 一種語音識別方法,其特征在于,包括: 獲取語音信息對應的目標文本的多個分詞; 確定所述多個分詞中的目標詞; 根據(jù)所述目標詞的業(yè)務屬性,確定所述多個分詞中各非目標詞與所述目標詞的關聯(lián)關 系; 根據(jù)所述各非目標詞與所述目標詞的關聯(lián)關系,確定所述各非目標詞與所述目標詞的 關耳關度; 根據(jù)所述各非目標詞與所述目標詞的關聯(lián)度,確定用戶的業(yè)務需求。2. 根據(jù)權利要求1所述的方法,其特征在于,所述確定所述多個分詞中各非目標詞與所 述目標詞的關聯(lián)關系,包括: 確定所述目標詞左側的非目標詞與所述目標詞的關聯(lián)關系,和/或,確定所述目標詞右 側的非目標詞與所述目標詞的關聯(lián)關系。3. 根據(jù)權利要求1所述的方法,其特征在于,所述確定所述多個分詞中各非目標詞與所 述目標詞的關聯(lián)關系,包括: 根據(jù)所述多個分詞中各非目標詞與所述目標詞查詢關系表,所述關系表包括參考非目 標詞與所述目標詞的依賴關系; 若所述非目標詞與所述關系表中的參考非目標詞匹配,則所述非目標詞與所述目標詞 的關聯(lián)關系為所述參考非目標詞與所述目標詞的依賴關系。4. 根據(jù)權利要求1-3任一項所述的方法,其特征在于,所述根據(jù)所述各非目標詞與所述 目標詞的關聯(lián)關系,確定所述各非目標詞與所述目標詞的關聯(lián)度,包括: 根據(jù)所述各非目標詞與所述目標詞的關聯(lián)關系確定所述關聯(lián)關系對應的第一分值; 依據(jù)所述第一分值計算所述各非目標詞與所述目標詞的關聯(lián)度。5. 根據(jù)權利要求4所述的方法,其特征在于,所述第一分值包括第一因子和第二因子; 所述依據(jù)所述第一分值計算所述各非目標詞與所述目標詞的關聯(lián)度,包括: 將所述目標文本中第一個非目標詞對應的第一因子乘以所述目標詞的第二分值獲得 第一中間值,所述目標詞的第二分值根據(jù)所述目標詞的長度、所述目標詞與所述非目標詞 的依賴程度確定; 將所述目標文本中第二個非目標詞對應的第一因子乘以所述第一中間值獲得第二中 間值; 遍歷所述第二個非目標詞后面的第i個非目標詞,3<i<N,將所述第i個非目標詞對應 的第一因子乘以第i-Ι中間值獲得第i中間值,N表示所述目標文本中最后一個非目標詞的 序號; 將所述各非目標詞分別對應的第二因子相加后求平均獲得平均值; 所述各非目標詞與所述目標詞的關聯(lián)度等于第N中間值與所述平均值的乘積。6. -種語音識別裝置,其特征在于,包括: 分詞處理模塊,用于獲取語音信息對應的目標文本的多個分詞; 目標詞確定模塊,用于確定所述多個分詞中的目標詞; 關聯(lián)關系確定模塊,用于根據(jù)所述目標詞的業(yè)務屬性,確定所述多個分詞中各非目標 詞與所述目標詞的關聯(lián)關系; 關聯(lián)度計算模塊,用于根據(jù)所述各非目標詞與所述目標詞的關聯(lián)關系,確定所述各非 目標詞與所述目標詞的關聯(lián)度; 業(yè)務需求確定模塊,用于根據(jù)所述各非目標詞與所述目標詞的關聯(lián)度,確定用戶的業(yè) 務需求。7. 根據(jù)權利要求6所述的語音識別裝置,其特征在于,所述關聯(lián)關系確定模塊具體用于 確定所述目標詞左側的非目標詞與所述目標詞的關聯(lián)關系,和/或,確定所述目標詞右側的 非目標詞與所述目標詞的關聯(lián)關系。8. 根據(jù)權利要求7所述的語音識別裝置,其特征在于,所述關聯(lián)關系確定模塊包括查詢 單元和關聯(lián)關系確定單元,其中,所述查詢單元用于根據(jù)所述多個分詞中各非目標詞與所 述目標詞查詢關系表,所述關系表包括參考非目標詞與所述目標詞的依賴關系;所述關聯(lián) 關系確定單元用于所述非目標詞與所述關系表中的參考非目標詞匹配時,確定所述非目標 詞與所述目標詞的關聯(lián)關系為所述參考非目標詞與所述目標詞的依賴關系。9. 根據(jù)權利要求6-8任一項所述的語音識別裝置,其特征在于,所述關聯(lián)度計算模塊包 括第一分值確定單元和計算單元,其中,所述第一分值確定單元用于根據(jù)所述各非目標詞 與所述目標詞的關聯(lián)關系確定所述關聯(lián)關系對應的第一分值;所述計算單元用于依據(jù)所述 第一分值計算所述各非目標詞與所述目標詞的關聯(lián)度。10. 根據(jù)權利要求9所述的語音識別裝置,其特征在于,所述第一分值包括第一因子和 第二因子;所述計算單元具體用于將所述目標文本中第一個非目標詞對應的第一因子乘以 所述目標詞的第二分值獲得第一中間值,所述目標詞的第二分值根據(jù)所述目標詞的長度、 所述目標詞與所述非目標詞的依賴程度確定; 將所述目標文本中第二個非目標詞對應的第一因子乘以所述第一中間值獲得第二中 間值; 遍歷所述第二個非目標詞后面的第i個非目標詞,3<i<N,將所述第i個非目標詞對應 的第一因子乘以第i-Ι中間值獲得第i中間值,N表示所述目標文本中最后一個非目標詞的 序號; 將所述各非目標詞分別對應的第二因子相加后求平均獲得平均值; 所述各非目標詞與所述目標詞的關聯(lián)度等于第N中間值與所述平均值的乘積。
【文檔編號】G06F17/27GK105893351SQ201610203599
【公開日】2016年8月24日
【申請日】2016年3月31日
【發(fā)明人】陳曉敏, 陳仲帥, 李霞
【申請人】海信集團有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
弥渡县| 浑源县| 舟山市| 兴文县| 玛沁县| 寻甸| 南通市| 汕尾市| 会同县| 清丰县| 日照市| 嘉荫县| 精河县| 太康县| 图片| 秭归县| 安阳县| 长海县| 湖南省| 镇巴县| 漯河市| 宿州市| 孝昌县| 临漳县| 湄潭县| 涪陵区| 丹寨县| 肥城市| 扎赉特旗| 东至县| 正阳县| 榆林市| 景东| 抚远县| 内乡县| 泰来县| 东乡| 长沙市| 南昌县| 平陆县| 玉树县|