一種關(guān)鍵詞識(shí)別方法及電子設(shè)備的制作方法

文檔序號(hào)：2825463閱讀：377來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

一種關(guān)鍵詞識(shí)別方法及電子設(shè)備的制作方法
【專(zhuān)利摘要】本發(fā)明實(shí)施例提供一種關(guān)鍵詞識(shí)別方法及電子設(shè)備，其中方法包括：獲取用戶(hù)的發(fā)音場(chǎng)景圖像；確定所述發(fā)音場(chǎng)景圖像中的發(fā)音場(chǎng)景信息；將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配，當(dāng)存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí)，將所述相匹配的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞，當(dāng)不存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí)，將優(yōu)先級(jí)最高的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。本發(fā)明避免了通過(guò)上下文語(yǔ)義對(duì)關(guān)鍵詞進(jìn)行識(shí)別而存在的限制，提高了關(guān)鍵詞識(shí)別的正確率。
【專(zhuān)利說(shuō)明】—種關(guān)鍵詞識(shí)別方法及電子設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及語(yǔ)音識(shí)別【技術(shù)領(lǐng)域】，更具體地說(shuō)，涉及一種關(guān)鍵詞識(shí)別方法及電子設(shè)備。
【背景技術(shù)】
[0002]隨著語(yǔ)音識(shí)別技術(shù)的發(fā)展，越來(lái)越多的電子設(shè)備，如智能手機(jī)、個(gè)人計(jì)算機(jī)和掌上電腦等均具備了語(yǔ)音輸入的功能，借助于語(yǔ)音識(shí)別技術(shù)，這些電子設(shè)備能夠識(shí)別和理解用戶(hù)輸入的語(yǔ)音，將語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令，使得信息的輸入更為簡(jiǎn)便。
[0003]語(yǔ)音識(shí)別中關(guān)鍵詞的識(shí)別尤為重要，如果關(guān)鍵詞識(shí)別錯(cuò)誤，那么用戶(hù)輸入的語(yǔ)音的語(yǔ)義將發(fā)生重大的改變，使得語(yǔ)音識(shí)別出錯(cuò)。由于近似音或用戶(hù)發(fā)音不標(biāo)準(zhǔn)等問(wèn)題，對(duì)于用戶(hù)輸入的一個(gè)關(guān)鍵詞語(yǔ)音，電子設(shè)備可能會(huì)識(shí)別出多個(gè)候選關(guān)鍵詞，此時(shí)就需要對(duì)該多個(gè)候選關(guān)鍵詞進(jìn)行進(jìn)一步的識(shí)別，從中確定出最終輸出的關(guān)鍵詞；如當(dāng)用戶(hù)輸入的語(yǔ)音為“tai gu”對(duì)應(yīng)的語(yǔ)音信號(hào)時(shí)，電子設(shè)備確認(rèn)該語(yǔ)音信號(hào)為關(guān)鍵詞語(yǔ)音信號(hào)后，由于近似音或用戶(hù)發(fā)音不標(biāo)準(zhǔn)的問(wèn)題，電子設(shè)備對(duì)于該語(yǔ)音信號(hào)可能存在識(shí)別出“太苦”、“泰谷”這兩個(gè)候選關(guān)鍵詞的情況，此時(shí)就需要對(duì)這兩個(gè)候選關(guān)鍵詞進(jìn)行進(jìn)一步的識(shí)別，在“泰谷”和“太苦”間確定最終輸出的關(guān)鍵詞。
[0004]現(xiàn)有技術(shù)中，當(dāng)一個(gè)關(guān)鍵詞語(yǔ)音識(shí)別出多個(gè)候選關(guān)鍵詞時(shí)，電子設(shè)備一般通過(guò)用戶(hù)輸入的語(yǔ)音的上下文語(yǔ)義對(duì)該多個(gè)候選關(guān)鍵詞進(jìn)行進(jìn)一步的識(shí)別，從而確定出候選關(guān)鍵詞的優(yōu)先級(jí)，將優(yōu)先級(jí)最高的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞，這種關(guān)鍵詞的識(shí)別方式雖然在一定程度上能夠增強(qiáng)關(guān)鍵詞識(shí)別的正確率；但很多情況下，如用戶(hù)輸入的語(yǔ)音過(guò)于簡(jiǎn)短或用戶(hù)輸入的語(yǔ)音只為關(guān)鍵詞語(yǔ)音時(shí)，這種通過(guò)上下文語(yǔ)義對(duì)關(guān)鍵詞進(jìn)行識(shí)別的方式就會(huì)存在限制，無(wú)法正確的對(duì)關(guān)鍵詞進(jìn)行識(shí)別，影響關(guān)鍵詞識(shí)別的正確率。

【發(fā)明內(nèi)容】

[0005]有鑒于此，本發(fā)明實(shí)施例提供一種關(guān)鍵詞識(shí)別方法及電子設(shè)備，以避免通過(guò)上下文語(yǔ)義對(duì)關(guān)鍵詞進(jìn)行識(shí)別而存在的限制，提高關(guān)鍵詞識(shí)別的正確率。
[0006]為實(shí)現(xiàn)上述目的，本發(fā)明實(shí)施例提供如下技術(shù)方案:
[0007]—種關(guān)鍵詞識(shí)別方法，包括:
[0008]獲取用戶(hù)的發(fā)音場(chǎng)景圖像；
[0009]確定所述發(fā)音場(chǎng)景圖像中的發(fā)音場(chǎng)景信息；
[0010]將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配，當(dāng)存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí)，將所述相匹配的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞，當(dāng)不存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí)，將優(yōu)先級(jí)最高的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵
ο
[0011]可選的，所述發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的面部表情信息或用戶(hù)當(dāng)前的發(fā)音背景信肩、Ο[0012]可選的，當(dāng)所述發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的面部表情信息時(shí)，所述確定所述發(fā)音場(chǎng)景圖像中的發(fā)音場(chǎng)景信息包括:
[0013]根據(jù)人臉識(shí)別技術(shù)從所述發(fā)音場(chǎng)景圖像中提取出用戶(hù)的人臉，從所述人臉中提取出用戶(hù)當(dāng)前的表情特征，確定與所述表情特征對(duì)應(yīng)的用戶(hù)當(dāng)前的面部表情信息。
[0014]可選的，所述確定與所述表情特征對(duì)應(yīng)的用戶(hù)當(dāng)前的面部表情信息包括:
[0015]在預(yù)置的表情詞庫(kù)中查找所述表情特征所對(duì)應(yīng)的字詞，確定所述字詞為用戶(hù)當(dāng)前的面部表情信息，所述預(yù)置的表情詞庫(kù)存儲(chǔ)有表情特征與表達(dá)表情特征所代表的含義的字詞的對(duì)應(yīng)關(guān)系。
[0016]可選的，當(dāng)發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的面部表情信息時(shí)，所述將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配包括:
[0017]將用戶(hù)當(dāng)前的面部表情信息與候選關(guān)鍵詞進(jìn)行匹配，判斷是否存在與用戶(hù)當(dāng)前的面部表情信息相對(duì)應(yīng)的候選關(guān)鍵詞；
[0018]若是，則存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞，若否，則不存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞。
[0019]可選的，當(dāng)所述發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的發(fā)音背景信息時(shí)，所述確定所述發(fā)音場(chǎng)景圖像中的發(fā)音場(chǎng)景信息包括:
[0020]從所述發(fā)音場(chǎng)景圖像中提取出場(chǎng)景特征，確定與所述場(chǎng)景特征對(duì)應(yīng)的用戶(hù)當(dāng)前的
發(fā)音背景信息。
[0021]可選的，當(dāng)發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的發(fā)音背景信息時(shí)，所述將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配包括:
[0022]按照預(yù)先設(shè)置的發(fā)音背景信息與關(guān)鍵詞的對(duì)應(yīng)關(guān)系，判斷是否存在與用戶(hù)當(dāng)前的發(fā)音背景信息對(duì)應(yīng)的候選關(guān)鍵詞；
[0023]若是，則存在與用戶(hù)當(dāng)前的發(fā)音背景信息相匹配的候選關(guān)鍵詞，若否，則不存在與用戶(hù)當(dāng)前的發(fā)音背景信息相匹配的候選關(guān)鍵詞。
[0024]本發(fā)明實(shí)施例還提供一種電子設(shè)備，包括:圖像獲取模塊，發(fā)音場(chǎng)景信息確定模塊和匹配確定模塊；
[0025]所述圖像獲取模塊，用于獲取用戶(hù)的發(fā)音場(chǎng)景圖像，將所述發(fā)音場(chǎng)景圖像發(fā)送給所述發(fā)音場(chǎng)景信息確定模塊；
[0026]所述發(fā)音場(chǎng)景信息確定模塊，用于接收所述發(fā)音場(chǎng)景圖像，確定所述發(fā)音場(chǎng)景圖像中的發(fā)音場(chǎng)景信息，將所述發(fā)音場(chǎng)景信息發(fā)送給所述匹配確定模塊；
[0027]所述匹配確定模塊，用于接收所述發(fā)音場(chǎng)景信息，將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配，當(dāng)存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí)，將所述相匹配的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞，當(dāng)不存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí)，將優(yōu)先級(jí)最聞的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
[0028]可選的，所述發(fā)音場(chǎng)景信息確定模塊包括:
[0029]面部表情信息確定單元，用于根據(jù)人臉識(shí)別技術(shù)從所述發(fā)音場(chǎng)景圖像中提取出用戶(hù)的人臉，從所述人臉中提取出用戶(hù)當(dāng)前的表情特征，確定與所述表情特征對(duì)應(yīng)的用戶(hù)當(dāng)前的面部表情信息；
[0030]所述匹配確定模塊包括:[0031]第一匹配單元，用于將用戶(hù)當(dāng)前的面部表情信息與候選關(guān)鍵詞進(jìn)行匹配，判斷是否存在與用戶(hù)當(dāng)前的面部表情信息相對(duì)應(yīng)的候選關(guān)鍵詞，若是，則存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞，若否，則不存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞；
[0032]第一確定單元，用于在所述第一匹配單元判斷存在與用戶(hù)當(dāng)前的面部表情信息對(duì)應(yīng)的候選關(guān)鍵詞時(shí)，將與用戶(hù)當(dāng)前的面部表情信息對(duì)應(yīng)的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞，在所述第一匹配單元判斷不存在與用戶(hù)當(dāng)前的面部表情信息對(duì)應(yīng)的候選關(guān)鍵詞時(shí)，將優(yōu)先級(jí)最聞的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
[0033]可選的，所述發(fā)音場(chǎng)景信息確定模塊包括:
[0034]發(fā)音背景信息確定單元，用于從所述發(fā)音場(chǎng)景圖像中提取出當(dāng)前的場(chǎng)景特征，確定與所述場(chǎng)景特征對(duì)應(yīng)的用戶(hù)當(dāng)前的發(fā)音背景信息；
[0035]所述匹配確定模塊包括:
[0036]第二匹配單元，用于按照預(yù)先設(shè)置的發(fā)音背景信息與關(guān)鍵詞的對(duì)應(yīng)關(guān)系，判斷是否存在與用戶(hù)當(dāng)前的發(fā)音背景信息對(duì)應(yīng)的候選關(guān)鍵詞，若是，則存在與用戶(hù)當(dāng)前的發(fā)音背景信息相匹配的候選關(guān)鍵詞，若否，則不存在與用戶(hù)當(dāng)前的發(fā)音背景信息相匹配的候選關(guān)鍵詞；
[0037]第二確定單元，用于在所述第二匹配單元判斷存在與用戶(hù)當(dāng)前的發(fā)音背景信息相對(duì)應(yīng)的候選關(guān)鍵詞時(shí)，將與用戶(hù)當(dāng)前的發(fā)音背景信息相對(duì)應(yīng)的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞，在所述第二匹配單元判斷不存在與用戶(hù)當(dāng)前的發(fā)音背景信息相對(duì)應(yīng)的候選關(guān)鍵詞時(shí)，將優(yōu)先級(jí)最高的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
[0038]基于上述技術(shù)方案，本發(fā)明實(shí)施例提供的關(guān)鍵詞識(shí)別方法，在關(guān)鍵詞識(shí)別中考慮了發(fā)音場(chǎng)景信息的因素，通過(guò)將發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配，當(dāng)存在與用戶(hù)當(dāng)前發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí)，將所述相匹配的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞，這樣就避免了通過(guò)上下文語(yǔ)義對(duì)關(guān)鍵詞進(jìn)行識(shí)別而存在的限制，提高了關(guān)鍵詞識(shí)別的正確率。
【專(zhuān)利附圖】

【附圖說(shuō)明】
[0039]為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案，下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹，顯而易見(jiàn)地，下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例，對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講，在不付出創(chuàng)造性勞動(dòng)的前提下，還可以根據(jù)這些附圖獲得其他的附圖。
[0040]圖1為本發(fā)明實(shí)施例提供的關(guān)鍵詞識(shí)別方法的流程圖；
[0041]圖2為本發(fā)明實(shí)施例提供的關(guān)鍵詞識(shí)別方法的另一流程圖；
[0042]圖3為本發(fā)明實(shí)施例提供的關(guān)鍵詞識(shí)別方法的又一流程圖；
[0043]圖4為本發(fā)明實(shí)施例提供的一種電子設(shè)備的結(jié)構(gòu)框圖；
[0044]圖5為本發(fā)明實(shí)施例提供的一種電子設(shè)備的另一結(jié)構(gòu)框圖；
[0045]圖6為本發(fā)明實(shí)施例提供的面部表情信息確定單元的結(jié)構(gòu)框圖；
[0046]圖7為本發(fā)明實(shí)施例提供的一種電子設(shè)備的又一結(jié)構(gòu)框圖。【具體實(shí)施方式】
[0047]下面將結(jié)合本發(fā)明實(shí)施例中的附圖，對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述，顯然，所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例，而不是全部的實(shí)施例?；诒景l(fā)明中的實(shí)施例，本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例，都屬于本發(fā)明保護(hù)的范圍。
[0048]圖1為本發(fā)明實(shí)施例提供的關(guān)鍵詞識(shí)別方法的流程圖，參照?qǐng)D1，該方法可以包括:
[0049]步驟S100、獲取用戶(hù)的發(fā)音場(chǎng)景圖像；
[0050]當(dāng)語(yǔ)音識(shí)別的過(guò)程中出現(xiàn)多個(gè)候選關(guān)鍵詞時(shí)，可啟用本發(fā)明實(shí)施例提供的方法，執(zhí)行步驟SlOO “獲取用戶(hù)的發(fā)音場(chǎng)景圖像”的操作；也可設(shè)定每次語(yǔ)音識(shí)別過(guò)程中，均啟用本發(fā)明實(shí)施例提供的方法，執(zhí)行步驟SlOO “獲取用戶(hù)的發(fā)音場(chǎng)景圖像”的操作；也可設(shè)定語(yǔ)音識(shí)別中啟用本發(fā)明實(shí)施例提供的方法的預(yù)定條件，在達(dá)到預(yù)定條件時(shí)，執(zhí)行步驟SlOO“獲取用戶(hù)的發(fā)音場(chǎng)景圖像”的操作；
[0051]用戶(hù)的發(fā)音場(chǎng)景圖像是指用戶(hù)在發(fā)音時(shí)刻的場(chǎng)景圖像，包括用戶(hù)的自身圖像及用戶(hù)的背景圖像。
[0052]步驟S110、確定所述發(fā)音場(chǎng)景圖像中的發(fā)音場(chǎng)景信息；
[0053]其中，發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的面部表情信息或用戶(hù)當(dāng)前的發(fā)音背景信息，由于發(fā)音場(chǎng)景圖像包括了用戶(hù)的自身圖像及用戶(hù)的背景圖像，因此通過(guò)用戶(hù)的自身圖像即可確定用戶(hù)當(dāng)前的面部表情信息，如喜、怒、哀、樂(lè)、難過(guò)，傷心等信息，通過(guò)用戶(hù)的背景圖像即可確定用戶(hù)當(dāng)前的發(fā)音背景信息，如用戶(hù)所處的超市、廣場(chǎng)、健身房等場(chǎng)所信息。
[0054]步驟S120、將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配，當(dāng)存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí)，將所述相匹配的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞，當(dāng)不存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí)，將優(yōu)先級(jí)最高的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
[0055]在確定了發(fā)音場(chǎng)景信息后，可將語(yǔ)音識(shí)別過(guò)程中出現(xiàn)的候選關(guān)鍵詞與發(fā)音場(chǎng)景信息進(jìn)行匹配，具體的，當(dāng)發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的面部表情信息時(shí)，可將候選關(guān)鍵詞與用戶(hù)當(dāng)前的面部表情信息進(jìn)行匹配，判斷是否存在與用戶(hù)當(dāng)前的面部表情信息相對(duì)應(yīng)的候選關(guān)鍵詞，若存在與用戶(hù)當(dāng)前的面部表情信息相對(duì)應(yīng)的候選關(guān)鍵詞，則表明存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞；當(dāng)發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的發(fā)音背景信息時(shí)，可將候選關(guān)鍵詞與用戶(hù)當(dāng)前的發(fā)音背景信息進(jìn)行匹配，判斷是否存在與用戶(hù)當(dāng)前的發(fā)音背景信息相對(duì)應(yīng)的候選關(guān)鍵詞，若存在與用戶(hù)當(dāng)前的發(fā)音背景信息相對(duì)應(yīng)的候選關(guān)鍵詞，則表明存在與用戶(hù)當(dāng)前的發(fā)音背景信息相匹配的候選關(guān)鍵詞。
[0056]本發(fā)明實(shí)施例提供的關(guān)鍵詞識(shí)別方法，在關(guān)鍵詞識(shí)別中考慮了發(fā)音場(chǎng)景信息的因素，通過(guò)將發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配，當(dāng)存在與用戶(hù)當(dāng)前發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí)，將所述相匹配的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞，這樣就避免了通過(guò)上下文語(yǔ)義對(duì)關(guān)鍵詞進(jìn)行識(shí)別而存在的限制，提高了關(guān)鍵詞識(shí)別的正確率。
[0057]圖2為本發(fā)明實(shí)施例提供的關(guān)鍵詞識(shí)別方法的另一流程圖，結(jié)合圖1和圖2所示，該方法可以包括:
[0058]步驟S200、獲取用戶(hù)的發(fā)音場(chǎng)景圖像；[0059]步驟S210、根據(jù)人臉識(shí)別技術(shù)從所述發(fā)音場(chǎng)景圖像中提取出用戶(hù)的人臉，從所述人臉中提取出用戶(hù)當(dāng)前的表情特征，確定與所述表情特征對(duì)應(yīng)的用戶(hù)當(dāng)前的面部表情信息；
[0060]相比圖1所示步驟S110，步驟S210為發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的面部表情信息時(shí)，步驟S110的一種可選實(shí)現(xiàn)方式；
[0061]確定出的表情特征可為“嘴角上揚(yáng)”、“嘴角下撇”，“臉部抽搐”等臉部器官的動(dòng)作特征，在確定出表情特征后即可確定各個(gè)表情特征所代表的含義，從而確定用戶(hù)當(dāng)前的面部表情信息，用戶(hù)當(dāng)前的面部表情信息可以為能夠表達(dá)表情特征所代表的含義的字詞，表情特征可以是由用戶(hù)的觸覺(jué)、味覺(jué)、心里感受等反應(yīng)出來(lái)的信息，因此本發(fā)明實(shí)施例中，表情特征所代表的含義可以指由用戶(hù)的臉部器官的動(dòng)作而反映的用戶(hù)的觸覺(jué)感受、味覺(jué)感受、心里感受等，一個(gè)表情特征可以既表示觸覺(jué)感受、味覺(jué)感受又可以表示心里感受，如“嘴角上揚(yáng)”的表情特征代表的含義為“高興”、“甜”、“快樂(lè)”、“得意”等字詞，則“嘴角上揚(yáng)”的表情特征所對(duì)應(yīng)的面部表情信息可以為“高興”、“樂(lè)”、“甜”、“得意”等字詞，本發(fā)明實(shí)施例中，具體的表情特征與表情特征所代表的用戶(hù)的觸覺(jué)感受、味覺(jué)感受、心里感受等的對(duì)應(yīng)關(guān)系，可按照實(shí)際需要進(jìn)行設(shè)定。
[0062]其中，確定與所述表情特征對(duì)應(yīng)的用戶(hù)當(dāng)前的面部表情信息的一種可選方式為:預(yù)先設(shè)置表情詞庫(kù)，在表情詞庫(kù)中存儲(chǔ)各個(gè)表情特征，與表達(dá)各個(gè)表情特征所代表的含義的字詞的對(duì)應(yīng)關(guān)系，如“嘴角上揚(yáng)”的表情特征所代表的含義為“高興”，“甜”、“快樂(lè)”、“得意”等，則可在表情詞庫(kù)中存儲(chǔ)“嘴角上揚(yáng)”與“高興”、“甜”、“快樂(lè)”、“得意”等的對(duì)應(yīng)關(guān)系，在表情詞庫(kù)中查找與用戶(hù)當(dāng)前的表情特征所對(duì)應(yīng)的字詞，確定所述字詞為用戶(hù)當(dāng)前的面部表情信息；
[0063]另一種確定與用戶(hù)當(dāng)前的表情特征對(duì)應(yīng)的用戶(hù)當(dāng)前的面部表情信息的可選方式為:建立表情訓(xùn)練模型，對(duì)電子設(shè)備進(jìn)行機(jī)器訓(xùn)練，使得電子設(shè)備能夠解析出各個(gè)表情特征所代表的含義，通過(guò)機(jī)器訓(xùn)練確定能夠表達(dá)各個(gè)表情特征所代表的含義的字詞，將該字詞確定為用戶(hù)當(dāng)前的面部表情信息。
[0064]步驟S220、將用戶(hù)當(dāng)前的面部表情信息與候選關(guān)鍵詞進(jìn)行匹配，判斷是否存在與用戶(hù)當(dāng)前的面部表情信息相對(duì)應(yīng)的候選關(guān)鍵詞；若是，執(zhí)行步驟S230，若否，執(zhí)行步驟S240 ；
[0065]相比圖1所示步驟S120，步驟S220為當(dāng)發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的面部表情信息時(shí)，步驟S120中將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配的一種可選實(shí)現(xiàn)方式；
[0066]在將表達(dá)用戶(hù)當(dāng)前的表情特征所代表的含義的字詞確定為用戶(hù)當(dāng)前的面部表情信息后，可將該字詞與候選關(guān)鍵詞進(jìn)行匹配，判斷候選關(guān)鍵詞與該字詞是否對(duì)應(yīng)，主要通過(guò)字詞間的相似度來(lái)判斷字詞與候選關(guān)鍵詞是否對(duì)應(yīng)，如當(dāng)候選關(guān)鍵詞為“太苦”和“泰谷”，用戶(hù)的表情特征為“嘴角上厥”的苦澀的表情時(shí)，則對(duì)應(yīng)的當(dāng)前的面部表情信息為“苦”、“難過(guò)”、“痛苦”、“疼痛”等字詞，則可將這些字詞分別與“太苦”和“泰谷”進(jìn)行匹配，從而確定與“苦”對(duì)應(yīng)的“太苦”;如果存在與用戶(hù)當(dāng)前的面部表情信息相對(duì)應(yīng)的候選關(guān)鍵詞，則說(shuō)明存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞，執(zhí)行步驟S230，否則，說(shuō)明不存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞，執(zhí)行步驟S240。
[0067]步驟S230、將與用戶(hù)當(dāng)前的面部表情信息相對(duì)應(yīng)的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞；
[0068]步驟S240、將優(yōu)先級(jí)最高的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
[0069]本發(fā)明實(shí)施例在關(guān)鍵詞識(shí)別中考慮了用戶(hù)當(dāng)前的面部表情信息的因素，通過(guò)將用戶(hù)當(dāng)前的面部表情信息與候選關(guān)鍵詞進(jìn)行匹配，當(dāng)存在與用戶(hù)當(dāng)前的面部表情信息相對(duì)應(yīng)的候選關(guān)鍵詞，將與用戶(hù)當(dāng)前的面部表情信息相對(duì)應(yīng)的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞，避免了通過(guò)上下文語(yǔ)義對(duì)關(guān)鍵詞進(jìn)行識(shí)別而存在的限制，提高了關(guān)鍵詞識(shí)別的正確率。
[0070]為了更好的說(shuō)明圖2所示方法，現(xiàn)以用戶(hù)輸入的語(yǔ)音為“tai gu”對(duì)應(yīng)的語(yǔ)音信號(hào)，且電子設(shè)備對(duì)該語(yǔ)音信號(hào)存在“太苦”和“泰谷”這兩個(gè)候選關(guān)鍵詞的情況為例，對(duì)圖2所示方法進(jìn)行說(shuō)明。
[0071]當(dāng)電子設(shè)備存在“太苦”和“泰谷”這兩個(gè)候選關(guān)鍵詞時(shí)，電子設(shè)備開(kāi)啟前置攝像頭或后置攝像頭拍攝用戶(hù)發(fā)音場(chǎng)景圖像，電子設(shè)備根據(jù)人臉識(shí)別技術(shù)從發(fā)音場(chǎng)景圖像中提取出用戶(hù)的人臉，從人臉中提取出用戶(hù)當(dāng)前的表情特征，在表情詞庫(kù)中查找用戶(hù)當(dāng)前的表情特征所對(duì)應(yīng)的字詞，若用戶(hù)當(dāng)前的表情特征為“嘴角上厥”等苦澀的表情時(shí)，則可在表情詞庫(kù)中查找到用戶(hù)當(dāng)前的表情特征所對(duì)應(yīng)的字詞為“苦”、“難過(guò)”、“痛苦”、“疼痛”等與“嘴角上厥”相對(duì)應(yīng)的字詞，將“苦”、“難過(guò)”、“痛苦”、“疼痛”等字詞與“太苦”和“泰谷”這兩個(gè)候選關(guān)鍵詞進(jìn)行匹配，通過(guò)字詞的形似比對(duì)，確定與“苦”對(duì)應(yīng)的“太苦”為最終輸出的關(guān)鍵詞；若用戶(hù)當(dāng)前沒(méi)有表情特征或表情特征不為嘴角上厥等苦澀的表情時(shí)，則“太苦”和“泰谷”與用戶(hù)當(dāng)前的面部表情信息均不對(duì)應(yīng)，將“太苦”和“泰谷”中優(yōu)先級(jí)最高的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
[0072]圖3為本發(fā)明實(shí)施例提供的關(guān)鍵詞方法的又一流程圖，結(jié)合圖1和圖3所示，該方法可以包括:
[0073]步驟S300、獲取用戶(hù)的發(fā)音場(chǎng)景圖像；
[0074]步驟S310、從所述發(fā)音場(chǎng)景圖像中提取出當(dāng)前的場(chǎng)景特征，確定與所述場(chǎng)景特征對(duì)應(yīng)的用戶(hù)當(dāng)前的發(fā)音背景信息；
[0075]相比圖1所示步驟SI 10，步驟S310為發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的發(fā)音背景信息時(shí)，步驟SllO的一種可選實(shí)現(xiàn)方式；
[0076]場(chǎng)景特征為發(fā)音場(chǎng)景圖像中標(biāo)識(shí)用戶(hù)當(dāng)前所處背景的信息，如用戶(hù)處在商店中，則發(fā)音場(chǎng)景圖像中的商店招牌、貨架等這些可以標(biāo)識(shí)用戶(hù)當(dāng)前處于商店這一背景的信息，均可認(rèn)為是場(chǎng)景特征；如用戶(hù)處于廣場(chǎng)中，廣場(chǎng)上的標(biāo)志性建筑等可以標(biāo)識(shí)用戶(hù)當(dāng)前處于廣場(chǎng)中，則廣場(chǎng)上的標(biāo)志性建筑可認(rèn)為是場(chǎng)景特征。在提取出當(dāng)前的場(chǎng)景特征后，則可通過(guò)預(yù)置的場(chǎng)景特征與發(fā)音背景信息的對(duì)應(yīng)關(guān)系確定用戶(hù)當(dāng)前的發(fā)音背景信息，可選的，可設(shè)置數(shù)據(jù)庫(kù)預(yù)存場(chǎng)景特征與發(fā)音背景信息的對(duì)應(yīng)關(guān)系，在確定當(dāng)前的場(chǎng)景特征后，通過(guò)查找數(shù)據(jù)庫(kù)確定用戶(hù)當(dāng)前的發(fā)音背景信息；其中，用戶(hù)當(dāng)前的發(fā)音背景信息可以為用戶(hù)當(dāng)前所處的背景，如商店、廣場(chǎng)場(chǎng)所等。
[0077]步驟S320、按照預(yù)先設(shè)置的發(fā)音背景信息與關(guān)鍵詞的對(duì)應(yīng)關(guān)系，判斷是否存在與用戶(hù)當(dāng)前的發(fā)音背景信息對(duì)應(yīng)的候選關(guān)鍵詞，若是，執(zhí)行步驟S330，若否，執(zhí)行步驟S340 ；
[0078]相比圖1所示步驟S120，步驟S320為當(dāng)發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的發(fā)音背景信息時(shí)，步驟S120中將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配的一種可選實(shí)現(xiàn)方式；
[0079]在確定了發(fā)音背景信息后，可按照預(yù)先設(shè)置的發(fā)音背景信息與關(guān)鍵詞的對(duì)應(yīng)關(guān)系，判斷是否存在與用戶(hù)當(dāng)前的發(fā)音背景信息對(duì)應(yīng)的候選關(guān)鍵詞，如確定的發(fā)音背景信息為商店，那么可預(yù)置商店中的商品名稱(chēng)、品牌等與商店相關(guān)的關(guān)鍵詞，與商店的對(duì)應(yīng)關(guān)系；將與商店對(duì)應(yīng)的商品名稱(chēng)、品牌等關(guān)鍵詞與候選關(guān)鍵詞進(jìn)行匹配，如果存在與商品名稱(chēng)、品牌等關(guān)鍵詞對(duì)應(yīng)的候選關(guān)鍵詞，則說(shuō)明存在與用戶(hù)當(dāng)前發(fā)音背景信息相匹配的候選關(guān)鍵詞，執(zhí)行步驟S330，否則，說(shuō)明不存在與用戶(hù)當(dāng)前發(fā)音背景信息相匹配的候選關(guān)鍵詞，執(zhí)行步驟S340，此處可通過(guò)字詞間的相似度，判斷候選關(guān)鍵詞與商品名稱(chēng)、品牌等關(guān)鍵詞間是否對(duì)應(yīng)，優(yōu)選的，對(duì)應(yīng)可以表示為字詞間的相似度完全一致。
[0080]步驟S330、將與用戶(hù)當(dāng)前的發(fā)音背景信息對(duì)應(yīng)的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞；
[0081]步驟S340、將優(yōu)先級(jí)最高的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
[0082]本發(fā)明實(shí)施例在關(guān)鍵詞識(shí)別中考慮了用戶(hù)當(dāng)前的發(fā)音背景信息的因素，通過(guò)將用戶(hù)當(dāng)前的發(fā)音背景信息與候選關(guān)鍵詞進(jìn)行匹配，當(dāng)存在與用戶(hù)當(dāng)前的發(fā)音背景信息對(duì)應(yīng)的候選關(guān)鍵詞時(shí)，將與用戶(hù)當(dāng)前的發(fā)音背景信息對(duì)應(yīng)的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞，避免了通過(guò)上下文語(yǔ)義對(duì)關(guān)鍵詞進(jìn)行識(shí)別而存在的限制，提高了關(guān)鍵詞識(shí)別的正確率。
[0083]為了更好的說(shuō)明圖3所示方法，現(xiàn)以用戶(hù)所處場(chǎng)景為商店，輸入的語(yǔ)音為“quechao”對(duì)應(yīng)的語(yǔ)音信號(hào)，由于發(fā)音不標(biāo)準(zhǔn)或近似音的緣故，電子設(shè)備對(duì)該語(yǔ)音信號(hào)存在“雀巢”和“鵲巢”這兩個(gè)候選關(guān)鍵詞的情況為例，對(duì)圖3所示方法進(jìn)行說(shuō)明。
[0084]當(dāng)電子設(shè)備存在“雀巢”和“鵲巢”這兩個(gè)候選關(guān)鍵詞時(shí)，電子設(shè)備開(kāi)啟前置攝像頭或后置攝像頭拍攝用戶(hù)發(fā)音場(chǎng)景圖像，電子設(shè)備從發(fā)音場(chǎng)景圖像中提取出當(dāng)前的場(chǎng)景特征，通過(guò)當(dāng)前場(chǎng)景特征與發(fā)音背景信息的對(duì)應(yīng)關(guān)系，確定用戶(hù)當(dāng)前的發(fā)音背景信息，由于用戶(hù)處于商店中，電子設(shè)備可從發(fā)音場(chǎng)景圖像中提取到貨架等與商店相關(guān)的場(chǎng)景特征，則可通過(guò)預(yù)置的貨架等與商店相關(guān)的場(chǎng)景特征與商店的對(duì)應(yīng)關(guān)系，確定當(dāng)前的發(fā)音背景信息為商店，在確定了用戶(hù)當(dāng)前的發(fā)音背景信息后，按照預(yù)先設(shè)置的發(fā)音背景信息與關(guān)鍵詞的對(duì)應(yīng)關(guān)系，判斷是否存在與用戶(hù)當(dāng)前的發(fā)音背景信息對(duì)應(yīng)的候選關(guān)鍵詞，由于當(dāng)前的發(fā)音背景信息為商店，則與商店對(duì)應(yīng)的關(guān)鍵詞為商品的種類(lèi)、品牌等與商店這一背景相關(guān)的字詞，由于“雀巢”和“鵲巢”中，“雀巢”為咖啡品牌，與商店對(duì)應(yīng)，因此確定“雀巢”為最終輸出的關(guān)鍵詞。
[0085]下面對(duì)本發(fā)明實(shí)施例提供的一種電子設(shè)備進(jìn)行介紹，下文所介紹的電子設(shè)備與上文描述的關(guān)鍵詞識(shí)別方法相對(duì)應(yīng)，兩者可相互參照。
[0086]圖4為本發(fā)明實(shí)施例提供的一種電子設(shè)備的結(jié)構(gòu)框圖，參照?qǐng)D4，電子設(shè)備可以包括:圖像獲取模塊100，發(fā)音場(chǎng)景信息確定模塊200和匹配確定模塊300 ;其中，圖像獲取模塊100與發(fā)音場(chǎng)景信息確定模塊200相連，發(fā)音場(chǎng)景信息確定模塊200與匹配確定模塊300相連。
[0087]圖像獲取模塊100，用于獲取用戶(hù)的發(fā)音場(chǎng)景圖像，將所述發(fā)音場(chǎng)景圖像發(fā)送給發(fā)音場(chǎng)景信息確定模塊200 ；
[0088]發(fā)音場(chǎng)景信息確定模塊200，用于接收所述發(fā)音場(chǎng)景圖像，確定所述發(fā)音場(chǎng)景圖像中的發(fā)音場(chǎng)景信息，將所述發(fā)音場(chǎng)景信息發(fā)送給匹配確定模塊300 ；
[0089]匹配確定模塊300，用于接收所述發(fā)音場(chǎng)景信息，將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配，當(dāng)存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí)，將所述相匹配的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞，當(dāng)不存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí)，將優(yōu)先級(jí)最聞的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
[0090]本發(fā)明實(shí)施例所指的發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的面部表情信息或用戶(hù)當(dāng)前的發(fā)
音背景信息。
[0091]圖5為本發(fā)明實(shí)施例提供的一種電子設(shè)備的另一結(jié)構(gòu)框圖，參照?qǐng)D5，發(fā)音場(chǎng)景信息確定模塊200可以包括:
[0092]面部表情信息確定單元210，用于根據(jù)人臉識(shí)別技術(shù)從所述發(fā)音場(chǎng)景圖像中提取出用戶(hù)的人臉，從所述人臉中提取出用戶(hù)當(dāng)前的表情特征，確定與所述表情特征對(duì)應(yīng)的用戶(hù)當(dāng)前的面部表情信息；
[0093]匹配確定模塊300可以包括:
[0094]第一匹配單元310，用于將用戶(hù)當(dāng)前的面部表情信息與候選關(guān)鍵詞進(jìn)行匹配，判斷是否存在與用戶(hù)當(dāng)前的面部表情信息相對(duì)應(yīng)的候選關(guān)鍵詞，若是，則存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞，若否，則不存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞；
[0095]第一確定單元311，用于在第一匹配單元310判斷存在與用戶(hù)當(dāng)前的面部表情信息對(duì)應(yīng)的候選關(guān)鍵詞時(shí)，將與用戶(hù)當(dāng)前的面部表情信息對(duì)應(yīng)的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞，在第一匹配單元310判斷不存在與用戶(hù)當(dāng)前的面部表情信息對(duì)應(yīng)的候選關(guān)鍵詞時(shí)，將優(yōu)先級(jí)最聞的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
[0096]其中，面部表情信息確定單元210的結(jié)構(gòu)可如圖6所示，包括:
[0097]人臉提取子單元211，用于根據(jù)人臉識(shí)別技術(shù)從所述發(fā)音場(chǎng)景圖像中提取出用戶(hù)的人臉；
[0098]表情特征提取子單元212，用于從所述人臉中提取出用戶(hù)當(dāng)前的表情特征；
[0099]查找子單元213，用于在預(yù)置的表情詞庫(kù)中查找與所述用戶(hù)當(dāng)前的表情特征相對(duì)應(yīng)的字詞；
[0100]確定子單元214，用于將查找子單元213所查找出的字詞確定為用戶(hù)當(dāng)前的面部表情信息。
[0101]圖7為本發(fā)明實(shí)施例提供的一種電子設(shè)備的又一結(jié)構(gòu)框圖，參照?qǐng)D7，發(fā)音場(chǎng)景信息確定模塊200可以包括:
[0102]發(fā)音背景信息確定單元220，用于從所述發(fā)音場(chǎng)景圖像中提取出當(dāng)前的場(chǎng)景特征，確定與所述場(chǎng)景特征對(duì)應(yīng)的用戶(hù)當(dāng)前的發(fā)音背景信息；
[0103]匹配確定模塊300可以包括:
[0104]第二匹配單元320，用于按照預(yù)先設(shè)置的發(fā)音背景信息與關(guān)鍵詞的對(duì)應(yīng)關(guān)系，判斷是否存在與用戶(hù)當(dāng)前的發(fā)音背景信息對(duì)應(yīng)的候選關(guān)鍵詞，若是，則存在與用戶(hù)當(dāng)前發(fā)音背景信息相匹配的候選關(guān)鍵詞，若否，則不存在與用戶(hù)當(dāng)前發(fā)音背景信息相匹配的候選關(guān)鍵詞；
[0105]第二確定單元321，用于在第二匹配單元320判斷存在與用戶(hù)當(dāng)前的發(fā)音背景信息相對(duì)應(yīng)的候選關(guān)鍵詞時(shí)，將與用戶(hù)當(dāng)前的發(fā)音背景信息相對(duì)應(yīng)的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞，在第二匹配單元320判斷不存在與用戶(hù)當(dāng)前的發(fā)音背景信息相對(duì)應(yīng)的候選關(guān)鍵詞時(shí)，將優(yōu)先級(jí)最聞的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。[0106]本發(fā)明在關(guān)鍵詞的識(shí)別中考慮了發(fā)音場(chǎng)景信息的因素，通過(guò)將發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配，當(dāng)存在與用戶(hù)當(dāng)前發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí)，將所述相匹配的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞，這樣就避免了通過(guò)上下文語(yǔ)義對(duì)關(guān)鍵詞進(jìn)行識(shí)別而存在的限制，提高了關(guān)鍵詞識(shí)別的正確率。
[0107]本說(shuō)明書(shū)中各個(gè)實(shí)施例采用遞進(jìn)的方式描述，每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處，各個(gè)實(shí)施例之間相同相似部分互相參見(jiàn)即可。對(duì)于實(shí)施例公開(kāi)的裝置而言，由于其與實(shí)施例公開(kāi)的方法相對(duì)應(yīng)，所以描述的比較簡(jiǎn)單，相關(guān)之處參見(jiàn)方法部分說(shuō)明即可。
[0108]專(zhuān)業(yè)人員還可以進(jìn)一步意識(shí)到，結(jié)合本文中所公開(kāi)的實(shí)施例描述的各示例的單元及算法步驟，能夠以電子硬件、計(jì)算機(jī)軟件或者二者的結(jié)合來(lái)實(shí)現(xiàn)，為了清楚地說(shuō)明硬件和軟件的可互換性，在上述說(shuō)明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來(lái)執(zhí)行，取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。專(zhuān)業(yè)技術(shù)人員可以對(duì)每個(gè)特定的應(yīng)用來(lái)使用不同方法來(lái)實(shí)現(xiàn)所描述的功能，但是這種實(shí)現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。
[0109]結(jié)合本文中所公開(kāi)的實(shí)施例描述的方法或算法的步驟可以直接用硬件、處理器執(zhí)行的軟件模塊，或者二者的結(jié)合來(lái)實(shí)施。軟件模塊可以置于隨機(jī)存儲(chǔ)器(RAM)、內(nèi)存、只讀存儲(chǔ)器(ROM)、電可編程ROM、電可擦除可編程ROM、寄存器、硬盤(pán)、可移動(dòng)磁盤(pán)、CD-ROM、或【技術(shù)領(lǐng)域】?jī)?nèi)所公知的任意其它形式的存儲(chǔ)介質(zhì)中。
[0110]對(duì)所公開(kāi)的實(shí)施例的上述說(shuō)明，使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對(duì)這些實(shí)施例的多種修改對(duì)本領(lǐng)域的專(zhuān)業(yè)技術(shù)人員來(lái)說(shuō)將是顯而易見(jiàn)的，本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下，在其它實(shí)施例中實(shí)現(xiàn)。因此，本發(fā)明將不會(huì)被限制于本文所示的這些實(shí)施例，而是要符合與本文所公開(kāi)的原理和新穎特點(diǎn)相一致的最寬的范圍。
【權(quán)利要求】
1.一種關(guān)鍵詞識(shí)別方法，其特征在于，包括:獲取用戶(hù)的發(fā)音場(chǎng)景圖像；確定所述發(fā)音場(chǎng)景圖像中的發(fā)音場(chǎng)景信息；將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配，當(dāng)存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí)，將所述相匹配的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞，當(dāng)不存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí)，將優(yōu)先級(jí)最高的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的面部表情信息或用戶(hù)當(dāng)前的發(fā)音背景信息。
3.根據(jù)權(quán)利要求2所述的方法，其特征在于，當(dāng)所述發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的面部表情信息時(shí)，所述確定所述發(fā)音場(chǎng)景圖像中的發(fā)音場(chǎng)景信息包括:根據(jù)人臉識(shí)別技術(shù)從所述發(fā)音場(chǎng)景圖像中提取出用戶(hù)的人臉，從所述人臉中提取出用戶(hù)當(dāng)前的表情特征，確定與所述表情特征對(duì)應(yīng)的用戶(hù)當(dāng)前的面部表情信息。
4.根據(jù)權(quán)利要求3所述的方法，其特征在于，所述確定與所述表情特征對(duì)應(yīng)的用戶(hù)當(dāng)前的面部表情信息包括:在預(yù)置的表情詞庫(kù)中查找所述表情特征所對(duì)應(yīng)的字詞，確定所述字詞為用戶(hù)當(dāng)前的面部表情信息，所述預(yù)置的表情詞庫(kù)存儲(chǔ)有表情特征與表達(dá)表情特征所代表的含義的字詞的對(duì)應(yīng)關(guān)系。
5.根據(jù)權(quán)利要求2至4任一項(xiàng)所述的方法，其特征在于，當(dāng)發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的面部表情信息時(shí)，所述將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配包括:將用戶(hù)當(dāng)前的面部表情信息與候選關(guān)鍵詞進(jìn)行匹配，判斷是否存在與用戶(hù)當(dāng)前的面部表情信息相對(duì)應(yīng)的候選關(guān)鍵詞；`若是，則存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞，若否，則不存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞。
6.根據(jù)權(quán)利要求2所述的方法，其特征在于，當(dāng)所述發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的發(fā)音背景信息時(shí)，所述確定所述發(fā)音場(chǎng)景圖像中的發(fā)音場(chǎng)景信息包括:從所述發(fā)音場(chǎng)景圖像中提取出場(chǎng)景特征，確定與所述場(chǎng)景特征對(duì)應(yīng)的用戶(hù)當(dāng)前的發(fā)音背景信息。
7.根據(jù)權(quán)利要求2或6所述的方法，其特征在于，當(dāng)發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的發(fā)音背景信息時(shí)，所述將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配包括:按照預(yù)先設(shè)置的發(fā)音背景信息與關(guān)鍵詞的對(duì)應(yīng)關(guān)系，判斷是否存在與用戶(hù)當(dāng)前的發(fā)音背景信息對(duì)應(yīng)的候選關(guān)鍵詞；若是，則存在與用戶(hù)當(dāng)前的發(fā)音背景信息相匹配的候選關(guān)鍵詞，若否，則不存在與用戶(hù)當(dāng)前的發(fā)音背景信息相匹配的候選關(guān)鍵詞。
8.一種電子設(shè)備，其特征在于，包括:圖像獲取模塊，發(fā)音場(chǎng)景信息確定模塊和匹配確定模塊；所述圖像獲取模塊，用于獲取用戶(hù)的發(fā)音場(chǎng)景圖像，將所述發(fā)音場(chǎng)景圖像發(fā)送給所述發(fā)音場(chǎng)景信息確定模塊；所述發(fā)音場(chǎng)景信息確定模塊，用于接收所述發(fā)音場(chǎng)景圖像，確定所述發(fā)音場(chǎng)景圖像中的發(fā)音場(chǎng)景信息，將所述發(fā)音場(chǎng)景信息發(fā)送給所述匹配確定模塊；所述匹配確定模塊，用于接收所述發(fā)音場(chǎng)景信息，將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配，當(dāng)存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí)，將所述相匹配的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞，當(dāng)不存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí)，將優(yōu)先級(jí)最聞的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
9.根據(jù)權(quán)利要求8所述的電子設(shè)備，其特征在于，所述發(fā)音場(chǎng)景信息確定模塊包括: 面部表情信息確定單元，用于根據(jù)人臉識(shí)別技術(shù)從所述發(fā)音場(chǎng)景圖像中提取出用戶(hù)的人臉，從所述人臉中提取出用戶(hù)當(dāng)前的表情特征，確定與所述表情特征對(duì)應(yīng)的用戶(hù)當(dāng)前的面部表情信息；所述匹配確定模塊包括: 第一匹配單元，用于將用戶(hù)當(dāng)前的面部表情信息與候選關(guān)鍵詞進(jìn)行匹配，判斷是否存在與用戶(hù)當(dāng)前的面部表情信息相對(duì)應(yīng)的候選關(guān)鍵詞，若是，則存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞，若否，則不存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞；第一確定單元，用于在所述第一匹配單元判斷存在與用戶(hù)當(dāng)前的面部表情信息對(duì)應(yīng)的候選關(guān)鍵詞時(shí)，將與用戶(hù)當(dāng)前的面部表情信息對(duì)應(yīng)的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞，在所述第一匹配單元判斷不存在與用戶(hù)當(dāng)前的面部表情信息對(duì)應(yīng)的候選關(guān)鍵詞時(shí)，將優(yōu)先級(jí)最聞的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
10.根據(jù)權(quán)利要求8所述的電子設(shè)備，其特征在于，所述發(fā)音場(chǎng)景信息確定模塊包括: 發(fā)音背景信息確定單元，用于從所述發(fā)音場(chǎng)景圖像中提取出當(dāng)前的場(chǎng)景特征，確定與所述場(chǎng)景特征對(duì)應(yīng)的用戶(hù)當(dāng)前的發(fā)音背景信息；所述匹配確定模塊包括: 第二匹配單元，用于按照預(yù)先設(shè)置的發(fā)音背景信息與關(guān)鍵詞的對(duì)應(yīng)關(guān)系，判斷是否存在與用戶(hù)當(dāng)前的發(fā)音背景信息對(duì)應(yīng)的候選關(guān)鍵詞，若是，則存在與用戶(hù)當(dāng)前的發(fā)音背景信息相匹配的候選關(guān)鍵詞，若否，則不存在與用戶(hù)當(dāng)前的發(fā)音背景信息相匹配的候選關(guān)鍵詞；第二確定單元，用于在所述第二匹配單元判斷存在與用戶(hù)當(dāng)前的發(fā)音背景信息相對(duì)應(yīng)的候選關(guān)鍵詞時(shí)，將與用戶(hù)當(dāng)前的發(fā)音背景信息相對(duì)應(yīng)的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞，在所述第二匹配單元判斷不存在與用戶(hù)當(dāng)前的發(fā)音背景信息相對(duì)應(yīng)的候選關(guān)鍵詞時(shí)，將優(yōu)先級(jí)最聞的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
【文檔編號(hào)】G10L15/00GK103678404SQ201210357210
【公開(kāi)日】2014年3月26日申請(qǐng)日期:2012年9月21日優(yōu)先權(quán)日:2012年9月21日
【發(fā)明者】彭剛申請(qǐng)人:聯(lián)想(北京)有限公司

完整全部詳細(xì)技術(shù)資料下載