欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種關(guān)鍵詞識(shí)別方法及電子設(shè)備的制作方法

文檔序號(hào):2825463閱讀:377來(lái)源:國(guó)知局
一種關(guān)鍵詞識(shí)別方法及電子設(shè)備的制作方法
【專(zhuān)利摘要】本發(fā)明實(shí)施例提供一種關(guān)鍵詞識(shí)別方法及電子設(shè)備,其中方法包括:獲取用戶(hù)的發(fā)音場(chǎng)景圖像;確定所述發(fā)音場(chǎng)景圖像中的發(fā)音場(chǎng)景信息;將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配,當(dāng)存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí),將所述相匹配的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞,當(dāng)不存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí),將優(yōu)先級(jí)最高的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。本發(fā)明避免了通過(guò)上下文語(yǔ)義對(duì)關(guān)鍵詞進(jìn)行識(shí)別而存在的限制,提高了關(guān)鍵詞識(shí)別的正確率。
【專(zhuān)利說(shuō)明】—種關(guān)鍵詞識(shí)別方法及電子設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及語(yǔ)音識(shí)別【技術(shù)領(lǐng)域】,更具體地說(shuō),涉及一種關(guān)鍵詞識(shí)別方法及電子設(shè)備。
【背景技術(shù)】
[0002]隨著語(yǔ)音識(shí)別技術(shù)的發(fā)展,越來(lái)越多的電子設(shè)備,如智能手機(jī)、個(gè)人計(jì)算機(jī)和掌上電腦等均具備了語(yǔ)音輸入的功能,借助于語(yǔ)音識(shí)別技術(shù),這些電子設(shè)備能夠識(shí)別和理解用戶(hù)輸入的語(yǔ)音,將語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令,使得信息的輸入更為簡(jiǎn)便。
[0003]語(yǔ)音識(shí)別中關(guān)鍵詞的識(shí)別尤為重要,如果關(guān)鍵詞識(shí)別錯(cuò)誤,那么用戶(hù)輸入的語(yǔ)音的語(yǔ)義將發(fā)生重大的改變,使得語(yǔ)音識(shí)別出錯(cuò)。由于近似音或用戶(hù)發(fā)音不標(biāo)準(zhǔn)等問(wèn)題,對(duì)于用戶(hù)輸入的一個(gè)關(guān)鍵詞語(yǔ)音,電子設(shè)備可能會(huì)識(shí)別出多個(gè)候選關(guān)鍵詞,此時(shí)就需要對(duì)該多個(gè)候選關(guān)鍵詞進(jìn)行進(jìn)一步的識(shí)別,從中確定出最終輸出的關(guān)鍵詞;如當(dāng)用戶(hù)輸入的語(yǔ)音為“tai gu”對(duì)應(yīng)的語(yǔ)音信號(hào)時(shí),電子設(shè)備確認(rèn)該語(yǔ)音信號(hào)為關(guān)鍵詞語(yǔ)音信號(hào)后,由于近似音或用戶(hù)發(fā)音不標(biāo)準(zhǔn)的問(wèn)題,電子設(shè)備對(duì)于該語(yǔ)音信號(hào)可能存在識(shí)別出“太苦”、“泰谷”這兩個(gè)候選關(guān)鍵詞的情況,此時(shí)就需要對(duì)這兩個(gè)候選關(guān)鍵詞進(jìn)行進(jìn)一步的識(shí)別,在“泰谷”和“太苦”間確定最終輸出的關(guān)鍵詞。
[0004]現(xiàn)有技術(shù)中,當(dāng)一個(gè)關(guān)鍵詞語(yǔ)音識(shí)別出多個(gè)候選關(guān)鍵詞時(shí),電子設(shè)備一般通過(guò)用戶(hù)輸入的語(yǔ)音的上下文語(yǔ)義對(duì)該多個(gè)候選關(guān)鍵詞進(jìn)行進(jìn)一步的識(shí)別,從而確定出候選關(guān)鍵詞的優(yōu)先級(jí),將優(yōu)先級(jí)最高的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞,這種關(guān)鍵詞的識(shí)別方式雖然在一定程度上能夠增強(qiáng)關(guān)鍵詞識(shí)別的正確率;但很多情況下,如用戶(hù)輸入的語(yǔ)音過(guò)于簡(jiǎn)短或用戶(hù)輸入的語(yǔ)音只為關(guān)鍵詞語(yǔ)音時(shí),這種通過(guò)上下文語(yǔ)義對(duì)關(guān)鍵詞進(jìn)行識(shí)別的方式就會(huì)存在限制,無(wú)法正確的對(duì)關(guān)鍵詞進(jìn)行識(shí)別,影響關(guān)鍵詞識(shí)別的正確率。

【發(fā)明內(nèi)容】

[0005]有鑒于此,本發(fā)明實(shí)施例提供一種關(guān)鍵詞識(shí)別方法及電子設(shè)備,以避免通過(guò)上下文語(yǔ)義對(duì)關(guān)鍵詞進(jìn)行識(shí)別而存在的限制,提高關(guān)鍵詞識(shí)別的正確率。
[0006]為實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例提供如下技術(shù)方案:
[0007]—種關(guān)鍵詞識(shí)別方法,包括:
[0008]獲取用戶(hù)的發(fā)音場(chǎng)景圖像;
[0009]確定所述發(fā)音場(chǎng)景圖像中的發(fā)音場(chǎng)景信息;
[0010]將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配,當(dāng)存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí),將所述相匹配的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞,當(dāng)不存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí),將優(yōu)先級(jí)最高的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵
ο
[0011]可選的,所述發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的面部表情信息或用戶(hù)當(dāng)前的發(fā)音背景信肩、Ο[0012]可選的,當(dāng)所述發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的面部表情信息時(shí),所述確定所述發(fā)音場(chǎng)景圖像中的發(fā)音場(chǎng)景信息包括:
[0013]根據(jù)人臉識(shí)別技術(shù)從所述發(fā)音場(chǎng)景圖像中提取出用戶(hù)的人臉,從所述人臉中提取出用戶(hù)當(dāng)前的表情特征,確定與所述表情特征對(duì)應(yīng)的用戶(hù)當(dāng)前的面部表情信息。
[0014]可選的,所述確定與所述表情特征對(duì)應(yīng)的用戶(hù)當(dāng)前的面部表情信息包括:
[0015]在預(yù)置的表情詞庫(kù)中查找所述表情特征所對(duì)應(yīng)的字詞,確定所述字詞為用戶(hù)當(dāng)前的面部表情信息,所述預(yù)置的表情詞庫(kù)存儲(chǔ)有表情特征與表達(dá)表情特征所代表的含義的字詞的對(duì)應(yīng)關(guān)系。
[0016]可選的,當(dāng)發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的面部表情信息時(shí),所述將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配包括:
[0017]將用戶(hù)當(dāng)前的面部表情信息與候選關(guān)鍵詞進(jìn)行匹配,判斷是否存在與用戶(hù)當(dāng)前的面部表情信息相對(duì)應(yīng)的候選關(guān)鍵詞;
[0018]若是,則存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞,若否,則不存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞。
[0019]可選的,當(dāng)所述發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的發(fā)音背景信息時(shí),所述確定所述發(fā)音場(chǎng)景圖像中的發(fā)音場(chǎng)景信息包括:
[0020]從所述發(fā)音場(chǎng)景圖像中提取出場(chǎng)景特征,確定與所述場(chǎng)景特征對(duì)應(yīng)的用戶(hù)當(dāng)前的
發(fā)音背景信息。
[0021]可選的,當(dāng)發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的發(fā)音背景信息時(shí),所述將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配包括:
[0022]按照預(yù)先設(shè)置的發(fā)音背景信息與關(guān)鍵詞的對(duì)應(yīng)關(guān)系,判斷是否存在與用戶(hù)當(dāng)前的發(fā)音背景信息對(duì)應(yīng)的候選關(guān)鍵詞;
[0023]若是,則存在與用戶(hù)當(dāng)前的發(fā)音背景信息相匹配的候選關(guān)鍵詞,若否,則不存在與用戶(hù)當(dāng)前的發(fā)音背景信息相匹配的候選關(guān)鍵詞。
[0024]本發(fā)明實(shí)施例還提供一種電子設(shè)備,包括:圖像獲取模塊,發(fā)音場(chǎng)景信息確定模塊和匹配確定模塊;
[0025]所述圖像獲取模塊,用于獲取用戶(hù)的發(fā)音場(chǎng)景圖像,將所述發(fā)音場(chǎng)景圖像發(fā)送給所述發(fā)音場(chǎng)景信息確定模塊;
[0026]所述發(fā)音場(chǎng)景信息確定模塊,用于接收所述發(fā)音場(chǎng)景圖像,確定所述發(fā)音場(chǎng)景圖像中的發(fā)音場(chǎng)景信息,將所述發(fā)音場(chǎng)景信息發(fā)送給所述匹配確定模塊;
[0027]所述匹配確定模塊,用于接收所述發(fā)音場(chǎng)景信息,將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配,當(dāng)存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí),將所述相匹配的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞,當(dāng)不存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí),將優(yōu)先級(jí)最聞的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
[0028]可選的,所述發(fā)音場(chǎng)景信息確定模塊包括:
[0029]面部表情信息確定單元,用于根據(jù)人臉識(shí)別技術(shù)從所述發(fā)音場(chǎng)景圖像中提取出用戶(hù)的人臉,從所述人臉中提取出用戶(hù)當(dāng)前的表情特征,確定與所述表情特征對(duì)應(yīng)的用戶(hù)當(dāng)前的面部表情信息;
[0030]所述匹配確定模塊包括:[0031]第一匹配單元,用于將用戶(hù)當(dāng)前的面部表情信息與候選關(guān)鍵詞進(jìn)行匹配,判斷是否存在與用戶(hù)當(dāng)前的面部表情信息相對(duì)應(yīng)的候選關(guān)鍵詞,若是,則存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞,若否,則不存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞;
[0032]第一確定單元,用于在所述第一匹配單元判斷存在與用戶(hù)當(dāng)前的面部表情信息對(duì)應(yīng)的候選關(guān)鍵詞時(shí),將與用戶(hù)當(dāng)前的面部表情信息對(duì)應(yīng)的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞,在所述第一匹配單元判斷不存在與用戶(hù)當(dāng)前的面部表情信息對(duì)應(yīng)的候選關(guān)鍵詞時(shí),將優(yōu)先級(jí)最聞的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
[0033]可選的,所述發(fā)音場(chǎng)景信息確定模塊包括:
[0034]發(fā)音背景信息確定單元,用于從所述發(fā)音場(chǎng)景圖像中提取出當(dāng)前的場(chǎng)景特征,確定與所述場(chǎng)景特征對(duì)應(yīng)的用戶(hù)當(dāng)前的發(fā)音背景信息;
[0035]所述匹配確定模塊包括:
[0036]第二匹配單元,用于按照預(yù)先設(shè)置的發(fā)音背景信息與關(guān)鍵詞的對(duì)應(yīng)關(guān)系,判斷是否存在與用戶(hù)當(dāng)前的發(fā)音背景信息對(duì)應(yīng)的候選關(guān)鍵詞,若是,則存在與用戶(hù)當(dāng)前的發(fā)音背景信息相匹配的候選關(guān)鍵詞,若否,則不存在與用戶(hù)當(dāng)前的發(fā)音背景信息相匹配的候選關(guān)鍵詞;
[0037]第二確定單元,用于在所述第二匹配單元判斷存在與用戶(hù)當(dāng)前的發(fā)音背景信息相對(duì)應(yīng)的候選關(guān)鍵詞時(shí),將與用戶(hù)當(dāng)前的發(fā)音背景信息相對(duì)應(yīng)的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞,在所述第二匹配單元判斷不存在與用戶(hù)當(dāng)前的發(fā)音背景信息相對(duì)應(yīng)的候選關(guān)鍵詞時(shí),將優(yōu)先級(jí)最高的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
[0038]基于上述技術(shù)方案,本發(fā)明實(shí)施例提供的關(guān)鍵詞識(shí)別方法,在關(guān)鍵詞識(shí)別中考慮了發(fā)音場(chǎng)景信息的因素,通過(guò)將發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配,當(dāng)存在與用戶(hù)當(dāng)前發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí),將所述相匹配的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞,這樣就避免了通過(guò)上下文語(yǔ)義對(duì)關(guān)鍵詞進(jìn)行識(shí)別而存在的限制,提高了關(guān)鍵詞識(shí)別的正確率。
【專(zhuān)利附圖】

【附圖說(shuō)明】
[0039]為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0040]圖1為本發(fā)明實(shí)施例提供的關(guān)鍵詞識(shí)別方法的流程圖;
[0041]圖2為本發(fā)明實(shí)施例提供的關(guān)鍵詞識(shí)別方法的另一流程圖;
[0042]圖3為本發(fā)明實(shí)施例提供的關(guān)鍵詞識(shí)別方法的又一流程圖;
[0043]圖4為本發(fā)明實(shí)施例提供的一種電子設(shè)備的結(jié)構(gòu)框圖;
[0044]圖5為本發(fā)明實(shí)施例提供的一種電子設(shè)備的另一結(jié)構(gòu)框圖;
[0045]圖6為本發(fā)明實(shí)施例提供的面部表情信息確定單元的結(jié)構(gòu)框圖;
[0046]圖7為本發(fā)明實(shí)施例提供的一種電子設(shè)備的又一結(jié)構(gòu)框圖。【具體實(shí)施方式】
[0047]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0048]圖1為本發(fā)明實(shí)施例提供的關(guān)鍵詞識(shí)別方法的流程圖,參照?qǐng)D1,該方法可以包括:
[0049]步驟S100、獲取用戶(hù)的發(fā)音場(chǎng)景圖像;
[0050]當(dāng)語(yǔ)音識(shí)別的過(guò)程中出現(xiàn)多個(gè)候選關(guān)鍵詞時(shí),可啟用本發(fā)明實(shí)施例提供的方法,執(zhí)行步驟SlOO “獲取用戶(hù)的發(fā)音場(chǎng)景圖像”的操作;也可設(shè)定每次語(yǔ)音識(shí)別過(guò)程中,均啟用本發(fā)明實(shí)施例提供的方法,執(zhí)行步驟SlOO “獲取用戶(hù)的發(fā)音場(chǎng)景圖像”的操作;也可設(shè)定語(yǔ)音識(shí)別中啟用本發(fā)明實(shí)施例提供的方法的預(yù)定條件,在達(dá)到預(yù)定條件時(shí),執(zhí)行步驟SlOO“獲取用戶(hù)的發(fā)音場(chǎng)景圖像”的操作;
[0051]用戶(hù)的發(fā)音場(chǎng)景圖像是指用戶(hù)在發(fā)音時(shí)刻的場(chǎng)景圖像,包括用戶(hù)的自身圖像及用戶(hù)的背景圖像。
[0052]步驟S110、確定所述發(fā)音場(chǎng)景圖像中的發(fā)音場(chǎng)景信息;
[0053]其中,發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的面部表情信息或用戶(hù)當(dāng)前的發(fā)音背景信息,由于發(fā)音場(chǎng)景圖像包括了用戶(hù)的自身圖像及用戶(hù)的背景圖像,因此通過(guò)用戶(hù)的自身圖像即可確定用戶(hù)當(dāng)前的面部表情信息,如喜、怒、哀、樂(lè)、難過(guò),傷心等信息,通過(guò)用戶(hù)的背景圖像即可確定用戶(hù)當(dāng)前的發(fā)音背景信息,如用戶(hù)所處的超市、廣場(chǎng)、健身房等場(chǎng)所信息。
[0054]步驟S120、將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配,當(dāng)存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí),將所述相匹配的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞,當(dāng)不存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí),將優(yōu)先級(jí)最高的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
[0055]在確定了發(fā)音場(chǎng)景信息后,可將語(yǔ)音識(shí)別過(guò)程中出現(xiàn)的候選關(guān)鍵詞與發(fā)音場(chǎng)景信息進(jìn)行匹配,具體的,當(dāng)發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的面部表情信息時(shí),可將候選關(guān)鍵詞與用戶(hù)當(dāng)前的面部表情信息進(jìn)行匹配,判斷是否存在與用戶(hù)當(dāng)前的面部表情信息相對(duì)應(yīng)的候選關(guān)鍵詞,若存在與用戶(hù)當(dāng)前的面部表情信息相對(duì)應(yīng)的候選關(guān)鍵詞,則表明存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞;當(dāng)發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的發(fā)音背景信息時(shí),可將候選關(guān)鍵詞與用戶(hù)當(dāng)前的發(fā)音背景信息進(jìn)行匹配,判斷是否存在與用戶(hù)當(dāng)前的發(fā)音背景信息相對(duì)應(yīng)的候選關(guān)鍵詞,若存在與用戶(hù)當(dāng)前的發(fā)音背景信息相對(duì)應(yīng)的候選關(guān)鍵詞,則表明存在與用戶(hù)當(dāng)前的發(fā)音背景信息相匹配的候選關(guān)鍵詞。
[0056]本發(fā)明實(shí)施例提供的關(guān)鍵詞識(shí)別方法,在關(guān)鍵詞識(shí)別中考慮了發(fā)音場(chǎng)景信息的因素,通過(guò)將發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配,當(dāng)存在與用戶(hù)當(dāng)前發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí),將所述相匹配的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞,這樣就避免了通過(guò)上下文語(yǔ)義對(duì)關(guān)鍵詞進(jìn)行識(shí)別而存在的限制,提高了關(guān)鍵詞識(shí)別的正確率。
[0057]圖2為本發(fā)明實(shí)施例提供的關(guān)鍵詞識(shí)別方法的另一流程圖,結(jié)合圖1和圖2所示,該方法可以包括:
[0058]步驟S200、獲取用戶(hù)的發(fā)音場(chǎng)景圖像;[0059]步驟S210、根據(jù)人臉識(shí)別技術(shù)從所述發(fā)音場(chǎng)景圖像中提取出用戶(hù)的人臉,從所述人臉中提取出用戶(hù)當(dāng)前的表情特征,確定與所述表情特征對(duì)應(yīng)的用戶(hù)當(dāng)前的面部表情信息;
[0060]相比圖1所示步驟S110,步驟S210為發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的面部表情信息時(shí),步驟S110的一種可選實(shí)現(xiàn)方式;
[0061]確定出的表情特征可為“嘴角上揚(yáng)”、“嘴角下撇”,“臉部抽搐”等臉部器官的動(dòng)作特征,在確定出表情特征后即可確定各個(gè)表情特征所代表的含義,從而確定用戶(hù)當(dāng)前的面部表情信息,用戶(hù)當(dāng)前的面部表情信息可以為能夠表達(dá)表情特征所代表的含義的字詞,表情特征可以是由用戶(hù)的觸覺(jué)、味覺(jué)、心里感受等反應(yīng)出來(lái)的信息,因此本發(fā)明實(shí)施例中,表情特征所代表的含義可以指由用戶(hù)的臉部器官的動(dòng)作而反映的用戶(hù)的觸覺(jué)感受、味覺(jué)感受、心里感受等,一個(gè)表情特征可以既表示觸覺(jué)感受、味覺(jué)感受又可以表示心里感受,如“嘴角上揚(yáng)”的表情特征代表的含義為“高興”、“甜”、“快樂(lè)”、“得意”等字詞,則“嘴角上揚(yáng)”的表情特征所對(duì)應(yīng)的面部表情信息可以為“高興”、“樂(lè)”、“甜”、“得意”等字詞,本發(fā)明實(shí)施例中,具體的表情特征與表情特征所代表的用戶(hù)的觸覺(jué)感受、味覺(jué)感受、心里感受等的對(duì)應(yīng)關(guān)系,可按照實(shí)際需要進(jìn)行設(shè)定。
[0062]其中,確定與所述表情特征對(duì)應(yīng)的用戶(hù)當(dāng)前的面部表情信息的一種可選方式為:預(yù)先設(shè)置表情詞庫(kù),在表情詞庫(kù)中存儲(chǔ)各個(gè)表情特征,與表達(dá)各個(gè)表情特征所代表的含義的字詞的對(duì)應(yīng)關(guān)系,如“嘴角上揚(yáng)”的表情特征所代表的含義為“高興”,“甜”、“快樂(lè)”、“得意”等,則可在表情詞庫(kù)中存儲(chǔ)“嘴角上揚(yáng)”與“高興”、“甜”、“快樂(lè)”、“得意”等的對(duì)應(yīng)關(guān)系,在表情詞庫(kù)中查找與用戶(hù)當(dāng)前的表情特征所對(duì)應(yīng)的字詞,確定所述字詞為用戶(hù)當(dāng)前的面部表情信息;
[0063]另一種確定與用戶(hù)當(dāng)前的表情特征對(duì)應(yīng)的用戶(hù)當(dāng)前的面部表情信息的可選方式為:建立表情訓(xùn)練模型,對(duì)電子設(shè)備進(jìn)行機(jī)器訓(xùn)練,使得電子設(shè)備能夠解析出各個(gè)表情特征所代表的含義,通過(guò)機(jī)器訓(xùn)練確定能夠表達(dá)各個(gè)表情特征所代表的含義的字詞,將該字詞確定為用戶(hù)當(dāng)前的面部表情信息。
[0064]步驟S220、將用戶(hù)當(dāng)前的面部表情信息與候選關(guān)鍵詞進(jìn)行匹配,判斷是否存在與用戶(hù)當(dāng)前的面部表情信息相對(duì)應(yīng)的候選關(guān)鍵詞;若是,執(zhí)行步驟S230,若否,執(zhí)行步驟S240 ;
[0065]相比圖1所示步驟S120,步驟S220為當(dāng)發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的面部表情信息時(shí),步驟S120中將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配的一種可選實(shí)現(xiàn)方式;
[0066]在將表達(dá)用戶(hù)當(dāng)前的表情特征所代表的含義的字詞確定為用戶(hù)當(dāng)前的面部表情信息后,可將該字詞與候選關(guān)鍵詞進(jìn)行匹配,判斷候選關(guān)鍵詞與該字詞是否對(duì)應(yīng),主要通過(guò)字詞間的相似度來(lái)判斷字詞與候選關(guān)鍵詞是否對(duì)應(yīng),如當(dāng)候選關(guān)鍵詞為“太苦”和“泰谷”,用戶(hù)的表情特征為“嘴角上厥”的苦澀的表情時(shí),則對(duì)應(yīng)的當(dāng)前的面部表情信息為“苦”、“難過(guò)”、“痛苦”、“疼痛”等字詞,則可將這些字詞分別與“太苦”和“泰谷”進(jìn)行匹配,從而確定與“苦”對(duì)應(yīng)的“太苦”;如果存在與用戶(hù)當(dāng)前的面部表情信息相對(duì)應(yīng)的候選關(guān)鍵詞,則說(shuō)明存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞,執(zhí)行步驟S230,否則,說(shuō)明不存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞,執(zhí)行步驟S240。
[0067]步驟S230、將與用戶(hù)當(dāng)前的面部表情信息相對(duì)應(yīng)的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞;
[0068]步驟S240、將優(yōu)先級(jí)最高的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
[0069]本發(fā)明實(shí)施例在關(guān)鍵詞識(shí)別中考慮了用戶(hù)當(dāng)前的面部表情信息的因素,通過(guò)將用戶(hù)當(dāng)前的面部表情信息與候選關(guān)鍵詞進(jìn)行匹配,當(dāng)存在與用戶(hù)當(dāng)前的面部表情信息相對(duì)應(yīng)的候選關(guān)鍵詞,將與用戶(hù)當(dāng)前的面部表情信息相對(duì)應(yīng)的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞,避免了通過(guò)上下文語(yǔ)義對(duì)關(guān)鍵詞進(jìn)行識(shí)別而存在的限制,提高了關(guān)鍵詞識(shí)別的正確率。
[0070]為了更好的說(shuō)明圖2所示方法,現(xiàn)以用戶(hù)輸入的語(yǔ)音為“tai gu”對(duì)應(yīng)的語(yǔ)音信號(hào),且電子設(shè)備對(duì)該語(yǔ)音信號(hào)存在“太苦”和“泰谷”這兩個(gè)候選關(guān)鍵詞的情況為例,對(duì)圖2所示方法進(jìn)行說(shuō)明。
[0071]當(dāng)電子設(shè)備存在“太苦”和“泰谷”這兩個(gè)候選關(guān)鍵詞時(shí),電子設(shè)備開(kāi)啟前置攝像頭或后置攝像頭拍攝用戶(hù)發(fā)音場(chǎng)景圖像,電子設(shè)備根據(jù)人臉識(shí)別技術(shù)從發(fā)音場(chǎng)景圖像中提取出用戶(hù)的人臉,從人臉中提取出用戶(hù)當(dāng)前的表情特征,在表情詞庫(kù)中查找用戶(hù)當(dāng)前的表情特征所對(duì)應(yīng)的字詞,若用戶(hù)當(dāng)前的表情特征為“嘴角上厥”等苦澀的表情時(shí),則可在表情詞庫(kù)中查找到用戶(hù)當(dāng)前的表情特征所對(duì)應(yīng)的字詞為“苦”、“難過(guò)”、“痛苦”、“疼痛”等與“嘴角上厥”相對(duì)應(yīng)的字詞,將“苦”、“難過(guò)”、“痛苦”、“疼痛”等字詞與“太苦”和“泰谷”這兩個(gè)候選關(guān)鍵詞進(jìn)行匹配,通過(guò)字詞的形似比對(duì),確定與“苦”對(duì)應(yīng)的“太苦”為最終輸出的關(guān)鍵詞;若用戶(hù)當(dāng)前沒(méi)有表情特征或表情特征不為嘴角上厥等苦澀的表情時(shí),則“太苦”和“泰谷”與用戶(hù)當(dāng)前的面部表情信息均不對(duì)應(yīng),將“太苦”和“泰谷”中優(yōu)先級(jí)最高的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
[0072]圖3為本發(fā)明實(shí)施例提供的關(guān)鍵詞方法的又一流程圖,結(jié)合圖1和圖3所示,該方法可以包括:
[0073]步驟S300、獲取用戶(hù)的發(fā)音場(chǎng)景圖像;
[0074]步驟S310、從所述發(fā)音場(chǎng)景圖像中提取出當(dāng)前的場(chǎng)景特征,確定與所述場(chǎng)景特征對(duì)應(yīng)的用戶(hù)當(dāng)前的發(fā)音背景信息;
[0075]相比圖1所示步驟SI 10,步驟S310為發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的發(fā)音背景信息時(shí),步驟SllO的一種可選實(shí)現(xiàn)方式;
[0076]場(chǎng)景特征為發(fā)音場(chǎng)景圖像中標(biāo)識(shí)用戶(hù)當(dāng)前所處背景的信息,如用戶(hù)處在商店中,則發(fā)音場(chǎng)景圖像中的商店招牌、貨架等這些可以標(biāo)識(shí)用戶(hù)當(dāng)前處于商店這一背景的信息,均可認(rèn)為是場(chǎng)景特征;如用戶(hù)處于廣場(chǎng)中,廣場(chǎng)上的標(biāo)志性建筑等可以標(biāo)識(shí)用戶(hù)當(dāng)前處于廣場(chǎng)中,則廣場(chǎng)上的標(biāo)志性建筑可認(rèn)為是場(chǎng)景特征。在提取出當(dāng)前的場(chǎng)景特征后,則可通過(guò)預(yù)置的場(chǎng)景特征與發(fā)音背景信息的對(duì)應(yīng)關(guān)系確定用戶(hù)當(dāng)前的發(fā)音背景信息,可選的,可設(shè)置數(shù)據(jù)庫(kù)預(yù)存場(chǎng)景特征與發(fā)音背景信息的對(duì)應(yīng)關(guān)系,在確定當(dāng)前的場(chǎng)景特征后,通過(guò)查找數(shù)據(jù)庫(kù)確定用戶(hù)當(dāng)前的發(fā)音背景信息;其中,用戶(hù)當(dāng)前的發(fā)音背景信息可以為用戶(hù)當(dāng)前所處的背景,如商店、廣場(chǎng)場(chǎng)所等。
[0077]步驟S320、按照預(yù)先設(shè)置的發(fā)音背景信息與關(guān)鍵詞的對(duì)應(yīng)關(guān)系,判斷是否存在與用戶(hù)當(dāng)前的發(fā)音背景信息對(duì)應(yīng)的候選關(guān)鍵詞,若是,執(zhí)行步驟S330,若否,執(zhí)行步驟S340 ;
[0078]相比圖1所示步驟S120,步驟S320為當(dāng)發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的發(fā)音背景信息時(shí),步驟S120中將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配的一種可選實(shí)現(xiàn)方式;
[0079]在確定了發(fā)音背景信息后,可按照預(yù)先設(shè)置的發(fā)音背景信息與關(guān)鍵詞的對(duì)應(yīng)關(guān)系,判斷是否存在與用戶(hù)當(dāng)前的發(fā)音背景信息對(duì)應(yīng)的候選關(guān)鍵詞,如確定的發(fā)音背景信息為商店,那么可預(yù)置商店中的商品名稱(chēng)、品牌等與商店相關(guān)的關(guān)鍵詞,與商店的對(duì)應(yīng)關(guān)系;將與商店對(duì)應(yīng)的商品名稱(chēng)、品牌等關(guān)鍵詞與候選關(guān)鍵詞進(jìn)行匹配,如果存在與商品名稱(chēng)、品牌等關(guān)鍵詞對(duì)應(yīng)的候選關(guān)鍵詞,則說(shuō)明存在與用戶(hù)當(dāng)前發(fā)音背景信息相匹配的候選關(guān)鍵詞,執(zhí)行步驟S330,否則,說(shuō)明不存在與用戶(hù)當(dāng)前發(fā)音背景信息相匹配的候選關(guān)鍵詞,執(zhí)行步驟S340,此處可通過(guò)字詞間的相似度,判斷候選關(guān)鍵詞與商品名稱(chēng)、品牌等關(guān)鍵詞間是否對(duì)應(yīng),優(yōu)選的,對(duì)應(yīng)可以表示為字詞間的相似度完全一致。
[0080]步驟S330、將與用戶(hù)當(dāng)前的發(fā)音背景信息對(duì)應(yīng)的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞;
[0081]步驟S340、將優(yōu)先級(jí)最高的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
[0082]本發(fā)明實(shí)施例在關(guān)鍵詞識(shí)別中考慮了用戶(hù)當(dāng)前的發(fā)音背景信息的因素,通過(guò)將用戶(hù)當(dāng)前的發(fā)音背景信息與候選關(guān)鍵詞進(jìn)行匹配,當(dāng)存在與用戶(hù)當(dāng)前的發(fā)音背景信息對(duì)應(yīng)的候選關(guān)鍵詞時(shí),將與用戶(hù)當(dāng)前的發(fā)音背景信息對(duì)應(yīng)的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞,避免了通過(guò)上下文語(yǔ)義對(duì)關(guān)鍵詞進(jìn)行識(shí)別而存在的限制,提高了關(guān)鍵詞識(shí)別的正確率。
[0083]為了更好的說(shuō)明圖3所示方法,現(xiàn)以用戶(hù)所處場(chǎng)景為商店,輸入的語(yǔ)音為“quechao”對(duì)應(yīng)的語(yǔ)音信號(hào),由于發(fā)音不標(biāo)準(zhǔn)或近似音的緣故,電子設(shè)備對(duì)該語(yǔ)音信號(hào)存在“雀巢”和“鵲巢”這兩個(gè)候選關(guān)鍵詞的情況為例,對(duì)圖3所示方法進(jìn)行說(shuō)明。
[0084]當(dāng)電子設(shè)備存在“雀巢”和“鵲巢”這兩個(gè)候選關(guān)鍵詞時(shí),電子設(shè)備開(kāi)啟前置攝像頭或后置攝像頭拍攝用戶(hù)發(fā)音場(chǎng)景圖像,電子設(shè)備從發(fā)音場(chǎng)景圖像中提取出當(dāng)前的場(chǎng)景特征,通過(guò)當(dāng)前場(chǎng)景特征與發(fā)音背景信息的對(duì)應(yīng)關(guān)系,確定用戶(hù)當(dāng)前的發(fā)音背景信息,由于用戶(hù)處于商店中,電子設(shè)備可從發(fā)音場(chǎng)景圖像中提取到貨架等與商店相關(guān)的場(chǎng)景特征,則可通過(guò)預(yù)置的貨架等與商店相關(guān)的場(chǎng)景特征與商店的對(duì)應(yīng)關(guān)系,確定當(dāng)前的發(fā)音背景信息為商店,在確定了用戶(hù)當(dāng)前的發(fā)音背景信息后,按照預(yù)先設(shè)置的發(fā)音背景信息與關(guān)鍵詞的對(duì)應(yīng)關(guān)系,判斷是否存在與用戶(hù)當(dāng)前的發(fā)音背景信息對(duì)應(yīng)的候選關(guān)鍵詞,由于當(dāng)前的發(fā)音背景信息為商店,則與商店對(duì)應(yīng)的關(guān)鍵詞為商品的種類(lèi)、品牌等與商店這一背景相關(guān)的字詞,由于“雀巢”和“鵲巢”中,“雀巢”為咖啡品牌,與商店對(duì)應(yīng),因此確定“雀巢”為最終輸出的關(guān)鍵詞。
[0085]下面對(duì)本發(fā)明實(shí)施例提供的一種電子設(shè)備進(jìn)行介紹,下文所介紹的電子設(shè)備與上文描述的關(guān)鍵詞識(shí)別方法相對(duì)應(yīng),兩者可相互參照。
[0086]圖4為本發(fā)明實(shí)施例提供的一種電子設(shè)備的結(jié)構(gòu)框圖,參照?qǐng)D4,電子設(shè)備可以包括:圖像獲取模塊100,發(fā)音場(chǎng)景信息確定模塊200和匹配確定模塊300 ;其中,圖像獲取模塊100與發(fā)音場(chǎng)景信息確定模塊200相連,發(fā)音場(chǎng)景信息確定模塊200與匹配確定模塊300相連。
[0087]圖像獲取模塊100,用于獲取用戶(hù)的發(fā)音場(chǎng)景圖像,將所述發(fā)音場(chǎng)景圖像發(fā)送給發(fā)音場(chǎng)景信息確定模塊200 ;
[0088]發(fā)音場(chǎng)景信息確定模塊200,用于接收所述發(fā)音場(chǎng)景圖像,確定所述發(fā)音場(chǎng)景圖像中的發(fā)音場(chǎng)景信息,將所述發(fā)音場(chǎng)景信息發(fā)送給匹配確定模塊300 ;
[0089]匹配確定模塊300,用于接收所述發(fā)音場(chǎng)景信息,將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配,當(dāng)存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí),將所述相匹配的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞,當(dāng)不存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí),將優(yōu)先級(jí)最聞的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
[0090]本發(fā)明實(shí)施例所指的發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的面部表情信息或用戶(hù)當(dāng)前的發(fā)
音背景信息。
[0091]圖5為本發(fā)明實(shí)施例提供的一種電子設(shè)備的另一結(jié)構(gòu)框圖,參照?qǐng)D5,發(fā)音場(chǎng)景信息確定模塊200可以包括:
[0092]面部表情信息確定單元210,用于根據(jù)人臉識(shí)別技術(shù)從所述發(fā)音場(chǎng)景圖像中提取出用戶(hù)的人臉,從所述人臉中提取出用戶(hù)當(dāng)前的表情特征,確定與所述表情特征對(duì)應(yīng)的用戶(hù)當(dāng)前的面部表情信息;
[0093]匹配確定模塊300可以包括:
[0094]第一匹配單元310,用于將用戶(hù)當(dāng)前的面部表情信息與候選關(guān)鍵詞進(jìn)行匹配,判斷是否存在與用戶(hù)當(dāng)前的面部表情信息相對(duì)應(yīng)的候選關(guān)鍵詞,若是,則存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞,若否,則不存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞;
[0095]第一確定單元311,用于在第一匹配單元310判斷存在與用戶(hù)當(dāng)前的面部表情信息對(duì)應(yīng)的候選關(guān)鍵詞時(shí),將與用戶(hù)當(dāng)前的面部表情信息對(duì)應(yīng)的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞,在第一匹配單元310判斷不存在與用戶(hù)當(dāng)前的面部表情信息對(duì)應(yīng)的候選關(guān)鍵詞時(shí),將優(yōu)先級(jí)最聞的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
[0096]其中,面部表情信息確定單元210的結(jié)構(gòu)可如圖6所示,包括:
[0097]人臉提取子單元211,用于根據(jù)人臉識(shí)別技術(shù)從所述發(fā)音場(chǎng)景圖像中提取出用戶(hù)的人臉;
[0098]表情特征提取子單元212,用于從所述人臉中提取出用戶(hù)當(dāng)前的表情特征;
[0099]查找子單元213,用于在預(yù)置的表情詞庫(kù)中查找與所述用戶(hù)當(dāng)前的表情特征相對(duì)應(yīng)的字詞;
[0100]確定子單元214,用于將查找子單元213所查找出的字詞確定為用戶(hù)當(dāng)前的面部表情信息。
[0101]圖7為本發(fā)明實(shí)施例提供的一種電子設(shè)備的又一結(jié)構(gòu)框圖,參照?qǐng)D7,發(fā)音場(chǎng)景信息確定模塊200可以包括:
[0102]發(fā)音背景信息確定單元220,用于從所述發(fā)音場(chǎng)景圖像中提取出當(dāng)前的場(chǎng)景特征,確定與所述場(chǎng)景特征對(duì)應(yīng)的用戶(hù)當(dāng)前的發(fā)音背景信息;
[0103]匹配確定模塊300可以包括:
[0104]第二匹配單元320,用于按照預(yù)先設(shè)置的發(fā)音背景信息與關(guān)鍵詞的對(duì)應(yīng)關(guān)系,判斷是否存在與用戶(hù)當(dāng)前的發(fā)音背景信息對(duì)應(yīng)的候選關(guān)鍵詞,若是,則存在與用戶(hù)當(dāng)前發(fā)音背景信息相匹配的候選關(guān)鍵詞,若否,則不存在與用戶(hù)當(dāng)前發(fā)音背景信息相匹配的候選關(guān)鍵詞;
[0105]第二確定單元321,用于在第二匹配單元320判斷存在與用戶(hù)當(dāng)前的發(fā)音背景信息相對(duì)應(yīng)的候選關(guān)鍵詞時(shí),將與用戶(hù)當(dāng)前的發(fā)音背景信息相對(duì)應(yīng)的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞,在第二匹配單元320判斷不存在與用戶(hù)當(dāng)前的發(fā)音背景信息相對(duì)應(yīng)的候選關(guān)鍵詞時(shí),將優(yōu)先級(jí)最聞的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。[0106]本發(fā)明在關(guān)鍵詞的識(shí)別中考慮了發(fā)音場(chǎng)景信息的因素,通過(guò)將發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配,當(dāng)存在與用戶(hù)當(dāng)前發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí),將所述相匹配的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞,這樣就避免了通過(guò)上下文語(yǔ)義對(duì)關(guān)鍵詞進(jìn)行識(shí)別而存在的限制,提高了關(guān)鍵詞識(shí)別的正確率。
[0107]本說(shuō)明書(shū)中各個(gè)實(shí)施例采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似部分互相參見(jiàn)即可。對(duì)于實(shí)施例公開(kāi)的裝置而言,由于其與實(shí)施例公開(kāi)的方法相對(duì)應(yīng),所以描述的比較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法部分說(shuō)明即可。
[0108]專(zhuān)業(yè)人員還可以進(jìn)一步意識(shí)到,結(jié)合本文中所公開(kāi)的實(shí)施例描述的各示例的單元及算法步驟,能夠以電子硬件、計(jì)算機(jī)軟件或者二者的結(jié)合來(lái)實(shí)現(xiàn),為了清楚地說(shuō)明硬件和軟件的可互換性,在上述說(shuō)明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來(lái)執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。專(zhuān)業(yè)技術(shù)人員可以對(duì)每個(gè)特定的應(yīng)用來(lái)使用不同方法來(lái)實(shí)現(xiàn)所描述的功能,但是這種實(shí)現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。
[0109]結(jié)合本文中所公開(kāi)的實(shí)施例描述的方法或算法的步驟可以直接用硬件、處理器執(zhí)行的軟件模塊,或者二者的結(jié)合來(lái)實(shí)施。軟件模塊可以置于隨機(jī)存儲(chǔ)器(RAM)、內(nèi)存、只讀存儲(chǔ)器(ROM)、電可編程ROM、電可擦除可編程ROM、寄存器、硬盤(pán)、可移動(dòng)磁盤(pán)、CD-ROM、或【技術(shù)領(lǐng)域】?jī)?nèi)所公知的任意其它形式的存儲(chǔ)介質(zhì)中。
[0110]對(duì)所公開(kāi)的實(shí)施例的上述說(shuō)明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對(duì)這些實(shí)施例的多種修改對(duì)本領(lǐng)域的專(zhuān)業(yè)技術(shù)人員來(lái)說(shuō)將是顯而易見(jiàn)的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實(shí)施例中實(shí)現(xiàn)。因此,本發(fā)明將不會(huì)被限制于本文所示的這些實(shí)施例,而是要符合與本文所公開(kāi)的原理和新穎特點(diǎn)相一致的最寬的范圍。
【權(quán)利要求】
1.一種關(guān)鍵詞識(shí)別方法,其特征在于,包括:獲取用戶(hù)的發(fā)音場(chǎng)景圖像;確定所述發(fā)音場(chǎng)景圖像中的發(fā)音場(chǎng)景信息;將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配,當(dāng)存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí),將所述相匹配的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞,當(dāng)不存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí),將優(yōu)先級(jí)最高的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的面部表情信息或用戶(hù)當(dāng)前的發(fā)音背景信息。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,當(dāng)所述發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的面部表情信息時(shí),所述確定所述發(fā)音場(chǎng)景圖像中的發(fā)音場(chǎng)景信息包括:根據(jù)人臉識(shí)別技術(shù)從所述發(fā)音場(chǎng)景圖像中提取出用戶(hù)的人臉,從所述人臉中提取出用戶(hù)當(dāng)前的表情特征,確定與所述表情特征對(duì)應(yīng)的用戶(hù)當(dāng)前的面部表情信息。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述確定與所述表情特征對(duì)應(yīng)的用戶(hù)當(dāng)前的面部表情信息包括:在預(yù)置的表情詞庫(kù)中查找所述表情特征所對(duì)應(yīng)的字詞,確定所述字詞為用戶(hù)當(dāng)前的面部表情信息,所述預(yù)置的表情詞庫(kù)存儲(chǔ)有表情特征與表達(dá)表情特征所代表的含義的字詞的對(duì)應(yīng)關(guān)系。
5.根據(jù)權(quán)利要求2至4任一項(xiàng)所述的方法,其特征在于,當(dāng)發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的面部表情信息時(shí),所述將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配包括:將用戶(hù)當(dāng)前的面部表情信息與候選關(guān)鍵詞進(jìn)行匹配,判斷是否存在與用戶(hù)當(dāng)前的面部表情信息相對(duì)應(yīng)的候選關(guān)鍵詞;`若是,則存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞,若否,則不存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞。
6.根據(jù)權(quán)利要求2所述的方法,其特征在于,當(dāng)所述發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的發(fā)音背景信息時(shí),所述確定所述發(fā)音場(chǎng)景圖像中的發(fā)音場(chǎng)景信息包括:從所述發(fā)音場(chǎng)景圖像中提取出場(chǎng)景特征,確定與所述場(chǎng)景特征對(duì)應(yīng)的用戶(hù)當(dāng)前的發(fā)音背景信息。
7.根據(jù)權(quán)利要求2或6所述的方法,其特征在于,當(dāng)發(fā)音場(chǎng)景信息為用戶(hù)當(dāng)前的發(fā)音背景信息時(shí),所述將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配包括:按照預(yù)先設(shè)置的發(fā)音背景信息與關(guān)鍵詞的對(duì)應(yīng)關(guān)系,判斷是否存在與用戶(hù)當(dāng)前的發(fā)音背景信息對(duì)應(yīng)的候選關(guān)鍵詞;若是,則存在與用戶(hù)當(dāng)前的發(fā)音背景信息相匹配的候選關(guān)鍵詞,若否,則不存在與用戶(hù)當(dāng)前的發(fā)音背景信息相匹配的候選關(guān)鍵詞。
8.一種電子設(shè)備,其特征在于,包括:圖像獲取模塊,發(fā)音場(chǎng)景信息確定模塊和匹配確定模塊;所述圖像獲取模塊,用于獲取用戶(hù)的發(fā)音場(chǎng)景圖像,將所述發(fā)音場(chǎng)景圖像發(fā)送給所述發(fā)音場(chǎng)景信息確定模塊;所述發(fā)音場(chǎng)景信息確定模塊,用于接收所述發(fā)音場(chǎng)景圖像,確定所述發(fā)音場(chǎng)景圖像中的發(fā)音場(chǎng)景信息,將所述發(fā)音場(chǎng)景信息發(fā)送給所述匹配確定模塊;所述匹配確定模塊,用于接收所述發(fā)音場(chǎng)景信息,將所述發(fā)音場(chǎng)景信息與候選關(guān)鍵詞進(jìn)行匹配,當(dāng)存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí),將所述相匹配的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞,當(dāng)不存在與所述發(fā)音場(chǎng)景信息相匹配的候選關(guān)鍵詞時(shí),將優(yōu)先級(jí)最聞的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
9.根據(jù)權(quán)利要求8所述的電子設(shè)備,其特征在于,所述發(fā)音場(chǎng)景信息確定模塊包括: 面部表情信息確定單元,用于根據(jù)人臉識(shí)別技術(shù)從所述發(fā)音場(chǎng)景圖像中提取出用戶(hù)的人臉,從所述人臉中提取出用戶(hù)當(dāng)前的表情特征,確定與所述表情特征對(duì)應(yīng)的用戶(hù)當(dāng)前的面部表情信息; 所述匹配確定模塊包括: 第一匹配單元,用于將用戶(hù)當(dāng)前的面部表情信息與候選關(guān)鍵詞進(jìn)行匹配,判斷是否存在與用戶(hù)當(dāng)前的面部表情信息相對(duì)應(yīng)的候選關(guān)鍵詞,若是,則存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞,若否,則不存在與用戶(hù)當(dāng)前的面部表情信息相匹配的候選關(guān)鍵詞; 第一確定單元,用于在所述第一匹配單元判斷存在與用戶(hù)當(dāng)前的面部表情信息對(duì)應(yīng)的候選關(guān)鍵詞時(shí),將與用戶(hù)當(dāng)前的面部表情信息對(duì)應(yīng)的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞,在所述第一匹配單元判斷不存在與用戶(hù)當(dāng)前的面部表情信息對(duì)應(yīng)的候選關(guān)鍵詞時(shí),將優(yōu)先級(jí)最聞的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
10.根據(jù)權(quán)利要求8所述的電子設(shè)備,其特征在于,所述發(fā)音場(chǎng)景信息確定模塊包括: 發(fā)音背景信息確定單元,用于從所述發(fā)音場(chǎng)景圖像中提取出當(dāng)前的場(chǎng)景特征,確定與所述場(chǎng)景特征對(duì)應(yīng)的用戶(hù)當(dāng)前的發(fā)音背景信息; 所述匹配確定模塊包括: 第二匹配單元,用于按照預(yù)先設(shè)置的發(fā)音背景信息與關(guān)鍵詞的對(duì)應(yīng)關(guān)系,判斷是否存在與用戶(hù)當(dāng)前的發(fā)音背景信息對(duì)應(yīng)的候選關(guān)鍵詞,若是,則存在與用戶(hù)當(dāng)前的發(fā)音背景信息相匹配的候選關(guān)鍵詞,若否,則不存在與用戶(hù)當(dāng)前的發(fā)音背景信息相匹配的候選關(guān)鍵詞; 第二確定單元,用于在所述第二匹配單元判斷存在與用戶(hù)當(dāng)前的發(fā)音背景信息相對(duì)應(yīng)的候選關(guān)鍵詞時(shí),將與用戶(hù)當(dāng)前的發(fā)音背景信息相對(duì)應(yīng)的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞,在所述第二匹配單元判斷不存在與用戶(hù)當(dāng)前的發(fā)音背景信息相對(duì)應(yīng)的候選關(guān)鍵詞時(shí),將優(yōu)先級(jí)最聞的候選關(guān)鍵詞確定為最終輸出的關(guān)鍵詞。
【文檔編號(hào)】G10L15/00GK103678404SQ201210357210
【公開(kāi)日】2014年3月26日 申請(qǐng)日期:2012年9月21日 優(yōu)先權(quán)日:2012年9月21日
【發(fā)明者】彭剛 申請(qǐng)人:聯(lián)想(北京)有限公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
寻乌县| 宁强县| 绥化市| 嘉定区| 陵川县| 礼泉县| 满城县| 呼伦贝尔市| 车致| 寻乌县| 香河县| 甘孜县| 夏津县| 仙居县| 肇庆市| 新疆| 化隆| 庆元县| 临江市| 乐昌市| 金平| 昭通市| 怀化市| 平果县| 吉安县| 曲阜市| 日喀则市| 孟连| 博湖县| 河东区| 扎鲁特旗| 玉龙| 英山县| 原阳县| 双流县| 图木舒克市| 建德市| 临漳县| 大埔区| 蓬溪县| 屯门区|