語(yǔ)音識(shí)別設(shè)備和用于提供響應(yīng)信息的方法
【專(zhuān)利摘要】提供一種語(yǔ)音識(shí)別設(shè)備和用于提供響應(yīng)信息的方法。根據(jù)本公開(kāi)的語(yǔ)音識(shí)別設(shè)備包括:提取器,被配置為從用戶(hù)的發(fā)音信號(hào)中提取代表用戶(hù)動(dòng)作的第一表達(dá)元素和代表對(duì)象的第二表達(dá)元素;域確定器,被配置為基于分層域模型檢測(cè)出與提取的第一表達(dá)元素和第二表達(dá)元素有關(guān)的擴(kuò)展域,并將與檢測(cè)出的多個(gè)擴(kuò)展域有關(guān)的至少一個(gè)候選域確定為最終域;通信器,與外部設(shè)備執(zhí)行通信;控制器,被配置為控制通信器發(fā)送關(guān)于第一表達(dá)元素和第二表達(dá)元素的信息和關(guān)于確定的最終域的信息。
【專(zhuān)利說(shuō)明】語(yǔ)音識(shí)別設(shè)備和用于提供響應(yīng)信息的方法
[0001]本申請(qǐng)要求于2013年I月31日提交的第10-2013-0011292號(hào)韓國(guó)專(zhuān)利申請(qǐng)的優(yōu)先權(quán),其中,所述專(zhuān)利申請(qǐng)的公開(kāi)通過(guò)引用合并于此。
【技術(shù)領(lǐng)域】
[0002]與示例性實(shí)施例一致的方法和設(shè)備涉及一種語(yǔ)音識(shí)別設(shè)備和用于提供響應(yīng)信息的方法,更具體地,涉及一種用于提供與用戶(hù)的發(fā)音相應(yīng)的響應(yīng)信息的語(yǔ)音識(shí)別設(shè)備以及用于提供響應(yīng)信息的方法。
【背景技術(shù)】
[0003]當(dāng)接收到用戶(hù)的發(fā)音時(shí),現(xiàn)有技術(shù)的語(yǔ)音識(shí)別設(shè)備分析接收到的用戶(hù)的發(fā)音以確定用戶(hù)意圖的域(domain),并基于確定的域提供關(guān)于用戶(hù)的發(fā)音的響應(yīng)信息。
[0004]然而,隨著域在這樣的現(xiàn)有技術(shù)的語(yǔ)音識(shí)別設(shè)備中應(yīng)該被提供的服務(wù)和多種域(有關(guān)區(qū)域)的服務(wù)變得多樣化并復(fù)雜,出現(xiàn)這樣的問(wèn)題:語(yǔ)音識(shí)別設(shè)備確定了并非用戶(hù)意圖的域,并基于確定的非意圖的域來(lái)提供關(guān)于用戶(hù)的發(fā)音的響應(yīng)信息。
[0005]例如,當(dāng)從用戶(hù)接收到發(fā)音“有多少種動(dòng)作片”時(shí),關(guān)于這樣的發(fā)音可確定有關(guān)域的電視(TV)節(jié)目和/或視頻點(diǎn)播(V0D),然而傳統(tǒng)的語(yǔ)音識(shí)別設(shè)備在不考慮這樣多域的可能性的情況下在多個(gè)域之中只檢測(cè)出一個(gè)域。例如,來(lái)自用戶(hù)的發(fā)音“有多少種動(dòng)作片? ”可包括關(guān)于在TV節(jié)目中提供的動(dòng)作片的用戶(hù)意圖。然而,語(yǔ)音識(shí)別設(shè)備可以不管用戶(hù)的意圖從用戶(hù)的發(fā)音中任意地確定VOD有關(guān)的域,并可基于確定的VOD有關(guān)的域提供關(guān)于用戶(hù)的發(fā)音的響應(yīng)信息。如此,在傳統(tǒng)的語(yǔ)音識(shí)別設(shè)備中,經(jīng)常發(fā)生這種情況:提供并非用戶(hù)意圖的響應(yīng)信息,因此,為了提供意圖的響應(yīng)信息,用戶(hù)必須忍受這樣的不便:不得不提供更詳細(xì)的發(fā)音。
【發(fā)明內(nèi)容】
[0006]一個(gè)或更多個(gè)示例性實(shí)施例提供用于提供與用戶(hù)的發(fā)音相應(yīng)的響應(yīng)信息的語(yǔ)音識(shí)別設(shè)備及其提供響應(yīng)信息的方法。更具體地,一個(gè)或更多個(gè)示例性實(shí)施例在對(duì)話(huà)型系統(tǒng)中的提供關(guān)于用戶(hù)的發(fā)音的響應(yīng)信息的語(yǔ)音識(shí)別設(shè)備中,在基于用戶(hù)發(fā)音可能的多個(gè)域之中根據(jù)用戶(hù)的意圖確定域,并基于確定的域提供關(guān)于用戶(hù)發(fā)音的響應(yīng)信息。
[0007]根據(jù)示例性實(shí)施例的一方面,提供一種對(duì)話(huà)型語(yǔ)音識(shí)別設(shè)備,包括:提取器,被配置為從用戶(hù)的發(fā)音信號(hào)中提取代表用戶(hù)動(dòng)作的第一表達(dá)元素和代表對(duì)象的第二表達(dá)元素;域確定器,被配置為基于預(yù)先確定的分層域模型檢測(cè)與提取的第一表達(dá)元素和第二表達(dá)元素有關(guān)的擴(kuò)展域,并將與檢測(cè)出的擴(kuò)展域有關(guān)的至少一個(gè)候選域確定為最終域;通信器,被配置為與外部設(shè)備執(zhí)行通信;控制器,被配置為控制通信器發(fā)送與第一表達(dá)元素和第二表達(dá)元素有關(guān)的信息和關(guān)于確定的最終域的信息。
[0008]分層域模型可包括下位概念的候選域和預(yù)先確定為候選域的上位概念的虛擬擴(kuò)展域,在下位概念的候選域中,與第一表達(dá)元素相應(yīng)的主動(dòng)作和與第二表達(dá)元素相應(yīng)的組件槽彼此匹配。
[0009]當(dāng)檢測(cè)出與從提取器中提取的第一表達(dá)元素相應(yīng)的主動(dòng)作和與從提取器中提取的第二表達(dá)元素相應(yīng)的組件槽彼此匹配的擴(kuò)展域時(shí),域確定器可使用多分類(lèi)器以檢測(cè)與檢測(cè)出的擴(kuò)展域有關(guān)的從屬候選域,當(dāng)沒(méi)有檢測(cè)出所述擴(kuò)展域時(shí),檢測(cè)與第一表達(dá)元素相應(yīng)的主動(dòng)作和與第二表達(dá)元素相應(yīng)的組件槽彼此匹配的候選域。
[0010]域確定器可使用至少一個(gè)二元分類(lèi)器檢測(cè)在候選域之中的至少一個(gè)域和擴(kuò)展域,其中,在候選域中,與第一表達(dá)元素相應(yīng)的主動(dòng)作和與第二表達(dá)元素相應(yīng)的組件槽彼此匹配。
[0011]域確定器從提取的第一表達(dá)元素和第二表達(dá)元素中的至少一個(gè)和檢測(cè)出的候選域可理解用戶(hù)的意圖,以確定是否發(fā)生語(yǔ)境初始化,當(dāng)確定還沒(méi)有發(fā)生語(yǔ)境初始化時(shí),基于先前域?qū)⒃跈z測(cè)出的多個(gè)候選域之中的至少一個(gè)候選域確定為最終域,所述先前域是在接收到用戶(hù)的發(fā)音信號(hào)之前從用戶(hù)的先前發(fā)音確定的域。
[0012]當(dāng)在檢測(cè)出的多個(gè)候選域之中的一個(gè)候選域與先前域彼此相應(yīng)時(shí),域確定器可將先前域確定為最終域。
[0013]當(dāng)確定檢測(cè)出的候選域與先前域彼此不同或已發(fā)生了語(yǔ)境初始化時(shí),域確定器可將在與檢測(cè)出的擴(kuò)展域有關(guān)的至少一個(gè)候選域之中與代表用戶(hù)動(dòng)作的第一表達(dá)元素有關(guān)的候選域確定為最終域。
[0014]當(dāng)檢測(cè)出的候選域包括與代表用戶(hù)動(dòng)作的第一表達(dá)元素相應(yīng)的主動(dòng)作信息時(shí),域確定器可將檢測(cè)出的全部候選域確定為最終域。
[0015]當(dāng)檢測(cè)出的候選域包括與代表用戶(hù)動(dòng)作的第一表達(dá)元素相應(yīng)的主動(dòng)作信息時(shí),域確定器可將由用戶(hù)選擇的候選域確定為最終域或任意選擇在檢測(cè)出的多個(gè)候選域之中的一個(gè)候選域作為最終域。
[0016]當(dāng)存在多個(gè)先前域,所述多個(gè)先前域中的一個(gè)與所述多個(gè)候選域中的一個(gè)彼此相應(yīng)并且該候選域包括與代表用戶(hù)動(dòng)作的第一表達(dá)兀素相應(yīng)的主動(dòng)作信息時(shí),域確定器可在檢測(cè)出的多個(gè)候選域之中將與先前域相應(yīng)的候選域確定為最終域。
[0017]根據(jù)示例性實(shí)施例的一方面,提供一種在對(duì)話(huà)型語(yǔ)音識(shí)別設(shè)備中提供與用戶(hù)的發(fā)音相應(yīng)的響應(yīng)信息的方法,所述方法包括:從用戶(hù)的發(fā)音信號(hào)中提取代表用戶(hù)動(dòng)作的第一表達(dá)兀素和代表對(duì)象的第二表達(dá)兀素;基于預(yù)先確定的分層域模型檢測(cè)出與提取的第一表達(dá)元素和第二表達(dá)元素有關(guān)的擴(kuò)展域;將與檢測(cè)出的擴(kuò)展域有關(guān)的至少一個(gè)候選域確定為最終域;將關(guān)于第一表達(dá)元素和第二表達(dá)元素的信息和關(guān)于確定的最終域的信息發(fā)送到外部設(shè)備。
[0018]分層域模型可包括下位概念的候選域和預(yù)先確定為候選域的上位概念的虛擬擴(kuò)展域,在下位概念的候選域中,與第一表達(dá)元素相應(yīng)的主動(dòng)作和與第二表達(dá)元素相應(yīng)的組件槽彼此匹配。
[0019]當(dāng)檢測(cè)出與從提取器中提取的第一表達(dá)元素相應(yīng)的主動(dòng)作和與從提取器中提取的第二表達(dá)元素相應(yīng)的組件槽彼此匹配的擴(kuò)展域時(shí),檢測(cè)擴(kuò)展域的步驟可使用多分類(lèi)器以檢測(cè)與檢測(cè)出的擴(kuò)展域有關(guān)的從屬候選域,當(dāng)沒(méi)有檢測(cè)出所述擴(kuò)展域時(shí),檢測(cè)與第一表達(dá)元素相應(yīng)的主動(dòng)作和與第二表達(dá)元素相應(yīng)的組件槽彼此匹配的候選域。
[0020]檢測(cè)擴(kuò)展域的步驟可使用至少一個(gè)二元分類(lèi)器檢測(cè)在候選域之中的至少一個(gè)域和擴(kuò)展域,其中,在候選域中,與第一表達(dá)元素相應(yīng)的主動(dòng)作和與第二表達(dá)元素相應(yīng)的組件槽彼此匹配。
[0021]確定最終域的步驟可從提取的第一表達(dá)元素和第二表達(dá)元素中的至少一個(gè)和檢測(cè)出的候選域來(lái)理解用戶(hù)的意圖,以確定是否發(fā)生語(yǔ)境初始化,當(dāng)確定還沒(méi)有發(fā)生語(yǔ)境初始化時(shí),基于先前域?qū)⒃跈z測(cè)出的多個(gè)候選域之中的至少一個(gè)候選域確定為最終域,所述先前域是在接收到用戶(hù)的發(fā)音信號(hào)之前從用戶(hù)的先前發(fā)音確定的域。
[0022]確定最終域的步驟可包括:當(dāng)在檢測(cè)出的多個(gè)候選域之中的一個(gè)候選域與先前域彼此相應(yīng)時(shí),將先前域確定為最終域。
[0023]當(dāng)確定檢測(cè)出的候選域與先前域彼此不同或已發(fā)生了語(yǔ)境初始化時(shí),確定最終域的步驟可將在與檢測(cè)出的擴(kuò)展域有關(guān)的至少一個(gè)候選域之中與代表用戶(hù)動(dòng)作的第一表達(dá)兀素有關(guān)的候選域確定為最終域。
[0024]當(dāng)檢測(cè)出的候選域包括與代表用戶(hù)動(dòng)作的第一表達(dá)元素相應(yīng)的主動(dòng)作信息時(shí),確定最終域的步驟可將檢測(cè)出的全部候選域確定為最終域。
[0025]當(dāng)檢測(cè)出的候選域包括與代表用戶(hù)動(dòng)作的第一表達(dá)元素相應(yīng)的主動(dòng)作信息時(shí),確定最終域的步驟可將由用戶(hù)選擇的候選域確定為最終域或任意選擇在檢測(cè)出的多個(gè)候選域之中的一個(gè)候選域作為最終域。
[0026]當(dāng)存在多個(gè)先前域,所述多個(gè)先前域中的一個(gè)與所述多個(gè)候選域中的一個(gè)彼此相應(yīng)并且該候選域包括與代表用戶(hù)動(dòng)作的第一表達(dá)元素相應(yīng)的主動(dòng)作信息時(shí),確定最終域的步驟可在檢測(cè)出的多個(gè)候選域之中將與先前域相應(yīng)的候選域確定為最終域。
[0027]如前述,根據(jù)各種示例性實(shí)施例,對(duì)話(huà)型系統(tǒng)中的語(yǔ)音識(shí)別設(shè)備可考慮到關(guān)于用戶(hù)的發(fā)音的各種情況確定適合用戶(hù)的意圖的域,并可基于確定的域來(lái)提供關(guān)于用戶(hù)的發(fā)音的響應(yīng)信息。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0028]通過(guò)參照附圖描述特定示例性實(shí)施例,以上和/或其它方面將更清楚,其中:
[0029]圖1是根據(jù)示例性實(shí)施例的對(duì)話(huà)型系統(tǒng)的示例性實(shí)施例;
[0030]圖2是根據(jù)示例性實(shí)施例的語(yǔ)音識(shí)別設(shè)備的框圖;
[0031]圖3是根據(jù)示例性實(shí)施例的用于檢測(cè)候選域的分層域模型的示圖;
[0032]圖4是示出根據(jù)示例性實(shí)施例的屬于分層域模型的域中預(yù)先確定的主動(dòng)作和每一個(gè)主動(dòng)作的組件槽的示圖;
[0033]圖5是示出根據(jù)示例性實(shí)施例的屬于分層域模型中的全部域中預(yù)先確定的主動(dòng)作和每一個(gè)主動(dòng)作的組件槽的示圖;
[0034]圖6是根據(jù)示例性實(shí)施例的域確定器中對(duì)屬于分層域模型中的每一個(gè)分層的域分類(lèi)的第一示圖;
[0035]圖7是根據(jù)示例性實(shí)施例的域確定器中對(duì)屬于分層域模型中的每一個(gè)分層的域分類(lèi)的第二示圖;
[0036]圖8是根據(jù)示例性實(shí)施例的用于在對(duì)話(huà)型系統(tǒng)的語(yǔ)音識(shí)別設(shè)備中響應(yīng)于用戶(hù)的發(fā)音提供響應(yīng)信息的方法的流程圖;
[0037]圖9是根據(jù)示例性實(shí)施例的用于在語(yǔ)音識(shí)別設(shè)備中檢測(cè)出的候選域之中確定最終域的方法的流程圖。
【具體實(shí)施方式】
[0038]以下參照附圖更詳細(xì)地描述特定示例性實(shí)施例。
[0039]圖1是根據(jù)示例性實(shí)施例的對(duì)話(huà)型系統(tǒng)的示圖。
[0040]如圖1中所示,對(duì)話(huà)型系統(tǒng)包括語(yǔ)音識(shí)別設(shè)備100和顯示設(shè)備200。語(yǔ)音識(shí)別設(shè)備100通過(guò)顯示設(shè)備200接收用戶(hù)的發(fā)音信號(hào)(在下文中被稱(chēng)作“發(fā)音”),并確定接收到的用戶(hù)的發(fā)音屬于哪一個(gè)域。接下來(lái),語(yǔ)音識(shí)別設(shè)備100可基于確定的域的對(duì)話(huà)模式來(lái)產(chǎn)生關(guān)于用戶(hù)的發(fā)音的響應(yīng)信息。然而,本公開(kāi)不限于此,語(yǔ)音識(shí)別設(shè)備100和顯示設(shè)備200可被實(shí)施為一個(gè)設(shè)備,并可收集用戶(hù)的發(fā)音,確定收集的用戶(hù)的發(fā)音屬于哪一個(gè)域,并基于確定的域的對(duì)話(huà)模式來(lái)產(chǎn)生關(guān)于用戶(hù)的發(fā)音的響應(yīng)信息。
[0041]顯示設(shè)備200可以是智能TV,但這僅為示例性實(shí)施例,因此顯示設(shè)備可以被實(shí)施為各種電子裝置(諸如,移動(dòng)電話(huà)/智能電話(huà)、桌面PC、筆記本、導(dǎo)航系統(tǒng)等)。顯示設(shè)備200將收集到的用戶(hù)的發(fā)音發(fā)送到語(yǔ)音識(shí)別設(shè)備100。如上所提,語(yǔ)音識(shí)別設(shè)備100確定從顯示設(shè)備200接收的用戶(hù)的發(fā)音屬于哪一個(gè)域,基于確定的從顯示設(shè)備200接收的用戶(hù)的發(fā)音屬于的域的對(duì)話(huà)型模式來(lái)產(chǎn)生關(guān)于用戶(hù)的發(fā)音的響應(yīng)信息,并將產(chǎn)生的響應(yīng)信息發(fā)送到顯示設(shè)備200。因此,顯示設(shè)備200可通過(guò)揚(yáng)聲器將從語(yǔ)音識(shí)別設(shè)備接收的響應(yīng)信息輸出或?qū)⑺鲰憫?yīng)信息顯示在屏幕上。
[0042]例如,當(dāng)從用戶(hù)接收到發(fā)音“給我動(dòng)作片! ”,語(yǔ)音識(shí)別設(shè)備100分析接收到的發(fā)音并檢測(cè)出關(guān)于發(fā)音的至少一個(gè)候選域。更具體地,語(yǔ)音識(shí)別設(shè)備100可從發(fā)音“給我動(dòng)作片! ”中提取代表用戶(hù)動(dòng)作“給我”的第一表達(dá)元素和代表對(duì)象“動(dòng)作片”的第二表達(dá)元素。接下來(lái),語(yǔ)音識(shí)別設(shè)備100可基于提取的第一表達(dá)元素和第二表達(dá)元素來(lái)確定用戶(hù)的意圖“search_program(genre) ”,并基于預(yù)先確定的分層域模型來(lái)確定是否存在包括“search_program (genre) ”的擴(kuò)展域。在此,擴(kuò)展域是預(yù)先確定為候選域的上位概念的虛擬域,其中候選域用于將擴(kuò)展域確定為最終域。
[0043]當(dāng)確定包括“search_program(genre) ”的擴(kuò)展域是視頻內(nèi)容時(shí),語(yǔ)音識(shí)別設(shè)備100檢測(cè)與“search_program(genre) ”相應(yīng)的擴(kuò)展域的從屬域。當(dāng)屬于視頻內(nèi)容擴(kuò)展域的從屬候選域是TV節(jié)目和VOD時(shí),語(yǔ)音識(shí)別設(shè)備100可檢測(cè)與TV節(jié)目和VOD相應(yīng)的候選域。
[0044]當(dāng)檢測(cè)到這樣的候選域時(shí),語(yǔ)音識(shí)別設(shè)備100可基于根據(jù)先前對(duì)話(huà)內(nèi)容預(yù)先確定的先前域和檢測(cè)到的候選域?qū)⒅辽僖粋€(gè)候選域確定為最終域。
[0045]例如,當(dāng)根據(jù)先前對(duì)話(huà)內(nèi)容預(yù)先確定的先前域和檢測(cè)到的候選域是VOD時(shí),語(yǔ)音識(shí)別設(shè)備100可將與VOD相應(yīng)的候選域確定為最終域。當(dāng)確定這樣的最終域時(shí),語(yǔ)音識(shí)別設(shè)備100將關(guān)于預(yù)先提取的第一表達(dá)元素和第二表達(dá)元素的信息以及關(guān)于預(yù)先確定的最終域的信息發(fā)送到外部設(shè)備(未示出)。外部設(shè)備(未示出)可在與VOD相應(yīng)的預(yù)先確定的最終域內(nèi)產(chǎn)生與用戶(hù)的發(fā)音有關(guān)的響應(yīng)信息,并將產(chǎn)生的響應(yīng)信息發(fā)送到語(yǔ)音識(shí)別設(shè)備100。然后語(yǔ)音識(shí)別設(shè)備100可將從外部設(shè)備(未示出)接收的響應(yīng)信息發(fā)送到顯示設(shè)備200。然而,本公開(kāi)不限于此,當(dāng)與VOD相應(yīng)的候選域被確定為最終域時(shí),語(yǔ)音識(shí)別設(shè)備100可在確定的最終域內(nèi)基于預(yù)先提取的第一表達(dá)元素和第二表達(dá)元素來(lái)產(chǎn)生關(guān)于用戶(hù)的發(fā)音的響應(yīng)信息,并將產(chǎn)生的響應(yīng)信息發(fā)送到顯示設(shè)備200。因此,然后顯示設(shè)備200可通過(guò)揚(yáng)聲器將從語(yǔ)音識(shí)別設(shè)備100接收的響應(yīng)信息輸出或?qū)⑺鲰憫?yīng)信息顯示在屏幕上。
[0046]以下是關(guān)于在根據(jù)本公開(kāi)的對(duì)話(huà)型系統(tǒng)中提供關(guān)于用戶(hù)的發(fā)音的響應(yīng)信息的語(yǔ)音識(shí)別設(shè)備100的詳細(xì)解釋。
[0047]圖2是根據(jù)示例性實(shí)施例的語(yǔ)音識(shí)別設(shè)備的框圖。
[0048]如圖2中所示,語(yǔ)音識(shí)別設(shè)備100包括通信器110、語(yǔ)音識(shí)別器120、提取器130、域確定器140、控制器150和存儲(chǔ)單元160。
[0049]通信器110執(zhí)行與顯示設(shè)備200的數(shù)據(jù)通信,并接收由顯示設(shè)備200收集的用戶(hù)的發(fā)音。此外,通信器110可執(zhí)行與外部設(shè)備(未示出)的通信,并可發(fā)送用于產(chǎn)生關(guān)于用戶(hù)的發(fā)音的響應(yīng)信息的關(guān)于確定的最終域的信息和關(guān)于從用戶(hù)的發(fā)音提取的表達(dá)元素的信息。通信器110可包括各種通信模塊(諸如,短距離無(wú)線(xiàn)通信模塊(未示出)等)。在此,短距離無(wú)線(xiàn)通信模塊是用于根據(jù)短距離無(wú)線(xiàn)通信方法(諸如,藍(lán)牙,Zigbee等)來(lái)執(zhí)行與位于附近的外部裝置的通信的模塊。
[0050]除了以上內(nèi)容,在通信器110中還可包括這樣的移動(dòng)通信模塊:所述移動(dòng)通信模塊根據(jù)各種移動(dòng)通信標(biāo)準(zhǔn)(諸如,3G (第三代)、3GPP(第三代合作伙伴項(xiàng)目)、LTE (長(zhǎng)期演進(jìn))等)接入移動(dòng)通信網(wǎng)絡(luò)并執(zhí)行通信。
[0051]此外,通信器110可通過(guò)互聯(lián)網(wǎng)絡(luò)與web服務(wù)器(未示出)執(zhí)行通信,將各種搜索關(guān)鍵詞發(fā)送到web服務(wù)器(未示出),并根據(jù)此接收web搜索結(jié)果。在此,搜索關(guān)鍵詞可包括各種關(guān)鍵詞(諸如,天氣有關(guān)的關(guān)鍵詞(例如,區(qū)域的名稱(chēng)、溫度、降雨概率等)、內(nèi)容有關(guān)的關(guān)鍵詞(例如,電影片名、電影發(fā)行日期、曲名、歌手等))。各種關(guān)鍵詞可被預(yù)存在存儲(chǔ)單元160中。
[0052]語(yǔ)音識(shí)別器120識(shí)別通過(guò)通信器110從顯示設(shè)備200接收的用戶(hù)的發(fā)音,并將識(shí)別的發(fā)音轉(zhuǎn)換為文本。根據(jù)示例性實(shí)施例,語(yǔ)音識(shí)別器120可使用語(yǔ)音轉(zhuǎn)文本(STT)算法以將接收到的用戶(hù)的發(fā)音轉(zhuǎn)換為文本。當(dāng)通過(guò)語(yǔ)音識(shí)別器120將用戶(hù)的發(fā)音轉(zhuǎn)換為文本時(shí),提取器130從轉(zhuǎn)換為文本的用戶(hù)的發(fā)音中提取表達(dá)元素。更具體地,提取器130可基于預(yù)存在存儲(chǔ)單元160中的語(yǔ)料表在從用戶(hù)的發(fā)音轉(zhuǎn)換的文本中提取表達(dá)元素。在此,表達(dá)元素是在用戶(hù)的發(fā)音內(nèi)用于執(zhí)行用戶(hù)請(qǐng)求的操作的關(guān)鍵詞,并可被分類(lèi)為代表用戶(hù)動(dòng)作的第一表達(dá)元素和代表主要特征的第二表達(dá)元素。例如,在用戶(hù)的發(fā)音“給我動(dòng)作片! ”的情況下,提取器130可提取代表用戶(hù)動(dòng)作“給我! ”的第一表達(dá)元素和代表對(duì)象“動(dòng)作片”的第二表達(dá)元素。
[0053]當(dāng)?shù)谝槐磉_(dá)元素和第二表達(dá)元素被提取到時(shí),域確定器140基于預(yù)先確定并存儲(chǔ)在存儲(chǔ)單元160中的分層域模型來(lái)檢測(cè)與第一表達(dá)元素和第二表達(dá)元素有關(guān)的擴(kuò)展域。接下來(lái),域確定器140將與檢測(cè)到的擴(kuò)展域有關(guān)的至少一個(gè)候選域確定為最終域。在此,預(yù)先確定并存儲(chǔ)在存儲(chǔ)單元160中的分層域模型是分層地包括下位概念的候選域和預(yù)先確定為每一個(gè)候選域的上位概念的虛擬擴(kuò)展域的域模型,在候選域中,與每一個(gè)發(fā)音中提取的第一表達(dá)元素相應(yīng)的主動(dòng)作和與第二表達(dá)元素相應(yīng)的組件槽(component slot)彼此匹配。
[0054]因此,域確定器140可基于這樣的分層域模型檢測(cè)與第一表達(dá)元素和第二表達(dá)元素有關(guān)的擴(kuò)展域,并當(dāng)檢測(cè)到這樣的擴(kuò)展域時(shí),域確定器140可將與檢測(cè)到的擴(kuò)展域有關(guān)的至少一個(gè)候選域確定為最終域。
[0055]控制器150控制語(yǔ)音識(shí)別設(shè)備100的每一個(gè)配置的整體操作。主要地,控制器150可控制通信器110發(fā)送關(guān)于通過(guò)域確定器140確定的最終域中的預(yù)先提取的第一表達(dá)元素和第二表達(dá)元素的信息。因此,外部裝置可在預(yù)先確定的最終域內(nèi)產(chǎn)生與用戶(hù)的發(fā)音有關(guān)的響應(yīng)信息,并將產(chǎn)生的響應(yīng)信息發(fā)送到語(yǔ)音識(shí)別設(shè)備100,控制器150可將從外部裝置接收的響應(yīng)信息通過(guò)通信器110發(fā)送到顯示設(shè)備200。然而,本公開(kāi)不限于此,控制器150可在由域確定器140確定的最終域內(nèi)基于預(yù)先提取的第一表達(dá)元素和第二表達(dá)元素來(lái)自身產(chǎn)生關(guān)于用戶(hù)的發(fā)音的響應(yīng)信息,并將產(chǎn)生的響應(yīng)信息發(fā)送到顯示設(shè)備200。
[0056]預(yù)先確定并存儲(chǔ)在存儲(chǔ)單元160中的分層域模型可包括如圖3中的分層結(jié)構(gòu)。
[0057]圖3是根據(jù)示例性實(shí)施例的用于檢測(cè)候選域的分層域模型的示例性示圖。
[0058]如圖3中所示,用于檢測(cè)候選域的分層域模型包括標(biāo)準(zhǔn)的顯示用戶(hù)的意圖和可處理域之間關(guān)系的分層結(jié)構(gòu)。分層域模型可包括具有樹(shù)狀的分層結(jié)構(gòu),包括:最高分層等級(jí)、中間分層等級(jí)和最低分層等級(jí)等。最高分層等級(jí)是與虛擬擴(kuò)展域相應(yīng)的主題節(jié)點(diǎn),其中,虛擬擴(kuò)展域被預(yù)先確定為與候選域相應(yīng)的上位概念,候選域是產(chǎn)生關(guān)于用戶(hù)的發(fā)音的響應(yīng)信息的區(qū)域。中間分層等級(jí)是關(guān)于預(yù)先確定為上位概念的從屬概念的虛擬擴(kuò)展域的主題節(jié)點(diǎn)。此外,最低分層等級(jí)是與預(yù)先確定為中間概念的從屬概念的候選域相應(yīng)的主題節(jié)點(diǎn)。
[0059]例如,如圖3中所示,在最低分層等級(jí)中,可預(yù)先確定每一個(gè)候選域(TV節(jié)目10、V0D20和TV裝置30)。在這樣的情況下,在中間分層等級(jí),可預(yù)先確定:擴(kuò)展域TV頻道40和擴(kuò)展域視頻內(nèi)容50,擴(kuò)展域TV頻道40是候選域TV節(jié)目10和TV裝置30中的每一個(gè)的中間概念,擴(kuò)展域視頻內(nèi)容50是候選域TV節(jié)目10和V0D20中的每一個(gè)的中間概念。
[0060]也就是說(shuō),在分層域模型的最低分層等級(jí)中,可預(yù)先確定用于確定用于產(chǎn)生關(guān)于用戶(hù)的每一個(gè)發(fā)音的響應(yīng)信息的區(qū)域的候選域,在中間分層等級(jí)中,可預(yù)先確定中間概念的擴(kuò)展域,其中,中間概念的擴(kuò)展域包括在預(yù)先確定為下位概念的候選域之中的至少兩個(gè)候選域。此外,在最高分層等級(jí)中,可預(yù)先確定包括全部被預(yù)先確定為下位概念的候選域的上位概念的擴(kuò)展域。如上所提,每一個(gè)分層預(yù)先確定的每一個(gè)域可被預(yù)先確定為用于確定每一個(gè)域的主動(dòng)作,并且如圖4中每一個(gè)主動(dòng)作的每一個(gè)組件槽彼此匹配。
[0061]圖4是示出根據(jù)示例性實(shí)施例的包括在分層域模型中的域中預(yù)先確定的主動(dòng)作和每一個(gè)主動(dòng)作的組件槽的示例性示圖,圖5是示出根據(jù)示例性實(shí)施例的包括在分層域模型中的所有模型中預(yù)先確定的主動(dòng)作和每一個(gè)主動(dòng)作的組件槽的示例性示圖。
[0062]如圖4中所示,例如,關(guān)于TV節(jié)目10的域可以是在如以上圖3中所解釋的最低分層等級(jí)中預(yù)先確定的候選域。關(guān)于TV節(jié)目10的候選域可包括與代表對(duì)象的第二表達(dá)元素相應(yīng)的組件槽11。此外,關(guān)于TV節(jié)目10的候選域可包括用戶(hù)動(dòng)作腳本12,在用戶(hù)動(dòng)作腳本中,將與關(guān)于用戶(hù)動(dòng)作的第一表達(dá)元素相應(yīng)的主動(dòng)作和組件槽11彼此匹配。如附圖所示,關(guān)于TV節(jié)目10的候選域可包括用戶(hù)動(dòng)作腳本12 (諸如,“play_program (channel_name, channel_no, genre, time, title)”、〃search_program(channel_name, channel_no, genre, time, title) 〃)。因此,包括在分層等級(jí)模型中的每一個(gè)分層中的每一個(gè)域可包括通過(guò)將不同的主動(dòng)作和每一個(gè)主動(dòng)作的組件槽組合而產(chǎn)生的用戶(hù)動(dòng)作腳本。
[0063]因此,域確定器140可基于這樣的預(yù)先確定的分層域模型來(lái)檢測(cè)包括用戶(hù)動(dòng)作腳本的至少一個(gè)候選域,在用戶(hù)動(dòng)作腳本中,將與提取器130中提取的第一表達(dá)元素和第二表達(dá)元素分別相應(yīng)的主動(dòng)作和組件槽彼此匹配。例如,參照?qǐng)D5,提取器130可從關(guān)于發(fā)音“給我(廣播節(jié)目的名稱(chēng))”的文本中提取第一表達(dá)元素“給我! ”和第二表達(dá)元素“(廣播節(jié)目的名稱(chēng))”。
[0064]在這種情況下,域確定器140確定用戶(hù)動(dòng)作腳本是否存在于擴(kuò)展域中,其中,用戶(hù)動(dòng)作腳本通過(guò)將與第一表達(dá)元素“給我! ”相應(yīng)的主動(dòng)作和與第二表達(dá)元素“(廣播節(jié)目的名稱(chēng))”相應(yīng)的組件槽結(jié)合而被產(chǎn)生。在前述示例中,與第一表達(dá)元素“給我! ”相應(yīng)的主動(dòng)作可以是“play_pix)gram”,與第二表達(dá)元素“(廣播節(jié)目的名稱(chēng))”相應(yīng)的組件槽可以是“title”。因此,與“給我(廣播節(jié)目的名稱(chēng))”相應(yīng)的用戶(hù)動(dòng)作腳本可以是“play_program (title) ”。因此,域確定器140確定在擴(kuò)展域中是否包括用戶(hù)動(dòng)作腳本。當(dāng)確定在中間分層的擴(kuò)展域中包括關(guān)于“play_program(title) ”的用戶(hù)動(dòng)作腳本時(shí),域確定器140可檢測(cè)出作為擴(kuò)展域的域視頻內(nèi)容(50)域。
[0065]當(dāng)沒(méi)有檢測(cè)出與在用戶(hù)的發(fā)音中提取的第一表達(dá)元素和第二表達(dá)元素有關(guān)的擴(kuò)展域時(shí),域確定器140可檢測(cè)與第一表達(dá)元素和第二表達(dá)元素有關(guān)的候選域。
[0066]例如,提取器130可從與發(fā)音“立刻為我找出空中動(dòng)作片”相應(yīng)的文本中提取第一表達(dá)元素“為我找出! ”和第二表達(dá)元素“動(dòng)作片”以及“立刻”。當(dāng)提取到第一表達(dá)元素和第二表達(dá)元素時(shí),域確定器140確定通過(guò)將與第一表達(dá)元素“為我找出! ”相應(yīng)的主動(dòng)作和與第一表達(dá)元素相應(yīng)的每一個(gè)第二表達(dá)元素“立刻”和“動(dòng)作片”相應(yīng)的組件槽組合而產(chǎn)生的用戶(hù)動(dòng)作腳本是否存在于擴(kuò)展域中。在前述示例中,與第一表達(dá)元素相應(yīng)的主動(dòng)作可以是“searCh_pix)gram”,與每一個(gè)第二表達(dá)元素“立刻”和“動(dòng)作片”分別相應(yīng)的組件槽可以是“time”和“genre”。因此,與“立刻為我找出空中動(dòng)作片”相應(yīng)的用戶(hù)動(dòng)作腳本可以是usearch_program(time, genre)”。
[0067]因此,域確定器140確定在擴(kuò)展域中是否包括這樣的用戶(hù)動(dòng)作腳本。當(dāng)確定在擴(kuò)展域中不包括關(guān)于“search_program(time, genre) ”的用戶(hù)動(dòng)作腳本時(shí),域確定器140可檢測(cè)包括“search_program(time, genre) ”、與用戶(hù)動(dòng)作腳本相應(yīng)的、包括在屬于最低等級(jí)的多個(gè)候選域中的候選域。當(dāng)包括“search_program(time, genre) ”的候選域是TV節(jié)目10時(shí),域確定器140可檢測(cè)出作為候選域的域TV節(jié)目10域。
[0068]當(dāng)檢測(cè)出候選域時(shí),域確定器140可基于先前域確定是否將檢測(cè)出的候選域確定為最終域。當(dāng)基于與在用戶(hù)發(fā)音中提取的第一表達(dá)元素和第二表達(dá)元素分別相應(yīng)的主動(dòng)作和組件槽而檢測(cè)出擴(kuò)展域時(shí),如圖6和圖7,可通過(guò)將屬于分層域模型中的每一個(gè)分層等級(jí)中的域分類(lèi)來(lái)檢測(cè)出擴(kuò)展域。
[0069]圖6是根據(jù)示例性實(shí)施例的域確定器中將屬于分層域模型中的每一個(gè)分層等級(jí)中的域分類(lèi)的第一示例性示圖。
[0070]如圖6中所示,域確定器140可包括多分類(lèi)器141和擴(kuò)展域解釋器142。多分類(lèi)器141識(shí)別屬于分層域模型的每一個(gè)分層等級(jí)的用戶(hù)的發(fā)音,并檢測(cè)與從轉(zhuǎn)換的文本中提取的第一表達(dá)元素和第二表達(dá)元素有關(guān)的至少一個(gè)候選域。此外,擴(kuò)展域解釋器142將從多分類(lèi)器141中檢測(cè)出的屬于候選域的上位概念的域確定為擴(kuò)展域。
[0071]如前述示例中,當(dāng)從用戶(hù)的發(fā)音“為我找出動(dòng)作片! ”中提取到第一表達(dá)元素“為我找出! ”和第二表達(dá)元素“動(dòng)作片”時(shí),多分類(lèi)器141可檢測(cè)屬于最低分層等級(jí)的候選域(TV節(jié)目10和V0D20),TV節(jié)目10和V0D20域包括通過(guò)將與第一表達(dá)元素相應(yīng)的主動(dòng)作和與第二表達(dá)元素相應(yīng)的組件槽組合而產(chǎn)生的用戶(hù)動(dòng)作腳本。如上所提,當(dāng)檢測(cè)到候選域(TV節(jié)目10和V0D20)時(shí),擴(kuò)展域解釋器142確定是否存在對(duì)于每一個(gè)候選域(TV節(jié)目10和V0D20)具有上位概念的擴(kuò)展域。當(dāng)確定每個(gè)候選域TV節(jié)目10和V0D20包括具有與域“視頻內(nèi)容50”共同的上位概念的分層時(shí),擴(kuò)展域解釋器142可將域“視頻內(nèi)容50”確定為擴(kuò)展域。
[0072]圖7是根據(jù)另一示例性實(shí)施例的域確定器中將屬于分層域模型中的每一個(gè)分層中的域分類(lèi)的第二示例性示圖。
[0073]如圖7中所示,域確定器140可包括二元分類(lèi)器143和域組合器144??纱嬖谂c屬于分層域模型中的最低分層等級(jí)中的候選域一樣多的二元分類(lèi)器。也就是說(shuō),當(dāng)屬于分層域模型中的最低分層等級(jí)的候選域的數(shù)量是η時(shí),域確定器140可包括二元分類(lèi)器143-1~143-η。因此,與屬于分層域模型中的最低分層等級(jí)的候選域相應(yīng)的二元分類(lèi)器143-1~143-η可檢測(cè)出與在用戶(hù)的發(fā)音中提取的第一表達(dá)元素和第二表達(dá)元素有關(guān)的候選域和與候選域相應(yīng)的較高分層等級(jí)的域。因此,域組合器144可組合通過(guò)每一個(gè)二元分類(lèi)器143-1~143-η檢測(cè)的域,并確定候選域。
[0074]例如,當(dāng)從用戶(hù)的發(fā)音“為我找出動(dòng)作片”中提取出第一表達(dá)元素“為我找出”和第二表達(dá)元素“動(dòng)作片”時(shí),僅與包括用戶(hù)動(dòng)作腳本的候選域TV節(jié)目10和V0D20相應(yīng)的二元分類(lèi)器143-2和143-3可檢測(cè)出每一個(gè)分層等級(jí)中的域,其中,所述用戶(hù)動(dòng)作腳本通過(guò)將與第一表達(dá)元素“為我找出! ”相應(yīng)的主動(dòng)作和與第二表達(dá)要素“動(dòng)作片”相應(yīng)的組件槽組合而被產(chǎn)生。
[0075]也就是說(shuō),可檢查出包括用戶(hù)動(dòng)作腳本的關(guān)于最低分層等級(jí)的TV節(jié)目10的候選域、與具有包括上位概念的中間分層的TV頻道40、視頻頻道50相應(yīng)的擴(kuò)展域以及與最高分層的根60相應(yīng)的擴(kuò)展域,其中,用戶(hù)動(dòng)作腳本通過(guò)將第一表達(dá)元素“為我找出! ”相應(yīng)的主動(dòng)作和與第二表達(dá)元素相應(yīng)的組合槽結(jié)合而被產(chǎn)生。此外,二元分類(lèi)器143-3可檢測(cè)出包括用戶(hù)動(dòng)作腳本的關(guān) 于最低分層的V0D20的候選域、與包括上位概念的中間分層的視頻頻道50相應(yīng)的擴(kuò)展域和與最高分層的根60相應(yīng)的擴(kuò)展域,其中,用戶(hù)動(dòng)作腳本通過(guò)將與第一表達(dá)元素“為我找出! ”相應(yīng)的主動(dòng)作和與第二表達(dá)元素相應(yīng)的組合槽結(jié)合而被產(chǎn)生。如此,當(dāng)通過(guò)二元分類(lèi)器143-1、143-2…檢測(cè)到每一個(gè)分層的域時(shí),域組合器144可將檢測(cè)到的域中的重復(fù)的域確定為擴(kuò)展域。
[0076]因此,當(dāng)檢測(cè)到與在用戶(hù)的發(fā)音中提取的第一表達(dá)元素和第二表達(dá)元素有關(guān)的擴(kuò)展域時(shí),域確定器140可基于先前確定的域(上文中稱(chēng)作域)檢測(cè)出與預(yù)先檢測(cè)的擴(kuò)展域有關(guān)的所有從屬概念的域,并將檢測(cè)的的所有候選域中的至少一個(gè)候選域確定為最終域。
[0077]此外,域確定器140可從與從提取器130中提取的用戶(hù)的發(fā)音相應(yīng)的第一表達(dá)元素和第二表達(dá)元素中的至少一個(gè)和預(yù)先檢測(cè)的候選域來(lái)理解用戶(hù)的意圖。例如,當(dāng)從用戶(hù)的發(fā)音“立刻為我找出空中動(dòng)作片”中檢測(cè)出第二表達(dá)元素“立刻”和“動(dòng)作片”時(shí),域確定器140可從與第二表達(dá)元素“立刻”和“動(dòng)作片”相應(yīng)的組件槽中理解用戶(hù)的意圖。
[0078]如此,當(dāng)用戶(hù)的意圖被理解時(shí),域確定器140從理解的用戶(hù)意圖中確定是否發(fā)生語(yǔ)境初始化。當(dāng)確定沒(méi)有發(fā)生語(yǔ)境初始化時(shí),域確定器140可基于先前域?qū)㈩A(yù)先檢測(cè)的多個(gè)候選域中的至少一個(gè)候選域確定為最終域,先前域是就在接收到用戶(hù)的發(fā)音之前從用戶(hù)的先前發(fā)音中確定的域。
[0079]更具體地,當(dāng)預(yù)先檢測(cè)的多個(gè)候選域中的至少一個(gè)候選域與預(yù)先存儲(chǔ)在存儲(chǔ)單元160中的先前域相應(yīng)時(shí),域確定器140可將先前域確定為最終域。在此,先前域是就在接收到用戶(hù)的發(fā)音之前從用戶(hù)的先前發(fā)音中確定的域。這樣的先前域可以是TV節(jié)目10,當(dāng)前檢測(cè)到的候選域可以是TV節(jié)目10和V0D20。在這種情況下,域確定器140確定在與先前發(fā)音有關(guān)的類(lèi)別內(nèi)正在輸入的當(dāng)前用戶(hù)的發(fā)音。因此,域確定器140沒(méi)有將候選域確定為最終域,而是可維持作為先前域的TV節(jié)目10作為最終域。
[0080]然而,本公開(kāi)不限于此,域確定器140可將預(yù)先檢測(cè)的多個(gè)候選域中的與先前域相應(yīng)的候選域確定為最終域。
[0081]當(dāng)確定預(yù)先檢測(cè)的多個(gè)候選域與先前域不同或發(fā)生語(yǔ)境初始化時(shí),域確定器140在與預(yù)先檢測(cè)的擴(kuò)展域有關(guān)的至少一個(gè)候選域之中將與代表用戶(hù)動(dòng)作的第一表達(dá)元素有關(guān)的候選域確定為最終域。更具體地,域確定器140在檢測(cè)出的多個(gè)候選域之中將包括與代表用戶(hù)動(dòng)作的第一表達(dá)元素相應(yīng)的主動(dòng)作信息的候選域確定為最終域。這里,當(dāng)在檢測(cè)出的多個(gè)候選域中包括與代表用戶(hù)動(dòng)作的第一表達(dá)元素相應(yīng)的全部主動(dòng)作信息時(shí),域確定器140可將全部預(yù)先檢測(cè)的域確定為最終域。
[0082]例如,當(dāng)預(yù)先檢測(cè)的擴(kuò)展域是關(guān)于視頻內(nèi)容的擴(kuò)展域時(shí),針對(duì)關(guān)于視頻內(nèi)容的擴(kuò)展域的候選域可以是關(guān)于TV節(jié)目和VOD的域?;谙惹鞍l(fā)音確定的先前域可以是TV節(jié)目和V0D。也就是說(shuō),在當(dāng)前檢測(cè)的候選域與先前域全部相應(yīng)時(shí),域確定器140可將與作為先前域的TV節(jié)目和VOD相應(yīng)的域確定為最終域。當(dāng)候選域是與TV節(jié)目和VOD相應(yīng)的域并且先前域是與VOD相應(yīng)的域時(shí),域確定器可將作為先前域的VOD域確定為最終域。
[0083]候選域可以是與TV節(jié)目和VOD相應(yīng)的域,先前域可以是與TV設(shè)備相應(yīng)的域。也就是說(shuō),當(dāng)檢測(cè)到的候選域和先前域彼此不同時(shí),域確定器140確定已經(jīng)發(fā)生了域轉(zhuǎn)變。因此,域確定器140可將包括與第一表達(dá)元素相應(yīng)的主動(dòng)作信息的候選域確定為最終域,其中,第一表達(dá)元素在從用戶(hù)的發(fā)音中提取的第一表達(dá)元素和第二表達(dá)元素之中代表用戶(hù)動(dòng)作。
[0084]例如,當(dāng)檢測(cè)到的候選域是與TV節(jié)目和VOD有關(guān)的域,并且與從用戶(hù)的發(fā)音中提取的第一表達(dá)元素相應(yīng)的主動(dòng)作信息是搜索內(nèi)容“search_program”時(shí),域確定器140確定檢測(cè)到的候選域是否包括主動(dòng)作信息。當(dāng)在與TV節(jié)目和VOD相應(yīng)的候選域中包括主動(dòng)作信息“search_program”時(shí),域確定器140可將全部預(yù)先檢測(cè)的候選域(即,與TV節(jié)目和VOD有關(guān)的域)確定為最終域。
[0085]當(dāng)預(yù)先檢測(cè)的多個(gè)候選域包括與從用戶(hù)的發(fā)音中提取的第一表達(dá)元素相應(yīng)的主動(dòng)作信息時(shí),域確定器140可在檢測(cè)到的多個(gè)候選域之中將由用戶(hù)選擇的候選域確定為最終域或任意選擇在多個(gè)候選域之中的一個(gè)候選域并將選擇的候選域確定為最終域。
[0086]例如,預(yù)先檢測(cè)的候選域可以是與TV節(jié)目和VOD有關(guān)的域,并且與從用戶(hù)的發(fā)音中提取的第一表達(dá)元素相應(yīng)的主動(dòng)作信息可以是特定內(nèi)容“play_pr0gram”。在這種情況下,當(dāng)選擇與TV節(jié)目和VOD有關(guān)的域作為最終域時(shí),關(guān)于用戶(hù)的發(fā)音可產(chǎn)生不同的響應(yīng)信息。也就是說(shuō),在與TV節(jié)目相應(yīng)的候選域內(nèi)響應(yīng)于用戶(hù)的發(fā)音產(chǎn)生的響應(yīng)信息可以與在與VOD相應(yīng)的候選域內(nèi)響應(yīng)于用戶(hù)的發(fā)音產(chǎn)生的響應(yīng)信息彼此不同。因此,域確定器140可將在TV節(jié)目和VOD之中用戶(hù)選擇的兩個(gè)中的一個(gè)確定為最終域。
[0087]可存在多個(gè)先前域,并且在多個(gè)先前域之中的一個(gè)先前域可與在預(yù)先檢測(cè)的多個(gè)候選域之中的一個(gè)候選域彼此相應(yīng)。在這種情況下,域確定器140確定與先前域相應(yīng)的候選域是否包括與第一表達(dá)元素相應(yīng)的主動(dòng)作信息。當(dāng)確定與先前域相應(yīng)的候選域包括與第一表達(dá)兀素相應(yīng)的主動(dòng)作信息時(shí),域確定器140可將與先前域相應(yīng)的候選域確定為最終域。
[0088]當(dāng)在預(yù)先檢測(cè)的多個(gè)候選域之中的一個(gè)候選域被確定為最終域時(shí),控制器150可通過(guò)通信器110將關(guān)于從用戶(hù)的發(fā)音中提取的第一表達(dá)元素和第二表達(dá)元素的信息和關(guān)于預(yù)先確定的最終域的信息發(fā)送到外部設(shè)備(未示出)。因此,外部設(shè)備(未示出)在預(yù)先確定的最終域內(nèi)產(chǎn)生與用戶(hù)的發(fā)音有關(guān)的響應(yīng)信息,并將產(chǎn)生的響應(yīng)信息發(fā)送到語(yǔ)音識(shí)別設(shè)備100。因此,控制器150可將從外部設(shè)備接收的響應(yīng)信息通過(guò)通信器110發(fā)送到顯示設(shè)備200。然而,本公開(kāi)不限于此,當(dāng)通過(guò)域確定器140確定了最終域時(shí),控制器150可在確定的最終域內(nèi)基于預(yù)先提取的第一表達(dá)元素和第二表達(dá)元素來(lái)自身產(chǎn)生關(guān)于用戶(hù)的發(fā)音的響應(yīng)信息,并將產(chǎn)生的響應(yīng)信息通過(guò)通信器110發(fā)送到顯示設(shè)備200。
[0089]在此,響應(yīng)信息包括與用戶(hù)的發(fā)音相應(yīng)的響應(yīng)消息信息。因此,控制器150可從外部設(shè)備接收正在輸出在顯示設(shè)備200上、包括以文本格式的響應(yīng)消息信息的響應(yīng)信息,或在內(nèi)部產(chǎn)生響應(yīng)信息。當(dāng)從外部設(shè)備接收了或內(nèi)部產(chǎn)生了這樣的響應(yīng)信息時(shí),控制器150通過(guò)通信器110將所述響應(yīng)信息發(fā)送到顯示設(shè)備200。因此,顯示設(shè)備200可將包括在從語(yǔ)音識(shí)別設(shè)備100接收的響應(yīng)信息中的響應(yīng)消息信息以文本格式輸出在屏幕上,或通過(guò)揚(yáng)聲器作為音頻輸出。
[0090]以上已經(jīng)提供了關(guān)于根據(jù)示例性實(shí)施例的對(duì)話(huà)型系統(tǒng)中提供對(duì)于用戶(hù)的發(fā)音的響應(yīng)信息的語(yǔ)音識(shí)別設(shè)備100的每一個(gè)配置的詳細(xì)解釋。以下將提供關(guān)于根據(jù)示例性實(shí)施例的對(duì)話(huà)型語(yǔ)音識(shí)別設(shè)備100中提供與用戶(hù)的發(fā)音相應(yīng)的響應(yīng)信息的方法的詳細(xì)解釋。
[0091]圖8是根據(jù)示例性實(shí)施例的用于在對(duì)話(huà)型系統(tǒng)的語(yǔ)音識(shí)別設(shè)備中提供與用戶(hù)的發(fā)音相應(yīng)的響應(yīng)信息的方法的流程圖。
[0092]如圖8中所示,語(yǔ)音識(shí)別設(shè)備100從顯示設(shè)備200接收收集的用戶(hù)的發(fā)音信號(hào)(在下文中被稱(chēng)作“發(fā)音”)。當(dāng)從顯示設(shè)備200接收到用戶(hù)的發(fā)音時(shí),接收的用戶(hù)的發(fā)音被識(shí)別并被轉(zhuǎn)換成文本(S810)。根據(jù)示例性實(shí)施例,語(yǔ)音識(shí)別設(shè)備100可使用STT (語(yǔ)音到電文)算法,并將接收到的用戶(hù)的發(fā)音轉(zhuǎn)換為文本。當(dāng)用戶(hù)的發(fā)音轉(zhuǎn)換成文本時(shí),語(yǔ)音識(shí)別設(shè)備100從轉(zhuǎn)換成文本的用戶(hù)的發(fā)音中提取代表用戶(hù)動(dòng)作的第一表達(dá)元素和代表對(duì)象的第二表達(dá)元素(S820)。例如,在用戶(hù)的發(fā)音“為我找出動(dòng)作片! ”的情況下,語(yǔ)音識(shí)別設(shè)備100可提取代表用戶(hù)動(dòng)作“為我找到! ”的第一表達(dá)元素和代表對(duì)象“動(dòng)作片”的第二表達(dá)元素。
[0093]接下來(lái),語(yǔ)音識(shí)別設(shè)備100基于預(yù)先確定并存儲(chǔ)的分層域模型來(lái)檢測(cè)與從用戶(hù)的發(fā)音提取的第一表達(dá)元素和第二表達(dá)元素有關(guān)的擴(kuò)展域(S830)。在此,分層域模式是分層地包括候選域和預(yù)先確定為每一個(gè)候選域的上位概念的虛擬擴(kuò)展域的域模型,在候選域中,在每一個(gè)發(fā)音中提取的第一表達(dá)元素相應(yīng)的主動(dòng)作和與第二表達(dá)元素相應(yīng)的組件槽彼此匹配。
[0094]分層域模型可包括樹(shù)狀分層結(jié)構(gòu),在其中包括最高分層等級(jí)、中間分層等級(jí)和最低分層等級(jí)。最高分層等級(jí)是關(guān)于預(yù)先確定為與候選域有關(guān)的上位概念的虛擬擴(kuò)展域的主題節(jié)點(diǎn),其中,候選域是產(chǎn)生關(guān)于用戶(hù)的發(fā)音的響應(yīng)信息的區(qū)域,中間分層等級(jí)是預(yù)先確定為上位概念的從屬概念的主題節(jié)點(diǎn)。此外,最低分層等級(jí)是關(guān)于預(yù)先確定為中間概念的從屬概念的候選域的主題節(jié)點(diǎn)。也就是說(shuō),屬于分層域模型的最低分層等級(jí)的候選域被預(yù)先確定為與基本關(guān)鍵詞相應(yīng)的下位概念的候選域,屬于中間分層等級(jí)的虛擬擴(kuò)展域可被預(yù)先確定為在多個(gè)預(yù)先確定為下位概念的候選域之間包括兩個(gè)或更多個(gè)候選域的中間概念的域。此外,屬于最高分層等級(jí)的虛擬擴(kuò)展域可被確定為包括全部預(yù)先確定為下位概念的候選域的上位概念的域。
[0095]如圖4中所示,每一個(gè)分層等級(jí)預(yù)先確定的每一個(gè)域可被預(yù)先確定為用于確定每一個(gè)域的主動(dòng)作和與主動(dòng)作彼此匹配的組件槽。也就是說(shuō),每一個(gè)分層預(yù)先確定的每一個(gè)域可包括通過(guò)將與代表用戶(hù)動(dòng)作的第一表達(dá)元素相應(yīng)的主動(dòng)作和與代表對(duì)象的第二表達(dá)元素相應(yīng)的組件槽組合而產(chǎn)生的用戶(hù)動(dòng)作腳本。如圖4中所示,關(guān)于屬于最低分層的TV節(jié)目10的候選域可包括用戶(hù)動(dòng)作腳本12 (諸如,“play_program (channel_name, channel_no, genre, time, title)”、〃search_program(channel_name, channel_no, genre, time, title)")。因此,如圖4中所示,每一個(gè)分層預(yù)先確定的每一個(gè)域(即,包括在分層域模型中的每一個(gè)分層的每一個(gè)域)可包括如圖5中所示的通過(guò)將不同的主動(dòng)作和每一個(gè)主動(dòng)作的組件槽組合而產(chǎn)生的用戶(hù)動(dòng)作腳本。
[0096]因此,語(yǔ)音識(shí)別設(shè)備100可基于預(yù)先確定的分層域模型來(lái)檢測(cè)包括用戶(hù)動(dòng)作腳本的至少一個(gè)候選域并從檢測(cè)出的候選域中檢測(cè)屬于相應(yīng)的候選域的上位概念的擴(kuò)展域,其中,用戶(hù)動(dòng)作腳本通過(guò)將從用戶(hù)的語(yǔ)音中提取的第一表達(dá)元素和第二表達(dá)元素分別相應(yīng)的主動(dòng)作和組件槽組合而被產(chǎn)生。
[0097]根據(jù)示例性實(shí)施例,語(yǔ)音識(shí)別設(shè)備100使用多分類(lèi)器以在屬于分層域模型的每一個(gè)分層中檢測(cè)與從用戶(hù)的發(fā)音提取的第一表達(dá)元素和第二表達(dá)元素有關(guān)的至少一個(gè)候選域。當(dāng)如此檢測(cè)到至少一個(gè)候選域時(shí),語(yǔ)音識(shí)別設(shè)備100將屬于檢測(cè)出的候選域的上位概念的域確定為擴(kuò)展域。例如,語(yǔ)音識(shí)別設(shè)備100可檢測(cè)出包括作為用戶(hù)動(dòng)作腳本的“search_program(genre) ”的候選域TV節(jié)目10和V0D20,其中,用戶(hù)動(dòng)作腳本通過(guò)將與來(lái)自用戶(hù)的發(fā)音的第一表達(dá)元素“為我找出! ”相應(yīng)的主動(dòng)作和與第二表達(dá)元素“動(dòng)作片”相應(yīng)的組件槽組合而被產(chǎn)生。如此,當(dāng)檢測(cè)出每一個(gè)候選域(TV節(jié)目10和V0D20)時(shí),語(yǔ)音識(shí)別設(shè)備100確定是否存在與每一個(gè)檢測(cè)到的候選域具有共同的上位概念的擴(kuò)展域。當(dāng)確定候選域TV節(jié)目10和V0D20的每一個(gè)包括具有域“視頻內(nèi)容(50)”的共同的上位概念的分層時(shí),語(yǔ)音識(shí)別設(shè)備100可將域“視頻內(nèi)容(50)”確定為擴(kuò)展域。
[0098]根據(jù)另一示例性實(shí)施例,語(yǔ)音識(shí)別設(shè)備100使用至少一個(gè)二元分類(lèi)器以在與從用戶(hù)的發(fā)音中提取的第一表達(dá)元素和第二表達(dá)元素有關(guān)的候選域之中檢測(cè)至少一個(gè)域和擴(kuò)展域。在此,二元分類(lèi)器的數(shù)量可以與在屬于分層域模型的最低分層域中候選域的數(shù)量一樣多。也就是說(shuō),當(dāng)在屬于分層域模型的最低分層等級(jí)中存在數(shù)量η的候選域時(shí),語(yǔ)音識(shí)別設(shè)備100使用數(shù)量η的二元分類(lèi)器以檢測(cè)與從用戶(hù)的發(fā)音中提取的第一表達(dá)元素和第二表達(dá)元素有關(guān)的候選域和與相應(yīng)的候選域有關(guān)的較高分層等級(jí)的擴(kuò)展域。接下來(lái),語(yǔ)音識(shí)別設(shè)備100可通過(guò)將經(jīng)過(guò)每一個(gè)二元分類(lèi)器檢測(cè)出的域組合而確定候選域。例如,當(dāng)從用戶(hù)的發(fā)音中提取到第一表達(dá)元素“為我找出! ”和第二表達(dá)元素“動(dòng)作片”時(shí),僅在與TV節(jié)目、VOD和TV裝置相應(yīng)的每一個(gè)二元分類(lèi)器之中與包括用戶(hù)動(dòng)作腳本的候選域TV節(jié)目和VOD相應(yīng)的二元分類(lèi)器可檢測(cè)出每一個(gè)分層的域,其中,用戶(hù)動(dòng)作腳本通過(guò)將與第一表達(dá)元素“為我找出! ”相應(yīng)的主動(dòng)作和與第二表達(dá)元素“動(dòng)作片”相應(yīng)的動(dòng)作槽組合而被產(chǎn)生。
[0099]也就是說(shuō),語(yǔ)音識(shí)別設(shè)備100可檢測(cè)與包括通過(guò)將與第一表達(dá)元素“為我找出! ”相應(yīng)的主動(dòng)作和與第二表達(dá)元素“動(dòng)作片”相應(yīng)的組件槽組合而產(chǎn)生的用戶(hù)動(dòng)作腳本的最低分層等級(jí)的TV節(jié)目10相應(yīng)的候選域、與包含相應(yīng)候選域的上位概念的中間分層等級(jí)中的TV頻道和視頻內(nèi)容相應(yīng)的擴(kuò)展域以及與最高分層等級(jí)中的根相應(yīng)的擴(kuò)展域。此外,語(yǔ)音識(shí)別設(shè)備100可檢測(cè)在包括通過(guò)將與第一表達(dá)元素“為我找出! ”相應(yīng)的主動(dòng)作和與第二表達(dá)元素“動(dòng)作片”相應(yīng)的組件槽組合而產(chǎn)生的用戶(hù)動(dòng)作腳本的最低分層等級(jí)中關(guān)于VOD的候選域、在包括相應(yīng)候選域的上位概念的中間分層等級(jí)中與視頻頻道相應(yīng)的擴(kuò)展域以及與最高分層等級(jí)的根相應(yīng)的擴(kuò)展域。如此,當(dāng)通過(guò)與每一個(gè)候選域TV節(jié)目和VOD相應(yīng)的二元分類(lèi)器而檢測(cè)出每一個(gè)分層的域時(shí),語(yǔ)音識(shí)別設(shè)備100可在檢測(cè)出的域之中將重復(fù)的域確定為擴(kuò)展域。
[0100]當(dāng)檢測(cè)出與從用戶(hù)的發(fā)音中提取的第一表達(dá)元素和第二表達(dá)元素有關(guān)的擴(kuò)展域時(shí),語(yǔ)音識(shí)別設(shè)備100可基于先前確定的域(在此以下稱(chēng)作先前域)檢測(cè)出與預(yù)檢測(cè)的候選域有關(guān)的全部從屬概念的候選域,并檢測(cè)多個(gè)檢測(cè)出的候選域中的至少一個(gè)作為最終域(S840、S850)。接下來(lái),語(yǔ)音識(shí)別設(shè)備100將關(guān)于確定的最終域的信息和關(guān)于從用戶(hù)的發(fā)音提取的第一表達(dá)元素和第二表達(dá)元素的信息發(fā)送到外部設(shè)備(未示出)(S860)。因此,外部設(shè)備(未示出)可在預(yù)先確定的最終域內(nèi)產(chǎn)生與用戶(hù)的發(fā)音有關(guān)的響應(yīng)信息并將產(chǎn)生的響應(yīng)信息發(fā)送到語(yǔ)音識(shí)別設(shè)備100。然而,本公開(kāi)不限于此,并且語(yǔ)音識(shí)別設(shè)備100可在預(yù)先確定的最終域內(nèi)基于第一表達(dá)元素和第二表達(dá)元素來(lái)自身產(chǎn)生關(guān)于用戶(hù)的發(fā)音的響應(yīng)信息。在此,響應(yīng)信息可包括與用戶(hù)的發(fā)音相應(yīng)的響應(yīng)消息信息。因此,當(dāng)從外部設(shè)備接收了或在內(nèi)部產(chǎn)生了這樣的響應(yīng)信息時(shí),語(yǔ)音識(shí)別設(shè)備100將相應(yīng)的響應(yīng)信息發(fā)送到顯示設(shè)備200。因此,顯示設(shè)備200可將包括在從語(yǔ)音識(shí)別設(shè)備100接收的響應(yīng)信息中的響應(yīng)消息信息以文本格式輸出在屏幕上,或通過(guò)揚(yáng)聲器作為音頻輸出。
[0101]在此以下是用于在前述的語(yǔ)音識(shí)別設(shè)備100中在多個(gè)候選域之中將至少一個(gè)候選域確定為最終域的方法的詳細(xì)解釋。
[0102]圖9是根據(jù)示例性實(shí)施例的用于將在語(yǔ)音識(shí)別設(shè)備中提取的候選域中的一個(gè)確定為最終域的方法的流程圖。
[0103]如圖9中所示,在操作語(yǔ)音識(shí)別設(shè)備100從在操作S820中提取的第一表達(dá)元素和第二表達(dá)元素和預(yù)先檢測(cè)的候選域來(lái)理解用戶(hù)的意圖。如之前所提,當(dāng)從用戶(hù)的發(fā)音“立刻為我找出空中動(dòng)作片”中檢測(cè)出第二表達(dá)元素“立刻”和“動(dòng)作片”時(shí),語(yǔ)音識(shí)別設(shè)備100可從檢測(cè)出的“立刻”和“動(dòng)作片”相應(yīng)的組件槽理解用戶(hù)的意圖。
[0104]當(dāng)理解了用戶(hù)的意圖時(shí),語(yǔ)音識(shí)別設(shè)備100基于理解的用戶(hù)的意圖來(lái)確定是否發(fā)生了語(yǔ)境初始化(S910)。當(dāng)確定還沒(méi)有發(fā)生語(yǔ)境初始化時(shí),語(yǔ)音識(shí)別設(shè)備100基于先前域?qū)⒃陬A(yù)先檢測(cè)的多個(gè)候選域之中的一個(gè)候選域確定為最終域。更具體地,當(dāng)在預(yù)先檢測(cè)的多個(gè)候選域之中的一個(gè)候選域與預(yù)先存儲(chǔ)的先前域相應(yīng)時(shí),語(yǔ)音識(shí)別設(shè)備100維持先前域作為最終域(S920、S930)。在此,先前域是就在接收到用戶(hù)的發(fā)音之前從用戶(hù)的先前發(fā)音確定的域。例如,當(dāng)這樣的先前域是TV節(jié)目,并且當(dāng)前檢測(cè)到的候選域是TV節(jié)目和VOD時(shí),語(yǔ)音識(shí)別設(shè)備100確定在與先前發(fā)音有關(guān)的類(lèi)別內(nèi)用戶(hù)的當(dāng)前發(fā)音正在被輸入。因此,語(yǔ)音識(shí)別設(shè)備100沒(méi)有將預(yù)先檢測(cè)的多個(gè)候選域確定為最終域,但可維持作為先前域的TV節(jié)目作為最終域。
[0105]當(dāng)確定預(yù)先檢測(cè)的多個(gè)候選域與先前域不同或已經(jīng)發(fā)生了語(yǔ)境初始化時(shí),語(yǔ)音識(shí)別設(shè)備100獲得與代表用戶(hù)意圖的第一表達(dá)元素相應(yīng)的主動(dòng)作信息(S940)。接下來(lái),語(yǔ)音識(shí)別設(shè)備100確定在預(yù)先檢測(cè)的多個(gè)候選域中是否包括與第一表達(dá)元素相應(yīng)的主動(dòng)作信息(S950)。當(dāng)確定在多個(gè)獲選域中的至少一個(gè)候選域中包括與第一表達(dá)元素相應(yīng)的主動(dòng)作信息時(shí),語(yǔ)音識(shí)別設(shè)備100將包括與第一表達(dá)兀素相應(yīng)的主動(dòng)作信息的候選域確定為最終域(S960)。
[0106]可存在多個(gè)先前域,并且在多個(gè)先前域之中的一個(gè)先前域可與在預(yù)先檢測(cè)的多個(gè)候選域之中的一個(gè)候選域彼此相應(yīng)。在這種情況下,語(yǔ)音識(shí)別設(shè)備100確定與先前域相應(yīng)的候選域是否包括與第一表達(dá)元素相應(yīng)的主動(dòng)作信息。當(dāng)確定與先前域相應(yīng)的候選域包括與第一表達(dá)元素相應(yīng)的主動(dòng)作信息時(shí),語(yǔ)音識(shí)別設(shè)備100可將與先前域相應(yīng)的候選域確定為最終域。
[0107]例如,當(dāng)檢測(cè)到的候選域是關(guān)于TV節(jié)目和VOD的域,并且與從用戶(hù)的發(fā)音中提取的第一表達(dá)元素相應(yīng)的主動(dòng)作信息是搜索內(nèi)容“searctupiOgram”時(shí),語(yǔ)音識(shí)別設(shè)備100確定檢測(cè)到的候選域是否包括主動(dòng)作信息“ search_program,,0當(dāng)關(guān)于TV節(jié)目和VOD的候選域包括主動(dòng)作信息“search_program”時(shí),語(yǔ)音識(shí)別設(shè)備100可將關(guān)于TV節(jié)目和VOD的候選域確定為最終域。
[0108]當(dāng)確定全部預(yù)先檢測(cè)的多個(gè)候選域不包括主動(dòng)作信息時(shí),語(yǔ)音識(shí)別設(shè)備100可在檢測(cè)到的多個(gè)候選域之中將由用戶(hù)選擇的候選域確定為最終域(S970),或任意選擇在多個(gè)候選域之中的一個(gè)候選域并將選擇的候選域確定為最終域。
[0109]例如,預(yù)先檢測(cè)的候選域可以是與TV節(jié)目和VOD有關(guān)的域,并且與從用戶(hù)的發(fā)音中提取的第一表達(dá)元素相應(yīng)的主動(dòng)作信息可以是“play_pr0gram”。在這種情況下,當(dāng)選擇關(guān)于TV節(jié)目和VOD的候選域作為最終域時(shí),關(guān)于用戶(hù)的發(fā)音可產(chǎn)生不同的響應(yīng)信息。因此,語(yǔ)音識(shí)別設(shè)備100可在關(guān)于TV節(jié)目和VOD的候選域之中的由用戶(hù)選擇的一個(gè)候選域確定為最終域。
[0110]如此,當(dāng)將在預(yù)先檢測(cè)的多個(gè)候選域之中的至少一個(gè)候選域確定為最終域時(shí),語(yǔ)音識(shí)別設(shè)備100可在預(yù)先確定的最終域內(nèi)產(chǎn)生關(guān)于用戶(hù)的發(fā)音的響應(yīng)信息并將產(chǎn)生的響應(yīng)信息輸出。因此,顯示設(shè)備200可通過(guò)顯示從語(yǔ)音識(shí)別設(shè)備100接收的響應(yīng)信息或通過(guò)將所述響應(yīng)信息經(jīng)過(guò)揚(yáng)聲器輸出來(lái)確認(rèn)關(guān)于自身的發(fā)音的響應(yīng)信息。
[0111]根據(jù)各種示例性實(shí)施例的語(yǔ)音識(shí)別設(shè)備中提供關(guān)于用戶(hù)的發(fā)音的響應(yīng)信息的方法可作為程序代碼被實(shí)施并可被設(shè)置在存儲(chǔ)在非暫時(shí)性計(jì)算機(jī)可讀介質(zhì)中的每一個(gè)服務(wù)器或裝置中。
[0112]非暫時(shí)性計(jì)算機(jī)可讀介質(zhì)是數(shù)據(jù)可被半永久性的存儲(chǔ)在其中的計(jì)算機(jī)可讀介質(zhì),而非在一段短時(shí)期內(nèi)數(shù)據(jù)被存儲(chǔ)在其中的介質(zhì)(諸如,寄存器、緩存器、內(nèi)存等)。更具體地,前述各種應(yīng)用或程序可被存儲(chǔ)在非暫時(shí)性計(jì)算機(jī)可讀介質(zhì)(諸如,CD、DVD、硬盤(pán)、藍(lán)光碟、USB、內(nèi)存卡、ROM等)中。
[0113]雖然已經(jīng)示出并描述了一些示例性實(shí)施例,但本領(lǐng)域技術(shù)人員應(yīng)該理解:在不脫離本發(fā)明的概念的原理和精神的情況下可在這些實(shí)施例中做出改變,其中,本發(fā)明的概念的范圍由權(quán)利要求和它們的等同物限定。
【權(quán)利要求】
1.一種對(duì)話(huà)型語(yǔ)音識(shí)別設(shè)備,包括: 提取器,被配置為從用戶(hù)的發(fā)音信號(hào)中提取代表用戶(hù)動(dòng)作的第一表達(dá)元素和代表對(duì)象的第二表達(dá)元素; 域確定器,被配置為基于分層域模型檢測(cè)出與提取的第一表達(dá)元素和第二表達(dá)元素有關(guān)的擴(kuò)展域,并將與檢測(cè)出的多個(gè)擴(kuò)展域有關(guān)的至少一個(gè)候選域確定為最終域; 通信器,被配置為與外部設(shè)備執(zhí)行通信; 控制器,被配置為控制通信器發(fā)送與第一表達(dá)元素和第二表達(dá)元素有關(guān)的信息和關(guān)于確定的最終域的信息。
2.根據(jù)權(quán)利要求1所述的對(duì)話(huà)型語(yǔ)音識(shí)別設(shè)備,其中,分層域模型包括:下位概念的候選域和預(yù)先確定為候選域的上位概念的虛擬擴(kuò)展域,在下位概念的候選域中,與第一表達(dá)元素相應(yīng)的主動(dòng)作和與第二表達(dá)元素相應(yīng)的組件槽彼此匹配。
3.根據(jù)權(quán)利要求2所述的對(duì)話(huà)型語(yǔ)音識(shí)別設(shè)備,其中,域確定器被配置為當(dāng)檢測(cè)出與從提取器中提取的第一表達(dá)元素相應(yīng)的主動(dòng)作和與從提取器中提取的第二表達(dá)元素相應(yīng)的組件槽彼此匹配的擴(kuò)展域時(shí),使用多分類(lèi)器以檢測(cè)與檢測(cè)出的擴(kuò)展域有關(guān)的從屬候選域,并且 域確定器被配置為當(dāng)沒(méi)有檢測(cè)出所述擴(kuò)展域時(shí),檢測(cè)候選域,在所述候選鄰域中,與第一表達(dá)元素相應(yīng)的主動(dòng)作和與第二表達(dá)元素相應(yīng)的組件槽彼此匹配域。
4.根據(jù)權(quán)利要求2所述的對(duì)話(huà)型語(yǔ)音識(shí)別設(shè)備,其中,域確定器被配置為使用至少一個(gè)二元分類(lèi)器檢測(cè)在多個(gè)候選域之中的至少一個(gè)域和擴(kuò)展域,其中,在候選域中,與第一表達(dá)元素相應(yīng)的主動(dòng)作和與第二表達(dá)元素相應(yīng)的組件槽彼此匹配。
5.根據(jù)權(quán)利要求3所述的對(duì)話(huà)型語(yǔ)音識(shí)別設(shè)備,其中,域確定器被配置為從提取的第一表達(dá)元素和第二表達(dá)元素中的至少一個(gè)和檢測(cè)出的候選域來(lái)確定用戶(hù)的意圖,以確定是否發(fā)生語(yǔ)境初始化,當(dāng)確定還沒(méi)有發(fā)生語(yǔ)音初始化時(shí),基于先前域?qū)⒃跈z測(cè)出的多個(gè)候選域之中的至少一個(gè)候選域確定為最終域,所述先前域是在接收到用戶(hù)的發(fā)音信號(hào)之前從用戶(hù)的先前發(fā)音確定的域。
6.根據(jù)權(quán)利要求5所述的對(duì)話(huà)型語(yǔ)音識(shí)別設(shè)備,其中,域確定器被配置為響應(yīng)于在檢測(cè)出的多個(gè)候選域之中的一個(gè)候選域與先前域彼此相應(yīng),將先前域確定為最終域。
7.根據(jù)權(quán)利要求6所述的對(duì)話(huà)型語(yǔ)音識(shí)別設(shè)備,其中,域確定器被配置為響應(yīng)于確定檢測(cè)出的候選域與先前域彼此不同或已發(fā)生了語(yǔ)境初始化,將在與檢測(cè)出的擴(kuò)展域有關(guān)的至少一個(gè)候選域之中與代表用戶(hù)動(dòng)作的第一表達(dá)元素有關(guān)的候選域確定為最終域。
8.根據(jù)權(quán)利要求7所述的對(duì)話(huà)型語(yǔ)音識(shí)別設(shè)備,其中,域確定器被配置為響應(yīng)于檢測(cè)出的候選域包括與代表用戶(hù)動(dòng)作的第一表達(dá)元素相應(yīng)的主動(dòng)作信息,將檢測(cè)出的全部候選域確定為最終域。
9.根據(jù)權(quán)利要求8所述的對(duì)話(huà)型語(yǔ)音識(shí)別設(shè)備,其中,域確定器被配置為響應(yīng)于檢測(cè)出的候選域包括與代表用戶(hù)動(dòng)作的第一表達(dá)元素相應(yīng)的主動(dòng)作信息,將由用戶(hù)選擇的候選域確定為最終域或任意選擇在檢測(cè)出的多個(gè)候選域之中的一個(gè)候選域作為最終域。
10.根據(jù)權(quán)利要求9所述的對(duì)話(huà)型語(yǔ)音識(shí)別設(shè)備,其中,域確定器被配置為響應(yīng)于存在多個(gè)先前域,所述多個(gè)先前域中的一個(gè)與所述多個(gè)候選域中的一個(gè)彼此相應(yīng)并且該候選域包括與代表用戶(hù)動(dòng)作的第一表達(dá)元素相應(yīng)的主動(dòng)作信息,來(lái)將在檢測(cè)出的多個(gè)候選域之中與先前域相應(yīng)的候選域確定為最終域。
11.一種在對(duì)話(huà)型語(yǔ)音識(shí)別設(shè)備中提供與用戶(hù)的發(fā)音相應(yīng)的響應(yīng)信息的方法,所述方法包括: 從用戶(hù)的發(fā)音信號(hào)中提取代表用戶(hù)動(dòng)作的第一表達(dá)元素和代表對(duì)象的第二表達(dá)元素; 基于預(yù)先確定的分層域模型檢測(cè)出與提取的第一表達(dá)元素和第二表達(dá)元素有關(guān)的擴(kuò)展域; 將與檢測(cè)出的多個(gè)擴(kuò)展域有關(guān)的至少一個(gè)候選域確定為最終域; 將關(guān)于第一表達(dá)元素和第二表達(dá)元素的信息和關(guān)于確定的最終域的信息發(fā)送到外部設(shè)備。
12.根據(jù)權(quán)利要求11所述的方法,其中,分層域模型包括下位概念的候選域和預(yù)先確定為候選域的上位概念的虛擬擴(kuò)展域,在下位概念的候選域中,與第一表達(dá)元素相應(yīng)的主動(dòng)作和與第二表達(dá)元素相應(yīng)的組件槽彼此匹配。
13.根據(jù)權(quán)利要求12所述的方法,其中,檢測(cè)擴(kuò)展域的步驟包括:當(dāng)檢測(cè)出與從提取器中提取的第一表達(dá)元素相應(yīng)的主動(dòng)作和與從提取器中提取的第二表達(dá)元素相應(yīng)的組件槽彼此匹配的擴(kuò)展域 時(shí),使用多分類(lèi)器以檢測(cè)與檢測(cè)出的擴(kuò)展域有關(guān)的從屬候選域,并且, 當(dāng)沒(méi)有檢測(cè)出所述擴(kuò)展域時(shí),檢測(cè)擴(kuò)展域的步驟包括:使用多分類(lèi)器以檢測(cè)候選域,在所述候選鄰域中,與第一表達(dá)元素相應(yīng)的主動(dòng)作和與第二表達(dá)元素相應(yīng)的組件槽彼此匹配域。
14.根據(jù)權(quán)利要求12所述的方法,其中,檢測(cè)擴(kuò)展域的步驟包括:使用至少一個(gè)二元分類(lèi)器檢測(cè)在多個(gè)候選域之中的至少一個(gè)域和擴(kuò)展域,其中,在候選域中,與第一表達(dá)元素相應(yīng)的主動(dòng)作和與第二表達(dá)元素相應(yīng)的組件槽彼此匹配。
15.根據(jù)權(quán)利要求13所述的方法,其中,確定最終域的步驟包括:從提取的第一表達(dá)元素和第二表達(dá)元素中的至少一個(gè)和檢測(cè)出的候選域來(lái)確定用戶(hù)的意圖,以確定是否發(fā)生語(yǔ)境初始化,響應(yīng)于確定還沒(méi)有發(fā)生語(yǔ)境初始化,基于先前域?qū)⒃跈z測(cè)出的多個(gè)候選域之中的至少一個(gè)候選域確定為最終域,所述先前域是在接收到用戶(hù)的發(fā)音信號(hào)之前從用戶(hù)的先前發(fā)音確定的域。
【文檔編號(hào)】G10L15/00GK103974109SQ201410041514
【公開(kāi)日】2014年8月6日 申請(qǐng)日期:2014年1月28日 優(yōu)先權(quán)日:2013年1月31日
【發(fā)明者】樸殷相, 金倞德, 金命哉, 劉昱, 柳成瀚, 李根培 申請(qǐng)人:三星電子株式會(huì)社