欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

話音應(yīng)用架構(gòu)的制作方法

文檔序號(hào):11635836閱讀:310來(lái)源:國(guó)知局
話音應(yīng)用架構(gòu)的制造方法與工藝

相關(guān)申請(qǐng)案的交叉引用

本申請(qǐng)案主張2014年8月11日提交的第14/456,620號(hào)美國(guó)專(zhuān)利申請(qǐng)案的優(yōu)先權(quán)。所述申請(qǐng)案的全部?jī)?nèi)容特此通過(guò)引用并入本文中。



背景技術(shù):

家中和其它用戶處所越來(lái)越多地配備有永遠(yuǎn)在線因特網(wǎng)或“云”連接。在許多情況下,甚至移動(dòng)用戶具有恒定的或幾乎恒定的數(shù)據(jù)連接。網(wǎng)絡(luò)通信的公共可用性,結(jié)合計(jì)算裝置的增加的能力,已產(chǎn)生使用各種用戶可訪問(wèn)的連接裝置的服務(wù)和其它功能性的多種新可能性?;谡Z(yǔ)言和基于語(yǔ)音的系統(tǒng)是可被用于在用戶與自動(dòng)化系統(tǒng)交互時(shí)向用戶提供便利的技術(shù)的實(shí)例。

附圖說(shuō)明

參考附圖描述具體實(shí)施方式。在圖式中,參考數(shù)字的最左位識(shí)別該參考數(shù)字首先出現(xiàn)的圖。在不同的圖式中使用相同的參考數(shù)字指示相似或相同的部件或特征。

圖1是說(shuō)明具有控制服務(wù)和語(yǔ)音接口裝置的基于語(yǔ)音的系統(tǒng)的框圖。

圖2是說(shuō)明應(yīng)用在控制服務(wù)和語(yǔ)音接口裝置上的使用和安裝的框圖。

圖3和圖4是說(shuō)明在基于語(yǔ)音選擇應(yīng)用時(shí)所使用的功能部件的框圖。

圖5是說(shuō)明在所描述的實(shí)施方案中可通過(guò)控制服務(wù)來(lái)執(zhí)行的動(dòng)作的實(shí)例的流程圖。

圖6是說(shuō)明在所描述的實(shí)施方案中可通過(guò)語(yǔ)音接口裝置來(lái)執(zhí)行的動(dòng)作的實(shí)例的流程圖。

具體實(shí)施方式

本公開(kāi)描述執(zhí)行與用戶的自然語(yǔ)言和/或基于語(yǔ)音的交互的裝置、系統(tǒng)以及服務(wù)。在所描述的實(shí)施方案中,系統(tǒng)收聽(tīng)用戶的語(yǔ)音或與用戶交互,以基于對(duì)用戶的語(yǔ)音的自然語(yǔ)言理解來(lái)確定用戶意圖。例如,用戶可說(shuō)出某一表達(dá),所述表達(dá)被理解為播放歌曲或訂電影票的意圖。在某些實(shí)施方案中,系統(tǒng)可與用戶進(jìn)行自然語(yǔ)言對(duì)話以確定或弄清用戶意圖。在確定用戶的意圖后,系統(tǒng)通過(guò)執(zhí)行動(dòng)作或提供服務(wù)以履行所述意圖來(lái)作用于所述意圖,諸如通過(guò)播放歌曲或另外與用戶交互以訂電影票。

系統(tǒng)可包含位于用戶的家中的語(yǔ)音接口裝置和基于支持云的控制服務(wù)。語(yǔ)音接口裝置經(jīng)配置以捕獲用戶話語(yǔ)并將其提供到控制服務(wù)??刂品?wù)對(duì)話語(yǔ)執(zhí)行語(yǔ)音識(shí)別和自然語(yǔ)言理解以確定話語(yǔ)所表達(dá)的意圖。響應(yīng)于所識(shí)別的意圖,控制服務(wù)使得執(zhí)行對(duì)應(yīng)的動(dòng)作。動(dòng)作可在控制服務(wù)處執(zhí)行,或通過(guò)指示語(yǔ)音接口執(zhí)行某一功能來(lái)執(zhí)行。

系統(tǒng)的內(nèi)置能力可通過(guò)由用戶選定或購(gòu)買(mǎi)的售后應(yīng)用來(lái)擴(kuò)展。此類(lèi)應(yīng)用可經(jīng)設(shè)計(jì)用于在控制服務(wù)或語(yǔ)音接口裝置上安裝和執(zhí)行。在基于所接收的用戶語(yǔ)音來(lái)確定用戶意圖后,控制服務(wù)識(shí)別所述應(yīng)用中的適合于對(duì)意圖做出響應(yīng)的一個(gè)應(yīng)用。如果此應(yīng)用已在控制服務(wù)上安裝并啟用,那么控制服務(wù)調(diào)用所述應(yīng)用。否則,如果合適的應(yīng)用安裝在語(yǔ)音接口裝置上,那么控制服務(wù)將用戶意圖的指示傳遞到語(yǔ)音接口裝置。在接收到意圖的指示后,語(yǔ)音接口裝置調(diào)用對(duì)應(yīng)的應(yīng)用以對(duì)用戶意圖做出響應(yīng)。

圖1示出基于話音的平臺(tái)或系統(tǒng)100的實(shí)例,所述基于話音的平臺(tái)或系統(tǒng)諸如可用于實(shí)施這些技術(shù)。系統(tǒng)100可包含或可利用能夠捕獲并播放音頻的語(yǔ)音接口裝置102。語(yǔ)音接口裝置102可以是環(huán)境104(諸如家中或其它處所)本地的和/或位于所述環(huán)境內(nèi)以為用戶106提供服務(wù)。語(yǔ)音接口裝置可在本文中替代地被稱(chēng)為語(yǔ)音接口、被稱(chēng)為接口裝置或被簡(jiǎn)稱(chēng)為裝置。在不同的實(shí)施方案中,語(yǔ)音接口裝置的功能可通過(guò)不同類(lèi)型的裝置來(lái)執(zhí)行,所述不同類(lèi)型的裝置包含移動(dòng)裝置,諸如智能手機(jī)、平板計(jì)算機(jī)、媒體播放器、個(gè)人計(jì)算機(jī)等。

語(yǔ)音接口裝置102可結(jié)合遠(yuǎn)程的基于網(wǎng)絡(luò)或網(wǎng)絡(luò)可訪問(wèn)的控制服務(wù)108和/或在所述服務(wù)的控制下操作,所述服務(wù)也被稱(chēng)為語(yǔ)音服務(wù)或基于語(yǔ)音的服務(wù),且經(jīng)配置以從語(yǔ)音接口裝置102接收音頻,識(shí)別所接收的音頻中的語(yǔ)音,且響應(yīng)于所識(shí)別的語(yǔ)音而執(zhí)行或啟動(dòng)功能或服務(wù)。此類(lèi)功能或服務(wù)可通過(guò)控制服務(wù)108獨(dú)立于語(yǔ)音接口裝置102來(lái)實(shí)施,和/或可通過(guò)將命令提供到語(yǔ)音接口裝置102以用于通過(guò)語(yǔ)音接口裝置102在本地執(zhí)行來(lái)實(shí)施。例如,控制服務(wù)108可指示語(yǔ)音接口裝置102播放音樂(lè)、語(yǔ)音或通過(guò)控制服務(wù)108指定的其它音頻內(nèi)容。另外,功能或服務(wù)可通過(guò)被用戶啟用和/或安裝以用于在語(yǔ)音接口裝置102或控制服務(wù)108上執(zhí)行的應(yīng)用來(lái)實(shí)施。

語(yǔ)音接口裝置102可具有一個(gè)或多個(gè)麥克風(fēng)110以及一個(gè)或多個(gè)音頻揚(yáng)聲器或換能器112以促進(jìn)與用戶106的語(yǔ)音交互。語(yǔ)音接口裝置102可具有網(wǎng)絡(luò)通信接口114,用于經(jīng)由通信網(wǎng)絡(luò)116與控制服務(wù)108通信。通信網(wǎng)絡(luò)116可包括公用廣域網(wǎng),諸如因特網(wǎng),或可包括延伸超出用戶106的本地處所的各種其它類(lèi)型的公用和專(zhuān)用網(wǎng)絡(luò)中的任何網(wǎng)絡(luò)。另外,通信接口114可在本地經(jīng)由用戶處所內(nèi)的局域網(wǎng)來(lái)通信。

語(yǔ)音接口裝置102可包含操作或控制邏輯,其可包括處理器118和存儲(chǔ)器120。處理器118可包含多個(gè)處理器和/或具有多個(gè)內(nèi)核的處理器。處理器118還可包括或包含用于處理音頻信號(hào)的數(shù)字信號(hào)處理器。

控制邏輯可包含可含有存儲(chǔ)在存儲(chǔ)器120中的應(yīng)用、程序以及其它軟件。軟件可包括計(jì)算機(jī)可執(zhí)行的指令,所述指令被處理器118執(zhí)行以執(zhí)行實(shí)施語(yǔ)音接口裝置102的所需功能性的行動(dòng)或動(dòng)作,所述所需功能性包含本文中描述的功能性。存儲(chǔ)器120可為一種非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),且可包含易失性和非易失性存儲(chǔ)器。因此,存儲(chǔ)器120可包含但不限于,ram、rom、eeprom、閃存存儲(chǔ)器、磁性介質(zhì)、光學(xué)介質(zhì)或其它存儲(chǔ)器技術(shù)。存儲(chǔ)器120還可包含通常用于傳遞或分配軟件的介質(zhì),諸如cd-rom、dvd、閃存驅(qū)動(dòng)、記憶棒等。

軟件可包含系統(tǒng)或操作軟件122,其預(yù)安裝在語(yǔ)音接口裝置102上并與之集成。操作軟件122可包括操作系統(tǒng),其提供語(yǔ)音接口裝置102的基礎(chǔ)功能性,包含驅(qū)動(dòng)器、音頻處理功能、控制服務(wù)108的接口等等。操作軟件122可包含用于執(zhí)行各種“內(nèi)置”功能和動(dòng)作的預(yù)安裝程序或應(yīng)用。操作軟件122還可包含動(dòng)作處理器或接口,其響應(yīng)于從控制服務(wù)108接收到的指令而執(zhí)行動(dòng)作。

存儲(chǔ)器可120還可包含用戶安裝的應(yīng)用124,在本文中也被稱(chēng)為裝置應(yīng)用,其可包括在裝置102的購(gòu)買(mǎi)和安裝后已被用戶106安裝在存儲(chǔ)器120且被激活以用于由處理器118執(zhí)行的應(yīng)用。各種售后應(yīng)用可供用戶用于本地安裝和執(zhí)行。在一些實(shí)施方案中,控制服務(wù)108可提供功能性以用于允許用戶識(shí)別并安裝已由各種開(kāi)發(fā)者和供應(yīng)商提供用于在語(yǔ)音接口裝置102上執(zhí)行的應(yīng)用。例如,用戶可陳述“找到用于打出租車(chē)的應(yīng)用”??刂品?wù)108可通過(guò)建議提供此類(lèi)應(yīng)用以用于安裝在語(yǔ)音接口裝置102上來(lái)做出響應(yīng)。用戶可接受此建議,由此應(yīng)用可被提供到語(yǔ)音接口裝置102并安裝在所述語(yǔ)音接口裝置上。

在一些情況下,控制服務(wù)108可為網(wǎng)絡(luò)可訪問(wèn)的計(jì)算平臺(tái)中的經(jīng)由網(wǎng)絡(luò)116維持并可訪問(wèn)的部分。諸如此平臺(tái)等網(wǎng)絡(luò)可訪問(wèn)的計(jì)算平臺(tái)可使用術(shù)語(yǔ)諸如“按需計(jì)算”、“軟件即服務(wù)(saas)”、“平臺(tái)計(jì)算”、“網(wǎng)絡(luò)可訪問(wèn)的平臺(tái)”、“云服務(wù)”、“數(shù)據(jù)中心”等等來(lái)稱(chēng)呼??刂品?wù)108可經(jīng)配置以將服務(wù)提供到在不同用戶的家中或處所中的大量語(yǔ)音接口裝置102。

語(yǔ)音接口裝置102和/或控制服務(wù)108可經(jīng)由有線技術(shù)(例如,導(dǎo)線、通用串行總線(usb)、光纖電纜等)、無(wú)線技術(shù)(例如,射頻(rf)、蜂窩、移動(dòng)電話網(wǎng)絡(luò)、衛(wèi)星、藍(lán)牙等)或其它連接技術(shù)來(lái)通信地耦合到網(wǎng)絡(luò)116。網(wǎng)絡(luò)116表示任何類(lèi)型的通信網(wǎng)絡(luò),包含數(shù)據(jù)和/或話音網(wǎng)絡(luò),且可使用有線基礎(chǔ)設(shè)施(例如,同軸電纜、光纖電纜等)、無(wú)線基礎(chǔ)設(shè)施(例如,rf、蜂窩、微波、衛(wèi)星、等)和/或其它連接技術(shù)來(lái)實(shí)施。

控制服務(wù)108經(jīng)配置以從語(yǔ)音接口裝置102接收音頻流,識(shí)別音頻流中的語(yǔ)音,以及從所識(shí)別的語(yǔ)音確定用戶意圖。取決于所識(shí)別的意圖的性質(zhì),控制服務(wù)108可通過(guò)執(zhí)行動(dòng)作或調(diào)用應(yīng)用以執(zhí)行動(dòng)作來(lái)做出響應(yīng)。

在一些情況下,控制服務(wù)108可確定意圖并將對(duì)意圖的描述返回到語(yǔ)音接口裝置102,使得語(yǔ)音接口裝置102可響應(yīng)于意圖而執(zhí)行動(dòng)作。在從控制服務(wù)108接收到所識(shí)別的意圖后,語(yǔ)音接口裝置可調(diào)用用戶安裝的應(yīng)用124中的一個(gè)來(lái)執(zhí)行動(dòng)作以履行意圖。

在其它情況下,控制服務(wù)可將指令或命令返回到語(yǔ)音接口裝置102,且語(yǔ)音接口裝置102的命令處理器可執(zhí)行所述指令或命令以在環(huán)境104內(nèi)執(zhí)行動(dòng)作。

控制服務(wù)108包含操作或控制邏輯,其可包括一個(gè)或多個(gè)服務(wù)器、計(jì)算機(jī)和/或處理器126??刂七壿嫲鎯?chǔ)器128,其包含應(yīng)用、程序和/或呈指令的形式的其它軟件,所述指令被處理器126執(zhí)行以執(zhí)行實(shí)施控制服務(wù)108的所需功能性的行動(dòng)或動(dòng)作,所述所需功能性包含本文中描述的功能性。存儲(chǔ)器128可為一種非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),且可包含易失性和非易失性存儲(chǔ)器。因此,存儲(chǔ)器128可包含但不限于,ram、rom、eeprom、閃存存儲(chǔ)器、磁性介質(zhì)、光學(xué)介質(zhì)或其它存儲(chǔ)器技術(shù)。存儲(chǔ)器128還可包含通常用于傳遞或分配軟件的介質(zhì),諸如cd-rom、dvd、閃存驅(qū)動(dòng)、記憶棒等。

在未具體示出的其它邏輯和物理部件中,控制服務(wù)108的軟件可包含語(yǔ)音處理部件130,也被稱(chēng)為語(yǔ)音服務(wù)130。語(yǔ)音服務(wù)130可包含自動(dòng)語(yǔ)音識(shí)別(asr)功能性,其在由語(yǔ)音接口裝置102提供的來(lái)自麥克風(fēng)110的音頻信號(hào)中識(shí)別人類(lèi)語(yǔ)音。語(yǔ)音服務(wù)130還可包含自然語(yǔ)言理解(nlu)功能性,其基于通過(guò)語(yǔ)音識(shí)別部件識(shí)別的用戶語(yǔ)音來(lái)確定用戶意圖。語(yǔ)音服務(wù)130還可包含語(yǔ)音生成功能性,其合成或以其它方式產(chǎn)生語(yǔ)音音頻。例如,語(yǔ)音生成功能性可包括文本到語(yǔ)音部件,其產(chǎn)生語(yǔ)音以在語(yǔ)音接口裝置102的揚(yáng)聲器112上播放。

控制服務(wù)108還可提供對(duì)話管理部件132,其經(jīng)配置以結(jié)合語(yǔ)音服務(wù)130來(lái)協(xié)調(diào)與用戶106的語(yǔ)音對(duì)話或交互??墒褂谜Z(yǔ)音對(duì)話以通過(guò)使用語(yǔ)音提示向用戶詢問(wèn)信息來(lái)確定或弄清用戶意圖。

控制服務(wù)108還可包括命令解釋器與動(dòng)作調(diào)度器134(下文簡(jiǎn)稱(chēng)為命令解釋器134),其確定對(duì)應(yīng)于通過(guò)用戶語(yǔ)音表達(dá)的意圖的功能或命令。在一些情況下,命令可對(duì)應(yīng)于將至少部分通過(guò)語(yǔ)音接口裝置102執(zhí)行的功能,且在那些情況下,命令解釋器134可將裝置命令或指令提供到語(yǔ)音接口裝置102以用于實(shí)施此類(lèi)功能。命令解釋器134實(shí)施結(jié)合語(yǔ)音接口裝置102來(lái)使用的基礎(chǔ)“內(nèi)置”能力。此類(lèi)基礎(chǔ)能力可默認(rèn)地被實(shí)施和啟用用于所有語(yǔ)音接口裝置102的用戶?;A(chǔ)能力的實(shí)例可包括設(shè)定警告或通知,增加/降低揚(yáng)聲器112的音量,通過(guò)揚(yáng)聲器112生成可聽(tīng)語(yǔ)音,啟動(dòng)與類(lèi)似裝置的用戶的某些類(lèi)型的通信等等。

控制服務(wù)108還可具有一個(gè)或多個(gè)用戶安裝的應(yīng)用136或還可經(jīng)配置以使用一個(gè)或多個(gè)用戶安裝的應(yīng)用,所述應(yīng)用還可被描述為售后應(yīng)用、第三方應(yīng)用、可選應(yīng)用、啟用應(yīng)用、服務(wù)器應(yīng)用等等。諸如此應(yīng)用等的應(yīng)用可為可選的,且可由用戶106從可用可安裝應(yīng)用的庫(kù)或其它集合獲得。在一些情況下,用戶可購(gòu)買(mǎi)應(yīng)用以用于與系統(tǒng)100結(jié)合使用。一般地,服務(wù)器應(yīng)用可由用戶以與裝置應(yīng)用124相同的方式選定、獲得并安裝。

除由命令解釋器134提供的基礎(chǔ)功能性外,用戶安裝的應(yīng)用136還提供補(bǔ)充的和/或另外的功能性和能力。響應(yīng)于啟用或授權(quán)的用戶安裝的應(yīng)用136應(yīng)用能夠服務(wù)的所識(shí)別的用戶意圖,可自動(dòng)地調(diào)用所述應(yīng)用。

在某些情況下,用戶安裝的服務(wù)器應(yīng)用136可由控制服務(wù)108提供并托管。替代地,某些服務(wù)器應(yīng)用136可由第三方或第三方服務(wù)提供和/或托管,且可使用基于網(wǎng)絡(luò)的接口來(lái)與控制服務(wù)108通信。

控制服務(wù)108還可具有應(yīng)用選擇部件138,其在本文中也被稱(chēng)為意圖路由器138,其基于所識(shí)別的通過(guò)用戶語(yǔ)音表達(dá)的意圖來(lái)選擇并調(diào)用應(yīng)用。例如,服務(wù)器應(yīng)用136中的每一個(gè)可與應(yīng)用能夠?qū)ζ渥龀鲰憫?yīng)的一個(gè)或多個(gè)意圖相關(guān)聯(lián)。響應(yīng)于所識(shí)別的不可由命令解釋器134服務(wù)的用戶意圖,應(yīng)用選擇器138可選擇并調(diào)用控制服務(wù)108的服務(wù)器應(yīng)用136中的一個(gè)。在一些情況下,應(yīng)用選擇器138還可從語(yǔ)音接口裝置的經(jīng)安裝的裝置應(yīng)用124中進(jìn)行選擇。

響應(yīng)于從所接收的音頻識(shí)別的語(yǔ)音,控制服務(wù)108還可執(zhí)行涉及圖1中未示出的實(shí)體或裝置的功能。例如,控制服務(wù)108可與其它基于網(wǎng)絡(luò)的服務(wù)交互以代表用戶106獲得信息或服務(wù)。

圖2說(shuō)明在某些實(shí)施方案中可如何獲得并使用可安裝的基于語(yǔ)音的應(yīng)用的實(shí)例。如上文所描述,語(yǔ)音接口裝置102可具有多個(gè)用戶安裝的裝置應(yīng)用124,且控制服務(wù)108也可具有多個(gè)用戶安裝的服務(wù)器應(yīng)用136。經(jīng)安裝的應(yīng)用124和136可響應(yīng)于用戶請(qǐng)求而從可用可安裝應(yīng)用202的集合獲得并安裝。可用應(yīng)用202可包括可選的并補(bǔ)充由系統(tǒng)100提供的功能性或添加另外的功能性的應(yīng)用??捎脩?yīng)用202可由控制服務(wù)108的操作人員提供,或可由第三方實(shí)體設(shè)計(jì)并提供。

某些可用應(yīng)用202可由網(wǎng)絡(luò)服務(wù)器或服務(wù)來(lái)托管并從網(wǎng)絡(luò)服務(wù)器或服務(wù)執(zhí)行,且可通過(guò)適當(dāng)?shù)木W(wǎng)絡(luò)應(yīng)用編程接口(api)來(lái)訪問(wèn)。其它可用應(yīng)用202可經(jīng)設(shè)計(jì)用于在控制服務(wù)108的服務(wù)器或處理器上執(zhí)行。經(jīng)安裝的服務(wù)器應(yīng)用136可包含通過(guò)控制服務(wù)108執(zhí)行的那些應(yīng)用,以及在控制服務(wù)108的監(jiān)督下通過(guò)第三方服務(wù)托管的那些應(yīng)用。再其它可用應(yīng)用202可經(jīng)設(shè)計(jì)用于安裝在語(yǔ)音接口裝置102上并通過(guò)所述語(yǔ)音接口裝置執(zhí)行。經(jīng)安裝的裝置應(yīng)用124包含諸如此應(yīng)用的應(yīng)用。

如上文參考圖1所提及,控制服務(wù)108可具有自動(dòng)語(yǔ)音識(shí)別(asr)部件204和自然語(yǔ)言理解(nlu)部件206。對(duì)話管理部件132經(jīng)配置以基于如通過(guò)語(yǔ)音識(shí)別部件204所識(shí)別和/或通過(guò)自然語(yǔ)言理解部件206所理解的語(yǔ)音來(lái)協(xié)調(diào)與用戶106的對(duì)話或交互。控制服務(wù)108還可具有文本到語(yǔ)音部件208,其響應(yīng)于對(duì)話管理部件132以生成語(yǔ)音以用于在語(yǔ)音接口裝置102上對(duì)用戶106重放。

上文描述的部件可基于不同類(lèi)型的模型或規(guī)則來(lái)起作用。例如,asr部件204可使其功能性基于asr模型210,所述asr模型可包含借助于各種訓(xùn)練技術(shù)產(chǎn)生的聲學(xué)模型。類(lèi)似地,nlu部件206可利用nlu模型212,所述nlu模型指定語(yǔ)法、詞匯、短語(yǔ)、響應(yīng)等等,且還可通過(guò)訓(xùn)練產(chǎn)生。對(duì)話管理部件132可利用對(duì)話模型214,其指定用于與用戶進(jìn)行對(duì)話的邏輯。對(duì)話包括用戶106的自然語(yǔ)言語(yǔ)句或話語(yǔ)與系統(tǒng)生成的語(yǔ)音或文本響應(yīng)的交替序列。對(duì)話模型214體現(xiàn)用于進(jìn)行以下操作的邏輯:基于所接收的用戶語(yǔ)句來(lái)產(chǎn)生響應(yīng),以便提示用戶106關(guān)于意圖的更詳細(xì)信息或從用戶106獲得其它信息。

響應(yīng)于通過(guò)nlu部件206識(shí)別的用戶意圖,應(yīng)用選擇部件或意圖路由器138識(shí)別、選擇和/或調(diào)用經(jīng)安裝的裝置應(yīng)用124和/或經(jīng)安裝的服務(wù)器應(yīng)用136。響應(yīng)于所確定的用戶意圖,意圖路由器138嘗試識(shí)別經(jīng)安裝的應(yīng)用124和136中的能夠服務(wù)于用戶意圖的一個(gè)應(yīng)用。如果找到此類(lèi)應(yīng)用,那么調(diào)用(called)或調(diào)用(invoked)此應(yīng)用以滿足用戶意圖或與用戶進(jìn)行另外的對(duì)話以另外細(xì)化用戶意圖。

經(jīng)安裝的應(yīng)用124和136中的每一個(gè)可具有或提供意圖規(guī)范,其界定所述應(yīng)用可服務(wù)的意圖。通過(guò)意圖規(guī)范指示的意圖可在本文中被稱(chēng)為應(yīng)用意圖或稱(chēng)為應(yīng)用的可服務(wù)意圖。經(jīng)安裝的應(yīng)用的意圖規(guī)范界定可通過(guò)所述應(yīng)用服務(wù)的一般意圖或意圖類(lèi)型??刂品?wù)108使用經(jīng)安裝的應(yīng)用的意圖規(guī)范來(lái)檢測(cè)對(duì)應(yīng)于應(yīng)用124和136的用戶話語(yǔ)、表達(dá)或意圖。

應(yīng)用意圖規(guī)范可包含nlu模型,以供自然語(yǔ)言理解部件206結(jié)合nlu模型212使用。在一些情況下,nlu模型212可包含或并入有通過(guò)經(jīng)安裝的應(yīng)用124和136指定的nlu模型。

經(jīng)安裝的應(yīng)用124和136還可具有或指定產(chǎn)生并協(xié)調(diào)與用戶106的語(yǔ)音交互的對(duì)話模型。所述對(duì)話模型可通過(guò)對(duì)話管理部件132結(jié)合對(duì)話模型214來(lái)使用以產(chǎn)生并協(xié)調(diào)與用戶106的對(duì)話,并在經(jīng)安裝的應(yīng)用124和136的操作之前或期間確定用戶意圖。在一些情況下,對(duì)話模型214可包含或并入有通過(guò)經(jīng)安裝的應(yīng)用124和136指定的對(duì)話模型。

控制服務(wù)108可具有或顯露應(yīng)用編程接口,且某些應(yīng)用124和136可通過(guò)api及控制服務(wù)108來(lái)注冊(cè)。特定應(yīng)用的注冊(cè)可指示或提供對(duì)應(yīng)的意圖規(guī)范以供控制服務(wù)108使用。應(yīng)用開(kāi)發(fā)者可通過(guò)api提供其應(yīng)用的注冊(cè),使得應(yīng)用124和136可結(jié)合控制服務(wù)108來(lái)使用。

在一些實(shí)施方案中,nlu部件206和對(duì)話管理部件132可經(jīng)配置以使用應(yīng)用124和136的意圖規(guī)范來(lái)進(jìn)行對(duì)話,以識(shí)別用戶所表達(dá)的意圖,且以識(shí)別對(duì)應(yīng)于用戶所表達(dá)的意圖或能夠服務(wù)于所述意圖的經(jīng)安裝的應(yīng)用。

應(yīng)用的意圖規(guī)范可在應(yīng)用的操作之前或期間使用。在一些情況下,例如,在啟動(dòng)或調(diào)用應(yīng)用之前,當(dāng)確定一般用戶意圖時(shí),對(duì)話管理部件132可利用意圖規(guī)范。更具體地說(shuō),nlu部件206和對(duì)話管理部件132可使用應(yīng)用的意圖規(guī)范,結(jié)合nlu模型212和對(duì)話模型214來(lái)確定用戶何時(shí)表達(dá)可由所述應(yīng)用服務(wù)的意圖。隨后,nlu部件206和對(duì)話管理部件132可使用意圖規(guī)范來(lái)與用戶106進(jìn)行另外的對(duì)話,以便另外細(xì)化用戶意圖。替代地,應(yīng)用本身可利用控制服務(wù)108的能力來(lái)與用戶106進(jìn)行另外對(duì)話,以細(xì)化用戶意圖,以便提供相關(guān)聯(lián)的功能性。

作為實(shí)例,響應(yīng)于用戶話語(yǔ),控制服務(wù)108可參考多個(gè)應(yīng)用的意圖規(guī)范,包含裝置應(yīng)用124和服務(wù)器應(yīng)用136的意圖規(guī)范,以將已被注冊(cè)的“購(gòu)票”意圖識(shí)別為應(yīng)用中的一個(gè)的可服務(wù)意圖。服務(wù)108隨后可調(diào)用對(duì)應(yīng)的應(yīng)用。在被調(diào)用后,所述應(yīng)用可接收所確定的意圖的指示,且可進(jìn)行或協(xié)調(diào)與用戶106的另外對(duì)話,以便得出另外的意圖細(xì)節(jié)。在確定關(guān)于用戶意圖的足夠細(xì)節(jié)后,應(yīng)用可執(zhí)行其經(jīng)設(shè)計(jì)的功能性以履行意圖。

當(dāng)與用戶106進(jìn)行對(duì)話時(shí),經(jīng)安裝的應(yīng)用可利用控制服務(wù)108的語(yǔ)音相關(guān)的能力,例如asr部件204、nlu部件206、對(duì)話管理部件132以及文本到語(yǔ)音部件208的那些能力。

作為另一實(shí)例,用戶可陳述不可由當(dāng)前可用于用戶的任何應(yīng)用服務(wù)的意圖。例如,用戶可陳述“我想打出租車(chē)”。盡管用戶當(dāng)前已安裝或激活的應(yīng)用都不能服務(wù)于此意圖,但控制服務(wù)108可搜索可用應(yīng)用202的列表或市場(chǎng),以識(shí)別已指定匹配的或?qū)?yīng)的可服務(wù)意圖的應(yīng)用。在一些情況下,控制服務(wù)108隨后可自動(dòng)地安裝或啟用所識(shí)別的應(yīng)用。在其它情況下,控制服務(wù)108可提示用戶購(gòu)買(mǎi)或激活應(yīng)用,且隨后啟動(dòng)或調(diào)用應(yīng)用。當(dāng)安裝應(yīng)用202中的一個(gè)時(shí),應(yīng)用可安裝在語(yǔ)音接口裝置102上或安裝在控制服務(wù)108上。

當(dāng)應(yīng)用已被調(diào)用或啟動(dòng)時(shí),可在已啟動(dòng)的應(yīng)用的控制下執(zhí)行與用戶的另外語(yǔ)音交互,所述已啟動(dòng)的應(yīng)用可根據(jù)應(yīng)用的活動(dòng)領(lǐng)域,使用特定于所述應(yīng)用及其領(lǐng)域的nlu模型來(lái)解釋用戶語(yǔ)句。例如,應(yīng)用可根據(jù)所述應(yīng)用經(jīng)設(shè)計(jì)以執(zhí)行的功能來(lái)與用戶進(jìn)行對(duì)話。在檢測(cè)到與應(yīng)用的活動(dòng)領(lǐng)域不相符的用戶語(yǔ)句或意圖后,應(yīng)用可自終止且控制可返回到控制服務(wù)108。在一些情況下,控制服務(wù)108可在經(jīng)安裝的應(yīng)用的執(zhí)行期間繼續(xù)監(jiān)視用戶語(yǔ)句,且可在檢測(cè)到用戶的與應(yīng)用的活動(dòng)領(lǐng)域不相符的表達(dá)或意圖后預(yù)先制止應(yīng)用。

圖3說(shuō)明可在系統(tǒng)100中通過(guò)語(yǔ)音接口裝置102和控制服務(wù)108實(shí)施的邏輯部件和功能性。圖3說(shuō)明的配置允許可安裝應(yīng)用位于語(yǔ)音接口裝置102或控制服務(wù)108處且從所述語(yǔ)音接口裝置或控制服務(wù)執(zhí)行。應(yīng)注意,盡管某些功能性說(shuō)明為通過(guò)離散的部件實(shí)施,但此類(lèi)功能性可通過(guò)在語(yǔ)音接口裝置102和控制服務(wù)108中的任一個(gè)或每一個(gè)內(nèi)的硬件和/或軟件的不同組合來(lái)實(shí)施。

語(yǔ)音接口裝置102具有音頻捕獲功能或部件302,其使用麥克風(fēng)110從環(huán)境104捕獲音頻。音頻捕獲部件302產(chǎn)生音頻信號(hào)304并將音頻信號(hào)304提供到控制服務(wù)108。音頻信號(hào)304可能地包含用戶話語(yǔ),包含用戶106的語(yǔ)音。

asr部件204接收音頻信號(hào)304并執(zhí)行語(yǔ)音識(shí)別以產(chǎn)生含有用戶106說(shuō)出的自然語(yǔ)言的文本串306。文本串306被提供到nlu部件206,所述nlu部件使用自然語(yǔ)言理解技術(shù)來(lái)確定文本串306的文字所表達(dá)的意圖308。

控制服務(wù)108可具有如上文所描述的多個(gè)經(jīng)安裝的服務(wù)器應(yīng)用136,其已被用戶選定并啟用以用于在控制服務(wù)108的一個(gè)或多個(gè)服務(wù)器計(jì)算機(jī)上執(zhí)行。語(yǔ)音接口裝置102還可具有多個(gè)經(jīng)安裝的裝置應(yīng)用124,其已被用戶選定并啟用以用于在語(yǔ)音接口裝置102上執(zhí)行。經(jīng)安裝的應(yīng)用124和136可執(zhí)行不同的功能或提供涉及不同的活動(dòng)或內(nèi)容領(lǐng)域的不同服務(wù)。例如,一個(gè)應(yīng)用可涉及音樂(lè)領(lǐng)域,且可具有用于查找并播放音樂(lè)的功能性。另一應(yīng)用可對(duì)應(yīng)于通知領(lǐng)域且可具有用于設(shè)定并發(fā)出告警或警告的功能性。應(yīng)用可以是語(yǔ)音啟用的,意味著所述應(yīng)用經(jīng)配置以通過(guò)語(yǔ)音與用戶交互以提供所需功能性。應(yīng)用中的每一個(gè)可對(duì)應(yīng)于所述應(yīng)用能夠滿足或服務(wù)的一個(gè)或多個(gè)可服務(wù)意圖。

控制服務(wù)108可經(jīng)配置以跟蹤哪些服務(wù)器應(yīng)用136已被安裝或啟用以用于多個(gè)語(yǔ)音接口裝置102中的每一個(gè)??刂品?wù)108還可經(jīng)配置以跟蹤哪些裝置應(yīng)用124已在多個(gè)語(yǔ)音接口裝置102中的每一個(gè)上被安裝和啟用。另外,控制服務(wù)108可經(jīng)配置以跟蹤每一經(jīng)安裝或啟用的應(yīng)用能夠?qū)ζ渥龀鲰憫?yīng)或另外處理的意圖。

在識(shí)別出意圖308后,應(yīng)用選擇器或意圖路由器138識(shí)別并選擇裝置應(yīng)用124中的一個(gè)或服務(wù)器應(yīng)用136中的一個(gè)。意圖路由器138將所識(shí)別的意圖308的指示或描述提供到選定應(yīng)用,并調(diào)用選定應(yīng)用或造成選定應(yīng)用的調(diào)用。選定應(yīng)用的調(diào)用可以編程方式實(shí)現(xiàn),和/或通過(guò)對(duì)所述應(yīng)用或?qū)φZ(yǔ)音接口裝置102的適當(dāng)api調(diào)用來(lái)實(shí)現(xiàn)。

當(dāng)選定應(yīng)用124或136中的一個(gè)時(shí),選定應(yīng)用通過(guò)執(zhí)行對(duì)應(yīng)的動(dòng)作來(lái)對(duì)所提供的意圖做出響應(yīng)。當(dāng)選定服務(wù)器應(yīng)用136中的一個(gè)時(shí),可完全通過(guò)應(yīng)用136來(lái)執(zhí)行動(dòng)作,或應(yīng)用136可將命令310發(fā)送到語(yǔ)音接口裝置102的動(dòng)作處理器312以使得語(yǔ)音接口裝置102執(zhí)行所述動(dòng)作或所述動(dòng)作的一部分。例如,應(yīng)用136可針對(duì)語(yǔ)音接口裝置102發(fā)送命令以播放某一音調(diào),以增加揚(yáng)聲器音量,以播放語(yǔ)音或以執(zhí)行某一其它動(dòng)作。

當(dāng)選定裝置應(yīng)用124中的一個(gè)時(shí),意圖路由器可將命令發(fā)送到語(yǔ)音接口裝置102,所述命令指定將被調(diào)用的應(yīng)用和所述應(yīng)用將對(duì)其做出響應(yīng)的意圖。在一些情況下,應(yīng)用可通過(guò)應(yīng)用標(biāo)識(shí)符(appid)指定。作為響應(yīng),語(yǔ)音接口裝置102的操作軟件122可以編程方式調(diào)用經(jīng)指定的裝置應(yīng)用124。選定裝置應(yīng)用可通過(guò)使用經(jīng)集成的語(yǔ)音接口裝置102的能力和/或由控制服務(wù)108提供的能力來(lái)對(duì)指定意圖做出響應(yīng)。例如,經(jīng)選定并調(diào)用的裝置應(yīng)用124可利用控制服務(wù)108的語(yǔ)音服務(wù),包含asr和nlu服務(wù),以便與用戶106進(jìn)行交互和對(duì)話。選定裝置應(yīng)用124還可使用其它在線服務(wù)或結(jié)合其它在線服務(wù)來(lái)作用,所述在線服務(wù)諸如音樂(lè)服務(wù)、新聞服務(wù)、在線商家、各種類(lèi)型的服務(wù)提供商等等。

圖4說(shuō)明可在系統(tǒng)100中通過(guò)語(yǔ)音接口裝置102和控制服務(wù)108實(shí)施的部件和功能性的替代配置。圖4說(shuō)明的配置類(lèi)似于圖3所說(shuō)明的配置,除添加應(yīng)用選擇部件或意圖路由器402以作為語(yǔ)音接口裝置102的部分外。在此實(shí)例中,控制服務(wù)108的意圖路由器138響應(yīng)于意圖而不選擇裝置應(yīng)用124中的一個(gè)。相反,意圖308的指示被傳遞到語(yǔ)音接口裝置102的意圖路由器402,且所述意圖路由器402基于意圖的性質(zhì)來(lái)選擇適當(dāng)?shù)膽?yīng)用。

在此實(shí)例中,控制服務(wù)108的意圖路由器138可首先嘗試識(shí)別并調(diào)用服務(wù)器應(yīng)用136中的適合于對(duì)所確定的意圖308做出響應(yīng)的一個(gè)服務(wù)器應(yīng)用。如果不能找到此類(lèi)應(yīng)用,那么將意圖308傳遞到語(yǔ)音接口裝置的意圖路由器402,所述意圖路由器嘗試識(shí)別并調(diào)用裝置應(yīng)用124中的能夠服務(wù)于所識(shí)別的意圖的一個(gè)裝置應(yīng)用。在一些實(shí)施方案中,控制服務(wù)108的意圖路由器138可經(jīng)配置以跟蹤哪些裝置應(yīng)用124安裝在語(yǔ)音接口102上,且可僅當(dāng)裝置應(yīng)用124中的一個(gè)能夠?qū)σ鈭D做出響應(yīng)時(shí),才將意圖308傳遞到語(yǔ)音接口裝置102。

應(yīng)注意,盡管已在基于語(yǔ)音的上下文中描述某些技術(shù),但可以不同于語(yǔ)音的方式(諸如以文本方式)提供或進(jìn)行用戶輸入和對(duì)話。例如,用戶可通過(guò)使用鍵盤(pán)鍵入自然語(yǔ)言語(yǔ)句來(lái)指定意圖,且服務(wù)可通過(guò)顯示響應(yīng)文本來(lái)做出響應(yīng)。對(duì)話可使用此類(lèi)雙向文本交流來(lái)進(jìn)行。另外,可在其它環(huán)境或配置中使用不同于本文中描述的架構(gòu)的架構(gòu)。例如,說(shuō)明為通過(guò)語(yǔ)音接口裝置執(zhí)行的功能可通過(guò)計(jì)算裝置來(lái)執(zhí)行,諸如個(gè)人計(jì)算機(jī)、智能手機(jī)、平板計(jì)算機(jī)或任何其它類(lèi)型的裝置。

特定的可執(zhí)行應(yīng)用可經(jīng)設(shè)計(jì)用于在語(yǔ)音接口裝置102或控制服務(wù)108上安裝并執(zhí)行。在其中裝置可能能夠提供更多資源和/或更低時(shí)延的某些情況下,在語(yǔ)音接口裝置102上執(zhí)行應(yīng)用可為所期望的。另外,安裝在語(yǔ)音接口裝置上的應(yīng)用可能能夠在網(wǎng)絡(luò)不可用的時(shí)段期間繼續(xù)提供某些功能,諸如本地控制功能。家庭自動(dòng)化是可期望將應(yīng)用安裝在語(yǔ)音接口裝置102上的實(shí)例環(huán)境。

在其中語(yǔ)音接口裝置102對(duì)于大量使用語(yǔ)音服務(wù)的應(yīng)用、對(duì)于主要利用網(wǎng)絡(luò)資源的功能和/或在其它情況下具有有限的功能的情況下,在控制服務(wù)108上執(zhí)行應(yīng)用可為所期望的。

在一些情況下,應(yīng)用可經(jīng)設(shè)計(jì)以在語(yǔ)音接口裝置102和控制服務(wù)108中的一個(gè)上執(zhí)行,或可實(shí)施為適合于在各自的實(shí)體上執(zhí)行的兩個(gè)起類(lèi)似作用的版本。在這些情況下,可要求用戶指定應(yīng)用是應(yīng)被安裝在語(yǔ)音接口裝置102上還是應(yīng)被安裝在控制服務(wù)108上。替代地,系統(tǒng)100可評(píng)估其它因素且可確定安裝應(yīng)用的地方。在一些情況下,應(yīng)用可安裝在語(yǔ)音接口裝置102和控制服務(wù)108兩者上,且可取決于各種情況在不同位置上執(zhí)行。此外,在一些情況下,不同的應(yīng)用可安裝在語(yǔ)音接口裝置102和控制服務(wù)108中的每一個(gè)上以用于處理同一意圖,且系統(tǒng)100可基于情形或其它因素來(lái)確定調(diào)用所述應(yīng)用中的哪個(gè)。

圖5說(shuō)明在諸如上文所描述的系統(tǒng)等基于語(yǔ)音或基于語(yǔ)言的系統(tǒng)中選擇并調(diào)用用戶安裝的應(yīng)用的實(shí)例方法500。在所描述的實(shí)施方案中,系統(tǒng)包含本地語(yǔ)音接口裝置,以及經(jīng)配置以實(shí)施控制服務(wù)的一個(gè)或多個(gè)遠(yuǎn)程服務(wù)器計(jì)算機(jī)。用戶安裝的應(yīng)用可包含服務(wù)器應(yīng)用,其已被用戶選定并啟用以用于在一個(gè)或多個(gè)服務(wù)器計(jì)算機(jī)上執(zhí)行以結(jié)合語(yǔ)音接口裝置來(lái)操作。用戶安裝的應(yīng)用還可包含裝置應(yīng)用,其已被用戶選定并啟用以用于在語(yǔ)音接口裝置上執(zhí)行。在一些情況下,啟用應(yīng)用可通過(guò)以下操作執(zhí)行:將待安裝的應(yīng)用安裝或引導(dǎo)在裝置存儲(chǔ)器、計(jì)算機(jī)服務(wù)器存儲(chǔ)器或與裝置或計(jì)算機(jī)服務(wù)器相關(guān)聯(lián)或可由裝置或計(jì)算機(jī)服務(wù)器訪問(wèn)的其它存儲(chǔ)器中。術(shù)語(yǔ)“用戶安裝的”用于指示應(yīng)用已被系統(tǒng)的用戶明確地選定且被啟用或安裝以用于執(zhí)行。圖5的動(dòng)作被描述為通過(guò)系統(tǒng)100的控制服務(wù)108執(zhí)行,但方法500還可在其它環(huán)境中執(zhí)行。

動(dòng)作502包括接收指示或表達(dá)對(duì)應(yīng)的用戶意圖的用戶語(yǔ)音和/或用戶話語(yǔ)。動(dòng)作502可包括從語(yǔ)音接口裝置102接收音頻,所述音頻可含有用戶語(yǔ)音。語(yǔ)音接口裝置102可將連續(xù)的音頻流提供到控制服務(wù)108,或可提供含有個(gè)別的用戶話語(yǔ)的音頻段。

動(dòng)作504包括對(duì)所接收的用戶語(yǔ)音執(zhí)行語(yǔ)音處理,以確定通過(guò)用戶語(yǔ)音表達(dá)的意圖。動(dòng)作504可包含對(duì)所接收的用戶語(yǔ)音執(zhí)行自動(dòng)語(yǔ)音識(shí)別(asr)和自然語(yǔ)言理解(nlu),以確定通過(guò)用戶語(yǔ)音或話語(yǔ)表達(dá)的意圖。動(dòng)作504還可包含執(zhí)行與用戶的雙向語(yǔ)音對(duì)話,以提示用戶另外的信息且由此弄清用戶意圖的元素或角色。

動(dòng)作506包括識(shí)別和/或選擇服務(wù)器應(yīng)用136中的或裝置應(yīng)用124中的對(duì)應(yīng)于通過(guò)用戶話語(yǔ)表達(dá)的意圖中的一個(gè)服務(wù)器應(yīng)用或裝置應(yīng)用。應(yīng)用可通過(guò)確定哪一個(gè)應(yīng)用具有與用戶的所表達(dá)意圖匹配的相關(guān)聯(lián)的可服務(wù)意圖來(lái)選定。

另外的動(dòng)作取決于所識(shí)別和/或選定的應(yīng)用是裝置應(yīng)用124中的一個(gè)還是服務(wù)器應(yīng)用136中的一個(gè),如通過(guò)圖5的判定框508指示。如果所識(shí)別的應(yīng)用是裝置應(yīng)用124中的一個(gè),那么控制服務(wù)108執(zhí)行將意圖的指示提供到語(yǔ)音接口裝置102的動(dòng)作510。語(yǔ)音接口裝置102響應(yīng)于所接收的意圖的指示來(lái)調(diào)用裝置應(yīng)用124中的執(zhí)行對(duì)應(yīng)于意圖的動(dòng)作的一個(gè)裝置應(yīng)用。在一些情況下,控制服務(wù)108還可執(zhí)行明確地指定將使用哪一個(gè)裝置應(yīng)用124來(lái)對(duì)用戶意圖做出響應(yīng)(諸如具體地說(shuō)通過(guò)應(yīng)用標(biāo)識(shí)符)的動(dòng)作512。語(yǔ)音接口裝置102通過(guò)調(diào)用指定的應(yīng)用124來(lái)對(duì)此指定做出響應(yīng),所述應(yīng)用轉(zhuǎn)而通過(guò)執(zhí)行對(duì)應(yīng)于用戶意圖的動(dòng)作來(lái)做出響應(yīng)。在一些情況下,經(jīng)調(diào)用的裝置應(yīng)用還可通過(guò)以下操作做出響應(yīng):向控制服務(wù)108或意圖路由器138確認(rèn)裝置應(yīng)用已響應(yīng)于所提供的意圖采取動(dòng)作或裝置應(yīng)用能夠?qū)λ峁┑囊鈭D做出響應(yīng)。

如果所識(shí)別的應(yīng)用是服務(wù)器應(yīng)用136中的一個(gè),那么執(zhí)行啟動(dòng)或調(diào)用所識(shí)別的服務(wù)器應(yīng)用136的動(dòng)作514,并執(zhí)行將所確定的用戶意圖的指示提供到經(jīng)調(diào)用的服務(wù)器應(yīng)用136的動(dòng)作516。經(jīng)調(diào)用的應(yīng)用136可通過(guò)執(zhí)行對(duì)應(yīng)于用戶意圖的動(dòng)作來(lái)做出響應(yīng)。在一些情況下,經(jīng)調(diào)用的服務(wù)器應(yīng)用還可通過(guò)以下操作做出響應(yīng):向控制服務(wù)108或意圖路由器138確認(rèn)服務(wù)器應(yīng)用已響應(yīng)于所提供的意圖采取動(dòng)作或服務(wù)器應(yīng)用能夠?qū)λ峁┑囊鈭D做出響應(yīng)。

應(yīng)注意,在一些實(shí)施方案中,意圖路由器138可經(jīng)配置以響應(yīng)于特定意圖而調(diào)用裝置應(yīng)用124和服務(wù)器應(yīng)用136兩者,且以將意圖的指示提供到兩個(gè)應(yīng)用。兩個(gè)經(jīng)調(diào)用的應(yīng)用中的任一個(gè)或兩個(gè)可提供指示響應(yīng)于第一意圖所述應(yīng)用具有或?qū)?zhí)行動(dòng)作的響應(yīng)。當(dāng)意圖路由器從應(yīng)用中的一個(gè)接收響應(yīng)時(shí),可終止或取消其它應(yīng)用,或指示應(yīng)用取消任何另外的處理。例如,裝置可提供響應(yīng)于意圖所述裝置的應(yīng)用中的一個(gè)將執(zhí)行動(dòng)作的響應(yīng),且意圖路由器可做出響應(yīng)以取消先前已被調(diào)用以處理意圖的服務(wù)器應(yīng)用。替代地,服務(wù)器應(yīng)用可提供指示響應(yīng)于意圖所述服務(wù)器應(yīng)用將執(zhí)行動(dòng)作的響應(yīng),且意圖路由器可做出響應(yīng)以指示裝置取消裝置應(yīng)用。在一些情況下,此技術(shù)可用于減少響應(yīng)時(shí)延。

方法500可迭代地執(zhí)行以處理連續(xù)的用戶話語(yǔ)和意圖。例如,控制服務(wù)108可接收對(duì)應(yīng)于第一和第二用戶意圖的連續(xù)的第一和第二用戶話語(yǔ)。響應(yīng)于第一用戶意圖,控制服務(wù)108可識(shí)別、選擇服務(wù)器應(yīng)用并使得調(diào)用服務(wù)器應(yīng)用,且還可將第一用戶意圖的指示提供到服務(wù)器應(yīng)用。響應(yīng)于第二用戶意圖,控制服務(wù)108可識(shí)別、選擇裝置應(yīng)用并使得調(diào)用裝置應(yīng)用,且可將第二用戶意圖的指示提供到裝置和/或裝置應(yīng)用。替代地,響應(yīng)于第二用戶意圖,控制服務(wù)108可簡(jiǎn)單地將第二用戶意圖的指示傳遞到語(yǔ)音接口裝置,且語(yǔ)音接口裝置本身可從其用戶安裝的裝置應(yīng)用選擇并調(diào)用應(yīng)用,以對(duì)第二用戶意圖做出響應(yīng)。

在一些實(shí)施中,控制服務(wù)108可首先嘗試確定服務(wù)器應(yīng)用中的一個(gè)是否能夠?qū)μ囟ㄓ脩粢鈭D做出響應(yīng)。如果是,那么調(diào)用所述服務(wù)器應(yīng)用以對(duì)用戶意圖做出響應(yīng)。否則,將用戶意圖的指示提供到語(yǔ)音接口裝置,且語(yǔ)音接口裝置識(shí)別、選擇并調(diào)用其裝置應(yīng)用中的一個(gè)以對(duì)用戶意圖做出響應(yīng)。

圖6示出可通過(guò)語(yǔ)音接口裝置102結(jié)合圖5的方法來(lái)執(zhí)行的方法600。盡管方法600參考上文描述的系統(tǒng)來(lái)描述,但方法600還可在其它環(huán)境中并結(jié)合其它類(lèi)型的裝置來(lái)實(shí)施。

動(dòng)作602包括捕獲音頻并將音頻提供到控制服務(wù)108。音頻可含有用戶語(yǔ)音或話語(yǔ)。音頻所含有的話語(yǔ)可表達(dá)或?qū)?yīng)于可由先前已被選定和啟用以用于通過(guò)語(yǔ)音接口裝置102或控制服務(wù)108執(zhí)行的應(yīng)用服務(wù)的用戶意圖。

動(dòng)作604包括響應(yīng)于將用戶語(yǔ)音提供到控制服務(wù)108,接收通過(guò)用戶語(yǔ)音表達(dá)的意圖的指示。在一些情況下,動(dòng)作604還包括接收響應(yīng)于用戶意圖將被調(diào)用的裝置應(yīng)用的指定。裝置應(yīng)用可依據(jù)應(yīng)用標(biāo)識(shí)符(id)來(lái)指定。

動(dòng)作606包括識(shí)別對(duì)應(yīng)于通過(guò)動(dòng)作604指示的用戶意圖的應(yīng)用。在控制服務(wù)108已明確地指定應(yīng)用或應(yīng)用id的情況下,此動(dòng)作可包括簡(jiǎn)單地識(shí)別通過(guò)控制服務(wù)108指定的應(yīng)用。在控制服務(wù)108尚未指定特定裝置應(yīng)用124的其它情況下,動(dòng)作606可包括將所接收的意圖與當(dāng)前安裝的裝置應(yīng)用能夠?qū)ζ渥龀鲰憫?yīng)的意圖進(jìn)行比較,并選擇裝置應(yīng)用中的能夠?qū)νㄟ^(guò)控制服務(wù)108指示的意圖做出響應(yīng)的一個(gè)裝置應(yīng)用。

動(dòng)作608包括啟動(dòng)或調(diào)用選定應(yīng)用。動(dòng)作610可包括將從控制服務(wù)108接收的意圖提供到經(jīng)調(diào)用的應(yīng)用。通過(guò)經(jīng)調(diào)用的應(yīng)用執(zhí)行的動(dòng)作612包括執(zhí)行對(duì)應(yīng)于通過(guò)用戶語(yǔ)音表達(dá)的意圖的動(dòng)作。在一些情況下,應(yīng)用可與用戶進(jìn)行另外的對(duì)話,且可接收另外的語(yǔ)音以便確定應(yīng)執(zhí)行的一個(gè)或多個(gè)動(dòng)作。

盡管已用特定于結(jié)構(gòu)特征的語(yǔ)言描述主題,但應(yīng)理解在所附權(quán)利要求中界定的主題未必限于所描述的特定特征。相反,公開(kāi)特定特征以作為實(shí)施權(quán)利要求的說(shuō)明性形式。

條款

1.一種系統(tǒng),其包括:

一個(gè)或多個(gè)服務(wù)器計(jì)算機(jī);

一個(gè)或多個(gè)服務(wù)器應(yīng)用,其已被用戶選定并啟用以用于在所述一個(gè)或多個(gè)服務(wù)器計(jì)算機(jī)上執(zhí)行,其中所述一個(gè)或多個(gè)經(jīng)選定并啟用的服務(wù)器應(yīng)用結(jié)合位于所述用戶的處所中的語(yǔ)音接口裝置來(lái)操作,以為所述用戶提供服務(wù);

語(yǔ)音處理部件,其經(jīng)配置以從所述語(yǔ)音接口裝置接收第一和第二話語(yǔ),其中所述第一和第二話語(yǔ)分別表達(dá)第一和第二用戶意圖,所述語(yǔ)音處理部件另外經(jīng)配置以對(duì)所述第一和第二話語(yǔ)執(zhí)行自動(dòng)語(yǔ)音識(shí)別和自然語(yǔ)言理解以確定所述第一和第二用戶意圖;

意圖路由器,其經(jīng)配置以執(zhí)行包括以下各項(xiàng)的行動(dòng):

識(shí)別所述一個(gè)或多個(gè)服務(wù)器應(yīng)用中的對(duì)應(yīng)于所述第一用戶意圖的服務(wù)器應(yīng)用;

調(diào)用所述所識(shí)別的服務(wù)器應(yīng)用以執(zhí)行對(duì)應(yīng)于所述第一用戶意圖的第一動(dòng)作;以及

將所述第二用戶意圖的指示提供到所述語(yǔ)音接口裝置,其中所述語(yǔ)音接口裝置響應(yīng)于所述第二用戶意圖以執(zhí)行對(duì)應(yīng)于所述第二用戶意圖的第二動(dòng)作。

2.根據(jù)條款1所述的系統(tǒng),其中:

所述語(yǔ)音接口裝置具有一個(gè)或多個(gè)裝置應(yīng)用,所述裝置應(yīng)用被用戶選定并啟用以用于在所述語(yǔ)音接口裝置上執(zhí)行;以及

所述語(yǔ)音接口裝置經(jīng)配置以(a)識(shí)別所述一個(gè)或多個(gè)裝置應(yīng)用中的對(duì)應(yīng)于所述第二用戶意圖的裝置應(yīng)用,以及(b)調(diào)用所述所識(shí)別的裝置應(yīng)用以執(zhí)行所述第二動(dòng)作。

3.根據(jù)條款1所述的系統(tǒng),其中:

所述語(yǔ)音接口裝置具有一個(gè)或多個(gè)裝置應(yīng)用,所述裝置應(yīng)用被用戶選定并啟用以用于在所述語(yǔ)音接口裝置上執(zhí)行;以及

所述行動(dòng)另外包括(a)識(shí)別所述一個(gè)或多個(gè)裝置應(yīng)用中的對(duì)應(yīng)于所述第二用戶意圖的裝置應(yīng)用,以及(b)使得所述所識(shí)別的裝置應(yīng)用被調(diào)用以執(zhí)行所述第二動(dòng)作。

4.根據(jù)條款1所述的系統(tǒng),其中:

所述語(yǔ)音接口裝置具有一個(gè)或多個(gè)裝置應(yīng)用,所述裝置應(yīng)用被用戶選定并啟用以用于在所述語(yǔ)音接口裝置上執(zhí)行;以及

所述行動(dòng)另外包括(a)確定所述一個(gè)或多個(gè)裝置應(yīng)用中的至少一個(gè)對(duì)應(yīng)于所述第二用戶意圖,以及(b)將所述第二用戶意圖的所述指示提供到所述語(yǔ)音接口裝置。

5.根據(jù)條款1所述的系統(tǒng),其中:

所述語(yǔ)音接口裝置具有一個(gè)或多個(gè)裝置應(yīng)用,所述裝置應(yīng)用被用戶選定并啟用以用于在所述語(yǔ)音接口裝置上執(zhí)行;以及

響應(yīng)于一個(gè)或多個(gè)用戶請(qǐng)求,所述一個(gè)或多個(gè)服務(wù)器應(yīng)用和所述一個(gè)或多個(gè)裝置應(yīng)用從可用應(yīng)用的集合獲得。

6.一種方法,其包括:

從語(yǔ)音接口裝置接收第一用戶語(yǔ)音,其中所述第一用戶語(yǔ)音指示第一意圖;

對(duì)所述第一用戶語(yǔ)音執(zhí)行自然語(yǔ)言理解以確定所述第一意圖;

使得第一應(yīng)用對(duì)所述第一意圖做出響應(yīng);

從所述語(yǔ)音接口裝置接收第二用戶語(yǔ)音,其中所述第二用戶語(yǔ)音指示第二意圖;

對(duì)所述第二用戶語(yǔ)音執(zhí)行自然語(yǔ)言理解以確定所述第二意圖;以及

將所述第二意圖的指示提供到所述語(yǔ)音接口裝置。

7.根據(jù)條款6所述的方法,其中所述第一應(yīng)用已被用戶選定并啟用以用于在一個(gè)或多個(gè)服務(wù)器計(jì)算機(jī)上執(zhí)行。

8.根據(jù)條款6所述的方法,其中所述語(yǔ)音接口裝置響應(yīng)于所述第二意圖的所述指示以執(zhí)行對(duì)應(yīng)于所述第二意圖的動(dòng)作。

9.根據(jù)條款6所述的方法,其中所述語(yǔ)音接口裝置響應(yīng)于所述第二意圖的所述指示以:

識(shí)別對(duì)應(yīng)于所述第二意圖的第二應(yīng)用,其中所述第二應(yīng)用已被用戶選定并啟用以用于在語(yǔ)音接口裝置上執(zhí)行;以及

調(diào)用所述第二應(yīng)用以執(zhí)行對(duì)應(yīng)于所述第二意圖的動(dòng)作。

10.根據(jù)條款6所述的方法,其另外包括:

識(shí)別對(duì)應(yīng)于所述第二意圖的第二應(yīng)用,其中所述第二應(yīng)用已被用戶選定并啟用以用于在語(yǔ)音接口裝置上執(zhí)行;以及

使得所述第二應(yīng)用對(duì)所述第二意圖做出響應(yīng)。

11.根據(jù)條款6所述的方法,其另外包括與用戶進(jìn)行自然語(yǔ)言對(duì)話以接收所述第一和第二用戶語(yǔ)音。

12.根據(jù)條款6所述的方法,其中響應(yīng)于確定第二應(yīng)用在所述語(yǔ)音接口裝置上可用以用于對(duì)所述第二意圖做出響應(yīng),執(zhí)行將所述第二意圖的所述指示提供到所述語(yǔ)音接口裝置。

13.根據(jù)條款6所述的方法,其中所述第一應(yīng)用已被用戶選定并啟用以用于在一個(gè)或多個(gè)服務(wù)器計(jì)算機(jī)上執(zhí)行,并且其中響應(yīng)于確定所述用戶尚未選定并啟用用于對(duì)所述第二意圖做出響應(yīng)的應(yīng)用以用于在所述一個(gè)或多個(gè)服務(wù)器計(jì)算機(jī)上執(zhí)行,執(zhí)行將所述第二意圖的所述指示提供到所述語(yǔ)音接口裝置。

14.一種方法,其包括:

確定裝置的用戶所表達(dá)的第一意圖;

識(shí)別對(duì)應(yīng)于所述第一意圖的第一應(yīng)用,其中所述第一應(yīng)用已被用戶選定并啟用以用于在一個(gè)或多個(gè)服務(wù)器計(jì)算機(jī)上執(zhí)行;

調(diào)用所述第一應(yīng)用以對(duì)所述第一意圖做出響應(yīng);

確定所述裝置的所述用戶所表達(dá)的第二意圖;以及

將所述第二意圖的指示提供到所述裝置并使得所述裝置調(diào)用第二應(yīng)用以對(duì)所述第二意圖做出響應(yīng),其中所述第二應(yīng)用已被所述用戶選定并啟用以用于在所述裝置上執(zhí)行。

15.根據(jù)條款14所述的方法,其另外包括將所述第一意圖的指示提供到所述裝置以用于調(diào)用第三應(yīng)用以對(duì)所述第一意圖做出響應(yīng)。

16.根據(jù)條款14所述的方法,其另外包括:

將所述第一意圖的指示提供到所述裝置以用于調(diào)用第三應(yīng)用以對(duì)所述第一意圖做出響應(yīng);

從所述裝置接收確認(rèn):所述裝置將響應(yīng)于所述第一意圖執(zhí)行動(dòng)作,或所述裝置已響應(yīng)于所述第一意圖執(zhí)行動(dòng)作;以及

響應(yīng)于接收到所述確認(rèn),指示所述第一應(yīng)用取消對(duì)所述第一意圖做出響應(yīng)。

17.根據(jù)條款14所述的方法,其另外包括:

將所述第一意圖的指示提供到所述裝置以用于調(diào)用第三應(yīng)用以對(duì)所述第一意圖做出響應(yīng);

從所述第一應(yīng)用接收確認(rèn):所述第一應(yīng)用將響應(yīng)于所述第一意圖執(zhí)行動(dòng)作,或所述第一應(yīng)用已響應(yīng)于所述第一意圖執(zhí)行動(dòng)作;以及

響應(yīng)于接收到所述確認(rèn),指示所述第三應(yīng)用取消對(duì)所述第一意圖做出響應(yīng)。

18.根據(jù)條款14所述的方法,其中所述裝置包括位于所述用戶的家中的語(yǔ)音接口。

19.根據(jù)條款14所述的方法,其另外包括通過(guò)所述裝置與所述用戶進(jìn)行自然語(yǔ)言對(duì)話以確定所述第一和第二意圖。

20.根據(jù)條款14所述的方法,其中所述第一應(yīng)用經(jīng)配置以通過(guò)將一個(gè)或多個(gè)指令發(fā)送到所述裝置來(lái)對(duì)所述第一意圖做出響應(yīng)。

21.根據(jù)條款14所述的方法,其另外包括從多個(gè)應(yīng)用識(shí)別已被所述用戶選定并啟用以用于在所述一個(gè)或多個(gè)服務(wù)器計(jì)算機(jī)上執(zhí)行的所述第一應(yīng)用。

22.根據(jù)條款14所述的方法,其另外包括從多個(gè)應(yīng)用識(shí)別已被所述用戶安裝以用于在所述裝置上執(zhí)行的所述第二應(yīng)用。

23.根據(jù)條款14所述的方法,其中所述裝置響應(yīng)于所述第二意圖的所述指示,以從多個(gè)應(yīng)用識(shí)別已被所述用戶安裝以用于在所述裝置上執(zhí)行的所述第二應(yīng)用。

24.根據(jù)條款14所述的方法,其中響應(yīng)于確定應(yīng)用被安置在所述裝置上以用于對(duì)所述第二意圖做出響應(yīng),執(zhí)行將所述第二意圖的所述指示提供到裝置。

25.根據(jù)條款14所述的方法,其中響應(yīng)于確定所述用戶尚未選定并啟用用于對(duì)所述第二意圖做出響應(yīng)的服務(wù)器應(yīng)用以用于在所述一個(gè)或多個(gè)服務(wù)器計(jì)算機(jī)上執(zhí)行,執(zhí)行將所述第二意圖的所述指示提供到所述裝置。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
绩溪县| 建德市| 宝坻区| 凌海市| 兴义市| 襄垣县| 炉霍县| 酉阳| 安图县| 屏东县| 尚志市| 增城市| 武威市| 彰化市| 印江| 谷城县| 海南省| 自治县| 灵武市| 盐山县| 株洲市| 连山| 墨竹工卡县| 巴楚县| 汝城县| 淄博市| 承德市| 宜都市| 临潭县| 西昌市| 苏尼特右旗| 大宁县| 河西区| 偏关县| 汾阳市| 游戏| 金塔县| 贵定县| 囊谦县| 晋州市| 荥阳市|