欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

數(shù)字助理的語(yǔ)音觸發(fā)器的制造方法

文檔序號(hào):9252474閱讀:479來(lái)源:國(guó)知局
數(shù)字助理的語(yǔ)音觸發(fā)器的制造方法
【專利說(shuō)明】數(shù)字助理的語(yǔ)音觸發(fā)器
[0001]相關(guān)申請(qǐng)的交叉引用
[0002]本申請(qǐng)要求于2013年2月7日提交的名稱為“VOICE TRIGGER FOR A DIGITALASSISTANT”的美國(guó)臨時(shí)申請(qǐng)61/762,260的權(quán)益,該申請(qǐng)?zhí)卮巳囊砸梅绞讲⑷胍杂糜谒心康摹?br>技術(shù)領(lǐng)域
[0003]本發(fā)明所公開(kāi)的具體實(shí)施整體涉及數(shù)字助理,并且更具體地涉及一種用于數(shù)字助理的語(yǔ)音觸發(fā)器的方法和系統(tǒng)。
【背景技術(shù)】
[0004]近來(lái),基于語(yǔ)音的數(shù)字助理諸如蘋果的SIRI已被引入市場(chǎng)來(lái)處理各種任務(wù)諸如網(wǎng)頁(yè)搜索和導(dǎo)航。這種基于語(yǔ)音的數(shù)字助理的一個(gè)優(yōu)點(diǎn)在于用戶能夠以免持方式與設(shè)備進(jìn)行交互,而無(wú)需觸摸乃至查看設(shè)備。免持操作在人無(wú)法或不能物理地操縱設(shè)備的情況下,諸如在他們正在開(kāi)車的情況下,可以是尤其有利的。然而,為了啟動(dòng)基于語(yǔ)音的助理,用戶通常必須在觸摸屏上按下按鈕或選擇圖標(biāo)。這一觸覺(jué)輸入有損于免持體驗(yàn)。因此,提供一種使用語(yǔ)音輸入或信號(hào)而非觸覺(jué)輸入來(lái)啟用基于語(yǔ)音的數(shù)字助理(或其他基于語(yǔ)音的服務(wù))的方法和系統(tǒng)將是有利的。
[0005]使用語(yǔ)音輸入來(lái)啟用基于語(yǔ)音的助理需要監(jiān)測(cè)音頻通道以檢測(cè)語(yǔ)音輸入。該監(jiān)測(cè)消耗電力,而電力是手持式設(shè)備或便攜式設(shè)備上的有限資源,該手持式設(shè)備或便攜式設(shè)備依靠于電池并且此類基于語(yǔ)音的數(shù)字助理常常運(yùn)行于其上。因此,提供一種可用于啟動(dòng)設(shè)備上基于語(yǔ)音的服務(wù)的高能效語(yǔ)音觸發(fā)器將是有利的。

【發(fā)明內(nèi)容】

[0006]因此,需要可在不過(guò)度消耗有限電力資源的情況下提供“隨時(shí)監(jiān)聽(tīng)”語(yǔ)音觸發(fā)功能性的低功率語(yǔ)音觸發(fā)器。下述的具體實(shí)施提供用于使用位于電子設(shè)備上的語(yǔ)音觸發(fā)器來(lái)啟動(dòng)基于語(yǔ)音的助理的系統(tǒng)和方法。與基于語(yǔ)音的數(shù)字助理(或其他基于語(yǔ)音的服務(wù),諸如語(yǔ)音轉(zhuǎn)文字轉(zhuǎn)錄服務(wù))的交互常常開(kāi)始于用戶按下設(shè)備上的示能表示(例如,按鈕或圖標(biāo))以啟用數(shù)字助理時(shí),之后設(shè)備向用戶提供數(shù)字助理為活動(dòng)的并在監(jiān)聽(tīng)的某一指示,諸如光、聲音(例如,嗶嗶聲)或發(fā)聲輸出(例如,“我能幫你做點(diǎn)什么? ”)。如本文所述,也可將語(yǔ)音觸發(fā)器實(shí)現(xiàn)為使得其響應(yīng)于特定預(yù)先確定的字詞、短語(yǔ)或聲音而啟用,并且無(wú)需用戶的物理交互。例如,用戶能夠通過(guò)敘讀短語(yǔ)“嘿,SIRI”來(lái)啟用IPHONE上的SIRI數(shù)字助理(二者由Apple Inc.,本申請(qǐng)的受讓人提供)。作為響應(yīng),設(shè)備輸出嗶嗶聲、聲音或語(yǔ)音輸出(例如,“我能幫你做點(diǎn)什么? ”)來(lái)向用戶表明監(jiān)聽(tīng)模式是活動(dòng)的。因此,用戶可通過(guò)數(shù)字助理發(fā)起交互,而不必物理地觸摸提供數(shù)字助理功能的設(shè)備。
[0007]一種用于通過(guò)語(yǔ)音觸發(fā)器啟動(dòng)基于語(yǔ)音的服務(wù)的技術(shù)為使基于語(yǔ)音的服務(wù)連續(xù)監(jiān)聽(tīng)預(yù)先確定的觸發(fā)字詞、短語(yǔ)或聲音(其任一種在本文中可稱為“觸發(fā)聲音”)。然而,連續(xù)操作基于語(yǔ)音的服務(wù)(例如,基于語(yǔ)音的數(shù)字助理)需要大量的音頻處理和電池電力。為了降低由提供語(yǔ)音觸發(fā)功能所消耗的功率,可采用幾種技術(shù)。在一些具體實(shí)施中,電子設(shè)備的主處理器(即,“應(yīng)用處理器”)保持在低功率或無(wú)功率狀態(tài),而使用較低功率(例如,因?yàn)樗鼈儾灰蕾囉趹?yīng)用處理器)的一個(gè)或多個(gè)聲音檢測(cè)器保持為活動(dòng)的。(當(dāng)處于低功率或無(wú)功率狀態(tài)時(shí),應(yīng)用處理器或任何其他處理器、程序或模塊可被描述為非活動(dòng)的或處于待機(jī)模式。)例如,即使在應(yīng)用處理器為非活動(dòng)的時(shí),低功率聲音檢測(cè)器也用于監(jiān)測(cè)觸發(fā)聲音的音頻通道。該聲音檢測(cè)器在本文中有時(shí)稱為觸發(fā)聲音檢測(cè)器。在一些具體實(shí)施中,其被配置為檢測(cè)特定聲音、音素和/或字詞。觸發(fā)聲音檢測(cè)器(包括硬件和/或軟件部件)被設(shè)計(jì)成識(shí)別特定字詞、聲音或短語(yǔ),但就需要更大計(jì)算資源和功率資源的任務(wù)而言,通常不能提供完整的語(yǔ)音轉(zhuǎn)文本功能或未針對(duì)該功能進(jìn)行優(yōu)化。因此,在一些具體實(shí)施中,觸發(fā)聲音檢測(cè)器識(shí)別語(yǔ)音輸入是否包括預(yù)定義的模式(例如,匹配字詞“嘿,SIRI”的聲波模式),但其無(wú)法(或未被配置為)將語(yǔ)音輸入轉(zhuǎn)換成文本或識(shí)別大量其他字詞。一旦檢測(cè)到觸發(fā)聲音,則使數(shù)字助理離開(kāi)待機(jī)模式,使得用戶能夠提供語(yǔ)音命令。
[0008]在一些具體實(shí)施中,觸發(fā)聲音檢測(cè)器被配置為檢測(cè)幾種不同的觸發(fā)聲音,諸如一組字詞、詞組、聲音和/或它們的組合。用戶繼而可使用那些聲音中的任一種來(lái)啟動(dòng)基于語(yǔ)音的服務(wù)。例如,語(yǔ)音觸發(fā)器被預(yù)先配置為對(duì)詞組“嘿,SIRI”、“醒來(lái),SIRI”、“調(diào)用我的數(shù)字助理”或“你好,HAL,聽(tīng)到了嗎,HAL ? ”進(jìn)行響應(yīng)。在一些具體實(shí)施中,用戶必須選擇預(yù)先配置的觸發(fā)聲音中的一個(gè)作為唯一的觸發(fā)聲音。在一些具體實(shí)施中,用戶選擇預(yù)先配置的觸發(fā)聲音的子組,使得用戶可利用不同的觸發(fā)聲音來(lái)啟動(dòng)基于語(yǔ)音的服務(wù)。在一些具體實(shí)施中,所有的預(yù)先配置的觸發(fā)聲音均保持為有效觸發(fā)聲音。
[0009]在一些具體實(shí)施中,使用另一聲音檢測(cè)器使得甚至觸發(fā)聲音檢測(cè)器也可在大部分時(shí)間內(nèi)保持在低功率或無(wú)功率模式。例如,使用不同類型的聲音檢測(cè)器(例如,比觸發(fā)聲音檢測(cè)器使用更低功率的聲音檢測(cè)器)來(lái)監(jiān)測(cè)音頻通道以確定聲音輸入是否對(duì)應(yīng)于某一聲音類型?;诼曇舻哪承┛杀孀R(shí)特征將聲音分類成不同“類型”。例如,屬于“人聲”類型的聲音具有一定的頻譜內(nèi)容、周期性、基頻等。其他類型的聲音(例如,口哨聲、拍手聲等)具有不同特征。不同類型的聲音使用本文所述的音頻和/或信號(hào)處理器技術(shù)來(lái)識(shí)別。該聲音檢測(cè)器在本文中有時(shí)稱為“聲音類型檢測(cè)器”。例如,如果預(yù)先確定的觸發(fā)短語(yǔ)為“嘿,SIRI”,則聲音類型檢測(cè)器確定輸入是否有可能對(duì)應(yīng)于人的語(yǔ)音。如果觸發(fā)聲音為非語(yǔ)音聲音,諸如口哨聲,則聲音類型檢測(cè)器確定聲音輸入是否有可能對(duì)應(yīng)于口哨聲。當(dāng)檢測(cè)到適當(dāng)?shù)穆曇纛愋蜁r(shí),聲音類型檢測(cè)器啟動(dòng)觸發(fā)聲音檢測(cè)器以進(jìn)一步處理和/或分析該聲音。并且由于聲音類型檢測(cè)器比觸發(fā)聲音檢測(cè)器需要更少的功率(例如,由于其使用比觸發(fā)聲音檢測(cè)器具有更低功率需求和/或更高效音頻處理算法的電路),因此語(yǔ)音觸發(fā)功能比只用觸發(fā)聲音檢測(cè)器消耗更少的功率。
[0010]在一些具體實(shí)施中,使用另一聲音檢測(cè)器使得上述的聲音類型檢測(cè)器和觸發(fā)聲音檢測(cè)器兩者均可在大部分時(shí)間內(nèi)保持在低功率或無(wú)功率模式。例如,使用比聲音類型檢測(cè)器使用更低功率的聲音檢測(cè)器來(lái)監(jiān)測(cè)音頻通道以確定聲音輸入是否滿足預(yù)先確定的條件,諸如幅值(例如,音量)閾值。該聲音檢測(cè)器在本文中可稱為“噪聲檢測(cè)器”。當(dāng)噪聲檢測(cè)器檢測(cè)到滿足預(yù)先確定閾值的聲音時(shí),噪聲檢測(cè)器啟動(dòng)聲音類型檢測(cè)器以進(jìn)一步處理和/或分析該聲音。并且由于噪聲檢測(cè)器比聲音類型檢測(cè)器或觸發(fā)聲音檢測(cè)器需要更少的功率(例如,由于其使用具有更低功率需求和/或更高效音頻處理算法的電路),因此語(yǔ)音觸發(fā)功能比不使用噪聲檢測(cè)器而使用聲音類型檢測(cè)器和觸發(fā)聲音檢測(cè)器的組合消耗更少的功率。
[0011]在一些具體實(shí)施中,上述聲音檢測(cè)器中的任何一者或多者根據(jù)占空比進(jìn)行操作,其中它們?cè)凇敖油ā焙汀瓣P(guān)斷”狀態(tài)之間循環(huán)。這就進(jìn)一步有助于減少語(yǔ)音觸發(fā)器的功率消耗。例如,在一些具體實(shí)施中,噪聲檢測(cè)器“接通”(即,積極地監(jiān)測(cè)音頻通道)10毫秒,并且在接下來(lái)的90毫秒內(nèi)“關(guān)斷”。這樣,噪聲檢測(cè)器90%的時(shí)間“關(guān)斷”,而同時(shí)仍有效地提供連續(xù)噪聲檢測(cè)功能。在一些具體實(shí)施中,選擇聲音檢測(cè)器的接通和關(guān)斷持續(xù)時(shí)間使得所有的檢測(cè)器在觸發(fā)聲音一直保持輸入的情況下啟用。例如,對(duì)于觸發(fā)短語(yǔ)“嘿,SIRI”,可配置聲音檢測(cè)器使得不管觸發(fā)短語(yǔ)開(kāi)始于一個(gè)或多個(gè)占空比的哪個(gè)位置,觸發(fā)聲音檢測(cè)器都被及時(shí)啟用以分析足夠的輸入量。例如,觸發(fā)聲音檢測(cè)器將被及時(shí)啟用以接收、處理并分析聲音“嘿,SIRI”,這足以確定聲音與觸發(fā)短語(yǔ)匹配。在一些具體實(shí)施中,聲音輸入在被接收并傳送至上游檢測(cè)器時(shí)存儲(chǔ)在存儲(chǔ)器中,使得較大部分的聲音輸入可被分析。因此,即使直到觸發(fā)短語(yǔ)發(fā)出之后觸發(fā)聲音檢測(cè)器才啟動(dòng),其仍可分析整個(gè)已記錄的觸發(fā)短語(yǔ)。
[0012]一些具體實(shí)施提供一種用于操作語(yǔ)音觸發(fā)器的方法。該方法在包括存儲(chǔ)器和一個(gè)或多個(gè)處理器的電子設(shè)備上執(zhí)行,該存儲(chǔ)器存儲(chǔ)由一個(gè)或多個(gè)處理器執(zhí)行的指令。該方法包括接收聲音輸入。該方法還包括確定聲音輸入的至少一部分是否對(duì)應(yīng)于預(yù)先確定的聲音類型。該方法還包括在確定聲音輸入的至少一部分對(duì)應(yīng)于預(yù)先確定的類型時(shí),確定聲音輸入是否包括預(yù)先確定的內(nèi)容。該方法還包括在確定聲音輸入包括預(yù)先確定的內(nèi)容時(shí),啟動(dòng)基于語(yǔ)音的服務(wù)。在一些具體實(shí)施中,基于語(yǔ)音的服務(wù)為基于語(yǔ)音的數(shù)字助理。在一些具體實(shí)施中,基于語(yǔ)音的服務(wù)為聽(tīng)寫服務(wù)。
[0013]在一些具體實(shí)施中,確定聲音輸入是否對(duì)應(yīng)于預(yù)先確定的聲音類型由第一聲音檢測(cè)器執(zhí)行,并且確定聲音輸入是否包括預(yù)先確定的內(nèi)容由第二聲音檢測(cè)器執(zhí)行。在一些具體實(shí)施中,第一聲音檢測(cè)器在操作時(shí)比第二聲音檢測(cè)器消耗更少的功率。在一些具體實(shí)施中,第一聲音檢測(cè)器執(zhí)行聲音輸入的頻域分析。在一些具體實(shí)施中,確定聲音輸入是否對(duì)應(yīng)于預(yù)先確定的聲音類型是在確定聲音輸入滿足預(yù)先確定的條件(例如,由下述的第三聲音檢測(cè)器確定)時(shí)執(zhí)行的。
[0014]在一些具體實(shí)施中,第一聲音檢測(cè)器根據(jù)占空比周期性地監(jiān)測(cè)音頻通道。在一些具體實(shí)施中,占空比包括約20毫秒的接通時(shí)間以及約100毫秒的關(guān)斷時(shí)間。
[0015]在一些具體實(shí)施中,預(yù)先確定的類型為人聲并且預(yù)先確定的內(nèi)容為一個(gè)或多個(gè)字詞。在一些具體實(shí)施中,確定聲音輸入的至少一部分是否對(duì)應(yīng)于預(yù)先確定的聲音類型包括確定聲音輸入的至少一部分是否包括人聲的頻率特征。
[0016]在一些具體實(shí)施中,第二聲音檢測(cè)器是響應(yīng)于第一聲音檢測(cè)器確定聲音輸入對(duì)應(yīng)于預(yù)先確定的類型而啟動(dòng)的。在一些具體實(shí)施中,在第一聲音檢測(cè)器確定聲音輸入對(duì)應(yīng)于預(yù)先確定的類型之后,第二聲音檢測(cè)器操作至少預(yù)先確定的時(shí)間量。在一些具體實(shí)施中,預(yù)先確定的時(shí)間量對(duì)應(yīng)于預(yù)先確定內(nèi)容的持續(xù)時(shí)間。
[0017]在一些具體實(shí)施中,預(yù)先確定的內(nèi)容為一個(gè)或多個(gè)預(yù)先確定的音素。在一些具體實(shí)施中,一個(gè)或多個(gè)預(yù)先確定的音素構(gòu)成至少一個(gè)字詞。
[0018]在一些具體實(shí)施中,該方法包括在確定聲音輸入是否對(duì)應(yīng)于預(yù)先確定的聲音類型之前,確定聲音輸入是否滿足預(yù)先確定的條件。在一些具體實(shí)施中,預(yù)先確定的條件為幅值閾值。在一些具體實(shí)施中,確定聲音輸入是否滿足預(yù)先確定的條件是由第三聲音檢測(cè)器來(lái)執(zhí)行的,其中第三聲音檢測(cè)器在操作時(shí)比第一聲音檢測(cè)器消耗更少的功率。在一些具體實(shí)施中,第三聲音檢測(cè)器根據(jù)占空比周期性地監(jiān)測(cè)音頻通道。在一些具體實(shí)施中,占空比包括約20毫秒的接通時(shí)間以及約500毫秒的關(guān)斷時(shí)間。在一些具體實(shí)施中,第三聲音檢測(cè)器執(zhí)行聲音輸入的時(shí)域分析。
[0019]在一些具體實(shí)施中,該方法包括將聲音輸入的至少一部分存儲(chǔ)在存儲(chǔ)器中,并且一旦基于語(yǔ)音的服務(wù)啟動(dòng),就將聲音輸入的該部分提供至基于語(yǔ)音的服務(wù)。在一些具體實(shí)施中,使用直接存儲(chǔ)器存取將聲音輸入的一部分存儲(chǔ)在存儲(chǔ)器中。
[0020]在一些具體實(shí)施中,該方法包括確定聲音輸入是否對(duì)應(yīng)于特定用戶的語(yǔ)音。在一些具體實(shí)施中,基于語(yǔ)音的服務(wù)是在確定聲音輸入包括預(yù)先確定的內(nèi)容以及聲音輸入對(duì)應(yīng)于特定用戶的語(yǔ)音時(shí)啟動(dòng)的。在一些具體實(shí)施中,基于語(yǔ)音的服務(wù)在確定聲音輸入包括預(yù)先確定的內(nèi)容以及聲音輸入不對(duì)應(yīng)于特定用戶的語(yǔ)音時(shí)在受限訪問(wèn)模式下啟動(dòng)。在一些具體實(shí)施中,該方法包括在確定聲音輸入對(duì)應(yīng)于特定用戶的語(yǔ)音時(shí),輸出包括特定用戶的姓名的語(yǔ)音提示。
[0021]在一些具體實(shí)施中,確定聲音輸入是否包括預(yù)先確定的內(nèi)容包括將聲音輸入的表示與參考表示進(jìn)行比較,以及在聲音輸入的表示與參考表示相匹配的情況下確定聲音輸入是否包括預(yù)先確定的內(nèi)容。在一些具體實(shí)施中,如果聲音輸入的表示以預(yù)先確定的置信度與參考表示匹配,則確定匹配。在一些具體實(shí)施中,該方法包括接收多個(gè)聲音輸入,該多個(gè)聲音輸入包括聲音輸入;以及響應(yīng)于確定相應(yīng)聲音輸入包括預(yù)先確定的內(nèi)容,使用多個(gè)聲音輸入中的相應(yīng)聲音輸入反復(fù)地調(diào)節(jié)參考表示。
[0022]在一些具體實(shí)施中,該方法包括確定電子設(shè)備是否處于預(yù)先確定的取向,以及在確定電子設(shè)備處于預(yù)先確定的取向時(shí),啟用語(yǔ)音觸發(fā)器的預(yù)先確定模式。在一些具體實(shí)施中,預(yù)先確定的取向?qū)?yīng)于設(shè)備的大體上水平且正面朝下的顯示屏,并且預(yù)先確定的模式為待機(jī)模式。在一些具體實(shí)施中,預(yù)先確定的取向?qū)?yīng)于設(shè)備的大體上水平且正面朝上的顯示屏,并且預(yù)先確定的模式為監(jiān)聽(tīng)模式。
[0023]一些具體實(shí)施提供一種用于操作語(yǔ)音觸發(fā)器的方法。該方法在包括存儲(chǔ)器和一個(gè)或多個(gè)處理器的電子設(shè)備上執(zhí)行,該存儲(chǔ)器存儲(chǔ)由一個(gè)或多個(gè)處理器執(zhí)行的指令。該方法包括在第一模式下操作語(yǔ)音觸發(fā)器。該方法還包括通過(guò)檢測(cè)到電子設(shè)備的麥克風(fēng)和相機(jī)中的一者或多者被遮擋來(lái)確定電子設(shè)備是否處于大體上封閉的空間中。該方法還包括在確定電子設(shè)備處于大體上封閉的空間中時(shí),將語(yǔ)音觸發(fā)器切換至第二模式。在一些具體實(shí)施中,第二模式為待機(jī)模式。
[0024]一些具體實(shí)施提供一種用于操作語(yǔ)音觸發(fā)器的方法。該方法在包括存儲(chǔ)器和一個(gè)或多個(gè)處理器的電子設(shè)備上執(zhí)行,該存儲(chǔ)器存儲(chǔ)由一個(gè)或多個(gè)處理器執(zhí)行的指令。該方法包括確定電子設(shè)備是否處于預(yù)先確定的取向,以及在確定電子設(shè)備處于預(yù)先確定的取向時(shí),啟用語(yǔ)音觸發(fā)器的預(yù)先確定模式。在一些具體實(shí)施中,預(yù)先確定的取向?qū)?yīng)于設(shè)備的大體上水平且正面朝下的顯示屏,并且預(yù)先確定的模式為待機(jī)模式。在一些具體實(shí)施中,預(yù)先確定的取向?qū)?yīng)于設(shè)備的大體上水平且正面朝上的顯示屏,并且預(yù)先確定的模式為監(jiān)聽(tīng)模式。
[0025]根據(jù)一些具體實(shí)施,電子設(shè)備包括被配置為接收聲音輸入的聲音接收單元和耦接至聲音接收單元的處理單元。處理單元被配置為確定聲音輸入的至少一部分是否對(duì)應(yīng)于預(yù)先確定的聲音類型;在確定聲音輸入的至少一部分對(duì)應(yīng)于預(yù)先確定的類型時(shí),確定聲音輸入是否包括預(yù)先確定的內(nèi)容;以及在確定聲音輸入包括預(yù)先確定的內(nèi)容時(shí),啟動(dòng)基于語(yǔ)音的服務(wù)。在一些具體實(shí)施中,處理單元被進(jìn)一步配置為在確定聲音輸入是否對(duì)應(yīng)于預(yù)先確定的聲音類型時(shí),確定聲音輸入是否滿足預(yù)先確定的條件。在一些具體實(shí)施中,處理單元被進(jìn)一步配置為確定聲音輸入是否對(duì)應(yīng)于特定用戶的語(yǔ)音。
[0026]根據(jù)一些具體實(shí)施,電子設(shè)備包括被配置為在多個(gè)模式中的第一模式下操作語(yǔ)音觸發(fā)器的語(yǔ)音觸發(fā)單元;以及耦接至語(yǔ)音觸發(fā)單元的處理單元。在一些具體實(shí)施中,處理單元被配置為:通過(guò)檢測(cè)到電子設(shè)備的麥克風(fēng)和相機(jī)中的一者或多者被遮擋來(lái)確定電子設(shè)備是否處于大體上封閉的空間中;并且在確定電子設(shè)備處于大體上封閉的空間中時(shí),將語(yǔ)音觸發(fā)器切換至第二模式。在一些具體實(shí)施中,處理單元被配置為確定電子設(shè)備是否處于預(yù)先確定的取向;以及在確定電子設(shè)備處于預(yù)先確定的取向時(shí),啟用語(yǔ)音觸發(fā)器的預(yù)先確定模式。
[0027]根據(jù)一些具體實(shí)施,提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)(例如,非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)),該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)供電子設(shè)備的一個(gè)或多個(gè)處理器執(zhí)行的一個(gè)或多個(gè)程序,該一個(gè)或多個(gè)程序包括用于執(zhí)行本文所述方法中的任一種方法的指令。
[0028]根據(jù)一些具體實(shí)施,提供一種電子設(shè)備(例如,便攜式電子設(shè)備),其包括用于執(zhí)行本文所述方法中的任一種方法的裝置。
[0029]根據(jù)一些具體實(shí)施,提供一種電子設(shè)備(例如,便攜式電子設(shè)備),其包括被配置為執(zhí)行本文所述方法中的任一種方法的處理單元。
[0030]根據(jù)一些具體實(shí)施,提供一種電子設(shè)備(例如,便攜式電子設(shè)備),其包括存儲(chǔ)器和一個(gè)或多個(gè)處理器,該存儲(chǔ)器存儲(chǔ)供一個(gè)或多個(gè)處理器執(zhí)行的一個(gè)或多個(gè)程序,該一個(gè)或多個(gè)程序包括用于執(zhí)行本文所述方法中的任一種方法的指令。
[0031]根據(jù)一些具體實(shí)施,提供一種用于在電子設(shè)備中使用的信息處理裝置,該信息處理裝置包括用于執(zhí)行本文所述方法中的任一種方法的裝置。
【附圖說(shuō)明】
[0032]圖1為示出根據(jù)一些具體實(shí)施的數(shù)字助理在其中操作的環(huán)境的框圖。
[0033]圖2為示出根據(jù)一些具體實(shí)施的數(shù)字助理客戶端系統(tǒng)的框圖。
[0034]圖3A為示出根據(jù)一些具體實(shí)施的獨(dú)立式數(shù)字助理系統(tǒng)或數(shù)字助理服務(wù)器系統(tǒng)的框圖。
[0035]圖3B為示出根據(jù)一些具體實(shí)施的圖3A中所示的數(shù)字助理的功能的框圖。
[0036]圖3C為示出根據(jù)一些具體實(shí)施的知識(shí)本體的一部分的網(wǎng)絡(luò)圖。
[0037]圖4為示出根據(jù)一些具體實(shí)施的語(yǔ)音觸發(fā)系統(tǒng)的部件的框圖。
[0038]圖5-7為示出根據(jù)一些具體實(shí)施的用于操作語(yǔ)音觸發(fā)系統(tǒng)的方法的流程圖。
[0039]圖8-9為根據(jù)一些實(shí)施例的電子設(shè)備的功能框圖。
[0040]相似的附圖標(biāo)號(hào)是指整個(gè)附圖中的對(duì)應(yīng)部件。
【具體實(shí)施方式】
[0041]圖1為根據(jù)一些具體實(shí)施的數(shù)字助理的操作環(huán)境100的框圖。術(shù)語(yǔ)“數(shù)字助理”、“虛擬助理”、“智能自動(dòng)化助理”、“基于語(yǔ)音的數(shù)字助理”或“自動(dòng)數(shù)字助理”是指解譯口頭和/或文本形式的自然語(yǔ)言輸入以推斷用戶意圖(例如,識(shí)別對(duì)應(yīng)于自然語(yǔ)言輸入的任務(wù)類型)并基于推斷出的用戶意圖來(lái)執(zhí)行動(dòng)作(例如,執(zhí)行對(duì)應(yīng)于所識(shí)別的任務(wù)類型的任務(wù))的任何信息處理系統(tǒng)。例如,為遵照推斷出的用戶意圖來(lái)執(zhí)行動(dòng)作,系統(tǒng)可執(zhí)行以下操作中的一者或多者:通過(guò)設(shè)計(jì)用以實(shí)現(xiàn)所推斷出的用戶意圖的步驟和參數(shù)來(lái)識(shí)別任務(wù)流(例如,識(shí)別任務(wù)類型),將來(lái)自推斷出的用戶意圖的具體要求輸入到任務(wù)流中,通過(guò)調(diào)用程序、方法、服務(wù)、API等來(lái)執(zhí)行任務(wù)流(例如,發(fā)送請(qǐng)求至服務(wù)提供方);以及生成對(duì)用戶的聽(tīng)覺(jué)(例如,語(yǔ)音)和/或視覺(jué)形式的輸出響應(yīng)。
[0042]具體地講,數(shù)字助理系統(tǒng)一旦啟動(dòng),就能夠接受至少部分地為自然語(yǔ)言命令、請(qǐng)求、聲明、講述和/或詢問(wèn)的形式的用戶請(qǐng)求。通常,用戶請(qǐng)求要么尋求數(shù)字助理系統(tǒng)作出信息性回答,要么尋求數(shù)字助理系統(tǒng)執(zhí)行任務(wù)。對(duì)用戶請(qǐng)求的令人滿意的響應(yīng)通常是提供所請(qǐng)求的信息性回答、執(zhí)行所請(qǐng)求的任務(wù)、或這兩者的組合。例如,用戶可向數(shù)字助理系統(tǒng)提出諸如“我現(xiàn)在在哪里? ”之類的問(wèn)題?;谟脩舻漠?dāng)前位置,數(shù)字助理可能回答“你在中央公園西門附近。”用戶還可請(qǐng)求執(zhí)行任務(wù),例如通過(guò)敘述“請(qǐng)邀請(qǐng)我的朋友下周來(lái)參加我女朋友的生日聚會(huì)?!弊鳛轫憫?yīng),數(shù)字助理可通過(guò)生成語(yǔ)音輸出“好的,馬上”來(lái)確認(rèn)請(qǐng)求,并且然后將合適的日歷邀請(qǐng)從用戶的電子郵件地址發(fā)送到用戶的電子通訊錄或聯(lián)系人列表中列出的用戶的每個(gè)朋友。存在與數(shù)字助理進(jìn)行交互以請(qǐng)求信息或執(zhí)行各種任務(wù)的許多其他方法。除了提供口頭應(yīng)答并進(jìn)行程序化動(dòng)作之外,數(shù)字助理還可提供其他視覺(jué)或音頻形式的應(yīng)答(例如,像文本、警報(bào)、音樂(lè)、視頻、動(dòng)畫等)。
[0043]如圖1中所示,在一些具體實(shí)施中,數(shù)字助理系統(tǒng)根據(jù)客戶端-服務(wù)器模型來(lái)實(shí)施。數(shù)字助理系統(tǒng)包括在用戶設(shè)備(例如,104a和104b)上執(zhí)行的客戶端側(cè)部分(例如,102a和102b)(后文稱作“數(shù)字助理(DA)客戶端102”),以及在服務(wù)器系統(tǒng)108上執(zhí)行的服務(wù)器側(cè)部分106 (后文稱作“數(shù)字助理(DA)服務(wù)器106”)。DA客戶端102通過(guò)一個(gè)或多個(gè)網(wǎng)絡(luò)110與DA服務(wù)器106進(jìn)行通信。DA客戶端102提供客戶端側(cè)功能諸如面向用戶的輸入和輸出處理以及與DA服務(wù)器106的通信。DA服務(wù)器106為任意數(shù)量的DA客戶端102提供服務(wù)器側(cè)功能,該任意數(shù)量的DA客戶端102各自位于相應(yīng)的用戶設(shè)備104(也稱作客戶端設(shè)備或電子設(shè)備)上。
[0044]在一些具體實(shí)施中,DA服務(wù)器106包括面向客戶端的I/O接口 112、一個(gè)或多個(gè)處理模塊114、數(shù)據(jù)與模型116、到外部服務(wù)的I/O接口 118、照片與標(biāo)簽數(shù)據(jù)庫(kù)130,以及照片-標(biāo)簽?zāi)K132。面向客戶端的I/O接口促成數(shù)字助理服務(wù)器106的面向客戶端的輸入和輸出處理。一個(gè)或多個(gè)處理模塊114利用數(shù)據(jù)與模型116基于自然語(yǔ)言輸入來(lái)確定用戶的意圖,并基于推斷出的用戶意圖來(lái)進(jìn)行任務(wù)執(zhí)行。照片與標(biāo)簽數(shù)據(jù)庫(kù)130存儲(chǔ)數(shù)字照片的指紋并任選地存儲(chǔ)數(shù)字照片本身,以及與數(shù)字照片相關(guān)聯(lián)的標(biāo)簽。照片-標(biāo)簽?zāi)K132創(chuàng)建標(biāo)簽,存儲(chǔ)與照片相關(guān)聯(lián)的標(biāo)簽和/或指紋,自動(dòng)標(biāo)記照片,并將標(biāo)簽連接到照片中的位置。
[0045]在一些具體實(shí)施中,DA服務(wù)器106通過(guò)一個(gè)或多個(gè)網(wǎng)絡(luò)110與外部服務(wù)120 (例如,一種或多種導(dǎo)航服務(wù)122-1、一種或多種消息型服務(wù)122-2、一種或多種信息服務(wù)
當(dāng)前第1頁(yè)1 2 3 4 5 6 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
土默特右旗| 长汀县| 邵阳市| 钟祥市| 蚌埠市| 晋城| 洛南县| 和政县| 仁化县| 华阴市| 磐石市| 黄山市| 玛沁县| 通山县| 永新县| 郧西县| 南开区| 罗江县| 铁岭市| 宜都市| 古浪县| 大石桥市| 资讯 | 和硕县| 泸西县| 南木林县| 南通市| 河间市| 汽车| 诸城市| 龙江县| 梧州市| 都昌县| 泽普县| 缙云县| 柳州市| 简阳市| 赤水市| 堆龙德庆县| 云龙县| 定远县|