在用戶合理地預(yù)期社交互動(dòng)會(huì)發(fā)生,諸如在街道上走、坐公共交通或在辦公室中工作的情況下,用戶會(huì)戴耳機(jī)來(lái)收聽(tīng)音樂(lè)或其他音頻。然而,耳機(jī)通常使得難以聽(tīng)到除由耳機(jī)輸出的音頻外的周?chē)肼暬蚱渌曇?。?dāng)除用戶外的人正嘗試引起用戶的關(guān)注時(shí),該人除了非常大聲講話、觸碰用戶或做可能不是社會(huì)可接受的一些其他動(dòng)作外別無(wú)他法。即使該人能夠引起該用戶的關(guān)注,在該用戶能夠有效地與該人交互前,該用戶必須移開(kāi)耳機(jī)。
技術(shù)實(shí)現(xiàn)要素:
在一個(gè)示例中,一種方法可以包括由與用戶相關(guān)聯(lián)的計(jì)算設(shè)備輸出第一音頻數(shù)據(jù),用于由音頻輸出設(shè)備以第一音量水平(level)回放;由計(jì)算設(shè)備接收音頻輸入數(shù)據(jù);響應(yīng)于由計(jì)算設(shè)備確定音頻輸入數(shù)據(jù)包括與不同于用戶的實(shí)體相關(guān)聯(lián)的語(yǔ)音,由計(jì)算設(shè)備至少部分基于音頻輸入數(shù)據(jù),確定是否輸出第二音頻數(shù)據(jù)。該方法還可以包括響應(yīng)于確定輸出第二音頻數(shù)據(jù),由計(jì)算設(shè)備確定低于第一音量水平的第二音量水平;以及由與用戶相關(guān)聯(lián)的計(jì)算設(shè)備輸出第二音頻數(shù)據(jù),用于由音頻輸出設(shè)備以第二音量水平回放。
在另一示例中,公開(kāi)了一種與用戶相關(guān)聯(lián)的計(jì)算系統(tǒng),該計(jì)算系統(tǒng)包括:一個(gè)或多個(gè)處理器、以第一音量水平輸出第一音頻數(shù)據(jù)的音頻輸出設(shè)備、接收音頻輸入數(shù)據(jù)的音頻輸入設(shè)備,以及一個(gè)或多個(gè)模塊。所述一個(gè)或多個(gè)模塊可由一個(gè)或多個(gè)處理器操作以響應(yīng)于確定音頻輸入數(shù)據(jù)可以包括與不同于用戶的實(shí)體相關(guān)聯(lián)的語(yǔ)音,確定是否輸出第二音頻數(shù)據(jù),并且響應(yīng)于確定輸出第二音頻數(shù)據(jù),確定低于第一音量水平的第二音量水平,其中,所述音頻輸出設(shè)備被進(jìn)一步配置為以第二音量水平輸出第二音頻數(shù)據(jù)。
在另一示例中,一種編碼有指令的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述指令當(dāng)被執(zhí)行時(shí),使與用戶相關(guān)聯(lián)的計(jì)算設(shè)備的至少一個(gè)處理器輸出第一音頻數(shù)據(jù),用于由音頻輸出設(shè)備以第一音量水平回放;接收音頻輸入數(shù)據(jù);響應(yīng)于確定音頻輸入數(shù)據(jù)包括與不同于用戶的實(shí)體相關(guān)聯(lián)的語(yǔ)音,至少部分基于音頻輸入數(shù)據(jù),確定是否輸出第二音頻數(shù)據(jù)。所述指令還可以使至少一個(gè)處理器響應(yīng)于確定輸出第二音頻數(shù)據(jù):確定低于第一音量水平的第二音量水平;以及輸出第二音頻數(shù)據(jù),用于由音頻輸出設(shè)備以第二音量水平回放。
在附圖和下述說(shuō)明書(shū)中描述一個(gè)或多個(gè)示例的細(xì)節(jié)。從說(shuō)明書(shū)和附圖以及權(quán)利要求,其他特征、目的和優(yōu)點(diǎn)將是顯而易見(jiàn)的。
附圖說(shuō)明
圖1是根據(jù)本公開(kāi)的一個(gè)或多個(gè)方面,圖示出用于基于所檢測(cè)的音頻輸入,動(dòng)態(tài)地變更音頻輸出的示例計(jì)算系統(tǒng)的概念圖。
圖2是根據(jù)本公開(kāi)的一個(gè)或多個(gè)方面,圖示出用于基于所檢測(cè)的音頻輸入,動(dòng)態(tài)地變更音頻輸出的示例計(jì)算設(shè)備的進(jìn)一步細(xì)節(jié)的框圖。
圖3是根據(jù)本公開(kāi)的一個(gè)或多個(gè)方面,圖示出用于基于來(lái)自第二計(jì)算設(shè)備的所檢測(cè)的音頻輸入,在第二計(jì)算設(shè)備處動(dòng)態(tài)地變更音頻輸出的示例計(jì)算設(shè)備的框圖。
圖4是根據(jù)本公開(kāi)的一個(gè)或多個(gè)方面,圖示出用于檢測(cè)談話并且動(dòng)態(tài)地變更音頻數(shù)據(jù)的輸出水平的示例操作的流程圖。
圖5是根據(jù)本公開(kāi)的一個(gè)或多個(gè)方面,圖示出用于確定用戶的談話習(xí)慣的示例操作的流程圖。
具體實(shí)施方式
通常,本公開(kāi)描述了可以使得計(jì)算設(shè)備能夠響應(yīng)于確定不同于計(jì)算設(shè)備的用戶的實(shí)體正嘗試與用戶交流,動(dòng)態(tài)地變更音頻輸出的音量水平的技術(shù)。例如,當(dāng)計(jì)算設(shè)備正輸出音頻數(shù)據(jù)時(shí),該計(jì)算設(shè)備可以檢測(cè)說(shuō)出用戶的姓名,并且作為響應(yīng),可以動(dòng)態(tài)地降低音頻輸出的音量水平或終止輸出音頻。在一些示例中,響應(yīng)于計(jì)算設(shè)備確定談話結(jié)束,計(jì)算設(shè)備可以恢復(fù)音頻輸出的音量水平或繼續(xù)輸出音頻。
通過(guò)自動(dòng)地檢測(cè)實(shí)體正嘗試與用戶交互,本公開(kāi)的技術(shù)可以使得實(shí)體能夠與該實(shí)體可以如何發(fā)起與未戴耳機(jī)的用戶交互類(lèi)似地發(fā)起交互。用戶能注意到音頻輸出的變化,并且認(rèn)識(shí)到不同于該用戶的實(shí)體正嘗試引起他或她的關(guān)注。即,不是要求有人將他/她的話音音量提高到令人不舒服的水平或,以一些方式物理地向用戶告知他/她的存在,本公開(kāi)的技術(shù)可以使得該人引起用戶的關(guān)注,并且使用正常音調(diào)和音量水平開(kāi)始與用戶談話。此外,當(dāng)嘗試與實(shí)體談話或其他社會(huì)交互時(shí),本公開(kāi)的技術(shù)可以不要求用戶移開(kāi)一對(duì)耳機(jī)或手動(dòng)地變更音頻輸出的音量水平。
在整個(gè)本公開(kāi)中,描述了僅當(dāng)計(jì)算設(shè)備從用戶接收允許這樣做的許可時(shí)計(jì)算設(shè)備和/或計(jì)算系統(tǒng)才可以訪問(wèn)和/或分析與計(jì)算設(shè)備相關(guān)聯(lián)的信息(例如執(zhí)行應(yīng)用、位置、速度、日歷、通信、音頻數(shù)據(jù)等)的示例。例如,在下述計(jì)算設(shè)備可以收集或可以利用與用戶相關(guān)聯(lián)的場(chǎng)境信息和/或與計(jì)算設(shè)備相關(guān)聯(lián)的場(chǎng)境信息的情形中,可以為用戶提供機(jī)會(huì)來(lái)提供輸入以控制計(jì)算設(shè)備的程序或特征是否能收集和利用這些信息,或規(guī)定計(jì)算設(shè)備是否可以存儲(chǔ)這些信息和/或存儲(chǔ)多久。此外,如果允許收集任何數(shù)據(jù),在數(shù)據(jù)由計(jì)算設(shè)備和/或計(jì)算系統(tǒng)存儲(chǔ)或使用前,計(jì)算設(shè)備可以以一個(gè)或多個(gè)方式處理某些數(shù)據(jù),使得去除個(gè)人可識(shí)別信息。例如,在獲得用于計(jì)算設(shè)備的位置信息后,可以概括地理位置(諸如到市、ZIP碼或州級(jí)),使得不能確定計(jì)算設(shè)備或用戶的特定位置。由此,用戶有權(quán)控制如何收集有關(guān)用戶的信息和計(jì)算設(shè)備如何使用該信息。
圖1是根據(jù)本公開(kāi)的一個(gè)或多個(gè)方面,圖示出用于檢測(cè)談話音頻輸入,并且作為響應(yīng),變更音頻輸出數(shù)據(jù)的音量輸出水平的示例計(jì)算設(shè)備和音頻輸出設(shè)備的框圖。如圖1的示例中所示,計(jì)算設(shè)備2可以包括輸入/輸出(I/O)模塊4、語(yǔ)音模塊6、數(shù)據(jù)存儲(chǔ)器8、音頻輸出設(shè)備12、音頻輸入設(shè)備15和通信單元22。
計(jì)算設(shè)備2可以包括任意多個(gè)不同的便攜式電子計(jì)算設(shè)備,諸如可穿戴計(jì)算設(shè)備(例如計(jì)算機(jī)化手表、計(jì)算機(jī)化耳機(jī)、計(jì)算機(jī)化耳麥、計(jì)算機(jī)化眼鏡等)、智能手機(jī)、個(gè)人數(shù)字助理(PDA)、手提電腦、便攜式游戲設(shè)備、便攜式媒體播放器、電子書(shū)閱讀器等。計(jì)算設(shè)備2可以包括各種輸入和輸出組件,包括例如一個(gè)或多個(gè)處理器、存儲(chǔ)器、遙測(cè)模塊、蜂窩網(wǎng)絡(luò)天線、顯示器、一個(gè)或多個(gè)UI元件、傳感器和如可充電電池的電源。在圖2中描述計(jì)算設(shè)備2的另外的細(xì)節(jié)。實(shí)現(xiàn)本公開(kāi)的技術(shù)的計(jì)算設(shè)備2的其他示例可以包括圖1中未示出的另外的組件。
通信信道(COMM.CHANNELS)28可以互連組件4、6、8、12、15和/或22互連,用于(物理地、通信地和/或可操作地)組件間通信。在一些示例中,通信信道28可以包括系統(tǒng)總線、網(wǎng)絡(luò)連接、進(jìn)程間通信數(shù)據(jù)結(jié)構(gòu)或用于傳送數(shù)據(jù)的任何其他方法。
在圖1的示例中,一個(gè)或多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備8可操作以存儲(chǔ)用于在計(jì)算設(shè)備2的操作期間處理的信息。例如,計(jì)算設(shè)備2可以存儲(chǔ)在計(jì)算設(shè)備2處執(zhí)行期間模塊4和/或6可以訪問(wèn)的數(shù)據(jù)。在一些示例中,數(shù)據(jù)存儲(chǔ)設(shè)備8表示臨時(shí)存儲(chǔ)器,意指數(shù)據(jù)存儲(chǔ)設(shè)備8的主要目的可以不是長(zhǎng)期存儲(chǔ)。例如,計(jì)算設(shè)備2的數(shù)據(jù)存儲(chǔ)設(shè)備8可以是易失性存儲(chǔ)器,意指如果斷電,數(shù)據(jù)存儲(chǔ)設(shè)備8不保持存儲(chǔ)的內(nèi)容。易失性存儲(chǔ)器的示例包括隨機(jī)存取存儲(chǔ)器(RAM)、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM)、靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)和本領(lǐng)域公知的其他形式的易失性存儲(chǔ)器。
在一些示例中,數(shù)據(jù)存儲(chǔ)設(shè)備8還包括一個(gè)或多個(gè)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。數(shù)據(jù)存儲(chǔ)設(shè)備8可以被配置為存儲(chǔ)比易失性存儲(chǔ)器更大量的信息。數(shù)據(jù)存儲(chǔ)設(shè)備8可以進(jìn)一步被配置為長(zhǎng)期存儲(chǔ)信息。在一些示例中,數(shù)據(jù)存儲(chǔ)設(shè)備8可以包括非易失性存儲(chǔ)元件,意指數(shù)據(jù)存儲(chǔ)設(shè)備8可以在上電/斷電周期保持信息。非易失性存儲(chǔ)器的示例包括磁硬盤(pán)、光盤(pán)、軟盤(pán)、閃存或電編程存儲(chǔ)器(EPROM)或電可擦可編程(EEPROM)存儲(chǔ)器的形式。在一些示例中,諸如程序執(zhí)行期間,數(shù)據(jù)存儲(chǔ)設(shè)備8可以存儲(chǔ)與模塊4和6相關(guān)聯(lián)的程序指令和/或信息(例如數(shù)據(jù))。
在圖1的示例中,一個(gè)或多個(gè)通信單元22可操作以經(jīng)由一個(gè)或多個(gè)有線和/或無(wú)線網(wǎng)絡(luò),通過(guò)在一個(gè)或多個(gè)網(wǎng)絡(luò)上傳送和/或接收網(wǎng)絡(luò)信號(hào),與外部設(shè)備通信。通信單元22的示例可以包括網(wǎng)絡(luò)接口卡(例如,諸如以太網(wǎng)卡)、光收發(fā)器、射頻收發(fā)器、GPS接收機(jī),或能發(fā)送和/或接收信息的任何其他類(lèi)型的設(shè)備。通信單元22的其他示例可以包括近場(chǎng)通信(NFC)單元、藍(lán)牙無(wú)線電、短波無(wú)線電、蜂窩數(shù)據(jù)無(wú)線電、無(wú)線網(wǎng)絡(luò)無(wú)線電以及通用串行總線(USB)控制器。
在圖1的示例中,計(jì)算設(shè)備2可以包括音頻輸出設(shè)備12和音頻輸入設(shè)備15。在一些示例中,音頻輸出設(shè)備12可以是揚(yáng)聲器或揚(yáng)聲器集合。在一些示例中,音頻輸入設(shè)備15可以是麥克風(fēng)。在其他示例中,音頻輸入設(shè)備15可以是送話口、MIDI鍵盤(pán)、骨導(dǎo)傳感器或一些其他數(shù)字儀器。音頻輸出設(shè)備12和音頻輸入設(shè)備15可以經(jīng)由通信信道28,與計(jì)算設(shè)備2的其他組件,諸如模塊4和6、數(shù)據(jù)存儲(chǔ)器8或通信單元22通信。在一些示例中,音頻輸出設(shè)備12和/或音頻輸入設(shè)備15可以與計(jì)算設(shè)備2物理分離并且可以使用有線和/或無(wú)線通信機(jī)制,諸如藍(lán)牙、WiFi、紅外等,可操作地和/或通信地耦接到計(jì)算設(shè)備2。
如圖1所示,計(jì)算設(shè)備2可以包括輸入/輸出(“I/O”)模塊4和語(yǔ)音模塊6。模塊4和6可以使用軟件、硬件、固件或硬件、軟件和駐留在計(jì)算設(shè)備2中并且在其上執(zhí)行的固件的混合,執(zhí)行本文所述的操作。計(jì)算設(shè)備2可以以在底層硬件上執(zhí)行的虛擬機(jī),執(zhí)行模塊4和6??梢砸愿鞣N方式實(shí)現(xiàn)模塊4和6。例如,I/O模塊4和語(yǔ)音模塊6可以實(shí)現(xiàn)為預(yù)安裝的應(yīng)用或“app”。在另一示例中,模塊4和6可以實(shí)現(xiàn)為計(jì)算設(shè)備2的操作系統(tǒng)的一部分。
I/O模塊4可以充當(dāng)計(jì)算設(shè)備2的各個(gè)組件之間的中介并且與計(jì)算設(shè)備2的各個(gè)組件交換信息。例如,計(jì)算設(shè)備2的I/O模塊4可以與計(jì)算設(shè)備2的其他元件,諸如音頻輸入設(shè)備15、音頻輸出設(shè)備12或語(yǔ)音模塊6交換數(shù)據(jù)。
語(yǔ)音模塊6可以處理由計(jì)算系統(tǒng)2接收的音頻輸入數(shù)據(jù)。例如,語(yǔ)音模塊6可以分析音頻輸入數(shù)據(jù)來(lái)確定計(jì)算設(shè)備的用戶是否加入談話或不同于計(jì)算設(shè)備的用戶的實(shí)體是否正嘗試引起用戶關(guān)注。例如,語(yǔ)音模塊6可以確定音頻輸入數(shù)據(jù)是否包括來(lái)自計(jì)算設(shè)備2的用戶或不同于計(jì)算設(shè)備2的用戶的實(shí)體的語(yǔ)音。在一些示例中,語(yǔ)音模塊6可以進(jìn)一步確定音頻輸入數(shù)據(jù)是否包括談話關(guān)鍵字或短語(yǔ),諸如“哈羅”、“嘿”、“嗨”或與用戶相關(guān)聯(lián)的名稱(例如用戶的姓名、昵稱等)。
根據(jù)本公開(kāi)的技術(shù),計(jì)算設(shè)備2可以自動(dòng)地確定計(jì)算設(shè)備2的用戶是否加入與不同于用戶的實(shí)體的談話,或不同于用戶的實(shí)體是否想要引起用戶的關(guān)注,并且可以基于該確定,由計(jì)算設(shè)備2動(dòng)態(tài)地調(diào)整音頻的回放。如一個(gè)示例,在時(shí)刻T1,用戶70正使用計(jì)算設(shè)備2(例如計(jì)算機(jī)化耳機(jī))收聽(tīng)音樂(lè)。計(jì)算設(shè)備2可以輸出音樂(lè)(例如,第一音頻數(shù)據(jù)),用于由音頻輸出設(shè)備12以第一音量水平14A回放。第一音量水平14A可以是用戶70通常收聽(tīng)音樂(lè)的音量水平。音頻數(shù)據(jù)可以存儲(chǔ)在數(shù)據(jù)存儲(chǔ)器8處或可以使用例如通信單元22,從一個(gè)或多個(gè)遠(yuǎn)程服務(wù)器或音樂(lè)服務(wù)流出。在任一實(shí)例中,I/O模塊4可以使用通信信道28或其他有線和/或無(wú)線通信機(jī)制,將音頻數(shù)據(jù)發(fā)送到音頻輸出設(shè)備12,用于以音量水平14A回放。
當(dāng)用戶70正以音量水平14B收聽(tīng)音樂(lè)時(shí),用戶72嘗試引起用戶70的關(guān)注。例如,用戶72會(huì)在時(shí)刻T2說(shuō)“Hey,John!(嘿,約翰!)”(語(yǔ)音74)。盡管描述為用戶72,在其他示例中,用戶72能是不同于用戶70的任何實(shí)體,包括對(duì)講系統(tǒng)、計(jì)算機(jī)化系統(tǒng)、無(wú)線電、機(jī)器人對(duì)象或輸出音頻的任何其他對(duì)象。在一些示例中,音量水平14B可以是與音量水平14A相同的音量水平。
音頻輸入設(shè)備15可以檢測(cè)語(yǔ)音74并且將語(yǔ)音74的指示(例如音頻輸入數(shù)據(jù))提供給I/O模塊4,反過(guò)來(lái),該I/O模塊4可以將音頻輸入數(shù)據(jù)提供給語(yǔ)音模塊6。例如,語(yǔ)音模塊6可以確定音頻輸入數(shù)據(jù)是否包括與不同于用戶70的實(shí)體相關(guān)聯(lián)的語(yǔ)音或與用戶70相關(guān)聯(lián)的語(yǔ)音。響應(yīng)于接收到音頻輸入數(shù)據(jù),語(yǔ)音模塊6可以通過(guò)例如應(yīng)用語(yǔ)音識(shí)別技術(shù)來(lái)確定音頻輸入數(shù)據(jù)是否包括可識(shí)別詞(例如語(yǔ)音),分析音頻輸入數(shù)據(jù)。如果語(yǔ)音模塊6確定音頻輸入數(shù)據(jù)不包括語(yǔ)音,計(jì)算設(shè)備2可以繼續(xù)輸出音頻數(shù)據(jù),用于以音量水平14B由音頻輸出設(shè)備12回放。
在語(yǔ)音模塊6確定音頻輸入數(shù)據(jù)包括語(yǔ)音的示例中,(例如在時(shí)刻T3)計(jì)算設(shè)備2可以動(dòng)態(tài)地調(diào)整由音頻輸出設(shè)備12輸出的音頻。作為一個(gè)示例,I/O模塊4可以終止輸出用于由音頻輸出設(shè)備12回放的音頻數(shù)據(jù)。作為另一示例,I/O模塊4可以降低于用于由音頻輸出設(shè)備12回放的音頻數(shù)據(jù)相關(guān)聯(lián)的音量水平(例如降低至音量水平14C),使得音頻輸出設(shè)備12可以以音量水平14C輸出音頻數(shù)據(jù)。即,計(jì)算設(shè)備2可以響應(yīng)于確定音頻輸入包括語(yǔ)音,動(dòng)態(tài)地停止由音頻輸出設(shè)備12回放音頻數(shù)據(jù)和/或降低由音頻輸出設(shè)備12輸出的音頻數(shù)據(jù)的音量水平。
如果語(yǔ)音模塊6確定語(yǔ)音包含在音頻輸入數(shù)據(jù)中,可以將其指示從語(yǔ)音模塊6發(fā)送到I/O模塊4。在一些示例中,語(yǔ)音74可以使音樂(lè)的音頻輸出的音量降低,使得用戶70以談話的方式應(yīng)答用戶72,與使用戶70試圖在播放音樂(lè)時(shí)講話、手動(dòng)降低音量或不應(yīng)答用戶72完全不同。在I/O模塊4接收語(yǔ)音模塊6確定音頻輸入數(shù)據(jù)包括語(yǔ)音的肯定指示的實(shí)例中,I/O模塊4可以確定是否停止輸出音頻數(shù)據(jù)(例如終止輸出與音樂(lè)相關(guān)聯(lián)的音頻數(shù)據(jù))或確定低于第一音量14B的第二音量14C。如果I/O模塊4確定第二音量14C,那么I/O模塊4可以經(jīng)由通信單元22和通信信道28,輸出第二音頻數(shù)據(jù),用于由音頻輸出設(shè)備12以第二音量14C回放。即,在一些實(shí)例中,I/O模塊4可以響應(yīng)于語(yǔ)音模塊6確定音頻輸入數(shù)據(jù)包括語(yǔ)音,以較低音量水平(例如音量14C)輸出第二音頻數(shù)據(jù)(例如,音樂(lè)的另外的部分)。
在一些示例中,I/O模塊4可以變更第二音頻數(shù)據(jù)的其他特性。例如,I/O模塊4可以變更第二音頻數(shù)據(jù)內(nèi)的聲音的特定頻率的輸出。對(duì)用戶,諸如用戶70來(lái)說(shuō),如果音頻數(shù)據(jù)不包含與語(yǔ)音的頻率類(lèi)似的頻率,更容易聽(tīng)到來(lái)自不同于該用戶的實(shí)體的語(yǔ)音。作為一個(gè)示例,語(yǔ)音模塊6可以測(cè)量音頻輸入數(shù)據(jù)的頻率以及I/O模塊4可以降低與所測(cè)量的音頻輸入類(lèi)似的頻率的音量,所述頻率諸如在所測(cè)量的音頻輸入的50Hz或100Hz內(nèi)的頻率。在另一示例中,語(yǔ)音模塊6可以測(cè)量音頻輸入數(shù)據(jù)的頻率并且I/O模塊4可以終止以類(lèi)似于所測(cè)量的音頻輸入的頻率輸出音頻數(shù)據(jù),所述頻率諸如在所測(cè)量的音頻輸入的50Hz或100Hz內(nèi)的頻率。如另一示例,I/O模塊4可以降低落在平均人類(lèi)說(shuō)出的話音頻率范圍中的所有頻率的音量。如另一示例,I/O模塊4可以終止以落在平均人類(lèi)說(shuō)出的話音頻率范圍中的頻率輸出音頻數(shù)據(jù)。換句話說(shuō),在不同實(shí)例中,I/O模塊4可以使用均衡器來(lái)調(diào)整音頻數(shù)據(jù)的各個(gè)頻率分量之間的平衡。
在一些示例中,計(jì)算設(shè)備2可以確定用戶70和72可以加入談話。響應(yīng)于確定談話結(jié)束,計(jì)算設(shè)備2可以自動(dòng)地恢復(fù)輸出音頻數(shù)據(jù)(例如,在計(jì)算設(shè)備2響應(yīng)于檢測(cè)到語(yǔ)音,終止輸出音頻數(shù)據(jù)的示例中)和/或自動(dòng)地調(diào)整音頻輸出的音量水平(例如,調(diào)整到在計(jì)算設(shè)備2檢測(cè)到語(yǔ)音前輸出音頻的音量水平)。
在整個(gè)本公開(kāi)中,描述了僅當(dāng)計(jì)算設(shè)備從用戶接收允許這樣做的許可時(shí)計(jì)算設(shè)備和/或計(jì)算系統(tǒng)才可以訪問(wèn)和/或分析與計(jì)算設(shè)備相關(guān)聯(lián)的信息(例如執(zhí)行應(yīng)用、位置、速度、日歷、通信、音頻數(shù)據(jù)等)的示例。例如,在下述計(jì)算設(shè)備可以收集或可以利用與用戶相關(guān)聯(lián)的場(chǎng)境信息和/或與計(jì)算設(shè)備相關(guān)聯(lián)的場(chǎng)境信息的情形中,可以為用戶提供機(jī)會(huì)來(lái)提供輸入以控制計(jì)算設(shè)備的程序或特征是否能收集和利用這些信息,或規(guī)定計(jì)算設(shè)備是否可以存儲(chǔ)這些信息和/或存儲(chǔ)多久。此外,如果允許收集任何數(shù)據(jù),在數(shù)據(jù)由計(jì)算設(shè)備和/或計(jì)算系統(tǒng)存儲(chǔ)或使用前,計(jì)算設(shè)備可以以一個(gè)或多個(gè)方式處理某些數(shù)據(jù),使得去除個(gè)人可識(shí)別信息。例如,在獲得用于計(jì)算設(shè)備的位置信息后,可以概括地理位置(諸如到市、ZIP碼或州級(jí)),使得不能確定計(jì)算設(shè)備或用戶的特定位置。由此,用戶有權(quán)控制如何收集有關(guān)用戶的信息和計(jì)算設(shè)備如何使用該信息。
圖2是根據(jù)本公開(kāi)的一個(gè)或多個(gè)方面,圖示出用于基于所檢測(cè)的音頻輸入,動(dòng)態(tài)地變更音頻輸出的示例計(jì)算設(shè)備的進(jìn)一步細(xì)節(jié)的框圖。圖2僅圖示出計(jì)算設(shè)備2的一個(gè)具體示例,以及計(jì)算設(shè)備2的許多其他示例可以在其他實(shí)例中使用并且可以包括在示例計(jì)算設(shè)備2中包括的組件的子集或可以包括圖2中未示出的另外的組件。
計(jì)算設(shè)備2可以包括為清楚起見(jiàn),在圖2中未示出的另外的組件。例如,計(jì)算設(shè)備2可以包括向計(jì)算設(shè)備2的組件供電的電池。類(lèi)似地,圖2中所示的計(jì)算設(shè)備2的組件并非在計(jì)算設(shè)備2的每一示例中均是必要的。例如,在一些配置中,計(jì)算設(shè)備2可以不包括通信單元22。
在圖2的示例中,計(jì)算設(shè)備2可以包括音頻輸出設(shè)備12、音頻輸入設(shè)備15、一個(gè)或多個(gè)處理器20、一個(gè)或多個(gè)輸入設(shè)備24、一個(gè)或多個(gè)通信單元22、一個(gè)或多個(gè)輸出設(shè)備26和一個(gè)或多個(gè)存儲(chǔ)設(shè)備30。計(jì)算設(shè)備2的存儲(chǔ)設(shè)備30還可以包括I/O模塊4、語(yǔ)音模塊6和數(shù)據(jù)存儲(chǔ)器8。語(yǔ)音模塊6可以進(jìn)一步包括語(yǔ)音識(shí)別模塊32、語(yǔ)音處理模塊34和用戶語(yǔ)音模塊36。通信信道28可以互連組件20、22、24、26、12、15、30、4、6、8、32、34和36的每一個(gè),用于(物理地、通信和/或可操作地)組件間通信。在一些示例中,通信信道28可以包括系統(tǒng)總線、網(wǎng)絡(luò)連接、進(jìn)程間通信數(shù)據(jù)結(jié)構(gòu)或用于傳送數(shù)據(jù)的任何其他結(jié)構(gòu)。在圖2的示例中,音頻輸出設(shè)備12、音頻輸入設(shè)備15、I/O模塊4和數(shù)據(jù)存儲(chǔ)器8可以具有與圖1的示例中的相應(yīng)組件類(lèi)似的功能性。
計(jì)算設(shè)備2的一個(gè)或多個(gè)通信單元22可以通過(guò)在一個(gè)或多個(gè)網(wǎng)絡(luò)上傳送和/或接收網(wǎng)絡(luò)信號(hào),經(jīng)由一個(gè)或多個(gè)網(wǎng)絡(luò),與外部設(shè)備通信。例如,計(jì)算設(shè)備2可以使用通信單元22來(lái)在無(wú)線電網(wǎng)絡(luò)諸如蜂窩無(wú)線電網(wǎng)絡(luò)上傳送和/或接收無(wú)線電信號(hào)。同樣地,通信單元22可以在衛(wèi)星網(wǎng)絡(luò)諸如GPS網(wǎng)絡(luò)上傳送和/或接收衛(wèi)星信號(hào)。通信單元22的示例可以包括網(wǎng)絡(luò)接口卡(例如諸如以太網(wǎng)卡)、光收發(fā)器、射頻收發(fā)器、GPS接收機(jī)或可以發(fā)送和/或接收信息的任何其他類(lèi)型的設(shè)備。通信單元22的其他示例可以包括在移動(dòng)設(shè)備中找到的GPS、3G、4G和無(wú)線電以及通用串行總線(USB)控制器。
計(jì)算設(shè)備2的一個(gè)或多個(gè)輸入設(shè)備24可以接收輸入。輸入的示例可以是觸覺(jué)、音頻和視頻輸入。在一個(gè)示例中,計(jì)算設(shè)備2的輸入設(shè)備24可以包括鼠標(biāo)、鍵盤(pán)、話音應(yīng)答系統(tǒng)、攝像機(jī)、麥克風(fēng)、骨導(dǎo)傳感器、傳感器或用于檢測(cè)來(lái)自人或機(jī)器的輸入的任何其他類(lèi)型的設(shè)備。在其他示例中,輸入設(shè)備24可以是按鈕、觸摸屏或一些其他類(lèi)型的輸入。
在一些示例中,輸入設(shè)備24可以是麥克風(fēng)或骨導(dǎo)傳感器,其被配置為檢測(cè)來(lái)自用戶、不同于用戶的實(shí)體或兩者的語(yǔ)音。例如,計(jì)算設(shè)備2能夠通過(guò)輸入設(shè)備24,檢測(cè)來(lái)自用戶(例如用戶70)的語(yǔ)音,其中,來(lái)自該用戶的語(yǔ)音可以是對(duì)與不同于該用戶的實(shí)體相關(guān)聯(lián)的語(yǔ)音的響應(yīng)。
計(jì)算設(shè)備2的一個(gè)或多個(gè)輸出設(shè)備26可以生成輸出。輸出的示例可以是觸覺(jué)、音頻和視頻輸出。在一個(gè)示例中,計(jì)算設(shè)備2的輸出設(shè)備26可以包括存在敏感屏幕、聲卡、視頻圖形適配卡、陰極射線管(CRT)監(jiān)視器、液晶顯示器(LCD)或用于對(duì)人或機(jī)器生成輸出的任何其他類(lèi)型的設(shè)備。輸出設(shè)備26可以包括顯示設(shè)備,諸如陰極射線管(CRT)監(jiān)視器、液晶顯示器(LCD)或用于生成可視輸出的任何其他類(lèi)型的設(shè)備。
作為一個(gè)示例,用戶可以正使用計(jì)算設(shè)備2(例如具有內(nèi)置揚(yáng)聲器的手提電腦)收聽(tīng)播客。計(jì)算設(shè)備2可以輸出播客(例如第一音頻數(shù)據(jù)),用于由音頻輸出設(shè)備12(例如手提電腦揚(yáng)聲器)以第一音量水平14A回放。第一音量水平14A可以是用戶70可以通常收聽(tīng)播客的音量水平。音頻數(shù)據(jù)可以存儲(chǔ)在數(shù)據(jù)存儲(chǔ)器8處或可以使用例如通信單元22,從一個(gè)或多個(gè)遠(yuǎn)程服務(wù)器或音樂(lè)服務(wù)流出。在任一示例中,I/O模塊4可以使用通信信道28或其他有線和/或無(wú)線通信機(jī)制,將音頻數(shù)據(jù)發(fā)送到音頻輸出設(shè)備12,用于以第一音量水平14A回放。
當(dāng)用戶70正以音量水平14B收聽(tīng)播客時(shí),用戶72可能?chē)L試引起用戶70的關(guān)注。例如,用戶72可以在時(shí)刻T2說(shuō)“Hey,John!”(語(yǔ)音74)。盡管示為用戶72,在其他示例中,用戶72能是不同于用戶70的任何實(shí)體,包括對(duì)講系統(tǒng)、計(jì)算機(jī)化系統(tǒng)、無(wú)線電、機(jī)器人對(duì)象或輸出音頻的任何其他對(duì)象。在一些示例中,音量水平14B可以是與音量水平14A相同的音量水平。
音頻輸入設(shè)備15(例如麥克風(fēng))可以檢測(cè)語(yǔ)音74(例如音頻輸入數(shù)據(jù))并且將語(yǔ)音74的指示提供給I/O模塊4,反過(guò)來(lái),該I/O模塊4可以將音頻輸入數(shù)據(jù)提供給語(yǔ)音模塊6。在一些示例中,語(yǔ)音模塊6可以包含多個(gè)不同的模塊以執(zhí)行如參考圖1所述的功能性。例如,語(yǔ)音模塊6可以包含語(yǔ)音識(shí)別模塊32、語(yǔ)音處理模塊34和用戶語(yǔ)音模塊36。在一些示例中,語(yǔ)音識(shí)別模塊32可以從I/O模塊4接收音頻輸入數(shù)據(jù)并且處理該音頻輸入數(shù)據(jù)以確定該音頻輸入數(shù)據(jù)是否包含語(yǔ)音。語(yǔ)音識(shí)別模塊32可以通過(guò)測(cè)量用戶附近的任何環(huán)境噪聲并且檢測(cè)所接收的音頻輸入數(shù)據(jù)中的尖峰信號(hào)來(lái)完成。在本公開(kāi)的示例中,尖峰信號(hào)可以是指在用戶附近的聲波的大小急劇增加后,緊跟著用戶附近的聲波的大小的急劇減小。這些尖峰信號(hào)可以指示音頻輸入數(shù)據(jù)可以包括可以不同于通常環(huán)境噪聲的聲音的指示,諸如語(yǔ)音。例如,本示例中的用戶70具有來(lái)自手提電腦揚(yáng)聲器的環(huán)境噪聲和其他環(huán)境因素。然后,將語(yǔ)音74確定為尖峰信號(hào),因?yàn)樗硎驹谟脩?0附近的聲波的大小急劇增加后,緊跟著用戶70附近的聲波的大小的急劇減小。如果語(yǔ)音識(shí)別模塊32確定存在可以包括語(yǔ)音的尖峰信號(hào),語(yǔ)音識(shí)別模塊32可以將音頻輸入數(shù)據(jù)轉(zhuǎn)發(fā)到語(yǔ)音處理模塊34。
在一些示例中,語(yǔ)音處理模塊34可以確定由語(yǔ)音識(shí)別模塊32確定的尖峰信號(hào)是否包括語(yǔ)音。語(yǔ)音處理模塊34可以確定音頻輸入數(shù)據(jù)中的尖峰信號(hào)是否對(duì)應(yīng)于語(yǔ)音,并且如果是,通過(guò)應(yīng)用語(yǔ)音識(shí)別技術(shù)來(lái)確定音頻輸入數(shù)據(jù)是否包括可識(shí)別的詞,可以確定一個(gè)或多個(gè)詞包括在音頻輸入數(shù)據(jù)中。在一些示例中,語(yǔ)音處理模塊34可以確定語(yǔ)音是否包含談話關(guān)鍵字。談話關(guān)鍵字可以是通常用來(lái)開(kāi)始談話的任何詞。示例能包括詞或短語(yǔ)“hello”、“hey”、“hi”、“howdy”或“you there”,但能基于用戶的文化、語(yǔ)言、俚語(yǔ)或禮節(jié)擴(kuò)展這些關(guān)鍵字。在其他示例中,談話關(guān)鍵字能是用戶的名字與用戶相關(guān)聯(lián)的名稱。在該示例中,語(yǔ)音處理模塊34可以接收語(yǔ)音74中由詞“Hey,John!”組成的音頻輸入數(shù)據(jù),并且確定滿足語(yǔ)音識(shí)別的談話關(guān)鍵字分量。在一些示例中,語(yǔ)音處理模塊34可以進(jìn)一步確定是否以滿足閾值音量值的音量,檢測(cè)到來(lái)自除用戶外的實(shí)體的語(yǔ)音。
如果語(yǔ)音處理模塊34確定語(yǔ)音包含在音頻輸入數(shù)據(jù)中,并且將該指示從語(yǔ)音處理模塊34發(fā)送到I/O模塊4。語(yǔ)音74將使播客的音頻輸出的音量減小,允許用戶70以談話的方式應(yīng)答用戶72,與使用戶70試圖以在播放播客時(shí)講話、手動(dòng)降低音量或根本不應(yīng)答用戶72完全不同。當(dāng)I/O模塊4接收音頻輸入數(shù)據(jù)包含語(yǔ)音的肯定指示時(shí),I/O模塊4確定是否停止輸出音頻數(shù)據(jù)(即停止播客并且完全地終止輸出音頻數(shù)據(jù))或確定比第一音量14B更低的第二音量14C。如果I/O模塊4確定第二音量14C,那么I/O模塊4將經(jīng)由通信單元22和通信信道28,輸出第二音頻數(shù)據(jù),用于由音頻輸出設(shè)備12以第二音量14C回放。
在一些示例中,用戶語(yǔ)音模塊36還能夠處理來(lái)自用戶的語(yǔ)音或?qū)崿F(xiàn)機(jī)器學(xué)習(xí)算法。計(jì)算設(shè)備2可以接收第二音頻輸入數(shù)據(jù),其中,第二音頻輸入是可以與用戶70相關(guān)聯(lián)的語(yǔ)音(例如,用戶在使用計(jì)算設(shè)備2的同時(shí),開(kāi)始說(shuō)話)。計(jì)算設(shè)備2使用用戶語(yǔ)音模塊36,可以測(cè)量來(lái)自用戶的語(yǔ)音的各種語(yǔ)音特性。在一些示例中,語(yǔ)音特性可以是以下中的任何一個(gè):音調(diào)、音量、節(jié)奏、音色、口音、發(fā)音、清晰度、頭部運(yùn)動(dòng)、停頓、上述特性的任何一個(gè)的波動(dòng),或上述特性的任何一個(gè)的組合。計(jì)算設(shè)備2可以存儲(chǔ)所測(cè)量的語(yǔ)音特性。在一些示例中,這些語(yǔ)音特性可以存儲(chǔ)在數(shù)據(jù)存儲(chǔ)器8中。計(jì)算設(shè)備2可以至少部分基于第三音頻輸入數(shù)據(jù)(例如用戶70在使用計(jì)算設(shè)備2的同時(shí)說(shuō)話的另一示例)和存儲(chǔ)的語(yǔ)音特性之間的比較,確定用戶是否正在講話。例如,如果第三音頻輸入具有與由計(jì)算設(shè)備2存儲(chǔ)的語(yǔ)音特性類(lèi)似的音調(diào)、音量、節(jié)奏、音色、口音、發(fā)音、清晰度、頭部運(yùn)動(dòng)、停頓、上述特性的任何一個(gè)的波動(dòng),或上述特性的任何一個(gè)的組合,那么計(jì)算設(shè)備2可以確定用戶正在講話。如果計(jì)算設(shè)備2確定用戶70正在講話,計(jì)算設(shè)備2可以確定是否輸出第三音頻數(shù)據(jù)(例如,用戶目前收聽(tīng)的播客的其他部分)。如果計(jì)算設(shè)備2確定輸出第三音頻數(shù)據(jù),計(jì)算設(shè)備可以確定比第一音量水平更低的第三音量水平。經(jīng)過(guò)一段時(shí)間后,計(jì)算設(shè)備2可以使用用戶語(yǔ)音模塊36來(lái)不斷地細(xì)化所存儲(chǔ)的語(yǔ)音特性以更接近地匹配用戶70的特定語(yǔ)音特性。例如,用戶語(yǔ)音模塊36可以隨時(shí)間收集所存儲(chǔ)的語(yǔ)音特性的不同數(shù)據(jù)點(diǎn)來(lái)追蹤用戶70的語(yǔ)音特性可以如何改變。通過(guò)參考多個(gè)數(shù)據(jù)點(diǎn),用戶語(yǔ)音模塊36在預(yù)測(cè)用戶70是否正在講話方面會(huì)變得更準(zhǔn)確。
用戶語(yǔ)音模塊36還可以匯集來(lái)自多個(gè)輸入設(shè)備的數(shù)據(jù)以確定用戶是否正在講話。例如,用戶語(yǔ)音模塊36可以從I/O模塊4接收不同于用戶70的實(shí)體(例如用戶72)正與用戶70講話的指示。輸入設(shè)備24可以包括計(jì)算設(shè)備2上的傳感器和在音頻輸出設(shè)備12上的耳機(jī)的內(nèi)部的骨導(dǎo)傳感器。音頻輸入設(shè)備15能夠確定與用戶72相關(guān)聯(lián)的語(yǔ)音來(lái)自的方向。傳感器還可以確定用戶70或計(jì)算設(shè)備2目前面對(duì)的方向。用戶語(yǔ)音模塊36可以接收這些方向的指示并且比較它們以查看用戶70(或計(jì)算設(shè)備2)是否正面對(duì)與用戶72相關(guān)聯(lián)的語(yǔ)音的起源點(diǎn)。如果響應(yīng)于來(lái)自用戶72的語(yǔ)音,用戶70正進(jìn)一步講話,骨導(dǎo)傳感器可以從用戶70接收音頻輸入。骨導(dǎo)傳感器可以將該音頻輸入數(shù)據(jù)發(fā)送到I/O模塊4,該I/O模塊4將該音頻輸入數(shù)據(jù)轉(zhuǎn)發(fā)到用戶語(yǔ)音模塊36。用戶語(yǔ)音模塊36可以基于該音頻輸入數(shù)據(jù),確定用戶正在講話。用戶語(yǔ)音模塊36確定用戶70正看向跟與用戶72相關(guān)聯(lián)的語(yǔ)音來(lái)自的方向相同的方向并且確定用戶70正在講話的組合可以指示應(yīng)當(dāng)降低音量水平。用戶語(yǔ)音模塊36可以將該指示發(fā)送到I/O模塊4,其可以降低將回放音頻數(shù)據(jù)的音量水平。
一個(gè)或多個(gè)處理器20可以實(shí)現(xiàn)功能性和/或執(zhí)行計(jì)算設(shè)備2內(nèi)的指令。例如,計(jì)算設(shè)備2上的處理器20可以接收并執(zhí)行由存儲(chǔ)設(shè)備30存儲(chǔ)的、執(zhí)行I/O模塊4、語(yǔ)音模塊6、語(yǔ)音識(shí)別模塊32、語(yǔ)音處理模塊34和用戶語(yǔ)音模塊36的功能性的指令。由處理器20執(zhí)行的這些指令可以使計(jì)算設(shè)備2在程序執(zhí)行期間,將信息存儲(chǔ)在存儲(chǔ)設(shè)備30內(nèi)。處理器20可以執(zhí)行I/O模塊4、語(yǔ)音模塊6、語(yǔ)音識(shí)別模塊32、語(yǔ)音處理模塊34和用戶語(yǔ)音模塊36的指令來(lái)使音頻輸出設(shè)備12以各種音量輸出音頻數(shù)據(jù)。即,存儲(chǔ)設(shè)備30中的項(xiàng),諸如I/O模塊4、語(yǔ)音模塊6、語(yǔ)音識(shí)別模塊32、語(yǔ)音處理模塊34和用戶語(yǔ)音模塊36可以由處理器20操作來(lái)執(zhí)行各種動(dòng)作,包括使音頻輸出設(shè)備12以各種音量輸出音頻數(shù)據(jù),如圖1所示。
在一些示例中,輸入設(shè)備24可以是按鈕、觸摸屏或一些其他類(lèi)型的輸入,其中,響應(yīng)于在輸入設(shè)備24處,從用戶接收輸入的指示,計(jì)算設(shè)備2輸出第三音頻數(shù)據(jù),用于由音頻輸出設(shè)備12以第一音量水平(例如第一音量水平14B)回放。例如,如果降低或停止音量,用戶70可以使用輸入設(shè)備24來(lái)以音量水平14B,而不是音量水平14C繼續(xù)收聽(tīng)播客。
在一些示例中,一個(gè)或多個(gè)處理器28可以執(zhí)行用于輸出第一音頻數(shù)據(jù)的指令,用于由音頻輸出設(shè)備(例如音頻輸出設(shè)備12)以第一音量水平回放。指令可以使一個(gè)或多個(gè)處理器28接收音頻輸入數(shù)據(jù)。響應(yīng)于確定音頻輸入數(shù)據(jù)包括與不同于用戶的實(shí)體相關(guān)聯(lián)的語(yǔ)音,指令可以使一個(gè)或多個(gè)處理器28至少部分基于音頻輸入數(shù)據(jù),確定是否輸出第二音頻數(shù)據(jù)。響應(yīng)于確定輸出第二音頻數(shù)據(jù),指令可以使一個(gè)或多個(gè)處理器28確定低于第一音量水平的第二音量水平。指令可以使一個(gè)或多個(gè)處理器28輸出第二音頻數(shù)據(jù),用于由音頻輸出設(shè)備以第二音量水平回放。
圖3是根據(jù)本公開(kāi)的一個(gè)或多個(gè)方面,圖示出用于基于來(lái)自第二計(jì)算設(shè)備的所檢測(cè)的音頻輸入,在第二計(jì)算設(shè)備處動(dòng)態(tài)地變更音頻輸出的示例計(jì)算設(shè)備的框圖。在一些示例中,根據(jù)本公開(kāi),執(zhí)行本公開(kāi)的技術(shù)的計(jì)算設(shè)備可以耦接到在音頻輸出設(shè)備處輸出音頻數(shù)據(jù)并且將音頻輸入數(shù)據(jù)提供給第一計(jì)算設(shè)備的第二計(jì)算設(shè)備。例如,計(jì)算設(shè)備48可以包括任意多個(gè)不同的便攜式電子計(jì)算設(shè)備,諸如可穿戴計(jì)算設(shè)備(例如計(jì)算機(jī)化手表、計(jì)算機(jī)化耳麥、計(jì)算機(jī)化眼鏡等)、智能手機(jī)、個(gè)人數(shù)字助理(PDA)、手提電腦、便攜式游戲設(shè)備、便攜式媒體播放器、電子書(shū)閱讀器等,而計(jì)算設(shè)備40可以是耳機(jī)、耳麥,或諸如麥克風(fēng)的音頻輸入設(shè)備和諸如揚(yáng)聲器的音頻輸出設(shè)備的一些其他組合。計(jì)算設(shè)備48可以耦接到包含音頻輸出設(shè)備12和音頻輸入設(shè)備15的計(jì)算設(shè)備40。例如,計(jì)算設(shè)備48可以是將可以是耳機(jī)的計(jì)算設(shè)備40中的音頻輸入設(shè)備15和音頻輸出設(shè)備12用作耦接到計(jì)算設(shè)備48的外圍設(shè)備以分別提供語(yǔ)音檢測(cè)和回放功能性。計(jì)算設(shè)備48和/或計(jì)算設(shè)備40可以包括各種輸入和輸出組件,包括例如一個(gè)或多個(gè)處理器、存儲(chǔ)器、遙測(cè)模塊、蜂窩網(wǎng)絡(luò)天線、顯示器、一個(gè)或多個(gè)UI元件、傳感器和如可充電電池的電源。
計(jì)算設(shè)備40和/或計(jì)算設(shè)備48可以包括為清楚起見(jiàn)圖3中未示出的另外的組件。例如,計(jì)算設(shè)備40和/或計(jì)算設(shè)備48可以包括向計(jì)算設(shè)備40和/或計(jì)算設(shè)備48的組件供電的電池。類(lèi)似地,圖3中所示的計(jì)算設(shè)備40和/或計(jì)算設(shè)備48的組件并非在計(jì)算設(shè)備40和/或計(jì)算設(shè)備48的每一示例中均是必要的。例如,在一些配置中,計(jì)算設(shè)備40和/或計(jì)算設(shè)備48可以不包括通信單元44和/或52。計(jì)算設(shè)備48的存儲(chǔ)設(shè)備58也可以包括I/O模塊54、語(yǔ)音模塊60和數(shù)據(jù)存儲(chǔ)器56。
計(jì)算設(shè)備40和計(jì)算設(shè)備48分別包含經(jīng)由鏈路47相互通信的一個(gè)或多個(gè)通信單元44和52。計(jì)算設(shè)備40和48的一個(gè)或多個(gè)通信單元44和52可以通過(guò)在一個(gè)或多個(gè)網(wǎng)絡(luò)上傳送和/或接收網(wǎng)絡(luò)信號(hào),經(jīng)由一個(gè)或多個(gè)有線和/或無(wú)線網(wǎng)絡(luò),與外部設(shè)備通信。例如,計(jì)算設(shè)備40和48可以使用通信單元44和52來(lái)在無(wú)線電網(wǎng)絡(luò)諸如蜂窩無(wú)線電網(wǎng)絡(luò)上傳送和/或接收無(wú)線電信號(hào)。同樣地,通信單元44和52可以在衛(wèi)星網(wǎng)絡(luò)諸如GPS網(wǎng)絡(luò)上傳送和/或接收衛(wèi)星信號(hào)。通信單元44和52的示例可以包括網(wǎng)絡(luò)接口卡(例如諸如以太網(wǎng)卡)、光收發(fā)器、射頻收發(fā)器、GPS接收機(jī)或可以發(fā)送和/或接收信息的任何其他類(lèi)型的設(shè)備。通信單元44和52的其他示例可以包括在移動(dòng)設(shè)備中找到的GPS、3G、4G和無(wú)線電以及通用串行總線(USB)控制器。
通信單元44和52經(jīng)由鏈路47相互通信。鏈路47可以是使計(jì)算設(shè)備40和計(jì)算設(shè)備48物理連接的硬鏈接連接,諸如光纜或以太網(wǎng)連接。鏈路47也可以是無(wú)線鏈路,諸如GPS、3G、4G和
通信信道(COMM.CHANNELS)68可以互連計(jì)算設(shè)備40中的組件42、43、44、45和/或46和計(jì)算設(shè)備48中的組件50、52、54、56、58、60、62、64和/或66,用于(物理地、通信地和/或可操作地)組件間通信。在一些示例中,通信信道68可以包括系統(tǒng)總線、網(wǎng)絡(luò)連接、進(jìn)程間通信數(shù)據(jù)結(jié)構(gòu)或用于傳送數(shù)據(jù)的任何其他方法。
在圖3的示例中,一個(gè)或多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備56可操作以存儲(chǔ)用于在計(jì)算設(shè)備48的操作期間處理的信息。例如,計(jì)算設(shè)備48可以存儲(chǔ)在計(jì)算設(shè)備48處執(zhí)行期間模塊54和/或60可以訪問(wèn)的數(shù)據(jù)。在一些示例中,數(shù)據(jù)存儲(chǔ)設(shè)備56表示臨時(shí)存儲(chǔ)器,意指數(shù)據(jù)存儲(chǔ)設(shè)備56的主要目的可以不是長(zhǎng)期存儲(chǔ)。例如,計(jì)算設(shè)備48的數(shù)據(jù)存儲(chǔ)設(shè)備56可以是易失性存儲(chǔ)器,意指如果斷電,數(shù)據(jù)存儲(chǔ)設(shè)備56不保持存儲(chǔ)的內(nèi)容。易失性存儲(chǔ)器的示例包括隨機(jī)存取存儲(chǔ)器(RAM)、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM)、靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)和本領(lǐng)域公知的其他形式的易失性存儲(chǔ)器。
在一些示例中,數(shù)據(jù)存儲(chǔ)設(shè)備56還包括一個(gè)或多個(gè)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。數(shù)據(jù)存儲(chǔ)設(shè)備56可以被配置為存儲(chǔ)比易失性存儲(chǔ)器更大量的信息。數(shù)據(jù)存儲(chǔ)設(shè)備56可以進(jìn)一步被配置為長(zhǎng)期存儲(chǔ)信息。在一些示例中,數(shù)據(jù)存儲(chǔ)設(shè)備56可以包括非易失性存儲(chǔ)元件,意指數(shù)據(jù)存儲(chǔ)設(shè)備56可以在上電/斷電周期保持信息。非易失性存儲(chǔ)器的示例包括磁硬盤(pán)、光盤(pán)、軟盤(pán)、閃存或電編程存儲(chǔ)器(EPROM)或電可擦可編程(EEPROM)存儲(chǔ)器的形式。在一些示例中,諸如程序執(zhí)行期間,數(shù)據(jù)存儲(chǔ)設(shè)備56可以存儲(chǔ)與模塊54和56相關(guān)聯(lián)的程序指令和/或信息(例如數(shù)據(jù))。
在圖3的示例中,計(jì)算設(shè)備40可以包括音頻輸出設(shè)備43和音頻輸入設(shè)備45。在一些示例中,音頻輸出設(shè)備43可以是揚(yáng)聲器或揚(yáng)聲器集合。在一些示例中,音頻輸入設(shè)備45可以是麥克風(fēng)。在其他示例中,音頻輸入設(shè)備45可以是送話口、MIDI鍵盤(pán)、骨導(dǎo)傳感器或一些其他數(shù)字儀器。音頻輸出設(shè)備43和音頻輸入設(shè)備45可以經(jīng)由通信信道68、通信單元44和鏈路47,與計(jì)算設(shè)備48的其他組件,諸如模塊54和60、數(shù)據(jù)存儲(chǔ)器56或通信單元52通信。在一些示例中,音頻輸出設(shè)備43和/或音頻輸入設(shè)備45可以與計(jì)算設(shè)備48物理分離并且可以使用有線和/或無(wú)線通信機(jī)制,諸如藍(lán)牙、WiFi、紅外等,可操作地和/或通信地耦接到計(jì)算設(shè)備48。
如圖3所示,計(jì)算設(shè)備48可以包括輸入/輸出(“I/O”)模塊54和語(yǔ)音模塊60。模塊54和60可以使用軟件、硬件、固件或硬件、軟件和駐留在計(jì)算設(shè)備48中并且在其上執(zhí)行的固件的混合,執(zhí)行本文所述的操作。計(jì)算設(shè)備48可以以在底層硬件上執(zhí)行的虛擬機(jī),執(zhí)行模塊54和60??梢砸愿鞣N方式實(shí)現(xiàn)模塊54和60。例如,I/O模塊54和語(yǔ)音模塊60可以實(shí)現(xiàn)為預(yù)安裝的應(yīng)用或“app”。在另一示例中,模塊54和60可以實(shí)現(xiàn)為計(jì)算設(shè)備48的操作系統(tǒng)的一部分。
I/O模塊54可以充當(dāng)計(jì)算設(shè)備48的各個(gè)組件之間的中介并且與計(jì)算設(shè)備48的各個(gè)組件交換信息。例如,計(jì)算設(shè)備48的I/O模塊54可以與計(jì)算設(shè)備40和/或計(jì)算設(shè)備48的其他元件,諸如音頻輸入設(shè)備45、音頻輸出設(shè)備43或語(yǔ)音模塊60交換數(shù)據(jù)。
語(yǔ)音模塊60可以處理由計(jì)算系統(tǒng)48接收的音頻輸入數(shù)據(jù)。例如,語(yǔ)音模塊60可以分析音頻輸入數(shù)據(jù)來(lái)確定計(jì)算設(shè)備的用戶是否加入談話或不同于計(jì)算設(shè)備的用戶的實(shí)體是否正嘗試引起用戶關(guān)注。在一些示例中,語(yǔ)音模塊60可以包含多個(gè)不同的模塊(例如語(yǔ)音識(shí)別模塊62、語(yǔ)音處理模塊64和/或用戶語(yǔ)音模塊66)來(lái)實(shí)現(xiàn)參考圖3所述的功能性。
計(jì)算設(shè)備40的一個(gè)或多個(gè)輸入設(shè)備42可以接收輸入。輸入的示例可以是觸覺(jué)、音頻和視頻輸入。在一個(gè)示例中,計(jì)算設(shè)備40的輸入設(shè)備42可以包括鼠標(biāo)、鍵盤(pán)、話音應(yīng)答系統(tǒng)、攝像機(jī)、麥克風(fēng)、骨導(dǎo)傳感器、傳感器或用于檢測(cè)來(lái)自人或機(jī)器的輸入的任何其他類(lèi)型的設(shè)備。在其他示例中,輸入設(shè)備42可以是按鈕、觸摸屏或一些其他類(lèi)型的輸入。
在一些示例中,輸入設(shè)備42可以是麥克風(fēng)或骨導(dǎo)傳感器,其被配置為檢測(cè)來(lái)自用戶、不同于用戶的實(shí)體或兩者的語(yǔ)音。例如,計(jì)算設(shè)備40能夠通過(guò)輸入設(shè)備42,檢測(cè)來(lái)自用戶(例如用戶70)的語(yǔ)音,其中,來(lái)自該用戶的語(yǔ)音可以是對(duì)與不同于該用戶的實(shí)體相關(guān)聯(lián)的語(yǔ)音的響應(yīng)。
計(jì)算設(shè)備40的一個(gè)或多個(gè)輸出設(shè)備46可以生成輸出。輸出的示例可以是觸覺(jué)、音頻和視頻輸出。在一個(gè)示例中,計(jì)算設(shè)備40的輸出設(shè)備46可以包括存在敏感屏幕、聲卡、視頻圖形適配卡、陰極射線管(CRT)監(jiān)視器、液晶顯示器(LCD)或用于對(duì)人或機(jī)器生成輸出的任何其他類(lèi)型的設(shè)備。輸出設(shè)備46可以包括顯示設(shè)備,諸如陰極射線管(CRT)監(jiān)視器、液晶顯示器(LCD)或用于生成可視輸出的任何其他類(lèi)型的設(shè)備。
圖3的示例可以執(zhí)行與參考圖1和2公開(kāi)的類(lèi)似的技術(shù)。參考圖1的一些方面,在下述示例中,計(jì)算設(shè)備40和計(jì)算設(shè)備48的系統(tǒng)可以替換圖1的計(jì)算設(shè)備2。在該實(shí)施例中,計(jì)算設(shè)備48基于檢測(cè)音頻輸入中與除用戶外的實(shí)體相關(guān)聯(lián)的語(yǔ)音,改變?cè)谟?jì)算設(shè)備40中的音頻輸出設(shè)備43處的音頻輸出的音量。在一個(gè)示例中,計(jì)算設(shè)備40可以是連接到電視機(jī)、輸出與正在電視機(jī)上顯示的電影相關(guān)聯(lián)的音頻(例如第一音頻數(shù)據(jù))的揚(yáng)聲器(例如輸出設(shè)備46),以及計(jì)算設(shè)備48可以是服務(wù)器。第一音量水平14A可以是用戶70通常收聽(tīng)電影的音量水平。音頻數(shù)據(jù)可以存儲(chǔ)在數(shù)據(jù)存儲(chǔ)器56處或可以例如經(jīng)由鏈路47,使用通信單元44和52,從一個(gè)或多個(gè)遠(yuǎn)程服務(wù)器或音樂(lè)服務(wù)流出。在任一實(shí)例中,I/O模塊54可以經(jīng)由通信單元44和52、通信信道68和鏈路47或其他有線和/或無(wú)線通信機(jī)制,將音頻數(shù)據(jù)發(fā)送到音頻輸出設(shè)備43,用于以第一音量水平14A回放。
當(dāng)用戶70正以音量水平14B收聽(tīng)電影時(shí),用戶72可能?chē)L試引起用戶70的關(guān)注。例如,用戶72可以在時(shí)刻T2說(shuō)“Hey,John!”(語(yǔ)音74)。盡管描述為用戶72,但在其他示例中,用戶72能是不同于用戶70的任何實(shí)體,包括對(duì)講系統(tǒng)、計(jì)算機(jī)化系統(tǒng)、無(wú)線電、機(jī)器人對(duì)象或輸出音頻的任何其他對(duì)象。在一些示例中,音量水平14B可以是與音量水平14A相同的音量水平。
音頻輸入設(shè)備45(例如揚(yáng)聲器殼體中的麥克風(fēng))可以檢測(cè)語(yǔ)音74(例如音頻輸入數(shù)據(jù))并且將語(yǔ)音74的指示經(jīng)由通信單元44和52、通信信道68和鏈路47,提供給服務(wù)器上的I/O模塊54,反過(guò)來(lái),I/O模塊54可以將音頻輸入數(shù)據(jù)提供給語(yǔ)音模塊60。在一些示例中,語(yǔ)音模塊60可以包含多個(gè)不同的模塊以執(zhí)行如參考圖1所述的功能性。例如,語(yǔ)音模塊60可以包含語(yǔ)音識(shí)別模塊62、語(yǔ)音處理模塊64和用戶語(yǔ)音模塊66。在一些示例中,語(yǔ)音識(shí)別模塊62可以從I/O模塊54接收音頻輸入數(shù)據(jù)并且處理音頻輸入數(shù)據(jù)以確定該音頻輸入數(shù)據(jù)是否包含語(yǔ)音。語(yǔ)音識(shí)別模塊62可以通過(guò)測(cè)量用戶附近的任何環(huán)境噪聲并且檢測(cè)所接收的音頻輸入數(shù)據(jù)中的尖峰信號(hào)來(lái)完成。在本公開(kāi)的示例中,尖峰信號(hào)可以是指在用戶附近的聲波的大小急劇增加后,緊跟著用戶附近的聲波的大小的急劇減小。這些尖峰信號(hào)可以指示音頻輸入數(shù)據(jù)包括可以不同于通常環(huán)境噪聲的聲音的指示,諸如語(yǔ)音。例如,本示例中的用戶70可以具有來(lái)自電視揚(yáng)聲器的環(huán)境噪聲和其他環(huán)境因素。語(yǔ)音識(shí)別模塊62可以確定語(yǔ)音74為尖峰信號(hào),因?yàn)樗硎驹谟脩?0附近的聲波的大小急劇增加后,緊跟著用戶70附近的聲波的大小的急劇減小。如果語(yǔ)音識(shí)別模塊62確定存在包括語(yǔ)音的尖峰信號(hào),語(yǔ)音識(shí)別模塊62可以將音頻輸入數(shù)據(jù)轉(zhuǎn)發(fā)到語(yǔ)音處理模塊64。
在一些示例中,語(yǔ)音處理模塊64可以確定由語(yǔ)音識(shí)別模塊62確定的尖峰信號(hào)是否包括語(yǔ)音。語(yǔ)音處理模塊64可以確定音頻輸入數(shù)據(jù)中的尖峰信號(hào)是否對(duì)應(yīng)于語(yǔ)音,并且如果是,通過(guò)應(yīng)用語(yǔ)音識(shí)別技術(shù)來(lái)確定音頻輸入數(shù)據(jù)是否包括可識(shí)別的詞,可以確定一個(gè)或多個(gè)詞包括在音頻輸入數(shù)據(jù)中。在一些示例中,語(yǔ)音處理模塊64可以確定語(yǔ)音是否包含談話關(guān)鍵字。談話關(guān)鍵字可以是通常用來(lái)開(kāi)始談話的任何詞。示例能包括詞或短語(yǔ)“hello”、“hey”、“hi”、“howdy”或“you there”,但能基于用戶的文化、語(yǔ)言、俚語(yǔ)或禮節(jié)擴(kuò)展這些關(guān)鍵字。在其他示例中,談話關(guān)鍵字能是用戶的名字或與用戶相關(guān)聯(lián)的名稱。在該示例中,語(yǔ)音處理模塊64可以接收語(yǔ)音74中,由詞“Hey,John!”組成的音頻輸入數(shù)據(jù),并且確定滿足語(yǔ)音識(shí)別的談話關(guān)鍵字分量。在一些示例中,語(yǔ)音處理模塊64可以進(jìn)一步確定是否以滿足閾值音量值的音量,檢測(cè)到來(lái)自除用戶外的實(shí)體的語(yǔ)音。
如果語(yǔ)音處理模塊64確定語(yǔ)音包含在音頻輸入數(shù)據(jù)中,并且將該指示從語(yǔ)音處理模塊64發(fā)送到I/O模塊54。語(yǔ)音74將使電影的音頻輸出的音量減小,允許用戶70以談話的方式應(yīng)答用戶72,與使用戶70試圖以在播放電影時(shí)講話、手動(dòng)降低音量或根本不應(yīng)答用戶72完全不同。當(dāng)I/O模塊54接收音頻輸入數(shù)據(jù)包含語(yǔ)音的肯定指示時(shí),I/O模塊54確定是否停止輸出音頻數(shù)據(jù)(即停止電影并且完全地終止輸出音頻數(shù)據(jù))或確定比第一音量14B更低的第二音量14C。如果I/O模塊54確定第二音量14C,那么I/O模塊54將經(jīng)由通信單元44和52、通信信道68和鏈路47,輸出第二音頻數(shù)據(jù),用于由音頻輸出設(shè)備43以第二音量14C回放。
在一些示例中,用戶語(yǔ)音模塊36還能夠處理來(lái)自用戶的語(yǔ)音或?qū)崿F(xiàn)機(jī)器學(xué)習(xí)算法。計(jì)算設(shè)備40可以接收第二音頻輸入數(shù)據(jù),其中,第二音頻輸入是可以與用戶70相關(guān)聯(lián)的語(yǔ)音(例如,用戶在使用計(jì)算設(shè)備40的同時(shí),開(kāi)始說(shuō)話)。計(jì)算設(shè)備48使用用戶語(yǔ)音模塊66,可以測(cè)量來(lái)自用戶的語(yǔ)音的各種語(yǔ)音特性。在一些示例中,語(yǔ)音特性可以是以下中的任何一個(gè):音調(diào)、音量、節(jié)奏、音色、口音、發(fā)音、清晰度、頭部運(yùn)動(dòng)、停頓、上述特性的任何一個(gè)的波動(dòng),或上述特性的任何一個(gè)的組合。計(jì)算設(shè)備48可以存儲(chǔ)所測(cè)量的語(yǔ)音特性。在一些示例中,這些語(yǔ)音特性可以存儲(chǔ)在數(shù)據(jù)存儲(chǔ)器56中。計(jì)算設(shè)備48可以至少部分基于第三音頻輸入數(shù)據(jù)(例如用戶70在使用計(jì)算設(shè)備40的同時(shí)說(shuō)話的另一示例)和存儲(chǔ)的語(yǔ)音特性之間的比較,確定用戶是否正在講話。例如,如果第三音頻輸入具有與由計(jì)算設(shè)備48存儲(chǔ)的語(yǔ)音特性類(lèi)似的音調(diào)、音量、節(jié)奏、音色、口音、發(fā)音、清晰度、頭部運(yùn)動(dòng)、停頓、上述特性的任何一個(gè)的波動(dòng),或上述特性的任何一個(gè)的組合,那么計(jì)算設(shè)備48可以確定用戶正在講話。如果計(jì)算設(shè)備48確定用戶70正在講話,計(jì)算設(shè)備48可以確定是否輸出第三音頻數(shù)據(jù)(例如,用戶當(dāng)前正在收聽(tīng)的播客(podcast)的其他部分)。如果計(jì)算設(shè)備48確定輸出第三音頻數(shù)據(jù),計(jì)算設(shè)備48可以確定比第一音量水平更低的第三音量水平。經(jīng)過(guò)一段時(shí)間后,計(jì)算設(shè)備48可以使用用戶語(yǔ)音模塊66來(lái)不斷地細(xì)化所存儲(chǔ)的語(yǔ)音特性以更接近地匹配用戶70的特定語(yǔ)音特性。例如,用戶語(yǔ)音模塊66可以隨時(shí)間收集所存儲(chǔ)的語(yǔ)音特性的不同數(shù)據(jù)點(diǎn)來(lái)追蹤用戶70的語(yǔ)音特性可以如何改變。通過(guò)參考多個(gè)數(shù)據(jù)點(diǎn),用戶語(yǔ)音模塊66在預(yù)測(cè)用戶70是否正在講話方面會(huì)變得更準(zhǔn)確。
用戶語(yǔ)音模塊66還可以匯集來(lái)自多個(gè)輸入設(shè)備的數(shù)據(jù)以確定用戶是否正在講話。例如,用戶語(yǔ)音模塊66可以從I/O模塊54接收不同于用戶70的實(shí)體(例如用戶72)正與用戶70講話的指示。輸入設(shè)備42可以包括計(jì)算設(shè)備40上的傳感器和在音頻輸出設(shè)備43上的耳機(jī)的內(nèi)部的骨導(dǎo)傳感器。音頻輸入設(shè)備45能夠確定與用戶72相關(guān)聯(lián)的語(yǔ)音來(lái)自的方向。傳感器還可以確定用戶70或計(jì)算設(shè)備2目前面對(duì)的方向。用戶語(yǔ)音模塊36可以接收這些方向的指示并且比較它們以查看用戶70(或計(jì)算設(shè)備2)是否正面對(duì)與用戶72相關(guān)聯(lián)的語(yǔ)音的起源點(diǎn)。如果響應(yīng)于來(lái)自用戶72的語(yǔ)音,用戶70正進(jìn)一步講話,骨導(dǎo)傳感器可以接收從用戶70輸入的音頻輸入。骨導(dǎo)傳感器可以將該音頻輸入數(shù)據(jù)發(fā)送到I/O模塊54,該I/O模塊54將該音頻輸入數(shù)據(jù)轉(zhuǎn)發(fā)到用戶語(yǔ)音模塊66。用戶語(yǔ)音模塊66可以基于該音頻輸入數(shù)據(jù),確定用戶正在講話。用戶語(yǔ)音模塊66確定用戶70正看向跟與用戶72相關(guān)聯(lián)的語(yǔ)音來(lái)自的方向相同的方向并且確定用戶70正在講話的組合可以指示應(yīng)當(dāng)降低音量水平。用戶語(yǔ)音模塊66可以將該指示發(fā)送到I/O模塊54,其可以降低將回放音頻數(shù)據(jù)的音量水平。
在一些示例中,輸入設(shè)備42可以是按鈕、觸摸屏或一些其他類(lèi)型的輸入,其中,響應(yīng)于在輸入設(shè)備42處,從用戶接收輸入的指示,計(jì)算設(shè)備48輸出第三音頻數(shù)據(jù),用于由音頻輸出設(shè)備43以第一音量水平(例如第一音量水平14B)回放。例如,如果降低或停止音量,用戶70可以使用輸入設(shè)備42來(lái)以音量水平14B,而不是音量水平14C繼續(xù)收聽(tīng)該播客。
一個(gè)或多個(gè)處理器50可以實(shí)現(xiàn)功能性和/或執(zhí)行計(jì)算設(shè)備40內(nèi)的指令。例如,計(jì)算設(shè)備40上的處理器50可以接收由存儲(chǔ)設(shè)備30存儲(chǔ)的、執(zhí)行I/O模塊54、語(yǔ)音模塊60、語(yǔ)音識(shí)別模塊62、語(yǔ)音處理模塊64和用戶語(yǔ)音模塊66的功能性的指令。由處理器50執(zhí)行的這些指令可以使計(jì)算設(shè)備48在程序執(zhí)行期間,將信息存儲(chǔ)在存儲(chǔ)設(shè)備58內(nèi)。處理器50可以執(zhí)行I/O模塊54、語(yǔ)音模塊60、語(yǔ)音識(shí)別模塊62、語(yǔ)音處理模塊64和用戶語(yǔ)音模塊66的指令來(lái)使計(jì)算設(shè)備40的音頻輸出設(shè)備43以各種音量輸出音頻數(shù)據(jù)。即,存儲(chǔ)設(shè)備58中的項(xiàng),諸如I/O模塊54、語(yǔ)音模塊60、語(yǔ)音識(shí)別模塊62、語(yǔ)音處理模塊64和用戶語(yǔ)音模塊66可以由處理器50操作來(lái)執(zhí)行各種動(dòng)作,包括使計(jì)算設(shè)備40的音頻輸出設(shè)備43以各種音量輸出音頻數(shù)據(jù),如圖3所示。
在整個(gè)本公開(kāi)中,描述了僅當(dāng)計(jì)算設(shè)備從用戶接收允許這樣做的許可時(shí)計(jì)算設(shè)備和/或計(jì)算系統(tǒng)才可以訪問(wèn)和/或分析與計(jì)算設(shè)備相關(guān)聯(lián)的信息(例如執(zhí)行應(yīng)用、位置、速度、日歷、通信、音頻數(shù)據(jù)等)的示例。例如,在下述計(jì)算設(shè)備可以收集或可以利用與用戶相關(guān)聯(lián)的場(chǎng)境信息和/或與計(jì)算設(shè)備相關(guān)聯(lián)的場(chǎng)境信息的情形中,可以為用戶提供機(jī)會(huì)來(lái)提供輸入以控制計(jì)算設(shè)備的程序或特征是否能收集和利用這些信息,或規(guī)定計(jì)算設(shè)備是否可以存儲(chǔ)這些信息和/或存儲(chǔ)多久。此外,如果允許收集任何數(shù)據(jù),在數(shù)據(jù)由計(jì)算設(shè)備和/或計(jì)算系統(tǒng)存儲(chǔ)或使用前,計(jì)算設(shè)備可以以一個(gè)或多個(gè)方式處理某些數(shù)據(jù),使得去除個(gè)人可識(shí)別信息。例如,在獲得用于計(jì)算設(shè)備的位置信息后,可以概括地理位置(諸如到市、ZIP碼或州級(jí)),使得不能確定計(jì)算設(shè)備或用戶的特定位置。由此,用戶有權(quán)控制如何收集有關(guān)用戶的信息和計(jì)算設(shè)備如何使用該信息。
圖4是根據(jù)本公開(kāi)的一個(gè)或多個(gè)方面,圖示出用于檢測(cè)談話并且動(dòng)態(tài)地變更音頻數(shù)據(jù)的輸出水平的示例操作的流程圖。僅為了示例目的,在圖1和2的上下文內(nèi),描述圖4的示例操作。
在圖4的示例中,計(jì)算設(shè)備(例如計(jì)算設(shè)備2)輸出第一音頻數(shù)據(jù),用于由音頻輸出設(shè)備(例如音頻輸出設(shè)備12)以第一音量水平(例如音量水平14A)回放(80)。計(jì)算設(shè)備2可以使用音頻輸入設(shè)備15,接收音頻輸入數(shù)據(jù)(例如語(yǔ)音74)(82)。
計(jì)算設(shè)備可以確定所接收的音頻輸入是否滿足閾值音量值(84)。例如,計(jì)算設(shè)備可以按分貝測(cè)量所接收的音頻輸入并且將其與閾值分貝值比較,確定所接收的音頻輸入是否超出閾值分貝值的分貝水平。
計(jì)算設(shè)備可以確定所接收的音頻輸入數(shù)據(jù)是否包含來(lái)自不同于用戶的實(shí)體(例如實(shí)體72)的語(yǔ)音(86)。例如,語(yǔ)音模塊6可以包含語(yǔ)音識(shí)別模塊32、語(yǔ)音處理模塊34和用戶語(yǔ)音模塊36。在一些示例中,語(yǔ)音識(shí)別模塊32可以從I/O模塊4接收音頻輸入數(shù)據(jù)并且處理該音頻輸入數(shù)據(jù)以確定該音頻輸入數(shù)據(jù)是否包含語(yǔ)音。語(yǔ)音識(shí)別模塊32可以通過(guò)測(cè)量用戶周?chē)娜魏苇h(huán)境噪聲并且檢測(cè)所接收的音頻輸入數(shù)據(jù)中的尖峰信號(hào)來(lái)完成。在本公開(kāi)的示例中,尖峰信號(hào)可以是指在用戶附近的聲波的大小急劇增加后,緊跟著用戶附近的聲波的大小的急劇減小。這些尖峰信號(hào)可以指示音頻輸入數(shù)據(jù)可以包括不同于通常環(huán)境噪聲的聲音的指示,諸如語(yǔ)音。例如,本示例中的用戶70具有來(lái)自手提電腦揚(yáng)聲器的環(huán)境噪聲和其他環(huán)境因素。然后,將語(yǔ)音74確定為尖峰信號(hào),因?yàn)樗硎驹谟脩?0附近的聲波的大小急劇增加后,緊跟著用戶70附近的聲波的大小的急劇減小。如果語(yǔ)音識(shí)別模塊32確定存在包括語(yǔ)音的尖峰信號(hào),語(yǔ)音識(shí)別模塊32可以將音頻輸入數(shù)據(jù)轉(zhuǎn)發(fā)到語(yǔ)音處理模塊34。在一些示例中,語(yǔ)音處理模塊34可以確定由語(yǔ)音識(shí)別模塊32確定的尖峰信號(hào)是否包括語(yǔ)音。語(yǔ)音處理模塊34可以確定音頻輸入數(shù)據(jù)中的尖峰信號(hào)是否對(duì)應(yīng)于語(yǔ)音,并且如果是,通過(guò)應(yīng)用語(yǔ)音識(shí)別技術(shù)來(lái)確定音頻輸入數(shù)據(jù)是否包括可識(shí)別的詞,可以確定一個(gè)或多個(gè)詞包括在音頻輸入數(shù)據(jù)中。
計(jì)算設(shè)備可以確定是否使用談話關(guān)鍵字(88)。例如,計(jì)算設(shè)備可以確定音頻輸入是否可以包括詞或短語(yǔ)“hello”、“hey”、“hi”、“howdy”或“you there”,但能基于用戶的文化、語(yǔ)言、俚語(yǔ)或禮節(jié)擴(kuò)展這些關(guān)鍵字。在其他示例中,談話關(guān)鍵字能是用戶的名字或與用戶相關(guān)聯(lián)的名稱。
對(duì)在步驟84、86或88中列出的任一確定,如果計(jì)算設(shè)備做出否定確定(84、86或88的“否”分支),計(jì)算設(shè)備可以繼續(xù)輸出第一音頻數(shù)據(jù),用于由音頻輸出設(shè)備以第一音量水平回放。在一些示例中,可以實(shí)現(xiàn)這些確定的僅一些組合。在一些示例中,可以實(shí)現(xiàn)這些確定中的僅一個(gè)。或者,過(guò)程可以繼續(xù)(84、86和/或88的“是”分支)。
計(jì)算設(shè)備可以確定是否輸出第二音頻數(shù)據(jù)(90)。在一些示例中,計(jì)算設(shè)備可以停止輸出音頻數(shù)據(jù)(90或92的“否”分支),意指不會(huì)將音頻數(shù)據(jù)發(fā)送到音頻輸出設(shè)備,因此,音頻輸出設(shè)備不發(fā)出任何聲音。在其他示例中,計(jì)算設(shè)備可以確定可以比第一音量水平更低的第二音量水平(例如第二音量水平14C)并且計(jì)算設(shè)備可以輸出第二音頻數(shù)據(jù),用于由音頻輸出設(shè)備以第二音量水平回放(90或94的“是”分支)。
在一些示例中,不管計(jì)算設(shè)備是否確定輸出第二音頻數(shù)據(jù),計(jì)算設(shè)備均可以確定是否檢測(cè)到用戶語(yǔ)音(96)。計(jì)算設(shè)備可以檢測(cè)來(lái)自用戶的語(yǔ)音,其中,來(lái)自用戶的語(yǔ)音可以是對(duì)與不同于該用戶的實(shí)體相關(guān)聯(lián)的語(yǔ)音的響應(yīng)。如果檢測(cè)到用戶語(yǔ)音,計(jì)算設(shè)備可以繼續(xù)執(zhí)行步驟92或94(基于計(jì)算設(shè)備是否確定輸出第二音頻數(shù)據(jù),96的“是”分支)。例如,如果計(jì)算設(shè)備確定輸出第二音頻數(shù)據(jù),用于由音頻輸出設(shè)備以第二音量水平回放,在長(zhǎng)達(dá)檢測(cè)到用戶語(yǔ)音的時(shí)間內(nèi),計(jì)算設(shè)備可以繼續(xù)輸出第二音頻數(shù)據(jù)。
在一些示例中,計(jì)算設(shè)備可以檢測(cè)用戶和不同于用戶的實(shí)體之間的語(yǔ)音模式,并且基于該語(yǔ)音模式,確定談話是否正發(fā)生。在這些示例中,計(jì)算設(shè)備可以繼續(xù)終止輸出第二音頻數(shù)據(jù),或在長(zhǎng)達(dá)計(jì)算設(shè)備確定談話可能正發(fā)生的時(shí)間內(nèi),計(jì)算設(shè)備可以繼續(xù)輸出第二音頻數(shù)據(jù),用于由音頻輸出設(shè)備以第二音量水平回放。例如,計(jì)算設(shè)備可以檢測(cè)用戶和不同于該用戶的實(shí)體之間的語(yǔ)音模式已經(jīng)結(jié)束。計(jì)算設(shè)備可以基于該語(yǔ)音模式的結(jié)束,確定談話已經(jīng)結(jié)束。因此,計(jì)算設(shè)備可以輸出第三音頻數(shù)據(jù),用于由音頻輸出設(shè)備以第一音量水平回放。參考圖4,如果計(jì)算設(shè)備確定不再檢測(cè)到用戶語(yǔ)音(96的“否”分支),計(jì)算設(shè)備可以確定談話是否已經(jīng)停止(98)。如果計(jì)算設(shè)備不再檢測(cè)到不同于該用戶的實(shí)體不再講話并且該用戶不再講話,談話已經(jīng)停止。如果計(jì)算設(shè)備確定談話還未停止(98的“否”分支),計(jì)算設(shè)備可以繼續(xù)終止輸出第二音頻數(shù)據(jù)或可以繼續(xù)輸出第二音頻數(shù)據(jù),用于由音頻輸出設(shè)備以第二音量水平回放。如果計(jì)算設(shè)備確定談話已經(jīng)停止(98的“是”分支),計(jì)算設(shè)備可以輸出音頻數(shù)據(jù),用于由音頻輸出設(shè)備以第一音量水平回放。
圖5是根據(jù)本公開(kāi)的一個(gè)或多個(gè)方面,圖示出用于確定用戶的談話習(xí)慣的示例操作的流程圖。僅為示例目的,在下文中,在圖1和2的上下文內(nèi),描述圖4的示例操作。
在圖5的示例中,計(jì)算設(shè)備(例如計(jì)算設(shè)備2)可以輸出第二音頻數(shù)據(jù),用于由音頻輸出設(shè)備(例如音頻輸出設(shè)備12)以第二音量水平(例如音量水平14C)回放(102)。這向計(jì)算設(shè)備指示用戶正參與談話。根據(jù)圖5的示例,計(jì)算設(shè)備可以分析用戶的講話話音以確定用戶何時(shí)參與談話。如果計(jì)算設(shè)備能基于用戶的講話話音,而不是來(lái)自不同于用戶的實(shí)體的語(yǔ)音,確定用戶何時(shí)參與談話,計(jì)算設(shè)備在用戶可能發(fā)起談話的實(shí)例中很有用。圖5的示例為計(jì)算設(shè)備提供該功能性。
只要計(jì)算設(shè)備輸出音頻數(shù)據(jù),用于以第二音量水平回放,計(jì)算設(shè)備可以接收第二音頻輸入數(shù)據(jù),其中,第二音頻輸入是可以與用戶相關(guān)聯(lián)的語(yǔ)音(104)。計(jì)算設(shè)備使用用戶語(yǔ)音模塊36,可以測(cè)量第二音頻輸入數(shù)據(jù)的各個(gè)語(yǔ)音特性(106)。在一些示例中,語(yǔ)音特性可以是以下中的任何一個(gè):音調(diào)、音量、節(jié)奏、音色、口音、發(fā)音、清晰度、頭部運(yùn)動(dòng)、停頓、上述特性的任何一個(gè)的波動(dòng),或上述特性的任何一個(gè)的組合。計(jì)算設(shè)備存儲(chǔ)所測(cè)量的語(yǔ)音特性(108)。在一些示例中,這些語(yǔ)音特性可以存儲(chǔ)在數(shù)據(jù)存儲(chǔ)器8中。
計(jì)算設(shè)備可以至少部分基于第三音頻輸入數(shù)據(jù)和所存儲(chǔ)的語(yǔ)音特性之間的比較,確定用戶是否正在講話(110)。例如,如果第三音頻輸入具有與由計(jì)算設(shè)備2存儲(chǔ)的語(yǔ)音特性類(lèi)似的音調(diào)、音量、節(jié)奏、音色、口音、發(fā)音、清晰度、頭部運(yùn)動(dòng)、停頓、上述特性的任何一個(gè)的波動(dòng),或上述特性的任何一個(gè)的組合,那么計(jì)算設(shè)備可以確定用戶正在講話。
如果計(jì)算設(shè)備確定用戶正在講話,計(jì)算設(shè)備可以確定是否輸出第三音頻數(shù)據(jù)(112)。如果計(jì)算設(shè)備確定輸出第三音頻數(shù)據(jù),計(jì)算設(shè)備可以確定低于第一音量水平的第三音量水平(114)。計(jì)算設(shè)備可以輸出第三音頻數(shù)據(jù),用于由音頻輸出設(shè)備以第三音量水平回放(116)。
在一個(gè)示例中,響應(yīng)于計(jì)算設(shè)備確定音頻輸入可以包括與不同于用戶的實(shí)體相關(guān)聯(lián)的語(yǔ)音,計(jì)算設(shè)備可以接收第二音頻輸入數(shù)據(jù),其中,該第二音頻輸入數(shù)據(jù)可以是與該用戶相關(guān)聯(lián)的語(yǔ)音。計(jì)算設(shè)備可以測(cè)量第二音頻輸入中,用戶的語(yǔ)音特性。計(jì)算設(shè)備可以存儲(chǔ)所測(cè)量的語(yǔ)音特性。計(jì)算設(shè)備可以至少部分基于第三音頻輸入數(shù)據(jù)與所存儲(chǔ)的語(yǔ)音特性之間的比較,確定用戶可能正在講話。響應(yīng)于計(jì)算設(shè)備確定第三音頻輸入數(shù)據(jù)可以包括與用戶相關(guān)聯(lián)的語(yǔ)音,計(jì)算設(shè)備可以至少部分基于第三音頻輸入數(shù)據(jù),確定是否輸出第三音頻數(shù)據(jù)。響應(yīng)于確定輸出第三音頻數(shù)據(jù),計(jì)算設(shè)備可以確定低于第一音量水平的第三音量水平。計(jì)算設(shè)備可以輸出第三音頻數(shù)據(jù),用于由音頻輸出設(shè)備以第三音量水平回放。
示例1:一種方法,包括:由與用戶相關(guān)聯(lián)的計(jì)算設(shè)備輸出第一音頻數(shù)據(jù),用于由音頻輸出設(shè)備以第一音量水平回放;由所述計(jì)算設(shè)備接收音頻輸入數(shù)據(jù);響應(yīng)于由所述計(jì)算設(shè)備確定所述音頻輸入數(shù)據(jù)包括與不同于所述用戶的實(shí)體相關(guān)聯(lián)的語(yǔ)音,由所述計(jì)算設(shè)備至少部分基于所述音頻輸入數(shù)據(jù),確定是否輸出第二音頻數(shù)據(jù);以及響應(yīng)于確定輸出所述第二音頻數(shù)據(jù):由所述計(jì)算設(shè)備確定低于所述第一音量水平的第二音量水平;以及由所述計(jì)算設(shè)備輸出所述第二音頻數(shù)據(jù),用于由所述音頻輸出設(shè)備以所述第二音量水平回放。
示例2:如示例1所述的方法,其中,所述音頻輸入數(shù)據(jù)是第一音頻輸入數(shù)據(jù),所述方法進(jìn)一步包括:響應(yīng)于由所述計(jì)算設(shè)備至少部分基于第二音頻輸入數(shù)據(jù)與所存儲(chǔ)的用戶的語(yǔ)音特性之間的比較,確定用戶正在講話,由所述計(jì)算設(shè)備至少部分基于所述第二音頻輸入數(shù)據(jù),確定是否輸出第三音頻數(shù)據(jù);以及響應(yīng)于確定輸出所述第三音頻數(shù)據(jù);由所述計(jì)算設(shè)備確定低于所述第一音量水平的第三音量水平;以及由所述計(jì)算設(shè)備輸出所述第三音頻數(shù)據(jù),用于由所述音頻輸出設(shè)備以第三音量水平回放。
示例3:如示例1-2的任何一個(gè)所述的方法,進(jìn)一步包括:響應(yīng)于由所述計(jì)算設(shè)備確定所述音頻輸入包括與不同于所述用戶的實(shí)體相關(guān)聯(lián)的語(yǔ)音:由所述計(jì)算設(shè)備接收第二音頻輸入數(shù)據(jù),其中,所述第二音頻輸入數(shù)據(jù)是與所述用戶相關(guān)聯(lián)的語(yǔ)音;由所述計(jì)算設(shè)備測(cè)量所述第二音頻輸入中,所述用戶的語(yǔ)音特性;以及由所述計(jì)算設(shè)備存儲(chǔ)所測(cè)量的語(yǔ)音特性。
示例4:如示例1-3的任何一個(gè)所述的方法,進(jìn)一步包括:響應(yīng)于所述計(jì)算設(shè)備檢測(cè)到與來(lái)自不同于所述用戶的實(shí)體相關(guān)聯(lián)的語(yǔ)音已經(jīng)結(jié)束,由所述計(jì)算設(shè)備輸出第三音頻數(shù)據(jù),用于由所述音頻輸出設(shè)備以第一音量水平回放。
示例5:如示例1-4的任何一個(gè)所述的方法,進(jìn)一步包括:響應(yīng)于接收用戶輸入的指示,由所述計(jì)算設(shè)備輸出第三音頻數(shù)據(jù),用于由所述音頻輸出設(shè)備以第一音量水平回放。
示例6:如示例1-5的任何一個(gè)所述的方法,其中,所述音頻輸入數(shù)據(jù)的音量水平滿足閾值音量水平。
示例7:如示例1-6的任何一個(gè)所述的方法,進(jìn)一步包括:由所述計(jì)算設(shè)備基于所述音頻輸入,確定談話正在所述用戶和不同于所述用戶的實(shí)體之間發(fā)生。
示例8:如示例1-7的任何一個(gè)所述的方法,進(jìn)一步包括:由所述計(jì)算設(shè)備接收另外的音頻數(shù)據(jù);由所述計(jì)算設(shè)備基于所述另外的音頻數(shù)據(jù),確定所述談話已經(jīng)結(jié)束;由所述計(jì)算設(shè)備輸出第三音頻數(shù)據(jù),用于由所述音頻輸出設(shè)備以第一音量水平回放。
示例9:如示例1-8的任何一個(gè)所述的方法,其中,確定所述音頻輸入數(shù)據(jù)包括與不同于所述用戶的實(shí)體相關(guān)聯(lián)的語(yǔ)音包括:確定所述音頻輸入數(shù)據(jù)包括談話關(guān)鍵字。
示例10:如示例1-9的任何一個(gè)所述的方法,進(jìn)一步包括:由所述計(jì)算設(shè)備確定所述音頻輸入數(shù)據(jù)源自的方向;由所述計(jì)算設(shè)備確定所述計(jì)算設(shè)備正面對(duì)的方向;以及由所述計(jì)算設(shè)備比較所述音頻輸入數(shù)據(jù)源自的方向與所述計(jì)算設(shè)備正面對(duì)的方向以確定所述計(jì)算設(shè)備是否正面對(duì)用于所述音頻輸入數(shù)據(jù)的起源點(diǎn)。
示例11:如示例10所述的方法,進(jìn)一步包括響應(yīng)于確定所述計(jì)算設(shè)備正面對(duì)用于所述音頻輸入數(shù)據(jù)的起源點(diǎn),由所述計(jì)算設(shè)備接收第二音頻輸入數(shù)據(jù);并且由計(jì)算設(shè)備確定所述第二音頻輸入數(shù)據(jù)是否包含與所述用戶相關(guān)聯(lián)的語(yǔ)音。
示例12:一種與用戶相關(guān)聯(lián)的計(jì)算系統(tǒng),包括:一個(gè)或多個(gè)處理器;以第一音量水平,輸出第一音頻數(shù)據(jù)的音頻輸出設(shè)備;接收音頻輸入數(shù)據(jù)的音頻輸入設(shè)備;以及一個(gè)或多個(gè)模塊,所述一個(gè)或多個(gè)模塊可由所述一個(gè)或多個(gè)處理器操作以響應(yīng)于確定所述音頻輸入數(shù)據(jù)包括與不同于所述用戶的實(shí)體相關(guān)聯(lián)的語(yǔ)音,確定是否輸出第二音頻數(shù)據(jù),并且響應(yīng)于確定輸出第二音頻數(shù)據(jù),確定低于所述第一音量水平的第二音量水平,其中,所述音頻輸出設(shè)備被進(jìn)一步配置為以第二音量水平輸出所述第二音頻數(shù)據(jù)。
示例13:如示例12所述的計(jì)算系統(tǒng),其中,音頻輸入數(shù)據(jù)是第一音頻輸入數(shù)據(jù),以及一個(gè)或多個(gè)模塊被進(jìn)一步由一個(gè)或多個(gè)處理器操作以:響應(yīng)于至少部分基于第二音頻輸入數(shù)據(jù)與所存儲(chǔ)的用戶的語(yǔ)音特性之間的比較,確定用戶正在講話,至少部分基于所述第二音頻輸入數(shù)據(jù),確定是否輸出第三音頻數(shù)據(jù);以及響應(yīng)于確定輸出所述第三音頻數(shù)據(jù),確定低于所述第一音量水平的第三音量水平,其中,音頻輸出設(shè)備被進(jìn)一步配置為以第三音量水平輸出第三音頻數(shù)據(jù)。
示例14:如示例12-13的任何一個(gè)所述的計(jì)算系統(tǒng),其中,一個(gè)或多個(gè)模塊被進(jìn)一步由一個(gè)或多個(gè)處理器操作以:響應(yīng)于由所述計(jì)算設(shè)備確定所述音頻輸入包括與不同于所述用戶的實(shí)體相關(guān)聯(lián)的語(yǔ)音:接收第二音頻輸入數(shù)據(jù),其中,所述第二音頻輸入數(shù)據(jù)是與所述用戶相關(guān)聯(lián)的語(yǔ)音,以及測(cè)量所述第二音頻輸入中,所述用戶的語(yǔ)音特性;以及其中,該計(jì)算系統(tǒng)進(jìn)一步包括被配置為存儲(chǔ)所測(cè)量的語(yǔ)音特性的數(shù)據(jù)存儲(chǔ)單元。
示例15:如示例12-14的任何一個(gè)所述的計(jì)算系統(tǒng),其中,一個(gè)或多個(gè)模塊被進(jìn)一步由一個(gè)或多個(gè)處理器操作以:基于音頻輸入,確定談話正在所述用戶和不同于所述用戶的實(shí)體之間發(fā)生。
示例16:如示例12-15的任何一個(gè)所述的計(jì)算系統(tǒng),其中,一個(gè)或多個(gè)模塊被進(jìn)一步由一個(gè)或多個(gè)處理器操作以:接收另外的音頻數(shù)據(jù);并且基于所述另外的音頻數(shù)據(jù),確定所述談話已經(jīng)結(jié)束,其中,所述音頻輸出設(shè)備被進(jìn)一步配置為以第一音量水平輸出第三音頻數(shù)據(jù)。
示例17:如示例12-16的任何一個(gè)所述的計(jì)算系統(tǒng),其中,確定所述音頻輸入數(shù)據(jù)包括與不同于所述用戶的實(shí)體相關(guān)聯(lián)的語(yǔ)音包括:確定所述音頻輸入數(shù)據(jù)包括談話關(guān)鍵字。
示例18:如示例12-17的任何一個(gè)所述的計(jì)算系統(tǒng),其中,所述計(jì)算系統(tǒng)是可穿戴計(jì)算系統(tǒng)。
示例19:如示例12-18的任何一個(gè)所述的計(jì)算系統(tǒng),其中,一個(gè)或多個(gè)模塊被進(jìn)一步由一個(gè)或多個(gè)處理器操作以:確定所述音頻輸入數(shù)據(jù)源自的方向;確定所述計(jì)算設(shè)備正面對(duì)的方向;以及比較所述音頻輸入數(shù)據(jù)源自的方向與所述計(jì)算設(shè)備正面對(duì)的方向以確定所述計(jì)算設(shè)備是否正面對(duì)用于所述音頻輸入數(shù)據(jù)的起源點(diǎn)。
示例20:如示例19所述的計(jì)算系統(tǒng),其中,一個(gè)或多個(gè)模塊被進(jìn)一步由一個(gè)或多個(gè)處理器操作以:響應(yīng)于確定所述計(jì)算設(shè)備正面對(duì)用于所述音頻輸入數(shù)據(jù)的起源點(diǎn),接收第二音頻輸入數(shù)據(jù),并且確定第二音頻輸入數(shù)據(jù)是否包含與所述用戶相關(guān)聯(lián)的語(yǔ)音。
示例21:一種編碼有指令的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述指令當(dāng)被執(zhí)行時(shí),使與用戶相關(guān)聯(lián)的計(jì)算設(shè)備的至少一個(gè)處理器:輸出第一音頻數(shù)據(jù),用于由音頻輸出設(shè)備以第一音量水平回放;接收音頻輸入數(shù)據(jù);響應(yīng)于確定所述音頻輸入數(shù)據(jù)包括與不同于所述用戶的實(shí)體相關(guān)聯(lián)的語(yǔ)音,至少部分基于所述音頻輸入數(shù)據(jù),確定是否輸出第二音頻數(shù)據(jù);以及響應(yīng)于確定輸出所述第二音頻數(shù)據(jù):確定低于所述第一音量水平的第二音量水平;以及輸出所述第二音頻數(shù)據(jù),用于由所述音頻輸出設(shè)備以第二音量水平回放。
示例22:如示例21所述的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,所述音頻輸入數(shù)據(jù)是第一音頻輸入數(shù)據(jù),以及其中,所述指令當(dāng)被執(zhí)行時(shí),進(jìn)一步使至少一個(gè)處理器:響應(yīng)于至少部分基于第二音頻輸入數(shù)據(jù)與所存儲(chǔ)的用戶的語(yǔ)音特性之間的比較,確定用戶正在講話,至少部分基于所述第二音頻輸入數(shù)據(jù),確定是否輸出第三音頻數(shù)據(jù);以及響應(yīng)于確定輸出所述第三音頻數(shù)據(jù):確定低于所述第一音量水平的第三音量水平;以及輸出所述第三音頻數(shù)據(jù),用于由所述音頻輸出設(shè)備以第三音量水平回放。
示例23:如示例21-22的任何一個(gè)所述的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,所述指令當(dāng)被執(zhí)行時(shí),進(jìn)一步使至少一個(gè)處理器:響應(yīng)于確定所述音頻輸入包括與不同于所述用戶的實(shí)體相關(guān)聯(lián)的語(yǔ)音:接收第二音頻輸入數(shù)據(jù),其中,所述第二音頻輸入數(shù)據(jù)是與所述用戶相關(guān)聯(lián)的語(yǔ)音;測(cè)量所述第二音頻輸入中,所述用戶的語(yǔ)音特性;以及存儲(chǔ)所測(cè)量的語(yǔ)音特性。
示例24:如示例21-23的任何一個(gè)所述的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,所述指令當(dāng)被執(zhí)行時(shí),進(jìn)一步使至少一個(gè)處理器:基于所述音頻輸入,確定談話正在所述用戶和不同于所述用戶的實(shí)體之間發(fā)生。
示例25:如示例21-24的任何一個(gè)所述的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,所述指令當(dāng)被執(zhí)行時(shí),進(jìn)一步使至少一個(gè)處理器:接收另外的音頻數(shù)據(jù);基于所述另外的音頻數(shù)據(jù),確定所述談話已經(jīng)結(jié)束;以及輸出第三音頻數(shù)據(jù),用于由所述音頻輸出設(shè)備以第一音量水平回放。
示例26:如示例21-25的任何一個(gè)所述的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,確定所述音頻輸入數(shù)據(jù)包括與不同于所述用戶的實(shí)體相關(guān)聯(lián)的語(yǔ)音包括:確定所述音頻輸入數(shù)據(jù)包括談話關(guān)鍵字。
示例27:如示例21-26的任何一個(gè)所述的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,所述指令當(dāng)被執(zhí)行時(shí),進(jìn)一步使至少一個(gè)處理器:確定所述音頻輸入數(shù)據(jù)源自的方向;確定所述計(jì)算設(shè)備正面對(duì)的方向;以及比較所述音頻輸入數(shù)據(jù)源自的方向與所述計(jì)算設(shè)備正面對(duì)的方向以確定所述計(jì)算設(shè)備是否正面對(duì)用于所述音頻輸入數(shù)據(jù)的起源點(diǎn)。
示例28:如示例27所述的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,所述指令當(dāng)被執(zhí)行時(shí),進(jìn)一步使至少一個(gè)處理器:響應(yīng)于確定所述計(jì)算設(shè)備正面對(duì)用于所述音頻輸入數(shù)據(jù)的起源點(diǎn),接收第二音頻輸入數(shù)據(jù);并且確定所述第二音頻輸入數(shù)據(jù)是否包含與所述用戶相關(guān)聯(lián)的語(yǔ)音。
在一個(gè)或者多個(gè)示例中,可以在硬件、軟件、固件或者它們的任何組合中實(shí)現(xiàn)所描述的功能。如果在軟件中實(shí)現(xiàn),功能可以作為一個(gè)或者多個(gè)指令或者代碼存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上或者通過(guò)該計(jì)算機(jī)可讀介質(zhì)傳送,并且由基于硬件的處理單元執(zhí)行。計(jì)算機(jī)可讀介質(zhì)可以包括:計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其與有形介質(zhì)(諸如,數(shù)據(jù)存儲(chǔ)介質(zhì))對(duì)應(yīng);或者通信介質(zhì),其包括:促進(jìn)例如根據(jù)通信協(xié)議將計(jì)算機(jī)程序從一個(gè)地方轉(zhuǎn)移至另一個(gè)地方的任何介質(zhì)。以這種方式,計(jì)算機(jī)可讀介質(zhì)大體上可以與以下相對(duì)應(yīng)(1)非暫時(shí)性的有形計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)或者(2)通信介質(zhì)(諸如,信號(hào)或者載波)。數(shù)據(jù)存儲(chǔ)介質(zhì)可以是任何可用介質(zhì),該任何可用介質(zhì)可以由一個(gè)或者多個(gè)計(jì)算機(jī)或者一個(gè)或者多個(gè)處理器訪問(wèn),以檢索用于實(shí)現(xiàn)本公開(kāi)所描述的技術(shù)的指令、代碼、和/或數(shù)據(jù)結(jié)構(gòu)。計(jì)算機(jī)程序產(chǎn)品可以包括計(jì)算機(jī)可讀介質(zhì)。
通過(guò)示例而非限制的方式,這種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以包括RAM、ROM、EEPROM、CD-ROM或者其它光盤(pán)存儲(chǔ)、磁盤(pán)存儲(chǔ)、或者其它磁盤(pán)存儲(chǔ)設(shè)備、閃存、或者可以用于存儲(chǔ)以指令或者數(shù)據(jù)結(jié)構(gòu)的形式的期望程序代碼并且計(jì)算機(jī)可以訪問(wèn)的任何其它介質(zhì)。同樣,將任何連接適當(dāng)?shù)胤Q為計(jì)算機(jī)可讀介質(zhì)。例如,如果通過(guò)使用同軸電纜、光纖電纜、雙絞線、數(shù)字訂戶線(DSL)、或者無(wú)線技術(shù)(諸如,紅外線、無(wú)線電和微波)來(lái)從網(wǎng)站、服務(wù)器或者其它遠(yuǎn)程源傳送指令,那么同軸電纜、光纖電纜、雙絞線、DSL、或者無(wú)線技術(shù)(諸如,紅外線、無(wú)線電和微波)包括在介質(zhì)的定義范圍內(nèi)。然而,應(yīng)該理解,該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和數(shù)據(jù)存儲(chǔ)介質(zhì)不包括連接、載波、信號(hào)、或者其它暫時(shí)性介質(zhì),但是反而涉及非暫時(shí)性、有形存儲(chǔ)介質(zhì)。本文所使用的磁盤(pán)和光盤(pán)包括:緊湊片(CD)、激光盤(pán)、光盤(pán)、數(shù)字多功能光盤(pán)(DVD)、軟盤(pán)和藍(lán)光盤(pán),其中,磁盤(pán)通常以磁的方式重現(xiàn)數(shù)據(jù),然而光盤(pán)利用激光來(lái)光重現(xiàn)數(shù)據(jù)。以上的組合還應(yīng)該包括在計(jì)算機(jī)可讀介質(zhì)的范圍內(nèi)。
指令可以由一個(gè)或者多個(gè)處理器執(zhí)行,所述處理器諸如,一個(gè)或者多個(gè)數(shù)字信號(hào)處理器(DSP)、通用微處理器、專(zhuān)用集成電路(ASIC)、現(xiàn)場(chǎng)可編程序邏輯陣列(FPGA)、或者其它等效的集成或者分立邏輯電路系統(tǒng)。因此,所使用的術(shù)語(yǔ)“處理器”可以指的是任何前述結(jié)構(gòu)或者適合實(shí)現(xiàn)所描述的技術(shù)的任何其它結(jié)構(gòu)。另外,在一些方面中,可以在專(zhuān)用硬件和/或軟件模塊內(nèi)提供所描述的功能。同樣,可以在一個(gè)或者多個(gè)電路或者邏輯元件中完全實(shí)現(xiàn)技術(shù)。
可以在各種各樣的設(shè)備或者裝置(包括無(wú)線手機(jī)、集成電路(IC)或者IC集(例如,芯片集))中實(shí)現(xiàn)本公開(kāi)的技術(shù)。在本公開(kāi)中描述了各種組件、模塊、或者單元,以強(qiáng)調(diào)被配置為執(zhí)行所公開(kāi)的技術(shù),但是不一定需要由不同的硬件單元實(shí)現(xiàn)的設(shè)備的功能方面。確切地說(shuō),如上面所描述的,結(jié)合合適的軟件和/或固件,各種單元可以結(jié)合在硬件單元中或者通過(guò)可互操作的硬件單元集(包括上面所描述的一個(gè)或者多個(gè)處理器)而提供。
應(yīng)認(rèn)識(shí)到,取決于實(shí)施例,本文所述的方法的任何一個(gè)的某些動(dòng)作或事件可以按不同順序執(zhí)行,可以添加、合并或者同時(shí)省去(例如,并非所述的動(dòng)作或事件對(duì)實(shí)施該方法是必要的)。此外,在某些實(shí)施例中,可以同時(shí)執(zhí)行動(dòng)作或事件,例如通過(guò)多線程處理、中斷處理或多處理器,而不是順序執(zhí)行。
在整個(gè)本公開(kāi)中,描述了僅當(dāng)計(jì)算設(shè)備從用戶接收允許這樣做的許可時(shí)計(jì)算設(shè)備和/或計(jì)算系統(tǒng)才可以訪問(wèn)和/或分析與計(jì)算設(shè)備相關(guān)聯(lián)的信息(例如執(zhí)行應(yīng)用、位置、速度、日歷、通信、音頻數(shù)據(jù)等)的示例。例如,在下述計(jì)算設(shè)備可以收集或可以利用與用戶相關(guān)聯(lián)的場(chǎng)境信息和/或與計(jì)算設(shè)備相關(guān)聯(lián)的場(chǎng)境信息的情形中,可以為用戶提供機(jī)會(huì)來(lái)提供輸入以控制計(jì)算設(shè)備的程序或特征是否能收集和利用這些信息,或規(guī)定計(jì)算設(shè)備是否可以存儲(chǔ)這些信息和/或存儲(chǔ)多久。此外,如果允許收集任何數(shù)據(jù),在數(shù)據(jù)由計(jì)算設(shè)備和/或計(jì)算系統(tǒng)存儲(chǔ)或使用前,計(jì)算設(shè)備可以以一個(gè)或多個(gè)方式處理某些數(shù)據(jù),使得去除個(gè)人可識(shí)別信息。例如,在獲得用于計(jì)算設(shè)備的位置信息后,可以概括地理位置(諸如到市、ZIP碼或州級(jí)),使得不能確定計(jì)算設(shè)備或用戶的特定位置。由此,用戶有權(quán)控制如何收集有關(guān)用戶的信息和計(jì)算設(shè)備如何使用該信息。
已經(jīng)描述了各種示例。這些示例和其它示例在所附權(quán)利要求書(shū)的范圍內(nèi)。