本申請要求于2014年4月18日提交的美國專利申請No.14/256547的權(quán)益,因此其全部內(nèi)容通過引用合并于此。
技術(shù)領(lǐng)域
所公開的主題涉及用于呈現(xiàn)與媒體內(nèi)容相關(guān)的音樂項的方法、系統(tǒng)和介質(zhì)。
背景技術(shù):
在觀看媒體內(nèi)容(例如,電視節(jié)目、電影等)時,觀眾經(jīng)常對與所述媒體內(nèi)容有關(guān)的音樂內(nèi)容感興趣。例如,觀眾可能想要回顧與在媒體內(nèi)容中所播放的一段音樂(例如,歌曲)有關(guān)的信息。作為另一個示例,觀眾在一段音樂在媒體內(nèi)容中播放和/或由另一個藝術(shù)家表演時可能想要訪問、共享和/或購買包含所述音樂的音樂項(例如,音頻片段、視頻片段等)。
為了使用傳統(tǒng)搜索引擎搜索與所述媒體內(nèi)容有關(guān)的音樂內(nèi)容,觀眾可能必須要形成包括與媒體內(nèi)容中所播放的一段特定音樂相關(guān)聯(lián)的搜索項的搜索查詢,并且可能必須通過搜索結(jié)果進(jìn)行點擊從而找到包括與這段音樂有關(guān)的信息的網(wǎng)頁。這可能對于觀眾而言可能是耗時且麻煩的過程,特別是在所述觀眾并不知道可能指向用戶所尋找的那段音樂的搜索項(例如,歌曲名稱)時更是如此。此外,觀眾可能不許進(jìn)行多次搜索來回顧與媒體內(nèi)容中所播放的多段音樂有關(guān)的信息。
因此,需要用于呈現(xiàn)與媒體內(nèi)容有關(guān)的音樂項的新機(jī)制。
技術(shù)實現(xiàn)要素:
根據(jù)所公開主題的一些實施方式,提供了用于呈現(xiàn)與媒體內(nèi)容有關(guān)的音樂項的方法、系統(tǒng)和介質(zhì)。
根據(jù)所公開主題的一些實施方式,提供了用于呈現(xiàn)與媒體內(nèi)容有關(guān)的音樂項的方法,所述方法包括:檢測包括音樂內(nèi)容的媒體內(nèi)容項的多個音樂分段;識別在所述多個音樂分段中所播放的多段音樂;使用硬件處理器生成包括與所述多段音樂相關(guān)的信息的播放列表;使得所述播放列表被呈現(xiàn)給用戶;接收對所述播放列表中與所述多個音樂分段中的第一音樂分段中所播放的一段音樂相對應(yīng)的部分的用戶選擇;以及響應(yīng)于接收所述用戶選擇而使得與匹配所述第一音樂分段的多個音樂項有關(guān)的信息被呈現(xiàn)。
根據(jù)所公開主題的一些實施方式,提供了用于呈現(xiàn)與媒體內(nèi)容有關(guān)的音樂項的系統(tǒng),所述系統(tǒng)包括:至少一個硬件處理器,該硬件處理器被配置為:檢測包括音樂內(nèi)容的媒體內(nèi)容項的多個音樂分段;識別在所述多個音樂分段中所播放的多段音樂;生成包括與所述多段音樂相關(guān)的信息的播放列表;使得所述播放列表被呈現(xiàn)給用戶;接收對所述播放列表中與所述多個音樂分段中的第一音樂分段中所播放的一段音樂相對應(yīng)的部分的用戶選擇;以及響應(yīng)于接收所述用戶選擇而使得與匹配所述第一音樂分段的多個音樂項有關(guān)的信息被呈現(xiàn)。
根據(jù)所公開主題的一些實施方式,提供了包含計算機(jī)可執(zhí)行指令的非暫時性計算機(jī)可讀介質(zhì),所述指令當(dāng)被處理器所執(zhí)行時,使得所述處理器執(zhí)行一種用于呈現(xiàn)與媒體內(nèi)容有關(guān)的音樂項的方法。在一些實施方式中,所述方法包括:檢測包括音樂內(nèi)容的媒體內(nèi)容項的多個音樂分段;識別在所述多個音樂分段中所播放的多段音樂;使用硬件處理器生成包括與所述多段音樂相關(guān)的信息的播放列表;使得所述播放列表被呈現(xiàn)給用戶;接收對所述播放列表中與所述多個音樂分段中的第一音樂分段中所播放的一段音樂相對應(yīng)的部分的用戶選擇;以及響應(yīng)于接收到所述用戶選擇而使得與匹配所述第一音樂分段的多個音樂項有關(guān)的信息被呈現(xiàn)。
附圖說明
在結(jié)合以下附圖進(jìn)行考慮時,所公開主題的各種對象、特征和優(yōu)勢能夠參考所公開主題的以下詳細(xì)描述而被更為全面地理解,其中相同的附圖標(biāo)記識別相同的元素。
圖1示出了根據(jù)所公開主題的一些實施方式的用于呈現(xiàn)與媒體內(nèi)容有關(guān)的音樂項的系統(tǒng)的示例的泛化的框圖。
圖2示出了根據(jù)所公開主題的一些實施方式的能夠在服務(wù)器、數(shù)字娛樂系統(tǒng)和/或移動設(shè)備中使用的硬件的示例。
圖3示出了根據(jù)所公開主題的一些實施方式的用于呈現(xiàn)與媒體內(nèi)容有關(guān)的音樂項的過程的示例的流程圖。
圖4示出了根據(jù)所公開主題的一些實施方式的用于生成與媒體內(nèi)容項有關(guān)的音樂內(nèi)容的播放列表的過程的示例的流程圖。
圖5示出了根據(jù)所公開主題的一些實施方式的用于識別匹配媒體內(nèi)容項的一部分的音樂項的過程的示例的流程圖。
具體實施方式
根據(jù)各種實施方式,如以下更為詳細(xì)描述的,提供了能夠包括用于呈現(xiàn)與媒體內(nèi)容有關(guān)的音樂項的系統(tǒng)、方法和計算機(jī)可讀介質(zhì)的機(jī)制。
所述機(jī)制能夠關(guān)于任意適當(dāng)?shù)拿襟w內(nèi)容來實現(xiàn)。例如,媒體內(nèi)容能夠包括任意適當(dāng)類型的內(nèi)容,諸如以下一種或多種:音頻內(nèi)容、視頻內(nèi)容、文本、圖形、多媒體內(nèi)容、字幕內(nèi)容、和/或任意其它適當(dāng)內(nèi)容。作為另一個示例,媒體內(nèi)容可以由任意適當(dāng)源所提供,所述源諸如電視提供方、視頻托管和/或流服務(wù)、視頻錄影機(jī)和/或任意其它適當(dāng)?shù)膬?nèi)容提供方。作為又另一個示例,媒體內(nèi)容可以具有任意適當(dāng)?shù)母袷?,諸如以下一種或多種:JPEG、H.264、MPEG-4AVC、MPEG-7、MP4、MP3、ASCII碼、和/或任意其它適當(dāng)?shù)母袷健?/p>
在一些實施方式中,音樂項能夠包含任意適當(dāng)?shù)囊魳穬?nèi)容,諸如一段或多段的器樂、背景音樂、歌曲和/或任意其它的適當(dāng)音樂內(nèi)容。在一些實施方式中,音樂項可以包括任意適當(dāng)?shù)拿襟w內(nèi)容,諸如音頻內(nèi)容、視頻內(nèi)容和/或任意其它適當(dāng)?shù)拿襟w內(nèi)容。在一些實施方式中,音樂項可以包括一個或多個音頻文件、視頻文件、多媒體文件和/或任意其它適當(dāng)?shù)拿襟w文件,并且可以具有任意適當(dāng)?shù)母袷剑T如MP3、WAV、WMA、H.264、MPEG-4AVC、MPEG-7、MP4,和/或任意其它適當(dāng)?shù)拿襟w格式。
這些機(jī)制能夠執(zhí)行各種功能。例如,所述機(jī)制能夠在媒體內(nèi)容項的呈現(xiàn)之前、期間和/或之后為用戶呈現(xiàn)與媒體內(nèi)容項(例如,電視節(jié)目、電影、錄制節(jié)目、音樂和/或任意其它適當(dāng)媒體內(nèi)容項)有關(guān)的音樂內(nèi)容的完整播放列表。在一些實施方式中,播放列表可以包括與和媒體內(nèi)容項相關(guān)聯(lián)進(jìn)行播放的每段音樂有關(guān)的任意適當(dāng)信息。在一些實施方式中,與媒體內(nèi)容項相關(guān)聯(lián)進(jìn)行播放的一段音樂可以是歌曲、器樂、背景音樂,和/或在媒體內(nèi)容項的一個或多個部分(例如,視頻場景、片頭字幕、片尾字幕、商業(yè)廣告、蒙太奇鏡頭,和/或媒體內(nèi)容項的任意其它適當(dāng)部分)中所播放的任意其它適當(dāng)音樂內(nèi)容。
作為另一個示例,所述機(jī)制能夠通過連同媒體內(nèi)容項所播放的音樂內(nèi)容的播放列表一起呈現(xiàn)與音樂項有關(guān)的信息(例如,指向音樂項中的一個或多個的鏈接),來提示用戶對與該媒體內(nèi)容項有關(guān)的音樂項進(jìn)行共享、購買、消費和/或采取任意其它適當(dāng)動作。在一些實施方式中,響應(yīng)于接收對所述播放列表中與媒體內(nèi)容項中所播放的一段音樂相對應(yīng)和/或與這段音樂有關(guān)的音樂項的用戶選擇,所述機(jī)制能夠為用戶呈現(xiàn)與涉及到這段音樂的一個或多個音樂項有關(guān)的信息(例如,通過呈現(xiàn)包括這樣的信息和/或允許用戶消費、購買和/或共享所述音樂項的網(wǎng)頁)。在一些實施方式中,與在媒體內(nèi)容項中所播放的給定的一段音樂(例如,一首歌曲)有關(guān)的音樂項能夠包括在媒體內(nèi)容項中所播放的這段音樂的原始音軌,由不同藝術(shù)家所表演的這段音樂的音軌,這段音樂和/或傳達(dá)所述媒體內(nèi)容項所傳達(dá)的情感的不同的一段音樂的音軌,和/或能夠被視為與這段音樂匹配的任意其它適當(dāng)?shù)囊纛l/視頻內(nèi)容。
在一些實施方式中,所述機(jī)制能夠接收與媒體內(nèi)容項相對應(yīng)的音頻樣本并且能夠隨后基于所述音頻樣本的音頻指紋來識別所述媒體內(nèi)容。例如,所述機(jī)制能夠?qū)⑺鲆纛l指紋與由媒體內(nèi)容項所存儲并索引的基準(zhǔn)音頻指紋進(jìn)行比較。在一些實施方式中,當(dāng)識別出匹配的基準(zhǔn)音頻指紋之后,所述機(jī)制能夠識別將與所述匹配的基準(zhǔn)音頻指紋相關(guān)聯(lián)的媒體內(nèi)容項識別為與所述音頻樣本相關(guān)聯(lián)的媒體內(nèi)容項。
在一些實施方式中,所述機(jī)制能夠檢索與媒體內(nèi)容項相關(guān)聯(lián)的音頻信號并且識別出所述音頻信號中包括音樂內(nèi)容的一個或多個分段。例如,所述機(jī)制能夠使用任意適當(dāng)音頻分段技術(shù)將與媒體內(nèi)容項相關(guān)聯(lián)的音頻信號劃分為多個分段(例如,音頻場景)。所述機(jī)制隨后將每個分段歸類為一個類別,諸如“靜音”、“話音”、“音樂”、“歌曲”、“具有音樂背景的話音”、“噪聲”和/或任意其它適當(dāng)類別。在一些實施方式中,所述機(jī)制能夠在音頻信號分段被歸類為“音樂”、“歌曲”、“具有音樂背景的話音”和/或與包括音樂內(nèi)容的音頻內(nèi)容相對應(yīng)的任意其它適當(dāng)類別時將所述音頻信號的所述分段識別為包括音樂內(nèi)容的分段。在一些實施方式中,所述機(jī)制能夠?qū)⒚襟w內(nèi)容項中與所識別音樂分段相對應(yīng)的一個或多個部分識別為所述媒體內(nèi)容項的音樂分段。
在一些實施方式中,所述機(jī)制能夠搜索與媒體內(nèi)容項的音樂分段相匹配的音樂項。例如,在音樂項和音樂分段包含匹配的音樂內(nèi)容(例如,一首歌曲、一段音樂,和/或相同藝術(shù)家和/或不同藝術(shù)家所表演的任意其它適當(dāng)音樂內(nèi)容)、匹配的音頻內(nèi)容、匹配的視頻內(nèi)容和/或任意其它適當(dāng)?shù)钠ヅ鋬?nèi)容時,所述機(jī)制能夠?qū)⑺鲆魳讽椬R別為與媒體內(nèi)容項的給定音樂分段相匹配。除此之外或替選地,所述音樂項和音樂分段能夠與匹配的情感指示符(例如,“快樂”、“悲傷”、“激動”、“中性”和/或任意其它適當(dāng)情感)相關(guān)聯(lián)。
在一些實施方式中,所述機(jī)制能夠生成與媒體內(nèi)容項相對應(yīng)的音樂內(nèi)容的播放列表。在一些實施方式中,所述播放列表可以包括與所述媒體內(nèi)容項中所播放的多段音樂(例如,歌曲、器樂、背景音樂和/或任意其它適當(dāng)音樂內(nèi)容)相關(guān)的任意適當(dāng)信息。此外,所述播放列表可以包括和與一段或多段音樂相匹配的音樂項有關(guān)的信息。
在一些實施方式中,所述播放列表可以在媒體內(nèi)容項結(jié)束時被自動呈現(xiàn)。在一些實施方式中,所述機(jī)制能夠響應(yīng)于針對與媒體內(nèi)容項有關(guān)的音樂內(nèi)容的搜索查詢而向用戶呈現(xiàn)所述播放列表,上述搜索查詢諸如包括與所述媒體內(nèi)容項相對應(yīng)的一個或多個搜索項(例如,標(biāo)題)以及指示用戶想要搜索與所述媒體內(nèi)容項有關(guān)的音樂內(nèi)容的一個或多個搜索項(例如,“音樂”、“音軌”和/或任意其它適當(dāng)搜索項)的搜索查詢。
在一些實施方式中,所述機(jī)制能夠為用戶呈現(xiàn)媒體內(nèi)容項的列表,其中,響應(yīng)于針對與這段音樂有關(guān)的媒體內(nèi)容項的搜索查詢而播放一段特定音樂。例如,這樣的搜索查詢可以包括與這段音樂相對應(yīng)的一個或多個搜索項(例如,這段音樂的標(biāo)題)以及指示用戶想要搜索與這段音樂有關(guān)的媒體內(nèi)容項的一個或多個搜索項(例如,“電影”、“音樂”、“節(jié)目”和/或指示這樣的期望的任意其它適當(dāng)搜索項)。
轉(zhuǎn)向圖1,根據(jù)所公開主題的一些實施方式而示出了用于呈現(xiàn)與媒體內(nèi)容有關(guān)的音樂項的系統(tǒng)的示例100的泛化的框圖。如所圖示的,系統(tǒng)100可以包括一個或多個服務(wù)器102、通信網(wǎng)絡(luò)104、數(shù)字娛樂系統(tǒng)106、一個或多個移動設(shè)備108、通信鏈路110、112、114和116,和/或任意其它適當(dāng)組件。在一些實施方式中,如圖3至圖5中所圖示的過程300、400和500的一個或多個適當(dāng)部分能夠在系統(tǒng)100的一個或多個組件中實現(xiàn)。例如,過程300、400和500的一個或多個適當(dāng)部分能夠在系統(tǒng)100的服務(wù)器102、數(shù)字娛樂系統(tǒng)106和移動設(shè)備108中的一個或多個上運行。
服務(wù)器102可以包括能夠搜索與媒體內(nèi)容有關(guān)的音樂項,對媒體內(nèi)容執(zhí)行視頻匹配、音頻匹配、歌詞匹配和/或情感匹配分析,生成與媒體內(nèi)容項有關(guān)的音樂內(nèi)容的播放列表,和/或執(zhí)行任意其它適當(dāng)功能的任意適當(dāng)設(shè)備,諸如硬件處理器、計算機(jī)、數(shù)據(jù)處理設(shè)備或者這樣的設(shè)備的組合。
數(shù)字娛樂系統(tǒng)106可以包括能夠接收、轉(zhuǎn)換、處理、渲染和/或傳送媒體內(nèi)容,生成、接收、處理、傳送和/或呈現(xiàn)與媒體內(nèi)容項有關(guān)的音樂內(nèi)容的播放列表,和/或執(zhí)行任意其它適當(dāng)功能的任意適當(dāng)設(shè)備。例如,數(shù)字娛樂系統(tǒng)106可以包括機(jī)頂盒、數(shù)字媒體接收器、DVD播放器、藍(lán)光播放器、游戲機(jī)、臺式計算機(jī)、膝上計算機(jī)、平板計算機(jī)、移動電話,和/或任意其它適當(dāng)設(shè)備,和/或它們的任意其它適當(dāng)組合。
移動設(shè)備108可以包括能夠接收用戶輸入,生成和/或呈現(xiàn)與音樂內(nèi)容項有關(guān)的音樂內(nèi)容的播放列表的任意適當(dāng)設(shè)備,諸如移動電話、平板計算機(jī)、膝上計算機(jī)、臺式計算機(jī)、個人數(shù)字助理(PDA)、便攜式電子郵件設(shè)備和/或任意其它適當(dāng)設(shè)備。
在一些實施方式中,服務(wù)器102、數(shù)字娛樂系統(tǒng)106和移動設(shè)備108中的每一個能夠被實現(xiàn)為獨立設(shè)備或者與系統(tǒng)100的其它組件進(jìn)行整合。
通信網(wǎng)絡(luò)104可以是任意適當(dāng)?shù)挠嬎銠C(jī)網(wǎng)絡(luò),諸如互聯(lián)網(wǎng)、企業(yè)內(nèi)部網(wǎng)、廣域網(wǎng)(“WAN”)、局域網(wǎng)(“LAN”)、無線網(wǎng)絡(luò)、數(shù)字訂戶線路(“DSL”)網(wǎng)絡(luò)、幀中繼網(wǎng)絡(luò)、異步傳輸模式(“ATM”)網(wǎng)絡(luò)、虛擬私人網(wǎng)絡(luò)(“VPN”)、衛(wèi)星網(wǎng)絡(luò)、移動電話網(wǎng)絡(luò)、移動數(shù)據(jù)網(wǎng)絡(luò)、有線網(wǎng)絡(luò)、電話網(wǎng)絡(luò)、光纖網(wǎng)絡(luò)和/或任意其它適當(dāng)通信網(wǎng)絡(luò),或者任意這樣的網(wǎng)絡(luò)的任意組合。
在一些實施方式中,服務(wù)器102、數(shù)字娛樂系統(tǒng)106和移動設(shè)備108能夠分別通過通信鏈路110、112和114連接至通信網(wǎng)絡(luò)104。在一些實施方式中,數(shù)字娛樂系統(tǒng)106能夠通過通信鏈路116連接至移動設(shè)備108。在一些實施方式中,通信鏈路110、112、114和116可以是任意適當(dāng)?shù)耐ㄐ沛溌?,諸如網(wǎng)絡(luò)鏈路、撥號鏈路、無線鏈路、硬線鏈路、任意其它適當(dāng)?shù)耐ㄐ沛溌?,或者這樣的鏈路的組合。
服務(wù)器102、數(shù)字娛樂系統(tǒng)106和移動設(shè)備108中的每一個能夠包括和/或作為諸如計算機(jī)的通用設(shè)備或者諸如客戶端、服務(wù)器的專用設(shè)備中的任意一種,和/或任意其它的適當(dāng)設(shè)備。任何這樣的通用計算機(jī)或?qū)S糜嬎銠C(jī)都能夠包括任意適當(dāng)?shù)挠布?。例如,如圖2的示例硬件200中所示,這樣的硬件可以包括硬件處理器202、存儲器和/或存儲204、輸入設(shè)備控制器206、輸入設(shè)備208、顯示/音頻驅(qū)動器210、顯示和音頻輸出電路212、通信接口214、天線216和總線218。
硬件處理器202可以包括任意適當(dāng)?shù)挠布幚砥?,在一些實施方式中諸如微處理器、微型控制器、數(shù)字信號處理器、專用邏輯,和/或用于控制通用計算機(jī)或?qū)S糜嬎銠C(jī)的功能的任意其它適當(dāng)電路。
存儲器和/或存儲204可以是在一些實施方式中用于存儲程序、數(shù)據(jù)、媒體內(nèi)容和/或任意其它適當(dāng)內(nèi)容的任意適當(dāng)存儲器和/或存儲。例如,存儲器和/或存儲204可以包括隨機(jī)存取存儲器、只讀存儲器、閃速存儲器、硬盤存儲、光學(xué)介質(zhì)和/或任意其它適當(dāng)存儲設(shè)備。
在一些實施方式中,輸入設(shè)備控制器206可以是用于控制一個或多個輸入設(shè)備208并且從一個或多個輸入設(shè)備208接收輸入的任意適當(dāng)電路。例如,輸入設(shè)備控制器206能夠是用于從觸摸屏、從一個或多個按鈕、從語音識別電路、從麥克風(fēng)、從相機(jī)、從光學(xué)傳感器、從加速計、從溫度傳感器、從近場傳感器和/或用于接收用戶輸入的任意其它電路接收輸入的電路。
在一些實施方式中,顯示/音頻驅(qū)動器210可以是用于控制一個或多個顯示器和音頻輸出電路212并且針對其驅(qū)動輸出的任意適當(dāng)電路。例如,顯示/音頻驅(qū)動器210可以是用于驅(qū)動LCD顯示器、揚聲器、LED和/或任意其它顯示/音頻設(shè)備的電路。
在一些實施方式中,通信接口214可以是用于與諸如通信網(wǎng)絡(luò)104的一個或多個通信網(wǎng)絡(luò)進(jìn)行對接的任意適當(dāng)電路。例如,接口214可以包括網(wǎng)絡(luò)接口卡電路、無線通信電路,和/或用于與一個或多個通信網(wǎng)絡(luò)進(jìn)行對接的任意其它適當(dāng)電路。
在一些實施方式中,天線216可以是用于與通信網(wǎng)絡(luò)進(jìn)行無線通信的任意適當(dāng)?shù)囊粋€或多個天線。在一些實施方式中,天線216在不需要時可以被省略。
在一些實施方式中,總線218可以是用于在組件202、204、206、210和214中的兩個或更多之間進(jìn)行通信的任意適當(dāng)機(jī)制。
根據(jù)一些實施方式,任意其它適當(dāng)?shù)慕M件能夠被包括在硬件200中。
在一些實施方式中,能夠使用任意適當(dāng)?shù)挠嬎銠C(jī)可讀介質(zhì)來存儲用于執(zhí)行本文中所描述的過程的指令。例如,在一些實施方式中,計算機(jī)可讀介質(zhì)可以是暫時性或非暫時性的。例如,非暫時性計算機(jī)可讀介質(zhì)能夠包括諸如磁性介質(zhì)(諸如硬盤、軟盤和/或任意其他適當(dāng)?shù)慕橘|(zhì)等)、光學(xué)介質(zhì)(諸如緊湊盤、數(shù)字視頻盤、藍(lán)光盤和/或任意其他適當(dāng)?shù)墓鈱W(xué)介質(zhì)等)、半導(dǎo)體介質(zhì)(諸如閃速存儲器、電可編程只讀存儲器(EPROM)、電可擦除可編程只讀存儲器(EEPROM)和/或任意其他適當(dāng)?shù)陌雽?dǎo)體介質(zhì)等)的介質(zhì),在傳輸期間并不丟失或缺乏任何永久的外觀的任意適當(dāng)介質(zhì)和/或任意適當(dāng)有形介質(zhì)。作為另一個示例,暫時性計算機(jī)可讀介質(zhì)可以包括網(wǎng)絡(luò)上的信號,線路、導(dǎo)體、光纖、電路中的信號,在傳輸期間丟失或缺乏任何永久的外觀的任意適當(dāng)介質(zhì),和/或任意適當(dāng)非有形介質(zhì)。
轉(zhuǎn)向圖3,根據(jù)所公開主題的一些實施方式而示出了用于呈現(xiàn)與媒體內(nèi)容有關(guān)的音樂項的過程的示例300的流程圖。在一些實施方式中,過程300的一個或多個部分能夠由一個或多個硬件處理器來實現(xiàn),諸如圖1的數(shù)字娛樂系統(tǒng)106和/或移動設(shè)備108的硬件處理器。
如所圖示的,處理300可以通過在305處呈現(xiàn)媒體內(nèi)容項而開始。在一些實施方式中,所述媒體內(nèi)容項可以包括任意適當(dāng)?shù)拿襟w內(nèi)容并且能夠由任意適當(dāng)?shù)脑此峁?。例如,媒體內(nèi)容項可以是由電視提供方所廣播的節(jié)目、所錄制的視頻節(jié)目、點播節(jié)目、視頻流和/或托管服務(wù)所提供的流節(jié)目,和/或任意其它適當(dāng)?shù)拿襟w內(nèi)容。在一些實施方式中,所述媒體內(nèi)容項能夠使用任意適當(dāng)?shù)脑O(shè)備來呈現(xiàn),諸如以上結(jié)合圖1和圖2所描述的數(shù)字娛樂系統(tǒng)。
在310處,過程300能夠獲得媒體內(nèi)容項的音頻樣本。所述音頻樣本能夠以任意適當(dāng)方式獲得。例如,過程300能夠激活音頻輸入設(shè)備(例如,麥克風(fēng)),后者被配置為從其周邊捕獲音頻數(shù)據(jù)并且能夠指令音頻輸入設(shè)備捕獲并錄制與所述媒體內(nèi)容項相關(guān)聯(lián)的音頻樣本或任意其它適當(dāng)音頻數(shù)據(jù)。作為另一個示例,過程300能夠錄制數(shù)字娛樂系統(tǒng)的視頻和/或音頻輸出,并且能夠隨后響應(yīng)于所述視頻和/或音頻輸出而生成音頻樣本。在一些實施方式中,過程300能夠提取數(shù)字?jǐn)?shù)據(jù),后者能夠被用來從音頻樣本和/或表示所述媒體內(nèi)容項的任意其它適當(dāng)信號識別所述媒體內(nèi)容項。
應(yīng)當(dāng)注意的是,在使用音頻輸入設(shè)備接收音頻樣本或任意其它音頻數(shù)據(jù)之前,過程300能夠為用戶(例如,本文中所描述的機(jī)制所提供的服務(wù)的用戶、作者、版權(quán)所有者、藝術(shù)家、音樂提供方和/或能夠關(guān)于在媒體內(nèi)容項中所播放的一段音樂主張合法權(quán)利的任意其它適當(dāng)用戶,和/或任意其它適當(dāng)用戶)提供同意或授權(quán)執(zhí)行動作的機(jī)會,所述動作諸如激活音頻輸入設(shè)備,獲得音頻樣本和/或音頻數(shù)據(jù),和/或傳送音頻樣本和/或音頻數(shù)據(jù)。例如,當(dāng)在諸如電視設(shè)備或媒體播放設(shè)備的數(shù)字娛樂系統(tǒng)和/或移動設(shè)備上加載應(yīng)用之后,所述應(yīng)用能夠提示用戶提供用于以下動作的授權(quán):激活音頻輸入設(shè)備、收集音頻樣本和/或音頻數(shù)據(jù)、傳送音頻樣本和/或音頻數(shù)據(jù),和/或執(zhí)行任意其它適當(dāng)動作。在更為特定的示例中,響應(yīng)于下載所述應(yīng)用并且在數(shù)字娛樂系統(tǒng)和/或移動設(shè)備上加載所述應(yīng)用,能夠利用請求(或要求)所述用戶在執(zhí)行這些動作之前提供同意的消息來提示用戶。除此之外或替選地,響應(yīng)于安裝了所述應(yīng)用,能夠利用請求(或要求)所述用戶在收集音頻樣本和/或音頻數(shù)據(jù)和/或傳送與音頻樣本有關(guān)的信息之前提供同意的消息來提示用戶。
在315處,過程300能夠識別媒體內(nèi)容項。在一些實施方式中,能夠使用與所述媒體內(nèi)容項有關(guān)的任意適當(dāng)?shù)淖R別信息來識別所述媒體內(nèi)容項,上述識別信息諸如內(nèi)容標(biāo)識符(例如,節(jié)目標(biāo)識符、統(tǒng)一資源標(biāo)識符(URI),和/或能夠被用來識別媒體內(nèi)容項的任意其它適當(dāng)標(biāo)識符)、標(biāo)題、描述、頻道編號、開始時間、結(jié)束時間、系列編號、分集編號,和/或能夠被用來識別媒體內(nèi)容項的任意其它適當(dāng)信息。
在一些實施方式中,與媒體內(nèi)容項有關(guān)的識別信息能夠以任意適當(dāng)方式被獲得。例如,過程300能夠針對與媒體內(nèi)容項有關(guān)的識別信息而查詢服務(wù)器。在更為特定的示例中,過程300能夠?qū)⒁纛l樣本和/或從所述音頻樣本所生成的音頻指紋傳送至服務(wù)器。所述服務(wù)器隨后能夠通過將所生成的音頻指紋與和多個媒體內(nèi)容項相關(guān)聯(lián)進(jìn)行存儲的多個基準(zhǔn)音頻指紋進(jìn)行比較來識別與所述音頻樣本相對應(yīng)的媒體內(nèi)容項(例如,圖4的步驟405至415)。
作為另一個示例,過程300能夠查詢數(shù)字娛樂系統(tǒng)(例如,圖1的數(shù)字娛樂系統(tǒng)106)、移動設(shè)備(例如,圖1的移動設(shè)備108),和/或呈現(xiàn)媒體內(nèi)容項以便識別與所述媒體內(nèi)容項有關(guān)的信息的任意其它適當(dāng)設(shè)備,上述信息諸如數(shù)字娛樂系統(tǒng)所調(diào)諧至的頻道,通過其流式傳輸媒體內(nèi)容的URL,和/或能夠用來識別媒體內(nèi)容項的任意其它適當(dāng)信息。
在320處,過程300能夠接收在所述媒體內(nèi)容項中所播放的音樂內(nèi)容的播放列表。在一些實施方式中,所述播放列表能夠包括在所述媒體內(nèi)容項中所播放的音樂內(nèi)容的列表,上述音樂內(nèi)容諸如歌曲、器樂、背景音樂,和/或在所述媒體內(nèi)容項的一個分段中所播放的任意其它適當(dāng)音樂內(nèi)容。在一些實施方式中,如結(jié)合圖4所描述的,能夠使用過程400而生成所述播放列表。
在一些實施方式中,所述播放列表能夠包括與媒體內(nèi)容項中所播放的給定的一段音樂有關(guān)的任意適當(dāng)信息。例如,所述播放列表能夠包括所述媒體內(nèi)容項中與這段音樂在其中播放的媒體內(nèi)容項分段的開始時間和/或結(jié)束時間。作為另一個示例,所述播放列表能夠包括標(biāo)題、藝術(shù)家、指向包括這段音樂的音樂項的鏈接、提供包括這段音樂的音樂項的音樂提供方,和/或與這段音樂有關(guān)的任意其它適當(dāng)信息。
作為又另一個示例,所述播放列表可以包括和與這段音樂相匹配的一個或多個音樂項和/或包括這段音樂的媒體內(nèi)容項分段有關(guān)的任意適當(dāng)信息。在一些實施方式中,這樣的信息可以包括指向提供與所述音樂項有關(guān)的信息的網(wǎng)站的鏈接(例如,URL),指向用戶能夠經(jīng)由其對一個或多個音樂項進(jìn)行播放、共享、購買和/或采取任意其它適當(dāng)動作的平臺(例如,視頻托管服務(wù)、社交網(wǎng)絡(luò)服務(wù)、媒體播放器服務(wù)器、電子商務(wù)服務(wù),和/或任意其它適當(dāng)平臺)的鏈接,和/或與所述音樂項有關(guān)的任意其它適當(dāng)信息。在一些實施方式中,音樂項可以在所述音樂項和分段包含匹配的音樂內(nèi)容(例如,一首歌曲、一段音樂,和/或相同藝術(shù)家和/或不同藝術(shù)家所表演的任意其它適當(dāng)音樂內(nèi)容)、匹配的音頻內(nèi)容、匹配的視頻內(nèi)容和/或任意其它適當(dāng)匹配內(nèi)容時被認(rèn)為與媒體內(nèi)容項的給定分段相匹配。除此之外或替選地,所述音樂項和媒體內(nèi)容項分段能夠與匹配情感(例如,“快樂”、“悲傷”、“激動”、“中性”和/或任意其它適當(dāng)情感)相關(guān)聯(lián)。在一些實施方式中,如以下結(jié)合圖5所描述的,與媒體內(nèi)容項的分段相匹配的音樂項能夠使用過程500而被檢測。
在325處,過程300能夠呈現(xiàn)在所述媒體內(nèi)容項中所播放的音樂內(nèi)容的播放列表。在一些實施方式中,與一段特定音樂有關(guān)的信息能夠使用所述播放列表中的任意適當(dāng)內(nèi)容進(jìn)行呈現(xiàn),諸如文本、圖像、視頻內(nèi)容、音頻內(nèi)容和/或任意其它適當(dāng)內(nèi)容。在一些實施方式中,過程300能夠呈現(xiàn)播放列表以提示用戶對在與所述媒體內(nèi)容項中播放的不同的多段音樂內(nèi)容有關(guān)的信息(例如,文本片段、URL、縮略圖圖像和/或任意其它適當(dāng)信息)進(jìn)行滾動。
在一些實施方式中,所述播放列表能夠使用任意適當(dāng)設(shè)備進(jìn)行呈現(xiàn)。例如,所述信息能夠被呈現(xiàn)在耦合至正在呈現(xiàn)所述媒體內(nèi)容項的數(shù)字娛樂系統(tǒng)(例如,圖1的數(shù)字娛樂系統(tǒng)106)的顯示器上。除此之外或替選地,所述信息能夠被呈現(xiàn)在移動設(shè)備上,諸如移動電話、平板計算機(jī)、可穿戴計算機(jī)、臺式計算機(jī)和/或任意其它適當(dāng)?shù)囊苿釉O(shè)備。
在一些實施方式中,所述播放列表能夠響應(yīng)于任意適當(dāng)事件而被呈現(xiàn)。例如,所述播放列表能夠在媒體內(nèi)容的呈現(xiàn)已經(jīng)結(jié)束時被呈現(xiàn)。在更為特定的示例中,當(dāng)接收到用戶針對識別當(dāng)前正在呈現(xiàn)的媒體內(nèi)容項和/或呈現(xiàn)在所述媒體內(nèi)容項中所播放的音樂內(nèi)容的播放列表的同意和/或授權(quán)時,過程300能夠在確定所述媒體內(nèi)容項已經(jīng)結(jié)束時呈現(xiàn)所述媒體內(nèi)容項中所播放的音樂內(nèi)容的播放列表。
作為另一個示例,所述播放列表能夠響應(yīng)于接收到針對與所述媒體內(nèi)容項有關(guān)的音樂內(nèi)容的搜索查詢而被呈現(xiàn)。在更為特定的示例中,所述搜索查詢能夠包括與所述媒體內(nèi)容項有關(guān)的一個或多個搜索項(例如,所述媒體內(nèi)容項的標(biāo)題)以及指示用戶想要搜索與所述媒體內(nèi)容有關(guān)的音樂內(nèi)容的一個或多個搜索項(例如,“音樂”、“音軌”和/或指示這樣的期望的任意其它適當(dāng)搜索項)。
在一些實施方式中,在330處,過程300能夠接收對所述媒體內(nèi)容項中所播放的一段音樂的用戶選擇。在一些實施方式中,這段音樂能夠響應(yīng)于對所述播放列表中與所述音樂項相對應(yīng)的任意一個或多個適當(dāng)部分的用戶選擇而被選擇,上述部分諸如這段音樂的文本片段、表示這段音樂的圖像、指向與這段音樂有關(guān)的信息和/或與這段音樂有關(guān)的音樂項的鏈接,和/或所述播放列表中與這段音樂相對應(yīng)的任意其它適當(dāng)部分。
在335處,過程330能夠呈現(xiàn)和與這段音樂相關(guān)聯(lián)的音樂項和/或這段音樂在其中播放的媒體內(nèi)容項分段有關(guān)的信息。在一些實施方式中,過程300能夠呈現(xiàn)與所述音樂項有關(guān)的任意適當(dāng)信息,諸如描述、標(biāo)題、藝術(shù)家、所述音樂項可用的格式、能夠經(jīng)由其獲得所述音樂項的一個或多個平臺(例如,視頻托管服務(wù)、電子商務(wù)平臺、社交網(wǎng)絡(luò)平臺和/或任意其它適當(dāng)平臺)和/或與所述音樂項有關(guān)的任意其它適當(dāng)信息。
在一些實施方式中,與所述音樂項有關(guān)的信息能夠以任意適當(dāng)方式被呈現(xiàn)。例如,過程300能夠使得包括這樣的信息的網(wǎng)頁使用Web瀏覽器、移動應(yīng)用和/或能夠渲染W(wǎng)eb內(nèi)容的任意其它適當(dāng)應(yīng)用而被呈現(xiàn)。作為另一個示例,過程300能夠從存儲設(shè)備、服務(wù)器接收這樣的信息,和/或任意其它適當(dāng)設(shè)備能夠使用任意適當(dāng)內(nèi)容來呈現(xiàn)所述信息,諸如視頻內(nèi)容、音頻內(nèi)容、文本和/或任意其它適當(dāng)內(nèi)容。
轉(zhuǎn)向圖4,根據(jù)所公開主題的一些實施方式而示出了用于生成與媒體內(nèi)容項有關(guān)的音樂內(nèi)容的播放列表的過程的示例400的流程圖。在一些實施方式中,過程400能夠使用一個或多個硬件處理器來實現(xiàn),諸如圖1的服務(wù)器102的處理器。
如所圖示的,過程400可以在405處通過接收與媒體內(nèi)容項相對應(yīng)的音頻樣本而開始。所述音頻樣本可以以任意適當(dāng)方式被生成和/或接收。例如,所述音頻樣本能夠使用音頻輸入設(shè)備生成(例如,圖3的步驟310)并且能夠被傳送至執(zhí)行過程400的一個或多個硬件處理器。
在410處,過程400能夠生成所述音頻樣本的音頻指紋。所述音頻指紋能夠包括所述音頻樣本的一個或多個適當(dāng)音頻特征的任意適當(dāng)數(shù)字表示,其中所述音頻指紋能夠被用來識別音頻數(shù)據(jù)中相同或相似的部分。在一些實施方式中,所述音頻指紋能夠使用任意適當(dāng)?shù)囊纛l指紋算法來生成,諸如二維變換(例如,離散余弦變換)、三維變換(例如,小波變換)、散列函數(shù)等。在更為特定的示例中,能夠針對所述音頻樣本的一個或多個適當(dāng)部分而生成所述音頻樣本的一個或多個特征(例如,峰值、振幅、功率水平、頻率、信噪比和/或任意其它適當(dāng)特征)。所述特征能夠被處理從而形成一個或多個音頻指紋(例如,使用散列函數(shù))。
在一些實施方式中,如以上結(jié)合圖3所描述的,所述音頻指紋能夠由執(zhí)行過程300的一個或多個硬件處理器所生成并且能夠被傳送至服務(wù)器和/或任意其它適當(dāng)設(shè)備以便進(jìn)行分析。
在415處,過程400能夠基于所述音頻樣本的音頻指紋來識別媒體內(nèi)容項。在一些實施方式中,過程400能夠訪問按照媒體內(nèi)容項索引并存儲基準(zhǔn)音頻指紋的數(shù)據(jù)庫,并且能夠搜索與所述音頻樣本的音頻指紋相匹配的基準(zhǔn)音頻指紋。過程400隨后能夠?qū)⑴c匹配的基準(zhǔn)音頻指紋相關(guān)聯(lián)的媒體內(nèi)容項識別為與所述音頻樣本相對應(yīng)的媒體內(nèi)容項。在一些實施方式中,所生成的音頻指紋能夠與所存儲的基準(zhǔn)音頻指紋進(jìn)行比較從而找出匹配。在一些實施方式中,在所述基準(zhǔn)音頻指紋和音頻樣本的音頻指紋之間的差異不大于預(yù)定閾值時,基準(zhǔn)音頻指紋能夠被認(rèn)為與所述音頻樣本的音頻指紋相匹配。
雖然所公開的主題總體上涉及到使用音頻指紋和/或匹配技術(shù)來識別媒體內(nèi)容,但是這僅是說明性的。在一些實施方式中,過程400能夠接收在顯示器上所呈現(xiàn)的媒體內(nèi)容項的截屏,并且能夠使用任意適當(dāng)?shù)囊曨l指紋和/或匹配技術(shù)來識別媒體內(nèi)容項。在一些實施方式中,過程400能夠接收與媒體內(nèi)容項相關(guān)的節(jié)目信息,諸如頻道編號、節(jié)目名稱、系列編號、分集編號、URI和/或任意其它適當(dāng)節(jié)目信息。過程400能夠基于所接收的節(jié)目信息來識別媒體內(nèi)容項。
在一些實施方式中,例如,本文中所描述的機(jī)制能夠包括捕獲模塊,所述捕獲模塊能夠從多個源(例如,電視頻道、視頻托管網(wǎng)站上的頻道和/或任意其它適當(dāng)?shù)拿襟w內(nèi)容源)接收信號并進(jìn)行處理。這些捕獲模塊能夠針對每個媒體內(nèi)容源以特定時間間隔(例如,每兩分鐘或三分鐘)捕獲視頻截屏和/或以特定時間間隔從音頻數(shù)據(jù)生成音頻指紋。在一些實施方式中,這些捕獲模塊能夠?qū)碜远鄠€內(nèi)容源的媒體內(nèi)容進(jìn)行監(jiān)視,并且生成視頻截屏、音頻指紋、視頻指紋、轉(zhuǎn)錄(例如,字母內(nèi)容)和/或任意其它適當(dāng)?shù)膬?nèi)容標(biāo)識符。更具體地,這些捕獲模塊能夠?qū)⑺傻囊曨l截屏、音頻指紋、視頻指紋、轉(zhuǎn)錄(例如,字母內(nèi)容)和其它內(nèi)容標(biāo)識符存儲在存儲設(shè)備中。例如,捕獲模塊能夠監(jiān)視提供廣播電視內(nèi)容的頻道并且將所生成的音頻指紋存儲在按照節(jié)目和時間進(jìn)行索引的數(shù)據(jù)庫中。
在420處,過程400能夠獲得與媒體內(nèi)容項相關(guān)聯(lián)的音頻信號。例如,過程400能夠使用任意適當(dāng)?shù)囊纛l和/或視頻處理技術(shù)從媒體內(nèi)容項提取音頻信號。此外,所述音頻信號能夠使用任意適當(dāng)?shù)囊纛l處理技術(shù)而被降低采樣、轉(zhuǎn)碼、過濾和/或處理。
在一些實施方式中,所述音頻信號能夠與媒體內(nèi)容項的任意適當(dāng)?shù)囊粋€或多個部分相對應(yīng)。例如,所述音頻信號能夠與一個或多個視頻場景、片頭字幕、片尾字幕、蒙太奇鏡頭、商業(yè)廣告,和/或媒體內(nèi)容項的任意其它適當(dāng)部分相對應(yīng)。
在425處,過程400能夠識別音頻信號中包括音樂內(nèi)容的一個或多個分段。在一些實施方式中,音頻信號的分段能夠以任意適當(dāng)方式進(jìn)行識別。例如,過程400能夠使用任意適當(dāng)?shù)囊环N或多種音頻分段技術(shù)將音頻信號劃分為多個分段并且能夠從每個分段中提取一個或多個特征(例如,平均過零率、基礎(chǔ)頻率、振幅集合的均方根和/或任意其它適當(dāng)特征)。過程400隨后能夠基于所提取的特征將每個分段歸類為一個或多個類別。例如,音頻信號的特定分段能夠被歸類為“靜音”、“話音”、“音樂”、“歌曲”、“具有音樂背景的話音”、“噪聲”和/或任意其它適當(dāng)類別。在一些實施方式中,音頻信號的分段能夠使用任意適當(dāng)?shù)囊纛l分類技術(shù)或技術(shù)組合進(jìn)行歸類,諸如隱馬爾科夫模型、貝葉斯分類器、Viterbi算法、Baum-Welch算法和/或任意其它適當(dāng)?shù)姆诸惸P汀?/p>
在一些實施方式中,任意適當(dāng)?shù)囊纛l信號分段能夠被認(rèn)為包括音樂內(nèi)容。例如,音頻信號的分段能夠在所述分段被歸類為“音樂”、“歌曲”、“具有音樂背景的話音”和/或能夠被認(rèn)為與包括音樂內(nèi)容的音頻分段相對應(yīng)的任意其它適當(dāng)類別時被認(rèn)為包括音樂內(nèi)容。
在430處,過程400能夠識別在425處所識別的每個音頻分段中所包括的音樂內(nèi)容。在一些實施方式中,給定音頻分段中所包括的音樂內(nèi)容(例如,一段器樂、一首歌曲、一段背景音樂和/或任意其它適當(dāng)音樂內(nèi)容)能夠使用任意適當(dāng)?shù)男畔⑦M(jìn)行識別,諸如標(biāo)題、內(nèi)容標(biāo)識符、藝術(shù)家和/或能夠被用來識別音樂內(nèi)容的任意其它適當(dāng)信息。
在一些實施方式中,給定音頻分段中所包括的音樂內(nèi)容能夠使用任意適當(dāng)?shù)募夹g(shù)或技術(shù)組合來識別。例如,音樂內(nèi)容能使用任意適當(dāng)?shù)囊纛l指紋和/或匹配技術(shù)來識別。在更為特定的示例中,表示音頻分段中的一個或多個音頻特征的音頻指紋能夠與按照音樂項進(jìn)行存儲和索引的基準(zhǔn)音頻指紋進(jìn)行比較。所述音樂內(nèi)容隨后能夠通過識別與和音頻分段的音頻指紋相匹配的基準(zhǔn)音頻指紋相關(guān)聯(lián)的音樂項而被識別。
作為另一個示例,所述音樂內(nèi)容能夠通過將與音頻分段相關(guān)聯(lián)的轉(zhuǎn)錄(例如,字幕內(nèi)容)和與音樂項集合相關(guān)聯(lián)的歌詞進(jìn)行比較而被識別。在一些實施方式中,當(dāng)檢測到和與音頻分段相關(guān)聯(lián)的轉(zhuǎn)錄相匹配的歌詞時,過程400可以將與匹配的歌詞相關(guān)聯(lián)的音樂項識別為所述音頻分段中所包括的音樂內(nèi)容。
在一些實施方式中,在435處,過程400能夠識別媒體內(nèi)容項的一個或多個音樂分段。在一些實施方式中,所述音樂分段能夠包括所述媒體內(nèi)容項中包括音樂內(nèi)容(例如,一段器樂、一首歌曲、一段背景音樂和/或任意其它適當(dāng)音樂內(nèi)容)的任意適當(dāng)部分。
在一些實施方式中,所述音樂分段能夠以任意適當(dāng)方式被識別。例如,媒體內(nèi)容項的音樂分段能夠通過定位所述媒體內(nèi)容項中與所述音頻信號中包括音樂內(nèi)容的分段相對應(yīng)的部分而被識別。在更為特定的示例中,針對在425處所識別的特定音頻分段,過程400能夠檢索與音頻分段的開始相對應(yīng)的開始時間戳以及與所述音頻分段的結(jié)束相對應(yīng)的結(jié)束時間戳。過程400隨后能夠識別所述媒體內(nèi)容項中由所述開始時間戳和結(jié)束時間戳所定義的部分(例如,與和開始時間戳相對應(yīng)的呈現(xiàn)時間戳相關(guān)聯(lián)的第一幀以及與和結(jié)束時間戳相對應(yīng)的呈現(xiàn)時間戳相關(guān)聯(lián)的第二視頻幀所定義的視頻分段)。
在440處,過程400能夠搜索與媒體內(nèi)容項的音樂分段相匹配的音樂項。在一些實施方式中,任何適當(dāng)?shù)囊魳讽椂寄軌虮徽J(rèn)為與媒體內(nèi)容項的給定音樂分段相匹配。例如,媒體內(nèi)容項的給定音樂分段和與所述音樂分段相匹配的音樂項可以包括匹配的音頻內(nèi)容。在更為特定的示例中,匹配的音樂項可以是媒體內(nèi)容項中與所述音樂分段相對應(yīng)的部分的音軌、包括與所述音樂分段相關(guān)聯(lián)的音頻內(nèi)容的音樂視頻、包括從媒體內(nèi)容項中與音樂分段相對應(yīng)的部分所提取的一個或多個視頻場景的視頻片段、和/或任意其它適當(dāng)音樂項。
作為另一個示例,媒體內(nèi)容項的給定音樂分段和與所述音樂分段相匹配的音樂項能夠包括匹配的音樂內(nèi)容。在更為特定的示例中,所述音樂分段和音樂項可以包括由相同藝術(shù)家或不同藝術(shù)家所表演的一段音樂(例如,一首歌曲)的音頻內(nèi)容和/或視頻內(nèi)容。
作為又另一個示例,媒體內(nèi)容項的給定音樂分段和音樂項可以與匹配的情感相關(guān)聯(lián)。在一些實施方式中,與媒體內(nèi)容項的音樂分段或音樂項相關(guān)聯(lián)的情感可以通過所述音樂分段或音樂項所傳達(dá)的一種或多種情緒來衡量,諸如“快樂”、“悲傷”、“激動”、“中性”和/或任意其它適當(dāng)情感。除此之外或替選地,這樣的情感能夠被歸類為各種情感狀態(tài)之一,諸如“正面”、“負(fù)面”、“中性”和/或任意其它適當(dāng)?shù)那楦袪顟B(tài)。
在一些實施方式中,匹配的音樂項能夠使用任意適當(dāng)技術(shù)或技術(shù)組合進(jìn)行識別,諸如視頻匹配、音頻匹配、歌詞匹配、情感匹配,和/或能夠被用來分析媒體內(nèi)容項的一部分和音樂項之間的相似度的任意其它適當(dāng)技術(shù)。在更為特定的示例中,如以下結(jié)合圖5所描述的,能夠基于各種量度對音樂項和媒體內(nèi)容項的音樂分段之間的相似度進(jìn)行分析。在一些實施方式中,所述量度能夠包括表示與音樂分段相關(guān)聯(lián)的視頻內(nèi)容和與音樂項相關(guān)聯(lián)的視頻內(nèi)容之間的相似度的視頻相似度分?jǐn)?shù)。在一些實施方式中,所述量度可以包括表示與音樂分段相關(guān)聯(lián)的音頻內(nèi)容和與音樂項相關(guān)聯(lián)的音頻內(nèi)容之間的相似度的音頻相似度分?jǐn)?shù)。在一些實施方式中,所述量度可以包括表示音樂分段中所包含的音樂內(nèi)容(例如,一段器樂、一首特定歌曲和/或任意其它適當(dāng)音樂內(nèi)容)與音樂項中所包含的音樂內(nèi)容之間的相似度的音樂相似度分?jǐn)?shù)。在一些實施方式中,所述量度可以包括表示音樂分段所傳達(dá)的情感和音樂項所傳達(dá)的情感之間的相似度的情感分?jǐn)?shù)。
在445處,過程400能夠?qū)⑺鲆魳讽椗c媒體內(nèi)容項相關(guān)聯(lián)。在一些實施方式中,與所述音樂項有關(guān)的任何適當(dāng)信息都能夠與媒體內(nèi)容相關(guān)聯(lián)。例如,與特定音樂項有關(guān)的信息能夠包括描述、標(biāo)題、藝術(shù)家、所述音樂項可用的格式、能夠經(jīng)由其獲得所述音樂項的一個或多個平臺(例如,視頻托管服務(wù)、電子商務(wù)平臺、社交網(wǎng)絡(luò)平臺和/或任意其它適當(dāng)平臺)、指向提供與所述音樂項有關(guān)的信息的網(wǎng)站(例如,提供用于播放、共享和/或購買所述音樂項的信息的網(wǎng)站)的鏈接,和/或與所述音樂項有關(guān)的任意其它適當(dāng)信息。
在一些實施方式中,與音樂項有關(guān)的信息能夠同與和所述音樂項相對應(yīng)的媒體內(nèi)容項的音樂分段有關(guān)的任意適當(dāng)信息相關(guān)聯(lián),諸如媒體內(nèi)容項中與所述音樂分段相對應(yīng)的開始時間和/或結(jié)束時間,與所述音樂分段中所包含的音樂內(nèi)容有關(guān)的信息(例如,標(biāo)題、藝術(shù)家,和/或與音樂分段中所包含的一段器樂、一首歌曲和/或任意其它適當(dāng)音樂內(nèi)容有關(guān)的任意其它適當(dāng)信息),和/或與所述音樂分段有關(guān)的任意其它適當(dāng)信息。在一些實施方式中,與音樂項有關(guān)的信息能夠和與媒體內(nèi)容有關(guān)的任意適當(dāng)信息相關(guān)聯(lián),諸如內(nèi)容標(biāo)識符(例如,節(jié)目標(biāo)識符、URI和/或任意其它適當(dāng)標(biāo)識符)、描述、指向提供與所述媒體內(nèi)容項有關(guān)的信息的網(wǎng)站的鏈接(例如,URL),和/或與所述媒體內(nèi)容項有關(guān)的任意其它適當(dāng)信息。
在一些實施方式中,與音樂項有關(guān)的信息能夠按照媒體內(nèi)容項和/或音樂分段而在數(shù)據(jù)庫中進(jìn)行存儲和索引。在一些實施方式中,過程400能夠在媒體內(nèi)容項由電視提供方或任意其它適當(dāng)內(nèi)容提供方進(jìn)行廣播的同時,以特定時間間隔(例如,每N毫秒)將與音樂項有關(guān)的信息連同與媒體內(nèi)容項和/或媒體內(nèi)容項的音樂分段有關(guān)的信息一起存儲在數(shù)據(jù)庫中。
在一些實施方式中,響應(yīng)于接收針對與媒體內(nèi)容項有關(guān)的音樂內(nèi)容的后續(xù)搜索查詢,本文中所描述的機(jī)制能夠識別與所述媒體內(nèi)容項有關(guān)的音樂項并且檢索所存儲的與所述音樂項有關(guān)的信息以便進(jìn)行呈現(xiàn)。在一些實施方式中,響應(yīng)于接收針對與特定音樂項有關(guān)的媒體內(nèi)容項的后續(xù)搜索查詢,本文中所描述的機(jī)制能夠識別與所述音樂項有關(guān)的媒體內(nèi)容項并且檢索所存儲的與所述媒體內(nèi)容項有關(guān)的信息以便進(jìn)行呈現(xiàn)。
在450處,過程400能夠生成所述媒體內(nèi)容項中所播放的音樂內(nèi)容的播放列表。在一些實施方式中,所述播放列表能夠通過對與媒體內(nèi)容項中的一個或多個音樂分段有關(guān)的任意適當(dāng)信息進(jìn)行編譯而被生成。在一些實施方式中,所述播放列表可以包括媒體內(nèi)容項中與所述音樂分段相對應(yīng)的開始時間和/或結(jié)束時間,與所述音樂分段中所包含的音樂內(nèi)容有關(guān)的信息(例如,標(biāo)題、藝術(shù)家,和/或與一段音樂、一首歌曲和/或音樂分段中所包含的任意其它適當(dāng)音樂內(nèi)容有關(guān)的任意其它適當(dāng)信息),和/或與每個音樂分段有關(guān)的任意其它適當(dāng)信息。
在一些實施方式中,所述播放列表可以包括和與每個音樂分段相關(guān)聯(lián)的一個或多個項有關(guān)的任意適當(dāng)信息,諸如指向提供與所述音樂項有關(guān)的信息的網(wǎng)站的鏈接(例如,URL)、指向用戶能夠經(jīng)由其對一個或多個音樂項進(jìn)行播放、共享、購買和/或采取任意其它適當(dāng)動作的平臺(例如,視頻托管服務(wù)、社交網(wǎng)絡(luò)服務(wù)、媒體播放器服務(wù)、電子商務(wù)服務(wù)和/或任意其它適當(dāng)平臺)的鏈接,和/或與音樂項有關(guān)的任意其它適當(dāng)信息。
轉(zhuǎn)向圖5,根據(jù)所公開主題的一些實施方式而示出了用于識別與媒體內(nèi)容項的一部分相匹配的音樂項的過程的示例500的流程圖。在一些實施方式中,過程500的一個或多個部分能夠通過一個或多個硬件處理器來實現(xiàn),諸如圖1的服務(wù)器102的一個或多個硬件處理器。
如所圖示的,過程500能夠在505處通過識別媒體內(nèi)容項的音樂分段而開始。在一些實施方式中,所述音樂分段能夠包括媒體內(nèi)容項中包括音樂內(nèi)容(例如,一段器樂、一首歌曲、一段背景音樂和/或任意其它適當(dāng)音樂內(nèi)容)的任意適當(dāng)部分。在一些實施方式中,所述音樂分段能夠以任意適當(dāng)方式來識別。例如,如結(jié)合圖4所描述的,所述音樂分段能夠使用任意適當(dāng)?shù)囊纛l分段和/或分類技術(shù)來識別(例如,圖4的步驟420至435)。
在510處,過程500能夠生成音樂分段的音頻指紋。所述音頻指紋能夠包括音樂分段的一個或多個適當(dāng)?shù)囊纛l特征的任意適當(dāng)數(shù)字表示,其中所述音頻指紋能夠被用于識別音頻數(shù)據(jù)的相同或相似部分。在一些實施方式中,所述音頻指紋能夠使用任意適當(dāng)?shù)囊纛l指紋算法來生成。
在515處,過程500能夠生成音樂分段的轉(zhuǎn)錄。所述轉(zhuǎn)錄能夠以任意適當(dāng)方式而生成。例如,與音樂分段相關(guān)聯(lián)的轉(zhuǎn)錄能夠基于與所述音樂分段相關(guān)聯(lián)的字幕內(nèi)容而生成(例如,所關(guān)閉的字幕內(nèi)容、副標(biāo)題和/或任意其它適當(dāng)字幕內(nèi)容)。作為另一個示例,與音樂分段相關(guān)聯(lián)的轉(zhuǎn)錄能夠通過對與音樂分段相關(guān)聯(lián)的音頻內(nèi)容進(jìn)行轉(zhuǎn)錄而獲得。在更為特定的示例中,所述轉(zhuǎn)錄能夠通過以下而生成:從媒體內(nèi)容項中與音樂分段相對應(yīng)的部分提取音頻內(nèi)容、對所述音頻內(nèi)容進(jìn)行處理(例如,通過對所述音頻內(nèi)容進(jìn)行分段、轉(zhuǎn)錄和/或過濾)、使用適當(dāng)話音辨識技術(shù)將經(jīng)處理的音頻內(nèi)容轉(zhuǎn)換為文本,并且基于所述文本生成轉(zhuǎn)錄。
在520處,過程500能夠生成所述音樂分段的視頻指紋。所述視頻指紋能夠使用任意適當(dāng)?shù)囊曨l指紋技術(shù)來生成。例如,視頻指紋能夠通過從分段提取代表性的幀(例如,關(guān)鍵幀)而被生成。作為另一個示例,視頻指紋能夠通過計算一個或多個空間特性(例如,與強(qiáng)度變化、邊緣差異和/或任意其它適當(dāng)幀間特征相對應(yīng)的一個或多個矢量)、時間特征(例如,運動矢量、運動軌跡和/或任意其它幀間特征)、時空特征(例如,通過對視頻幀的群組執(zhí)行小波變換)和/或音樂分段的其它適當(dāng)特性。
在525處,過程500能夠?qū)⒁魳贩侄闻c情感指示符相關(guān)聯(lián)。在一些實施方式中,所述情感指示符能夠包括音樂分段所傳達(dá)的一種或多種情緒,諸如“快樂”、“悲傷”、“激動”、“中性”和/或任意其它適當(dāng)情緒。在一些實施方式中,所述情感指示符能夠包括情感狀態(tài),諸如“正面”、“負(fù)面”、“中性”和/或任意其它適當(dāng)?shù)那楦袪顟B(tài)。
在一些實施方式中,所述情感指示符能夠通過對音樂分段執(zhí)行任意適當(dāng)?shù)那楦蟹治龆_定。例如,過程500能夠使用自然語言處理、文本分析、機(jī)器學(xué)習(xí)和/或任意其它適當(dāng)技術(shù)對音樂分段中所包含的音樂內(nèi)容的旋律和/或歌詞、與音樂分段相關(guān)聯(lián)的轉(zhuǎn)錄、與媒體內(nèi)容項相關(guān)聯(lián)的元數(shù)據(jù)(例如,標(biāo)題、描述、用戶打分、用戶評論、流派和/或任意其它適當(dāng)元數(shù)據(jù))和/或與音樂分段有關(guān)的任意其它適當(dāng)信息進(jìn)行分析。過程500隨后能夠利用各種情感中的一種或多種對所述音樂分段進(jìn)行分類。
在530處,過程500能夠計算所述音樂分段與音樂項集合中的每個音樂項之間的相似度分?jǐn)?shù)。在一些實施方式中,過程500能夠從數(shù)據(jù)庫訪問和/或檢索與音樂項集合有關(guān)的信息(例如,音頻指紋、視頻指紋、歌詞、情感指示符,和/或與音樂項有關(guān)的任意其它適當(dāng)信息),上述數(shù)據(jù)庫按照音樂項對這樣的信息進(jìn)行存儲和索引。
在一些實施方式中,能夠基于任意適當(dāng)?shù)臉?biāo)準(zhǔn)或基準(zhǔn)和/或使用一種或多種任意適當(dāng)?shù)南嗨贫攘慷?例如,距離量度),來計算媒體內(nèi)容項的音樂分段和給定音樂項之間的相似度分?jǐn)?shù)。例如,能夠基于與音樂分段相關(guān)聯(lián)的視頻內(nèi)容和與音樂項相關(guān)聯(lián)的視頻內(nèi)容之間的相似度,來計算視頻相似度分?jǐn)?shù)。在更為特定的示例中,能夠通過將與音樂分段相關(guān)聯(lián)的視頻指紋和與音樂項相關(guān)聯(lián)的視頻指紋進(jìn)行比較和/或計算音頻指紋之間的差異,來計算視頻相似度分?jǐn)?shù)。
作為另一個示例,能夠基于與音樂分段相關(guān)聯(lián)的音頻內(nèi)容和與音樂項相關(guān)聯(lián)的音頻內(nèi)容之間的相似度,來計算音頻相似度分?jǐn)?shù)。在更為特定的示例中,能夠通過將與音樂分段相關(guān)聯(lián)的音頻指紋和與音樂項相關(guān)聯(lián)的音頻指紋進(jìn)行比較和/或計算視頻指紋之間的差異,來計算音頻相似度分?jǐn)?shù)。
作為另一個示例,能夠基于音樂分段中所包含的音樂內(nèi)容(例如,一首特定歌曲)和音樂項中所包含的音樂內(nèi)容之間的相似度來計算音樂相似度分?jǐn)?shù)。在更為特定的示例中,能夠通過比較與音樂分段相關(guān)聯(lián)的轉(zhuǎn)錄和與音樂項相關(guān)聯(lián)的歌詞,來計算音樂相似度分?jǐn)?shù)。
作為又另一個示例,能夠基于音樂分段所傳達(dá)的情感和音樂項所傳達(dá)的情感之間的相似度來計算情感相似度分?jǐn)?shù)。在更為特定的示例中,能夠通過比較與音樂分段相關(guān)聯(lián)的情感指示符和與音樂項相關(guān)聯(lián)的情感指示符和/或任意其它適當(dāng)情感信息,來計算情感相似度分?jǐn)?shù)。
在一些實施方式中,能夠?qū)σ魳贩侄魏鸵魳讽椫g的相似度進(jìn)行分析,并且能夠通過使用任意適當(dāng)技術(shù)將視頻相似度分?jǐn)?shù)、音頻相似度分?jǐn)?shù)、音樂相似度分?jǐn)?shù)和/或情感相似度分?jǐn)?shù)進(jìn)行組合而生成相似度分?jǐn)?shù)。例如,情感相似度分?jǐn)?shù)能夠是音樂相似度分?jǐn)?shù)、音頻相似度分?jǐn)?shù)和/或視頻相似度分?jǐn)?shù)的乘數(shù)。作為另一個示例,所述相似度分?jǐn)?shù)可以是視頻相似度分?jǐn)?shù)、音頻相似度分?jǐn)?shù)、音樂相似度分?jǐn)?shù)和/或情感相似度分?jǐn)?shù)的加權(quán)和、加權(quán)平均值和/或任意其它適當(dāng)組合。
在535處,過程500能夠識別與音樂分段相匹配的一個或多個音樂項。所述音樂項能夠以任意適當(dāng)方式進(jìn)行識別。例如,過程500能夠?qū)σ魳讽椀募虾?或音樂項的子集進(jìn)行排序,并且按照排序?qū)⒁粋€或多個音樂項識別為匹配的音樂項。在一些實施方式中,所述排序能夠基于任意適當(dāng)?shù)臉?biāo)準(zhǔn)或基準(zhǔn)來執(zhí)行,諸如按照相似度分?jǐn)?shù)(例如,基于視頻相似度分?jǐn)?shù)、音頻相似度分?jǐn)?shù)、音樂相似度分?jǐn)?shù)和/或情感相似度分?jǐn)?shù)中的一個或多個)、按照流行度(例如,基于點擊率、消費者回顧和/或打分、音樂項已經(jīng)在一個或多個社交媒體平臺上被共享的次數(shù),和/或音樂項的任意其它適當(dāng)?shù)牧餍卸戎笜?biāo))、按照源(例如,提供音樂項的內(nèi)容提供方是否已經(jīng)訂閱了過程500所提供的服務(wù)),和/或任意其它適當(dāng)標(biāo)準(zhǔn)。
在一些實施方式中,任意適當(dāng)數(shù)目的音樂項能夠基于排序而被選擇作為與所述音樂分段相匹配的音樂項。例如,過程500能夠選擇與特定排序相關(guān)聯(lián)的預(yù)定數(shù)目的音樂項(例如,前五個音樂項)。作為另一個示例,過程500能夠基于所確定的排序而選擇預(yù)定百分比的音樂項。
應(yīng)當(dāng)注意的是,上述圖3至圖5中的流程圖的步驟能夠以任意順序或次序執(zhí)行或?qū)崿F(xiàn)而并不限于圖中所示出并描述的順序和次序。而且,上述圖3至圖5中的流程圖的一些步驟在適當(dāng)情況下能夠基本上同時被執(zhí)行或?qū)崿F(xiàn)或者被并行執(zhí)行或?qū)崿F(xiàn)以便減少延時和處理時間。此外,應(yīng)當(dāng)注意的是,圖3至圖5僅作為示例而提供。這些圖中所示出的至少一些步驟能夠以不同于所表示的順序執(zhí)行,同時執(zhí)行或者一起被省略。
在本文中所討論的機(jī)制收集與用戶有關(guān)的個人信息或者對個人信息加以利用的情況下,用戶可以被提供以控制程序或特征是否收集用戶信息(例如,與用戶的社交網(wǎng)絡(luò)、社交動作或活動、職業(yè)、用戶的偏好或者用戶的當(dāng)前位置有關(guān)的信息)和/或控制是否和/或如何從內(nèi)容服務(wù)器接收可能與用戶較相關(guān)的內(nèi)容的機(jī)會。此外,某些信息可在其被存儲或使用之前以一種或多種方式進(jìn)行處理,而使得個人可識別信息得以被移除。例如,用戶的身份可被處理,使得無法針對用戶確定個人可識別信息,或者在獲得位置信息(諸如城市、郵政編碼或州級別)的情況下能夠?qū)τ脩舻牡乩砦恢眠M(jìn)行泛化,而使得無法確定用戶的特定位置。因此,用戶能夠?qū)π畔⑷绾侮P(guān)于用戶被收集以及如何由內(nèi)容服務(wù)器所使用加以控制。
本文中所述示例(以及以“諸如”、“例如”、“包括”等短語所表達(dá)的條款)的提供并不應(yīng)當(dāng)被解釋為將所請求保護(hù)的主題局限于具體示例;相反,所述示例僅旨在對許多可能方面中的一些進(jìn)行說明。
因此,提供了用于呈現(xiàn)與媒體內(nèi)容相關(guān)的音樂項的方法、系統(tǒng)和介質(zhì)。
雖然已經(jīng)在以上說明性實施方式中描述并圖示了所公開的主題,但是所要理解的是,本公開僅是通過示例而進(jìn)行,并且能夠在不背離僅由后續(xù)權(quán)利要求所限定的所公開的主題的精神和范圍的情況下對所公開的主題的實施方式的細(xì)節(jié)進(jìn)行很多改變。所公開實施方式的特征能夠以各種方式進(jìn)行組合和重新排列。