專(zhuān)利名稱(chēng):用圖形界面在音頻文件的集合中進(jìn)行導(dǎo)航的方法及接收機(jī)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種在利用音視頻接收機(jī)可訪(fǎng)問(wèn)的聲音文件中進(jìn)行導(dǎo)航的方法,以及一種配備了能夠?qū)Ш降膱D形用戶(hù)界面的再現(xiàn)設(shè)備。
背景技術(shù):
將大量的聲音文件存儲(chǔ)在大量市場(chǎng)設(shè)備中是公知的。討論到能夠包含一定量CD的音頻壓縮盤(pán)(CD)讀取設(shè)備,遙控器一方面使用戶(hù)能夠選擇適當(dāng)?shù)腃D,另一方可以選擇該CD中適當(dāng)?shù)淖髌?piece)。這些設(shè)備還具有編程功能,可以定義一系列聲音作品。在該編程期間,用戶(hù)針對(duì)每一作品引入CD的標(biāo)識(shí)符以及CD中作品的標(biāo)識(shí)符。為了具有一定的旋律連貫性,用戶(hù)必須預(yù)先知道這些作品,并對(duì)其進(jìn)行編程,以便在再現(xiàn)期間產(chǎn)生一定的聲音連貫性。
存在存儲(chǔ)聲音內(nèi)容的其它手段。例如,便攜式讀取器(或個(gè)人播放器)具有大容量電子存儲(chǔ)器,使其能夠記錄數(shù)百個(gè)音樂(lè)作品。所討論的個(gè)人播放器可以是由申請(qǐng)人生產(chǎn)并制造的MP3LYRA。一些家用設(shè)備還具有大容量的硬盤(pán),例如20G字節(jié),從而可以存儲(chǔ)數(shù)千個(gè)聲音內(nèi)容。
訪(fǎng)問(wèn)音頻內(nèi)容(例如歌曲)集合的用戶(hù)遇到的難題在于通過(guò)觀看來(lái)從其集合中檢索所確定的作品以便收聽(tīng)。因此,重要在于根據(jù)一定準(zhǔn)則來(lái)排列這些作品并將其特別地進(jìn)行呈現(xiàn),以便用戶(hù)能夠快速地檢索適當(dāng)?shù)囊粋€(gè)作品或多個(gè)作品。與用于識(shí)別音頻內(nèi)容的數(shù)字?jǐn)?shù)據(jù)進(jìn)行關(guān)聯(lián)是公知,最通用的是標(biāo)題,但是還存在作者、歌手、出版商等。被稱(chēng)作“屬性”的其它元素可以對(duì)例如流派(爵士、美聲、搖滾、休閑音樂(lè)、背景音樂(lè)等)的內(nèi)容進(jìn)行分類(lèi)。另一方面,例如,當(dāng)用戶(hù)自己實(shí)際記錄其音樂(lè)作品時(shí),用戶(hù)可訪(fǎng)問(wèn)的特定音頻內(nèi)容不會(huì)自動(dòng)地具有屬性。對(duì)音樂(lè)內(nèi)容進(jìn)行分配的另一種方式在于直接分析聲音信號(hào)。信號(hào)分析技術(shù)在于其可以針對(duì)每一個(gè)音頻內(nèi)容來(lái)計(jì)算所謂“低級(jí)(low-level)”參數(shù)的數(shù)值。例如,這些參數(shù)是音樂(lè)速度、能量、亮度、包絡(luò)等。通過(guò)以其數(shù)字格式或其模擬格式分析信號(hào)來(lái)確定這些參數(shù)。IEEE Journal 2000年8月,1338到1353頁(yè),88卷公開(kāi)的文章″Speech and Language Technologies for audio indexing andretrieval″中描述了一種音頻內(nèi)容索引的技術(shù)。該文章解釋了如何通過(guò)分析音頻信號(hào)來(lái)對(duì)各種內(nèi)容進(jìn)行分類(lèi)。其它文章說(shuō)明了計(jì)算低級(jí)參數(shù)的手段以及可能的用途,這里是作為本專(zhuān)利申請(qǐng)的參考來(lái)包括的一些其它文章■B.Feiten和S.Gunzel,Automatic indexing of a SoundDatabase using self-organizing neural networks,Computer Music Journal,18(3°,1994■Eric Scheirer,Music Listening systems,博士論文,MIT Media Laboratory,2000年4月。
出版于2001年1月29日的IEEE WEIPPL文獻(xiàn)“Visualizingcontent based relations in texts”提出了使用例如主分量分析或Kohonen映射的傳統(tǒng)算法,通過(guò)投影到2D或3D空間來(lái)觀看文本文件的集合的各種過(guò)程。這種觀看過(guò)程的用戶(hù)是希望搜索文件的人,而不是希望沒(méi)有干涉地收聽(tīng)內(nèi)容的人。
一旦已經(jīng)針對(duì)集合的每一個(gè)聲音文件確定了低級(jí)參數(shù),作為這些參數(shù)的功能,存儲(chǔ)或再現(xiàn)設(shè)備能夠?qū)⑵渲鸾M進(jìn)行分類(lèi)。因此,古典音樂(lè)內(nèi)容可以構(gòu)成一組,同樣爵士段構(gòu)成另一組。2001年8月23日公開(kāi)的專(zhuān)利申請(qǐng)PCT/GB01/00681描述了一種顯示在屏幕上并由音頻接收機(jī)控制的、包括圖形的用戶(hù)界面。所顯示的菜單展示了可由用戶(hù)進(jìn)行選擇的圖標(biāo)(“古典”、“爵士”、“talk back”、“chart music”等),對(duì)組中文件的選擇激活了該聲音內(nèi)容的再現(xiàn)。
這種界面便于選擇音頻內(nèi)容,但不能進(jìn)行多個(gè)內(nèi)容的自動(dòng)鏈接(chaining)。通過(guò)用戶(hù)預(yù)先知道的各種內(nèi)容進(jìn)行編程能夠?qū)崿F(xiàn)這種連接。即使在這種情況下,如果用戶(hù)希望得到旋律鏈接,如果沒(méi)有對(duì)音樂(lè)的鑒賞力,如何完成鏈接并不容易。
國(guó)際專(zhuān)利申請(qǐng)WO01/65346-MINALCHEON描述了在線(xiàn)產(chǎn)品目錄的呈現(xiàn)。產(chǎn)品以屏幕上圖標(biāo)的形式出現(xiàn),用戶(hù)能夠選擇圖標(biāo),從而觸發(fā)與對(duì)象選擇相關(guān)的音頻再現(xiàn)。通過(guò)根據(jù)由目錄提供者建立的策略進(jìn)行導(dǎo)航,可以實(shí)現(xiàn)從一個(gè)圖標(biāo)到另一個(gè)圖標(biāo)的轉(zhuǎn)移。因此,該導(dǎo)航不能考慮到專(zhuān)用于用戶(hù)終端的對(duì)象、或?qū)S糜谟脩?hù)的準(zhǔn)則。
發(fā)明內(nèi)容
本申請(qǐng)使用戶(hù)能夠順序地再現(xiàn)包含在其終端中的音頻內(nèi)容,同時(shí)保持一定的音樂(lè)統(tǒng)一性或至少保持一定的邏輯。此外,據(jù)此定義的圖形界面可以在大量音頻內(nèi)容的集合中容易地進(jìn)行導(dǎo)航并再現(xiàn)用戶(hù)希望的內(nèi)容,以具有競(jìng)爭(zhēng)力并且用戶(hù)友好的方式進(jìn)行。
本發(fā)明的主題是一種在聲音文件的集合中進(jìn)行導(dǎo)航的方法,所述聲音文件存儲(chǔ)在配備了顯示設(shè)備的再現(xiàn)設(shè)備中,所述方法包括步驟存儲(chǔ)集合的每一個(gè)聲音文件,分析所存儲(chǔ)的聲音文件,以便確定專(zhuān)用于每一個(gè)文件的音頻參數(shù),該方法的特征在于以下步驟在顯示設(shè)備的圖形頁(yè)面上,定位與聲音文件的至少一部分相對(duì)應(yīng)的圖形標(biāo)識(shí)符,每一個(gè)圖形標(biāo)識(shí)符的位置取決于之前針對(duì)給定文件計(jì)算的參數(shù),通過(guò)根據(jù)考慮到圖形頁(yè)面中文件的圖形標(biāo)識(shí)符的位置以及專(zhuān)用于再現(xiàn)設(shè)備的幾何特性的策略選擇并順序地再現(xiàn)聲音文件來(lái)進(jìn)行自動(dòng)導(dǎo)航。
按照這種方式,該方法提出了一種在音頻內(nèi)容的集合中進(jìn)行導(dǎo)航的新穎概念,該概念基于觀看集合的圖形表示(graphicalrepresentation)以及基于結(jié)合特定圖形標(biāo)識(shí)符的圖形相關(guān)的策略。因此,用戶(hù)能夠在圖形頁(yè)面上看到在其終端中可用的、聲音文件的鏈接的進(jìn)展。此外,對(duì)于每一個(gè)文件,圖形頁(yè)面中文件的表示的位置取決于低級(jí)參數(shù),因此基于表示的位置的導(dǎo)航提供了一定程度的音頻連貫性。
根據(jù)第一改進(jìn),該方法包括步驟確定具有接近參數(shù)值的文件組。利用相仿物(similitude)來(lái)顯示與一組文件相關(guān)的圖形標(biāo)識(shí)符,以使用戶(hù)能夠在圖形頁(yè)面中定位組。因此,用戶(hù)能夠在所確定的音樂(lè)組中清楚地選擇聲音文件。
根據(jù)另一個(gè)改進(jìn),該方法包括步驟通過(guò)指定由接收機(jī)使用的、用于自動(dòng)鏈接文件的再現(xiàn)的導(dǎo)航策略,接收用于激勵(lì)導(dǎo)航的命令。存在多個(gè)可能的導(dǎo)航策略,所有導(dǎo)航策略均可以按照?qǐng)D形形式表示為對(duì)線(xiàn)段的穿越(traversal)、對(duì)螺線(xiàn)的穿越或開(kāi)口形狀,圖形區(qū)域的定義包括該區(qū)域中的標(biāo)識(shí)符和該區(qū)域中的隨機(jī)選擇。
根據(jù)另一個(gè)改進(jìn),該方法包括步驟根據(jù)所確定的策略來(lái)顯示所再現(xiàn)文件的數(shù)目。根據(jù)另一個(gè)改進(jìn),該方法包括步驟顯示正在進(jìn)行再現(xiàn)的文件的序號(hào)。
本發(fā)明的主題還是一種再現(xiàn)設(shè)備,包括中央單元、接收聲音文件的裝置、存儲(chǔ)所接收文件的裝置、引入用戶(hù)命令的裝置、分析所存儲(chǔ)的文件以便確定專(zhuān)用于每一個(gè)文件的參數(shù)的裝置,其特征在于包括顯示與所存儲(chǔ)的至少部分聲音文件相對(duì)應(yīng)的圖形標(biāo)識(shí)符的圖形頁(yè)面的裝置,每一個(gè)文件的圖形標(biāo)識(shí)符的位置取決于預(yù)先計(jì)算的參數(shù);以及導(dǎo)航裝置,用于根據(jù)考慮到圖形頁(yè)面中文件的圖形標(biāo)識(shí)符的位置以及專(zhuān)用于再現(xiàn)設(shè)備的幾何特性所確定的策略來(lái)自動(dòng)鏈接文件的再現(xiàn)。
在說(shuō)明書(shū)的框架內(nèi),本發(fā)明的其它特征和優(yōu)點(diǎn)將變得顯而易見(jiàn)并且更加詳細(xì),下面是作為演示給出并參考附圖的典型實(shí)施例,在圖中圖1是用于實(shí)現(xiàn)本發(fā)明的再現(xiàn)設(shè)備的方框圖,圖2是將集合的每一個(gè)參數(shù)與其低級(jí)參數(shù)的值進(jìn)行相關(guān)的排列,圖3示出了在二維空間中呈現(xiàn)文件集合的屏幕,圖4示出了所謂線(xiàn)段導(dǎo)航策略的屏幕,用于自動(dòng)地鏈接聲音文件,圖5示出了螺線(xiàn)導(dǎo)航策略的屏幕,用于自動(dòng)地鏈接聲音文件。
具體實(shí)施例方式
首先,將說(shuō)明再現(xiàn)設(shè)備1的操作方式,例如與顯示設(shè)備2相關(guān)的多媒體接收機(jī)1。接收機(jī)包括與程序存儲(chǔ)器12相連的中央單元3;以及與高比特率本地?cái)?shù)字總線(xiàn)6進(jìn)行通信的接口5,能夠以高比特率接收音頻和/或視頻數(shù)據(jù)。例如,該網(wǎng)絡(luò)是IEEE 1394網(wǎng)絡(luò)。接收機(jī)還可以通過(guò)與解調(diào)器4相關(guān)的接收天線(xiàn)來(lái)接收來(lái)自傳輸網(wǎng)絡(luò)的音頻和/或視頻數(shù)據(jù),該網(wǎng)絡(luò)可以是無(wú)線(xiàn)電或電視類(lèi)型。接收機(jī)還包括紅外信號(hào)7的接收機(jī),用于接收來(lái)自遙控器8的信號(hào);存儲(chǔ)器9,用于存儲(chǔ)數(shù)據(jù)庫(kù);以及音頻/視頻解碼邏輯電路10,用于產(chǎn)生分派給電視屏幕2的視聽(tīng)信號(hào)。遙控器8配備有方向鍵↑、↓、→和←以及“OK”和“選擇(Select)”,隨后將說(shuō)明其功能。
接收機(jī)還包括經(jīng)常被稱(chēng)作OSD(代表“屏幕上顯示”)電路的電路11,用于在屏幕上顯示數(shù)據(jù)。OSD電路11是一種文本和圖形產(chǎn)生器,可以在屏幕上顯示菜單、象形圖或其它圖形以及表示導(dǎo)航的菜單。由中央單元3和導(dǎo)航器12控制OSD電路。有利地,以記錄在只讀存儲(chǔ)器中程序模塊的形式嵌入導(dǎo)航器12。例如,還可以按照ASIC型專(zhuān)用電路的形式來(lái)嵌入。
數(shù)字總線(xiàn)6和/或傳輸網(wǎng)絡(luò)以數(shù)字形式或模擬形式向接收機(jī)發(fā)送音頻內(nèi)容,接收機(jī)將其記錄在存儲(chǔ)器9中。根據(jù)優(yōu)選的實(shí)施例,接收數(shù)字形式的音頻內(nèi)容,優(yōu)選根據(jù)例如MP3的壓縮標(biāo)準(zhǔn)進(jìn)行編碼,并以相同格式進(jìn)行存儲(chǔ)。根據(jù)該優(yōu)選的實(shí)施例,存儲(chǔ)器9是例如40G的大容量硬盤(pán)。一分鐘MP3格式的音頻內(nèi)容存儲(chǔ)占用大約1M字節(jié),這種盤(pán)能夠記錄大約數(shù)小時(shí)的聲音文件。音頻內(nèi)容的下載是公知技術(shù),無(wú)需在本專(zhuān)利申請(qǐng)中進(jìn)行說(shuō)明。
一旦在存儲(chǔ)器9中存儲(chǔ)了一定量的音頻內(nèi)容。用戶(hù)希望對(duì)其進(jìn)行再現(xiàn)并無(wú)過(guò)多的手動(dòng)干預(yù),用戶(hù)還希望隨后的另一個(gè)內(nèi)容相仿,從而保持和諧的氣氛。為此,導(dǎo)航器的軟件模塊在其接收期間分析每一個(gè)音頻內(nèi)容并從中提取低級(jí)參數(shù)。如導(dǎo)言中所述,大量信號(hào)分析技術(shù)在于可以針對(duì)這些歌曲得到數(shù)字描述符的排列。描述符的元素的數(shù)目是數(shù)十?dāng)?shù)量級(jí)的。
包含在圖2的屏幕頁(yè)面中的排列呈現(xiàn)了低級(jí)參數(shù)的數(shù)值,這些低級(jí)參數(shù)構(gòu)成了一定量音頻文件的描述符。排列的第一列呈現(xiàn)了音頻內(nèi)容的標(biāo)題,對(duì)每一個(gè)內(nèi)容編號(hào)。后續(xù)列呈現(xiàn)了與文件相關(guān)的低級(jí)參數(shù)的數(shù)值,例如平均聲音強(qiáng)度、音樂(lè)速度、能量、零交叉率、亮度、包絡(luò)、帶寬、響度、對(duì)數(shù)(cepstral)系數(shù)等。
根據(jù)一個(gè)改進(jìn),可以與音頻內(nèi)容一起提供數(shù)字形式的低級(jí)參數(shù)。當(dāng)利用數(shù)字傳輸以壓縮形式提供內(nèi)容時(shí),將構(gòu)成字段的相關(guān)低級(jí)參數(shù)附加到音頻內(nèi)容上。由于由內(nèi)容提供商而不是用戶(hù)來(lái)執(zhí)行參數(shù)的計(jì)算。該解決方案尤其有利,因此只需執(zhí)行一次。
如果進(jìn)行本地下載或計(jì)算,將描述符存儲(chǔ)在存儲(chǔ)器9中,然后用于產(chǎn)生具有特定相仿性的文件組。
根據(jù)第一方法,利用所謂的“聚類(lèi)”算法來(lái)執(zhí)行將內(nèi)容分組到一致的組(或簇)中,例如k-均值算法(Mac Queen,″Some Methods forclassification and analysis of multivariate observations″,ProcFifth Berkeley Symposium on Math.,Stat.and Prob.,voll,281-296,1967)。圖2的描述符排列具有新的列,定義了其中放置了內(nèi)容的組。組計(jì)算技術(shù)是公知的,利用k-均值算法,能夠容易地控制如此產(chǎn)生的組的數(shù)目。
根據(jù)第二方法,利用類(lèi)別(例如基調(diào)、主要樂(lè)器、音樂(lè)速度等)的提前選擇和有利于定義這些類(lèi)別的地面實(shí)況值(ground truth)來(lái)確定組。通過(guò)將學(xué)習(xí)算法應(yīng)用于該地面實(shí)況值來(lái)得到這些類(lèi)別。
根據(jù)本發(fā)明的典型實(shí)施例,通過(guò)圖形標(biāo)識(shí)符將接收機(jī)可訪(fǎng)問(wèn)的聲音文件表示在屏幕上。根據(jù)低級(jí)參數(shù)得到這些圖形標(biāo)識(shí)符的位置(即,圖形頁(yè)面中的空間坐標(biāo))。根據(jù)圖3的示例,屏幕表示了二維導(dǎo)航空間,構(gòu)成圖形標(biāo)識(shí)符的點(diǎn)Pi表示聲音文件Si。通過(guò)例如根據(jù)所選擇表示的類(lèi)型,將點(diǎn)Pi投影到2、3維空間上來(lái)得到圖形標(biāo)識(shí)符的坐標(biāo)(xi,yi),所述點(diǎn)Pi的坐標(biāo)是聲音樣本上低級(jí)描述符的數(shù)值。通過(guò)主分量分析或PCA來(lái)確定投影。具體地,在Technip出版的Saporta 1990文獻(xiàn)中說(shuō)明了PCA,標(biāo)題是“Probabilités Analyse de données etstatistiques[Probabilities data analysis and statistics]”。該公知的數(shù)據(jù)分析算法尋求找到線(xiàn)性限定了原始軸的、軸的子系統(tǒng),并最優(yōu)地“擴(kuò)展”了樣本,這些軸趨于融合原始相關(guān)軸。假設(shè)低級(jí)描述符具有知覺(jué)一致性(當(dāng)且僅當(dāng)?shù)图?jí)描述符的數(shù)值接近時(shí),聲音在知覺(jué)上才接近)且投影是連續(xù)的,則在屏幕上接近的圖形標(biāo)識(shí)符與知覺(jué)上接近的聲音相對(duì)應(yīng)。該示例不排除通過(guò)二維以上的空間來(lái)表示集合。
按照通用方式,多維空間中圖形標(biāo)識(shí)符的坐標(biāo){xi,y2,…zi}使用戶(hù)能夠在精神上描繪相關(guān)聲音文件的類(lèi)型。具體地,作為低級(jí)參數(shù)的數(shù)值的功能來(lái)計(jì)算圖形標(biāo)識(shí)符的位置,如果兩個(gè)標(biāo)識(shí)符在圖形上相差較遠(yuǎn),其低級(jí)參數(shù)的數(shù)值非常不同,因此,聲音內(nèi)容的類(lèi)型也不同。另一方面,如果兩個(gè)標(biāo)識(shí)符接近,相關(guān)音頻內(nèi)容的聽(tīng)覺(jué)形式同樣接近。數(shù)據(jù)分析技術(shù)在于可以發(fā)現(xiàn)一定歌曲集合中的主導(dǎo)維(或維組合)。這可以通過(guò)指示這些是與軸相對(duì)應(yīng)的維來(lái)實(shí)現(xiàn),歌曲最廣泛地根據(jù)所述軸進(jìn)行分布。有利地,導(dǎo)航器可以分析聲音文件并確定與音頻內(nèi)容的類(lèi)型相對(duì)應(yīng)的主維,于是,該導(dǎo)航器成為選擇導(dǎo)航空間的維數(shù)的導(dǎo)航器。
仍根據(jù)圖3所示的改進(jìn),根據(jù)“聚類(lèi)”算法來(lái)分組聲音文件,例如k-均值算法。同一組的元素的圖形標(biāo)識(shí)符具有公共特性。根據(jù)優(yōu)選的實(shí)施例,圖形標(biāo)識(shí)符的顏色取決于文件所屬的組(例如藍(lán)、紅和綠)。在圖3中所示的變體在于向圖形標(biāo)識(shí)符提供特定形狀圓形、十字形或星形。圖3所示的改進(jìn)在于利用包括封閉曲線(xiàn)的輪廓來(lái)限定組。在圖3所示的示例中,導(dǎo)航器具有所計(jì)算三個(gè)組A、B和C,由三個(gè)特定形狀對(duì)其成員進(jìn)行區(qū)別,于是,由封閉曲線(xiàn)來(lái)表示每一組的輪廓。與組的文件相關(guān)的圖形標(biāo)識(shí)符在屏幕上聚集在一起。具體地,通常屏幕上標(biāo)識(shí)符的分布不會(huì)均勻,在導(dǎo)航空間中出現(xiàn)非常接近標(biāo)識(shí)符的組,這些“星云”向?qū)⒙曇粑募溄拥揭黄鸬膶?dǎo)航添加了可視的益處。此外發(fā)現(xiàn)好奇的用戶(hù)可能希望收聽(tīng)孤立的標(biāo)識(shí)符。通過(guò)圖形化地在表示不同音頻內(nèi)容類(lèi)型的組之間進(jìn)行區(qū)分,用戶(hù)“看到”其集合并能夠通過(guò)從適當(dāng)組中選擇圖形標(biāo)識(shí)符來(lái)選擇音頻內(nèi)容。通過(guò)移動(dòng)包括兩個(gè)垂直直線(xiàn)的目標(biāo)來(lái)執(zhí)行標(biāo)識(shí)符的選擇,希望的對(duì)象位于直線(xiàn)的交點(diǎn)。用戶(hù)利用其遙控器或“游戲桿”的方向鍵來(lái)移動(dòng)目標(biāo)。屏幕底部的窗口顯示了正在進(jìn)行再現(xiàn)的音頻內(nèi)容的標(biāo)題,如果該內(nèi)容適于用戶(hù),用戶(hù)按下“OK”并再現(xiàn)內(nèi)容。如果窗口不包含標(biāo)題,這表示目標(biāo)沒(méi)有針對(duì)任意音頻內(nèi)容。
在上述段落中,說(shuō)明了包含在存儲(chǔ)于存儲(chǔ)器9中的集合中的單個(gè)聲音文件的選擇和再現(xiàn)?,F(xiàn)在將說(shuō)明基于多個(gè)音頻內(nèi)容的自動(dòng)導(dǎo)航。
為了激勵(lì)多個(gè)音頻內(nèi)容的自動(dòng)鏈接,用戶(hù)必須預(yù)先建立導(dǎo)航策略。利用圖形,用戶(hù)對(duì)其集合的內(nèi)容具有良好知識(shí),所述圖形是按照位于空間中星云的一定方式的聯(lián)想(reminiscent),思想在于建立橫穿這些元素組的路徑。表示相同類(lèi)型的文件組對(duì)于導(dǎo)航不是必需的,然而,向能夠更好描繪其音頻集合如何分布的用戶(hù)提供幫助。
現(xiàn)在解釋用戶(hù)能夠選擇的多個(gè)自動(dòng)導(dǎo)航策略。目的是將圖形表示用作定義選擇策略并確定文件的自動(dòng)鏈接的手段。第一策略在于直線(xiàn)段。圖4的圖示出了該導(dǎo)航策略。用戶(hù)選擇起始文件Dd(因此是起始點(diǎn))和結(jié)束文件Df(分別是結(jié)束點(diǎn)),并激勵(lì)導(dǎo)航。然后,導(dǎo)航器顯示這兩個(gè)圖像標(biāo)識(shí)符之間的線(xiàn)段S,并計(jì)算集合的每一個(gè)標(biāo)識(shí)符與線(xiàn)段之間的距離。然后,導(dǎo)航器再現(xiàn)與起始文件相關(guān)的聲音文件,然后相繼再現(xiàn)位于距離線(xiàn)段距離最大的聲音文件。改進(jìn)在于,基于線(xiàn)段,顯示從起始點(diǎn)到結(jié)束點(diǎn)移動(dòng)的標(biāo)記(例如圖4和5的笑臉),并根據(jù)該標(biāo)記來(lái)計(jì)算與圖形標(biāo)識(shí)符的距離。通過(guò)標(biāo)記在線(xiàn)段上的位置,用戶(hù)能夠跟隨導(dǎo)航的進(jìn)展,并能夠確定在到達(dá)結(jié)束點(diǎn)之前剩余的時(shí)間。
根據(jù)該導(dǎo)航策略,用戶(hù)引入了三個(gè)參數(shù)起始點(diǎn)的坐標(biāo)(圖4中表示為Dd)、結(jié)束點(diǎn)的坐標(biāo)(圖4中表示為Df)以及由導(dǎo)航器選擇的圖形標(biāo)識(shí)符與線(xiàn)段之間的最大距離(圖4中表示為d)。選擇圖形標(biāo)識(shí)符的一種方式在于利用方向鍵在屏幕上移動(dòng)索引(包含要選擇點(diǎn)的方形),導(dǎo)航器自動(dòng)地定位圖形標(biāo)識(shí)符上的方形。對(duì)于第三參數(shù),用戶(hù)鍵入1到99之間的數(shù)值。
當(dāng)在第一再現(xiàn)之前計(jì)算集合的每一個(gè)圖形標(biāo)識(shí)符與線(xiàn)段之間的距離時(shí),導(dǎo)航器知道順序再現(xiàn)的文件的數(shù)目,并將其顯示在屏幕一角的圖形窗口中。在窗口中,還顯示了正在進(jìn)行再現(xiàn)的聲音文件的序號(hào)。
基于線(xiàn)段的導(dǎo)航策略可以從一種類(lèi)型的聲音文件轉(zhuǎn)到另一種,由于文件在圖形上接近,從一個(gè)文件到另一個(gè)文件的轉(zhuǎn)移是和緩的。
螺線(xiàn)策略由圖5表示,用戶(hù)選擇起始文件Dd(因此是起始點(diǎn))、曲率半徑R并激勵(lì)導(dǎo)航。然后,導(dǎo)航器顯示螺線(xiàn),其中心是起始點(diǎn),其相對(duì)于該標(biāo)識(shí)符的距離隨著每一個(gè)進(jìn)展增加數(shù)值R。如前所述,導(dǎo)航器計(jì)算利用螺線(xiàn)顯示的每一個(gè)標(biāo)識(shí)符的距離。然后,導(dǎo)航器再現(xiàn)與起始文件相關(guān)的聲音文件,然后相繼再現(xiàn)位于距離螺線(xiàn)最大距離處的文件。按照與前述相同的方式,導(dǎo)航器與文件的再現(xiàn)一起,顯示沿螺線(xiàn)移動(dòng)的標(biāo)記,并在圖形窗口中顯示將順序再現(xiàn)的文件的數(shù)目以及正在進(jìn)行再現(xiàn)的聲音文件的序號(hào)。
如果用戶(hù)將起始點(diǎn)正好放置在聲音文件組的中間,該策略可以?huà)呙璐蟛糠纸M,因此在較長(zhǎng)持續(xù)時(shí)間內(nèi)再現(xiàn)相同類(lèi)型的文件。另一方面,如果用戶(hù)將起始點(diǎn)放置在兩組聲音文件之間的邊界處,則利用螺線(xiàn)的每一個(gè)旋轉(zhuǎn),導(dǎo)航器再現(xiàn)一組的文件然后是另一組的文件,從而可以改變?cè)佻F(xiàn)的類(lèi)型。
如果用戶(hù)引入了相同的參數(shù),這兩種策略可以根據(jù)較好定義的鏈接來(lái)掃描部分集合,因此進(jìn)行理想再現(xiàn)。第三策略涉及隨機(jī)方案。用戶(hù)選擇起始文件Dd(因此是起始點(diǎn))和圓形半徑,并激勵(lì)導(dǎo)航。然后,導(dǎo)航器顯示其圓心位于起始點(diǎn)的圓形。接下來(lái),導(dǎo)航器隨機(jī)地選擇圓形區(qū)域內(nèi)中圖形標(biāo)識(shí)符并再現(xiàn)相關(guān)的文件。當(dāng)已經(jīng)再現(xiàn)了所有文件之后,導(dǎo)航停止。如前所述,導(dǎo)航器在圖形窗口中顯示順序再現(xiàn)的文件的數(shù)目以及正在進(jìn)行再現(xiàn)的聲音文件的序號(hào)。第三策略具有與第二策略(根據(jù)起始點(diǎn))相同的優(yōu)點(diǎn),還具有的優(yōu)點(diǎn)在于,防止始終按照相同的鏈接再現(xiàn)文件。
當(dāng)接收機(jī)能夠訪(fǎng)問(wèn)的文件數(shù)目非常大時(shí),不可能在屏幕上針對(duì)每一個(gè)文件來(lái)顯示表述。根據(jù)改進(jìn),圖形頁(yè)面顯示了表述的選擇,于是用戶(hù)引入例如在文件屬性中定義的文件流派的準(zhǔn)則,或文件的創(chuàng)建日期或記錄日期,或文件是某一姓名歌手的歌曲。
盡管已經(jīng)參考演示的具體實(shí)施例說(shuō)明了本發(fā)明,本發(fā)明并不局限于這些實(shí)施例,而由所附的權(quán)利要求限定。注意,本領(lǐng)域的技術(shù)人員可以進(jìn)行改變或修改。
權(quán)利要求
1.一種在聲音文件的集合中進(jìn)行導(dǎo)航的方法,所述聲音文件存儲(chǔ)在配備了顯示設(shè)備的再現(xiàn)設(shè)備中,所述方法包括步驟存儲(chǔ)集合的每一個(gè)聲音文件,分析所存儲(chǔ)的聲音文件,以便確定專(zhuān)用于每一個(gè)文件的音頻參數(shù),其特征在于,包括以下步驟在顯示設(shè)備的圖形頁(yè)面上,定位與聲音文件的至少一部分相對(duì)應(yīng)的圖形標(biāo)識(shí)符,每一個(gè)圖形標(biāo)識(shí)符的位置取決于之前針對(duì)給定文件計(jì)算的參數(shù),通過(guò)根據(jù)考慮到圖形頁(yè)面中文件的圖形標(biāo)識(shí)符的位置以及專(zhuān)用于再現(xiàn)設(shè)備的幾何特性的策略選擇并順序地再現(xiàn)聲音文件來(lái)進(jìn)行自動(dòng)導(dǎo)航。
2.根據(jù)權(quán)利要求1所述的導(dǎo)航方法,其特征在于,包括步驟確定具有接近參數(shù)值的文件組,圖形標(biāo)識(shí)符與具有相仿物的文件組相關(guān)。
3.根據(jù)權(quán)利要求1或2所述的導(dǎo)航方法,其特征在于,包括步驟通過(guò)指定由接收機(jī)使用的、用于自動(dòng)鏈接文件的再現(xiàn)的導(dǎo)航策略,接收用于激勵(lì)導(dǎo)航的命令。
4.根據(jù)權(quán)利要求1或2所述的導(dǎo)航方法,其特征在于,包括步驟再現(xiàn)設(shè)備確定導(dǎo)航策略,用于自動(dòng)地鏈接文件的再現(xiàn)。
5.根據(jù)權(quán)利要求1到4之一所述的導(dǎo)航方法,其特征在于,所述導(dǎo)航包括自動(dòng)地選擇并再現(xiàn)其圖形標(biāo)識(shí)符位于起始點(diǎn)和結(jié)束點(diǎn)之間的直線(xiàn)段附近的文件,所選擇的第一文件位于起始點(diǎn)或最接近所述起始點(diǎn)。
6.根據(jù)權(quán)利要求1到4之一所述的導(dǎo)航方法,其特征在于,所述導(dǎo)航在于自動(dòng)地選擇并再現(xiàn)其圖形標(biāo)識(shí)符位于幾何形狀附近的文件,所述幾何形狀包括從起始點(diǎn)開(kāi)始并在屏幕的邊緣處結(jié)束的線(xiàn),所選擇的第一文件位于起始點(diǎn)或最接近所述起始點(diǎn)。
7.根據(jù)權(quán)利要求1到4之一所述的導(dǎo)航方法,其特征在于,包括在先步驟確定圖形標(biāo)識(shí)符的子集,自動(dòng)導(dǎo)航包括隨機(jī)并順序地選擇與所述子集的圖形標(biāo)識(shí)符相關(guān)的每一個(gè)文件。
8.根據(jù)前述權(quán)利要求之一所述的導(dǎo)航方法,其特征在于,包括步驟根據(jù)所確定的策略來(lái)顯示再現(xiàn)文件的數(shù)目。
9.根據(jù)前述權(quán)利要求之一所述的導(dǎo)航方法,其特征在于,包括步驟顯示正在進(jìn)行再現(xiàn)的文件的序號(hào)。
10.一種再現(xiàn)設(shè)備(1),包括中央單元(3)、接收聲音文件的裝置(5,6;4)、存儲(chǔ)所接收的文件的裝置(9)、引入用戶(hù)命令的裝置(7,8)、分析所存儲(chǔ)的文件以便確定專(zhuān)用于每一個(gè)文件的參數(shù)的裝置(3,12),其特征在于,包括顯示與所存儲(chǔ)的至少部分聲音文件相對(duì)應(yīng)的圖形標(biāo)識(shí)符的圖形頁(yè)面的裝置(3,10,11,12),每一個(gè)文件的圖形標(biāo)識(shí)符的位置取決于預(yù)先計(jì)算的參數(shù);以及導(dǎo)航裝置(3,12),用于根據(jù)考慮到圖形頁(yè)面中文件的圖形標(biāo)識(shí)符的位置以及專(zhuān)用于再現(xiàn)設(shè)備的幾何特性所確定的策略來(lái)自動(dòng)鏈接文件的再現(xiàn)。
11.根據(jù)權(quán)利要求10所述的再現(xiàn)設(shè)備,其特征在于,包括確定具有接近參數(shù)值的文件組的裝置(3,12),圖形標(biāo)識(shí)符與具有相仿物的文件組相關(guān)。
12.根據(jù)權(quán)利要求10或11所述的再現(xiàn)設(shè)備,其特征在于,包括接收裝置(7,8),用于通過(guò)指定由接收機(jī)使用的、用于自動(dòng)鏈接文件的再現(xiàn)的導(dǎo)航策略,來(lái)接收用于激勵(lì)導(dǎo)航的命令。
13.根據(jù)權(quán)利要求10或11所述的再現(xiàn)設(shè)備,其特征在于,包括確定裝置(3,12),用于由再現(xiàn)設(shè)備確定用于自動(dòng)地鏈接文件的再現(xiàn)的導(dǎo)航策略。
14.根據(jù)權(quán)利要求10到13之一所述的再現(xiàn)設(shè)備,其特征在于,所述導(dǎo)航裝置(3,12)選擇并再現(xiàn)其圖形標(biāo)識(shí)符位于起始點(diǎn)和結(jié)束點(diǎn)之間的直線(xiàn)段附近的文件,所選擇的第一文件位于起始點(diǎn)或最接近所述起始點(diǎn)。
15.根據(jù)權(quán)利要求10到13之一所述的再現(xiàn)設(shè)備,其特征在于,所述導(dǎo)航裝置(3,12)選擇并再現(xiàn)其圖形標(biāo)識(shí)符位于幾何形狀附近的文件,所述幾何形狀包括從起始點(diǎn)開(kāi)始并在屏幕的邊緣處結(jié)束的線(xiàn),所選擇的第一文件位于起始點(diǎn)或最接近所述起始點(diǎn)。
16.根據(jù)權(quán)利要求10到13之一所述的再現(xiàn)設(shè)備,其特征在于,包括確定圖形標(biāo)識(shí)符的子集的裝置(3,12),導(dǎo)航裝置隨機(jī)并順序地選擇與所述子集的圖形標(biāo)識(shí)符相關(guān)的每一個(gè)文件。
17.根據(jù)權(quán)利要求10到16之一所述的再現(xiàn)設(shè)備,其特征在于,包括顯示裝置(3,10,11,12),用于根據(jù)所確定的策略來(lái)顯示再現(xiàn)文件的數(shù)目。
18.根據(jù)權(quán)利要求10到17之一所述的再現(xiàn)設(shè)備,其特征在于,包括顯示裝置(3,10,11,12),用于顯示正在進(jìn)行再現(xiàn)的文件的序號(hào)。
全文摘要
公開(kāi)了一種用圖形界面在音頻文件的集合中進(jìn)行導(dǎo)航的方法及接收機(jī),可以從配備了顯示設(shè)備的接收機(jī)訪(fǎng)問(wèn)所述聲音文件。所述方法包括第一步驟,用于分析文件,以便確定專(zhuān)用于每一個(gè)文件的、被稱(chēng)作低級(jí)的音頻參數(shù)。然后,在圖形頁(yè)面上定位至少一部分聲音文件的圖形標(biāo)識(shí)符,圖形標(biāo)識(shí)符的排列的位置取決于之前計(jì)算的參數(shù)。最后,該方法包括步驟通過(guò)根據(jù)考慮到圖形頁(yè)面中文件的圖形標(biāo)識(shí)符的位置所確定的策略順序地再現(xiàn)聲音文件來(lái)進(jìn)行自動(dòng)導(dǎo)航。本發(fā)明還涉及一種執(zhí)行軟件導(dǎo)航模塊的設(shè)備,能夠根據(jù)所確定的策略并根據(jù)在圖形頁(yè)面中文件的表述位置來(lái)再現(xiàn)聲音文件。
文檔編號(hào)G11B27/28GK1836230SQ200480017413
公開(kāi)日2006年9月20日 申請(qǐng)日期2004年7月2日 優(yōu)先權(quán)日2003年7月3日
發(fā)明者路易·舍瓦利那, 伊莎貝拉·格拉斯蘭, 讓-羅南·維古魯 申請(qǐng)人:湯姆森許可貿(mào)易公司