欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

存儲和檢索基于非文本的信息的系統(tǒng)和方法

文檔序號:6570255閱讀:222來源:國知局

專利名稱::存儲和檢索基于非文本的信息的系統(tǒng)和方法存儲和檢索基于非文本的信息的系統(tǒng)和方法
背景技術(shù)
:本發(fā)明通常涉及創(chuàng)建可搜索的參考數(shù)據(jù)庫的系統(tǒng)和方法,該系統(tǒng)和方法特別用于但不限于音樂和多媒體文件。特別地,其涉及使用基于非文本的(non-text-based)檢索系統(tǒng)來檢索已存儲的音樂。保存在數(shù)據(jù)庫中的已存儲的音樂集合已經(jīng)成為商業(yè)景觀中的共同特征??墒?,在這樣的數(shù)據(jù)庫中尋找音樂會產(chǎn)生問題。一個明顯的問題是使用音樂數(shù)據(jù)庫提供的搜索方法所導(dǎo)致的困難。一般地,用戶必須從文本輸入開始,一般被指定或輸入到特定的搜索字段,例如"歌曲名稱"或"藝術(shù)家"。但是,用戶不記得作品的準確名稱,甚至藝術(shù)家、團隊或作曲者的名稱也不記得。在此,不但在例如EngelbertHumperdinck的各種具體名稱中存在大量的混淆,而且即使用戶能夠記住名稱,拼寫也是個問題。基于文本的音樂搜索的普遍需求造成了現(xiàn)有技術(shù)中的固有問題。而且,一旦從文本開始,現(xiàn)有技術(shù)無法為用戶提供聆聽一段音樂主旋律的機會。此處所用的旋律是指那些人類傾聽者會認為其是一段音樂的主要部分的曲調(diào)、節(jié)奏和可能的歌詞的組合。即使可以訪問一段音樂的原創(chuàng)配樂和歌詞,現(xiàn)有技術(shù)完成這樣的任務(wù)也是困難的。自動從配樂中提取旋律并從歌詞中為它加上文字,即便不是不可能也是困難的。已經(jīng)有一些方法嘗試使用信號處理和人工智能方法來從歌曲的數(shù)字格式中提取歌曲的主要曲調(diào)。這些方法失敗了,尤其在涉及多種樂器同時演奏的音樂中。因此,出現(xiàn)了提供根據(jù)基于非文本的檢索方法來檢索已存儲音樂的改進方法和系統(tǒng)的機會。發(fā)明概述本發(fā)明的一個方面是基于非文本標識所存儲音樂的所選項目的方法。該方法的第一主要部分集中于建立音樂標識數(shù)據(jù)庫。該過程需要捕獲所選音樂項目的標簽,并處理該標簽以產(chǎn)生關(guān)于其的參考關(guān)鍵字(key)。然后標簽與參考關(guān)鍵字及關(guān)于所存儲音樂的關(guān)聯(lián)一起被存儲。該數(shù)據(jù)庫通過收集許多標簽來建立。該方法的第二主要部分是從數(shù)據(jù)庫中檢索所存儲音樂的所期望的項目。該過程需要從用戶處捕捉查詢標簽,并處理該查詢標簽以產(chǎn)生關(guān)于其的查詢關(guān)鍵字。將查詢關(guān)鍵字與存儲于數(shù)據(jù)庫中的參考關(guān)鍵字進行比較,以標識所存儲音樂的所期望的項目。圖1說明了用于建立已存儲音樂的基于非文本的數(shù)據(jù)庫的過程的實施例。圖2展示了根據(jù)圖1所示的實施例的用于控制標簽的記錄的圖形界面的一個實施例。圖3展示了間接標簽輸入(tagentry)界面的一個實施例。圖4描繪了根據(jù)圖1的實施例的標簽關(guān)鍵字的建立。圖5展示了用于檢索已存儲音樂的數(shù)據(jù)庫的數(shù)據(jù)記錄的結(jié)構(gòu)。圖6展示了根據(jù)圖1所示的實施例的用于控制為標簽質(zhì)量投票的圖形界面的一個實施例。圖7說明了用于檢索已存儲音樂的過程的實施例。圖8a和8b說明了用于建立已存儲音樂的數(shù)據(jù)庫及檢索已存儲音樂的過程的實施例。詳細描述參考附圖做出以下詳細說明。描述優(yōu)選實施例是為了說明本發(fā)明,而非限制其范圍,本發(fā)明的范圍僅由權(quán)利要求限定。那些本領(lǐng)域的普通技術(shù)人員可以認識到根據(jù)下面的描述的多種等價變換??梢岳斫獾氖?,前面的一般描述和下面的詳細說明都僅僅是示例性的和解釋性的,不像權(quán)利要求一樣對本發(fā)明進行限制。在下面的討論中,類似附圖標記代表類似元素。一般地,本發(fā)明可以想象為兩個主要的相關(guān)聯(lián)的部分。第一,必須準備已存儲音樂的數(shù)據(jù)庫,圍繞基于非文本的結(jié)構(gòu)來建立該數(shù)據(jù)庫。然后,可利用基于非文本的搜索和檢索機制來檢索所需的音樂項目。整個發(fā)明的第一部分在圖1和伴隨的討論中進行一般描述,第二部分在圖2中描述。音樂標簽圖1描述了用于建立基于非文本的音樂數(shù)據(jù)庫的過程ioo。本領(lǐng)域技術(shù)人員可以得知,這樣的數(shù)據(jù)庫具有許多可能的應(yīng)用。在一個實施例中,該數(shù)據(jù)庫支持較大商業(yè)的音樂銷售部分,例如出售圖書、電子設(shè)備和其他產(chǎn)品及音樂的基于web的一般銷售操作。另一個實施例使用位于音樂店鋪中的音樂臺中的數(shù)據(jù)庫,使得顧客可以標識所需音樂。在這兩個實施例中,音樂搜索系統(tǒng)將數(shù)據(jù)饋送至某種購物引擎??蛇x地,數(shù)據(jù)庫可以是獨立網(wǎng)站的主驅(qū)動器,在此描述那個實例。本領(lǐng)域技術(shù)人員有能力使顯示的實例適應(yīng)其他的環(huán)境和應(yīng)用。這樣重要的應(yīng)用可以使本發(fā)明的方法適應(yīng)移動電話環(huán)境,其中小鍵盤強烈地促進了通過歌唱而不是打字來指示音樂選擇的能力。這個數(shù)據(jù)庫的關(guān)鍵原理是其包含音樂項目旋律的人類感知的人類再現(xiàn)(rendition)。因此,該數(shù)據(jù)庫不包括原創(chuàng)音樂項目,甚至也不包括那些項目的參考部分。它包括此處稱為"標簽"的音頻文件,通常是很短的表演(十幾秒長而不是幾分鐘長),其記錄了由人直接或間接再現(xiàn)的音樂旋律,如下所展示的。術(shù)語"標簽"在下文用于表示這樣的再現(xiàn)。應(yīng)該注意的是,一組源自人的音樂示例的存在完全避免了限制現(xiàn)有技術(shù)的關(guān)鍵問題,即,從復(fù)雜音頻文件中抽取音樂旋律的某一簡單版本的需求。在此,參考樣本不僅是簡單直接的產(chǎn)品,也是人工制品而不是計算機構(gòu)造。查詢?nèi)说母杏X更可能比計算機程序的感覺更接近地符合加標簽的人的感覺。結(jié)果是促成了整個搜索過程的一組數(shù)據(jù)。通過諸如單選按鈕、菜單選擇等傳統(tǒng)方法啟動"添加音樂"功能之后,用戶必須選擇是在聲音輸入模式還是在間接或符號輸入模式中輸入標簽。前一選擇需要用戶生成用戶感覺的音樂旋律的聲音再現(xiàn)。聲音重現(xiàn)可以釆用用戶喜歡的任何形式——歌唱、哼唱、吹口哨等。唯一的要求是輸入應(yīng)當為音頻信號。這種要求導(dǎo)致了對如麥克風(fēng)的音頻輸入設(shè)備的需求,但是這種設(shè)備的特性和質(zhì)量留待用戶處理。由于用戶向數(shù)據(jù)庫中輸入項目而不是輸入搜索請求,所以必須提供音樂段的名字。此外,用戶可以提供藝術(shù)家的名字以指示提出一段特定的再現(xiàn),或簡單地為將來的搜索提供更多信息。在一個實施例中,用戶提供的文本信息經(jīng)歷智能確認例程,該例程尋找拼寫錯誤等,以努力確保明確的可能數(shù)據(jù)。該例程可以擴展為檢查上下文,以能夠查詢用戶,例如,用戶是否確認Aerosm他錄制了巴赫大合唱。如果用戶選擇聲音輸入,系統(tǒng)可以提供如圖2所示的圖形界面。在那里,屏幕140回送用戶提供的文本信息,并提供錄音控制。屏幕顯示了廣泛應(yīng)用于因特網(wǎng)上及因特網(wǎng)下的錄音設(shè)備的典型控件,這些控件可以被改變或處理,可是最好適應(yīng)具體實施例的需要。聲音輸入可以以任何處理音樂材料的已知格式被捕捉及儲存,例如WAV、MP3、WMA等等。不同的文件格式需要如下所述地調(diào)整處理系統(tǒng),但這樣的調(diào)整也在本領(lǐng)域普通技術(shù)人員的能力范圍之內(nèi)?;蛘?,用戶可以通過使用如圖3所示的音樂輸入界面150來選擇非音頻輸入。這個界面允許用戶輸入使用直接音符的旋律。提供了五線譜152,在此以具有高音譜號和低音譜號的鋼琴式樣來進行設(shè)置,拖拽區(qū)域154以多種節(jié)拍值、升半音和降半音符號及其他多種值來提供音符。用戶可以拖拽五線譜上的符號來創(chuàng)建旋律。此外,也提供了鍵盤156,其允許用戶點擊鍵,以此在五線譜上顯示音符。輸入音符的多種技術(shù)都是本領(lǐng)域已知的,本領(lǐng)域技術(shù)人員能夠選擇并改變這些技術(shù)以適應(yīng)涉及在此要求的本發(fā)明的特定應(yīng)用的需求。一種非常有用的輸入方法是MIDI界面,以便用戶通過在鍵盤或其他樂器的MIDI設(shè)備上演奏而輸入旋律。本領(lǐng)域技術(shù)人員可以理解將MIDI產(chǎn)生的文件轉(zhuǎn)換為現(xiàn)有系統(tǒng)偏好的格式的最有效的方法。如上所述將以符號表示的輸入轉(zhuǎn)換為音樂格式,優(yōu)選地轉(zhuǎn)換為被選擇來如上所述地處理音頻材料的格式。此時的系統(tǒng)具有可以回放和被人聽到的文件,但是對于匹配音樂項目來說它是相對無用的工具。甚至超出匹配文件內(nèi)容的問題。在需要信號處理來達到能夠應(yīng)用匹配算法這一點上,現(xiàn)有技術(shù)是清楚的。現(xiàn)有技術(shù)已經(jīng)提出了許多解決方法,但是直到本發(fā)明出現(xiàn)前還沒有能夠提供合適結(jié)果的方法。圖4表示用于為匹配算法生成輸入的過程的實施例200。該過程包括處理標簽內(nèi)容以生成適合用于匹配算法的進一步操作的數(shù)據(jù)結(jié)構(gòu),這樣的數(shù)據(jù)結(jié)構(gòu)此后被稱為"關(guān)鍵字"文件。還可以理解的是,音樂檢索系統(tǒng)可以使用預(yù)先錄制的音樂文件以備用戶的輸入來匹配。這樣的文件可以包括存在的音樂錄音、或提取自該音樂錄音或這樣音樂的特殊錄音版本。對于提供參考音樂的這些或其他方法中的任一個,將音頻文件處理為關(guān)鍵字文件如下所述地進行。最初,音頻文件被分割為適當?shù)墓ぷ鏖L度——諸如25毫秒——的幀。從方法本身的描述中可以理解,該實施例在信號電平中設(shè)置邊界,音頻文件沒有被拆分為鄰接的幀,而是在相鄰幀之間提供了重疊。優(yōu)選的是這樣的重疊約達幀長度的50%。步驟204-212展示了依次應(yīng)用到每個幀的過程,旨在以數(shù)字化的音頻信號開始并導(dǎo)出一連串音樂音符值。步驟204的第一個動作是為了檢測音高升降曲線。現(xiàn)有技術(shù)中達到這個結(jié)果的許多技術(shù)都是已知的。多個實施例利用使用自相關(guān)音高追蹤的音高追蹤器、或平均差分函數(shù)(AMDF)分析或調(diào)和群(harmonicgrouping)。這些或其他已知方法中的任一種可以被用來產(chǎn)生包括音高值的向量的輸出,并且每幀一個音高值。這些輸出因此在時間上對應(yīng)于音高值的軌跡。接著,在步驟206標識暫停(靜默時段)。這可以通過多種已知方法實現(xiàn)。一個實施例使用基于聲能的原始值或?qū)?shù)值的能量直方圖。然后,如果確定存在多種模式,系統(tǒng)動態(tài)地計算"靜默閾值",其定義了有聲(大于邊界的值)和靜默(小于邊界的值)之間的邊界??紤]有聲的這段時間,步驟208確定音符之間邊界的位置。一個實施例分析能量水平和音高值,接通任一因素改變超過所選閾值的點。另一個實施例關(guān)注連續(xù)幀之間的交叉相關(guān)。這些和其他對于本領(lǐng)域人員已知的技術(shù)產(chǎn)生一個音符變成另一個的時間值??梢岳斫猓噜彽囊舴兓c之間的音高值很可能改變。音符的圓滑和連奏效果實際上確保人的再現(xiàn)不由一連串純粹的音符組成??墒菍⒁纛l文件轉(zhuǎn)換為一連串音符需要為每個音符選擇固定的音高值。因此,步驟210給每個音符時段指派單個音高值。一個實施例使用音符邊界之間的音高升降曲線的算數(shù)平均值。另一個實施例使用幾何平均值。也可以使用現(xiàn)有技術(shù)中的其他已知技術(shù)。最后,量化音符音高值,即,設(shè)置成對應(yīng)于具有預(yù)定值的音樂音符。在步驟212中選擇特定音符以便將量化中的差分誤差最小化。應(yīng)該注意的是,本方法可以處理音程的任意給定系統(tǒng)并在該系統(tǒng)中發(fā)揮作用。對于西方音樂,最通常情況下使用半音系統(tǒng),但是僅僅通過選擇不同的量化表該系統(tǒng)就同樣能夠與各種其他調(diào)音系統(tǒng)一起工作。類似地,可以提供平均律和純正(well)律。對于每個幀,結(jié)果是具有至少表示音高和音長的值的一系列多維變量。其他實施例能使用附加維度,計入音量、起奏和其他音樂特征及語音因素。步驟214確定所有的幀是否已被處理并通過步驟204-212循環(huán)返回,直到完成。當完成處理時,在計入幀之間重疊量的情況下,從幀結(jié)果中組裝關(guān)鍵字。到目前為止,系統(tǒng)己經(jīng)收集了數(shù)據(jù)和元數(shù)據(jù)。數(shù)據(jù)項包括音頻標簽和關(guān)鍵字。元數(shù)據(jù)有幾種類型——項目元數(shù)據(jù),例如一段音樂的名字、藝術(shù)家的名字等;用戶元數(shù)據(jù),例如用戶的名字,以及在一些實施例中的其他標識數(shù)據(jù);及系統(tǒng)元數(shù)據(jù),例如輸入時間或?qū)τ趹?yīng)用操作有用的其它信息。系統(tǒng)此時能夠建立數(shù)據(jù)記錄,如圖5所示。在此,數(shù)據(jù)記錄160包括數(shù)據(jù)項162和元數(shù)據(jù)164。前一類別包括音頻標簽165和關(guān)鍵字166,后者包括項目元數(shù)據(jù)167、用戶元數(shù)據(jù)168和系統(tǒng)元數(shù)據(jù)169。數(shù)據(jù)庫系統(tǒng)本身進一步的細節(jié)可以留給本領(lǐng)域技術(shù)人員處理。足以支持所示實施例和類似結(jié)構(gòu)的典型數(shù)據(jù)庫應(yīng)用由Oracle公司、微軟公司和其他公司提供。給出此處所示的數(shù)據(jù)結(jié)構(gòu),本領(lǐng)域的人員能夠建立并支持所需要的數(shù)據(jù)庫應(yīng)用。要注意的一點是為了提供快速的搜索結(jié)果,本系統(tǒng)不需要使用數(shù)據(jù)索引。系統(tǒng)能夠提供使用關(guān)鍵字文件的直接檢索操作,即使規(guī)模很大也無需任何索引系統(tǒng)。在一些狀況中可能需要引進索引方法,但是該步驟對于如此處所公開和要求的系統(tǒng)操作來說是不需要的。為了確保廣泛覆蓋,在討論中的應(yīng)用實施例必須積聚相當大的標簽數(shù)據(jù)庫。此外,為了進一步確保出現(xiàn)高質(zhì)量標簽,為音樂的每個可能段都收集許多標簽是很有利的。數(shù)量的第一個問題可以通過建立多個針對激發(fā)用戶輸入標簽的激勵計劃來解決。一個方法可以是簡單的支付計劃,其中對于輸入的每一個標簽,都給予用戶一定量的補償。雖然該方法簡單,但其不能激發(fā)有質(zhì)量的輸入。在系統(tǒng)不僅操作音樂數(shù)據(jù)庫還出售音樂表演的應(yīng)用環(huán)境中,優(yōu)選的方法是代理模式,其中,如下詳述,每次另一個用戶基于第一用戶輸入的標簽而購買音樂項目時,就對該第一用戶進行補償。用戶輸入多個標簽,特別是多個高質(zhì)量標簽,可以通過在網(wǎng)站的適當頁面被標識為"專業(yè)加標簽者(powertagger)"等而得到褒獎。多種激勵計劃都是可能的,用戶很可能在不同情況下使用一系列激勵計劃。除了傳統(tǒng)分類的補償方案之外,系統(tǒng)操作者可以通過提供用于下載到移動電話的標簽以作為鈴聲而將標簽作為收入來源。這樣的提供可基于貨幣支付,或者鈴聲可被結(jié)合到激勵計劃中。此外,可以通過為每次下載他/她的標簽而提供報酬或其他榮譽給原始加標簽者來進一步鼓勵旋律貢獻。對于本領(lǐng)域技術(shù)人員來說,會出現(xiàn)其他收入機會,而這些機會都在此處權(quán)利要求的范圍內(nèi)。質(zhì)量提議的問題是個別的但很重要的問題。許多人不能很好地表演音樂,如果由這樣的人輸入標簽,標簽與實際的音樂項目將只具有很少的類似之處。因此,試著"哼唱幾個小節(jié)"的后繼用戶也許很好地提交一段音樂的優(yōu)良再現(xiàn),但是基于此樣本,不會返回正確結(jié)果。如下討論的實施例中采用了如圖6所示的對于那個問題的一種可能解決方法。在此,向用戶提供聆聽已存在的標簽并為其演奏質(zhì)量投票的機會。那里顯示的網(wǎng)頁允許投票用戶有機會察看相關(guān)元數(shù)據(jù)(加標簽者的名字、項目信息等)并使用10星系統(tǒng)為標簽的質(zhì)量投票。投票允許系統(tǒng)在標簽中進行區(qū)分,標識那些最佳復(fù)制旋律的標簽和沒有最佳復(fù)制旋律的標簽。由于自己的標簽條目,系統(tǒng)操作者很可能想激勵用戶提交投票,至少在任何給定系統(tǒng)的歷史早期。以下包括檢索數(shù)據(jù)中投票信息的使用。如多個實施例所示,投票信息可以以多種方式結(jié)合到基本數(shù)據(jù)庫系統(tǒng)中。如下所示的實施例中的一種方法,簡單地將投票結(jié)果表鏈接到基本標簽表,且進一步鏈接到提供投票的那些用戶。本領(lǐng)域技術(shù)人員為了完成此任務(wù)可以設(shè)計同樣有效的其他方法。要注意的是早期的系統(tǒng)操作者能開發(fā)隨后可以作為獨立的產(chǎn)品被賣給其他人的標簽數(shù)據(jù)庫。因此,例如基于web的企業(yè)能夠開發(fā)相當大的用戶社區(qū),生成巨大且有用的標簽數(shù)據(jù)庫。音樂商店未必能夠開發(fā)這樣的數(shù)據(jù)庫,因此本質(zhì)上對于數(shù)據(jù)庫而言可能存在市場。這進一步說明了系統(tǒng)的建立和檢索部分可以獨立操作的事實。很容易想到,一個企業(yè)能夠獨自進行包括開發(fā)和銷售這種數(shù)據(jù)庫的事務(wù)。其他公司能夠以從不進行任何建立步驟但卻只使用已有的數(shù)據(jù)庫來進行搜索的方式來類似地起作用。序列匹配和計分如圖7所示,在已經(jīng)構(gòu)建標簽數(shù)據(jù)庫的情況下,系統(tǒng)準備好檢索已存儲的音樂。檢索音樂中的第一用戶步驟252是輸入"查詢標簽",g口,準確執(zhí)行上述步驟以產(chǎn)生數(shù)據(jù)庫標簽。此后,數(shù)據(jù)庫中的標簽及相關(guān)聯(lián)的關(guān)鍵字被稱為"參考"標簽和關(guān)鍵字。在系統(tǒng)的一個實施例中,用戶能夠直接或間接(使用符號)地輸入"査詢標簽",連同標簽的創(chuàng)建一起完成。無論如何,此步驟的結(jié)果是創(chuàng)建了與標簽具有同樣結(jié)構(gòu)的査詢。接著,在步驟254,準確使用上述同樣的過程,査詢標簽被用于產(chǎn)生査詢關(guān)鍵字。為了方便,下面的討論使用術(shù)語"查詢"和"參考"來分別表示查詢關(guān)鍵字和參考關(guān)鍵字。通常,隨后的步驟256-266通過交互地取出每個査詢、按下述分析、并接著比較分析來找到對査詢的最佳匹配。這些分析旨在以計分來表示參考序列——或者另外參考序列的一部分——匹配查詢序列的程度,并隨后根據(jù)該計分對匹配的質(zhì)量進行排序。步驟256的取出操作按照慣例進行。雖然沒有應(yīng)用任何索引系統(tǒng),但如果可以獲得如上所述的用戶進行的排序,則那些排序可以用于分組參考,以使得高排位的參考在低排位參考之前被取出。通過在處理另一個音樂片段之前以排序的順序取出給定音樂片段(由元數(shù)據(jù)標識的)的所有樣本來進行一個實施例。另一個實施例以排序順序取出參考,以使得首先對所有高質(zhì)量的參考運行查詢,并僅在隨后對低排位的參考運行查詢。這種安排留待系統(tǒng)操作者的判斷。通過比較搜索査詢與數(shù)據(jù)庫中的參考來確定査詢與參考之間的最優(yōu)匹配。這可以以多種方式完成,通常被歸入標題"字符串對齊(stringalignment)"之下。許多這樣的方法都是本領(lǐng)域已知的,例如"位距"方法、Needleman-Wunsch算法或所謂的旅行推銷員問題(TravelingSalesmanProblem)及其他。此處詳細討論并要求的一個實施例,使用稱為動態(tài)轉(zhuǎn)換匹配(dynamictransitionMatching:DTM)的對齊方法,該技術(shù)源于動態(tài)編程技術(shù)。圖7以流程圖的形式將該方法示為過程250。DTM是通過分析、量化并隨后匹配事件之間的轉(zhuǎn)換而不是匹配事件本身的、用于匹配事件序列的普適方法。這些序列("節(jié)點")潛在可能是多維的,并且它們可能是完全不同的,因為它們的節(jié)點的每個維度都處于不同的坐標系。然而,如果技術(shù)是針對每個維度(例如,差分、比值等)適當定義的,則節(jié)點維度之間的轉(zhuǎn)換可以被匹配而無需考慮他們的坐標系。因此,DTM表現(xiàn)為普適且有力的技術(shù),可適用于具有多種維度和對于不同維度的轉(zhuǎn)換的多種定義的各種應(yīng)用。為了簡化該表示,當前的討論將實例限于例示實施例的曲調(diào)匹配應(yīng)用。在此,數(shù)據(jù)"節(jié)點"和"音符"可互換使用。本領(lǐng)域技術(shù)人員可以理解該技術(shù)對于其他領(lǐng)域及學(xué)科的廣泛適用性。就方法中的這一點,實施例具有二維序列形式的查詢和參考。序列中的每個音符是音高值和音長值的向量。其他實施例可按需包括語音內(nèi)容和其他信息。參考序列可以標示為(rl,dl)、(r2,d2)、、(m,dn),其中,r值表示音高索引,d值表示音長索引。類似地,査詢序列標示為(ql,tl)、(q2,t2)、…、(qm,tm)。通常,査詢的大小m小于參考的大小n,但這不是必要條件。DTM不需要歸一化時間標度,或者關(guān)鍵字和査詢的音高標度相同。也無需轉(zhuǎn)換序列以便于例如移除暫停或轉(zhuǎn)換原始序列為一系列轉(zhuǎn)換值——分析能夠使用原始數(shù)據(jù)進行。該技術(shù)匹配關(guān)鍵字中兩個節(jié)點間的轉(zhuǎn)換——與査詢中兩個節(jié)點間的轉(zhuǎn)換相比——因此,稱為動態(tài)轉(zhuǎn)換匹配。這兩個轉(zhuǎn)換之間的比較可以計入一個或更多個特征——例如,實施例可按需使用半音差分、音長比例、語音內(nèi)容及其他特性。DTM技術(shù)對兩個序列起作用,例如,査詢=(60,12),(暫停,6),(65,12),(71,2),(72,10),(67,23),(65,12)參考=(89,10),(90,10),(暫停,5),(95,10),(102,10),(97,20),(95,10),(90,10)如上所述,每個序列成員的值表示音高和音長值,其由關(guān)鍵字提取過程確定。很清楚,包含7個成員查詢能夠與參考對齊,在每個序列的第一成員處開始,舍去(leaving)沒有匹配音符的參考的最后的成員,或通過匹配最后的音符并舍去不匹配的第一參考音符。此外,處理實際音樂的系統(tǒng)也必須允許序列中兩個或更多個音符應(yīng)當被合并的可能性,以便允許如連音符和裝飾音的現(xiàn)象。例如,在此處查詢序列中,成員4和成員5實際具有同樣的音高,也都有非常短的音長。表1示出了匹配問題的解決方法。注意暫停如何匹配,并也注意查詢中(71,2)和(72,10)的合并匹配參考中的音符(102,10)。結(jié)果,第一個和最后一個參考序列成員沒有與相應(yīng)的査詢成員匹配。<table>complextableseeoriginaldocumentpage20</column></row><table>表l.對齊示例圍繞矩陣或如下面表2的計分表建立最優(yōu)對齊分析,其中,i軸上的單元格表示參考序列中的向量,j軸上的單元格表示查詢向量。表2表示被構(gòu)建用來分析示例查詢和參考的整個表的示例性部分。顯示了(ri,d。和(qj,tj)的值。<table>complextableseeoriginaldocumentpage20</column></row><table><table>tableseeoriginaldocumentpage21</column></row><table>表2:計分表這種分析與Needleman-Wunsch算法具有同樣的一些特征。首先,通過從矩陣的左上方(i=l,j=l)到右下方(i=max,j-max)遍歷矩陣來進行分析,依次向下處理每一列,對每個單元格計算計分S(i,j)。分析的最終產(chǎn)物是按照逐單元格的最優(yōu)遍歷,從(i=l,j=l)到(i=maX,j二max)的最優(yōu)路徑。給定在Needleman-Wunsch方法中對隱含的移動施加限制,從單元格(i,j)開始的遍歷只能沿著三條路進行沿對角線方向向下到(i+l,j+l);垂直方向到(i,j+l)或水平方向到(i+l,j)。根據(jù)實際匹配的值序列,可以看到對角線方向的移動與對應(yīng)于匹配一對新的值。因此,在(i-l,j=l)時,(rl,dl)匹配(ql,tl),而移動到(i=2,j=2)則產(chǎn)生新的匹配(r2,d2)對(q2,t2)。垂直或水平方向上的移動在一條軸上繼續(xù)前進但不在另一方向上前進。因此,在(i=l,j=l)時,(rl,dl)匹配(ql,tl),但是垂直移動到(i=l,j=2)試圖匹配(rl,dl)對(q2,t2)。顯然,操作可以進行的唯一方法是刪除(ql,tl)或(q2,t2)中的一個,因此,這些操作被分別稱為垂直或水平刪除。一個重要的概念是每個單元格有父類單元格(i,j),該單元格的計分基于此父類單元格。在計分處理期間基于產(chǎn)生最高計分的遍歷確定父類單元格。對于匹配來說,父類單元格是(i-l,j-1)。對于垂直刪除來說,父類單元格是(i-l,j),對于水平刪除來說,父類單元格是(i,j-1)。因此,步驟268的計分包括測試已經(jīng)到達測試單元格的三種可能遍歷,從父類單元格的計分開始,并應(yīng)用適當?shù)挠嫹趾瘮?shù)以確定哪個可能的遍歷產(chǎn)生最好計分。因此,每個單元格的計分嚴重依賴于之前所經(jīng)過的路徑。此外,計分系統(tǒng)被構(gòu)建成通過為那些遍歷估算刪除成本來獎勵匹配和勸阻刪除。通常,計分公式如下S(i,j)=max(SDV,SDH,Sm,0)(式l)其中Sdv-垂直—刪除—計分(VERRTICAL_DELETION—SCORE)Sdh二水平JM除—計分(HORIZONTAL—DELETION—SCORE)Sm-替換—計分(匹配)(SUBSTITUTION—SCORE(Match))注意,單元格的計分不能小于0。通過確保遍歷是實際可能的來應(yīng)用邊界條件。例如,在(i=l,j=l)時,在右上角沒有任何可能的移動,所以唯一的辦法就是將該單元格計為默認值O。在那一列中的其他單元格中,垂直刪除是可能的,但無法進行匹配或水平刪除。應(yīng)用這些原理為三種可能的遍歷計分,分數(shù)如下計算SDV=S(i-l,j)-DVSDH=S(i,j-l)-DHSm=S(i-l,j-l)+T其中,DV和DH是刪除成本因子,T是轉(zhuǎn)換函數(shù)。轉(zhuǎn)換函數(shù)是從(i-l,j-1)移動到(i,j)的值。本領(lǐng)域技術(shù)人員可以為使用DTM技術(shù)的特殊應(yīng)用確定適當?shù)霓D(zhuǎn)換函數(shù)。對于在此所述的音樂搜索應(yīng)用,T是每個維度差值的絕對值的加權(quán)組合,在所述示例中是音高和音長的對數(shù)。該原理的改進在下面描述。如上所述,在組合相鄰音符有益的音樂應(yīng)用中會出現(xiàn)很多種情形。通過添加衡量這種組合結(jié)果的因子可以將此過程整合到計分過程中。通過添加分析垂直和水平合并的條件,結(jié)果計分函數(shù)如下所示S(i,j)=max(SD,SDH,Sm,SHC,Svc,0)(式2)其中Sof垂直—刪除—計分(VERTICAL—DELETION—SCORE)8011=水平_刪除—計分(HORIZONTAL—DELETION—SCORE)Sm二替換—計分(匹配)(SUBSTITUTION_SCORE(Match))SHC=max(水平—合并—計分(HORIZONTAL—CONS_SCORE)(h)),h=l,2,3,…,HmaxSvc=max(垂直—合并—計分(VERTICAL—CONS—SCORE)(v)),v=l,2,3,…,Vmax注意,單元格的計分不能小于O。本方法的計分過程與現(xiàn)有技術(shù)中的類似算法有顯著的不同。首先,現(xiàn)有技術(shù)沒有開發(fā)出有效方法以解決暫停問題,即音樂片段中的靜默時段。在如遺傳(genetic)序列的現(xiàn)象分析中不會出現(xiàn)這種問題,因為不存在一些基本成分沒有值的遺傳序列。此處,暫停被作為"未定義"的值來對待,允許分析繼續(xù)進行,也允許給予暫停如下所述的特殊考慮。另外,此處的分析集中于音符之間的轉(zhuǎn)換而不是音符本身,理解這一點是很重要的。結(jié)果,計分過程包括通過在垂直或水平方向上刪除先前的音符、通過在垂直或水平方向上再次組合兩個或更多個先前的音符、或通過將轉(zhuǎn)換作為"匹配"來對待——即從先前的音符到現(xiàn)有音符的簡單移動——來確定是否達到最高分。分析了所有五種可能的轉(zhuǎn)換,保留出現(xiàn)最高分的一個,并在矩陣中的合適點輸入分數(shù)。對于計分函數(shù)的每個部分都有多種可能的修改和增加。下面的討論集中于每個分量的細節(jié)。Sny二垂直刪除計分(VERTICALDELETIONSCORE)這個計分由垂直刪除或根據(jù)表2的査詢中的音符的刪除而得到??梢岳斫猓瑒h除沒有好處,并由此估算成本。如果垂直刪除的成本是DV,貝ij:SDV(i,j)=S(i,j-l)-DV(式3)刪除成本進一步被將要刪除的音符的重要性歸一化。如果將要刪除的音符的音長是tj,則經(jīng)歸一化的刪除成本應(yīng)該是DV*tj/mean_q,其中mean_q(平均值—q)是指遍及所有非暫停節(jié)點的查詢序列的音長平均值。<formula>formulaseeoriginaldocumentpage24</formula>(式4)如上所述,刪除意味著對轉(zhuǎn)換的實際刪除??墒?,通過刪除包含該轉(zhuǎn)換的兩個節(jié)點(其被稱為源節(jié)點和目的節(jié)點)中的一個來刪除轉(zhuǎn)換。必須作出是應(yīng)當刪除過去/源(j-l)節(jié)點還是刪除現(xiàn)在/目的(j)節(jié)點的決定。該決定通常依賴于應(yīng)用??墒牵绻舴呀?jīng)在另一個轉(zhuǎn)換中被匹配則不能被刪除。因此使用下述規(guī)則如果score(i,j)〉0:這意味著存在具有正分的先前的匹配,因此j-l處的節(jié)點是正匹配。既然這樣,刪除(j)處的新節(jié)點。如果score==0:既然如此,在當前路徑上不存在任何正匹配。因此節(jié)點(j-l)沒有用處并可以刪除。為了替換計分,記住已刪除節(jié)點是很重要的。一旦節(jié)點被刪除,其父類的特性被向前傳播以致其可用于替換計算中。S冊-水平刪除計分(HORIZONTALDELETIONSCORE)這個步驟與上述垂直刪除步驟是一樣的,但是其處理表2中的水平方向的參考刪除。參數(shù)因此改變使用DH代替DV等等。Sm-替換計分(匹配)(SUBSTITUTIONSCORE(Match))這個計分由使用從(i-l,j-l)到(i,j)的路徑得到。與參考中從(ri-l,di-l)至U(ri,di)的轉(zhuǎn)換相比,這與查詢中從(qj-l,tj-l)至lj(qj,tj)的轉(zhuǎn)換相對應(yīng)。可是,萬一父類節(jié)點已被刪除,在計算中使用被傳入他們的值。例如,如果在前一步驟,這個路徑上的(ri-l,di-l)被刪除,則其父類維度的值被傳入其中。在此步驟中使用這些值替代(ri-l,di-l)。通過將父類S(i-l,j-l)的計分加到從(i-l,j-l)到(i,j)的轉(zhuǎn)換的計分來計算新計分Sm(i,j)。因為該轉(zhuǎn)換在多維節(jié)點(在這種情況下為音高和音長)之間,計分的相對權(quán)重需要據(jù)此確定及使用??梢孕薷倪@些參數(shù)以適應(yīng)不同査詢。使用多維度計算替換計分的一般公式如下Sm(i,j)=S(i-l,j-l)+wl*STl+w2*ST2+."(式5)其中,ST1是維度1(例如音高)中轉(zhuǎn)換的計分,ST2是維度2(例如音長)中轉(zhuǎn)換的計分等。而wl,w2,…是這些轉(zhuǎn)換的相對權(quán)重。在DTM技術(shù)的另一個實施例中,與在每個階段使用權(quán)重來組合每個維度的計分不同,在基于使用計分陣列的更加復(fù)雜的標準的幾個階段之后,傳遞計分陣列并做出決定是可能的。在曲調(diào)匹配中,式4歸納為Sm(i,j)=S(i-l,j-l)+R*pitch_reward-K*tempo_error(式6)其中,pitch—reward(音高—獎勵)是與從(ri-l)到(ri)的轉(zhuǎn)換相比,從(qj-l)至U(qj)的轉(zhuǎn)換的計分。tempo—error(拍子—誤差)是與從(di-l)到(di)轉(zhuǎn)換相比,從(tj-l)到(tj)的轉(zhuǎn)換誤差。與刪除誤差類似,替換計分可以根據(jù)匹配的音符的音長來被賦予權(quán)重。這通過以在由其平均值(tj/mean_q)或((tj-l+tj)/mean—q)歸一化的查詢中音符的音長乘以增加的計分來完成。音高獎勵是0和1之間的數(shù)字,使用qj、qj-l、ri、ri-l按如下方式計算pitch—reward=l-pitch—error,而pitch—error如下計算情況I:在qj、qj-l、ri、ri-l中沒有"暫停"音高誤差作為轉(zhuǎn)換差值的絕對值來計算,使用模12操作,以允許8度音階的跳躍,然后關(guān)于較大的轉(zhuǎn)換任選地歸一化??梢詰?yīng)用更加復(fù)雜的非線性歸一化。情況II:qj和ri都是暫停在這種情況下pitch_error=0情況III:qj和ri中只有一個是暫停pitch一erro產(chǎn)l情況IV:如果qj-l和ri-l中的任一個是暫停,則在計算中使用它父類的音高并應(yīng)用上面3種情況中的一種??梢允褂枚喾N技術(shù)計算tempo—error。在我們的技術(shù)中一種可能使用的技術(shù)如下.-tempo—error=abs(log2[(di/di-l)(tj-1/tj)])(式6)注意隨著音長的比例變得更加均等,該誤差如何減少為O。通過在技術(shù)中添加歷史參數(shù)M可以改進匹配計分的質(zhì)量。在這個實施例中,基于之前M個匹配的父類的加權(quán)計分,計算匹配計分。參數(shù)M是設(shè)計參數(shù)。較高的M值需要較高的處理能力。然而,較高的M值不一定改善性能。例如,在錯誤的參考變化的情況下,我們不希望在計分計算中保持錯誤傳遞。因此M的選擇應(yīng)該考慮諸如人的注意廣度、可用的計算能力、參考數(shù)據(jù)庫的質(zhì)量等的因素。在特殊實施例中,M值可以由本領(lǐng)域技術(shù)人員很容易地確定。因此,使用歷史參數(shù)是有幫助的,但不是此處要求的方法的功能所必需的。Svr=max(垂直合并計分(VERTICALCONSSCORE)(v)),v=l,2,3,…V這一步驟確定能否通過組合查詢中的多個音符并將它們與參考中的單個音符相匹配來達到較高的計分。這是通過合并兩個音符并重新計算計分,然后合并三個音符并重新計算計分等來進行迭代。極限值Vmax是依賴于應(yīng)用和數(shù)據(jù)類型及可用處理能力的設(shè)計參數(shù)。當音符被組合時,它們的音長被相加。他們的音高可以是具有不是暫停的最大音長的主音符的音高,或者為每個已被合并并根據(jù)其音長加權(quán)的音符單獨計算pitch一error。如果使用后者的話,不累計暫停的pitch—error。SHC=max(水平合并計分(HORIZONTALCONSSCORE)(h)),h=l,2,3,…Hmax這個步驟與上述垂直合并步驟相同,但是其處理表2中水平方向的參考中的合并。所有參數(shù)相應(yīng)地改變。暫停如前所述,多數(shù)現(xiàn)行技術(shù)在應(yīng)用匹配技術(shù)之前從參考及査詢中移除暫停??墒?,暫停也許包含有價值的信息并可以用于提高性能。因為由于進出暫停的轉(zhuǎn)換不好定義而難于處理暫停,或在一些情況下,暫停被錯誤地檢測及可能存在于串(査詢或參考)中的一個但不在其他串中,所以通常會忽略暫停。本方法的目標是如果暫停確實提供有用的信息則將其作為信息源使用,或者如果暫停不能提供任何這樣的信息則忽略掉他們而沒有懲罰。不同于曲調(diào)匹配,應(yīng)用中的暫停也可以以空節(jié)點的形式存在,其中節(jié)點的一個或多個維度缺少有意義的值。在曲調(diào)中,暫停的音長維度包含有效值,而音高值維度不包含。下列步驟用于處理暫停預(yù)處理預(yù)處理所有串(査詢及參考),以便使他們不能從暫停開始,也使得不存在連續(xù)的暫停。通過計算他們的音長的和來合并所有連續(xù)的暫停。在刪除時,可以刪除暫停而沒有懲罰(或減少的懲罰)。當暫停得以匹配,其匹配父類的音高維度被傳送給它,以便當這個暫停稍后被匹配給另一個音符時使用其父類的音高信息。在計算替換計分中的音高誤差中,根據(jù)上述四種情況處理暫停。對齊確定一旦完成計分表,在步驟260,系統(tǒng)確定最佳對齊路徑。由于計分一小于O就會被變?yōu)?,所以第一行上的刪除不會受到懲罰。為了確保在對齊之后參考中的刪除不受到懲罰,我們在最后一行上尋找最終的目的地——其是具有最高計分的單元格——而不是尋找以節(jié)點(m,n)結(jié)尾的最佳路徑。這確保查詢與參考的任意部分完全匹配。一旦確定了這個目的節(jié)點,就向后遍歷以確定通向這個節(jié)點并產(chǎn)生最高分的路徑。結(jié)果是如表l中所示的對齊表。在此程度,分析足以確定査詢能否在特定的記分水平上與給定的參考序列相匹配。如果給定的應(yīng)用無需査詢與一組參考序列間的最佳匹配的分級確定,則這種程度的分析是足夠了。但是,在許多應(yīng)用中,最終的目的是找到匹配給定查詢的最佳參考?;谙铝性?,上面獲得的計分可能不足以對最佳對齊的參考進行排序-健忘以第一順序計算對齊計分,其中匹配計分僅僅依賴于父類節(jié)點。如果在一個匹配節(jié)點存在誤差,將影響兩個轉(zhuǎn)換,因此,一個誤差導(dǎo)致兩個懲罰。-刪除暫停及合并音符會導(dǎo)致給定的查詢-參考對的較小的最大可能計分。如果不同的對在其最大計分上具有不同的上限,比較他們的最終計分就不是公平的對比。在步驟262——重新記分——解決那些問題,其中使用了幾種技術(shù)以提高記分的質(zhì)量。相比于對齊0(111*11)的復(fù)雜度,重新記分的復(fù)雜度是O(m)。在重新記分中,每對分別小于Rescore—M(不必等于M)的音符的轉(zhuǎn)換被記分并將計分累加。并計算給定對齊表的最大計分,而且新的計分作為給定對齊表所達到的最大計分的百分比被報告。這是在所有查詢-參考對的新計分中確保公平比較的歸一化過程。新計分的計算可以使用一組不同的參數(shù)R、K和M,每個轉(zhuǎn)換的計分也根據(jù)每個轉(zhuǎn)換中節(jié)點的音長進行加權(quán)。通過對在參考的已對齊部分中的刪除節(jié)點進行懲罰,新的計分進一步被歸一化。如前所述,因為査詢能夠匹配參考的任意部分,所以在對齊部分之前及之后刪除的節(jié)點不應(yīng)該被懲罰??墒?,重新記分不考慮對參考的對齊部分中間的刪除節(jié)點的懲罰。為了適應(yīng)這些,新的計分乘以對齊表中的參考音符的總音長,并除以對齊部分的總音長減去已刪除暫停的音長。然后系統(tǒng)通過每個參考序列、通過判別塊264進行迭代。最后,在步驟266,新計分然后被用于對參考串排序,并且最高計分作為給定查詢的最佳匹配被報告。系統(tǒng)實施例圖8a和8b以用于標識音樂項目并將其傳遞給用戶的系統(tǒng)300的形式描繪了在此要求的本發(fā)明的特定實施例。為清楚起見,針對各個環(huán)境配置系統(tǒng)300,以便整個系統(tǒng)可以共同使用或以獨立的方式使用每個子系統(tǒng)。音樂傳遞系統(tǒng)300最好被看作兩個共同協(xié)作的系統(tǒng)、數(shù)據(jù)庫輸入系統(tǒng)310和檢索系統(tǒng)360。首先考慮如圖8a所示的輸入系統(tǒng),取決于裝置細節(jié),用戶可以直接或通過網(wǎng)絡(luò)訪問該系統(tǒng)。如上所述,如果該系統(tǒng)被配置為網(wǎng)站的一部分,則用戶302可以通過網(wǎng)絡(luò)304進行訪問,在該示例中網(wǎng)絡(luò)可以是因特網(wǎng)。其他系統(tǒng)可以被配置為在一個封閉的網(wǎng)絡(luò)上運行,例如,作為旅游船上娛樂系統(tǒng)的一部分。其他用戶306可以通過直接連接到系統(tǒng)的終端或計算機來直接訪問系統(tǒng)。那種訪問類型可以在例如零售機構(gòu)或商場的音樂臺中看到,其中用戶可以通過系統(tǒng)310輸入標簽,然后使用系統(tǒng)360檢索音樂。本領(lǐng)域技術(shù)人員可以理解此處所述的訪問方法和系統(tǒng)實質(zhì)上是示例性的。.隨著時光流逝,其他訪問設(shè)備將變得可用,這樣的設(shè)備在此可以完全結(jié)合于此。無論是這樣還是那樣,用戶與前端310進行交互,該前端可以是圖形化用戶接口(GUI)。關(guān)于訪問設(shè)備,本領(lǐng)域技術(shù)人員能夠設(shè)計出最有效的接口設(shè)備以適應(yīng)給定的安裝或應(yīng)用。只要設(shè)備執(zhí)行此處所述的功能,它就落入本發(fā)明的范圍內(nèi)。在輸入階段,用戶與音樂捕捉模塊314或音樂排序模塊320進行交互。兩個系統(tǒng)的操作細節(jié)如上所述。注意,音樂捕捉模塊不但捕捉以音頻文件形式存在的音樂標簽,還捕捉使用表格316的、關(guān)于音樂和用戶的元數(shù)據(jù)。如果選中音樂捕捉模塊,則音頻文件被發(fā)送到處理引擎318,該處理引擎以上述方式處理音頻數(shù)據(jù)。結(jié)果數(shù)據(jù)記錄被發(fā)送到音樂數(shù)據(jù)庫400進行存儲。應(yīng)該注意的是,在實施例中,共同使用子系統(tǒng)310和360,音樂數(shù)據(jù)庫400是單獨的組件,由系統(tǒng)共享。如果用戶選中音樂排序模塊320,則并不涉及處理引擎,該模塊直接與數(shù)據(jù)記錄交互。在此,如上所述,不改變音樂標簽。web特征330包括如上所述的設(shè)計用來促進用戶的相互作用及興趣的特征。旨在改善系統(tǒng)操作的特征——例如致力于激勵或鈴聲轉(zhuǎn)換的網(wǎng)頁——與例如致力于創(chuàng)建基于音樂的社會網(wǎng)絡(luò)的頁面組合在一起。以虛線的形式展示這樣的特征,以指示他們完全任由系統(tǒng)操作員處理。例如,零售機構(gòu)中的系統(tǒng)實現(xiàn),很可能不包括這些特征,而網(wǎng)站可能會將這樣的特征推到用戶的面前。在保持對本發(fā)明的技術(shù)特征的必要關(guān)注的同時,本領(lǐng)域技術(shù)人員能夠發(fā)揮這樣特征的最大優(yōu)點。圖8b說明了檢索系統(tǒng)360。這個系統(tǒng)結(jié)合了上述的數(shù)據(jù)檢索任務(wù),并將那些任務(wù)擴展成添加將期望音樂項目交付給用戶的所需步驟。如上所述,用戶352能通過例如因特網(wǎng)的網(wǎng)絡(luò)進行處理,或者,他們能通過諸如356的設(shè)備作出直接訪問。后者能夠很容易被實現(xiàn)為音樂商店中能夠監(jiān)督音樂的選擇和銷售的終端或音樂臺。前端362管理用戶與系統(tǒng)的交互。這個系統(tǒng)可以與圖8a中的前端310相組合或與其共享功能。類似地,査詢捕捉模塊364可與圖8a中的捕捉模塊314相一致。在此,因為沒有候補功能去追隨,所以用戶直接從前端轉(zhuǎn)到那個模塊。如上所述,用戶提供査詢標簽,在適當?shù)呐渲弥性摌撕灡惶峁┙o處理引擎(該處理引擎又可以是與處理引擎318相同或同樣的模塊)。結(jié)果數(shù)據(jù)文件被饋送到匹配引擎368,該匹配引擎使用如DTM系統(tǒng)或等效方法的匹配算法來從包含于音樂數(shù)據(jù)庫400的音樂標簽中檢索最佳匹配。匹配引擎使用項目元數(shù)據(jù)(圖5中的數(shù)據(jù)167)來標識應(yīng)用標簽的音樂項目,并將那些信息轉(zhuǎn)發(fā)到前端362。如果用戶期望如此,則前端從音樂項目存儲器410中檢索音樂項目本身并將其直接提供給用戶。在位于零售機構(gòu)中的實施例中,音樂存儲數(shù)據(jù)庫可以提供商店中實際音樂項目的詳細目錄及位置信息,或任選地,能提供特別定購音樂項目的能力。其他實施例在系統(tǒng)中不使用音樂項目存儲數(shù)據(jù)庫,但是可以訪問由第三方賣家提供的系統(tǒng)。這樣,小型機構(gòu)可以提供廣泛的音樂可用性而不必付出組裝全面的音樂庫的代價。其他實施例本領(lǐng)域技術(shù)人員可以理解,此處公開及要求的序列匹配方法可以用于多種環(huán)境。特殊需求的實施例可以在遺傳序列系統(tǒng)中使用該方法,其中要被匹配的序列是基于DNA鏈而不是音樂中的音符。另一個所需的實施例可以在語音識別中使用該方法。本發(fā)明可以被實現(xiàn)為方法或適于實現(xiàn)該方法的設(shè)備。本發(fā)明可以是一種產(chǎn)品,例如銘刻有用以執(zhí)行基于非文本的信息的計算機輔助檢索的邏輯的介質(zhì)。雖然參考上述的優(yōu)選實施例和示例公開了本發(fā)明,但可以理解的是這些例子意在作為示例性而非限制性??梢韵氲降氖牵绢I(lǐng)域技術(shù)人員很容易作出修改及組合,這種修改和組合將落在本發(fā)明的精神及所附權(quán)利要求的范圍內(nèi)。權(quán)利要求1.一種用于所選音樂項目的基于非文本的標識的方法,包括以下步驟建立音樂標識數(shù)據(jù)庫,包括以下步驟捕捉所選音樂項目的標簽;處理所述標簽以產(chǎn)生關(guān)于其的參考關(guān)鍵字;連同所述參考關(guān)鍵字以及關(guān)于所述音樂項目的關(guān)聯(lián)一起存儲所述標簽;收集多個標簽;從所述數(shù)據(jù)庫中檢索所期望的音樂項目,包括以下步驟捕捉查詢標簽;處理所述查詢標簽以產(chǎn)生關(guān)于其的查詢關(guān)鍵字;以及比較所述查詢關(guān)鍵字和存儲于所述數(shù)據(jù)庫中的參考關(guān)鍵字,以標識所期望的音樂項目。2.如權(quán)利要求l所述的方法,其特征在于,關(guān)于所述音樂項目的所述關(guān)聯(lián)包括與所述音樂項目有關(guān)的信息。3.如權(quán)利要求l所述的方法,其特征在于,關(guān)于所述音樂項目的所述關(guān)聯(lián)至少包括所選音樂項目的標題和藝術(shù)家。4.如權(quán)利要求l所述的方法,其特征在于,所述處理步驟各自包括以下步驟將所述標簽拆分為幀;處理每個幀,包括以下步驟檢測所述幀的音高升降曲線;標識暫停;標記音符邊界;對每個音符確定音高值;量化每個音符的所述音高值;以及將經(jīng)處理的幀組裝成標識所述標簽的關(guān)鍵字。5.—種用于組裝音樂標簽類集的方法,包括以下步驟建立可為多個用戶所訪問的基于計算機的位置;提供用于收集音樂標簽的計算機程序方法;收集音樂標簽,包括以下步驟捕捉所選音樂項目的標簽;處理所述標簽以產(chǎn)生關(guān)于其的關(guān)鍵字;連同所述關(guān)鍵字及關(guān)于所述音樂項目的關(guān)聯(lián)一起存儲所述標簽;以及為貢獻標簽的用戶提供激勵;捕捉由其他用戶提供的旋律的用戶排序;以及促進用戶之間的互動。6.如權(quán)利要求5所述的方法,其特征在于,所述基于計算機的位置是網(wǎng)站。7.如權(quán)利要求5所述的方法,其特征在于,提供所述激勵包括貨幣激勵。8.如權(quán)利要求7所述的方法,其特征在于,所述貨幣激勵是基于對所貢獻的標簽的有效性的度量。9.如權(quán)利要求5所述的方法,其特征在于,提供所述激勵包括基于他們的標簽提交來宣傳用戶。10.如權(quán)利要求9所述的方法,其特征在于,所述宣傳激勵是基于對所貢獻的標簽的有效性的度量。11.如權(quán)利要求5所述的方法,其特征在于,還包括以下步驟處理所選標簽以生成移動電話鈴聲;以及將結(jié)果鈴聲提供給用戶。12.—種用于建立音樂標識數(shù)據(jù)庫的方法,包括以下步驟捕捉音樂標簽;處理所述標簽以產(chǎn)生關(guān)于其的參考關(guān)鍵字;連同所述參考關(guān)鍵字及關(guān)于所述音樂項目的關(guān)聯(lián)一起存儲該標簽;收集多個標簽。13.如權(quán)利要求12所述的方法,其特征在于,所述處理步驟包括以下步驟將所述標簽拆分為幀;處理每個幀,包括以下步驟檢測所述幀的音高升降曲線;標識暫停;標記音符邊界;對每個音符確定音高值;量化每個音符的所述音高值;以及將經(jīng)處理的幀組裝成標識所述標簽的關(guān)鍵字。14.一種用于提供音樂項目的方法,包括以下步驟提供包括音樂標簽及關(guān)于其的參考關(guān)鍵字的第一數(shù)據(jù)庫;從用戶處捕捉查詢標簽;處理所述標簽以產(chǎn)生其查詢關(guān)鍵字;將所述查詢關(guān)鍵字與所述數(shù)據(jù)庫音樂參考關(guān)鍵字相匹配,以確定最佳匹配所述查詢標簽的所述音樂標簽;檢索與所述最佳匹配標簽相關(guān)聯(lián)的所述音樂項目。15.如權(quán)利要求14所述的方法,其特征在于,所述處理步驟包括以下步驟將所述標簽拆分為幀;處理每個幀,包括以下步驟檢測所述幀的音高升降曲線;標識暫停;標記音符邊界;對每個音符確定音高值;量化每個音符的所述音高值;以及將經(jīng)處理的幀組裝成標識所述標簽的關(guān)鍵字。16.—種用于向用戶提供音樂項目的系統(tǒng),包括計算機系統(tǒng),包括CPU、外圍設(shè)備和輸入/輸出設(shè)備,所述計算機系統(tǒng)可操作地連接到網(wǎng)絡(luò)以與遠程用戶通信;用于捕捉由用戶輸入的音樂標簽的裝置,所述標簽被標識為參考標簽或查詢標簽;用于處理所述標簽以產(chǎn)生關(guān)于其的標識關(guān)鍵字的裝置;用于連同標識關(guān)鍵字及關(guān)于各個音樂項目的關(guān)聯(lián)一起存儲參考標簽的數(shù)據(jù)庫裝置;用于將查詢標簽與所存儲的參考標簽作比較以標識所期望的音樂項目的匹配算法裝置。17.如權(quán)利要求16所述的系統(tǒng),其特征在于,所述處理裝置包括以下裝置將所述標簽拆分為幀;處理每個幀,包括以下步驟檢測所述幀的音高升降曲線;標識暫停;標記音符邊界;對每個音符確定音高值;量化每個音符的所述音高值;以及將經(jīng)處理的幀組裝成標識所述標簽的關(guān)鍵字。18.如權(quán)利要求16所述的系統(tǒng),其特征在于,所述匹配算法裝置將標識關(guān)鍵字與所述査詢標簽和所述參考標簽作比較。19.一種用于對j個多維數(shù)據(jù)項的查詢序列與i個多維數(shù)據(jù)項的參考序列的對齊進行計分的方法,包括以下步驟-構(gòu)建ixj矩陣;使用記分函數(shù)為查詢序列成員(j)與每個參考成員(i)之間的每個轉(zhuǎn)換指派一計分,其中所述計分函數(shù)是<formula>formulaseeoriginaldocumentpage5</formula>其中<formula>formulaseeoriginaldocumentpage5</formula>并且其中DV和DH是刪除成本因子,而T是轉(zhuǎn)換函數(shù);捕捉矩陣單元(i,j)中的每個計分Sij;以及標識跨越所述矩陣的最優(yōu)遍歷路徑,包括以下步驟選擇所述矩陣底端行中的最高單元計分;以及向后跨越所述矩陣跟蹤通向那個單元的轉(zhuǎn)換。20.—種用于將多維數(shù)據(jù)項目的查詢序列與多維數(shù)據(jù)項目的參考序列相匹配的方法,包括以下步驟將所述查詢序列與所選參考序列對齊,包括以下步驟構(gòu)建ixj矩陣;使用計分函數(shù)為査詢序列成員(j)與每個參考成員(i)之間的每個轉(zhuǎn)換指派一計分,其中所述計分函數(shù)是S(i,j)=max(SDV,SDH,Sm,0)其中SDV=S(i-l,j)-DVSDH=S(i,j-l)-DVSm=S(i-l,j-l)+T;并且其中DV和DH是刪除成本因子,而T是轉(zhuǎn)換函數(shù);捕捉矩陣單元(i,j)中的每個計分Sij;以及標識跨越所述矩陣的最優(yōu)遍歷路徑,包括以下步驟選擇所述矩陣底端行中的最高單元計分;以及向后跨越所述矩陣跟蹤通向那個單元的轉(zhuǎn)換。21.如權(quán)利要求20所述的方法,其特征在于,還包括以下步驟通過基于歷史因子的重新計算來測試所述最優(yōu)路徑;計算所述矩陣的最大可能計分;將所述矩陣計分歸一化為通過所述重新計算的最優(yōu)遍歷路徑達到的所述最大可能計分的百分比;以及重復(fù)對每個參考序列的對齊;通過選擇所述最高單元計分來確定最佳匹配。22.如權(quán)利要求21所述的方法,其特征在于,所述計分函數(shù)是S(i,j)=max(SDv,SDH,Sm,SHc,Svc,0)其中<formula>formulaseeoriginaldocumentpage7</formula><formula>formulaseeoriginaldocumentpage7</formula>SH(^max(水平—合并—計分(h)),h=l,2,3,…,HmaxSv^max(垂直—合并—得分(v)),v=l,2,3,…Vmax并且其中DV和DH是刪除成本因子,而T是轉(zhuǎn)換函數(shù)。23.如權(quán)利要求22所述的方法,其特征在于,所述轉(zhuǎn)換函數(shù)是<formula>formulaseeoriginaldocumentpage7</formula>其中ST(k)是在所述單元(i,j)與通向所述單元(i,j)的路徑上的最近匹配單元之間的維度k中的轉(zhuǎn)換的所述計分,所述單元(i,j)在維度k中不為空值,而w(k)是此轉(zhuǎn)換的所期望權(quán)重。24.—種用于將源自音樂查詢標簽的多維數(shù)據(jù)項目的査詢序列與源自音樂參考標簽的多維數(shù)據(jù)項目的參考序列相匹配的方法,包括以下步驟將所述査詢標簽與所選參考序列對齊,包括以下步驟構(gòu)建ixj矩陣;使用計分函數(shù)為査詢序列成員(j)與每個參考成員(i)之間的每個轉(zhuǎn)換指派一計分,其中所述計分函數(shù)是<formula>formulaseeoriginaldocumentpage7</formula>其中<formula>formulaseeoriginaldocumentpage7</formula>Sm=S(i-l,j-l)+T;并且其中DV和DH是刪除成本因子,而T是轉(zhuǎn)換函數(shù);捕捉矩陣單元(i,j)中的每個計分s^以及標識跨越所述矩陣的最優(yōu)遍歷路徑,包括以下步驟選擇所述矩陣底端行中的最高單元計分;并向后跨越所述矩陣跟蹤通向那個單元的轉(zhuǎn)換。25.如權(quán)利要求24所述的方法,其特征在于,還包括步驟通過基于歷史因子的重新計算來測試所述最優(yōu)路徑;計算所述矩陣的最大可能計分;將所述矩陣計分歸一化為通過所述重新計算的最優(yōu)遍歷路徑達到的所述最大可能計分的百分比;以及重復(fù)對每個參考序列的對齊;通過選擇最高單元計分來確定最佳匹配。26.如權(quán)利要求24所述的方法,其特征在于,所述計分函數(shù)是S(i,j)=max(SDV,SDH,Sm,SHC,SVc,0)其中<formula>formulaseeoriginaldocumentpage8</formula>SHc二max(水平—合并—計分(h》,h=l,2,3,…,HmaxSv^max(垂直—合并—計分(v)),v=l,2,3,…Vmax并且其中DV和DH是刪除成本因子,而T是轉(zhuǎn)換函數(shù)。27.如權(quán)利要求24所述的方法,其特征在于,所述轉(zhuǎn)換函數(shù)是T=w(1)*ST(1)+w(2)*ST(2)+..其中ST(k)是維度k中的轉(zhuǎn)換的所述計分,w(k)是此轉(zhuǎn)換的所期望權(quán)重。28.如權(quán)利要求24所述的方法,其特征在于,所述多維數(shù)據(jù)項目至少包括與音高和音長相關(guān)聯(lián)的維度。29.如權(quán)利要求28所述的方法,其特征在于,涉及音樂標簽中的暫停的、與音高相關(guān)聯(lián)的數(shù)據(jù)項目具有未定義值,并且計分函數(shù)不使用那個值計算計分但是使用前一匹配值,出于此目的所述值被向前傳遞。30.—種用于從包括音樂項目和與此類文件相關(guān)聯(lián)的關(guān)鍵字文件的數(shù)據(jù)庫中檢索音樂項目的方法,所述關(guān)鍵字文件包括此類音樂的標識值的序列,至少包括所選格式的音符的音高和音長信息,所述方法包括以下步驟從用戶處捕捉音頻查詢;處理所述音頻査詢以所選格式生成與所述音頻輸入查詢相關(guān)聯(lián)的査詢關(guān)鍵字;將所述查詢關(guān)鍵字與參考關(guān)鍵字匹配,包括以下步驟在所述査詢文件和每個參考文件上執(zhí)行迭代的串對齊操作,以標識關(guān)于所述查詢文件的最佳匹配;以及檢索與所述匹配參考文件相關(guān)聯(lián)的所述音樂項目。31.如權(quán)利要求30所述的方法,其特征在于,所述迭代的串對齊包括以下步驟將所述查詢序列與所選參考序列對齊,包括以下步驟構(gòu)建ixj矩陣;使用計分函數(shù)為查詢序列成員(j)與每個參考成員(i)之間的每個轉(zhuǎn)換指派一計分,其中所述計分函數(shù)是S(i,j)=max(SDV,SDH,Sm,0)其中SDV=S(i-l,j)國DVSDH=S(i,j-l)國DHSm=S(i-l,j陽l)+T;并且其中DV和DH是刪除成本因子,而T是轉(zhuǎn)換函數(shù);捕捉矩陣單元(i,j)中的每個計分Sij;以及標識跨越所述矩陣的最優(yōu)遍歷路徑,包括以下步驟選擇所述矩陣底端行中的最高單元計分;并向后跨越所述矩陣跟蹤通向那個單元的轉(zhuǎn)換。32.如權(quán)利要求31所述的方法,其特征在于,還包括以下步驟通過基于歷史因子的重新計算來測試所述最優(yōu)路徑;計算所述矩陣的最大可能計分;將所述矩陣計分歸一化為通過所述重新計算的最優(yōu)遍歷路徑達到的最大可能計分的百分比;以及重復(fù)對每個參考序列的對齊;通過選擇最高單元計分來確定最佳匹配。33.如權(quán)利要求31所述的方法,其特征在于,所述計分函數(shù)是S(i,j)=max(SDv,SDH,Sm,SHC,Svc,0)其中SDV=S(i-l,j)-DVSDH=S(i,j-l)-DHSm=S(i-l,j-l)+T;SjK^max(水平—合并—計分(h)),h=l,2,3,…,HmaxSyc-max(垂直—合并—計分(v)),v=l,2,3,…Vmax并且其中DV和DH是刪除成本因子,而T是轉(zhuǎn)換函數(shù)。34.如權(quán)利要求31所述的方法,其特征在于,所述轉(zhuǎn)換函數(shù)是T=w(1)*ST(1)+w(2)*ST(2)十..其中ST(k)是維度k中的轉(zhuǎn)換的所述計分,w(k)是此轉(zhuǎn)換的所期望的權(quán)重。35.如權(quán)利要求30所述的方法,其特征在于,所述多維數(shù)據(jù)項目至少包括與音高和音長相關(guān)聯(lián)的維度。36.如權(quán)利要求35所述的方法,其特征在于,涉及音樂標簽中的暫停的、與音高相關(guān)聯(lián)的數(shù)據(jù)項目具有未定義值,并且計分函數(shù)不使用那個值計算得分但是使用前一匹配值,出于此目的所述值被向前傳遞。37.—種表示音樂項目的數(shù)據(jù)結(jié)構(gòu),包括音樂數(shù)據(jù)部分,包括標簽部分,其中所述標簽部分是以音樂文件存儲格式編碼的、所述音樂項目的錄音;關(guān)鍵字部分,包括從所述標簽部分導(dǎo)出標識數(shù)據(jù);元數(shù)據(jù)部分,包括與所述音樂項目有關(guān)的數(shù)據(jù)項目。全文摘要一種基于非文本標識所存儲音樂的所選項目的方法。該方法的第一主要部分集中于建立音樂標識數(shù)據(jù)庫。該過程需要捕捉所選音樂項目的標簽,并處理該標簽以產(chǎn)生關(guān)于其的參考關(guān)鍵字。然后標簽與參考關(guān)鍵字及關(guān)于所存儲音樂的關(guān)聯(lián)一起被存儲。通過收集多個標簽來建立數(shù)據(jù)庫。該方法的第二主要部分是從數(shù)據(jù)庫中檢索所存儲音樂的所期望的項目。該過程需要從用戶處捕捉查詢標簽,并處理該查詢標簽以產(chǎn)生關(guān)于其的查詢關(guān)鍵字。將查詢標簽與存儲于數(shù)據(jù)庫中的參考關(guān)鍵字作比較,以標識所存儲音樂的所期望的項目。文檔編號G06F7/00GK101351767SQ200680050230公開日2009年1月21日申請日期2006年11月9日優(yōu)先權(quán)日2005年11月10日發(fā)明者J·M·霍姆,K·莫哈杰,M·加伯斯基,M·艾瑪米申請人:麥樂迪斯公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
阿鲁科尔沁旗| 晋城| 北宁市| 夏河县| 天全县| 多伦县| 东平县| 兰考县| 邵阳县| 元阳县| 金乡县| 治县。| 苏尼特左旗| 新竹市| 济南市| 育儿| 黔西县| 湖口县| 揭西县| 柳江县| 兴山县| 北海市| 西乌珠穆沁旗| 赤城县| 芮城县| 饶阳县| 贵港市| 石林| 客服| 明溪县| 杭锦后旗| 临武县| 长岛县| 蒲江县| 玛曲县| 修文县| 江永县| 乌什县| 文登市| 城固县| 杨浦区|