專利名稱:音頻內(nèi)容的搜索裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻內(nèi)容的搜索裝置。
背景技術(shù):
隨著互聯(lián)網(wǎng)的發(fā)展,搜索引擎成為人們上網(wǎng)必不可少的工具之一。傳統(tǒng)的搜索引擎都是基于文本搜索(Text Search),稱為是文本搜索引擎。其原理是搜索引擎服務(wù)器收集大量的網(wǎng)頁(yè);并根據(jù)已有的規(guī)則提取網(wǎng)頁(yè)中的文本并做分詞(Word Segmentation)處理,常見的分詞方法,例如基于字符串匹配的分詞方法、基于理解的分詞方法和基于統(tǒng)計(jì)的分詞方法;文本搜索引擎利用文本詞庫(kù)做索引表用于快速搜索。用戶在進(jìn)行搜索的時(shí)候,將文本輸入到服務(wù)器,服務(wù)器對(duì)該文本進(jìn)行分詞處理后,根據(jù)索引表進(jìn)行快速的搜索,然后返回結(jié)果。
目前,搜索引擎都是基于文本的,即使是一些搜索圖片或音頻的搜索引擎也是通過(guò)圖片或音頻節(jié)目的名稱、說(shuō)明、介紹、標(biāo)簽等文本信息進(jìn)行搜索的。搜索引擎還沒有直接通過(guò)音頻的信號(hào)內(nèi)容進(jìn)行搜索的。
音頻指紋(audio fingerprinting)在很早以前就被提出來(lái),例如,Jaap Haitsma和TonKalke在2002年音樂搜索進(jìn)展國(guó)際會(huì)議(Proceedings of International Conference on MusicInformation Retrieval)上發(fā)表了 "一種高可靠性的音頻指紋系統(tǒng)"(A Highly Robust AudioFingerprinting System)。這種系統(tǒng)通過(guò)信號(hào)處理的方法,將音頻文件中每隔一段時(shí)間(例如11.6ms)的音頻信號(hào),轉(zhuǎn)化為一個(gè)32比特(bit)大小的指紋(fingerprint),通過(guò)這種方法一個(gè)音頻文件就可以被轉(zhuǎn)換成一個(gè)指紋文件。系統(tǒng)在對(duì)所有的音頻指紋文件做索引表后,就可以進(jìn)行快速的音頻指紋檢索了。
在音頻指紋文件數(shù)目較少(例如l萬(wàn)個(gè))的情況下,可以將所有的指紋文件存入到計(jì)算機(jī)內(nèi)存中,進(jìn)行索引后,可方便地進(jìn)行快速的檢索。上述"一種高可靠性的音頻指紋系統(tǒng)"即給出了這種方法的詳細(xì)步驟。然而,在實(shí)際情況下,音頻文件的數(shù)目要遠(yuǎn)遠(yuǎn)超過(guò)一萬(wàn)的數(shù)目。例如,目前在互聯(lián)網(wǎng)上出現(xiàn)的音頻文件數(shù)目超過(guò)一千萬(wàn)數(shù)目,而且數(shù)量在不斷增長(zhǎng)。因此采用這種方法很難做出實(shí)用的搜索引擎。
發(fā)明內(nèi)容
3為了解決上述技術(shù)問(wèn)題,本發(fā)明提供一種音頻內(nèi)容的搜索裝置,這種搜索引擎稱為是音頻指紋搜索弓l擎(audio fingerprint search engine)。本發(fā)明采用如下技術(shù)方案-一種音頻內(nèi)容的搜索裝置,包括
音頻指紋提取模塊,用于提取多個(gè)音頻文件的音頻指紋;
音頻指紋分詞模塊,與所述音頻指紋提取模塊相連接,用于對(duì)提取的音頻指紋進(jìn)行分詞;索引生成模塊,與所述音頻指紋分詞模塊相連接,用于根據(jù)分詞結(jié)果生成音頻指紋索引;搜索模塊,與所述索引生成模塊相連接,用于提供利用該音頻指紋索引搜索匹配的音頻文件。
進(jìn)一步地,還包括連接于所述索引生成模塊與所述搜索模塊之間的存儲(chǔ)模塊,用于存儲(chǔ)音頻指紋、所述音頻指紋索引及其對(duì)應(yīng)的音頻文件。
本發(fā)明通過(guò)采用文本搜索引擎中的分詞技術(shù),在音頻指紋文件上進(jìn)行分詞處理,然后采用文本搜索領(lǐng)域中的索引技術(shù)對(duì)音頻指紋進(jìn)行索引處理,索引處理完成后,搜索引擎可以對(duì)用戶輸入的音頻片段進(jìn)行搜索。不但方便了用戶的搜索,而且提高了搜索的效率。
以下結(jié)合附圖及實(shí)施例進(jìn)一步說(shuō)明本發(fā)明。
圖1為本發(fā)明音頻指紋搜索裝置實(shí)施例結(jié)構(gòu)示意圖。
具體實(shí)施例方式
如圖1所示, 一種音頻內(nèi)容的搜索裝置,包括音頻指紋提取模塊,用于提取多個(gè)音頻文件的音頻指紋;
音頻指紋分詞模塊,與所述音頻指紋提取模塊相連接,用于對(duì)提取的音頻指紋進(jìn)行分詞;索引生成模塊,與所述音頻指紋分詞模塊相連接,用于根據(jù)分詞結(jié)果生成音頻指紋索引;搜索模塊,與所述索引生成模塊相連接,用于提供利用該音頻指紋索引搜索匹配的音頻文件。
其中,還包括連接于所述索引生成模塊與所述搜索模塊之間的存儲(chǔ)模塊,用于存儲(chǔ)音頻指紋、所述音頻指紋索引及其對(duì)應(yīng)的音頻文件。
搜索可采用根據(jù)輸入的需要檢索的音頻文件或音頻文件片段,通過(guò)所述音頻指紋提取模塊提取其音頻指紋,并通過(guò)音頻指紋分詞模塊對(duì)該音頻指紋進(jìn)行分詞,根據(jù)分詞結(jié)果在該音
4頻指紋索引中搜索匹配的音頻文件;也可以直接根據(jù)用戶輸入音頻指紋,利用音頻指紋分詞模塊對(duì)該音頻指紋進(jìn)行分詞后,根據(jù)分詞結(jié)果在該音頻指紋索引中搜索匹配的音頻文件。
上述實(shí)施例中的分詞方式可采用多種方式實(shí)現(xiàn),以下列舉幾種方式分別說(shuō)明。
方式一
采用基于統(tǒng)計(jì)的中文分詞方法對(duì)音頻指紋進(jìn)行分詞處理。首先將15000個(gè)音頻文件按上述Jaap Haitsma和Ton Kalke的方法生成寬度固定的指紋文件,其寬度可以是32比特或16比特,得到的每個(gè)指紋文件平均由約10000個(gè)寬度固定的指紋組成。每個(gè)32比特或16比特的數(shù)據(jù)被看作是中文中的一個(gè)字。所有15000個(gè)包含"字"的指紋文件被當(dāng)作是15000篇"文章",而這些"文章"則作為中文分詞的語(yǔ)料進(jìn)行分詞。在統(tǒng)計(jì)過(guò)程中,對(duì)音頻語(yǔ)料中相鄰共現(xiàn)的每個(gè)"字"的組合的頻度進(jìn)行統(tǒng)計(jì)。共現(xiàn)頻度高的組合被認(rèn)為是一個(gè)詞,稱為"指紋詞"。例如,頻度較高的7個(gè)連續(xù)的二進(jìn)制"00000000000000000000000000000000"的指紋的組合,和5個(gè)連續(xù)的二進(jìn)制"11111111111111111111111111111111"的指紋的組合被統(tǒng)計(jì)是頻度較高的指紋組合,他們被作為"指紋詞"。
方式二
采用指紋寬度為16比特的音頻指紋提取方法。具體是將方式一中寬度為32比特的指紋進(jìn)行間隔采樣得到16比特的指紋。然后采用與方式一相同的基于統(tǒng)計(jì)的中文分詞方法進(jìn)行音頻指紋的分詞處理。
權(quán)利要求
1、一種音頻內(nèi)容的搜索裝置,其特征在于包括音頻指紋提取模塊,用于提取多個(gè)音頻文件的音頻指紋;音頻指紋分詞模塊,與所述音頻指紋提取模塊相連接,用于對(duì)提取的音頻指紋進(jìn)行分詞;索引生成模塊,與所述音頻指紋分詞模塊相連接,用于根據(jù)分詞結(jié)果生成音頻指紋索引;搜索模塊,與所述索引生成模塊相連接,用于提供利用該音頻指紋索引搜索匹配的音頻文件。
2、 根據(jù)權(quán)利要求l所述的音頻內(nèi)容的搜索裝置,其特征在于還包括連接于所述索引生成模塊與所述搜索模塊之間的存儲(chǔ)模塊,用于存儲(chǔ)音頻指紋、所述音頻指紋索引及其對(duì)應(yīng)的音頻文件。
全文摘要
一種音頻內(nèi)容的搜索裝置,包括音頻指紋提取模塊,用于提取多個(gè)音頻文件的音頻指紋;音頻指紋分詞模塊,與所述音頻指紋提取模塊相連接,用于對(duì)提取的音頻指紋進(jìn)行分詞;索引生成模塊,與所述音頻指紋分詞模塊相連接,用于根據(jù)分詞結(jié)果生成音頻指紋索引;搜索模塊,與所述索引生成模塊相連接,用于提供利用該音頻指紋索引搜索匹配的音頻文件。本發(fā)明通過(guò)采用文本搜索引擎中的分詞技術(shù),在音頻指紋文件上進(jìn)行分詞處理,然后采用文本搜索領(lǐng)域中的索引技術(shù)對(duì)音頻指紋進(jìn)行索引處理,索引處理完成后,搜索引擎可以對(duì)用戶輸入的音頻片段進(jìn)行搜索。不但方便了用戶的搜索,而且提高了搜索的效率。
文檔編號(hào)G06F17/30GK101673264SQ20081004285
公開日2010年3月17日 申請(qǐng)日期2008年9月12日 優(yōu)先權(quán)日2008年9月12日
發(fā)明者程建章, 連惠城 申請(qǐng)人:未序網(wǎng)絡(luò)科技(上海)有限公司