專利名稱:音頻文件中語音信息的搜索方法、裝置及設備的制作方法
技術領域:
本發(fā)明涉及音頻搜索技術領域,尤其涉及一種音頻文件中語音信息的搜索方法、 裝置及設備。
背景技術:
在信息量成幾何級數(shù)增長的信息時代,搜索技術已成為人們工作和生活中必不可 少的關鍵技術之一,使得人們能夠快捷準確地從信息海洋中搜索到自己需要的信息,從而 極大地提高了工作和生活效率。隨著搜索技術日趨成熟,其應用越來越廣泛,人們對搜索技 術的要求也在不斷提升,對音頻搜索的需求日益增加?,F(xiàn)有的音頻搜索技術主要包括以下兩種方式方式一、預先由人工為音頻文件添加文字信息,即為音頻文件建立標簽,基于特定 關鍵字對音頻文件的標簽進行搜索。該方式無法滿足按照音頻文件的內(nèi)容對音頻文件進行 全文搜索的需求。同時,由于音頻文件的標簽無法涵蓋音頻文件的全部內(nèi)容,并且標簽由人 工建立,主觀因素較大,導致音頻搜索的準確度低,很難保證搜索結果的完整性,也無法準 確定位特定關鍵字在搜索結果中的具體位置;如果音頻資源庫中音頻文件的數(shù)量巨大,將 使得人工建立標簽的工作量巨大,導致大量人力資源的耗費。方式二、基于音頻匹配技術對音頻文件進行搜索,首先需要提取待搜索的音頻信 息的頻譜或者能量的特征值,然后提取音頻資源庫中各音頻文件的音頻信息的頻譜或者能 量的特征值,最后進行特征值的匹配。音頻匹配技術側重于音頻本身的特征值的匹配,該方 式同樣無法滿足按照音頻文件的內(nèi)容對音頻文件進行全文搜索的需求。同時,該方式對搜 索所輸入的音頻信息要求苛刻,不僅要求輸入的音頻信息的內(nèi)容與音頻資源庫中音頻文件 的內(nèi)容相一致,而且還要求音頻信息的頻率和能量與音頻資源庫中音頻文件的頻率和能量 相接近,才能成功匹配,導致音頻搜索的效率低,易用性差?,F(xiàn)有技術中提供的音頻搜索技術,沒有提供基于音頻文件的內(nèi)容進行全文搜索的 方案,并且音頻搜索的準確度低、效率低、易用性差。
發(fā)明內(nèi)容
本發(fā)明提供一種音頻文件中語音信息的搜索方法及裝置,用以實現(xiàn)對音頻文件的 內(nèi)容進行全文搜索,提高音頻搜索的準確度和效率,提升音頻搜索的易用性。相應的,本發(fā)明還提供一種終端設備和網(wǎng)站服務器。本發(fā)明提供了一種音頻文件中語音信息的搜索方法,包括對音頻資源庫中每一個包括語音信息的音頻文件進行語音識別,轉化為包括文字 信息的文本文件,并對各文本文件的文字信息進行分詞處理;根據(jù)每一個文本文件所包括的詞提取對應的音頻文件所包括的關鍵字,確定每一 個音頻文件與所包括的關鍵字的相關度,并結合每一個音頻文件的相關信息建立關鍵字的 索引數(shù)據(jù)庫,所述索引數(shù)據(jù)庫中存儲每一個關鍵字與每一個音頻文件的相關度、以及每一
4個音頻文件的相關信息;當接收到攜帶特定關鍵字的語音信息搜索請求時,在所述索引數(shù)據(jù)庫中進行所述 特定關鍵字的匹配,并根據(jù)與所述特定關鍵字具有相關度的音頻文件的相關信息提供相應 的音頻文件。本發(fā)明提供了一種音頻文件中語音信息的搜索裝置,包括語音識別模塊,用于對音頻資源庫中每一個包括語音信息的音頻文件進行語音識 別,轉化為包括文字信息的文本文件,并對各文本文件的文字信息進行分詞處理;索引建立模塊,用于根據(jù)每一個文本文件所包括的詞提取對應的音頻文件所包括 的關鍵字,確定每一個音頻文件與所包括的關鍵字的相關度,并結合每一個音頻文件的相 關信息建立關鍵字的索引數(shù)據(jù)庫;索引數(shù)據(jù)庫,用于存儲每一個關鍵字與每一個音頻文件的相關度、以及每一個音 頻文件的相關信息;搜索處理模塊,用于當接收到攜帶特定關鍵字的語音信息搜索請求時,在所述索 引數(shù)據(jù)庫中進行所述特定關鍵字的匹配,并根據(jù)與所述特定關鍵字具有相關度的音頻文件 的相關信息提供相應的音頻文件。本發(fā)明提供了一種終端設備,包括該音頻文件中語音信息的搜索裝置。本發(fā)明提供了一種網(wǎng)站服務器,包括該音頻文件中語音信息的搜索裝置。本發(fā)明提供的音頻文件中語音信息的搜索方法、裝置及設備,通過語音識別將包 括語音信息的音頻文件轉化為包括文字信息的文本文件,根據(jù)音頻文件對應的文本文件即 音頻文件的全部內(nèi)容,建立關鍵字的索引數(shù)據(jù)庫;在用戶輸入特定關鍵字發(fā)起語音信息的 搜索操作時,基于關鍵字的索引數(shù)據(jù)庫提供與該特定關鍵字具有相關度的音頻文件,從而 實現(xiàn)了對音頻文件的內(nèi)容進行全文搜索,彌補了現(xiàn)有音頻搜索技術的不足;由于關鍵字的 索引數(shù)據(jù)庫基于語音識別技術建立,且涵蓋了音頻文件的全部內(nèi)容,從而提高了音頻搜索 的準確度,基于關鍵字的搜索也提高了音頻搜索的效率;在用戶發(fā)起搜索時,只需輸入特定 關鍵字即可,提升了音頻搜索的易用性。
圖1為本發(fā)明實施例提供的音頻文件中語音信息的搜索裝置框圖;圖2為本發(fā)明實施例提供的音頻文件中語音信息的搜索方法流程圖;圖3為實施例一提供的音頻文件中語音信息的本地搜索方法流程圖;圖4為實施例二提供的音頻文件中語音信息的網(wǎng)絡搜索方法流程圖。
具體實施例方式本發(fā)明實施例旨在提供一種基于關鍵字對音頻文件的內(nèi)容進行全文搜索的方案, 能夠根據(jù)用戶輸入的特定關鍵字,對音頻資源庫中各音頻文件的內(nèi)容進行全文搜索,并向 用戶提供相應的音頻文件?;陉P鍵字對音頻文件的內(nèi)容進行全文搜索,能夠有效提高音 頻搜索的準確度和效率,提升音頻搜索的易用性。如圖1所示,本發(fā)明實施例首先提供了一種音頻文件中語音信息的搜索裝置,包 括
語音識別模塊101,用于對音頻資源庫中每一個包括語音信息的音頻文件進行語 音識別,轉化為包括文字信息的文本文件,并對各文本文件的文字信息進行分詞處理;詞是漢語中最小的、能獨立活動的、有意義的語言成分,詞可以包括一個漢字、兩 個漢字或者多個漢字?,F(xiàn)有技術中各種分詞算法可以實現(xiàn)對文字信息的分詞處理,分詞算 法主要包括三種類型基于字符串匹配的分詞算法、基于理解的分詞算法和基于統(tǒng)計的分 詞算法;索引建立模塊102,用于根據(jù)每一個文本文件所包括的詞提取對應的音頻文件所 包括的關鍵字,確定每一個音頻文件與所包括的關鍵字的相關度,并結合每一個音頻文件 的相關信息建立關鍵字的索引數(shù)據(jù)庫103 ;索引數(shù)據(jù)庫103,用于存儲每一個關鍵字與每一個音頻文件的相關度、以及每一個 音頻文件的相關信息;搜索處理模塊104,用于當接收到攜帶特定關鍵字的語音信息搜索請求時,在索引 數(shù)據(jù)庫103中進行該特定關鍵字的匹配,并根據(jù)與該特定關鍵字具有相關度的音頻文件的 相關信息提供相應的音頻文件。具體實施中,為了提升音頻搜索的精確度,在向用戶提供相應的音頻文件的同時, 還可以向用戶提供該特定關鍵字在相應的音頻文件中出現(xiàn)的具體位置,在該應用場景下, 索引建立模塊102在建立索引數(shù)據(jù)庫103時還結合每一個音頻文件所包括的關鍵字在該音 頻文件中出現(xiàn)的時間信息;相應的,索引數(shù)據(jù)庫103,還用于存儲每一個關鍵字在具有相關 度的音頻文件中出現(xiàn)的時間信息;搜索處理模塊104,還用于在提供與該特定關鍵字具有 相關度的音頻文件的同時,還提供該特定關鍵字在具有相關度的音頻文件中出現(xiàn)的時間信 息。為了準確確定每一個音頻文件所包括的關鍵字在該音頻文件中出現(xiàn)的時間信息,具體 實施中,語音識別模塊101,還用于對各文本文件的文字信息進行分詞處理之后,為各文本 文件所包括的詞添加其在對應的音頻文件中出現(xiàn)的時間信息,即為各文本文件所包括的詞 加上一個時間戳。具體實施中,音頻資源庫中可能存在不包括語音信息的音頻文件,例如僅包括音 樂旋律的音頻文件,在該應用場景下,該音頻文件中語音信息的搜索裝置還包括音頻解析模塊105,用于對音頻資源庫中每一個音頻文件進行語音解析,根據(jù)語音 解析結果提取出包括語音信息的音頻文件。過濾掉不包括語音信息的音頻文件之后,即可對音頻資源庫中每一個包括語音信 息的音頻文件進行語音識別。具體實施中,音頻資源庫中的音頻文件可能會發(fā)生變化,為了保證搜索結果的準 確度和完備性,該音頻文件中語音信息的搜索裝置還包括更新模塊106,用于定期或者在音頻資源庫中的音頻文件發(fā)生變化時,對索引數(shù)據(jù) 庫103進行更新;具體的,如果音頻資源庫中添加了新的音頻文件,則對該新的音頻文件進行語音 識別、分詞處理、關鍵字提取,確定該新的音頻文件與所包括的關鍵字的相關度,并結合該 新的音頻文件的相關信息在索引數(shù)據(jù)庫103中增加該新的音頻文件與所包括的關鍵字的 相關度、以及該新的音頻文件的相關信息;如果音頻資源庫中刪除了已有的音頻文件,則在 索引數(shù)據(jù)庫103中刪除與該已有的音頻文件相關的所有信息。
6
本發(fā)明實施例提供的音頻文件中語音信息的搜索裝置針對本地搜索和網(wǎng)絡搜索 均可適用。如果該音頻文件中語音信息的搜索裝置設置在終端側即用戶的終端設備中,可 以實現(xiàn)用戶對本地音頻資源庫中各音頻文件的內(nèi)容進行本地搜索。本地音頻資源庫是指 用戶的終端設備中的本地存儲器,例如本地硬盤、本地磁盤等。在本地音頻資源庫中,音 頻文件的相關信息包括音頻文件的文件名稱和本地存儲路徑,所述的本地存儲路徑例如 “E:\音樂”,表示存儲在本地E盤名稱為“音樂”的文件夾下。針對本地搜索,在提供與該特 定關鍵字具有相關度的音頻文件的同時,還提供與該特定關鍵字具有相關度的音頻文件的 文件名稱和本地存儲路徑。具體實施中,音頻文件的相關信息還可以包括音頻文件的大小、 類型、修改時間等其它相關信息,相應的,在提供與該特定關鍵字具有相關度的音頻文件的 同時,還可以提供與該特定關鍵字具有相關度的音頻文件的上述其它相關信息。如果該音頻文件中語音信息的搜索裝置設置在網(wǎng)絡側即提供音頻搜索業(yè)務的網(wǎng) 站的網(wǎng)站服務器中,通過網(wǎng)站服務器與安裝在終端側的瀏覽器之間的相互配合,可以實現(xiàn) 用戶對網(wǎng)絡音頻資源庫中各音頻文件的內(nèi)容進行網(wǎng)絡搜索。網(wǎng)絡音頻資源庫是指網(wǎng)站數(shù)據(jù) 庫,在網(wǎng)絡音頻資源庫中,音頻文件的相關信息包括音頻文件的文件名稱和URL(統(tǒng)一資源 定位符)。針對網(wǎng)絡搜索,所述的根據(jù)與該特定關鍵字具有相關度的音頻文件的相關信息提 供相應的音頻文件是指提供與該特定關鍵字具有相關度的音頻文件的超鏈接?;谕患夹g構思,本發(fā)明實施例同時提供了一種音頻文件中語音信息的搜索方 法,如圖2所示,包括S200、對音頻資源庫中每一個音頻文件進行語音解析,根據(jù)語音解析結果提取出 包括語音信息的音頻文件;具體實施中,如果音頻資源庫中每一個音頻文件均包括語音信息,則無需執(zhí)行該 步驟,直接從S201開始執(zhí)行。S201、對音頻資源庫中每一個包括語音信息的音頻文件進行語音識別,轉化為包 括文字信息的文本文件,并對各文本文件的文字信息進行分詞處理;具體實施中,對各文本文件的文字信息進行分詞處理之后,還可以為各文本文件 所包括的詞添加其在對應的音頻文件中出現(xiàn)的時間信息。S202、根據(jù)每一個文本文件所包括的詞提取對應的音頻文件所包括的關鍵字,確 定每一個音頻文件與所包括的關鍵字的相關度,并結合每一個音頻文件的相關信息建立關 鍵字的索引數(shù)據(jù)庫,相應的,關鍵字的索引數(shù)據(jù)庫中存儲每一個關鍵字與每一個音頻文件 的相關度、以及每一個音頻文件的相關信息;具體實施中,音頻文件與所包括的關鍵字的相關度基于相關度算法確定,音頻文 件與所包括的關鍵字的相關度與該關鍵字在音頻文件中出現(xiàn)的次數(shù)有關,出現(xiàn)次數(shù)越多, 相關度越高;具體實施中,為了提升音頻搜索的精確度,在建立關鍵字的索引數(shù)據(jù)庫時還結合 每一個音頻文件所包括的關鍵字在該音頻文件中出現(xiàn)的時間信息,相應的,關鍵字的索引 數(shù)據(jù)庫中還存儲每一個關鍵字在具有相關度的音頻文件中出現(xiàn)的時間信息。至此,已經(jīng)完成了音頻文件中語音信息的搜索準備階段,在搜索準備階段,需要對 音頻資源庫中每一個音頻文件進行處理,基于語音識別技術識別出語音信息并將語音信息 轉換為對應的文字信息;文字信息經(jīng)分詞處理和關鍵字提取以及確定出每一個音頻文件與所包括的關鍵字的相關度之后建立關鍵字的索引數(shù)據(jù)庫。關鍵字的索引數(shù)據(jù)庫建立完成之后,即可進入音頻文件中語音信息的搜索執(zhí)行階 段,搜索執(zhí)行階段由用戶發(fā)起,通過輸入特定關鍵字發(fā)起語音信息的搜索操作,則該方法還 包括如下步驟S203、當接收到攜帶特定關鍵字的語音信息搜索請求時,在關鍵字的索引數(shù)據(jù)庫 中進行該特定關鍵字的匹配,并根據(jù)與該特定關鍵字具有相關度的音頻文件的相關信息提 供相應的音頻文件;具體實施中,一般按照相關度由高到低對與該特定關鍵字具有相關度的音頻文件 進行排序,相關度越高排序越靠前;如果關鍵字的索引數(shù)據(jù)庫中還存儲每一個關鍵字在具有相關度的音頻文件中出 現(xiàn)的時間信息,為了便于用戶對搜索結果中的特定關鍵字進行準確定位,在提供與該特定 關鍵字具有相關度的音頻文件的同時,還提供特定關鍵字在具有相關度的音頻文件中出現(xiàn) 的時間信息,具體以時間軸的形式給出。具體實施中,還包括定期或者在音頻資源庫中的音頻文件發(fā)生變化時,對關鍵字 的索引數(shù)據(jù)庫進行更新的步驟。下面將分別以本地搜索和網(wǎng)絡搜索為例,詳細說明本發(fā)明實施例提供的音頻文件 中語音信息的搜索方案。實施例一本實施例提供音頻文件中語音信息的本地搜索方案,對應的音頻資源庫(可以稱 為本地音頻資源庫)設置在終端側,具體為用戶的終端設備中的本地存儲器,為了實現(xiàn)對 音頻文件中語音信息的本地搜索,需要在用戶的終端設備中設置本發(fā)明實施例提供的音頻 文件中語音信息的搜索裝置。音頻文件中語音信息的本地搜索流程,如圖3所示,包括本地 搜索準備階段和本地搜索執(zhí)行階段。本地搜索準備階段,包括如下步驟S301、終端設備從音頻資源庫中提取一個未處理的音頻文件,對當前的音頻文件 進行語音解析;S302、終端設備根據(jù)語音解析結果判斷當前的音頻文件是否包括語音信息,如果 是,則執(zhí)行S303、如果否,則轉向執(zhí)行S307 ;S303、終端設備對當前的音頻文件進行語音識別,轉化為包括文字信息的文本文 件;S304、終端設備對當前的文本文件的文字信息進行分詞處理,并為當前的文本文 件所包括的詞添加其在對應的音頻文件中出現(xiàn)的時間信息;S305、終端設備根據(jù)當前的文本文件所包括的詞提取對應的音頻文件所包括的關 鍵字,確定當前的音頻文件與所包括的關鍵字的相關度;S306、終端設備將當前的音頻文件與所包括的關鍵字的相關度、當前的音頻文件 的文件名稱和本地存儲路徑、以及當前的音頻文件所包括的關鍵字在該音頻文件中出現(xiàn)的 時間信息,存儲到關鍵字的索引數(shù)據(jù)庫中;S307、終端設備將當前的音頻文件設置為已處理;S308、終端設備判斷音頻資源庫中是否還存在未處理的音頻文件,如果是,則返回 執(zhí)行S301,如果否,則關鍵字的索引數(shù)據(jù)庫建立完成,即本地搜索準備階段完成,后續(xù)可以
8進入本地搜索執(zhí)行階段。如果用戶在本地搜索工具欄中輸入特定關鍵字,發(fā)起語音信息的本地搜索,則本 地搜索執(zhí)行階段,包括如下步驟S309、當接收到攜帶特定關鍵字的語音信息的本地搜索請求時,終端設備在關鍵 字的索引數(shù)據(jù)庫中進行該特定關鍵字的匹配;S310、終端設備根據(jù)與該特定關鍵字具有相關度的音頻文件的文件名稱和本地存 儲路徑,提供相應的音頻文件以及該特定關鍵字在具有相關度的音頻文件中出現(xiàn)的時間信 息,當然還可以一并提供該音頻文件的文件名稱和本地存儲路徑;相應的,音頻文件以及該特定關鍵字在具有相關度的音頻文件中出現(xiàn)的時間信 息、該音頻文件的文件名稱和本地存儲路徑,在終端設備上進行展現(xiàn)供用戶查看。需要指出的是,具體實施中由于本地音頻資源庫中的音頻文件會發(fā)生變化,例如 用戶在終端設備的本地存儲器中添加了新的音頻文件或者刪除了本地存儲器中已有的音 頻文件,因此需要定期或者在本地音頻資源庫中的音頻文件發(fā)生變化時,對關鍵字的索引 數(shù)據(jù)庫進行更新,以保證本地搜索結果的準確度和完備性。實施例二本實施例提供音頻文件中語音信息的網(wǎng)絡搜索方案。對應的音頻資源庫(可以稱 為本地音頻資源庫)設置在網(wǎng)絡側,具體為網(wǎng)站數(shù)據(jù)庫,為了實現(xiàn)對音頻文件中語音信息 的網(wǎng)絡搜索,需要在提供音頻搜索業(yè)務的網(wǎng)站的網(wǎng)站服務器中設置本發(fā)明實施例提供的音 頻文件中語音信息的搜索裝置。音頻文件中語音信息的網(wǎng)絡搜索流程,如圖4所示,包括網(wǎng) 絡搜索準備階段和網(wǎng)絡搜索執(zhí)行階段。網(wǎng)絡搜索準備階段,包括如下步驟S401、網(wǎng)站服務器從音頻資源庫中提取一個未處理的音頻文件,對當前的音頻文 件進行語音解析;S402、網(wǎng)站服務器根據(jù)語音解析結果判斷當前的音頻文件是否包括語音信息,如 果是,則執(zhí)行S403,如果否,則轉向執(zhí)行S407 ;S403、網(wǎng)站服務器對當前的音頻文件進行語音識別,轉化為包括文字信息的文本 文件;S404、網(wǎng)站服務器對當前的文本文件的文字信息進行分詞處理,并為當前的文本 文件所包括的詞添加其在對應的音頻文件中出現(xiàn)的時間信息;S405、網(wǎng)站服務器根據(jù)當前的文本文件所包括的詞提取對應的音頻文件所包括的 關鍵字,確定當前的音頻文件與所包括的關鍵字的相關度;S406、網(wǎng)站服務器將當前的音頻文件與所包括的關鍵字的相關度、當前的音頻文 件的文件名稱和URL、以及當前的音頻文件所包括的關鍵字在該音頻文件中出現(xiàn)的時間信 息,存儲到關鍵字的索引數(shù)據(jù)庫中S407、網(wǎng)站服務器將當前的音頻文件設置為已處理;S408、網(wǎng)站服務器判斷音頻資源庫中是否還存在未處理的音頻文件,如果是,則返 回執(zhí)行S401,如果否,則關鍵字的索引數(shù)據(jù)庫建立完成,即網(wǎng)絡搜索準備階段完成,后續(xù)可 以進入網(wǎng)絡搜索執(zhí)行階段。如果用戶在終端側的瀏覽器的網(wǎng)絡搜索工具欄中輸入特定關鍵字,發(fā)起語音信息 的網(wǎng)絡搜索,則網(wǎng)絡搜索執(zhí)行階段,包括如下步驟
S409、當接收到攜帶特定關鍵字的語音信息的網(wǎng)絡搜索請求時,網(wǎng)站服務器在關 鍵字的索引數(shù)據(jù)庫中進行該特定關鍵字的匹配;S410、網(wǎng)站服務器根據(jù)與該特定關鍵字具有相關度的音頻文件的文件名稱和URL, 提供相應的音頻文件的超鏈接以及該特定關鍵字在具有相關度的音頻文件中出現(xiàn)的時間 fn息;相應的,音頻文件的超鏈接以及該特定關鍵字在具有相關度的音頻文件中出現(xiàn)的 時間信息,通過傳輸網(wǎng)絡發(fā)送給終端側的瀏覽器,在終端設備上進行展現(xiàn)供用戶查看。需要指出的是,具體實施中由于網(wǎng)絡音頻資源庫中的音頻文件會發(fā)生變化,例如 網(wǎng)站數(shù)據(jù)庫中添加了新的音頻文件或者刪除了已有的音頻文件,因此需要定期或者在網(wǎng)絡 音頻資源庫中的音頻文件發(fā)生變化時,對關鍵字的索引數(shù)據(jù)庫進行更新,以保證網(wǎng)絡搜索 結果的準確度和完備性。本發(fā)明提供的音頻文件中語音信息的搜索方法、裝置及設備,通過語音識別將包 括語音信息的音頻文件轉化為包括文字信息的文本文件,根據(jù)音頻文件對應的文本文件即 音頻文件的全部內(nèi)容,建立關鍵字的索引數(shù)據(jù)庫;在用戶輸入特定關鍵字發(fā)起語音信息的 搜索時,基于關鍵字的索引數(shù)據(jù)庫提供與該特定關鍵字具有相關度的音頻文件,從而實現(xiàn) 了對音頻文件的內(nèi)容進行全文搜索,彌補了現(xiàn)有音頻搜索技術的不足;由于關鍵字的索引 數(shù)據(jù)庫基于語音識別技術建立,且涵蓋了音頻文件的全部內(nèi)容,從而提高了音頻搜索的準 確度,基于關鍵字的搜索也提高了音頻搜索的效率;在用戶發(fā)起搜索時,只需輸入特定關鍵 字即可,提升了音頻搜索的易用性。本發(fā)明提供的音頻文件中語音信息的搜索方法、裝置及設備,在關鍵字的索引數(shù) 據(jù)庫中還存儲每一個關鍵字在具有相關度的音頻文件中出現(xiàn)的時間信息,在用戶輸入特定 關鍵字發(fā)起語音信息的搜索時,基于關鍵字的索引數(shù)據(jù)庫還可以提供該特定關鍵字在具有 相關度的音頻文件中出現(xiàn)的時間信息,從而實現(xiàn)了準確定位特定關鍵字在搜索結果中的具 體位置。本領域的技術人員應明白,本發(fā)明的實施例可提供為方法、裝置、設備或計算機程 序產(chǎn)品。因此,本發(fā)明可采用完全硬件實施例、完全軟件實施例、或結合軟件和硬件方面的 實施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機可用程序代碼的計算 機可用存儲介質(包括但不限于磁盤存儲器、CD-ROM、光學存儲器等)上實施的計算機程序 產(chǎn)品的形式。本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、裝置、設備和計算機程序產(chǎn)品的流程圖 和/或方框圖來描述的。應理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流 程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些計算機 程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設備的處理器 以產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設備的處理器執(zhí)行的指令產(chǎn)生用 于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置ο這些計算機程序指令也可存儲在能引導計算機或其他可編程數(shù)據(jù)處理設備以特 定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指 令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設備上,使得在計 算機或其他可編程設備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或 其他可編程設備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖 一個方框或多個方框中指定的功能的步驟。盡管已描述了本發(fā)明的優(yōu)選實施例,但本領域內(nèi)的技術人員一旦得知了基本創(chuàng)造 性概念,則可對這些實施例作出另外的變更和修改。所以,所附權利要求意欲解釋為包括優(yōu) 選實施例以及落入本發(fā)明范圍的所有變更和修改。顯然,本領域的技術人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精 神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權利要求及其等同技術的范圍 之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
1權利要求
一種音頻文件中語音信息的搜索方法,其特征在于,包括對音頻資源庫中每一個包括語音信息的音頻文件進行語音識別,轉化為包括文字信息的文本文件,并對各文本文件的文字信息進行分詞處理;根據(jù)每一個文本文件所包括的詞提取對應的音頻文件所包括的關鍵字,確定每一個音頻文件與所包括的關鍵字的相關度,并結合每一個音頻文件的相關信息建立關鍵字的索引數(shù)據(jù)庫,所述索引數(shù)據(jù)庫中存儲每一個關鍵字與每一個音頻文件的相關度、以及每一個音頻文件的相關信息;當接收到攜帶特定關鍵字的語音信息搜索請求時,在所述索引數(shù)據(jù)庫中進行所述特定關鍵字的匹配,并根據(jù)與所述特定關鍵字具有相關度的音頻文件的相關信息提供相應的音頻文件。
2.如權利要求1所述的方法,其特征在于,在建立所述索引數(shù)據(jù)庫時還結合每一個音 頻文件所包括的關鍵字在該音頻文件中出現(xiàn)的時間信息,所述索引數(shù)據(jù)庫中還存儲每一個 關鍵字在具有相關度的音頻文件中出現(xiàn)的時間信息;以及在提供與所述特定關鍵字具有相關度的音頻文件的同時,還提供所述特定關鍵字在具 有相關度的音頻文件中出現(xiàn)的時間信息。
3.如權利要求2所述的方法,其特征在于,還包括對各文本文件的文字信息進行分詞處理之后,為各文本文件所包括的詞添加其在對應 的音頻文件中出現(xiàn)的時間信息。
4.如權利要求1、2或3任一所述的方法,其特征在于,按照相關度由高到低對與所述特 定關鍵字具有相關度的音頻文件進行排序。
5.如權利要求1所述的方法,其特征在于,所述音頻資源庫設置在終端側,所述語音信 息搜索請求為語音信息的本地搜索請求,所述音頻文件的相關信息包括音頻文件的文件名 稱和本地存儲路徑;以及在提供與所述特定關鍵字具有相關度的音頻文件的同時,還提供與所述特定關鍵字具 有相關度的音頻文件的文件名稱和本地存儲路徑。
6.如權利要求1所述的方法,其特征在于,所述音頻資源庫設置在網(wǎng)絡側,所述語音信 息搜索請求為語音信息的網(wǎng)絡搜索請求,所述音頻文件的相關信息包括音頻文件的文件名 稱和統(tǒng)一資源定位符URL ;以及所述根據(jù)與所述特定關鍵字具有相關度的音頻文件的相關信息提供相應的音頻文件 是指提供與所述特定關鍵字具有相關度的音頻文件的超鏈接。
7.如權利要求1所述的方法,其特征在于,還包括對音頻資源庫中每一個音頻文件進行語音解析,根據(jù)語音解析結果提取出包括語音信 息的音頻文件。
8.如權利要求1所述的方法,其特征在于,還包括定期或者在所述音頻資源庫中的音頻文件發(fā)生變化時,對所述索引數(shù)據(jù)庫進行更新。
9.一種音頻文件中語音信息的搜索裝置,其特征在于,包括語音識別模塊,用于對音頻資源庫中每一個包括語音信息的音頻文件進行語音識別, 轉化為包括文字信息的文本文件,并對各文本文件的文字信息進行分詞處理;索引建立模塊,用于根據(jù)每一個文本文件所包括的詞提取對應的音頻文件所包括的關鍵字,確定每一個音頻文件與所包括的關鍵字的相關度,并結合每一個音頻文件的相關信 息建立關鍵字的索引數(shù)據(jù)庫;索引數(shù)據(jù)庫,用于存儲每一個關鍵字與每一個音頻文件的相關度、以及每一個音頻文 件的相關信息;搜索處理模塊,用于當接收到攜帶特定關鍵字的語音信息搜索請求時,在所述索引數(shù) 據(jù)庫中進行所述特定關鍵字的匹配,并根據(jù)與所述特定關鍵字具有相關度的音頻文件的相 關信息提供相應的音頻文件。
10.如權利要求9所述的裝置,其特征在于,所述索引建立模塊在建立所述索引數(shù)據(jù)庫時還結合每一個音頻文件所包括的關鍵字 在該音頻文件中出現(xiàn)的時間信息;所述索引數(shù)據(jù)庫,還用于存儲每一個關鍵字在具有相關度的音頻文件中出現(xiàn)的時間信息;所述搜索處理模塊,還用于在提供與所述特定關鍵字具有相關度的音頻文件的同時, 還提供所述特定關鍵字在具有相關度的音頻文件中出現(xiàn)的時間信息。
11.如權利要求10所述的裝置,其特征在于,所述語音識別模塊,還用于對各文本文件的文字信息進行分詞處理之后,為各文本文 件所包括的詞添加其在對應的音頻文件中出現(xiàn)的時間信息。
12.如權利要求9所述的裝置,其特征在于,還包括音頻解析模塊,用于對音頻資源庫中每一個音頻文件進行語音解析,根據(jù)語音解析結 果提取出包括語音信息的音頻文件。
13.如權利要求9所述的裝置,其特征在于,還包括更新模塊,用于定期或者在所述音頻資源庫中的音頻文件發(fā)生變化時,對所述索引數(shù) 據(jù)庫進行更新。
14.一種終端設備,其特征在于,包括如權利要求9至13任一所述的搜索裝置。
15.一種網(wǎng)站服務器,其特征在于,包括如權利要求9至13任一所述的搜索裝置。
全文摘要
本發(fā)明公開了一種音頻文件中語音信息的搜索方法、裝置及設備,用以實現(xiàn)對音頻文件的內(nèi)容進行全文搜索,提高音頻搜索的準確度和效率,提升音頻搜索的易用性。所述搜索方法,包括對音頻資源庫中每一個包括語音信息的音頻文件進行語音識別,轉化為包括文字信息的文本文件,并對各文本文件的文字信息進行分詞處理;根據(jù)每一個文本文件所包括的詞提取對應的音頻文件所包括的關鍵字,確定每一個音頻文件與所包括的關鍵字的相關度,并結合每一個音頻文件的相關信息建立關鍵字的索引數(shù)據(jù)庫;當接收到攜帶特定關鍵字的語音信息搜索請求時,在索引數(shù)據(jù)庫中進行特定關鍵字的匹配,并根據(jù)與特定關鍵字具有相關度的音頻文件的相關信息提供相應的音頻文件。
文檔編號G06F17/30GK101996195SQ20091009166
公開日2011年3月30日 申請日期2009年8月28日 優(yōu)先權日2009年8月28日
發(fā)明者劉威, 樊科, 薛頔 申請人:中國移動通信集團公司