字幕查詢方法、查詢裝置、視頻播放器及字幕查詢服務器的制造方法
【專利摘要】本發(fā)明涉及一種字幕查詢方法、字幕查詢裝置及相應的視頻播放器。該字幕查詢方法包括步驟:獲取待播放視頻文件的特征信息,并根據特征信息,在字幕數(shù)據庫中對待播放視頻文件進行字幕查詢,產生查詢結果;根據查詢結果,對待播放視頻文件進行語音文本化處理;以及根據語音文本化處理生成的文本化字幕,對字幕數(shù)據庫進行更新,并將字幕數(shù)據庫中進行更新的字幕作為待播放視頻文件的字幕。本發(fā)明的字幕查詢方法、字幕查詢裝置及相應的視頻播放器基于音頻信息識別對字幕進行查詢,可提高字幕匹配命中率以及降低誤差率,解決了現(xiàn)有的視頻播放器的字幕匹配命中率不高或誤差率較大的技術問題。
【專利說明】字幕查詢方法、查詢裝置、視頻播放器及字幕查詢服務器
【技術領域】
[0001]本發(fā)明涉及互聯(lián)網【技術領域】,特別是涉及一種字幕查詢方法、字幕查詢裝置、視頻播放器及相應的字幕查詢服務器。
【背景技術】
[0002]隨著多媒體技術和互聯(lián)網技術的迅速發(fā)展,視頻作為一種媒體類型在人們的生活、教育以及娛樂等方面日益成為不可或缺的信息載體。在視頻文件,尤其是外語視頻文件中,字幕是非常重要的部分,因為有些用戶的外語水平有限,在看外文電影時難以融入進劇情;而國語配音又很難達到原音的效果,因此使用字幕是解決這個問題最有效以及最便捷的方法。
[0003]目前的主流播放器都提供將視頻文件和在線字幕庫進行匹配的功能,但匹配成功率較低或誤差率較大,導致用戶的觀看字幕的體驗很差。造成這種問題的主要原因是:沒有足夠豐富的在線字幕庫供位于客戶端的播放器使用,從而導致播放器的字幕匹配命中率不高或誤差率較大。
[0004]故,有必要提供一種字幕查詢方法、字幕查詢裝置、視頻播放器及相應的字幕查詢服務器,以解決現(xiàn)有技術所存在的問題。
【發(fā)明內容】
[0005]本發(fā)明的目的在于提供一種基于音頻信息識別的字幕查詢方法、字幕查詢裝置、視頻播放器及相應的字幕查詢服務器,可提高字幕匹配命中率以及降低誤差率,以解決現(xiàn)有的視頻播放器的字幕匹配命中率不高或誤差率較大的技術問題。
[0006]為解決上述問題,本發(fā)明提供的技術方案如下:
[0007]本發(fā)明涉及一種字幕查詢方法,其包括步驟:
[0008]A、獲取待播放視頻文件的特征信息,并根據所述特征信息,在字幕數(shù)據庫中對所述待播放視頻文件進行字幕查詢,產生查詢結果;
[0009]B、根據所述查詢結果,對所述待播放視頻文件進行語音文本化處理;
[0010]其中所述語音文本化處理包括步驟:
[0011]提取所述待播放視頻文件的音頻信息;以及
[0012]將所述音頻信息轉換為文本化字幕;以及
[0013]C、根據所述語音文本化處理生成的所述文本化字幕,對所述字幕數(shù)據庫進行更新,并將所述字幕數(shù)據庫中進行更新的字幕作為所述待播放視頻文件的字幕。
[0014]在本發(fā)明所述的字幕查詢方法中,所述字幕數(shù)據庫包括標準字幕數(shù)據庫以及語音文本化數(shù)據庫;
[0015]所述步驟A包括步驟:
[0016]Al、獲取待播放視頻文件的特征信息,并根據所述特征信息,在所述標準字幕數(shù)據庫中對所述待播放視頻文件進行字幕查詢;以及[0017]A2、如在所述標準字幕數(shù)據庫中沒有查詢到所述待播放視頻文件的字幕,則在所述語音文本化數(shù)據庫中對所述待播放視頻文件進行字幕查詢,產生查詢結果;
[0018]所述步驟C包括:
[0019]根據所述語音文本化處理生成的所述文本化字幕,對所述語音文本化數(shù)據庫進行更新;并將所述語音文本化數(shù)據庫中進行更新的字幕作為所述待播放視頻文件的字幕。
[0020]在本發(fā)明所述的字幕查詢方法中,所述步驟B包括:
[0021]如在所述字幕數(shù)據庫中沒有查詢到所述待播放視頻文件的字幕,則對所述待播放視頻文件進行語音文本化處理;
[0022]所述步驟C包括:
[0023]Cl、根據所述語音文本化處理生成的所述文本化字幕,對所述語音文本化數(shù)據庫進行更新;
[0024]C2、將所述語音文本化處理生成的文本化字幕與所述標準字幕數(shù)據庫中的字幕進行比較,如所述標準字幕數(shù)據庫中存在字幕與所述語音文本化處理生成的文本化字幕一致,則對所述標準字幕數(shù)據庫進行更新,并將所述標準字幕數(shù)據庫中進行更新的字幕作為所述待播放視頻文件的字幕,否則將所述語音文本化數(shù)據庫中進行更新的字幕作為所述待播放視頻文件的字幕。
[0025]在本發(fā)明所述的字幕查詢方法中,所述步驟C2包括:
[0026]如所述標準字幕數(shù)據庫中存在字幕與所述語音文本化處理生成的文本化字幕一致,則將與所述語音文本化處理生成的文本化字幕對應的視頻文件與所述字幕進行關聯(lián)。
[0027]在本發(fā)明所述的字幕查詢方法中,所述視頻文件的特征信息為視頻文件的哈希碼,所述標準字幕數(shù)據庫包括字幕以及與所述字幕關聯(lián)的視頻文件的哈希碼;所述語音文本化數(shù)據庫包括文本化字幕以及與所述文本化字幕關聯(lián)的視頻文件的哈希碼;
[0028]所述步驟Al具體為:如所述標準字幕數(shù)據庫中存在所述待播放視頻文件的哈希碼,則返回與所述哈希碼關聯(lián)的字幕;否則轉到步驟A2使用所述語音文本化數(shù)據庫對所述待播放視頻文件進行字幕查詢;
[0029]所述步驟A2具體為:如所述語音文本化數(shù)據庫中存在所述待播放視頻文件的哈希碼,則返回與所述哈希碼關聯(lián)的文本化字幕;否則轉到步驟B對所述待播放視頻文件進行語音文本化處理。
[0030]本發(fā)明還涉及一種字幕查詢裝置,其包括:
[0031]查詢模塊,用于獲取待播放視頻文件的特征信息,并根據所述特征信息,在字幕數(shù)據庫中對所述待播放視頻文件進行字幕查詢,產生查詢結果;
[0032]語音文本化模塊,用于根據所述查詢結果,對所述待播放視頻文件進行語音文本化處理;包括:
[0033]提取單元,用于提取所述待播放視頻文件的音頻信息;以及
[0034]轉換單元,用于將所述音頻信息轉換為文本化字幕;以及
[0035]更新模塊,用于根據所述語音文本化處理生成的所述文本化字幕,對所述字幕數(shù)據庫進行更新,并將所述字幕數(shù)據庫中進行更新的字幕作為所述待播放視頻文件的字幕。
[0036]在本發(fā)明所述的字幕查詢裝置中,所述字幕數(shù)據庫包括標準字幕數(shù)據庫以及語音文本化數(shù)據庫;[0037]所述查詢模塊包括:
[0038]第一查詢單元,用于獲取待播放視頻文件的特征信息,并根據所述特征信息,在所述標準字幕數(shù)據庫中對所述待播放視頻文件進行字幕查詢;以及
[0039]第二查詢單元,用于如在所述標準字幕數(shù)據庫中沒有查詢到所述待播放視頻文件的字幕,則在所述語音文本化數(shù)據庫中對所述待播放視頻文件進行字幕查詢,產生查詢結果;
[0040]所述更新模塊包括:
[0041]第一更新單元,用于根據所述語音文本化處理生成的所述文本化字幕,對所述語音文本化數(shù)據庫進行更新;以及
[0042]第一字幕生成模塊,用于將所述語音文本化數(shù)據庫中進行更新的字幕作為所述待播放視頻文件的字幕。
[0043]在本發(fā)明所述的字幕查詢裝置中,所述語音文本化模塊具體用于:
[0044]如在所述字幕數(shù)據庫中沒有查詢到所述待播放視頻文件的字幕,則對所述待播放視頻文件進行語音文本化處理;
[0045]所述更新模塊還包括:
[0046]第二更新單元,用于將所述語音文本化處理生成的文本化字幕與所述標準字幕數(shù)據庫中的字幕進行比較,如所述標準字幕數(shù)據庫中存在字幕與所述語音文本化處理生成的文本化字幕一致,則對所述標準字幕數(shù)據庫進行更新;以及
[0047]第二字幕生成單元,用于將所述標準字幕數(shù)據庫中進行更新的字幕作為所述待播放視頻文件的字幕。
[0048]在本發(fā)明所述的字幕查詢裝置中,所述第二更新單元具體用于:
[0049]如所述標準字幕數(shù)據庫中存在字幕與所述語音文本化處理生成的文本化字幕一致,則將與所述語音文本化處理生成的文本化字幕對應的視頻文件與所述字幕進行關聯(lián)。
[0050]在本發(fā)明所述的字幕查詢裝置中,所述視頻文件的特征信息為視頻文件的哈希碼,所述標準字幕數(shù)據庫包括字幕以及與所述字幕關聯(lián)的視頻文件的哈希碼;所述語音文本化數(shù)據庫包括文本化字幕以及與所述文本化字幕關聯(lián)的視頻文件的哈希碼;
[0051]所述第一查詢單元具體用于:如所述標準字幕數(shù)據庫中存在所述待播放視頻文件的哈希碼,則返回與所述哈希碼關聯(lián)的字幕;
[0052]所述第二查詢單元具體用于:如所述語音文本化數(shù)據庫中存在所述待播放視頻文件的哈希碼,則返回與所述哈希碼關聯(lián)的文本化字幕。
[0053]本發(fā)明還涉及一種采用上述的字幕查詢裝置進行字幕查詢的視頻播放器。
[0054]本發(fā)明還涉及一種采用上述的字幕查詢裝置進行字幕查詢的字幕查詢服務器。
[0055]相較于現(xiàn)有技術,本發(fā)明的字幕查詢方法、字幕查詢裝置、視頻播放器及相應的字幕查詢服務器基于音頻信息識別對字幕進行查詢,可提高字幕匹配命中率以及降低誤差率,解決了現(xiàn)有的視頻播放器的字幕匹配命中率不高或誤差率較大的技術問題。
[0056]為讓本發(fā)明的上述內容能更明顯易懂,下文特舉優(yōu)選實施例,并配合所附圖式,作詳細說明如下:
【專利附圖】
【附圖說明】[0057]圖1為本發(fā)明的字幕查詢方法的優(yōu)選實施例的流程圖;
[0058]圖2為本發(fā)明的字幕查詢裝置的優(yōu)選實施例的結構示意圖;
[0059]其中,附圖標記說明如下:
[0060]21、查詢模塊;
[0061]211、第一查詢單元;
[0062]212、第二查詢單元;
[0063]22、語音文本化模塊;
[0064]221、提取單元;
[0065]222、轉換單元;
[0066]23、更新模塊;
[0067]231、第一更新單元;
[0068]232、第二更新單元;
[0069]233、第一字幕生成單元;
[0070]234、第二字幕生成單元。
【具體實施方式】
[0071]以下各實施例的說明是參考附加的圖式,用以例示本發(fā)明可用以實施的特定實施例。本發(fā)明所提到的方向用語,例如「上」、「下」、「前」、「后」、「左」、「右」、「內」、「外」、「側面」等,僅是參考附加圖式的方向。因此,使用的方向用語是用以說明及理解本發(fā)明,而非用以限制本發(fā)明。
[0072]在圖中,結構相似的單元是以相同標號表示。
[0073]請參照圖1,圖1為本發(fā)明的字幕查詢方法的優(yōu)選實施例的流程圖,該字幕查詢方法包括:
[0074]步驟101,獲取待播放視頻文件的特征信息,并根據特征信息,在字幕數(shù)據庫中對待播放視頻文件進行字幕查詢,產生查詢結果;
[0075]步驟102,根據查詢結果,對待播放視頻文件進行語音文本化處理;
[0076]步驟103,根據語音文本化處理生成的文本化字幕,對字幕數(shù)據庫進行更新,并將字幕數(shù)據庫中進行更新的字幕作為待播放視頻文件的字幕;
[0077]本優(yōu)選實施例的字幕查詢方法結束于步驟103。
[0078]其中語音文本化處理包括步驟:提取待播放視頻文件的音頻信息以及將音頻信息轉換為文本化字幕,從而實現(xiàn)了待播放視頻文件的文本化。
[0079]本優(yōu)選實施例的字幕查詢方法對于匹配不到字幕的待播放視頻文件,對其進行語音文本化處理,并根據處理后的文本化字幕更新字幕數(shù)據庫,保證了字幕的匹配,同時可提高下一次字幕查詢的匹配命中率。
[0080]下面詳細說明本發(fā)明的字幕查詢方法的優(yōu)選實施例的各步驟的詳細流程。
[0081]在步驟101之前,會先建立標準字幕數(shù)據庫以及語音文本化數(shù)據庫以構成字幕數(shù)據庫,其中標準字幕數(shù)據庫為標準字幕格式的數(shù)據庫,包括字幕以及與字幕關聯(lián)的視頻文件的哈希碼。可通過人工輸入建立或通過字幕網絡爬蟲下載字幕網站上的標準字幕,并可定期通過字幕網絡爬蟲對標準字幕數(shù)據庫進行更新。語音文本化數(shù)據庫是由文本化字幕建立起來的數(shù)據庫,包括文本化字幕以及與文本化字幕關聯(lián)的視頻文件的哈希碼。其中文本化字幕是對視頻文件進行語音識別而形成的文本,其中包括視頻文件的文字對白以及相應的時間戳。初期的語音文本化數(shù)據庫可較小,但隨著字幕查詢的不斷進行,該語音文本化數(shù)據庫可被逐漸擴充(主要是最新的視頻文件的文本化字幕或一些稀少的視頻文件的文本化
子眷)。
[0082]在步驟101中,首先獲取待播放視頻文件的特征信息,并根據特征信息,在標準字幕數(shù)據庫中對所述待播放視頻文件進行字幕查詢。這里的視頻文件的特征信息是指文件名、文件大小、整個或部分文件的哈希碼以及上述的組合等可以標識視頻文件的特征值。在本實施例中特征信息以視頻文件的哈希碼為例進行說明,在本步驟中,會先查詢待播放視頻文件的哈希碼,然后在標準字幕數(shù)據庫中查詢該哈希碼,如標準字幕數(shù)據庫中存在該待播放視頻文件的哈希碼,則將與該哈希碼關聯(lián)的字幕返回給用戶,完成字幕查詢。否則判斷標準字幕數(shù)據庫中沒有該待播放視頻文件的字幕。
[0083]如在標準字幕數(shù)據庫中沒有查詢到待播放視頻文件的字幕,則在語音文本化數(shù)據庫中對待播放視頻文件進行字幕查詢。在本步驟中,同樣在語音文本化數(shù)據庫中查詢該待播放視頻文件的哈希碼,如語音文本化數(shù)據庫中存在該待播放視頻文件的哈希碼,則將與該哈希碼關聯(lián)的文本化字幕返回給用戶,完成字幕查詢。否則判斷語音文本化數(shù)據庫中沒有該待播放視頻文件的字幕。
[0084]隨后轉到步驟102。
[0085]在步驟102中,如在標準字幕數(shù)據庫和語音文本化數(shù)據庫中均沒有查詢到待播放視頻文件的字幕,則對該待播放視頻文件進行語音文本化處理。首先提取待播放視頻文件的音頻信息,即將待播放視頻文件中的語音信號從視頻中分離出來。無論待播放視頻文件中包括一個或多個語音,通過現(xiàn)有的語音識別技術均可輸出一路主要的語音信號(音頻信息)。隨后將音頻信息轉換為文本化字幕,即將音頻信息轉換為對白文字及相應的時間戳。該對白文字可為中文、英文或其他語言,并且該轉換應具有一定的容錯率。
[0086]隨后轉到步驟103。
[0087]在步驟103中,根據語音文本化處理生成的文本化字幕,對語音文本化數(shù)據庫進行更新;并將語音文本化數(shù)據庫中進行更新的字幕作為待播放視頻文件的字幕。這里的對語音文本化數(shù)據庫進行更新主要將語音文本化處理生成的文本化字幕及與該文本化字幕關聯(lián)的視頻文件的哈希碼存儲到語音文本化數(shù)據庫中。
[0088]進一步,在本步驟中,還可將語音文本化處理生成的文本化字幕與標準字幕數(shù)據庫中的字幕進行比較,如標準字幕數(shù)據庫中存在字幕與語音文本化處理生成的文本化字幕一致,則對標準字幕數(shù)據庫進行更新,并將標準字幕數(shù)據庫中進行更新的字幕作為待播放視頻文件的字幕,否則將語音文本化數(shù)據庫中進行更新的字幕作為待播放視頻文件的字眷。
[0089]由于標準字幕數(shù)據庫為標準字幕格式的數(shù)據庫,該數(shù)據庫中的字幕品質較高,因此在本步驟中可盡可能將語音文本化數(shù)據庫中的文本化字幕與標準字幕數(shù)據庫中的字幕建立關聯(lián),以便更多的視頻文件可以直接使用標準字幕數(shù)據庫中的高品質字幕。
[0090]字幕和文本化字幕均包括字符串(對白文字)以及相應的時間戳。具體比較時,取播放總時間大致相同的字幕和文本化字幕進行比較,任取文本化字幕的n (n大于等于2)個時間點(如5分鐘處、10分鐘處或20分鐘處等)的字符串,和字幕的相應時間點位置的字符串進行比較(這里的時間點選取應允許一定的誤差,例如和該時間點附近的10個字符串分別進行比較等),如文本化字幕的每個被比較的字符串在字幕中均有相應的字符串匹配,則判斷標準字幕數(shù)據庫中存在字幕與語音文本化處理生成的文本化字幕一致,否則判斷標準字幕數(shù)據庫中沒有字幕與語音文本化處理生成的文本化字幕一致。
[0091]如標準字幕數(shù)據庫中存在字幕與語音文本化處理生成的文本化字幕一致,則將與語音文本化處理生成的文本化字幕對應的視頻文件與字幕進行關聯(lián),即將該視頻文件的哈希碼與該字幕進行關聯(lián)并將該視頻文件的哈希碼存儲到標準字幕數(shù)據庫中,完成標準字幕數(shù)據庫的更新。
[0092]這樣即完成了整個待播放視頻文件的字幕查詢過程以及相應的字幕數(shù)據庫的更新過程。
[0093]這里需要指出的是,步驟103中的語音文本化處理生成的文本化字幕與標準字幕數(shù)據庫中的字幕的比較步驟以及標準字幕數(shù)據庫的更新步驟是為了優(yōu)化標準字幕數(shù)據庫中的字幕的匹配命中率,也可根據用戶的要求不進行這兩步驟的設置。
[0094]同時本優(yōu)選實施例中各步驟的順序并不限制本發(fā)明的保護范圍,如對最新的視頻文件可直接從步驟102開始,以更新語音文本化數(shù)據庫,而不必在字幕數(shù)據庫中進行字幕查詢。因此按照其他的步驟順序執(zhí)行本發(fā)明的上述步驟也能達到優(yōu)化字幕匹配命中率的效果,也屬于本發(fā)明的保護范圍。
[0095]本發(fā)明還涉及一種字幕查詢裝置,如圖2所示,圖2為本發(fā)明的字幕查詢裝置的優(yōu)選實施例的結構示意圖。該字幕查詢裝置包括查詢模塊21、語音文本化模塊22、以及更新模塊23。
[0096]其中查詢模塊21用于獲取待播放視頻文件的特征信息,并根據特征信息,在字幕數(shù)據庫中對待播放視頻文件進行字幕查詢,產生查詢結果;語音文本化模塊22用于根據查詢結果,對待播放視頻文件進行語音文本化處理;更新模塊23用于根據語音文本化處理生成的文本化字幕,對字幕數(shù)據庫進行更新,并將字幕數(shù)據庫中進行更新的字幕作為待播放視頻文件的字幕。
[0097]其中字幕數(shù)據庫包括標準字幕數(shù)據庫以及語音本地化數(shù)據庫,標準字幕數(shù)據庫包括字幕以及與字幕關聯(lián)的視頻文件的哈希碼;語音文本化數(shù)據庫包括文本化字幕以及與文本化字幕關聯(lián)的視頻文件的哈希碼。
[0098]其中查詢模塊21包括第一查詢單元211以及第二查詢單元212。第一查詢單元211用于獲取待播放視頻文件的特征信息,并根據特征信息,在標準字幕數(shù)據庫中對待播放視頻文件進行字幕查詢;具體為如標準字幕數(shù)據庫中存在待播放視頻文件的哈希碼,則返回與哈希碼關聯(lián)的字幕。第二查詢單元212用于如在標準字幕數(shù)據庫中沒有查詢到待播放視頻文件的字幕,則在語音文本化數(shù)據庫中對待播放視頻文件進行字幕查詢;具體為如語音文本化數(shù)據庫中存在待播放視頻文件的哈希碼,則返回與哈希碼關聯(lián)的文本化字幕。
[0099]語音文本化模塊22包括提取單元221以及轉換單元222。提取單元221用于提取待播放視頻文件的音頻信息;轉換單元222用于將音頻信息轉換為文本化字幕。
[0100]更新模塊23包括第一更新單元231、第二更新單元232、第一字幕生成單元233以及第二字幕生成單元234。第一更新單元231用于根據語音文本化處理生成的文本化字幕,對語音文本化數(shù)據庫進行更新;第二更新單元232用于將語音文本化處理生成的文本化字幕與標準字幕數(shù)據庫中的字幕進行比較,如標準字幕數(shù)據庫中存在字幕與語音文本化處理生成的文本化字幕一致,則對標準字幕數(shù)據庫進行更新,具體為將與語音文本化處理生成的文本化字幕對應的視頻文件與標準字幕數(shù)據庫中的字幕進行關聯(lián);第一字幕生成單元233用于將語音文本化數(shù)據庫中進行更新的字幕作為待播放視頻文件的字幕;第二字幕生成單元234用于將標準字幕數(shù)據庫中進行更新的字幕作為待播放視頻文件的字幕。
[0101]本發(fā)明的字幕查詢裝置使用時,會先建立標準字幕數(shù)據庫以及語音文本化數(shù)據庫。隨后查詢模塊21的第一查詢單元211會先查詢待播放視頻文件的哈希碼,然后在標準字幕數(shù)據庫中查詢該哈希碼,如標準字幕數(shù)據庫中存在該待播放視頻文件的哈希碼,則將與該哈希碼關聯(lián)的字幕返回給用戶,完成字幕查詢。否則查詢模塊21的第二查詢單元212會在語音文本化數(shù)據庫中查詢該待播放視頻文件的哈希碼,如語音文本化數(shù)據庫中存在該待播放視頻文件的哈希碼,則將與該哈希碼關聯(lián)的文本化字幕返回給用戶,完成字幕查詢。如在標準字幕數(shù)據庫和語音文本化數(shù)據庫中均沒有查詢到待播放視頻文件的字幕,則語音文本化模塊22對該待播放視頻文件進行語音文本化處理,并同時更新模塊23的第一更新單元231將轉換后的文本化字幕存入語音文本化數(shù)據庫供字幕查詢使用,實現(xiàn)了語音文本化數(shù)據庫的更新。這時第一字幕生成單元233可將語音文本化數(shù)據庫中進行更新的字幕作為待播放視頻文件的字幕。
[0102]進一步,更新模塊23的第二更新單元232可將語音文本化處理生成的文本化字幕與標準字幕數(shù)據庫中的字幕進行比較,如標準字幕數(shù)據庫中存在字幕與語音文本化處理生成的文本化字幕一致,則第二更新單元232將與語音文本化處理生成的文本化字幕對應的視頻文件與字幕進行關聯(lián),即將該視頻文件的哈希碼與該字幕進行關聯(lián),完成標準字幕數(shù)據庫的更新,優(yōu)化了標準字幕數(shù)據庫中的字幕的匹配命中率。這時第二字幕生成單元234可將標準字幕數(shù)據庫中進行更新的字幕作為待播放視頻文件的字幕。當然這里第二更新單元232和第二字幕生成單元234可根據用戶的要求進行選擇設置。
[0103]本發(fā)明的字幕查詢裝置的具體工作原理與上述的字幕查詢方法的優(yōu)選實施例中描述的相同或相似,具體請參見上述的字幕查詢方法的優(yōu)選實施例的詳細流程。
[0104]本發(fā)明還涉及一種視頻播放器,該視頻播放器使用上述的字幕查詢裝置進行字幕的查詢。該視頻播放器進行字幕查詢的具體原理與上述的字幕查詢裝置的優(yōu)選實施例中描述的相同或相似,具體請參見上述的字幕查詢裝置的優(yōu)選實施例中的相關描述。
[0105]本發(fā)明還涉及一種字幕查詢服務器,該字幕查詢服務器使用上述的字幕查詢裝置進行字幕的查詢。該字幕查詢服務器進行字幕查詢的具體原理與上述的字幕查詢裝置的優(yōu)選實施例中描述的相同或相似,具體請參見上述的字幕查詢裝置的優(yōu)選實施例中的相關描述。
[0106]本發(fā)明的字幕查詢方法、字幕查詢裝置、視頻播放器及相應的字幕查詢服務器基于音頻信息識別對字幕進行查詢,提高了字幕匹配命中率,降低了誤差率。同時根據語音文本化處理生成的文本化字幕對標準字幕數(shù)據庫和語音文本化數(shù)據庫進行及時更新,優(yōu)化了標準字幕數(shù)據庫和語音文本化數(shù)據庫中的字幕的匹配命中率,提升了用戶觀看視頻文件的體驗。
[0107]綜上所述,雖然本發(fā)明已以優(yōu)選實施例揭露如上,但上述優(yōu)選實施例并非用以限制本發(fā)明,本領域的普通技術人員,在不脫離本發(fā)明的精神和范圍內,均可作各種更動與潤飾,因此本發(fā)明的保護范圍以權利要求界定的范圍為準。
【權利要求】
1.一種字幕查詢方法,其特征在于,包括步驟: A、獲取待播放視頻文件的特征信息,并根據所述特征信息,在字幕數(shù)據庫中對所述待播放視頻文件進行字幕查詢,產生查詢結果; B、根據所述查詢結果,對所述待播放視頻文件進行語音文本化處理; 其中所述語音文本化處理包括步驟: 提取所述待播放視頻文件的音頻信息;以及 將所述音頻信息轉換為文本化字幕;以及 C、根據所述語音文本化處理生成的所述文本化字幕,對所述字幕數(shù)據庫進行更新,并將所述字幕數(shù)據庫中進行更新的字幕作為所述待播放視頻文件的字幕。
2.根據權利要求1所述的字幕查詢方法,其特征在于,所述字幕數(shù)據庫包括標準字幕數(shù)據庫以及語音文本化數(shù)據庫; 所述步驟A包括步驟: Al、獲取待播放視頻文件的特征信息,并根據所述特征信息,在所述標準字幕數(shù)據庫中對所述待播放視頻文件進行字幕查詢;以及 A2、如在所述標準字幕數(shù)據庫中沒有查詢到所述待播放視頻文件的字幕,則在所述語音文本化數(shù)據庫中對所述待播放視頻文件進行字幕查詢,產生查詢結果; 所述步驟C包括:` 根據所述語音文本化處理生成的所述文本化字幕,對所述語音文本化數(shù)據庫進行更新;并將所述語音文本化數(shù)據庫中進行更新的字幕作為所述待播放視頻文件的字幕。
3.根據權利要求2所述的字幕查詢方法,其特征在于,所述步驟B包括: 如在所述字幕數(shù)據庫中沒有查詢到所述待播放視頻文件的字幕,則對所述待播放視頻文件進行語音文本化處理; 所述步驟C包括: Cl、根據所述語音文本化處理生成的所述文本化字幕,對所述語音文本化數(shù)據庫進行更新; C2、將所述語音文本化處理生成的文本化字幕與所述標準字幕數(shù)據庫中的字幕進行比較,如所述標準字幕數(shù)據庫中存在字幕與所述語音文本化處理生成的文本化字幕一致,則對所述標準字幕數(shù)據庫進行更新,并將所述標準字幕數(shù)據庫中進行更新的字幕作為所述待播放視頻文件的字幕,否則將所述語音文本化數(shù)據庫中進行更新的字幕作為所述待播放視頻文件的字幕。
4.根據權利要求3所述的字幕查詢方法,其特征在于,所述步驟C2包括: 如所述標準字幕數(shù)據庫中存在字幕與所述語音文本化處理生成的文本化字幕一致,則將與所述語音文本化處理生成的文本化字幕對應的視頻文件與所述字幕進行關聯(lián)。
5.根據權利要求2所述的字幕查詢方法,其特征在于,所述視頻文件的特征信息為視頻文件的哈希碼,所述標準字幕數(shù)據庫包括字幕以及與所述字幕關聯(lián)的視頻文件的哈希碼;所述語音文本化數(shù)據庫包括文本化字幕以及與所述文本化字幕關聯(lián)的視頻文件的哈希碼; 所述步驟Al具體為:如所述標準字幕數(shù)據庫中存在所述待播放視頻文件的哈希碼,則返回與所述哈希碼關聯(lián)的字幕;否則轉到步驟A2使用所述語音文本化數(shù)據庫對所述待播放視頻文件進行字幕查詢; 所述步驟A2具體為:如所述語音文本化數(shù)據庫中存在所述待播放視頻文件的哈希碼,則返回與所述哈希碼關聯(lián)的文本化字幕;否則轉到步驟B對所述待播放視頻文件進行語音文本化處理。
6.一種字幕查詢裝置,其特征在于,包括: 查詢模塊,用于獲取待播放視頻文件的特征信息,并根據所述特征信息,在字幕數(shù)據庫中對所述待播放視頻文件進行字幕查詢,產生查詢結果; 語音文本化模塊,用于根據所述查詢結果,對所述待播放視頻文件進行語音文本化處理;包括: 提取單元,用于提取所述待播放視頻文件的音頻信息;以及 轉換單元,用于將所述音頻信息轉換為文本化字幕;以及 更新模塊,用于根據所述語音文本化處理生成的所述文本化字幕,對所述字幕數(shù)據庫進行更新,并將所述字幕數(shù)據庫中進行更新的字幕作為所述待播放視頻文件的字幕。
7.根據權利要求6所述的字幕查詢裝置,其特征在于,所述字幕數(shù)據庫包括標準字幕數(shù)據庫以及語音文本化數(shù)據庫; 所述查詢模塊包括: 第一查詢單元,用于獲取待播放視頻文件的特征信息,并根據所述特征信息,在所述標準字幕數(shù)據庫中對所述待播放視頻文件進行字幕查詢;以及 第二查詢單元,用于如在所述標準字幕數(shù)據庫中沒有查詢到所述待播放視頻文件的字幕,則在所述語音文本化數(shù)據庫中對所述待播放視頻文件進行字幕查詢,產生查詢結果;所述更新模塊包括: 第一更新單元,用于根據所述語音文本化處理生成的所述文本化字幕,對所述語音文本化數(shù)據庫進行更新;以及 第一字幕生成單元,用于將所述語音文本化數(shù)據庫中進行更新的字幕作為所述待播放視頻文件的字幕。
8.根據權利要求7所述的字幕查詢裝置,其特征在于,所述語音文本化模塊具體用于: 如在所述字幕數(shù)據庫中沒有查詢到所述待播放視頻文件的字幕,則對所述待播放視頻文件進行語音文本化處理; 所述更新模塊還包括: 第二更新單元,用于將所述語音文本化處理生成的文本化字幕與所述標準字幕數(shù)據庫中的字幕進行比較,如所述標準字幕數(shù)據庫中存在字幕與所述語音文本化處理生成的文本化字幕一致,則對所述標準字幕數(shù)據庫進行更新;以及 第二字幕生成單元,用于將所述標準字幕數(shù)據庫中進行更新的字幕作為所述待播放視頻文件的字幕。
9.根據權利要求8所述的字幕查詢裝置,其特征在于,所述第二更新單元具體用于: 如所述標準字幕數(shù)據庫中存在字幕與所述語音文本化處理生成的文本化字幕一致,則將與所述語音文本化處理生成的文本化字幕對應的視頻文件與所述字幕進行關聯(lián)。
10.根據權利要求7所述的字幕查詢裝置,其特征在于,所述視頻文件的特征信息為視頻文件的哈希碼,所述標準字幕數(shù)據庫包括字幕以及與所述字幕關聯(lián)的視頻文件的哈希碼;所述語音文本化數(shù)據庫包括文本化字幕以及與所述文本化字幕關聯(lián)的視頻文件的哈希碼; 所述第一查詢單元具體用于:如所述標準字幕數(shù)據庫中存在所述待播放視頻文件的哈希碼,則返回與所述哈希碼關聯(lián)的字幕; 所述第二查詢單元具體用于:如所述語音文本化數(shù)據庫中存在所述待播放視頻文件的哈希碼,則返回與所述哈希碼關聯(lián)的文本化字幕。
11.一種使用權利要求6至10中任一字幕查詢裝置進行字幕查詢的視頻播放器。
12.一種使用權利要求6至10中任一`字幕查詢裝置進行字幕查詢的字幕查詢服務器。
【文檔編號】G06F17/30GK103778131SQ201210398027
【公開日】2014年5月7日 申請日期:2012年10月18日 優(yōu)先權日:2012年10月18日
【發(fā)明者】劉剛 申請人:騰訊科技(深圳)有限公司