一種音視頻標(biāo)簽自動標(biāo)注方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及信息標(biāo)注【技術(shù)領(lǐng)域】,公開了一種音視頻標(biāo)簽自動標(biāo)注方法及系統(tǒng)。該方法包括:預(yù)先抓取各學(xué)科知識點和學(xué)科詞匯,構(gòu)建對應(yīng)的學(xué)科知識圖譜;將所述學(xué)科詞匯作為熱詞資源,將待標(biāo)注的音頻或視頻提取出的音頻轉(zhuǎn)寫成文本;提取所述文本中的關(guān)鍵詞,并根據(jù)所述關(guān)鍵詞與所述知識圖譜的關(guān)聯(lián)關(guān)系確定所述音頻或視頻所屬的學(xué)科及知識點;建立對應(yīng)所述音頻或視頻的標(biāo)簽,所述標(biāo)簽包括:所述關(guān)鍵詞以及所述音頻或視頻所屬的學(xué)科、知識點。本發(fā)明可以充分挖掘音視頻資源內(nèi)容,實現(xiàn)標(biāo)簽自動標(biāo)注,減少人工參與量,同時可以為后續(xù)的資源推送等服務(wù)提供很好的依據(jù)。
【專利說明】一種音視頻標(biāo)簽自動標(biāo)注方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及信息標(biāo)注【技術(shù)領(lǐng)域】,具體涉及一種音視頻標(biāo)簽自動標(biāo)注方法及系統(tǒng)。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)和教育云的蓬勃發(fā)展,教育教學(xué)類資源玲瑯滿目、參差不齊。對于教 師、學(xué)生而言,可以通過少量的元數(shù)據(jù),如標(biāo)題等來判斷資源是否是自身所需,這種方式較 依賴于元數(shù)據(jù),標(biāo)題中的錯別字可能都會影響用戶的判斷;也可能需要完整瀏覽整個音視 頻才能確定此資源的內(nèi)容是否為所需的資源,而完整瀏覽整個音視頻會比較耗時??梢姡瑐?統(tǒng)的這種音視頻獲取方式已經(jīng)無法滿足當(dāng)前從海量互聯(lián)網(wǎng)資源中快速獲取滿足自身要求 資源的需求。
[0003] 對教育教學(xué)類資源,尤其是音視頻進行標(biāo)簽自動標(biāo)注,一方面,標(biāo)注的標(biāo)簽可以更 好地挖掘當(dāng)前資源的實際內(nèi)容,彌補元數(shù)據(jù)不足的缺點,用戶不再需要完整瀏覽整個音視 頻就可以捕獲到實質(zhì)內(nèi)容,另一方面,標(biāo)注的標(biāo)簽對資源推送領(lǐng)域有著極大的促進作用,因 此,標(biāo)簽的自動標(biāo)注對當(dāng)前現(xiàn)代教育教學(xué)模式的變革意義重大。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明實施例提供了一種音視頻標(biāo)簽自動標(biāo)注方法及系統(tǒng),能讓用戶在不瀏覽整 個音視頻的情況下,準(zhǔn)確把握該音視頻資源的內(nèi)容;減少人工參與量;為后續(xù)的資源推薦 等服務(wù)提供更準(zhǔn)確的依據(jù)。
[0005] 為此,本發(fā)明提供如下技術(shù)方案:
[0006] -種音視頻標(biāo)簽自動標(biāo)注方法,包括:
[0007] 預(yù)先抓取各學(xué)科知識點和學(xué)科詞匯,構(gòu)建對應(yīng)的學(xué)科知識圖譜;
[0008] 將所述學(xué)科詞匯作為熱詞資源,將待標(biāo)注的音頻或視頻提取出的音頻轉(zhuǎn)寫成文 本;
[0009] 提取所述文本中的關(guān)鍵詞,并根據(jù)所述關(guān)鍵詞與所述知識圖譜的關(guān)聯(lián)關(guān)系確定所 述音頻或視頻所屬的學(xué)科及知識點;
[0010] 建立對應(yīng)所述音頻或視頻的標(biāo)簽,所述標(biāo)簽包括:所述關(guān)鍵詞以及所述音頻或視 頻所屬的學(xué)科、知識點。
[0011] 優(yōu)選地,所述關(guān)鍵詞有一個或者多個。
[0012] 優(yōu)選地,所述提取所述文本中的關(guān)鍵詞包括:
[0013] 對所述文本進行分詞,得到各子詞;
[0014] 計算各子詞的TF-IDF值;
[0015] 將所述TF-IDF值高于設(shè)定閾值的子詞作為關(guān)鍵詞,或者依照所述TF-IDF值由高 到低的順序選取前面設(shè)定個數(shù)的子詞作為關(guān)鍵詞。
[0016] 優(yōu)選地,所述關(guān)鍵詞與知識圖譜的關(guān)聯(lián)關(guān)系包括:所述關(guān)鍵詞在所述知識圖譜中 出現(xiàn)的位置和次數(shù)。
[0017] 優(yōu)選地,所述方法還包括:
[0018] 統(tǒng)計用戶對標(biāo)簽的選擇次數(shù),根據(jù)所述選擇次數(shù)進行添加、刪除或替換標(biāo)簽。
[0019] -種音視頻標(biāo)簽自動標(biāo)注系統(tǒng),包括:
[0020] 抓取模塊,用于預(yù)先抓取各學(xué)科知識點和學(xué)科詞匯;
[0021] 圖譜構(gòu)建模塊,用于構(gòu)建對應(yīng)所述學(xué)科知識點和學(xué)科詞匯的學(xué)科知識圖譜;
[0022] 轉(zhuǎn)寫模塊,用于將待標(biāo)注的音頻或視頻提取出的音頻轉(zhuǎn)寫成文本,轉(zhuǎn)寫時,以所述 學(xué)科詞匯作為熱詞資源;
[0023] 關(guān)鍵詞提取模塊,用于提取所述文本中的關(guān)鍵詞;
[0024] 信息確定模塊,用于根據(jù)所述關(guān)鍵詞與所述知識圖譜的關(guān)聯(lián)關(guān)系確定所述音頻或 視頻所屬的學(xué)科及知識點;
[0025] 標(biāo)簽建立模塊,用于建立對應(yīng)所述音頻或視頻的標(biāo)簽,所述標(biāo)簽中包括:所述關(guān)鍵 詞以及所述音頻或視頻所屬的學(xué)科、知識點。
[0026] 優(yōu)選地,所述關(guān)鍵詞有一個或者多個。
[0027] 優(yōu)選地,所述關(guān)鍵詞提取模塊包括:
[0028] 分詞單元,用于對所述文本進行分詞,得到各子詞;
[0029] 計算單元,用于計算所述各子詞的TF-IDF值;
[0030] 提取單元,用于將所述TF-IDF值高于設(shè)定閾值的子詞提取為關(guān)鍵詞,或者依照所 述TF-IDF值由高到低的順序選取前面設(shè)定個數(shù)的子詞提取為關(guān)鍵詞。
[0031] 優(yōu)選地,所述關(guān)鍵詞與知識圖譜的關(guān)聯(lián)關(guān)系包括:所述關(guān)鍵詞在所述知識圖譜中 出現(xiàn)的位置和次數(shù)。
[0032] 優(yōu)選地,所述系統(tǒng)還包括:
[0033] 優(yōu)化模塊,用于統(tǒng)計用戶對標(biāo)簽的選擇次數(shù),根據(jù)所述選擇次數(shù)進行添加、刪除或 替換標(biāo)簽。
[0034] 本發(fā)明實施例提供的音視頻標(biāo)簽自動標(biāo)注方法及系統(tǒng),利用語音轉(zhuǎn)寫技術(shù)和豐富 的互聯(lián)網(wǎng)數(shù)據(jù),對音視頻資源進行語音轉(zhuǎn)寫、關(guān)鍵詞提取,并依據(jù)關(guān)鍵詞及知識圖譜確定音 頻或視頻所屬的學(xué)科及知識點,實現(xiàn)標(biāo)簽自動標(biāo)注,減少了人工參與量,同時可以為后續(xù)的 資源推送等服務(wù)提供很好的依據(jù),更有利于教師、學(xué)生及時地發(fā)現(xiàn)優(yōu)質(zhì)教學(xué)資源。
【專利附圖】
【附圖說明】
[0035]為了更清楚地說明本申請實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例中所 需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明中記載的一 些實施例,對于本領(lǐng)域普通技術(shù)人員來講,還可以根據(jù)這些附圖獲得其它的附圖。
[0036] 圖1是本發(fā)明實施例音視頻標(biāo)簽自動標(biāo)注方法的流程圖;
[0037] 圖2是本發(fā)明實施例中構(gòu)建的學(xué)科知識圖譜的一種簡單示例;
[0038] 圖3是本發(fā)明實施例音視頻標(biāo)簽自動標(biāo)注系統(tǒng)的一種結(jié)構(gòu)示意圖。
【具體實施方式】
[0039] 為了使本【技術(shù)領(lǐng)域】的人員更好地理解本發(fā)明實施例的方案,下面結(jié)合附圖和實施 方式對本發(fā)明實施例作進一步的詳細說明。
[0040] 隨著互聯(lián)網(wǎng)和教育云的蓬勃發(fā)展,各種音視頻資源玲瑯滿目、參差不齊?,F(xiàn)有技術(shù) 中,可以通過少量的元數(shù)據(jù),如標(biāo)題等來判斷資源是否是自身所需,這種方式較依賴于元數(shù) 據(jù),標(biāo)題中的錯別字可能都會影響用戶的判斷;也可能需要完整瀏覽整個音視頻才能確定 此資源的內(nèi)容是否為所需的資源,而完整瀏覽整個音視頻會比較耗時。為此,本發(fā)明實施例 提供一種音視頻標(biāo)簽自動標(biāo)注方法及系統(tǒng),使用戶不再需要完整瀏覽整個音視頻就可以捕 獲到實質(zhì)內(nèi)容。首先,通過網(wǎng)絡(luò)爬蟲等工具抓取各學(xué)科知識點和學(xué)科詞匯,構(gòu)建對應(yīng)的學(xué)科 知識圖譜;然后,以所述學(xué)科詞匯作為熱詞資源,將待標(biāo)注的音頻或視頻提取出的音頻轉(zhuǎn)寫 成文本;其次,提取轉(zhuǎn)寫文本中的關(guān)鍵詞,并根據(jù)該關(guān)鍵詞與所構(gòu)建的知識圖譜的關(guān)聯(lián)關(guān)系 確定對應(yīng)的音頻或視頻所屬的學(xué)科及知識點;最后,建立對應(yīng)所述音頻或視頻的標(biāo)簽,所述 標(biāo)簽包括:所述關(guān)鍵詞以及所述音頻或視頻所屬的學(xué)科、知識點。
[0041] 如圖1所示,是本發(fā)明實施例音視頻標(biāo)簽自動標(biāo)注方法的流程圖,包括以下步驟:
[0042] 步驟101,預(yù)先抓取各學(xué)科知識點和學(xué)科詞匯,構(gòu)建對應(yīng)的學(xué)科知識圖譜。
[0043] 知識圖譜,也可稱為知識地圖,是以科學(xué)知識為計量研究對象,來顯示知識發(fā)展進 程與結(jié)構(gòu)關(guān)系的一系列各種不同的圖形,它可以用可視化技術(shù)描述人類隨時間擁有的知識 資源及其載體,繪制、挖掘、分析和顯示科學(xué)知識以及它們之間的相互聯(lián)系?;ヂ?lián)網(wǎng)上普遍 存在的超文本鏈接就是知識圖譜的一種簡單形式。在本發(fā)明實施例中,所述學(xué)科知識圖譜 包括具體到某個學(xué)科的各知識點及其相互關(guān)系。學(xué)科知識圖譜的作用在于顯示本學(xué)科中各 詞匯的相關(guān)性,對學(xué)科的預(yù)測和資源的推送有著至關(guān)重要的作用。
[0044] 實際應(yīng)用中,可以先通過網(wǎng)絡(luò)爬蟲等工具抓取學(xué)科知識點和學(xué)科詞匯,比如,物理 學(xué)科中浮力這個知識點,然后,以學(xué)科知識點作為起點,利用垂直搜索引擎獲取知識點關(guān)聯(lián) 的詞匯列表。垂直搜索引擎是針對某一個行業(yè)的專業(yè)搜索引擎,是搜索引擎的細分和延伸, 是對網(wǎng)頁庫中的某類專門的信息進行一次整合,定向分字段抽取出需要的數(shù)據(jù)進行處理后 再以某種形式返回給用戶。對每一個詞匯,獲取其百科內(nèi)容和百科詞條標(biāo)簽,以判斷該詞匯 是否是該學(xué)科詞匯,不斷地對詞匯進行深度遍歷,形成對應(yīng)學(xué)科的知識圖譜。如圖2所示, 是本發(fā)明實施例中構(gòu)建的學(xué)科知識圖譜的一種簡單示例。
[0045] 步驟102,將所述學(xué)科詞匯作為熱詞資源,將待標(biāo)注的音頻或視頻提取出的音頻轉(zhuǎn) 寫成文本。
[0046] 具體地,將待標(biāo)注的音頻或視頻提取出的音頻轉(zhuǎn)寫成文本時,可以使用現(xiàn)有的語 音轉(zhuǎn)寫技術(shù)進行音視頻轉(zhuǎn)寫。但是由于漢語的復(fù)雜性,傳統(tǒng)的語音轉(zhuǎn)寫技術(shù)轉(zhuǎn)寫準(zhǔn)確率普 遍較低,不能滿足實際應(yīng)用的需求,仍需大幅提高才能加以應(yīng)用,尤其對于包含大量專業(yè)詞 匯的教育教學(xué)類音視頻資源,語音轉(zhuǎn)寫的準(zhǔn)確率可能更低。
[0047] 為此,在本發(fā)明實施例中,以抓取到的專業(yè)詞匯作為熱詞資源,進行語音轉(zhuǎn)寫,語 音解碼可以選用傳統(tǒng)的聲學(xué)模型和語言模型,在不需要修改當(dāng)前模型的前提下,可以使語 音轉(zhuǎn)寫準(zhǔn)確率得到大幅度的提高。
[0048] 步驟103,提取所述文本中的關(guān)鍵詞,并根據(jù)所述關(guān)鍵詞與所述知識圖譜的關(guān)聯(lián)關(guān) 系確定所述音頻或視頻所屬的學(xué)科及知識點。
[0049] 具體地,在提取所述文本中的關(guān)鍵詞時,首先要對該文本進行分詞,得到各子詞, 然后計算各子詞的 TF_IDF(Term Frequency-Inverse Document Frequency,詞頻-逆向文 檔頻率)值,最后根據(jù)各子詞的TF-IDF值(即通過統(tǒng)計各子詞在當(dāng)前文檔中出現(xiàn)的頻率以 及該詞語在眾多文檔中出現(xiàn)的頻次)來判斷該詞能否作為該文本的關(guān)鍵詞。
[0050] 本實施例中,根據(jù)各子詞的TF-IDF值確定文本的關(guān)鍵詞時,可以有以下多種確定 方法,比如:
[0051] (1)設(shè)定閾值法:此方法首先設(shè)定TF-IDF閾值(如0· 202),然后將文本中TF-IDF 值高于設(shè)定閾值的子詞確定為關(guān)鍵詞;對于不同的文本,在同一設(shè)定閾值下,提取到的關(guān)鍵 詞個數(shù)可能不同。
[0052] (2)設(shè)定個數(shù)法:此方法首先設(shè)定待提取的關(guān)鍵詞個數(shù)(如5),然后依照文本中各 子詞的TF-IDF值由高到低的順序選取設(shè)定個數(shù)的子詞作為關(guān)鍵詞。
[0053] 使用TF-IDF技術(shù)提取的關(guān)鍵詞準(zhǔn)確性對語音轉(zhuǎn)寫的準(zhǔn)確性的依賴很小,即使語 音轉(zhuǎn)寫準(zhǔn)確率低于50%,使用TF-IDF技術(shù)仍然可以提取到準(zhǔn)確的關(guān)鍵詞信息。
[0054] 需要說明的是,可以提取文本中的一個或者多個子詞作為文本的關(guān)鍵詞,關(guān)鍵詞 個數(shù)(通常情況下可取3?5個)可以根據(jù)用戶需求進行設(shè)定。
[0055] 在確定了文本的關(guān)鍵詞后,根據(jù)關(guān)鍵詞與學(xué)科知識圖譜的關(guān)聯(lián)關(guān)系確定所述音頻 或視頻所屬的學(xué)科及知識點。比如,如果提取到的關(guān)鍵詞在數(shù)學(xué)學(xué)科知識圖譜中方程求解 這個知識點處出現(xiàn)的次數(shù)最高,則可以確定該關(guān)鍵詞所對應(yīng)的音頻或視頻所屬的學(xué)科及知 識點為數(shù)學(xué)學(xué)科的方程求解。
[0056] 步驟104,建立對應(yīng)所述音頻或視頻的標(biāo)簽,所述標(biāo)簽包括:所述關(guān)鍵詞以及所述 音頻或視頻所屬的學(xué)科、知識點。
[0057] 在提取到音頻或視頻的關(guān)鍵詞,確定了該音視頻所對應(yīng)的學(xué)科及知識點后,可以 將所述關(guān)鍵詞、所屬學(xué)科、知識點作為該音視頻的標(biāo)簽進行自動標(biāo)注。比如:提取關(guān)鍵詞個 數(shù)為5,則該關(guān)鍵詞對應(yīng)的音視頻的標(biāo)簽包括:5個關(guān)鍵詞、所屬學(xué)科、知識點,共計7個標(biāo) 簽。
[0058] 本發(fā)明實施例提供的音視頻標(biāo)簽自動標(biāo)注方法,利用語音轉(zhuǎn)寫技術(shù)和豐富的互聯(lián) 網(wǎng)數(shù)據(jù),對音視頻資源進行語音轉(zhuǎn)寫、關(guān)鍵詞提取、依據(jù)知識圖譜確定學(xué)科和知識點,可以 充分挖掘音視頻資源內(nèi)容,及時發(fā)現(xiàn)優(yōu)質(zhì)的音視頻資源,也可以為后續(xù)的資源推送等服務(wù) 提供很好的依據(jù)。
[0059] 為了進一步優(yōu)化自動標(biāo)注的標(biāo)簽,更好地反映音視頻的實質(zhì)內(nèi)容,在本發(fā)明音視 頻標(biāo)簽自動標(biāo)注方法另一實施例中,還包括:統(tǒng)計用戶對標(biāo)簽的選擇次數(shù),根據(jù)所述選擇次 數(shù)進行添加、刪除或替換標(biāo)簽。比如:統(tǒng)計用戶對標(biāo)簽的選擇次數(shù),保留用戶選擇次數(shù)高于 設(shè)定次數(shù)閾值的標(biāo)簽,刪除或替換用戶選擇次數(shù)低于設(shè)定次數(shù)閾值的標(biāo)簽。并且可以根據(jù) 對標(biāo)簽的刪減或添加,對熱詞資源和知識圖譜進行完善,進而再次建立更優(yōu)的音視頻標(biāo)簽。
[0060] 例如:對于一篇已轉(zhuǎn)寫的文本,系統(tǒng)標(biāo)注的結(jié)果可能為"重力、萬有引力、質(zhì)量、牛 頓、實驗、物理、牛頓定律"這些標(biāo)簽,在用戶對標(biāo)簽的反饋過程中,發(fā)現(xiàn)90%以上的用戶不 支持詞語"實驗"這個標(biāo)簽,而支持其他詞語,則在優(yōu)化知識圖譜和熱詞資源時,首先降低 "實驗"在語料庫中的權(quán)值,其次搜索知識圖譜,關(guān)聯(lián)其余詞語,將"萬有引力、質(zhì)量、牛頓、物 理、牛頓定律"和"重力"關(guān)聯(lián)起來,并記錄關(guān)聯(lián)度,隨著用戶反饋的增多,知識圖譜會越來越 豐富,越來越準(zhǔn)確。
[0061] 相應(yīng)地,本發(fā)明實施例還提供一種音視頻標(biāo)簽自動標(biāo)注系統(tǒng),如圖3所示,是該系 統(tǒng)的一種結(jié)構(gòu)示意圖。
[0062] 在該實施例中,所述系統(tǒng)包括:抓取模塊201,圖譜構(gòu)建模塊202,轉(zhuǎn)寫模塊203,關(guān) 鍵詞提取模塊204,信息確定模塊205以及標(biāo)簽建立模塊206。其中:
[0063] 抓取模塊201,用于預(yù)先抓取各學(xué)科知識點和學(xué)科詞匯。
[0064] 實際應(yīng)用中,抓取模塊201可以先通過網(wǎng)絡(luò)爬蟲等工具抓取學(xué)科知識點和學(xué)科詞 匯,以學(xué)科知識點作為起點,依據(jù)百度垂直搜索獲取知識點關(guān)聯(lián)的詞匯列表。
[0065] 圖譜構(gòu)建模塊202,用于構(gòu)建對應(yīng)所述學(xué)科知識點和學(xué)科詞匯的學(xué)科知識圖譜。
[0066] 具體的,圖譜構(gòu)建模塊202對抓取到的每一個詞匯,獲取其百度百科內(nèi)容和百度 百科詞條標(biāo)簽,以判斷該詞匯是否是該學(xué)科詞匯,不斷的對詞匯進行深度遍歷,得到各學(xué) 科知識點、各學(xué)科詞匯的關(guān)聯(lián)關(guān)系,并根據(jù)學(xué)科知識點、學(xué)科詞匯及其關(guān)聯(lián)關(guān)系構(gòu)建知識圖 譜。
[0067] 轉(zhuǎn)寫模塊203,用于將待標(biāo)注的音頻或視頻提取出的音頻轉(zhuǎn)寫成文本,轉(zhuǎn)寫時,以 所述學(xué)科詞匯作為熱詞資源。
[0068] 具體地,轉(zhuǎn)寫模塊203在將待標(biāo)注的音頻或視頻提取出的音頻轉(zhuǎn)寫成文本時,可 以使用現(xiàn)有的語音轉(zhuǎn)寫技術(shù)進行音視頻轉(zhuǎn)寫。但是由于漢語的復(fù)雜性,傳統(tǒng)的語音轉(zhuǎn)寫技 術(shù)轉(zhuǎn)寫準(zhǔn)確率普遍較低,不能滿足實際應(yīng)用的需求,仍需大幅提高才能加以應(yīng)用,尤其對于 包含大量專業(yè)詞匯的教育教學(xué)類音視頻資源,語音轉(zhuǎn)寫的準(zhǔn)確率可能更低。
[0069] 為此,在本發(fā)明實施例中,轉(zhuǎn)寫模塊203以抓取到的專業(yè)詞匯作為熱詞資源,進行 語音轉(zhuǎn)寫,語音解碼選用傳統(tǒng)的聲學(xué)模型或者語言模型,在不需要修改當(dāng)前模型的前提下, 可以使語音轉(zhuǎn)寫準(zhǔn)確率得到大幅度的提高。
[0070] 關(guān)鍵詞提取模塊204,用于提取所述文本中的關(guān)鍵詞。
[0071] 具體地,關(guān)鍵詞提取模塊204包括:分詞單元、計算單元和提取單元。在提取所述 文本中的關(guān)鍵詞時,所述分詞單元對所述文本進行分詞,得到各子詞;所述計算單元計算各 子詞的TF-IDF值,所述提取單元根據(jù)各子詞的TF-IDF值提取對應(yīng)文本的關(guān)鍵詞,比如,可 以將所述TF-IDF值高于設(shè)定閾值的子詞提取為關(guān)鍵詞,或者依照所述TF-IDF值由高到低 的順序選取前面設(shè)定個數(shù)的子詞提取為關(guān)鍵詞。對于不同的文本,在同一設(shè)定閾值下,提取 到的關(guān)鍵詞個數(shù)可能不同。
[0072] 關(guān)鍵詞提取模塊204使用TF-IDF技術(shù)提取的關(guān)鍵詞準(zhǔn)確性對語音轉(zhuǎn)寫的準(zhǔn)確性 的依賴很小,即使語音轉(zhuǎn)寫準(zhǔn)確率低于50%,仍然可以提取到準(zhǔn)確的關(guān)鍵詞信息。
[0073] 需要說明的是,關(guān)鍵詞提取模塊204可以提取文本中的一個或者多個子詞作為文 本的關(guān)鍵詞,關(guān)鍵詞個數(shù)(通常情況下可以取3?5個)可以根據(jù)用戶需求進行設(shè)定。
[0074] 信息確定模塊205,用于根據(jù)所述關(guān)鍵詞與所述知識圖譜的關(guān)聯(lián)關(guān)系確定所述音 頻或視頻所屬的學(xué)科及知識點。
[0075] 具體地,在確定了文本的關(guān)鍵詞后,信息確定模塊205根據(jù)關(guān)鍵詞與學(xué)科知識圖 譜的關(guān)聯(lián)關(guān)系確定所述音頻或視頻所屬的學(xué)科及知識點。比如:如果關(guān)鍵詞提取模塊204 提取到的關(guān)鍵詞在數(shù)學(xué)學(xué)科知識圖譜中方程求解這個知識點處出現(xiàn)的次數(shù)最高,則可以確 定該關(guān)鍵詞所對應(yīng)的音頻或視頻所屬的學(xué)科及知識點為數(shù)學(xué)學(xué)科的方程求解。
[0076] 標(biāo)簽建立模塊206,用于建立對應(yīng)所述音頻或視頻的標(biāo)簽,所述標(biāo)簽中包括:所述 關(guān)鍵詞以及所述音頻或視頻所屬的學(xué)科、知識點。比如:得到的關(guān)鍵詞個數(shù)為5,則該關(guān)鍵 詞對應(yīng)的音視頻的標(biāo)簽包括:5個關(guān)鍵詞、所屬學(xué)科、知識點,標(biāo)簽建立模塊206需要為該音 視頻建立7個標(biāo)簽(5個關(guān)鍵詞、所屬學(xué)科、知識點)。
[0077] 本發(fā)明實施例提供的音視頻標(biāo)簽自動標(biāo)注系統(tǒng),利用目前先進的語音轉(zhuǎn)寫技術(shù)和 豐富的互聯(lián)網(wǎng)數(shù)據(jù),對音視頻資源進行語音轉(zhuǎn)寫、關(guān)鍵詞提取、依據(jù)知識圖譜確定學(xué)科和知 識點,可以充分挖掘音視頻資源內(nèi)容,及時發(fā)現(xiàn)優(yōu)質(zhì)的音視頻資源,也可以為后續(xù)的資源推 送等服務(wù)提供很好的依據(jù)。
[0078] 為了進一步優(yōu)化自動標(biāo)注的標(biāo)簽,更好地反映音視頻的實質(zhì)內(nèi)容,在本發(fā)明音視 頻標(biāo)簽自動標(biāo)注系統(tǒng)另一實施例中,還包括:優(yōu)化模塊(未圖示),用于統(tǒng)計用戶對標(biāo)簽的 選擇次數(shù),根據(jù)所述選擇次數(shù)進行添加、刪除或替換標(biāo)簽。比如:統(tǒng)計用戶對標(biāo)簽的選擇次 數(shù),保留用戶選擇次數(shù)高于設(shè)定閾值的標(biāo)簽,刪除或替換用戶選擇次數(shù)低于設(shè)定閾值的標(biāo) 簽,根據(jù)對標(biāo)簽的刪減或添加,對熱詞資源和知識圖譜進行完善,進而再次建立更優(yōu)的音視 頻標(biāo)簽。
[0079] 本說明書中的各個實施例之間相同相似的部分互相參見即可,對于系統(tǒng)實施例而 言,由于其基本相似于方法實施例,所以描述得比較簡單,相關(guān)之處參見方法實施例的部分 說明即可。以上所描述的系統(tǒng)實施例僅僅是示意性的,其中所述作為分離部件說明的模塊 可以是或者也可以不是物理上分開的,作為模塊顯示的部件可以是或者也可以不是物理單 元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其 中的部分或者全部模塊來實現(xiàn)本實施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性 勞動的情況下,即可以理解并實施。
[0080] 本發(fā)明的各個部件實施例可以以硬件實現(xiàn),或者以在一個或者多個處理器上運行 的軟件模塊實現(xiàn),或者以它們的組合實現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實踐中使用 微處理器或者數(shù)字信號處理器(DSP)來實現(xiàn)根據(jù)本發(fā)明實施例中的一些或者全部部件的 一些或者全部功能。本發(fā)明還可以實現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的 設(shè)備或者裝置程序(例如,計算機程序和計算機程序產(chǎn)品)。
[0081] 以上對本發(fā)明實施例進行了詳細介紹,本文中應(yīng)用了【具體實施方式】對本發(fā)明進行 了闡述,以上實施例的說明只是用于幫助理解本發(fā)明的方法及設(shè)備;同時,對于本領(lǐng)域的 一般技術(shù)人員,依據(jù)本發(fā)明的思想,在【具體實施方式】及應(yīng)用范圍上均會有改變之處,綜上所 述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。
【權(quán)利要求】
1. 一種音視頻標(biāo)簽自動標(biāo)注方法,其特征在于,包括: 預(yù)先抓取各學(xué)科知識點和學(xué)科詞匯,構(gòu)建對應(yīng)的學(xué)科知識圖譜; 將所述學(xué)科詞匯作為熱詞資源,將待標(biāo)注的音頻或視頻提取出的音頻轉(zhuǎn)寫成文本; 提取所述文本中的關(guān)鍵詞,并根據(jù)所述關(guān)鍵詞與所述知識圖譜的關(guān)聯(lián)關(guān)系確定所述音 頻或視頻所屬的學(xué)科及知識點; 建立對應(yīng)所述音頻或視頻的標(biāo)簽,所述標(biāo)簽包括:所述關(guān)鍵詞以及所述音頻或視頻所 屬的學(xué)科、知識點。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述關(guān)鍵詞有一個或者多個。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述提取所述文本中的關(guān)鍵詞包括: 對所述文本進行分詞,得到各子詞; 計算各子詞的TF-IDF值; 將所述TF-IDF值高于設(shè)定閾值的子詞作為關(guān)鍵詞,或者依照所述TF-IDF值由高到低 的順序選取前面設(shè)定個數(shù)的子詞作為關(guān)鍵詞。
4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述關(guān)鍵詞與知識圖譜的關(guān)聯(lián)關(guān)系包括: 所述關(guān)鍵詞在所述知識圖譜中出現(xiàn)的位置和次數(shù)。
5. 根據(jù)權(quán)利要求1至4任一項所述的方法,其特征在于,所述方法還包括: 統(tǒng)計用戶對標(biāo)簽的選擇次數(shù),根據(jù)所述選擇次數(shù)進行添加、刪除或替換標(biāo)簽。
6. -種音視頻標(biāo)簽自動標(biāo)注系統(tǒng),其特征在于,包括: 抓取模塊,用于預(yù)先抓取各學(xué)科知識點和學(xué)科詞匯; 圖譜構(gòu)建模塊,用于構(gòu)建對應(yīng)所述學(xué)科知識點和學(xué)科詞匯的學(xué)科知識圖譜; 轉(zhuǎn)寫模塊,用于將待標(biāo)注的音頻或視頻提取出的音頻轉(zhuǎn)寫成文本,轉(zhuǎn)寫時,以所述學(xué)科 詞匯作為熱詞資源; 關(guān)鍵詞提取|吳塊,用于提取所述文本中的關(guān)鍵詞; 信息確定模塊,用于根據(jù)所述關(guān)鍵詞與所述知識圖譜的關(guān)聯(lián)關(guān)系確定所述音頻或視頻 所屬的學(xué)科及知識點; 標(biāo)簽建立模塊,用于建立對應(yīng)所述音頻或視頻的標(biāo)簽,所述標(biāo)簽中包括:所述關(guān)鍵詞以 及所述音頻或視頻所屬的學(xué)科、知識點。
7. 根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述關(guān)鍵詞有一個或者多個。
8. 根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述關(guān)鍵詞提取模塊包括: 分詞單元,用于對所述文本進行分詞,得到各子詞; 計算單元,用于計算所述各子詞的TF-IDF值; 提取單元,用于將所述TF-IDF值高于設(shè)定閾值的子詞提取為關(guān)鍵詞,或者依照所述 TF-IDF值由高到低的順序選取前面設(shè)定個數(shù)的子詞提取為關(guān)鍵詞。
9. 根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述關(guān)鍵詞與知識圖譜的關(guān)聯(lián)關(guān)系包括: 所述關(guān)鍵詞在所述知識圖譜中出現(xiàn)的位置和次數(shù)。
10. 根據(jù)權(quán)利要求6至9任一項所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括: 優(yōu)化模塊,用于統(tǒng)計用戶對標(biāo)簽的選擇次數(shù),根據(jù)所述選擇次數(shù)進行添加、刪除或替換 標(biāo)簽。
【文檔編號】G06F17/30GK104090955SQ201410320555
【公開日】2014年10月8日 申請日期:2014年7月7日 優(yōu)先權(quán)日:2014年7月7日
【發(fā)明者】徐玉林, 王政, 鐘錕, 胡國亮, 梁昭, 張建華, 王麗紅, 郭強 申請人:科大訊飛股份有限公司