音頻管理裝置和方法
【專利摘要】本發(fā)明公開(kāi)了一種音頻管理裝置,該裝置包括:語(yǔ)音識(shí)別模塊,用于對(duì)音頻文件進(jìn)行語(yǔ)音識(shí)別,獲取所述音頻文件對(duì)應(yīng)的文本,以及所述音頻文件與所述文本的時(shí)間關(guān)聯(lián)信息;信息提取模塊,用于根據(jù)預(yù)先配置的識(shí)別模型,提取所述文本的標(biāo)注信息;標(biāo)簽獲取模塊,用于根據(jù)所述文本的標(biāo)注信息,以及所述音頻文件與所述文本的時(shí)間關(guān)聯(lián)信息,獲取所述音頻文件的標(biāo)簽。本發(fā)明還公開(kāi)了一種音頻管理方法。本發(fā)明實(shí)現(xiàn)了自動(dòng)識(shí)別、智能添加音頻文件的標(biāo)簽,無(wú)需用戶手動(dòng)對(duì)音頻文件進(jìn)行標(biāo)簽的添加和編輯,提升了用戶體驗(yàn)。
【專利說(shuō)明】
音頻管理裝置和方法
技術(shù)領(lǐng)域
[0001 ]本發(fā)明涉及語(yǔ)音處理技術(shù)領(lǐng)域,尤其涉及一種音頻管理裝置和方法。
【背景技術(shù)】
[0002]用戶使用手機(jī)、錄音筆等終端設(shè)備進(jìn)行錄音時(shí),在錄音過(guò)程中可以給錄音文件添加標(biāo)簽,進(jìn)行重點(diǎn)標(biāo)記或段落劃分。后續(xù),在用戶播放錄音文件的時(shí),可以根據(jù)標(biāo)簽獲取錄首內(nèi)容的提不。
[0003]例如,在開(kāi)會(huì)時(shí),會(huì)議內(nèi)容通常會(huì)有幾個(gè)明確的議題,在討論不同的議題時(shí),用戶可以使用錄音應(yīng)用的標(biāo)簽功能,給錄音文件的時(shí)間點(diǎn)上添加標(biāo)簽。從而,在播放錄音文件時(shí),用戶可以根據(jù)時(shí)間點(diǎn)上的標(biāo)簽獲知此段錄音的議題。
[0004]但是,目前錄音標(biāo)簽的添加通常是由用戶手動(dòng)進(jìn)行操作的,在錄音的過(guò)程中可能會(huì)漏掉部分重要的標(biāo)簽沒(méi)有添加,若在錄音結(jié)束后再添加,則需要用戶再次查找到錄音的時(shí)間點(diǎn)進(jìn)行標(biāo)簽的添加,浪費(fèi)了用戶的精力。并且,當(dāng)用戶感覺(jué)一段錄音需要標(biāo)記時(shí),使用標(biāo)簽功能手動(dòng)給錄音打上標(biāo)簽,而在打標(biāo)簽的過(guò)程中,用戶一心二用、注意力分散,可能會(huì)錯(cuò)過(guò)重要的談話內(nèi)容,影響用戶的使用體驗(yàn)。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的主要目的在于提供一種音頻管理裝置和方法,旨在解決語(yǔ)音標(biāo)簽的添加不智能的技術(shù)問(wèn)題。
[0006]為實(shí)現(xiàn)上述目的,本發(fā)明提供一種音頻管理裝置,所述音頻管理裝置包括:
[0007]語(yǔ)音識(shí)別模塊,用于對(duì)音頻文件進(jìn)行語(yǔ)音識(shí)別,獲取所述音頻文件對(duì)應(yīng)的文本,以及所述音頻文件與所述文本的時(shí)間關(guān)聯(lián)信息;
[0008]信息提取模塊,用于根據(jù)預(yù)先配置的識(shí)別模型,提取所述文本的標(biāo)注信息;
[0009]標(biāo)簽獲取模塊,用于根據(jù)所述文本的標(biāo)注信息,以及所述音頻文件與所述文本的時(shí)間關(guān)聯(lián)信息,獲取所述音頻文件的標(biāo)簽。
[0010]在一個(gè)實(shí)施例中,所述信息提取模塊包括:
[0011 ]信息提取單元,用于根據(jù)預(yù)先配置的識(shí)別模型,分別提取所述文本中各句文字信息對(duì)應(yīng)的標(biāo)注信息;
[0012]去重單元,用于對(duì)所述文字信息的標(biāo)注信息進(jìn)行去重處理;
[0013]整合單元,用于獲取去重處理后的標(biāo)注信息為所述文本的標(biāo)注信息。
[0014]在一個(gè)實(shí)施例中,所述音頻管理裝置還包括:
[0015]關(guān)聯(lián)模塊,用于建立所述標(biāo)簽和音頻文件的關(guān)聯(lián)關(guān)系,將所述標(biāo)簽鏈接到所述音頻文件對(duì)應(yīng)的時(shí)間段或時(shí)間點(diǎn)。
[0016]在一個(gè)實(shí)施例中,所述音頻管理裝置還包括:
[0017]模型配置模塊,用于根據(jù)預(yù)先配置的訓(xùn)練語(yǔ)料和特征模板,訓(xùn)練得到所述識(shí)別模型。
[0018]在一個(gè)實(shí)施例中,所述模型配置模塊包括:
[0019]預(yù)處理單元,用于對(duì)預(yù)先配置的訓(xùn)練語(yǔ)料進(jìn)行預(yù)處理,獲取所述訓(xùn)練語(yǔ)料正確的標(biāo)注信息;
[0020]配置單元,用于根據(jù)預(yù)先配置的特征模板和所述正確的標(biāo)注信息,對(duì)所述預(yù)處理后的訓(xùn)練語(yǔ)料進(jìn)行特征提取訓(xùn)練,得到模型參數(shù),建立識(shí)別模型。
[0021]此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種音頻管理方法,所述音頻管理方法包括以下步驟:
[0022]對(duì)音頻文件進(jìn)行語(yǔ)音識(shí)別,獲取所述音頻文件對(duì)應(yīng)的文本,以及所述音頻文件與所述文本的時(shí)間關(guān)聯(lián)信息;
[0023]根據(jù)預(yù)先配置的識(shí)別模型,提取所述文本的標(biāo)注信息;
[0024]根據(jù)所述文本的標(biāo)注信息,以及所述音頻文件與所述文本的時(shí)間關(guān)聯(lián)信息,獲取所述音頻文件的標(biāo)簽。
[0025]在一個(gè)實(shí)施例中,所述根據(jù)預(yù)先配置的識(shí)別模型,提取所述文本的標(biāo)注信息的步驟包括:
[0026]根據(jù)預(yù)先配置的識(shí)別模型,分別提取所述文本中各句文字信息對(duì)應(yīng)的標(biāo)注信息;
[0027]對(duì)所述文字信息的標(biāo)注信息進(jìn)行去重處理;
[0028]獲取去重處理后的標(biāo)注信息為所述文本的標(biāo)注信息。
[0029]在一個(gè)實(shí)施例中,所述根據(jù)所述文本的標(biāo)注信息,以及所述音頻文件與所述文本的時(shí)間關(guān)聯(lián)信息,獲取所述音頻文件的標(biāo)簽的步驟之后,還包括:
[0030]建立所述標(biāo)簽和音頻文件的關(guān)聯(lián)關(guān)系,將所述標(biāo)簽鏈接到所述音頻文件對(duì)應(yīng)的時(shí)間段或時(shí)間點(diǎn)。
[0031]在一個(gè)實(shí)施例中,所述對(duì)音頻文件進(jìn)行語(yǔ)音識(shí)別,獲取所述音頻文件對(duì)應(yīng)的文本,以及所述音頻文件與所述文本的時(shí)間關(guān)聯(lián)信息的步驟之前,還包括:
[0032]根據(jù)預(yù)先配置的訓(xùn)練語(yǔ)料和特征模板,訓(xùn)練得到所述識(shí)別模型。
[0033]在一個(gè)實(shí)施例中,所述根據(jù)預(yù)先配置的訓(xùn)練語(yǔ)料和特征模板,訓(xùn)練得到所述識(shí)別模型的步驟包括:
[0034]對(duì)預(yù)先配置的訓(xùn)練語(yǔ)料進(jìn)行預(yù)處理,獲取所述訓(xùn)練語(yǔ)料正確的標(biāo)注信息;
[0035]根據(jù)預(yù)先配置的特征模板和所述正確的標(biāo)注信息,對(duì)所述預(yù)處理后的訓(xùn)練語(yǔ)料進(jìn)行特征提取訓(xùn)練,得到模型參數(shù),建立識(shí)別模型。
[0036]本發(fā)明提出的一種音頻管理裝置和方法,通過(guò)語(yǔ)音識(shí)別模塊對(duì)音頻文件進(jìn)行語(yǔ)音識(shí)別,獲取音頻文件對(duì)應(yīng)的文本,以及音頻文件與文本的時(shí)間關(guān)聯(lián)信息;然后,信息提取模塊根據(jù)預(yù)先配置的識(shí)別模型,提取文本的標(biāo)注信息;然后,標(biāo)簽獲取模塊根據(jù)文本的標(biāo)注信息,以及音頻文件與文本的時(shí)間關(guān)聯(lián)信息,獲取音頻文件的標(biāo)簽。本發(fā)明通過(guò)對(duì)音頻文件進(jìn)行語(yǔ)音識(shí)別得到對(duì)應(yīng)的文本,從而根據(jù)提取文本的標(biāo)注信息,用于添加音頻文件的標(biāo)簽;獲取音頻文件與文本的時(shí)間關(guān)聯(lián)信息,從而將得到的標(biāo)簽添加到音頻文件對(duì)應(yīng)的時(shí)間段或時(shí)間點(diǎn),保證了音頻文件標(biāo)簽位置的準(zhǔn)確性。由此,本發(fā)明實(shí)現(xiàn)了自動(dòng)識(shí)別、智能添加音頻文件的標(biāo)簽,無(wú)需用戶手動(dòng)對(duì)音頻文件進(jìn)行標(biāo)簽的添加和編輯,提升了用戶體驗(yàn)。
【附圖說(shuō)明】
[0037]圖1為實(shí)現(xiàn)本發(fā)明各個(gè)實(shí)施例一個(gè)可選的移動(dòng)終端的硬件結(jié)構(gòu)示意圖;
[0038]圖2為如圖1所示的移動(dòng)終端的無(wú)線通信系統(tǒng)示意圖;
[0039]圖3為本發(fā)明音頻管理裝置第一實(shí)施例的功能模塊示意圖;
[0040]圖4為本發(fā)明音頻管理裝置第二實(shí)施例的功能模塊示意圖;
[0041 ]圖5為本發(fā)明音頻管理裝置第三實(shí)施例的功能模塊示意圖;
[0042]圖6為本發(fā)明音頻管理裝置第四實(shí)施例的功能模塊示意圖;
[0043]圖7為本發(fā)明音頻管理裝置第五實(shí)施例的功能模塊示意圖;
[0044]圖8為本發(fā)明音頻管理方法第一實(shí)施例的流程示意圖;
[0045]圖9為本發(fā)明音頻管理方法第二實(shí)施例的流程示意圖;
[0046]圖10為本發(fā)明音頻管理方法第三實(shí)施例的流程示意圖;
[0047]圖11為本發(fā)明音頻管理方法第四實(shí)施例的流程示意圖;
[0048]圖12為本發(fā)明音頻管理方法第五實(shí)施例的流程示意圖;
[0049]圖13為本發(fā)明實(shí)施例中一種音頻文件標(biāo)簽示意圖;
[0050]圖14為本發(fā)明實(shí)施例中一種音頻文件標(biāo)簽示意圖;
[0051]圖15為本發(fā)明實(shí)施例中一種訓(xùn)練提取評(píng)價(jià)對(duì)象的識(shí)別模型應(yīng)用場(chǎng)景示意圖。
[0052]本發(fā)明目的的實(shí)現(xiàn)、功能特點(diǎn)及優(yōu)點(diǎn)將結(jié)合實(shí)施例,參照附圖做進(jìn)一步說(shuō)明。
【具體實(shí)施方式】
[0053]應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0054]現(xiàn)在將參考附圖描述實(shí)現(xiàn)本發(fā)明各個(gè)實(shí)施例的移動(dòng)終端。在后續(xù)的描述中,使用用于表示元件的諸如“模塊”、“部件”或“單元”的后綴僅為了有利于本發(fā)明的說(shuō)明,其本身并沒(méi)有特定的意義。因此,"模塊"與"部件"可以混合地使用。
[0055]移動(dòng)終端可以以各種形式來(lái)實(shí)施。例如,本發(fā)明中描述的終端可以包括諸如移動(dòng)電話、智能電話、錄音筆、筆記本電腦、數(shù)字廣播接收器、PDA(個(gè)人數(shù)字助理)、PAD(平板電腦)、PMP(便攜式多媒體播放器)、導(dǎo)航裝置等等的移動(dòng)終端以及諸如數(shù)字TV、臺(tái)式計(jì)算機(jī)等等的固定終端。下面,假設(shè)終端是移動(dòng)終端。然而,本領(lǐng)域技術(shù)人員將理解的是,除了特別用于移動(dòng)目的的元件之外,根據(jù)本發(fā)明的實(shí)施方式的構(gòu)造也能夠應(yīng)用于固定類型的終端。
[0056]圖1為實(shí)現(xiàn)本發(fā)明各個(gè)實(shí)施例的一個(gè)可選的移動(dòng)終端硬件結(jié)構(gòu)示意。
[0057]移動(dòng)終端100可以包括A/V(音頻/視頻)輸入單元110、用戶輸入單元120、輸出單元130、存儲(chǔ)器140、控制器150和電源單元160等等。圖1示出了具有各種組件的移動(dòng)終端,但是應(yīng)理解的是,并不要求實(shí)施所有示出的組件。可以替代地實(shí)施更多或更少的組件。將在下面詳細(xì)描述移動(dòng)終端的元件。
[0058]A/V輸入單元110用于接收音頻或視頻信號(hào)。A/V輸入單元110可以包括麥克風(fēng)111,麥克風(fēng)111可以在電話通話模式、記錄模式、語(yǔ)音識(shí)別模式等等運(yùn)行模式中經(jīng)由麥克風(fēng)接收聲音(音頻數(shù)據(jù)),并且能夠?qū)⑦@樣的聲音處理為音頻數(shù)據(jù)。處理后的音頻(語(yǔ)音)數(shù)據(jù)可以在電話通話模式的情況下轉(zhuǎn)換為可經(jīng)由移動(dòng)通信模塊112發(fā)送到移動(dòng)通信基站的格式輸出。麥克風(fēng)111可以實(shí)施各種類型的噪聲消除(或抑制)算法以消除(或抑制)在接收和發(fā)送音頻信號(hào)的過(guò)程中產(chǎn)生的噪聲或者干擾。
[0059]用戶輸入單元120可以根據(jù)用戶輸入的命令生成鍵輸入數(shù)據(jù)以控制移動(dòng)終端的各種操作。用戶輸入單元120允許用戶輸入各種類型的信息,并且可以包括鍵盤、鍋?zhàn)衅?、觸摸板(例如,檢測(cè)由于被接觸而導(dǎo)致的電阻、壓力、電容等等的變化的觸敏組件)、滾輪、搖桿等等。特別地,當(dāng)觸摸板以層的形式疊加在顯示單元131上時(shí),可以形成觸摸屏。
[0060]輸出單元130可以包括顯示單元131、音頻輸出模塊132等等。
[0061 ] 顯示單元131可以顯示在移動(dòng)終端100中處理的信息。例如,當(dāng)移動(dòng)終端100處于電話通話模式時(shí),顯示單元131可以顯示與通話或其它通信(例如,文本消息收發(fā)、多媒體文件下載等等)相關(guān)的用戶界面(UI)或圖形用戶界面(GUI)。當(dāng)移動(dòng)終端100處于視頻通話模式或者圖像捕獲模式時(shí),顯示單元131可以顯示捕獲的圖像和/或接收的圖像、示出視頻或圖像以及相關(guān)功能的UI或GUI等等。
[0062]同時(shí),當(dāng)顯示單元131和觸摸板以層的形式彼此疊加以形成觸摸屏?xí)r,顯示單元131可以用作輸入裝置和輸出裝置。顯示單元131可以包括液晶顯示器(LCD)、薄膜晶體管IXD(TFT-1XD)、有機(jī)發(fā)光二極管(OLED)顯示器、柔性顯示器、三維(3D)顯示器等等中的至少一種。這些顯示器中的一些可以被構(gòu)造為透明狀以允許用戶從外部觀看,這可以稱為透明顯示器,典型的透明顯示器可以例如為TOLED(透明有機(jī)發(fā)光二極管)顯示器等等。根據(jù)特定想要的實(shí)施方式,移動(dòng)終端100可以包括兩個(gè)或更多顯示單元(或其它顯示裝置),例如,移動(dòng)終端可以包括外部顯示單元(未示出)和內(nèi)部顯示單元(未示出)。觸摸屏可用于檢測(cè)觸摸輸入壓力以及觸摸輸入位置和觸摸輸入面積。
[0063]音頻輸出模塊132可以在移動(dòng)終端處于呼叫信號(hào)接收模式、通話模式、記錄模式、語(yǔ)音識(shí)別模式、廣播接收模式等等模式下時(shí),將無(wú)線通信單元110接收的或者在存儲(chǔ)器140中存儲(chǔ)的音頻數(shù)據(jù)轉(zhuǎn)換音頻信號(hào)并且輸出為聲音。而且,音頻輸出模塊132可以提供與移動(dòng)終端100執(zhí)行的特定功能相關(guān)的音頻輸出(例如,呼叫信號(hào)接收聲音、消息接收聲音等等)。音頻輸出模塊132可以包括揚(yáng)聲器、蜂鳴器等等。
[0064]存儲(chǔ)器140可以存儲(chǔ)由控制器150執(zhí)行的處理和控制操作的軟件程序等等,或者可以暫時(shí)地存儲(chǔ)己經(jīng)輸出或?qū)⒁敵龅臄?shù)據(jù)(例如,電話簿、消息、靜態(tài)圖像、視頻等等)。而且,存儲(chǔ)器140可以存儲(chǔ)關(guān)于當(dāng)觸摸施加到觸摸屏?xí)r輸出的各種方式的振動(dòng)和音頻信號(hào)的數(shù)據(jù)。
[0065]存儲(chǔ)器140可以包括至少一種類型的存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)包括閃存、硬盤、多媒體卡、卡型存儲(chǔ)器(例如,SD或DX存儲(chǔ)器等等)、隨機(jī)訪問(wèn)存儲(chǔ)器(RAM)、靜態(tài)隨機(jī)訪問(wèn)存儲(chǔ)器(SRAM)、只讀存儲(chǔ)器(R0M)、電可擦除可編程只讀存儲(chǔ)器(EEPROM)、可編程只讀存儲(chǔ)器(PROM)、磁性存儲(chǔ)器、磁盤、光盤等等。而且,移動(dòng)終端100可以與通過(guò)網(wǎng)絡(luò)連接執(zhí)行存儲(chǔ)器140的存儲(chǔ)功能的網(wǎng)絡(luò)存儲(chǔ)裝置協(xié)作。
[0066]控制器150通??刂埔苿?dòng)終端的總體操作。例如,控制器150執(zhí)行與語(yǔ)音通話、數(shù)據(jù)通信、視頻通話等等相關(guān)的控制和處理。控制器150可以執(zhí)行模式識(shí)別處理,以將在觸摸屏上執(zhí)行的手寫輸入或者圖片繪制輸入識(shí)別為字符或圖像。
[0067]電源單元160在控制器150的控制下接收外部電力或內(nèi)部電力并且提供操作各元件和組件所需的適當(dāng)?shù)碾娏Α?br>[0068]這里描述的各種實(shí)施方式可以以使用例如計(jì)算機(jī)軟件、硬件或其任何組合的計(jì)算機(jī)可讀介質(zhì)來(lái)實(shí)施。對(duì)于硬件實(shí)施,這里描述的實(shí)施方式可以通過(guò)使用特定用途集成電路(ASIC)、數(shù)字信號(hào)處理器(DSP)、數(shù)字信號(hào)處理裝置(DSPD)、可編程邏輯裝置(PLD)、現(xiàn)場(chǎng)可編程門陣列(FPGA)、處理器、控制器、微控制器、微處理器、被設(shè)計(jì)為執(zhí)行這里描述的功能的電子單元中的至少一種來(lái)實(shí)施,在一些情況下,這樣的實(shí)施方式可以在控制器150中實(shí)施。對(duì)于軟件實(shí)施,諸如過(guò)程或功能的實(shí)施方式可以與允許執(zhí)行至少一種功能或操作的單獨(dú)的軟件模塊來(lái)實(shí)施。軟件代碼可以由以任何適當(dāng)?shù)木幊陶Z(yǔ)言編寫的軟件應(yīng)用程序(或程序)來(lái)實(shí)施,軟件代碼可以存儲(chǔ)在存儲(chǔ)器140中并且由控制器150執(zhí)行。
[0069]至此,己經(jīng)按照其功能描述了移動(dòng)終端。下面,為了簡(jiǎn)要起見(jiàn),將描述諸如折疊型、直板型、擺動(dòng)型、滑動(dòng)型移動(dòng)終端等等的各種類型的移動(dòng)終端中的滑動(dòng)型移動(dòng)終端作為示例。因此,本發(fā)明能夠應(yīng)用于任何類型的移動(dòng)終端,并且不限于滑動(dòng)型移動(dòng)終端。
[0070]如圖1中所示的移動(dòng)終端100可以被構(gòu)造為利用經(jīng)由幀或分組發(fā)送數(shù)據(jù)的諸如有線和無(wú)線通信系統(tǒng)以及基于衛(wèi)星的通信系統(tǒng)來(lái)操作。
[0071]現(xiàn)在將參考圖2描述其中根據(jù)本發(fā)明的移動(dòng)終端能夠操作的通信系統(tǒng)。
[0072]這樣的通信系統(tǒng)可以使用不同的空中接口和/或物理層。例如,由通信系統(tǒng)使用的空中接口包括例如頻分多址(FDMA)、時(shí)分多址(TDMA)、碼分多址(CDMA)和通用移動(dòng)通信系統(tǒng)(UMTS)(特別地,長(zhǎng)期演進(jìn)(LTE))、全球移動(dòng)通信系統(tǒng)(GSM)等等。作為非限制性示例,下面的描述涉及CDMA通信系統(tǒng),但是這樣的教導(dǎo)同樣適用于其它類型的系統(tǒng)。
[0073]參考圖2,⑶MA無(wú)線通信系統(tǒng)可以包括多個(gè)移動(dòng)終端100、多個(gè)基站(BS)270、基站控制器(BSC)275和移動(dòng)交換中心(MSCUSOJSCSSO被構(gòu)造為與公共電話交換網(wǎng)絡(luò)(PSTN)290形成接口。MSC280還被構(gòu)造為與可以經(jīng)由回程線路耦接到基站270的BSC275形成接口?;爻叹€路可以根據(jù)若干己知的接口中的任一種來(lái)構(gòu)造,所述接口包括例如E1/T1、ATM,IP、PPP、幀中繼、HDSL、ADSL或xDSL。將理解的是,如圖2中所示的系統(tǒng)可以包括多個(gè)BSC275。
[0074]每個(gè)BS270可以服務(wù)一個(gè)或多個(gè)分區(qū)(或區(qū)域),由多向天線或指向特定方向的天線覆蓋的每個(gè)分區(qū)放射狀地遠(yuǎn)離BS270?;蛘?,每個(gè)分區(qū)可以由用于分集接收的兩個(gè)或更多天線覆蓋。每個(gè)BS270可以被構(gòu)造為支持多個(gè)頻率分配,并且每個(gè)頻率分配具有特定頻譜(例如,1.25MHz,5MHz 等等)。
[0075]分區(qū)與頻率分配的交叉可以被稱為CDMA信道。BS270也可以被稱為基站收發(fā)器子系統(tǒng)(BTS)或者其它等效術(shù)語(yǔ)。在這樣的情況下,術(shù)語(yǔ)"基站"可以用于籠統(tǒng)地表示單個(gè)BSC275和至少一個(gè)BS270?;疽部梢员环Q為〃蜂窩站〃?;蛘撸囟˙S270的各分區(qū)可以被稱為多個(gè)蜂窩站。
[0076]如圖2中所示,廣播發(fā)射器(BT)295將廣播信號(hào)發(fā)送給在系統(tǒng)內(nèi)操作的移動(dòng)終端100。在圖2中,示出了幾個(gè)全球定位系統(tǒng)(GPS)衛(wèi)星300。衛(wèi)星300幫助定位多個(gè)移動(dòng)終端100中的至少一個(gè)。
[0077]在圖2中,描繪了多個(gè)衛(wèi)星300,但是需要理解的是,可以利用任何數(shù)目的衛(wèi)星獲得有用的定位信息。替代GPS跟蹤技術(shù)或者在GPS跟蹤技術(shù)之外,可以使用可以跟蹤移動(dòng)終端的位置的其它技術(shù)。另外,至少一個(gè)GPS衛(wèi)星300可以選擇性地或者額外地處理衛(wèi)星DMB傳輸。
[0078]作為無(wú)線通信系統(tǒng)的一個(gè)典型操作,BS270接收來(lái)自各種移動(dòng)終端100的反向鏈路信號(hào)。移動(dòng)終端100通常參與通話、消息收發(fā)和其它類型的通信。特定基站270接收的每個(gè)反向鏈路信號(hào)被在特定BS270內(nèi)進(jìn)行處理。獲得的數(shù)據(jù)被轉(zhuǎn)發(fā)給相關(guān)的BSC275 ASC提供通話資源分配和包括BS270之間的軟切換過(guò)程的協(xié)調(diào)的移動(dòng)管理功能。BSC275還將接收到的數(shù)據(jù)路由到MSC280,其提供用于與PSTN290形成接口的額外的路由服務(wù)。類似地,PSTN290與MSC280形成接口,MSC與BSC275形成接口,并且BSC275相應(yīng)地控制BS270以將正向鏈路信號(hào)發(fā)送到移動(dòng)終端100。
[0079]基于上述移動(dòng)終端硬件結(jié)構(gòu)以及通信系統(tǒng),提出本發(fā)明各個(gè)實(shí)施例。
[0080]參照?qǐng)D3,本發(fā)明音頻管理裝置第一實(shí)施例提供一種音頻管理裝置,所述音頻管理裝置包括:
[0081]語(yǔ)音識(shí)別模塊10,用于對(duì)音頻文件進(jìn)行語(yǔ)音識(shí)別,獲取所述音頻文件對(duì)應(yīng)的文本,以及所述音頻文件與所述文本的時(shí)間關(guān)聯(lián)信息。
[0082]本發(fā)明通過(guò)對(duì)音頻文件進(jìn)行標(biāo)注信息的提取,實(shí)現(xiàn)了對(duì)音頻文件自動(dòng)添加標(biāo)簽,減少了很多人工干預(yù),使語(yǔ)音標(biāo)簽的管理更加智能化、自動(dòng)化,大大的提升了用戶體驗(yàn)。
[0083]音頻管理裝置可部署于移動(dòng)終端中、服務(wù)器中等,進(jìn)行錄音等各類音頻文件的音頻管理,本實(shí)施例以移動(dòng)終端錄音得到的錄音文件作為音頻文件進(jìn)行舉例說(shuō)明。
[0084]具體的,作為一種實(shí)施方式,首先,語(yǔ)音識(shí)別模塊10對(duì)音頻文件進(jìn)行語(yǔ)音識(shí)別,也即將音頻文件中的語(yǔ)音信息轉(zhuǎn)換為文字信息,得到的文本即為音頻文件對(duì)應(yīng)的文本。
[0085]需要說(shuō)明的是,在語(yǔ)音識(shí)別的過(guò)程中,可以將音頻文件中的語(yǔ)音信息以句為單位進(jìn)行劃分,由于音頻文件包括一句或多句語(yǔ)音信息,則識(shí)別得到的文本包括一句或多句對(duì)應(yīng)的文字信息。還可以將音頻文件中的語(yǔ)音信息以預(yù)設(shè)長(zhǎng)度的時(shí)間段為單位進(jìn)行劃分,由于音頻文件包括一段或多段語(yǔ)音信息,則識(shí)別得到的文本包括一段或多段對(duì)應(yīng)的文字信息。
[0086]在根據(jù)預(yù)設(shè)的單位對(duì)語(yǔ)音信息進(jìn)行分節(jié)后,語(yǔ)音識(shí)別模塊10記錄每節(jié)語(yǔ)音信息在音頻文件中的時(shí)間起始點(diǎn)和終止點(diǎn),得到每節(jié)語(yǔ)音信息的時(shí)間信息,也即將音頻文件以小節(jié)為單位,劃分成不同的時(shí)間段。
[0087]同時(shí),在語(yǔ)音識(shí)別的過(guò)程中,保存音頻文件中每節(jié)語(yǔ)音信息與識(shí)別得到的對(duì)應(yīng)的文字信息的關(guān)聯(lián)信息,也即得到每節(jié)語(yǔ)音信息與每節(jié)文字信息的對(duì)應(yīng)關(guān)系。
[0088]然后,語(yǔ)音識(shí)別模塊10根據(jù)每節(jié)語(yǔ)音信息的時(shí)間信息,和每節(jié)語(yǔ)音信息與每節(jié)文字信息的對(duì)應(yīng)關(guān)系,以音頻文件的時(shí)間軸為基礎(chǔ),建立音頻文件各時(shí)間段與文本中每節(jié)文字信息的關(guān)聯(lián)關(guān)系,音頻文件各時(shí)間段均有對(duì)應(yīng)的文本信息,并且同一時(shí)間段中的各時(shí)間點(diǎn)對(duì)應(yīng)的文本信息,與該時(shí)間段對(duì)應(yīng)的文本信息相同。
[0089]由此,語(yǔ)音識(shí)別模塊10得到音頻文件與文本的時(shí)間關(guān)聯(lián)關(guān)系。
[0090]根據(jù)音頻文件與文本的時(shí)間關(guān)聯(lián)關(guān)系,可以得到音頻文件中的各時(shí)間點(diǎn)或時(shí)間段對(duì)應(yīng)的文本信息。
[0091 ]信息提取模塊20,用于根據(jù)預(yù)先配置的識(shí)別模型,提取所述文本的標(biāo)注信息。
[0092]在得到音頻文件對(duì)應(yīng)的文本,以及音頻文件與文本的時(shí)間關(guān)聯(lián)關(guān)系后,信息提取模塊20根據(jù)預(yù)先配置的識(shí)別模型,提取文本的標(biāo)注信息。
[0093]作為一種實(shí)施方式,信息提取模塊20預(yù)先配置有識(shí)別模型,用于提取文本的目標(biāo)特征信息,對(duì)文本進(jìn)行標(biāo)注。
[0094]具體的,信息提取模塊20將文本信息中的各節(jié)文字信息作為語(yǔ)料,輸入識(shí)別模型,識(shí)別提取文本中每節(jié)文字信息的目標(biāo)特征信息作為標(biāo)注信息。
[0095]需要說(shuō)明的是,信息提取模塊20提取的目標(biāo)特征信息為預(yù)設(shè)類型的特征信息,例如提取文本中的評(píng)價(jià)對(duì)象作為目標(biāo)特征信息,提取文本中的情感評(píng)價(jià)作為目標(biāo)特征信息。
[0096]本實(shí)施例中,以目標(biāo)特征信息為評(píng)價(jià)對(duì)象,進(jìn)行舉例說(shuō)明。評(píng)價(jià)對(duì)象是一篇討論性文本中表現(xiàn)的主題。如在產(chǎn)品討論中關(guān)于一款手機(jī)屏幕、電池、按鍵、應(yīng)用軟件等的討論,在一部電影中關(guān)于導(dǎo)演、演員、制片人的討論。因此評(píng)價(jià)對(duì)象的抽取蘊(yùn)含著極大地商業(yè)價(jià)值。如:
[0097]這款手機(jī)的屏幕分辨率很低,有點(diǎn)失望。
[0098]在這個(gè)例句中,可以看出它討論的主題是屏幕分辨率,因此這句話的評(píng)價(jià)對(duì)象就是“屏幕分辨率”。
[0099]信息提取模塊20在提取得到每節(jié)文字信息的評(píng)價(jià)對(duì)象后,將評(píng)價(jià)對(duì)象作為目標(biāo)特征信息,對(duì)對(duì)應(yīng)的文字信息進(jìn)行標(biāo)注。
[0100]例如文字信息“這款手機(jī)的屏幕分辨率很低,有點(diǎn)失望”的目標(biāo)特征信息即為“屏幕分辨率”,標(biāo)注的信息也即“屏幕分辨率”。
[0101]由此,信息提取模塊20得到文本中每節(jié)文字信息的目標(biāo)特征信息,也即得到文本的標(biāo)注信息。
[0102]標(biāo)簽獲取模塊30,用于根據(jù)所述文本的標(biāo)注信息,以及所述音頻文件與所述文本的時(shí)間關(guān)聯(lián)信息,獲取所述音頻文件的標(biāo)簽。
[0103]在得到文本的標(biāo)注信息后,標(biāo)簽獲取模塊30根據(jù)文本的標(biāo)注信息,以及音頻文件與文本的時(shí)間關(guān)聯(lián)信息,獲取音頻文件的標(biāo)簽。
[0104]具體的,作為一種實(shí)施方式,標(biāo)簽獲取模塊30根據(jù)文本與音頻文件的時(shí)間關(guān)聯(lián)關(guān)系,將文本中每節(jié)文字信息的標(biāo)注信息作為標(biāo)簽,標(biāo)注到音頻文件對(duì)應(yīng)的時(shí)間段,保持音頻文件各時(shí)間段的語(yǔ)音信息的標(biāo)簽與對(duì)應(yīng)的文字信息的標(biāo)注信息一致。
[0105]由此,標(biāo)簽獲取模塊30得到音頻文件各時(shí)間段的標(biāo)簽,音頻文件同一時(shí)間段中各時(shí)間點(diǎn)的標(biāo)簽與該時(shí)間段相同。
[0106]需要說(shuō)明的是,用戶可根據(jù)需要對(duì)獲取的音頻文件標(biāo)簽進(jìn)行編輯、保存、刪除等操作。
[0107]然后,標(biāo)簽獲取模塊30可以根據(jù)音頻文件的各標(biāo)簽與對(duì)應(yīng)的時(shí)間段信息建立標(biāo)簽列表,參照?qǐng)D13,供用戶根據(jù)標(biāo)簽列表了解當(dāng)前音頻文件各時(shí)間段的評(píng)價(jià)對(duì)象。
[0108]參照?qǐng)D14,標(biāo)簽獲取模塊30在播放當(dāng)前音頻文件的過(guò)程中,可將標(biāo)簽顯示在音頻文件的時(shí)間軸或播放進(jìn)度條附近,供用戶根據(jù)各標(biāo)簽了解當(dāng)前音頻文件各時(shí)間段的評(píng)價(jià)對(duì)象。
[0109]在本實(shí)施例中,通過(guò)語(yǔ)音識(shí)別模塊10對(duì)音頻文件進(jìn)行語(yǔ)音識(shí)別,獲取音頻文件對(duì)應(yīng)的文本,以及音頻文件與文本的時(shí)間關(guān)聯(lián)信息;然后,信息提取模塊20根據(jù)預(yù)先配置的識(shí)別模型,提取文本的標(biāo)注信息;然后,標(biāo)簽獲取模塊30根據(jù)文本的標(biāo)注信息,以及音頻文件與文本的時(shí)間關(guān)聯(lián)信息,獲取音頻文件的標(biāo)簽。本實(shí)施例通過(guò)對(duì)音頻文件進(jìn)行語(yǔ)音識(shí)別得到對(duì)應(yīng)的文本,從而根據(jù)提取文本的標(biāo)注信息,用于添加音頻文件的標(biāo)簽;獲取音頻文件與文本的時(shí)間關(guān)聯(lián)信息,從而將得到的標(biāo)簽添加到音頻文件對(duì)應(yīng)的時(shí)間段或時(shí)間點(diǎn),保證了音頻文件標(biāo)簽位置的準(zhǔn)確性。由此,本實(shí)施例實(shí)現(xiàn)了自動(dòng)識(shí)別、智能添加音頻文件的標(biāo)簽,無(wú)需用戶手動(dòng)對(duì)音頻文件進(jìn)行標(biāo)簽的添加和編輯,提升了用戶體驗(yàn)。
[0110]進(jìn)一步的,參照?qǐng)D4,本發(fā)明音頻管理裝置第二實(shí)施例提供一種音頻管理裝置,基于上述圖3所示的實(shí)施例,所述信息提取模塊20包括:
[0111]信息提取單元21,用于根據(jù)預(yù)先配置的識(shí)別模型,分別提取所述文本中各句文字信息對(duì)應(yīng)的標(biāo)注信息。
[0112]在本發(fā)明音頻管理裝置第一實(shí)施例的基礎(chǔ)上,本實(shí)施例通過(guò)以句為單位提取標(biāo)注信息,更加符合語(yǔ)言結(jié)構(gòu),從而在對(duì)標(biāo)注信息進(jìn)行去重時(shí),能夠合理有效的去除重復(fù)的標(biāo)注信息,得到的文本標(biāo)注信息也更加準(zhǔn)確,符合音頻的語(yǔ)義。
[0113]具體的,以句為單位,對(duì)音頻文件中的語(yǔ)音信息進(jìn)行分節(jié)后,語(yǔ)音識(shí)別模塊10記錄每句語(yǔ)音信息在音頻文件中的時(shí)間起始點(diǎn)和終止點(diǎn),得到每句語(yǔ)音信息的時(shí)間信息,也即將音頻文件以句為單位,劃分成不同的時(shí)間段。
[0114]同時(shí),在語(yǔ)音識(shí)別的過(guò)程中,保存音頻文件中每句語(yǔ)音信息與識(shí)別得到的對(duì)應(yīng)的文字信息的關(guān)聯(lián)信息,也即得到每句語(yǔ)音信息與每句文字信息的對(duì)應(yīng)關(guān)系。
[0115]然后,語(yǔ)音識(shí)別模塊10根據(jù)每句語(yǔ)音信息的時(shí)間信息,和每句語(yǔ)音信息與每句文字信息的對(duì)應(yīng)關(guān)系,以音頻文件的時(shí)間軸為基礎(chǔ),建立音頻文件各時(shí)間段與文本中每句文字信息的關(guān)聯(lián)關(guān)系,音頻文件各時(shí)間段均有對(duì)應(yīng)的文本信息,并且同一時(shí)間段中的各時(shí)間點(diǎn)對(duì)應(yīng)的文本信息,與該時(shí)間段對(duì)應(yīng)的文本信息相同。
[0116]由此,得到的音頻文件與文本的時(shí)間關(guān)聯(lián)關(guān)系,包括音頻文件中各時(shí)間段或時(shí)間點(diǎn)與文本中文本信息的對(duì)應(yīng)關(guān)系。
[0117]然后,信息提取單元21將文本信息中的各句文字信息作為語(yǔ)料,輸入識(shí)別模型,識(shí)別提取文本中每句文字信息的目標(biāo)特征信息。
[0118]本實(shí)施例中,以目標(biāo)特征信息為評(píng)價(jià)對(duì)象,進(jìn)行舉例說(shuō)明。
[0119]信息提取單元21根據(jù)識(shí)別模型,提取得到文本中每句文字信息的評(píng)價(jià)對(duì)象,作為每句文字信息對(duì)應(yīng)的標(biāo)注信息。
[0120]去重單元22,用于對(duì)所述文字信息的標(biāo)注信息進(jìn)行去重處理。
[0121]在獲取文本中每句文字信息對(duì)應(yīng)的標(biāo)注信息后,去重單元22對(duì)文字信息的標(biāo)注信息進(jìn)行去重處理。
[0122]具體的,作為一種實(shí)施方式,若相鄰兩句文字信息的評(píng)價(jià)對(duì)象相同,標(biāo)注信息相同,則去重單元22合并此兩句文字信息,相應(yīng)的,合并對(duì)應(yīng)的標(biāo)注信息;
[0123]若相鄰兩句文字信息的評(píng)價(jià)對(duì)象不同,也即標(biāo)注信息不同,則去重單元22分別保存此相鄰兩句文字信息的標(biāo)注信息。
[0124]由此,去重單元22實(shí)現(xiàn)了對(duì)文字信息的標(biāo)注信息的去重處理。
[0125]整合單元23,用于獲取去重處理后的標(biāo)注信息為所述文本的標(biāo)注信息。
[0126]在完成對(duì)文字信息的標(biāo)注信息去重處理后,整合單元23獲取去重處理后的標(biāo)注信息為當(dāng)前文本的標(biāo)注信息。
[0127]然后,標(biāo)簽獲取模塊30根據(jù)去重處理后的每句文字信息與音頻文件的對(duì)應(yīng)管關(guān)系,將文本中每句文字信息的標(biāo)注信息作為標(biāo)簽,標(biāo)注到音頻文件中對(duì)應(yīng)的時(shí)間段,保持音頻文件各時(shí)間段的語(yǔ)音信息的標(biāo)簽與對(duì)應(yīng)的文字信息的標(biāo)注信息一致。
[0128]由此,標(biāo)簽獲取模塊30得到音頻文件各時(shí)間段的標(biāo)簽,音頻文件同一時(shí)間段中各時(shí)間點(diǎn)的標(biāo)簽與該時(shí)間段相同。
[0129]例如,對(duì)于一個(gè)手機(jī)發(fā)布會(huì)的錄音文件,根據(jù)本實(shí)施例,首先語(yǔ)音識(shí)別模塊10將錄音文件轉(zhuǎn)化為文本,信息提取單元21分別對(duì)文本中的每句文字信息進(jìn)行標(biāo)注信息的提取,得到每句文字信息的評(píng)價(jià)對(duì)象。然后,去重單元22對(duì)文字信息的標(biāo)注信息進(jìn)行去重處理,合并評(píng)價(jià)對(duì)象相同的相鄰文字信息及對(duì)應(yīng)的標(biāo)注信息,整合單元23得到文本的標(biāo)注信息。
[0130]取錄音文件0-5分鐘對(duì)應(yīng)的文本信息的評(píng)價(jià)對(duì)象,也即標(biāo)注信息是“手機(jī)的屏幕”;5-10分鐘對(duì)應(yīng)的文本信息的評(píng)價(jià)對(duì)象,也即標(biāo)注信息是“手機(jī)的相機(jī)” ;10-15分鐘對(duì)應(yīng)的文本信息的評(píng)價(jià)對(duì)象,也即標(biāo)注信息是“手機(jī)的價(jià)格”。
[0131]然后,標(biāo)簽獲取模塊30根據(jù)文本的標(biāo)注信息,以及錄音文件與文本的時(shí)間關(guān)聯(lián)信息,獲取首頻文件的標(biāo)簽,則:
[0132]錄音文件0-5分鐘的標(biāo)簽是“手機(jī)的屏幕”;
[0133]錄音文件5-10分鐘的標(biāo)簽是是“手機(jī)的相機(jī)”;
[0134]錄音文件10-15分鐘的標(biāo)簽是是“手機(jī)的價(jià)格”。
[0135]錄音文件有了以上的標(biāo)簽,用戶便知道錄音文件每一段的主題是什么,如果是用戶感興趣的主題,那么用戶自然會(huì)重點(diǎn)關(guān)注。
[0136]在本實(shí)施例中,信息提取單元21根據(jù)預(yù)先配置的識(shí)別模型,分別提取文本中各句文字信息對(duì)應(yīng)的標(biāo)注信息;去重單元22對(duì)文字信息的標(biāo)注信息進(jìn)行去重處理;整合單元23獲取去重處理后的標(biāo)注信息為文本的標(biāo)注信息。本實(shí)施例以句為單位,分別對(duì)文本中的每句文字信息進(jìn)行標(biāo)注信息的提取,然后對(duì)文字信息的標(biāo)注信息進(jìn)行去重處理,有效的去除了文本中相鄰的重復(fù)標(biāo)注信息,也同時(shí)對(duì)應(yīng)去除了音頻文件中相鄰的重復(fù)標(biāo)簽,合并音頻文件中標(biāo)簽相同的相鄰時(shí)間段,降低了音頻文件的標(biāo)簽重復(fù)程度,使得音頻文件的標(biāo)簽更加簡(jiǎn)潔有序,提升了用戶體驗(yàn)。
[0137]進(jìn)一步的,參照?qǐng)D5,本發(fā)明音頻管理裝置第三實(shí)施例提供一種音頻管理裝置,基于上述圖3或圖4所示的實(shí)施例(本實(shí)施例以圖3為例),所述音頻管理裝置還包括:
[0138]關(guān)聯(lián)模塊40,用于建立所述標(biāo)簽和音頻文件的關(guān)聯(lián)關(guān)系,將所述標(biāo)簽鏈接到所述音頻文件對(duì)應(yīng)的時(shí)間段或時(shí)間點(diǎn)。
[0139]本實(shí)施例在獲取首頻文件的標(biāo)簽后,關(guān)聯(lián)t旲塊40建立標(biāo)簽和首頻文件的關(guān)聯(lián)關(guān)系,將標(biāo)簽鏈接到音頻文件對(duì)應(yīng)的時(shí)間段或時(shí)間點(diǎn)。在本發(fā)明音頻管理裝置第二實(shí)施例或第三實(shí)施例的基礎(chǔ)上,本實(shí)施例實(shí)現(xiàn)了通過(guò)標(biāo)簽即可連接到對(duì)應(yīng)的音頻文件時(shí)間點(diǎn)或時(shí)間段,進(jìn)行播放,使音頻文件中的標(biāo)簽更加具有實(shí)用意義,提升了用戶的體驗(yàn)。
[0140]具體的,作為一種實(shí)施方式,關(guān)聯(lián)模塊40根據(jù)文本與音頻文件的時(shí)間關(guān)聯(lián)關(guān)系,將文本中每節(jié)文字信息的標(biāo)注信息作為標(biāo)簽,標(biāo)注到音頻文件對(duì)應(yīng)的時(shí)間段后,建立標(biāo)簽與對(duì)應(yīng)的時(shí)間段的關(guān)聯(lián)關(guān)系,將各標(biāo)簽鏈接到對(duì)應(yīng)的時(shí)間段。
[0141]作為另一種實(shí)施方式,關(guān)聯(lián)模塊40還可以分別建立各標(biāo)簽與音頻文件對(duì)應(yīng)的時(shí)間段中任意時(shí)間點(diǎn)的關(guān)聯(lián)關(guān)系,將各標(biāo)簽鏈接到對(duì)應(yīng)的時(shí)間段中的任意時(shí)間點(diǎn)。
[0142]例如,將各標(biāo)簽鏈接到音頻文件對(duì)應(yīng)的時(shí)間段的起始時(shí)間點(diǎn)。
[0143]由此,根據(jù)各標(biāo)簽,可以鏈接到音頻文件中對(duì)應(yīng)的時(shí)間段,播放此時(shí)間段的音頻文件;或,
[0144]根據(jù)各標(biāo)簽鏈,可以鏈接到音頻文件對(duì)應(yīng)的時(shí)間點(diǎn),進(jìn)行音頻文件的播放。
[0145]需要說(shuō)明的是,在關(guān)聯(lián)模塊40建立音頻文件和標(biāo)簽的關(guān)聯(lián)關(guān)系后,用戶可根據(jù)需要調(diào)整音頻文件和標(biāo)簽的對(duì)應(yīng)關(guān)系,調(diào)整將標(biāo)簽對(duì)應(yīng)的時(shí)間點(diǎn)或時(shí)間段。
[0146]參照?qǐng)D13,用戶可以根據(jù)標(biāo)簽列表中的各標(biāo)簽,鏈接到音頻文件對(duì)應(yīng)的時(shí)間段進(jìn)行播放;或者,
[0147]參照?qǐng)D14,用戶可以根據(jù)音頻文件時(shí)間軸或播放進(jìn)度條附近的標(biāo)簽,跳轉(zhuǎn)到對(duì)應(yīng)的時(shí)間點(diǎn)進(jìn)行播放。當(dāng)用戶調(diào)整播放進(jìn)度條時(shí),關(guān)聯(lián)模塊40根據(jù)進(jìn)度條的時(shí)間點(diǎn),和標(biāo)簽與音頻文件的關(guān)聯(lián)關(guān)系,查找到當(dāng)前時(shí)間點(diǎn)對(duì)應(yīng)的標(biāo)簽,并顯示。
[0148]在本實(shí)施例中,在獲取音頻文件的標(biāo)簽后,關(guān)聯(lián)模塊40建立標(biāo)簽和音頻文件的關(guān)聯(lián)關(guān)系,將標(biāo)簽鏈接到音頻文件對(duì)應(yīng)的時(shí)間段或時(shí)間點(diǎn)。本實(shí)施例通過(guò)建立標(biāo)簽和音頻文件的關(guān)聯(lián)關(guān)系,將音頻文件的標(biāo)簽鏈接到音頻文件對(duì)應(yīng)的時(shí)間段或時(shí)間點(diǎn),實(shí)現(xiàn)了根據(jù)標(biāo)簽可以跳轉(zhuǎn)到音頻文件對(duì)應(yīng)的時(shí)間段或時(shí)間點(diǎn)進(jìn)行播放,還可以根據(jù)音頻文件的時(shí)間點(diǎn)獲取對(duì)應(yīng)的標(biāo)簽,豐富了音頻文件標(biāo)簽的功能,使用戶操作更加方便快捷,提升了用戶體驗(yàn)。
[0149]進(jìn)一步的,參照?qǐng)D6,本發(fā)明音頻管理裝置第四實(shí)施例提供一種音頻管理裝置,基于上述圖3、圖4或圖5所示的實(shí)施例(本實(shí)施例以圖5為例),所述音頻管理裝置還包括:
[0150]模型配置模塊50,用于根據(jù)預(yù)先配置的訓(xùn)練語(yǔ)料和特征模板,訓(xùn)練得到所述識(shí)別模型。
[0151]本實(shí)施例中,模型配置模塊50預(yù)先配置訓(xùn)練語(yǔ)料和特征模板,訓(xùn)練得到識(shí)別模型,用于文本標(biāo)注信息的獲取。在本發(fā)明音頻管理裝置第一實(shí)施例、第二實(shí)施例和第三實(shí)施例的基礎(chǔ)上,本實(shí)施例通過(guò)訓(xùn)練識(shí)別模型,能夠根據(jù)實(shí)際需要調(diào)整模型參數(shù),從而使得到的識(shí)別模型能夠更加準(zhǔn)確的提取出文本的標(biāo)注信息,提升了音頻文件標(biāo)簽的準(zhǔn)確率。
[0152]具體的,作為一種實(shí)施方式,模型配置模塊50預(yù)先配置預(yù)設(shè)數(shù)量的訓(xùn)練語(yǔ)料,訓(xùn)練語(yǔ)料也即用于訓(xùn)練的文本。模型配置模塊50去除訓(xùn)練語(yǔ)料中無(wú)明確評(píng)價(jià)對(duì)象的中性語(yǔ)料,得到可用訓(xùn)練語(yǔ)料。
[0153]然后,模型配置模塊50分別獲取各可用訓(xùn)練語(yǔ)料的評(píng)價(jià)對(duì)象,作為對(duì)應(yīng)的正確的標(biāo)注信息。
[0154]然后,模型配置模塊50使用預(yù)先配置的特征模板,提取各可用訓(xùn)練語(yǔ)料的評(píng)價(jià)對(duì)象作為標(biāo)注信息,訓(xùn)練預(yù)先配置的訓(xùn)練模型,得到識(shí)別模型。
[°?55] 需要說(shuō)明的是,預(yù)先配置的訓(xùn)練模型可以是SVM(Support Vector Machine,支持向量機(jī))模型、CRF(Condit1nal Random Field,條件隨機(jī)場(chǎng))模型等,可根據(jù)需要靈活設(shè)置。
[0156]模型配置模塊50訓(xùn)練得到的識(shí)別模型,可以用來(lái)提取文本的標(biāo)注信息。
[0157]在本實(shí)施例中,模型配置模塊50根據(jù)預(yù)先配置的訓(xùn)練語(yǔ)料和特征模板,訓(xùn)練得到識(shí)別模型。本實(shí)施例通過(guò)預(yù)先配置訓(xùn)練語(yǔ)料和特征模板,訓(xùn)練得到識(shí)別模型,使獲取的識(shí)別模型能夠更加準(zhǔn)確的提取文本的標(biāo)注信息,提高了文本標(biāo)注信息的提取正確率,也即提高了音頻文件標(biāo)簽的正確率,在實(shí)現(xiàn)標(biāo)簽自動(dòng)獲取的同時(shí)保障了標(biāo)簽的正確率,提升了用戶體驗(yàn)。
[0158]進(jìn)一步的,參照?qǐng)D7,本發(fā)明音頻管理裝置實(shí)施例第五實(shí)施例提供一種音頻管理裝置,基于上述圖6所示的實(shí)施例,所述模型配置模50塊包括:
[0159]預(yù)處理單元51,用于對(duì)預(yù)先配置的訓(xùn)練語(yǔ)料進(jìn)行預(yù)處理,獲取所述訓(xùn)練語(yǔ)料正確的標(biāo)注信息。
[0160]在本發(fā)明音頻管理裝置實(shí)施例第四實(shí)施例的基礎(chǔ)上,本實(shí)施例通過(guò)預(yù)先配置訓(xùn)練語(yǔ)料的正確標(biāo)注信息,在訓(xùn)練過(guò)程校正模型參數(shù),使得訓(xùn)練得到的識(shí)別模型能夠更加準(zhǔn)確的提取出符合用戶實(shí)際需求的標(biāo)注信息。
[0161 ]具體的,作為一種實(shí)施方式,首先,預(yù)處理單元51對(duì)訓(xùn)練語(yǔ)料進(jìn)行預(yù)處理,進(jìn)行訓(xùn)練語(yǔ)料的主觀性檢測(cè),去除無(wú)評(píng)價(jià)對(duì)象的中性語(yǔ)料,得到可用訓(xùn)練語(yǔ)料。
[0162]然后,預(yù)處理單元51對(duì)可用訓(xùn)練語(yǔ)料進(jìn)行詞性標(biāo)注、依存關(guān)系分析,分析可用訓(xùn)練語(yǔ)料的語(yǔ)句結(jié)構(gòu),對(duì)可用訓(xùn)練語(yǔ)料進(jìn)行分詞。
[0163]同時(shí),預(yù)處理單元51將各可用訓(xùn)練語(yǔ)料反饋給測(cè)試人員,獲取測(cè)試人員輸入的各訓(xùn)練語(yǔ)料的正確標(biāo)注信息。
[0164]配置單元52,用于根據(jù)預(yù)先配置的特征模板和所述正確的標(biāo)注信息,對(duì)所述預(yù)處理后的訓(xùn)練語(yǔ)料進(jìn)行特征提取訓(xùn)練,得到模型參數(shù),建立識(shí)別模型。
[0165]在對(duì)訓(xùn)練語(yǔ)料進(jìn)行預(yù)處理,獲取訓(xùn)練語(yǔ)料正確的標(biāo)注信息后,配置單元52根據(jù)預(yù)先配置的特征模板,對(duì)預(yù)處理后的訓(xùn)練語(yǔ)料進(jìn)行特征提取訓(xùn)練,得到參數(shù)模型,根據(jù)模型參數(shù),建立識(shí)別模型。
[0166]具體的,作為一種實(shí)施方式,預(yù)先配置的特征模板包括了多種語(yǔ)句結(jié)構(gòu)模板的特征,用于提取訓(xùn)練語(yǔ)料的特征。
[0167]配置單元52使用預(yù)先配置的特征模板和訓(xùn)練模型,對(duì)預(yù)處理后的可用訓(xùn)練語(yǔ)料進(jìn)行特征提取訓(xùn)練,根據(jù)可用訓(xùn)練語(yǔ)料的正確標(biāo)注信息對(duì)訓(xùn)練過(guò)程進(jìn)行校正。
[0168]由此,配置單元52得到訓(xùn)練模型的模型參數(shù),也即各特征的權(quán)重。
[0169]然后,配置單元52根據(jù)訓(xùn)練模型和模型參數(shù),建立得到識(shí)別模型。
[0170]參照?qǐng)D15,以訓(xùn)練提取評(píng)價(jià)對(duì)象的識(shí)別模型為應(yīng)用場(chǎng)景,進(jìn)行舉例說(shuō)明。
[0171]首先,配置一定數(shù)量的原始語(yǔ)料。原始語(yǔ)料的數(shù)量規(guī)模越大,訓(xùn)練得到的識(shí)別模型越準(zhǔn)確。
[0172]然后,將原始語(yǔ)料進(jìn)行預(yù)處理,包括主觀性檢測(cè)、詞性分析、依存關(guān)系分析等,得到可用訓(xùn)練語(yǔ)料,和可用訓(xùn)練語(yǔ)料的正確評(píng)價(jià)對(duì)象。
[0173]然后使用預(yù)先配置的特征模板和訓(xùn)練模型,對(duì)可用訓(xùn)練語(yǔ)料進(jìn)行特征提取的訓(xùn)練,在訓(xùn)練過(guò)程中,使用可用訓(xùn)練語(yǔ)料的正確評(píng)價(jià)對(duì)象進(jìn)行校正,得到最優(yōu)的模型參數(shù)。
[0174]然后,根據(jù)訓(xùn)練模型和模型參數(shù),建立識(shí)別模型。
[0175]然后,對(duì)識(shí)別模型進(jìn)行性能測(cè)試。輸入一定數(shù)量的測(cè)試語(yǔ)料進(jìn)行特征提取,得到測(cè)試語(yǔ)料的評(píng)價(jià)對(duì)象,也即標(biāo)注信息。由于已經(jīng)預(yù)先獲取測(cè)試語(yǔ)料的正確評(píng)價(jià)對(duì)象,則根據(jù)提取得到的測(cè)試語(yǔ)料的評(píng)價(jià)對(duì)象和預(yù)先配置的正確的評(píng)價(jià)對(duì)象,獲取當(dāng)前識(shí)別模型的識(shí)別正確率。
[0176]若當(dāng)前識(shí)別模型的識(shí)別正確率不能夠達(dá)到預(yù)期值,則可以通過(guò)增加特征模板的形式,從新訓(xùn)練識(shí)別模型,對(duì)識(shí)別模型進(jìn)行修正,提升識(shí)別模型的識(shí)別正確率。
[0177]由此,實(shí)現(xiàn)了識(shí)別模型的配置。
[0178]在本實(shí)施例中,預(yù)處理單元51對(duì)預(yù)先配置的訓(xùn)練語(yǔ)料進(jìn)行預(yù)處理,獲取訓(xùn)練語(yǔ)料正確的標(biāo)注信息;配置單元52根據(jù)預(yù)先配置的特征模板和訓(xùn)練語(yǔ)料正確的標(biāo)注信息,對(duì)預(yù)處理后的訓(xùn)練語(yǔ)料進(jìn)行特征提取訓(xùn)練,得到模型參數(shù),建立識(shí)別模型。本實(shí)施例通過(guò)根據(jù)特征模板和訓(xùn)練語(yǔ)料進(jìn)行特征提取訓(xùn)練,獲取最優(yōu)的模型參數(shù),建立識(shí)別模型,提升了識(shí)別模型識(shí)別標(biāo)注信息的正確率。
[0179]參照?qǐng)D8,本發(fā)明音頻管理方法第一實(shí)施例提供一種音頻管理方法,可通過(guò)上述音頻管理裝置第一實(shí)施例具體實(shí)現(xiàn)。所述音頻管理方法包括:
[0180]步驟S10、對(duì)音頻文件進(jìn)行語(yǔ)音識(shí)別,獲取所述音頻文件對(duì)應(yīng)的文本,以及所述音頻文件與所述文本的時(shí)間關(guān)聯(lián)信息。
[0181]本發(fā)明通過(guò)對(duì)音頻文件進(jìn)行標(biāo)注信息的提取,實(shí)現(xiàn)了對(duì)音頻文件自動(dòng)添加標(biāo)簽,減少了很多人工干預(yù),使語(yǔ)音標(biāo)簽的管理更加智能化、自動(dòng)化,大大的提升了用戶體驗(yàn)。
[0182]本發(fā)明實(shí)施例可應(yīng)用于錄音等各類音頻文件的音頻管理,本實(shí)施例以移動(dòng)終端錄音得到的錄音文件作為音頻文件進(jìn)行舉例說(shuō)明。
[0183]具體的,作為一種實(shí)施方式,首先,移動(dòng)終端對(duì)音頻文件進(jìn)行語(yǔ)音識(shí)別,也即將音頻文件中的語(yǔ)音信息轉(zhuǎn)換為文字信息,得到的文本即為音頻文件對(duì)應(yīng)的文本。
[0184]需要說(shuō)明的是,在語(yǔ)音識(shí)別的過(guò)程中,可以將音頻文件中的語(yǔ)音信息以句為單位進(jìn)行劃分,由于音頻文件包括一句或多句語(yǔ)音信息,則識(shí)別得到的文本包括一句或多句對(duì)應(yīng)的文字信息。還可以將音頻文件中的語(yǔ)音信息以預(yù)設(shè)長(zhǎng)度的時(shí)間段為單位進(jìn)行劃分,由于音頻文件包括一段或多段語(yǔ)音信息,則識(shí)別得到的文本包括一段或多段對(duì)應(yīng)的文字信息。
[0185]在根據(jù)預(yù)設(shè)的單位對(duì)語(yǔ)音信息進(jìn)行分節(jié)后,移動(dòng)終端記錄每節(jié)語(yǔ)音信息在音頻文件中的時(shí)間起始點(diǎn)和終止點(diǎn),得到每節(jié)語(yǔ)音信息的時(shí)間信息,也即將音頻文件以小節(jié)為單位,劃分成不同的時(shí)間段。
[0186]同時(shí),在語(yǔ)音識(shí)別的過(guò)程中,保存音頻文件中每節(jié)語(yǔ)音信息與識(shí)別得到的對(duì)應(yīng)的文字信息的關(guān)聯(lián)信息,也即得到每節(jié)語(yǔ)音信息與每節(jié)文字信息的對(duì)應(yīng)關(guān)系。
[0187]然后,移動(dòng)終端根據(jù)每節(jié)語(yǔ)音信息的時(shí)間信息,和每節(jié)語(yǔ)音信息與每節(jié)文字信息的對(duì)應(yīng)關(guān)系,以音頻文件的時(shí)間軸為基礎(chǔ),建立音頻文件各時(shí)間段與文本中每節(jié)文字信息的關(guān)聯(lián)關(guān)系,音頻文件各時(shí)間段均有對(duì)應(yīng)的文本信息,并且同一時(shí)間段中的各時(shí)間點(diǎn)對(duì)應(yīng)的文本信息,與該時(shí)間段對(duì)應(yīng)的文本信息相同。
[0188]由此,得到音頻文件與文本的時(shí)間關(guān)聯(lián)關(guān)系。
[0189]根據(jù)音頻文件與文本的時(shí)間關(guān)聯(lián)關(guān)系,可以得到音頻文件中的各時(shí)間點(diǎn)或時(shí)間段對(duì)應(yīng)的文本信息。
[0190]步驟S20、根據(jù)預(yù)先配置的識(shí)別模型,提取所述文本的標(biāo)注信息。
[0191]在得到音頻文件對(duì)應(yīng)的文本,以及音頻文件與文本的時(shí)間關(guān)聯(lián)關(guān)系后,移動(dòng)終端根據(jù)預(yù)先配置的識(shí)別模型,提取文本的標(biāo)注信息。
[0192]作為一種實(shí)施方式,移動(dòng)終端預(yù)先配置有識(shí)別模型,用于提取文本的目標(biāo)特征信息,對(duì)文本進(jìn)行標(biāo)注。
[0193]具體的,將文本信息中的各節(jié)文字信息作為語(yǔ)料,輸入識(shí)別模型,識(shí)別提取文本中每節(jié)文字信息的目標(biāo)特征信息作為標(biāo)注信息。
[0194]需要說(shuō)明的是,提取的目標(biāo)特征信息為預(yù)設(shè)類型的特征信息,例如提取文本中的評(píng)價(jià)對(duì)象作為目標(biāo)特征信息,提取文本中的情感評(píng)價(jià)作為目標(biāo)特征信息。
[0195]本實(shí)施例中,以目標(biāo)特征信息為評(píng)價(jià)對(duì)象,進(jìn)行舉例說(shuō)明。評(píng)價(jià)對(duì)象是一篇討論性文本中表現(xiàn)的主題。如在產(chǎn)品討論中關(guān)于一款手機(jī)屏幕、電池、按鍵、應(yīng)用軟件等的討論,在一部電影中關(guān)于導(dǎo)演、演員、制片人的討論。因此評(píng)價(jià)對(duì)象的抽取蘊(yùn)含著極大地商業(yè)價(jià)值。如:
[0196]這款手機(jī)的屏幕分辨率很低,有點(diǎn)失望。
[0197]在這個(gè)例句中,可以看出它討論的主題是屏幕分辨率,因此這句話的評(píng)價(jià)對(duì)象就是“屏幕分辨率”。
[0198]移動(dòng)終端在提取得到每節(jié)文字信息的評(píng)價(jià)對(duì)象后,將評(píng)價(jià)對(duì)象作為目標(biāo)特征信息,對(duì)對(duì)應(yīng)的文字信息進(jìn)行標(biāo)注。
[0199]例如文字信息“這款手機(jī)的屏幕分辨率很低,有點(diǎn)失望”的目標(biāo)特征信息即為“屏幕分辨率”,標(biāo)注的信息也即“屏幕分辨率”。
[0200]由此,得到文本中每節(jié)文字信息的目標(biāo)特征信息,也即得到文本的標(biāo)注信息。
[0201 ]步驟S30、根據(jù)所述文本的標(biāo)注信息,以及所述音頻文件與所述文本的時(shí)間關(guān)聯(lián)信息,獲取所述音頻文件的標(biāo)簽。
[0202]在得到文本的標(biāo)注信息后,移動(dòng)終端根據(jù)文本的標(biāo)注信息,以及音頻文件與文本的時(shí)間關(guān)聯(lián)信息,獲取音頻文件的標(biāo)簽。
[0203]具體的,作為一種實(shí)施方式,移動(dòng)終端根據(jù)文本與音頻文件的時(shí)間關(guān)聯(lián)關(guān)系,將文本中每節(jié)文字信息的標(biāo)注信息作為標(biāo)簽,標(biāo)注到音頻文件對(duì)應(yīng)的時(shí)間段,保持音頻文件各時(shí)間段的語(yǔ)音信息的標(biāo)簽與對(duì)應(yīng)的文字信息的標(biāo)注信息一致。
[0204]由此,得到音頻文件各時(shí)間段的標(biāo)簽,音頻文件同一時(shí)間段中各時(shí)間點(diǎn)的標(biāo)簽與該時(shí)間段相同。
[0205]需要說(shuō)明的是,用戶可根據(jù)需要對(duì)獲取的音頻文件標(biāo)簽進(jìn)行編輯、保存、刪除等操作。
[0206]然后,移動(dòng)終端可以根據(jù)音頻文件的各標(biāo)簽與對(duì)應(yīng)的時(shí)間段信息建立標(biāo)簽列表,參照?qǐng)D13,供用戶根據(jù)標(biāo)簽列表了解當(dāng)前音頻文件各時(shí)間段的評(píng)價(jià)對(duì)象。
[0207]參照?qǐng)D14,移動(dòng)終端在播放當(dāng)前音頻文件的過(guò)程中,可將標(biāo)簽顯示在音頻文件的時(shí)間軸或播放進(jìn)度條附近,供用戶根據(jù)各標(biāo)簽了解當(dāng)前音頻文件各時(shí)間段的評(píng)價(jià)對(duì)象。
[0208]在本實(shí)施例中,通過(guò)對(duì)音頻文件進(jìn)行語(yǔ)音識(shí)別,獲取音頻文件對(duì)應(yīng)的文本,以及音頻文件與文本的時(shí)間關(guān)聯(lián)信息;然后,根據(jù)預(yù)先配置的識(shí)別模型,提取文本的標(biāo)注信息;然后,根據(jù)文本的標(biāo)注信息,以及音頻文件與文本的時(shí)間關(guān)聯(lián)信息,獲取音頻文件的標(biāo)簽。本實(shí)施例通過(guò)對(duì)音頻文件進(jìn)行語(yǔ)音識(shí)別得到對(duì)應(yīng)的文本,從而根據(jù)提取文本的標(biāo)注信息,用于添加音頻文件的標(biāo)簽;獲取音頻文件與文本的時(shí)間關(guān)聯(lián)信息,從而將得到的標(biāo)簽添加到音頻文件對(duì)應(yīng)的時(shí)間段或時(shí)間點(diǎn),保證了音頻文件標(biāo)簽位置的準(zhǔn)確性。由此,本實(shí)施例實(shí)現(xiàn)了自動(dòng)識(shí)別、智能添加音頻文件的標(biāo)簽,無(wú)需用戶手動(dòng)對(duì)音頻文件進(jìn)行標(biāo)簽的添加和編輯,提升了用戶體驗(yàn)。
[0209]進(jìn)一步的,參照?qǐng)D9,本發(fā)明音頻管理方法第二實(shí)施例提供一種音頻管理方法,可通過(guò)上述音頻管理裝置第二實(shí)施例具體實(shí)現(xiàn)。基于上述圖8所示的實(shí)施例,所述步驟S20包括:
[0210]步驟S21、根據(jù)預(yù)先配置的識(shí)別模型,提取所述各句文字信息對(duì)應(yīng)的標(biāo)注信息。
[0211]在本發(fā)明音頻管理方法第一實(shí)施例的基礎(chǔ)上,本實(shí)施例通過(guò)以句為單位提取標(biāo)注信息,更加符合語(yǔ)言結(jié)構(gòu),從而在對(duì)標(biāo)注信息進(jìn)行去重時(shí),能夠合理有效的去除重復(fù)的標(biāo)注信息,得到的文本標(biāo)注信息也更加準(zhǔn)確,符合音頻的語(yǔ)義。
[0212]具體的,以句為單位,對(duì)音頻文件中的語(yǔ)音信息進(jìn)行分節(jié)后,移動(dòng)終端記錄每句語(yǔ)音信息在音頻文件中的時(shí)間起始點(diǎn)和終止點(diǎn),得到每句語(yǔ)音信息的時(shí)間信息,也即將音頻文件以句為單位,劃分成不同的時(shí)間段。
[0213]同時(shí),在語(yǔ)音識(shí)別的過(guò)程中,保存音頻文件中每句語(yǔ)音信息與識(shí)別得到的對(duì)應(yīng)的文字信息的關(guān)聯(lián)信息,也即得到每句語(yǔ)音信息與每句文字信息的對(duì)應(yīng)關(guān)系。
[0214]然后,移動(dòng)終端根據(jù)每句語(yǔ)音信息的時(shí)間信息,和每句語(yǔ)音信息與每句文字信息的對(duì)應(yīng)關(guān)系,以音頻文件的時(shí)間軸為基礎(chǔ),建立音頻文件各時(shí)間段與文本中每句文字信息的關(guān)聯(lián)關(guān)系,音頻文件各時(shí)間段均有對(duì)應(yīng)的文本信息,并且同一時(shí)間段中的各時(shí)間點(diǎn)對(duì)應(yīng)的文本信息,與該時(shí)間段對(duì)應(yīng)的文本信息相同。
[0215]由此,得到的音頻文件與文本的時(shí)間關(guān)聯(lián)關(guān)系,包括音頻文件中各時(shí)間段或時(shí)間點(diǎn)與文本中文本信息的對(duì)應(yīng)關(guān)系。
[0216]然后,移動(dòng)終端將文本信息中的各句文字信息作為語(yǔ)料,輸入識(shí)別模型,識(shí)別提取文本中每句文字信息的目標(biāo)特征信息。
[0217]本實(shí)施例中,以目標(biāo)特征信息為評(píng)價(jià)對(duì)象,進(jìn)行舉例說(shuō)明。
[0218]移動(dòng)終端根據(jù)識(shí)別模型,提取得到文本中每句文字信息的評(píng)價(jià)對(duì)象,作為每句文字信息對(duì)應(yīng)的標(biāo)注信息。
[0219]步驟S22、對(duì)所述文字信息的標(biāo)注信息進(jìn)行去重處理。
[0220]在獲取文本中每句文字信息對(duì)應(yīng)的標(biāo)注信息后,對(duì)文字信息的標(biāo)注信息進(jìn)行去重處理。
[0221]具體的,作為一種實(shí)施方式,若相鄰兩句文字信息的評(píng)價(jià)對(duì)象相同,標(biāo)注信息相同,則合并此兩句文字信息,相應(yīng)的,合并對(duì)應(yīng)的標(biāo)注信息;
[0222]若相鄰兩句文字信息的評(píng)價(jià)對(duì)象不同,也即標(biāo)注信息不同,則分別保存此相鄰兩句文字信息的標(biāo)注信息。
[0223]由此,實(shí)現(xiàn)了對(duì)文字信息的標(biāo)注信息去重處理。
[0224]步驟S23、獲取去重處理后的標(biāo)注信息為所述文本的標(biāo)注信息。
[0225]在完成對(duì)文字信息的標(biāo)注信息去重處理后,獲取去重處理后的標(biāo)注信息為當(dāng)前文本的標(biāo)注信息。
[0226]然后,移動(dòng)終端根據(jù)去重處理后的每句文字信息與音頻文件的對(duì)應(yīng)管關(guān)系,將文本中每句文字信息的標(biāo)注信息作為標(biāo)簽,標(biāo)注到音頻文件中對(duì)應(yīng)的時(shí)間段,保持音頻文件各時(shí)間段的語(yǔ)音信息的標(biāo)簽與對(duì)應(yīng)的文字信息的標(biāo)注信息一致。
[0227]由此,得到音頻文件各時(shí)間段的標(biāo)簽,音頻文件同一時(shí)間段中各時(shí)間點(diǎn)的標(biāo)簽與該時(shí)間段相同。
[0228]例如,對(duì)于一個(gè)手機(jī)發(fā)布會(huì)的錄音文件,根據(jù)本實(shí)施例,首先將錄音文件轉(zhuǎn)化為文本,分別對(duì)文本中的每句文字信息進(jìn)行標(biāo)注信息的提取,得到每句文字信息的評(píng)價(jià)對(duì)象。然后,對(duì)文字信息的標(biāo)注信息進(jìn)行去重處理,合并評(píng)價(jià)對(duì)象相同的相鄰文字信息及對(duì)應(yīng)的標(biāo)注信息,得到文本的標(biāo)注信息。
[0229]取錄音文件0-5分鐘對(duì)應(yīng)的文本信息的評(píng)價(jià)對(duì)象,也即標(biāo)注信息是“手機(jī)的屏幕”;5-10分鐘對(duì)應(yīng)的文本信息的評(píng)價(jià)對(duì)象,也即標(biāo)注信息是“手機(jī)的相機(jī)” ;10-15分鐘對(duì)應(yīng)的文本信息的評(píng)價(jià)對(duì)象,也即標(biāo)注信息是“手機(jī)的價(jià)格”。
[0230]然后,根據(jù)文本的標(biāo)注信息,以及錄音文件與文本的時(shí)間關(guān)聯(lián)信息,獲取音頻文件的標(biāo)簽,則:
[0231]錄音文件0-5分鐘的標(biāo)簽是“手機(jī)的屏幕”;
[0232]錄音文件5-10分鐘的標(biāo)簽是是“手機(jī)的相機(jī)”;
[0233]錄音文件10-15分鐘的標(biāo)簽是是“手機(jī)的價(jià)格”。
[0234]錄音文件有了以上的標(biāo)簽,用戶便知道錄音文件每一段的主題是什么,如果是用戶感興趣的主題,那么用戶自然會(huì)重點(diǎn)關(guān)注。
[0235]在本實(shí)施例中,根據(jù)預(yù)先配置的識(shí)別模型,分別提取文本中各句文字信息對(duì)應(yīng)的標(biāo)注?目息;對(duì)文字?目息的標(biāo)注?目息進(jìn)行去重處理;獲取去重處理后的標(biāo)注?目息為文本的標(biāo)注信息。本實(shí)施例以句為單位,分別對(duì)文本中的每句文字信息進(jìn)行標(biāo)注信息的提取,然后對(duì)文字信息的標(biāo)注信息進(jìn)行去重處理,有效的去除了文本中相鄰的重復(fù)標(biāo)注信息,也同時(shí)對(duì)應(yīng)去除了音頻文件中相鄰的重復(fù)標(biāo)簽,合并音頻文件中標(biāo)簽相同的相鄰時(shí)間段,降低了音頻文件的標(biāo)簽重復(fù)程度,使得音頻文件的標(biāo)簽更加簡(jiǎn)潔有序,提升了用戶體驗(yàn)。
[0236]進(jìn)一步的,參照?qǐng)D10,本發(fā)明音頻管理方法第三實(shí)施例提供一種音頻管理方法,可通過(guò)上述音頻管理裝置第三實(shí)施例具體實(shí)現(xiàn)?;谏鲜鰣D8或圖9所示的實(shí)施例(本實(shí)施例以圖8為例),所述S30的步驟之后,還包括:
[0237]步驟S40、建立所述標(biāo)簽和音頻文件的關(guān)聯(lián)關(guān)系,將所述標(biāo)簽鏈接到所述音頻文件對(duì)應(yīng)的時(shí)間段或時(shí)間點(diǎn)。
[0238]本實(shí)施例在獲取音頻文件的標(biāo)簽后,移動(dòng)終端建立標(biāo)簽和音頻文件的關(guān)聯(lián)關(guān)系,將標(biāo)簽鏈接到音頻文件對(duì)應(yīng)的時(shí)間段或時(shí)間點(diǎn)。在本發(fā)明音頻管理方法第二實(shí)施例或第三實(shí)施例的基礎(chǔ)上,本實(shí)施例實(shí)現(xiàn)了通過(guò)標(biāo)簽即可連接到對(duì)應(yīng)的音頻文件時(shí)間點(diǎn)或時(shí)間段,進(jìn)行播放,使音頻文件中的標(biāo)簽更加具有實(shí)用意義,提升了用戶的體驗(yàn)。
[0239]具體的,作為一種實(shí)施方式,移動(dòng)終端根據(jù)文本與音頻文件的時(shí)間關(guān)聯(lián)關(guān)系,將文本中每節(jié)文字信息的標(biāo)注信息作為標(biāo)簽,標(biāo)注到音頻文件對(duì)應(yīng)的時(shí)間段后,建立標(biāo)簽與對(duì)應(yīng)的時(shí)間段的關(guān)聯(lián)關(guān)系,將各標(biāo)簽鏈接到對(duì)應(yīng)的時(shí)間段。
[0240]作為另一種實(shí)施方式,移動(dòng)終端還可以分別建立各標(biāo)簽與音頻文件對(duì)應(yīng)的時(shí)間段中任意時(shí)間點(diǎn)的關(guān)聯(lián)關(guān)系,將各標(biāo)簽鏈接到對(duì)應(yīng)的時(shí)間段中的任意時(shí)間點(diǎn)。
[0241 ]例如,將各標(biāo)簽鏈接到音頻文件對(duì)應(yīng)的時(shí)間段的起始時(shí)間點(diǎn)。
[0242 ]由此,根據(jù)各標(biāo)簽,可以鏈接到音頻文件中對(duì)應(yīng)的時(shí)間段,播放此時(shí)間段的音頻文件;或,
[0243]根據(jù)各標(biāo)簽鏈,可以鏈接到音頻文件對(duì)應(yīng)的時(shí)間點(diǎn),進(jìn)行音頻文件的播放。
[0244]需要說(shuō)明的是,在建立音頻文件和標(biāo)簽的關(guān)聯(lián)關(guān)系后,用戶可根據(jù)需要調(diào)整音頻文件和標(biāo)簽的對(duì)應(yīng)關(guān)系,調(diào)整將標(biāo)簽對(duì)應(yīng)的時(shí)間點(diǎn)或時(shí)間段。
[0245]參照?qǐng)D13,用戶可以根據(jù)標(biāo)簽列表中的各標(biāo)簽,鏈接到音頻文件對(duì)應(yīng)的時(shí)間段進(jìn)行播放;或者,
[0246]參照?qǐng)D14,用戶可以根據(jù)音頻文件時(shí)間軸或播放進(jìn)度條附近的標(biāo)簽,跳轉(zhuǎn)到對(duì)應(yīng)的時(shí)間點(diǎn)進(jìn)行播放。當(dāng)用戶調(diào)整播放進(jìn)度條時(shí),移動(dòng)終端根據(jù)進(jìn)度條的時(shí)間點(diǎn),和標(biāo)簽與音頻文件的關(guān)聯(lián)關(guān)系,查找到當(dāng)前時(shí)間點(diǎn)對(duì)應(yīng)的標(biāo)簽,并顯示。
[0247]在本實(shí)施例中,在獲取首頻文件的標(biāo)簽后,建立標(biāo)簽和首頻文件的關(guān)聯(lián)關(guān)系,將標(biāo)簽鏈接到音頻文件對(duì)應(yīng)的時(shí)間段或時(shí)間點(diǎn)。本實(shí)施例通過(guò)建立標(biāo)簽和音頻文件的關(guān)聯(lián)關(guān)系,將音頻文件的標(biāo)簽鏈接到音頻文件對(duì)應(yīng)的時(shí)間段或時(shí)間點(diǎn),實(shí)現(xiàn)了根據(jù)標(biāo)簽可以跳轉(zhuǎn)到音頻文件對(duì)應(yīng)的時(shí)間段或時(shí)間點(diǎn)進(jìn)行播放,還可以根據(jù)音頻文件的時(shí)間點(diǎn)獲取對(duì)應(yīng)的標(biāo)簽,豐富了音頻文件標(biāo)簽的功能,使用戶操作更加方便快捷,提升了用戶體驗(yàn)。
[0248]進(jìn)一步的,參照?qǐng)D11,本發(fā)明音頻管理方法第四實(shí)施例提供一種音頻管理方法,可通過(guò)上述音頻管理裝置第四實(shí)施例具體實(shí)現(xiàn)?;谏鲜鰣D10所示的實(shí)施例,所述步驟SlO之前,還包括:
[0249]步驟S50、根據(jù)預(yù)先配置的訓(xùn)練語(yǔ)料和特征模板,訓(xùn)練得到所述識(shí)別模型。
[0250]本實(shí)施例中,預(yù)先配置訓(xùn)練語(yǔ)料和特征模板,訓(xùn)練得到識(shí)別模型,用于文本標(biāo)注信息的獲取。在本發(fā)明音頻管理方法第一實(shí)施例、第二實(shí)施例和第三實(shí)施例的基礎(chǔ)上,本實(shí)施例通過(guò)訓(xùn)練識(shí)別模型,能夠根據(jù)實(shí)際需要調(diào)整模型參數(shù),從而使得到的識(shí)別模型能夠更加準(zhǔn)確的提取出文本的標(biāo)注信息,提升了音頻文件標(biāo)簽的準(zhǔn)確率。
[0251]具體的,作為一種實(shí)施方式,預(yù)先配置預(yù)設(shè)數(shù)量的訓(xùn)練語(yǔ)料,訓(xùn)練語(yǔ)料也即用于訓(xùn)練的文本。去除訓(xùn)練語(yǔ)料中無(wú)明確評(píng)價(jià)對(duì)象的中性語(yǔ)料,得到可用訓(xùn)練語(yǔ)料。
[0252]然后,分別獲取各可用訓(xùn)練語(yǔ)料的評(píng)價(jià)對(duì)象,作為對(duì)應(yīng)的正確的標(biāo)注信息。
[0253]然后,使用預(yù)先配置的特征模板,提取各可用訓(xùn)練語(yǔ)料的評(píng)價(jià)對(duì)象作為標(biāo)注信息,訓(xùn)練預(yù)先配置的訓(xùn)練模型,得到識(shí)別模型。
[°254] 需要說(shuō)明的是,預(yù)先配置的訓(xùn)練模型可以是SVM(Support Vector Machine,支持向量機(jī))模型、CRF(Condit1nal Random Field,條件隨機(jī)場(chǎng))模型等,可根據(jù)需要靈活設(shè)置。
[0255]訓(xùn)練得到的識(shí)別模型,可以用來(lái)提取文本的標(biāo)注信息。
[0256]在本實(shí)施例中,根據(jù)預(yù)先配置的訓(xùn)練語(yǔ)料和特征模板,訓(xùn)練得到識(shí)別模型。本實(shí)施例通過(guò)預(yù)先配置訓(xùn)練語(yǔ)料和特征模板,訓(xùn)練得到識(shí)別模型,使獲取的識(shí)別模型能夠更加準(zhǔn)確的提取文本的標(biāo)注信息,提高了文本標(biāo)注信息的提取正確率,也即提高了音頻文件標(biāo)簽的正確率,在實(shí)現(xiàn)標(biāo)簽自動(dòng)獲取的同時(shí)保障了標(biāo)簽的正確率,提升了用戶體驗(yàn)。
[0257]進(jìn)一步的,參照?qǐng)D12,本發(fā)明音頻管理方法第五實(shí)施例提供一種音頻管理方法,可通過(guò)上述音頻管理裝置第五實(shí)施例具體實(shí)現(xiàn)?;谏鲜鰣D11所示的實(shí)施例,所述步驟S50包括:
[0258]步驟S51、對(duì)預(yù)先配置的訓(xùn)練語(yǔ)料進(jìn)行預(yù)處理,獲取所述訓(xùn)練語(yǔ)料正確的標(biāo)注信息。
[0259]在本發(fā)明音頻管理方法第四實(shí)施例的基礎(chǔ)上,本實(shí)施例通過(guò)預(yù)先配置訓(xùn)練語(yǔ)料的正確標(biāo)注信息,在訓(xùn)練過(guò)程校正模型參數(shù),使得訓(xùn)練得到的識(shí)別模型能夠更加準(zhǔn)確的提取出符合用戶實(shí)際需求的標(biāo)注信息。
[0260]具體的,作為一種實(shí)施方式,首先,對(duì)訓(xùn)練語(yǔ)料進(jìn)行預(yù)處理,進(jìn)行訓(xùn)練語(yǔ)料的主觀性檢測(cè),去除無(wú)評(píng)價(jià)對(duì)象的中性語(yǔ)料,得到可用訓(xùn)練語(yǔ)料。
[0261]然后,對(duì)可用訓(xùn)練語(yǔ)料進(jìn)行詞性標(biāo)注、依存關(guān)系分析,分析可用訓(xùn)練語(yǔ)料的語(yǔ)句結(jié)構(gòu),對(duì)可用訓(xùn)練語(yǔ)料進(jìn)行分詞。
[0262]同時(shí),將各可用訓(xùn)練語(yǔ)料反饋給測(cè)試人員,獲取測(cè)試人員輸入的各訓(xùn)練語(yǔ)料的正確標(biāo)注信息。
[0263]步驟S52、根據(jù)預(yù)先配置的特征模板和所述正確的標(biāo)注信息,對(duì)所述預(yù)處理后的訓(xùn)練語(yǔ)料進(jìn)行特征提取訓(xùn)練,得到模型參數(shù),建立識(shí)別模型。
[0264]在對(duì)訓(xùn)練語(yǔ)料進(jìn)行預(yù)處理,獲取訓(xùn)練語(yǔ)料正確的標(biāo)注信息后,根據(jù)預(yù)先配置的特征模板,對(duì)預(yù)處理后的訓(xùn)練語(yǔ)料進(jìn)行特征提取訓(xùn)練,得到參數(shù)模型,根據(jù)模型參數(shù),建立識(shí)別豐旲型O
[0265]具體的,作為一種實(shí)施方式,預(yù)先配置的特征模板包括了多種語(yǔ)句結(jié)構(gòu)模板的特征,用于提取訓(xùn)練語(yǔ)料的特征。
[0266]使用預(yù)先配置的特征模板和訓(xùn)練模型,對(duì)預(yù)處理后的可用訓(xùn)練語(yǔ)料進(jìn)行特征提取訓(xùn)練,根據(jù)可用訓(xùn)練語(yǔ)料的正確標(biāo)注信息對(duì)訓(xùn)練過(guò)程進(jìn)行校正。
[0267 ]由此,得到訓(xùn)練模型的模型參數(shù),也即各特征的權(quán)重。
[0268]然后,根據(jù)訓(xùn)練模型和模型參數(shù),建立得到識(shí)別模型。
[0269]參照?qǐng)D15,以訓(xùn)練提取評(píng)價(jià)對(duì)象的識(shí)別模型為應(yīng)用場(chǎng)景,進(jìn)行舉例說(shuō)明。
[0270]首先,配置一定數(shù)量的原始語(yǔ)料。原始語(yǔ)料的數(shù)量規(guī)模越大,訓(xùn)練得到的識(shí)別模型越準(zhǔn)確。
[0271]然后,將原始語(yǔ)料進(jìn)行預(yù)處理,包括主觀性檢測(cè)、詞性分析、依存關(guān)系分析等,得到可用訓(xùn)練語(yǔ)料,和可用訓(xùn)練語(yǔ)料的正確評(píng)價(jià)對(duì)象。
[0272]然后使用預(yù)先配置的特征模板和訓(xùn)練模型,對(duì)可用訓(xùn)練語(yǔ)料進(jìn)行特征提取的訓(xùn)練,在訓(xùn)練過(guò)程中,使用可用訓(xùn)練語(yǔ)料的正確評(píng)價(jià)對(duì)象進(jìn)行校正,得到最優(yōu)的模型參數(shù)。
[0273]然后,根據(jù)訓(xùn)練模型和模型參數(shù),建立識(shí)別模型。
[0274]然后,對(duì)識(shí)別模型進(jìn)行性能測(cè)試。輸入一定數(shù)量的測(cè)試語(yǔ)料進(jìn)行特征提取,得到測(cè)試語(yǔ)料的評(píng)價(jià)對(duì)象,也即標(biāo)注信息。由于已經(jīng)預(yù)先獲取測(cè)試語(yǔ)料的正確評(píng)價(jià)對(duì)象,則根據(jù)提取得到的測(cè)試語(yǔ)料的評(píng)價(jià)對(duì)象和預(yù)先配置的正確的評(píng)價(jià)對(duì)象,獲取當(dāng)前識(shí)別模型的識(shí)別正確率。
[0275]若當(dāng)前識(shí)別模型的識(shí)別正確率不能夠達(dá)到預(yù)期值,則可以通過(guò)增加特征模板的形式,從新訓(xùn)練識(shí)別模型,對(duì)識(shí)別模型進(jìn)行修正,提升識(shí)別模型的識(shí)別正確率。
[0276]由此,實(shí)現(xiàn)了識(shí)別模型的配置。
[0277]在本實(shí)施例中,對(duì)預(yù)先配置的訓(xùn)練語(yǔ)料進(jìn)行預(yù)處理,獲取訓(xùn)練語(yǔ)料正確的標(biāo)注信息;根據(jù)預(yù)先配置的特征模板和訓(xùn)練語(yǔ)料正確的標(biāo)注信息,對(duì)預(yù)處理后的訓(xùn)練語(yǔ)料進(jìn)行特征提取訓(xùn)練,得到模型參數(shù),建立識(shí)別模型。本實(shí)施例通過(guò)根據(jù)特征模板和訓(xùn)練語(yǔ)料進(jìn)行特征提取訓(xùn)練,獲取最優(yōu)的模型參數(shù),建立識(shí)別模型,提升了識(shí)別模型識(shí)別標(biāo)注信息的正確率。
[0278]需要說(shuō)明的是,在本文中,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、物品或者裝置不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、物品或者裝置所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括該要素的過(guò)程、方法、物品或者裝置中還存在另外的相同要素。
[0279]上述本發(fā)明實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施例的優(yōu)劣。
[0280]通過(guò)以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到上述實(shí)施例方法可借助軟件加必需的通用硬件平臺(tái)的方式來(lái)實(shí)現(xiàn),當(dāng)然也可以通過(guò)硬件,但很多情況下前者是更佳的實(shí)施方式。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)(如ROM/RAM、磁碟、光盤)中,包括若干指令用以使得一臺(tái)終端設(shè)備(可以是手機(jī),計(jì)算機(jī),月艮務(wù)器,空調(diào)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述的方法。
[0281]以上僅為本發(fā)明的可選實(shí)施例,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說(shuō)明書(shū)及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,或直接或間接運(yùn)用在其他相關(guān)的技術(shù)領(lǐng)域,均同理包括在本發(fā)明的專利保護(hù)范圍內(nèi)。
【主權(quán)項(xiàng)】
1.一種音頻管理裝置,其特征在于,所述音頻管理裝置包括: 語(yǔ)音識(shí)別模塊,用于對(duì)音頻文件進(jìn)行語(yǔ)音識(shí)別,獲取所述音頻文件對(duì)應(yīng)的文本,以及所述音頻文件與所述文本的時(shí)間關(guān)聯(lián)信息; 信息提取模塊,用于根據(jù)預(yù)先配置的識(shí)別模型,提取所述文本的標(biāo)注信息; 標(biāo)簽獲取模塊,用于根據(jù)所述文本的標(biāo)注信息,以及所述音頻文件與所述文本的時(shí)間關(guān)聯(lián)信息,獲取所述音頻文件的標(biāo)簽。2.如權(quán)利要求1所述的音頻管理裝置,其特征在于,所述信息提取模塊包括: 信息提取單元,用于根據(jù)預(yù)先配置的識(shí)別模型,分別提取所述文本中各句文字信息對(duì)應(yīng)的標(biāo)注信息; 去重單元,用于對(duì)所述文字信息的標(biāo)注信息進(jìn)行去重處理; 整合單元,用于獲取去重處理后的標(biāo)注信息為所述文本的標(biāo)注信息。3.如權(quán)利要求1或2所述的音頻管理裝置,其特征在于,所述音頻管理裝置還包括: 關(guān)聯(lián)模塊,用于建立所述標(biāo)簽和音頻文件的關(guān)聯(lián)關(guān)系,將所述標(biāo)簽鏈接到所述音頻文件對(duì)應(yīng)的時(shí)間段或時(shí)間點(diǎn)。4.如權(quán)利要求3所述的音頻管理裝置,其特征在于,所述音頻管理裝置還包括: 模型配置模塊,用于根據(jù)預(yù)先配置的訓(xùn)練語(yǔ)料和特征模板,訓(xùn)練得到所述識(shí)別模型。5.如權(quán)利要求4所述的音頻管理裝置,其特征在于,所述模型配置模塊包括: 預(yù)處理單元,用于對(duì)預(yù)先配置的訓(xùn)練語(yǔ)料進(jìn)行預(yù)處理,獲取所述訓(xùn)練語(yǔ)料正確的標(biāo)注信息; 配置單元,用于根據(jù)預(yù)先配置的特征模板和所述正確的標(biāo)注信息,對(duì)所述預(yù)處理后的訓(xùn)練語(yǔ)料進(jìn)行特征提取訓(xùn)練,得到模型參數(shù),建立識(shí)別模型。6.一種音頻管理方法,其特征在于,所述音頻管理方法包括以下步驟: 對(duì)音頻文件進(jìn)行語(yǔ)音識(shí)別,獲取所述音頻文件對(duì)應(yīng)的文本,以及所述音頻文件與所述文本的時(shí)間關(guān)聯(lián)信息; 根據(jù)預(yù)先配置的識(shí)別模型,提取所述文本的標(biāo)注信息; 根據(jù)所述文本的標(biāo)注信息,以及所述音頻文件與所述文本的時(shí)間關(guān)聯(lián)信息,獲取所述音頻文件的標(biāo)簽。7.如權(quán)利要求6所述的音頻管理方法,其特征在于,所述根據(jù)預(yù)先配置的識(shí)別模型,提取所述文本的標(biāo)注信息的步驟包括: 根據(jù)預(yù)先配置的識(shí)別模型,分別提取所述文本中各句文字信息對(duì)應(yīng)的標(biāo)注信息; 對(duì)所述文字信息的標(biāo)注信息進(jìn)行去重處理; 獲取去重處理后的標(biāo)注信息為所述文本的標(biāo)注信息。8.如權(quán)利要求6或7所述的音頻管理方法,其特征在于,所述根據(jù)所述文本的標(biāo)注信息,以及所述音頻文件與所述文本的時(shí)間關(guān)聯(lián)信息,獲取所述音頻文件的標(biāo)簽的步驟之后,還包括: 建立所述標(biāo)簽和音頻文件的關(guān)聯(lián)關(guān)系,將所述標(biāo)簽鏈接到所述音頻文件對(duì)應(yīng)的時(shí)間段或時(shí)間點(diǎn)。9.如權(quán)利要求8所述的音頻管理方法,其特征在于,所述對(duì)音頻文件進(jìn)行語(yǔ)音識(shí)別,獲取所述音頻文件對(duì)應(yīng)的文本,以及所述音頻文件與所述文本的時(shí)間關(guān)聯(lián)信息的步驟之前,還包括: 根據(jù)預(yù)先配置的訓(xùn)練語(yǔ)料和特征模板,訓(xùn)練得到所述識(shí)別模型。10.如權(quán)利要求9所述的音頻管理方法,其特征在于,所述根據(jù)預(yù)先配置的訓(xùn)練語(yǔ)料和特征模板,訓(xùn)練得到所述識(shí)別模型的步驟包括: 對(duì)預(yù)先配置的訓(xùn)練語(yǔ)料進(jìn)行預(yù)處理,獲取所述訓(xùn)練語(yǔ)料正確的標(biāo)注信息; 根據(jù)預(yù)先配置的特征模板和所述正確的標(biāo)注信息,對(duì)所述預(yù)處理后的訓(xùn)練語(yǔ)料進(jìn)行特征提取訓(xùn)練,得到模型參數(shù),建立識(shí)別模型。
【文檔編號(hào)】G10L15/26GK105913838SQ201610339908
【公開(kāi)日】2016年8月31日
【申請(qǐng)日】2016年5月19日
【發(fā)明人】王榮洋
【申請(qǐng)人】努比亞技術(shù)有限公司