欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種錄音數(shù)據(jù)處理裝置、移動終端及方法與流程

文檔序號:12274084閱讀:367來源:國知局
一種錄音數(shù)據(jù)處理裝置、移動終端及方法與流程

本發(fā)明涉及錄音領(lǐng)域,更具體地說,涉及一種錄音數(shù)據(jù)處理裝置、移動終端及方法。



背景技術(shù):

在進行一個會議時,會議記錄員會將會議的重要內(nèi)容記錄下來,形成會議記錄,由于錄音工具的便攜性強、且能隨時隨地重復(fù)播放,所以采用錄音工具對會議進行錄音是最常用的錄音輔助手段。然而從錄音時長較長的錄音中提取出有用的會議信息,也是一項比較繁雜的工作,會耗費較多的時間和人力,用戶體驗較差。



技術(shù)實現(xiàn)要素:

本發(fā)明的主要目的在于提出一種錄音數(shù)據(jù)處理裝置、移動終端及方法,旨在解決現(xiàn)有技術(shù)中,從錄音時長較長的錄音中提取出有用的信息,會耗費較多的時間和人力的問題。

為解決上述技術(shù)問題,本發(fā)明提供一種錄音數(shù)據(jù)處理裝置,包括:

分割模塊,用于將原錄音數(shù)據(jù)按照預(yù)設(shè)方式進行分割,分割成多個連續(xù)的原數(shù)據(jù)段;

確定模塊,用于將各個原數(shù)據(jù)段與預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,確定出與關(guān)鍵數(shù)據(jù)相匹配的至少一個目標(biāo)數(shù)據(jù)段;

組合模塊,用于將各目標(biāo)數(shù)據(jù)段,或?qū)⒏髂繕?biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),組合成新的錄音數(shù)據(jù)。

其中,分割模塊用于將原錄音數(shù)據(jù)進行斷句分割,分割成多個連續(xù)的完整語句,作為原數(shù)據(jù)段。

其中,還包括:接收模塊,用于接收用戶輸入的所述關(guān)鍵數(shù)據(jù)。

其中,組合模塊用于將各目標(biāo)數(shù)據(jù)段,以斷句的形式組合成新的錄音數(shù)據(jù);或者,將各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式組合成新的錄音數(shù)據(jù);或者,將各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式且進行去重處理后組合成新的錄音數(shù)據(jù)。

可選地,本發(fā)明提供一種移動終端,包括上述的錄音數(shù)據(jù)處理裝置。

可選地,本發(fā)明提供一種錄音數(shù)據(jù)處理方法,包括:

將原錄音數(shù)據(jù)按照預(yù)設(shè)方式進行分割,分割成多個連續(xù)的原數(shù)據(jù)段;

將各個原數(shù)據(jù)段與預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,確定出與關(guān)鍵數(shù)據(jù)相匹配的至少一個目標(biāo)數(shù)據(jù)段;

將各目標(biāo)數(shù)據(jù)段,或?qū)⒏髂繕?biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),組合成新的錄音數(shù)據(jù)。

其中,將原錄音數(shù)據(jù)按照預(yù)設(shè)方式進行分割,分割成多個連續(xù)的原數(shù)據(jù)段包括:將原錄音數(shù)據(jù)進行斷句分割,分割成多個連續(xù)的完整語句,作為原數(shù)據(jù)段。

其中,目標(biāo)數(shù)據(jù)段包括:原數(shù)據(jù)段,或者從原數(shù)據(jù)段中截取的與關(guān)鍵數(shù)據(jù)相匹配的子數(shù)據(jù)段。

其中,將各個原數(shù)據(jù)段與預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對之前,還包括:接收用戶輸入的關(guān)鍵數(shù)據(jù)。

其中,將各目標(biāo)數(shù)據(jù)段,或?qū)⒏髂繕?biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),組合成新的錄音數(shù)據(jù)包括:

將各目標(biāo)數(shù)據(jù)段,以斷句的形式組合成新的錄音數(shù)據(jù);

或者,將各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式組合成新的錄音數(shù)據(jù);

或者,將各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式且進行去重處理后組合成新的錄音數(shù)據(jù)。

有益效果

本發(fā)明提供了一種錄音數(shù)據(jù)處理裝置、方法及移動終端,該錄音數(shù)據(jù)處理裝置包括分割模塊,用于將原錄音數(shù)據(jù)按照預(yù)設(shè)方式進行分割,分割成多個連續(xù)的原數(shù)據(jù)段;確定模塊,用于將各個原數(shù)據(jù)段與預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,確定出與關(guān)鍵數(shù)據(jù)相匹配的至少一個目標(biāo)數(shù)據(jù)段;組合模塊,用于將各目標(biāo)數(shù)據(jù)段,或?qū)⒏髂繕?biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),組合成新的錄音數(shù)據(jù);采用上述方案,從原錄音內(nèi)容中提取出與預(yù)設(shè)關(guān)鍵數(shù)據(jù)相匹配的錄音內(nèi)容,并將其組合成新的錄音,去掉了原錄音內(nèi)容中無用的信息,提高了錄音內(nèi)容中關(guān)鍵信息的密度,大大減小了錄音內(nèi)容的長度,同時還節(jié)省了錄音所需占用的存儲空間,為會議記錄人員或者處理類似工作的人員提供了便利,提升用戶體驗。

附圖說明

下面將結(jié)合附圖及實施例對本發(fā)明作進一步說明,附圖中:

圖1為實現(xiàn)本發(fā)明各個實施例一個可選的移動終端的硬件結(jié)構(gòu)示意圖;

圖2為本發(fā)明第一實施例提供的一種錄音數(shù)據(jù)處理裝置的示意圖;

圖3為本發(fā)明第二實施例提供的一種移動終端的示意圖;

圖4為本發(fā)明第三實施例提供的一種錄音數(shù)據(jù)處理方法的流程圖。

具體實施方式

應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。

現(xiàn)在將參考附圖描述實現(xiàn)本發(fā)明各個實施例的移動終端。在后續(xù)的描述中,使用用于表示元件的諸如“模塊”、“部件”或“單元”的后綴僅為了有利于本發(fā)明的說明,其本身并沒有特定的意義。因此,"模塊"與"部件"可以混合地使用。

移動終端可以以各種形式來實施。例如,本發(fā)明中描述的終端可以包括諸如移動電話、智能電話、筆記本電腦、數(shù)字廣播接收器、PDA(個人數(shù)字助理)、PAD(平板電腦)、PMP(便攜式多媒體播放器)、導(dǎo)航裝置等等的移動終端以及諸如數(shù)字TV、臺式計算機等等的固定終端。下面,假設(shè)終端是移動終端,然而,本領(lǐng)域技術(shù)人員將理解的是,除了特別用于移動目的的元件之外,根據(jù)本發(fā)明的實施方式的構(gòu)造也能夠應(yīng)用于固定類型的終端。

圖1為實現(xiàn)本發(fā)明各個實施例一個可選的移動終端的硬件結(jié)構(gòu)示意圖。

移動終端100可以包括A/V(音頻/視頻)輸入單元110、用戶輸入單元120、輸出單元130、存儲器140、控制器150和電源單元160等等。圖1示出了具有各種組件的移動終端,但是應(yīng)理解的是,并不要求實施所有示出的組件,可以替代地實施更多或更少的組件,將在下面詳細(xì)描述移動終端的元件。

A/V輸入單元110用于接收音頻或視頻信號。A/V輸入單元110可以包括麥克風(fēng)111,麥克風(fēng)111可以在電話通話模式、記錄模式、語音識別模式等等運行模式中經(jīng)由麥克風(fēng)111接收聲音(音頻數(shù)據(jù)),并且能夠?qū)⑦@樣的聲音處理為音頻數(shù)據(jù)。麥克風(fēng)111可以實施各種類型的噪聲消除(或抑制)算法以消除(或抑制)在接收和發(fā)送音頻信號的過程中產(chǎn)生的噪聲或者干擾。

用戶輸入單元120可以根據(jù)用戶輸入的命令生成鍵輸入數(shù)據(jù)以控制移動終端的各種操作。用戶輸入單元120允許用戶輸入各種類型的信息,并且可以包括鍵盤、鍋仔片、觸摸板(例如,檢測由于被接觸而導(dǎo)致的電阻、壓力、電容等等的變化的觸敏組件)、滾輪、搖桿等等。特別地,當(dāng)觸摸板以層的形式疊加在顯示模塊131上時,可以形成觸摸屏。

輸出單元130被構(gòu)造為以視覺、音頻和/或觸覺方式提供輸出信號(例如,音頻信號、視頻信號、警報信號、振動信號等等)。

輸出單元130可以包括顯示模塊131、音頻輸出模塊132等。

顯示模塊131可以顯示在移動終端100中處理的信息。例如,當(dāng)移動終端100處于電話通話模式時,顯示模塊131可以顯示與通話或其它通信(例如,文本消息收發(fā)、多媒體文件下載等等)相關(guān)的用戶界面(UI)或圖形用戶界面(GUI)。當(dāng)移動終端100處于視頻通話模式或者圖像捕獲模式時,顯示模塊131可以顯示捕獲的圖像和/或接收的圖像、示出視頻或圖像以及相關(guān)功能的UI或GUI等等。

同時,當(dāng)顯示模塊131和觸摸板以層的形式彼此疊加以形成觸摸屏?xí)r,顯示模塊131可以用作輸入裝置和輸出裝置。顯示模塊131可以包括液晶顯示器(LCD)、薄膜晶體管LCD(TFT-LCD)、有機發(fā)光二極管(OLED)顯示器、柔性顯示器、三維(3D)顯示器等等中的至少一種。這些顯示器中的一些可以被構(gòu)造為透明狀以允許用戶從外部觀看,這可以稱為透明顯示器,典型的透明顯示器可以例如為TOLED(透明有機發(fā)光二極管)顯示器等等。根據(jù)特定想要的實施方式,移動終端100可以包括兩個或更多顯示模塊(或其它顯示裝置),例如,移動終端可以包括外部顯示模塊(未示出)和內(nèi)部顯示模塊(未示出)。觸摸屏可用于檢測觸摸輸入壓力以及觸摸輸入位置和觸摸輸入面積。

音頻輸出模塊132可以提供與移動終端100執(zhí)行的特定功能相關(guān)的音頻輸出(例如,呼叫信號接收聲音、消息接收聲音等等)。音頻輸出模塊132可以包括揚聲器、蜂鳴器等等。

存儲器140可以存儲由控制器150執(zhí)行的處理和控制操作的軟件程序等等,或者可以暫時地存儲己經(jīng)輸出或?qū)⒁敵龅臄?shù)據(jù)(例如,電話簿、消息、靜態(tài)圖像、視頻等等)。而且,存儲器140可以存儲關(guān)于當(dāng)觸摸施加到觸摸屏?xí)r輸出的各種方式的振動和音頻信號的數(shù)據(jù)。

存儲器140可以包括至少一種類型的存儲介質(zhì),存儲介質(zhì)包括閃存、硬盤、多媒體卡、卡型存儲器(例如,SD或DX存儲器等等)、隨機訪問存儲器(RAM)、靜態(tài)隨機訪問存儲器(SRAM)、只讀存儲器(ROM)、電可擦除可編程只讀存儲器(EEPROM)、可編程只讀存儲器(PROM)、磁性存儲器、磁盤、光盤等等。而且,移動終端100可以與通過網(wǎng)絡(luò)連接執(zhí)行存儲器140的存儲功能的網(wǎng)絡(luò)存儲裝置協(xié)作。

控制器150通常控制移動終端的總體操作。例如,控制器150執(zhí)行與語音通話、數(shù)據(jù)通信、視頻通話等等相關(guān)的控制和處理。控制器150可以執(zhí)行模式識別處理,以將在觸摸屏上執(zhí)行的手寫輸入或者圖片繪制輸入識別為字符或圖像。

電源單元160在控制器150的控制下接收外部電力或內(nèi)部電力并且提供操作各元件和組件所需的適當(dāng)?shù)碾娏Α?/p>

這里描述的各種實施方式可以以使用例如計算機軟件、硬件或其任何組合的計算機可讀介質(zhì)來實施。對于硬件實施,這里描述的實施方式可以通過使用特定用途集成電路(ASIC)、數(shù)字信號處理器(DSP)、數(shù)字信號處理裝置(DSPD)、可編程邏輯裝置(PLD)、現(xiàn)場可編程門陣列(FPGA)、處理器、控制器、微控制器、微處理器、被設(shè)計為執(zhí)行這里描述的功能的電子單元中的至少一種來實施,在一些情況下,這樣的實施方式可以在控制器150中實施。對于軟件實施,諸如過程或功能的實施方式可以與允許執(zhí)行至少一種功能或操作的單獨的軟件模塊來實施。軟件代碼可以由以任何適當(dāng)?shù)木幊陶Z言編寫的軟件應(yīng)用程序(或程序)來實施,軟件代碼可以存儲在存儲器140中并且由控制器150執(zhí)行。

至此,己經(jīng)按照其功能描述了移動終端。下面,為了簡要起見,將描述諸如折疊型、直板型、擺動型、滑動型移動終端等等的各種類型的移動終端中的滑動型移動終端作為示例。因此,本發(fā)明能夠應(yīng)用于任何類型的移動終端,并且不限于滑動型移動終端。

基于上述移動終端硬件結(jié)構(gòu),以下通過具體實施例對本發(fā)明進行詳細(xì)說明。

第一實施例

本實施例提供了一種錄音數(shù)據(jù)處理裝置,參見圖2,圖2為本發(fā)明第一實施例提供的錄音數(shù)據(jù)處理裝置的示意圖,該錄音數(shù)據(jù)處理裝置包括:分割模塊201、確定模塊202、組合模塊203,其中,

分割模塊201,用于將原錄音數(shù)據(jù)按照預(yù)設(shè)方式進行分割,分割成多個連續(xù)的原數(shù)據(jù)段。

其中,預(yù)設(shè)方式可以包括采用中文分詞方法(例如基于字符串匹配的分詞方法、基于理解的分詞方法、基于統(tǒng)計的分詞方法等)對原錄音數(shù)據(jù)按照一句完整的語句進行分割;即分割模塊201用于將原錄音數(shù)據(jù)進行斷句分割,分割成多個連續(xù)的完整語句,作為原數(shù)據(jù)段。

例如分割模塊201將原錄音數(shù)據(jù)分割成了N個連續(xù)的原數(shù)據(jù)段,第一個原數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為t0、t1,第二個原數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為t1、t2,第三個原數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為t2、t3,以此類推,第N個原數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為tN-1、tN。

該錄音數(shù)據(jù)處理裝置還包括:接收模塊204,用于接收用戶輸入的關(guān)鍵數(shù)據(jù)。

關(guān)鍵數(shù)據(jù)可以根據(jù)用戶需求進行設(shè)置。關(guān)鍵數(shù)據(jù)可以是一個字、一個詞組、一個短句等,關(guān)鍵數(shù)據(jù)可以是一個,也可以是多個,例如當(dāng)原錄音數(shù)據(jù)的內(nèi)容主要是關(guān)于如何整治景點A的旅游市場秩序,則關(guān)鍵數(shù)據(jù)可以是旅游、景點A、整治、市場秩序、旅游市場秩序、整治市場秩序、整治旅游市場秩序、誠信經(jīng)營中的至少一個。

確定模塊202,用于將各個原數(shù)據(jù)段與預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,確定出與關(guān)鍵數(shù)據(jù)相匹配的至少一個目標(biāo)數(shù)據(jù)段。

當(dāng)預(yù)設(shè)關(guān)鍵數(shù)據(jù)只有一個時,可以先將上述的第一個原數(shù)據(jù)段與預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,然后再將上述的第二個原數(shù)據(jù)段與預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,以此類推,直至比對完所有的原數(shù)據(jù)段。

當(dāng)預(yù)設(shè)關(guān)鍵數(shù)據(jù)有多個時,可以先將上述的第一個原數(shù)據(jù)段與第一個預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,再將上述的第二個原數(shù)據(jù)段與第一個預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,以此類推,直至比對完所有的原數(shù)據(jù)段;然后將上述的第一個原數(shù)據(jù)段與第二個預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,再將上述的第二個原數(shù)據(jù)段與第二個預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,以此類推,直至比對完所有的原數(shù)據(jù)段;以此類推,直至將所有的原數(shù)據(jù)段與所有的預(yù)設(shè)關(guān)鍵數(shù)據(jù)比對完。

還可以先將上述的第一個原數(shù)據(jù)段與第一個預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,再將該原數(shù)據(jù)段與第二個預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,以此類推,直至比對完所有的預(yù)設(shè)關(guān)鍵數(shù)據(jù);然后將上述的第二個原數(shù)據(jù)段與第一個預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,再將該原數(shù)據(jù)段與第二個預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,以此類推,直至比對完所有的預(yù)設(shè)關(guān)鍵數(shù)據(jù);以此類推,直至將所有的原數(shù)據(jù)段與所有的預(yù)設(shè)關(guān)鍵數(shù)據(jù)比對完。

各個原數(shù)據(jù)段與預(yù)設(shè)關(guān)鍵數(shù)據(jù)的比對可以綜合人工智能方法以及統(tǒng)計學(xué)知識進行,如果某個原數(shù)據(jù)段與預(yù)設(shè)關(guān)鍵數(shù)據(jù)相關(guān)度達到某個設(shè)定閾值時,則認(rèn)為該原數(shù)據(jù)段有相關(guān)性,則可以將該條原數(shù)據(jù)段的起始時間點、結(jié)束時間點進行記錄。

目標(biāo)數(shù)據(jù)段包括:原數(shù)據(jù)段,或者從原數(shù)據(jù)段中截取的與關(guān)鍵數(shù)據(jù)相匹配的子數(shù)據(jù)段。

為了提高錄音內(nèi)容中關(guān)鍵信息的密度,目標(biāo)數(shù)據(jù)段可以包括從原數(shù)據(jù)段中截取的與關(guān)鍵數(shù)據(jù)相匹配的子數(shù)據(jù)段,例如一個原數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為60秒、80秒,在72-74秒處是關(guān)鍵數(shù)據(jù)所在的時間段,則可以在60秒-80秒內(nèi)截取出包含72-74秒的子數(shù)據(jù)段,例如可以是截取65秒-75秒的子數(shù)據(jù)段,也可以是截取70秒-80秒的子數(shù)據(jù)段。

組合模塊203,用于將各目標(biāo)數(shù)據(jù)段,或?qū)⒏髂繕?biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),組合成新的錄音數(shù)據(jù)。

具體的,組合模塊203用于將各目標(biāo)數(shù)據(jù)段,以斷句的形式組合成新的錄音數(shù)據(jù);或者,將各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式組合成新的錄音數(shù)據(jù);或者,將各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式且進行去重處理后組合成新的錄音數(shù)據(jù)。

組合模塊203將匹配得出的各目標(biāo)數(shù)據(jù)段以斷句的形式組合成新的錄音數(shù)據(jù),例如從所有的原數(shù)據(jù)段中匹配得到以下3個目標(biāo)數(shù)據(jù)段:第一個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為60秒、80秒,第二個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為120秒、135秒,第三個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為160秒、180秒。

將不匹配的原數(shù)據(jù)段丟棄,在直接將匹配到的目標(biāo)數(shù)據(jù)段進行組合后,可能出現(xiàn)前后兩個目標(biāo)數(shù)據(jù)段的銜接處的錄音內(nèi)容沒有停頓的情況,所以將匹配得出的各目標(biāo)數(shù)據(jù)段以斷句的形式組合成新的錄音數(shù)據(jù),以斷句的形式為在前后兩個目標(biāo)數(shù)據(jù)段的銜接處增加1秒的空白為例。組合成的新的錄音數(shù)據(jù)包括60秒-80秒、120秒-135秒、160秒-180秒以及兩個前后兩個目標(biāo)數(shù)據(jù)段的銜接處各1秒,一共57秒的錄音數(shù)據(jù),即0-20秒為第一個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù),20秒-21秒為空白,表示停頓,21秒-36秒為第二個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù),36秒-37秒為空白,表示停頓,37秒-57秒為第三個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù)。

通過上述將匹配得出的各目標(biāo)數(shù)據(jù)段以斷句的形式組合成新的錄音數(shù)據(jù),大大減小了錄音內(nèi)容的長度,同時還節(jié)省了錄音所需占用的存儲空間。

或者組合模塊203將匹配得出的各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式組合成新的錄音數(shù)據(jù)。

例如從所有的原數(shù)據(jù)段中匹配得到以下3個目標(biāo)數(shù)據(jù)段:第一個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為60秒、80秒,第二個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為120秒、135秒,第三個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為160秒、180秒。

將不匹配的原數(shù)據(jù)段丟棄,在將匹配得到的目標(biāo)數(shù)據(jù)段組合成的新的錄音數(shù)據(jù)的過程中,為了用戶能更清楚的知曉錄音內(nèi)容,可以將匹配得出的各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式組合成新的錄音數(shù)據(jù),預(yù)設(shè)長度可以根據(jù)用戶需求進行設(shè)置,也可以是默認(rèn)設(shè)置,前預(yù)設(shè)長度和后預(yù)設(shè)長度可以相同,也可以不同。若直接將匹配到的目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù)進行組合,可能出現(xiàn)前后兩個目標(biāo)數(shù)據(jù)段的銜接處的錄音內(nèi)容沒有停頓的情況,所以將匹配得出的各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式組合成新的錄音數(shù)據(jù)。

以斷句的形式為在前后兩個目標(biāo)數(shù)據(jù)段的銜接處增加1秒的空白,且以前后預(yù)設(shè)長度均為10秒為例,組合成的新的錄音數(shù)據(jù)包括50秒-90秒、110秒-145秒、150秒-190秒以及兩個前后兩個目標(biāo)數(shù)據(jù)段的銜接處各1秒,一共117秒的錄音數(shù)據(jù),即0-40秒為包含第一個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù),40秒-41秒為空白,表示停頓,41秒-76秒為包含第二個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù),76秒-77秒為空白,表示停頓,77秒-117秒為包含第三個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù)。

通過上述將匹配得出的各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式組合成新的錄音數(shù)據(jù),使用戶更清楚的知曉錄音內(nèi)容,同時大大減小了錄音內(nèi)容的長度,節(jié)省了錄音所需占用的存儲空間。

或者,組合模塊203用于將各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式且進行去重處理后組合成新的錄音數(shù)據(jù)。

例如從所有的原數(shù)據(jù)段中匹配得到以下3個目標(biāo)數(shù)據(jù)段:第一個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為60秒、80秒,第二個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為90秒、105秒,第三個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為130秒、145秒。

將不匹配的原數(shù)據(jù)段丟棄,在將匹配得到的目標(biāo)數(shù)據(jù)段組合成的新的錄音數(shù)據(jù)的過程中,為了用戶能更清楚的知曉錄音內(nèi)容,可以將匹配得出的各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式且進行去重處理后組合成新的錄音數(shù)據(jù),預(yù)設(shè)長度可以根據(jù)用戶需求進行設(shè)置,也可以是默認(rèn)設(shè)置,前預(yù)設(shè)長度和后預(yù)設(shè)長度可以相同,也可以不同。若直接將匹配到的目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù)進行組合,可能出現(xiàn)前后兩個目標(biāo)數(shù)據(jù)段的銜接處的錄音內(nèi)容沒有停頓的情況,所以將匹配得出的各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式組合成新的錄音數(shù)據(jù)。

以斷句的形式為在前后兩個目標(biāo)數(shù)據(jù)段的銜接處增加1秒的空白,且以前后預(yù)設(shè)長度均為10秒為例,組合成的錄音數(shù)據(jù)包括50秒-90秒、80秒-115秒、120秒-150秒以及兩個前后兩個目標(biāo)數(shù)據(jù)段的銜接處各1秒,一共107秒的錄音數(shù)據(jù),由于第一段錄音數(shù)據(jù)50秒-90秒與第二段錄音數(shù)據(jù)80秒-115秒有重復(fù)部分,所以對這兩段錄音數(shù)據(jù)進行去重處理,將其中一段錄音數(shù)據(jù)的80秒-90秒部分去掉,即最后組合成的新的錄音數(shù)據(jù)包括:0-40秒為包含第一個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù),40秒-41秒為空白,表示停頓,41秒-66秒為包含第二個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù),66秒-67秒為空白,表示停頓,67秒-97秒為包含第三個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù)?;蛘咦詈蠼M合成的新的錄音數(shù)據(jù)包括:0-30秒為包含第一個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù),30秒-31秒為空白,表示停頓,31秒-66秒為包含第二個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù),66秒-67秒為空白,表示停頓,67秒-97秒為包含第三個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù)。

通過上述將匹配得出的各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式且進行去重處理后組合成新的錄音數(shù)據(jù),使用戶更清楚的知曉錄音內(nèi)容,且去除了重復(fù)的錄音內(nèi)容,同時大大減小了錄音內(nèi)容的長度,節(jié)省了錄音所需占用的存儲空間。

通過本實施的實施,從原錄音內(nèi)容中提取出與預(yù)設(shè)關(guān)鍵數(shù)據(jù)相匹配的錄音內(nèi)容,并將其組合成新的錄音,去掉了原錄音內(nèi)容中無用的信息,提高了錄音內(nèi)容中關(guān)鍵信息的密度,大大減小了錄音內(nèi)容的長度,同時還節(jié)省了錄音所需占用的存儲空間,為會議記錄人員或者處理類似工作的人員提供了便利,提升用戶體驗。

第二實施例

本實施例還提供一種移動終端,參見圖3,圖3為本實施例提供的一種移動終端的示意圖,該移動終端包括第一實施例中的錄音數(shù)據(jù)處理裝置。上述錄音數(shù)據(jù)處理裝置的各功能模塊執(zhí)行的功能可通過圖1中的部分硬件來實現(xiàn),當(dāng)然,各硬件執(zhí)行的功能也可由上述功能模塊實現(xiàn)。上述各功能模塊的功能具體由如下硬件實現(xiàn):

分割模塊201、確定模塊202、組合模塊203的功能均可通過控制器150來實現(xiàn)。接收模塊204的功能可通過用戶輸入單元120來實現(xiàn),用戶輸入單元120可以根據(jù)用戶輸入的命令生成鍵輸入數(shù)據(jù)以控制移動終端的各種操作。

在錄音開始時,用戶輸入單元120接收用戶輸入的關(guān)鍵數(shù)據(jù),關(guān)鍵數(shù)據(jù)可以根據(jù)用戶需求進行設(shè)置。關(guān)鍵數(shù)據(jù)可以是一個字、一個詞組、一個短句等,關(guān)鍵數(shù)據(jù)可以是一個,也可以是多個,例如當(dāng)原錄音數(shù)據(jù)的內(nèi)容主要是關(guān)于如何整治景點A的旅游市場秩序,則關(guān)鍵數(shù)據(jù)可以是旅游、景點A、整治、市場秩序、旅游市場秩序、整治市場秩序、整治旅游市場秩序、誠信經(jīng)營中的至少一個。

采用麥克風(fēng)111來接收聲音,并將這樣的聲音處理為音頻數(shù)據(jù),待麥克風(fēng)111采集到原錄音數(shù)據(jù)后,將其發(fā)送給控制器150??刂破?50將原錄音數(shù)據(jù)按照預(yù)設(shè)方式進行分割,分割成多個連續(xù)的原數(shù)據(jù)段。其中,預(yù)設(shè)方式可以包括采用中文分詞方法(例如基于字符串匹配的分詞方法、基于理解的分詞方法、基于統(tǒng)計的分詞方法等)對原錄音數(shù)據(jù)按照一句完整的語句進行分割;即控制器150將原錄音數(shù)據(jù)進行斷句分割,分割成多個連續(xù)的完整語句,作為原數(shù)據(jù)段。

例如控制器150將原錄音數(shù)據(jù)分割成了N個連續(xù)的原數(shù)據(jù)段,第一個原數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為t0、t1,第二個原數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為t1、t2,第三個原數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為t2、t3,以此類推,第N個原數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為tN-1、tN。

控制器150將各個原數(shù)據(jù)段與預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,確定出與關(guān)鍵數(shù)據(jù)相匹配的至少一個目標(biāo)數(shù)據(jù)段。

當(dāng)預(yù)設(shè)關(guān)鍵數(shù)據(jù)只有一個時,可以先將上述的第一個原數(shù)據(jù)段與預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,然后再將上述的第二個原數(shù)據(jù)段與預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,以此類推,直至比對完所有的原數(shù)據(jù)段。

當(dāng)預(yù)設(shè)關(guān)鍵數(shù)據(jù)有多個時,可以先將上述的第一個原數(shù)據(jù)段與第一個預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,再將上述的第二個原數(shù)據(jù)段與第一個預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,以此類推,直至比對完所有的原數(shù)據(jù)段;然后將上述的第一個原數(shù)據(jù)段與第二個預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,再將上述的第二個原數(shù)據(jù)段與第二個預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,以此類推,直至比對完所有的原數(shù)據(jù)段;以此類推,直至將所有的原數(shù)據(jù)段與所有的預(yù)設(shè)關(guān)鍵數(shù)據(jù)比對完。

還可以先將上述的第一個原數(shù)據(jù)段與第一個預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,再將該原數(shù)據(jù)段與第二個預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,以此類推,直至比對完所有的預(yù)設(shè)關(guān)鍵數(shù)據(jù);然后將上述的第二個原數(shù)據(jù)段與第一個預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,再將該原數(shù)據(jù)段與第二個預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,以此類推,直至比對完所有的預(yù)設(shè)關(guān)鍵數(shù)據(jù);以此類推,直至將所有的原數(shù)據(jù)段與所有的預(yù)設(shè)關(guān)鍵數(shù)據(jù)比對完。

各個原數(shù)據(jù)段與預(yù)設(shè)關(guān)鍵數(shù)據(jù)的比對可以綜合人工智能方法以及統(tǒng)計學(xué)知識進行,如果某個原數(shù)據(jù)段與預(yù)設(shè)關(guān)鍵數(shù)據(jù)相關(guān)度達到某個設(shè)定閾值時,則認(rèn)為該原數(shù)據(jù)段有相關(guān)性,則可以將該條原數(shù)據(jù)段的起始時間點、結(jié)束時間點進行記錄。

目標(biāo)數(shù)據(jù)段包括:原數(shù)據(jù)段,或者從原數(shù)據(jù)段中截取的與關(guān)鍵數(shù)據(jù)相匹配的子數(shù)據(jù)段。

為了提高錄音內(nèi)容中關(guān)鍵信息的密度,目標(biāo)數(shù)據(jù)段可以包括從原數(shù)據(jù)段中截取的與關(guān)鍵數(shù)據(jù)相匹配的子數(shù)據(jù)段,例如一個原數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為60秒、80秒,在72-74秒處是關(guān)鍵數(shù)據(jù)所在的時間段,則可以在60秒-80秒內(nèi)截取出包含72-74秒的子數(shù)據(jù)段,例如可以是截取65秒-75秒的子數(shù)據(jù)段,也可以是截取70秒-80秒的子數(shù)據(jù)段。

控制器150將各目標(biāo)數(shù)據(jù)段,或?qū)⒏髂繕?biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),組合成新的錄音數(shù)據(jù)。

具體的,控制器150將各目標(biāo)數(shù)據(jù)段,以斷句的形式組合成新的錄音數(shù)據(jù);或者,將各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式組合成新的錄音數(shù)據(jù);或者,將各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式且進行去重處理后組合成新的錄音數(shù)據(jù)。

控制器150將匹配得出的各目標(biāo)數(shù)據(jù)段以斷句的形式組合成新的錄音數(shù)據(jù),例如從所有的原數(shù)據(jù)段中匹配得到以下3個目標(biāo)數(shù)據(jù)段:第一個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為60秒、80秒,第二個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為120秒、135秒,第三個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為160秒、180秒。

將不匹配的原數(shù)據(jù)段丟棄,在直接將匹配到的目標(biāo)數(shù)據(jù)段進行組合后,可能出現(xiàn)前后兩個目標(biāo)數(shù)據(jù)段的銜接處的錄音內(nèi)容沒有停頓的情況,所以將匹配得出的各目標(biāo)數(shù)據(jù)段以斷句的形式組合成新的錄音數(shù)據(jù),以斷句的形式為在前后兩個目標(biāo)數(shù)據(jù)段的銜接處增加1秒的空白為例。組合成的新的錄音數(shù)據(jù)包括60秒-80秒、120秒-135秒、160秒-180秒以及兩個前后兩個目標(biāo)數(shù)據(jù)段的銜接處各1秒,一共57秒的錄音數(shù)據(jù),即0-20秒為第一個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù),20秒-21秒為空白,表示停頓,21秒-36秒為第二個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù),36秒-37秒為空白,表示停頓,37秒-57秒為第三個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù)。。并將上述組合成的新的錄音數(shù)據(jù)保存到存儲器140中。

通過上述將匹配得出的各目標(biāo)數(shù)據(jù)段以斷句的形式組合成新的錄音數(shù)據(jù),大大減小了錄音內(nèi)容的長度,同時還節(jié)省了錄音所需占用的存儲空間。

或者控制器150將匹配得出的各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式組合成新的錄音數(shù)據(jù)。

例如從所有的原數(shù)據(jù)段中匹配得到以下3個目標(biāo)數(shù)據(jù)段:第一個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為60秒、80秒,第二個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為120秒、135秒,第三個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為160秒、180秒。

將不匹配的原數(shù)據(jù)段丟棄,在將匹配得到的目標(biāo)數(shù)據(jù)段組合成的新的錄音數(shù)據(jù)的過程中,為了用戶能更清楚的知曉錄音內(nèi)容,可以將匹配得出的各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式組合成新的錄音數(shù)據(jù),預(yù)設(shè)長度可以根據(jù)用戶需求進行設(shè)置,也可以是默認(rèn)設(shè)置,前預(yù)設(shè)長度和后預(yù)設(shè)長度可以相同,也可以不同。若直接將匹配到的目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù)進行組合,可能出現(xiàn)前后兩個目標(biāo)數(shù)據(jù)段的銜接處的錄音內(nèi)容沒有停頓的情況,所以將匹配得出的各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式組合成新的錄音數(shù)據(jù)。

以斷句的形式為在前后兩個目標(biāo)數(shù)據(jù)段的銜接處增加1秒的空白,且以前后預(yù)設(shè)長度均為10秒為例,組合成的新的錄音數(shù)據(jù)包括50秒-90秒、110秒-145秒、150秒-190秒以及兩個前后兩個目標(biāo)數(shù)據(jù)段的銜接處各1秒,一共117秒的錄音數(shù)據(jù),即0-40秒為包含第一個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù),40秒-41秒為空白,表示停頓,41秒-76秒為包含第二個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù),76秒-77秒為空白,表示停頓,77秒-117秒為包含第三個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù)。并將上述組合成的新的錄音數(shù)據(jù)保存到存儲器140中。

通過上述將匹配得出的各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式組合成新的錄音數(shù)據(jù),使用戶更清楚的知曉錄音內(nèi)容,同時大大減小了錄音內(nèi)容的長度,節(jié)省了錄音所需占用的存儲空間。

或者,控制器150將各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式且進行去重處理后組合成新的錄音數(shù)據(jù)。

例如從所有的原數(shù)據(jù)段中匹配得到以下3個目標(biāo)數(shù)據(jù)段:第一個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為60秒、80秒,第二個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為90秒、105秒,第三個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為130秒、145秒。

將不匹配的原數(shù)據(jù)段丟棄,在將匹配得到的目標(biāo)數(shù)據(jù)段組合成的新的錄音數(shù)據(jù)的過程中,為了用戶能更清楚的知曉錄音內(nèi)容,可以將匹配得出的各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式且進行去重處理后組合成新的錄音數(shù)據(jù),預(yù)設(shè)長度可以根據(jù)用戶需求進行設(shè)置,也可以是默認(rèn)設(shè)置,前預(yù)設(shè)長度和后預(yù)設(shè)長度可以相同,也可以不同。若直接將匹配到的目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù)進行組合,可能出現(xiàn)前后兩個目標(biāo)數(shù)據(jù)段的銜接處的錄音內(nèi)容沒有停頓的情況,所以將匹配得出的各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式組合成新的錄音數(shù)據(jù)。

以斷句的形式為在前后兩個目標(biāo)數(shù)據(jù)段的銜接處增加1秒的空白,且以前后預(yù)設(shè)長度均為10秒為例,組合成的錄音數(shù)據(jù)包括50秒-90秒、80秒-115秒、120秒-150秒以及兩個前后兩個目標(biāo)數(shù)據(jù)段的銜接處各1秒,一共107秒的錄音數(shù)據(jù),由于第一段錄音數(shù)據(jù)50秒-90秒與第二段錄音數(shù)據(jù)80秒-115秒有重復(fù)部分,所以對這兩段錄音數(shù)據(jù)進行去重處理,將其中一段錄音數(shù)據(jù)的80秒-90秒部分去掉,即最后組合成的新的錄音數(shù)據(jù)包括:0-40秒為包含第一個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù),40秒-41秒為空白,表示停頓,41秒-66秒為包含第二個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù),66秒-67秒為空白,表示停頓,67秒-97秒為包含第三個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù)?;蛘咦詈蠼M合成的新的錄音數(shù)據(jù)包括:0-30秒為包含第一個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù),30秒-31秒為空白,表示停頓,31秒-66秒為包含第二個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù),66秒-67秒為空白,表示停頓,67秒-97秒為包含第三個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù)。并將上述組合成的新的錄音數(shù)據(jù)保存到存儲器140中。

通過上述將匹配得出的各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式且進行去重處理后組合成新的錄音數(shù)據(jù),使用戶更清楚的知曉錄音內(nèi)容,且去除了重復(fù)的錄音內(nèi)容,同時大大減小了錄音內(nèi)容的長度,節(jié)省了錄音所需占用的存儲空間。

當(dāng)用戶需要播放組合成新的錄音數(shù)據(jù)時,通過音頻輸出模塊132進行播放,例如可以通過揚聲器播放。

通過本實施例的實施,從原錄音內(nèi)容中提取出與預(yù)設(shè)關(guān)鍵數(shù)據(jù)相匹配的錄音內(nèi)容,并將其組合成新的錄音,去掉了原錄音內(nèi)容中無用的信息,提高了錄音內(nèi)容中關(guān)鍵信息的密度,大大減小了錄音內(nèi)容的長度,同時還節(jié)省了錄音所需占用的存儲空間,為會議記錄人員或者處理類似工作的人員提供了便利,提升用戶體驗。

第三實施例

本實施例提供了一種錄音數(shù)據(jù)處理方法,參見圖4,圖4為本發(fā)明第三實施例提供的錄音數(shù)據(jù)處理方法的流程圖,該方法包括以下步驟:

S401:將原錄音數(shù)據(jù)按照預(yù)設(shè)方式進行分割,分割成多個連續(xù)的原數(shù)據(jù)段。

其中,預(yù)設(shè)方式可以包括采用中文分詞方法(例如基于字符串匹配的分詞方法、基于理解的分詞方法、基于統(tǒng)計的分詞方法等)對原錄音數(shù)據(jù)按照一句完整的語句進行分割;也即將原錄音數(shù)據(jù)進行斷句分割,分割成多個連續(xù)的完整語句,作為原數(shù)據(jù)段。

例如將原錄音數(shù)據(jù)分割成了N個連續(xù)的原數(shù)據(jù)段,第一個原數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為t0、t1,第二個原數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為t1、t2,第三個原數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為t2、t3,以此類推,第N個原數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為tN-1、tN。

S402:將各個原數(shù)據(jù)段與預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,確定出與關(guān)鍵數(shù)據(jù)相匹配的至少一個目標(biāo)數(shù)據(jù)段。

在將各個原數(shù)據(jù)段與預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對之前,還包括:接收用戶輸入的關(guān)鍵數(shù)據(jù)。

關(guān)鍵數(shù)據(jù)可以根據(jù)用戶需求進行設(shè)置。關(guān)鍵數(shù)據(jù)可以是一個字、一個詞組、一個短句等,關(guān)鍵數(shù)據(jù)可以是一個,也可以是多個,例如當(dāng)原錄音數(shù)據(jù)的內(nèi)容主要是關(guān)于如何整治景點A的旅游市場秩序,則關(guān)鍵數(shù)據(jù)可以是旅游、景點A、整治、市場秩序、旅游市場秩序、整治市場秩序、整治旅游市場秩序、誠信經(jīng)營中的至少一個。

當(dāng)預(yù)設(shè)關(guān)鍵數(shù)據(jù)只有一個時,可以先將上述的第一個原數(shù)據(jù)段與預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,然后再將上述的第二個原數(shù)據(jù)段與預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,以此類推,直至比對完所有的原數(shù)據(jù)段。

當(dāng)預(yù)設(shè)關(guān)鍵數(shù)據(jù)有多個時,可以先將上述的第一個原數(shù)據(jù)段與第一個預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,再將上述的第二個原數(shù)據(jù)段與第一個預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,以此類推,直至比對完所有的原數(shù)據(jù)段;然后將上述的第一個原數(shù)據(jù)段與第二個預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,再將上述的第二個原數(shù)據(jù)段與第二個預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,以此類推,直至比對完所有的原數(shù)據(jù)段;以此類推,直至將所有的原數(shù)據(jù)段與所有的預(yù)設(shè)關(guān)鍵數(shù)據(jù)比對完。

還可以先將上述的第一個原數(shù)據(jù)段與第一個預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,再將該原數(shù)據(jù)段與第二個預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,以此類推,直至比對完所有的預(yù)設(shè)關(guān)鍵數(shù)據(jù);然后將上述的第二個原數(shù)據(jù)段與第一個預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,再將該原數(shù)據(jù)段與第二個預(yù)設(shè)關(guān)鍵數(shù)據(jù)進行比對,以此類推,直至比對完所有的預(yù)設(shè)關(guān)鍵數(shù)據(jù);以此類推,直至將所有的原數(shù)據(jù)段與所有的預(yù)設(shè)關(guān)鍵數(shù)據(jù)比對完。

各個原數(shù)據(jù)段與預(yù)設(shè)關(guān)鍵數(shù)據(jù)的比對可以綜合人工智能方法以及統(tǒng)計學(xué)知識進行,如果某個原數(shù)據(jù)段與預(yù)設(shè)關(guān)鍵數(shù)據(jù)相關(guān)度達到某個設(shè)定閾值時,則認(rèn)為該原數(shù)據(jù)段有相關(guān)性,則可以將該條原數(shù)據(jù)段的起始時間點、結(jié)束時間點進行記錄。

目標(biāo)數(shù)據(jù)段包括:原數(shù)據(jù)段,或者從原數(shù)據(jù)段中截取的與關(guān)鍵數(shù)據(jù)相匹配的子數(shù)據(jù)段。

為了提高錄音內(nèi)容中關(guān)鍵信息的密度,目標(biāo)數(shù)據(jù)段可以包括從原數(shù)據(jù)段中截取的與關(guān)鍵數(shù)據(jù)相匹配的子數(shù)據(jù)段,例如一個原數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為60秒、80秒,在72-74秒處是關(guān)鍵數(shù)據(jù)所在的時間段,則可以在60秒-80秒內(nèi)截取出包含72-74秒的子數(shù)據(jù)段,例如可以是截取65秒-75秒的子數(shù)據(jù)段,也可以是截取70秒-80秒的子數(shù)據(jù)段。

S403:將各目標(biāo)數(shù)據(jù)段,或?qū)⒏髂繕?biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),組合成新的錄音數(shù)據(jù)。

具體的,將各目標(biāo)數(shù)據(jù)段,以斷句的形式組合成新的錄音數(shù)據(jù);或者,將各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式組合成新的錄音數(shù)據(jù);或者,將各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式且進行去重處理后組合成新的錄音數(shù)據(jù)。

將匹配得出的各目標(biāo)數(shù)據(jù)段以斷句的形式組合成新的錄音數(shù)據(jù),例如從所有的原數(shù)據(jù)段中匹配得到以下3個目標(biāo)數(shù)據(jù)段:第一個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為60秒、80秒,第二個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為120秒、135秒,第三個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為160秒、180秒。

將不匹配的原數(shù)據(jù)段丟棄,在直接將匹配到的目標(biāo)數(shù)據(jù)段進行組合后,可能出現(xiàn)前后兩個目標(biāo)數(shù)據(jù)段的銜接處的錄音內(nèi)容沒有停頓的情況,所以將匹配得出的各目標(biāo)數(shù)據(jù)段以斷句的形式組合成新的錄音數(shù)據(jù),以斷句的形式為在前后兩個目標(biāo)數(shù)據(jù)段的銜接處增加1秒的空白為例。組合成的新的錄音數(shù)據(jù)包括60秒-80秒、120秒-135秒、160秒-180秒以及兩個前后兩個目標(biāo)數(shù)據(jù)段的銜接處各1秒,一共57秒的錄音數(shù)據(jù),即0-20秒為第一個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù),20秒-21秒為空白,表示停頓,21秒-36秒為第二個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù),36秒-37秒為空白,表示停頓,37秒-57秒為第三個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù)。

通過上述將匹配得出的各目標(biāo)數(shù)據(jù)段以斷句的形式組合成新的錄音數(shù)據(jù),大大減小了錄音內(nèi)容的長度,同時還節(jié)省了錄音所需占用的存儲空間。

或者將匹配得出的各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式組合成新的錄音數(shù)據(jù)。

例如從所有的原數(shù)據(jù)段中匹配得到以下3個目標(biāo)數(shù)據(jù)段:第一個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為60秒、80秒,第二個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為120秒、135秒,第三個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為160秒、180秒。

將不匹配的原數(shù)據(jù)段丟棄,在將匹配得到的目標(biāo)數(shù)據(jù)段組合成的新的錄音數(shù)據(jù)的過程中,為了用戶能更清楚的知曉錄音內(nèi)容,可以將匹配得出的各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式組合成新的錄音數(shù)據(jù),預(yù)設(shè)長度可以根據(jù)用戶需求進行設(shè)置,也可以是默認(rèn)設(shè)置,前預(yù)設(shè)長度和后預(yù)設(shè)長度可以相同,也可以不同。若直接將匹配到的目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù)進行組合,可能出現(xiàn)前后兩個目標(biāo)數(shù)據(jù)段的銜接處的錄音內(nèi)容沒有停頓的情況,所以將匹配得出的各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式組合成新的錄音數(shù)據(jù)。

以斷句的形式為在前后兩個目標(biāo)數(shù)據(jù)段的銜接處增加1秒的空白,且以前后預(yù)設(shè)長度均為10秒為例,組合成的新的錄音數(shù)據(jù)包括50秒-90秒、110秒-145秒、150秒-190秒以及兩個前后兩個目標(biāo)數(shù)據(jù)段的銜接處各1秒,一共117秒的錄音數(shù)據(jù),即0-40秒為包含第一個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù),40秒-41秒為空白,表示停頓,41秒-76秒為包含第二個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù),76秒-77秒為空白,表示停頓,77秒-117秒為包含第三個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù)。

通過上述將匹配得出的各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式組合成新的錄音數(shù)據(jù),使用戶更清楚的知曉錄音內(nèi)容,同時大大減小了錄音內(nèi)容的長度,節(jié)省了錄音所需占用的存儲空間。

或者,將各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式且進行去重處理后組合成新的錄音數(shù)據(jù)。

例如從所有的原數(shù)據(jù)段中匹配得到以下3個目標(biāo)數(shù)據(jù)段:第一個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為60秒、80秒,第二個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為90秒、105秒,第三個目標(biāo)數(shù)據(jù)段的起始時間點和結(jié)束時間點分別為130秒、145秒。

將不匹配的原數(shù)據(jù)段丟棄,在將匹配得到的目標(biāo)數(shù)據(jù)段組合成的新的錄音數(shù)據(jù)的過程中,為了用戶能更清楚的知曉錄音內(nèi)容,可以將匹配得出的各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式且進行去重處理后組合成新的錄音數(shù)據(jù),預(yù)設(shè)長度可以根據(jù)用戶需求進行設(shè)置,也可以是默認(rèn)設(shè)置,前預(yù)設(shè)長度和后預(yù)設(shè)長度可以相同,也可以不同。若直接將匹配到的目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù)進行組合,可能出現(xiàn)前后兩個目標(biāo)數(shù)據(jù)段的銜接處的錄音內(nèi)容沒有停頓的情況,所以將匹配得出的各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式組合成新的錄音數(shù)據(jù)。

以斷句的形式為在前后兩個目標(biāo)數(shù)據(jù)段的銜接處增加1秒的空白,且以前后預(yù)設(shè)長度均為10秒為例,組合成的錄音數(shù)據(jù)包括50秒-90秒、80秒-115秒、120秒-150秒以及兩個前后兩個目標(biāo)數(shù)據(jù)段的銜接處各1秒,一共107秒的錄音數(shù)據(jù),由于第一段錄音數(shù)據(jù)50秒-90秒與第二段錄音數(shù)據(jù)80秒-115秒有重復(fù)部分,所以對這兩段錄音數(shù)據(jù)進行去重處理,將其中一段錄音數(shù)據(jù)的80秒-90秒部分去掉,即最后組合成的新的錄音數(shù)據(jù)包括:0-40秒為包含第一個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù),40秒-41秒為空白,表示停頓,41秒-66秒為包含第二個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù),66秒-67秒為空白,表示停頓,67秒-97秒為包含第三個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù)。或者最后組合成的新的錄音數(shù)據(jù)包括:0-30秒為包含第一個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù),30秒-31秒為空白,表示停頓,31秒-66秒為包含第二個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù),66秒-67秒為空白,表示停頓,67秒-97秒為包含第三個目標(biāo)數(shù)據(jù)段的錄音數(shù)據(jù)。

通過上述將匹配得出的各目標(biāo)數(shù)據(jù)段以及其前后預(yù)設(shè)長度內(nèi)的數(shù)據(jù),以斷句的形式且進行去重處理后組合成新的錄音數(shù)據(jù),使用戶更清楚的知曉錄音內(nèi)容,且去除了重復(fù)的錄音內(nèi)容,同時大大減小了錄音內(nèi)容的長度,節(jié)省了錄音所需占用的存儲空間。

通過本實施的實施,從原錄音內(nèi)容中提取出與預(yù)設(shè)關(guān)鍵數(shù)據(jù)相匹配的錄音內(nèi)容,并將其組合成新的錄音,去掉了原錄音內(nèi)容中無用的信息,提高了錄音內(nèi)容中關(guān)鍵信息的密度,大大減小了錄音內(nèi)容的長度,同時還節(jié)省了錄音所需占用的存儲空間,為會議記錄人員或者處理類似工作的人員提供了便利,提升用戶體驗。

需要說明的是,在本文中,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者裝置不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者裝置所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括該要素的過程、方法、物品或者裝置中還存在另外的相同要素。

上述本發(fā)明實施例序號僅僅為了描述,不代表實施例的優(yōu)劣。

通過以上的實施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到上述實施例方法可借助軟件加必需的通用硬件平臺的方式來實現(xiàn),當(dāng)然也可以通過硬件,但很多情況下前者是更佳的實施方式?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)(如ROM/RAM、磁碟、光盤)中,包括若干指令用以使得一臺終端設(shè)備(可以是手機,計算機,服務(wù)器,空調(diào)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例的方法。

以上僅為本發(fā)明的優(yōu)選實施例,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,或直接或間接運用在其他相關(guān)的技術(shù)領(lǐng)域,均同理包括在本發(fā)明的專利保護范圍內(nèi)。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
米林县| 蓬莱市| 禄丰县| 广南县| 宁津县| 洮南市| 阳山县| 舟曲县| 盘锦市| 祁阳县| 大邑县| 昌都县| 莱州市| 抚顺市| 延川县| 平谷区| 菏泽市| 尉犁县| 兴国县| 吴川市| 衡山县| 苗栗县| 津市市| 电白县| 汤原县| 民县| 托克逊县| 昭苏县| 漯河市| 霞浦县| 抚远县| 梅州市| 天祝| 池州市| 静海县| 龙泉市| 鄂托克旗| 平阴县| 鄂伦春自治旗| 靖边县| 阜阳市|