技術(shù)領(lǐng)域:
本發(fā)明涉及通訊領(lǐng)域,具體涉及一種音頻數(shù)據(jù)處理方法和終端。
背景技術(shù):
:
錄音功能是智能終端的一項(xiàng)基本的常用功能,很多場合都需要采用錄音功能,例如各類會議、培訓(xùn)以及通話通信中。但是目前錄音后的錄音內(nèi)容整理卻比較繁瑣,往往需要整理人去再次聽取或甄別錄音內(nèi)容以區(qū)分不同發(fā)言人。甚至,在甄別時(shí)也經(jīng)常會搞不清楚是哪位發(fā)言人的聲音;而且會議中同一發(fā)言人經(jīng)常不會連續(xù)的時(shí)段連續(xù)發(fā)言,經(jīng)常是在不同的時(shí)段進(jìn)行發(fā)言,如此就會為錄音內(nèi)容的整理帶來較大的工作量和很多不便。
技術(shù)實(shí)現(xiàn)要素:
:
本發(fā)明的實(shí)施例提供了一種音頻數(shù)據(jù)的處理方法和終端,能夠根據(jù)識別的標(biāo)記信息,提取采集的音頻數(shù)據(jù)的相應(yīng)時(shí)間內(nèi)的音頻數(shù)據(jù)進(jìn)行單獨(dú)保存,解決了錄音內(nèi)容的整理甄別工作的繁瑣和困難,提高了錄音內(nèi)容整理和收聽的高辨識性。
本發(fā)明實(shí)施例提供了一種音頻數(shù)據(jù)處理方法,包括:
識別標(biāo)記信息,其中,所述標(biāo)記信息包括標(biāo)記信息的內(nèi)容信息和識別所述標(biāo)記信息的時(shí)刻信息;
提取采集的被標(biāo)記有所述標(biāo)記信息的音頻數(shù)據(jù)并保存。
本發(fā)明另一實(shí)施例提供了一種終端,包括,識別模塊和處理模塊,其中,
所述識別模塊,用于識別標(biāo)記信息,其中,所述標(biāo)記信息包括標(biāo)記信息的內(nèi)容信息和識別所述標(biāo)記信息的時(shí)刻信息;
所述處理模塊,用于提取采集的被標(biāo)記有所述標(biāo)記信息的音頻數(shù)據(jù)并保存。
本發(fā)明實(shí)施例所提供的音頻數(shù)據(jù)處理方法和終端,能夠?qū)浺魞?nèi)容進(jìn)行標(biāo)記并將采集的被標(biāo)記的音頻數(shù)據(jù)進(jìn)行提取保存,為會議等其他錄音資料的整理提供了很大的便利,能夠極大的減少錄音內(nèi)容整理的繁雜,提高錄音內(nèi)容整理的工作效率,也提高了錄音內(nèi)容收聽的高辨識性。
附圖說明
附圖用來提供對本發(fā)明技術(shù)方案的進(jìn)一步理解,并且構(gòu)成說明書的一部分,與本申請的實(shí)施例共同用于解釋本發(fā)明的技術(shù)方案,并不構(gòu)成對本發(fā)明技術(shù)方案的限制。
圖1是本發(fā)明實(shí)施例中音頻數(shù)據(jù)處理方法的流程圖。
圖2是本發(fā)明另一實(shí)施例中錄音標(biāo)記信息輸入界面的示意圖。
圖3是本發(fā)明實(shí)施例中終端的示意圖。
具體實(shí)施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,下文中將結(jié)合附圖對本發(fā)明的實(shí)施例進(jìn)行詳細(xì)說明。需要說明的是,在不沖突的情況下,本申請中的實(shí)施例及實(shí)施例中的特征可以相互任意組合。
圖1是本發(fā)明實(shí)施例中的音頻數(shù)據(jù)處理方法的流程圖,如圖1所示,本發(fā)明實(shí)施例所述方法包括:
s10、識別標(biāo)記信息,其中,所述標(biāo)記信息包括標(biāo)記信息的內(nèi)容信息和識別所述標(biāo)記信息的時(shí)刻信息;
s20、提取采集的被標(biāo)記有所述標(biāo)記信息的音頻數(shù)據(jù)并保存。
其中,所述音頻數(shù)據(jù)從識別所述標(biāo)記信息時(shí)刻點(diǎn)開始采集。
在第一實(shí)施例中,所述識別標(biāo)記信息包括:
在終端屏幕黑屏待機(jī)時(shí),接收用戶輸入的手勢標(biāo)記信息;
識別所述手勢標(biāo)記信息,并記錄所述手勢標(biāo)記信息的圖像內(nèi)容和接收手勢標(biāo)記信息的時(shí)刻。
進(jìn)一步地,所述接收用戶輸入的手勢標(biāo)記信息,識別所述手勢標(biāo)記信息包括:
接收用戶輸入的英文字母手勢標(biāo)記信息;
識別提取的所述英文字母手勢圖像的邊緣信息點(diǎn)并顯示所述英文字母手勢圖像。
更具體來說,在終端黑屏狀態(tài)且后臺錄音時(shí),即接收用戶指令啟動(dòng)手機(jī)錄音機(jī)開始錄音,并將錄音應(yīng)用處于后臺運(yùn)行,終端處于鎖屏且屏幕背光熄滅后,終端的顯示屏仍然可通電工作時(shí),識別屏幕上是否有字母手勢輸入,是則觸摸屏從字母手勢圖像的邊緣信息中提取關(guān)鍵點(diǎn)對手勢進(jìn)行識別,顯示屏上則會顯示出相應(yīng)的字母手勢圖像,此時(shí)屏幕背光不需要點(diǎn)亮。例如,在會議錄音中“張明”發(fā)言時(shí),識別用戶在屏幕上分別輸入“z”和“m”字母手勢,這里的“z”和“m”是用戶依次輸入,中間間隔時(shí)間較短,終端可將“zm”識別為一個(gè)完整的標(biāo)記信息。
在第二實(shí)施例中,所述識別標(biāo)記信息包括:
調(diào)用錄音標(biāo)記信息輸入界面并接收輸入的標(biāo)記信息;
識別所述標(biāo)記信息,并記錄所述標(biāo)記信息的內(nèi)容和接收所述標(biāo)記信息的時(shí)刻。
具體來說,在終端待機(jī)亮屏且后臺錄音時(shí),即接收用戶指令啟動(dòng)錄音機(jī)開始錄音,并將錄音應(yīng)用處于后臺運(yùn)行,終端處于待機(jī)界面且屏幕背光未熄滅時(shí),可接收用戶請求調(diào)用錄音標(biāo)記信息輸入界面輸入錄音標(biāo)記信息并識別確認(rèn)。具體地,根據(jù)用戶請求,在待機(jī)界面中調(diào)用并顯示標(biāo)記輸入懸浮界面,接收用戶的輸入操作,可以接收用戶在輸入?yún)^(qū)域內(nèi)通過手寫(也可以通過拼音、筆畫等方式)輸入的標(biāo)記信息(不限于文字信息,也可以包括數(shù)字、字母及符號等)。例如,在會議錄音情景下若是“張明”發(fā)言,接收用戶在輸入?yún)^(qū)域內(nèi)的輸入操作“張明或zm”,如圖2所示。
在本發(fā)明另一實(shí)施例中,在所述識別至少兩個(gè)不同標(biāo)記信息后,所述方法還包括:
匹配所述標(biāo)記信息與預(yù)存在被錄音者信息庫中的信息并生成匹配關(guān)系;其中,所述被錄音者身份信息庫為預(yù)存有被錄音者身份信息的數(shù)據(jù)庫;
根據(jù)所述匹配關(guān)系,將與所述標(biāo)記信息匹配的被錄音者身份信息標(biāo)記在所述采集的音頻數(shù)據(jù)中。
進(jìn)一步地,所述匹配所述標(biāo)記信息與預(yù)存在被錄音者信息庫中的信息并生成匹配關(guān)系包括:提取所述標(biāo)記信息中的內(nèi)容信息;將所述內(nèi)容信息與預(yù)存在被錄音者信息庫中的被錄音者身份信息進(jìn)行匹配并生成匹配關(guān)系。具體為:
提取所述標(biāo)記信息中內(nèi)容信息,將所述內(nèi)容信息與在錄音前事先預(yù)存在終端內(nèi)的被錄音者身份信息的數(shù)據(jù)庫中進(jìn)行匹配,并生成所述第一標(biāo)記信息與其相匹配的被錄音者身份信息的匹配關(guān)系,其中所述匹配關(guān)系中的身份信息包括但不限于姓名信息、頭像信息、代號信息等身份信息。例如提取所述第一標(biāo)記信息“12:10;zm”中的內(nèi)容信息“zm”,與預(yù)存的被錄音者信息庫中的被錄音者張明的身份信息生成匹配關(guān)系。
進(jìn)一步地,所述提取采集的被標(biāo)記有所述標(biāo)記信息的音頻數(shù)據(jù)并保存包括:
識別第一標(biāo)記信息后,將與所述第一標(biāo)記信息匹配的第一被錄音者身份信息標(biāo)記在所述采集的音頻數(shù)據(jù)中;
識別第二標(biāo)記信息后,提取從識別所述第一標(biāo)記信息的時(shí)刻點(diǎn)至識別所述第二標(biāo)記信息時(shí)刻點(diǎn)的時(shí)段內(nèi)采集的音頻數(shù)據(jù);同時(shí)將與所述第二標(biāo)記信息匹配的第二被錄音者身份信息標(biāo)記在所述采集的音頻數(shù)據(jù)中;
保存所述提取的音頻數(shù)據(jù);其中所述保存的音頻數(shù)據(jù)的命名為與所述第一標(biāo)記信息匹配的第一被錄音者身份信息;其中所述被錄音者身份信息包括:所述第一被錄音者的姓名信息和/或頭像信息;
識別第三標(biāo)記信息后,提取從識別所述第二標(biāo)記信息的時(shí)刻點(diǎn)至識別所述第三標(biāo)記信息時(shí)刻點(diǎn)的時(shí)段內(nèi)采集的音頻數(shù)據(jù)并保存為命名為與所述第二標(biāo)記信息匹配的第二被錄音者的身份信息;
其中,所述識別第二標(biāo)記信息的時(shí)刻為所述以第一被錄音者的身份信息命名的音頻數(shù)據(jù)的采集終點(diǎn)時(shí)刻,為所述第二文件音頻數(shù)據(jù)的采集起點(diǎn)時(shí)刻。
為更詳細(xì)介紹上述實(shí)施例,現(xiàn)進(jìn)行具體說明如下:識別所述第二標(biāo)記信息后,根據(jù)所述第一標(biāo)記信息和所述第二標(biāo)記信息各自的時(shí)刻信息按照時(shí)間順序,首先將從識別所述第一標(biāo)記信息的時(shí)刻點(diǎn)到識別所述第二標(biāo)記信息的時(shí)刻點(diǎn)這一時(shí)段內(nèi)采集的音頻數(shù)據(jù)提取保存為以所述第一標(biāo)記信息相匹配的 第一錄音者的身份信息命名的音頻文件,可以稱之為即第一文件,其中所述音頻文件中記錄著采集過程中的時(shí)刻信息,其中所述第一文件的標(biāo)記名稱可以是第一被錄音者的姓名信息、頭像信息或工號信息或是多種身份信息的組合。而所述第二個(gè)標(biāo)記信息的時(shí)刻點(diǎn)則作為繼續(xù)采集的音頻數(shù)據(jù)的起始標(biāo)記點(diǎn)。例如,所述第一標(biāo)記信息為“12:00;zm”,所述第二標(biāo)記信息為“12:00,lh”,識別所述第二標(biāo)記信息后,提取12:00—12:10時(shí)段內(nèi)采集的音頻數(shù)據(jù)并保存為以所述第一標(biāo)記信息的內(nèi)容相匹配的錄音者張明的姓名“張明”命名的音頻文件。此外,若在會議錄音中,若同一發(fā)言人在不同時(shí)段均有發(fā)言,則可采用上述音頻數(shù)據(jù)處理方法,但可將根據(jù)內(nèi)容信息相同的標(biāo)記信息而采集的音頻文件提取保存為名稱是所述同一錄音者的身份信息和序列號的組合的音頻文件,例如張明-1、張明-2等。
在一特殊實(shí)施例中,若識別第一標(biāo)記信息后,再未接收到用戶的輸入操作,即未識別第二標(biāo)記信息就直接停止或結(jié)束音頻采集,則也可將從識別所述第一標(biāo)記信息時(shí)刻點(diǎn)到結(jié)束音頻數(shù)據(jù)采集時(shí)刻點(diǎn)的時(shí)段內(nèi)采集的音頻數(shù)據(jù)提取保存為一個(gè)音頻數(shù)據(jù)文件。
在一較優(yōu)實(shí)施例中,所述提取采集的被標(biāo)記有所述標(biāo)記信息的音頻數(shù)據(jù)并保存包括:
將識別的第三標(biāo)記信息、第四標(biāo)記信息、第五標(biāo)記信息和第六標(biāo)記信息分別標(biāo)記在采集的音頻數(shù)據(jù)中;其中,所述第三標(biāo)記信息的時(shí)刻信息為第三時(shí)刻點(diǎn),所述第四標(biāo)記信息的時(shí)刻信息為第四時(shí)刻點(diǎn),所述第五標(biāo)記信息的時(shí)刻信息為第五時(shí)刻點(diǎn),所述第六標(biāo)記信息的標(biāo)記信息為第六時(shí)刻點(diǎn);
結(jié)束音頻采集后,檢測所述第三標(biāo)記信息的內(nèi)容信息和所述第五標(biāo)記信息的內(nèi)容信息是否相同;是則,
提取所述第三時(shí)刻點(diǎn)至第四時(shí)刻點(diǎn)時(shí)段內(nèi)和所述第五時(shí)刻點(diǎn)至所述第六時(shí)刻點(diǎn)時(shí)段內(nèi)采集的音頻數(shù)據(jù);
按照所述各時(shí)刻點(diǎn)的時(shí)刻順序,合并保存所述提取的各音頻數(shù)據(jù)為一個(gè)音頻數(shù)據(jù);其中,所述合并保存的音頻數(shù)據(jù)的命名為與所述第三標(biāo)記信息或所述第五標(biāo)記信息相匹配的被錄音者的身份信息;
否則,將標(biāo)記有所述各標(biāo)記信息的音頻數(shù)據(jù)以相鄰的兩個(gè)標(biāo)記信息作為 分割點(diǎn),即將標(biāo)記有所述第三標(biāo)記信息、第四標(biāo)記信息、第五標(biāo)記信息和第六標(biāo)記信息的音頻數(shù)據(jù)分割為第三時(shí)刻到第四時(shí)刻、第四時(shí)刻到第五時(shí)刻、第五時(shí)刻到第六時(shí)刻三個(gè)時(shí)段的音頻數(shù)據(jù);提取所述每一時(shí)段的音頻數(shù)據(jù),并保存所述提取的各音頻數(shù)據(jù),其中保存的各音頻文件以其前一時(shí)刻點(diǎn)的標(biāo)記信息相匹配的被錄音者的身份信息進(jìn)行命名,例如將第四時(shí)刻點(diǎn)到第五時(shí)刻點(diǎn)時(shí)段內(nèi)的音頻數(shù)據(jù)提取保存為名稱為與所述第四標(biāo)記信息相匹配的被錄音者的身份信息音頻文件。
在本發(fā)明另一實(shí)施例中,所述方法還包括:
將所述標(biāo)記信息的內(nèi)容信息轉(zhuǎn)換為語音信息并保存;其中所述語音信息與采集的音頻數(shù)據(jù)被保存在不同音軌;
將保存所述語音信息的第一音軌和保存所述采集的音頻數(shù)據(jù)的第二音軌合并生成并保存為一個(gè)新的音頻文件。其中,所述保存所述標(biāo)記信息轉(zhuǎn)換的語音信息的音軌為音軌1;保存所述采集的音頻文件的音軌為音軌2;所述音軌1保存所述標(biāo)記信息的語音信息,對采集的音頻數(shù)據(jù)不做保存處理。
現(xiàn)對上述實(shí)施例展開詳細(xì)介紹,終端識別上一個(gè)標(biāo)記信息后記錄所述上一個(gè)標(biāo)記信息的內(nèi)容信息和時(shí)刻信息,并將所述上一個(gè)標(biāo)記信息的內(nèi)容信息轉(zhuǎn)換為語音信息并保存于音軌1;同時(shí),以所述上一個(gè)標(biāo)記信息的時(shí)刻點(diǎn)為標(biāo)記起始點(diǎn),以識別的下一個(gè)標(biāo)記信息的時(shí)刻點(diǎn)為標(biāo)記的終結(jié)點(diǎn),將根據(jù)所述上一個(gè)標(biāo)記信息采集的音頻數(shù)據(jù)進(jìn)行標(biāo)記并提取保存于音軌2;后根據(jù)標(biāo)記信息的時(shí)刻信息的先后順序,將音軌1和音軌2上保存的音頻數(shù)據(jù)合并保存形成一個(gè)新的音頻文件,其中在播放所述新的音頻文件時(shí)可將將音軌1和音軌2做分離處理,使得音軌1對應(yīng)左聲道,音軌2對應(yīng)右聲道,采用多聲道設(shè)備進(jìn)行播放,其中左聲道播放音軌1保存的標(biāo)記信息的內(nèi)容信息轉(zhuǎn)換的語音,右聲道正常播放錄音。
本發(fā)明另一實(shí)施例中,所述將保存所述語音信息的第一音軌和保存所述采集的音頻數(shù)據(jù)的第二音軌合并生成并保存為一個(gè)新的音頻文件之前還包括:
匹配所述標(biāo)記信息與預(yù)存在被錄音者信息庫中的信息并生成匹配關(guān)系;其中,所述被錄音者身份信息庫為預(yù)存有被錄音者身份信息的數(shù)據(jù)庫;根據(jù) 所述匹配關(guān)系,將與所述標(biāo)記信息匹配的被錄音者身份信息標(biāo)記在所述采集的音頻數(shù)據(jù)中;提取并保存所述采集的音頻數(shù)據(jù)在第二音軌,即音軌2上。
具體過程為:記錄識別的標(biāo)記信息并將其轉(zhuǎn)換為語音文件,具體地,記錄識別的標(biāo)記信息的時(shí)刻點(diǎn),并在采集音頻的音軌1上標(biāo)記該時(shí)刻點(diǎn),并生成標(biāo)記信息的時(shí)刻點(diǎn)信息、標(biāo)記信息的內(nèi)容信息和保存位置信息之間的對應(yīng)關(guān)系列表,同時(shí)將所述標(biāo)記信息的內(nèi)容信息轉(zhuǎn)換為對應(yīng)的語音文件;匹配所述標(biāo)記信息的內(nèi)容信息與預(yù)存在被錄音者信息庫中的被錄音者的身份信息并生成匹配關(guān)系;根據(jù)所述對應(yīng)關(guān)系列表和所述匹配關(guān)系,將所述轉(zhuǎn)化的語音信息新增到所述匹配關(guān)系中生成新的所述語音信息與所述被錄音者身份信息相匹配的新的映射關(guān)系。根據(jù)所述映射關(guān)系,將與所述標(biāo)記信息匹配的被錄音者身份信息標(biāo)記在所述采集的音頻數(shù)據(jù)中,并提取保存于第二音軌,即音軌2;后根據(jù)標(biāo)記在音軌1和音軌2上的標(biāo)記時(shí)刻點(diǎn),將所述音軌1和音軌2合并保存為一個(gè)新的音頻文件,其中所述新的音頻文件的命名為與所述識別的標(biāo)記信息相匹配的被錄音者的身份信息;其中,所述新的音頻文件在播放時(shí)可將音軌1和音軌2做分離處理,采用多聲道設(shè)備進(jìn)行播放。
此外,在本發(fā)明的另一實(shí)施例中,所述將所述標(biāo)記信息的內(nèi)容信息轉(zhuǎn)換為語音信息并保存;其中所述語音信息與采集的音頻數(shù)據(jù)被保存在不同音軌上還包括:在第二音軌上按照現(xiàn)有技術(shù)正常錄音并保存。具體為:記錄識別的標(biāo)記信息并將其轉(zhuǎn)換為語音文件,具體地,記錄識別的標(biāo)記信息的時(shí)刻點(diǎn),并在采集音頻的音軌1上標(biāo)記該時(shí)刻點(diǎn),并生成標(biāo)記信息的時(shí)刻點(diǎn)信息、標(biāo)記信息的內(nèi)容信息和保存位置信息之間的對應(yīng)關(guān)系列表,同時(shí)將所述標(biāo)記信息的內(nèi)容信息轉(zhuǎn)換為對應(yīng)的語音文件;匹配所述標(biāo)記信息的內(nèi)容信息與預(yù)存在被錄音者信息庫中的被錄音者的身份信息并生成匹配關(guān)系;根據(jù)所述對應(yīng)關(guān)系列表和所述匹配關(guān)系,將所述轉(zhuǎn)化的語音信息新增到所述匹配關(guān)系中生成新的所述語音信息與所述被錄音者身份信息相匹配的新的映射關(guān)系;同時(shí)音軌2上仍然保持著正常的后臺錄音。所述音軌1只負(fù)責(zé)錄制插入的標(biāo)記信息匹配的語音文件,不錄制被錄音者的聲音信息;音軌2則繼續(xù)正常錄音;錄音完畢,將音軌1和音軌2保存生成一個(gè)新的錄音文件。在播放所述新的錄音文件時(shí)將音軌1和音軌2做分離處理,使得音軌1對應(yīng)左聲道,音軌2 對應(yīng)右聲道,采用多聲道設(shè)備進(jìn)行播放錄音,左聲道播放音軌1語音信息,右聲道正常播放錄音。例如所述標(biāo)記信息的轉(zhuǎn)化的語文信息為“張明”,則當(dāng)用戶插入耳機(jī)播放錄音時(shí),耳機(jī)的左聲道在標(biāo)記的某一時(shí)刻點(diǎn)上會播放“張明”的語音內(nèi)容,右聲道則播放發(fā)言人的錄音內(nèi)容。
圖3是本發(fā)明實(shí)施例中終端的示意圖,如圖3所示,本實(shí)施例的終端包括:識別模塊1和處理模塊2;其中,
所述識別模塊,用于識別標(biāo)記信息,其中,所述標(biāo)記信息包括標(biāo)記信息的內(nèi)容信息和識別所述標(biāo)記信息的時(shí)刻信息;
所述處理模塊,用于提取采集的被標(biāo)記有所述標(biāo)記信息的音頻數(shù)據(jù)并保存。
所述識別模塊,用于識別至少兩個(gè)不同標(biāo)記信息;
所述處理模塊,用于根據(jù)所述不同標(biāo)記信息,將采集的音頻數(shù)據(jù)進(jìn)行標(biāo)記并分別單獨(dú)保存。
其中,所述識別模塊包括:接收單元和識別單元;其中,
所述接收單元,用于在終端屏幕黑屏待機(jī)時(shí),接收用戶輸入的手勢標(biāo)記信息;
所述識別單元,用于識別所述手勢標(biāo)記信息,并記錄所述手勢標(biāo)記信息的圖像內(nèi)容和接收手勢標(biāo)記信息的時(shí)刻;
具體地,所述接收單元用于接收用戶輸入的英文字母手勢標(biāo)記信息;所述識別單元,還用于識別提取的所述英文字母手勢圖像的邊緣信息點(diǎn)并顯示所述英文字母手勢圖像。
本發(fā)明另一實(shí)施例中,所述識別模塊的接收單元和識別單元還用于:
所述接收單元,用于調(diào)用錄音標(biāo)記信息輸入界面并接收輸入的標(biāo)記信息;
所述識別單元,用于識別所述標(biāo)記信息,并記錄所述標(biāo)記信息的內(nèi)容和接收所述標(biāo)記信息的時(shí)刻。
在較優(yōu)實(shí)施例中,所述終端還包括:存儲模塊3和匹配模塊4,其中,
所述存儲模塊,用于存儲預(yù)存有被錄音者身份信息的數(shù)據(jù)庫;
所述匹配模塊,用于根據(jù)所述匹配關(guān)系,將與所述標(biāo)記信息匹配的被錄音者身份信息標(biāo)記在所述采集的音頻數(shù)據(jù)中。
進(jìn)一步地,在較優(yōu)實(shí)施例中,所述終端的所述處理模塊包括:標(biāo)記單元、提取單元和保存單元;其中
所述標(biāo)記單元,用于識別第一標(biāo)記信息后,將與所述第一標(biāo)記信息匹配的第一被錄音者身份信息標(biāo)記在所述采集的音頻數(shù)據(jù)中;
所述提取單元,用于識別第二標(biāo)記信息后,提取從識別所述第一標(biāo)記信息的時(shí)刻點(diǎn)至識別所述第二標(biāo)記信息時(shí)刻點(diǎn)的時(shí)段內(nèi)采集的音頻數(shù)據(jù);
所述保存單元,用于保存所述提取的音頻數(shù)據(jù);其中所述保存的音頻數(shù)據(jù)的命名為與所述第一標(biāo)記信息匹配的第一被錄音者身份信息;其中所述被錄音者身份信息包括:所述第一被錄音者的姓名信息和/或頭像信息。
在另一較優(yōu)實(shí)施例中,所述處理模塊的包括標(biāo)記單元、判斷單元、提取單元和保存單元;其中,
所述標(biāo)記單元,用于將識別的第三標(biāo)記信息、第四標(biāo)記信息、第五標(biāo)記信息和第六標(biāo)記信息分別標(biāo)記在采集的音頻數(shù)據(jù)中;其中,所述第三標(biāo)記信息的時(shí)刻信息為第三時(shí)刻點(diǎn),所述第四標(biāo)記信息的時(shí)刻信息為第四時(shí)刻點(diǎn),所述第五標(biāo)記信息的時(shí)刻信息為第五時(shí)刻點(diǎn),所述第六標(biāo)記信息的標(biāo)記信息為第六時(shí)刻點(diǎn);
所述判斷單元,用于在結(jié)束音頻采集后,檢測所述第三標(biāo)記信息的內(nèi)容信息和所述第五標(biāo)記信息的內(nèi)容信息是否相同;是則,
所述提取單元,用于提取所述第三時(shí)刻點(diǎn)至第四時(shí)刻點(diǎn)時(shí)段內(nèi)和所述第五時(shí)刻點(diǎn)至所述第六時(shí)刻點(diǎn)時(shí)段內(nèi)采集的音頻數(shù)據(jù);
所述保存單元,用于按照所述各時(shí)刻點(diǎn)的時(shí)刻順序,合并保存所述提取的各音頻數(shù)據(jù)為一個(gè)音頻數(shù)據(jù);其中,所述合并保存的音頻數(shù)據(jù)的命名為與所述第三標(biāo)記信息或所述第五標(biāo)記信息相匹配的被錄音者的身份信息。
在另一實(shí)施例中,所述處理模塊還用于將所述標(biāo)記信息的內(nèi)容信息轉(zhuǎn)換為語音信息并保存;其中所述語音信息與采集的音頻數(shù)據(jù)被保存在不同音軌;
將保存所述語音信息的第一音軌和保存所述采集的音頻數(shù)據(jù)的第二音軌合并生成并保存為一個(gè)新的音頻文件。
本發(fā)明實(shí)施例提供了一種音頻數(shù)據(jù)處理方法和終端,能夠在錄音過程中,根據(jù)識別的標(biāo)記信息匹配預(yù)存的被錄音者身份信息生成匹配關(guān)系,根據(jù)匹配 關(guān)系將采集的音頻文件進(jìn)行標(biāo)記并提取保存,解決了錄音過程中不能區(qū)分具體被錄音人的身份,也解決了錄音內(nèi)容整理工作的繁瑣,提高了錄音內(nèi)容整理工作的效率。
本領(lǐng)域普通技術(shù)人員可以理解上述方法中的全部或部分步驟,可通過程序來指令相關(guān)硬件完成,所述程序可以存儲于計(jì)算機(jī)可讀存儲介質(zhì)中,如只讀存儲器、磁盤或光盤等。相應(yīng)地,上述實(shí)施例中的各模塊可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。本發(fā)明不限制于任何特定形式的硬件和軟件的結(jié)合。
以上僅為本發(fā)明的優(yōu)選實(shí)施例,當(dāng)然,本發(fā)明還可有其他多種實(shí)施例,在不背離本發(fā)明精神及其實(shí)質(zhì)的情況下,熟悉本領(lǐng)域的技術(shù)人員當(dāng)可根據(jù)本發(fā)明作出各種相應(yīng)的改變和變形,但這些相應(yīng)的改變和變形都應(yīng)屬于本發(fā)明所附的權(quán)利要求的保護(hù)范圍。