本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,特別涉及一種視頻數(shù)據(jù)處理方法及裝置。
背景技術(shù):
經(jīng)過近幾年互聯(lián)網(wǎng)視頻的發(fā)展,網(wǎng)絡(luò)視頻資源需求量也逐步增多,這就對視頻數(shù)據(jù)處理的效率也有了更高的要求。而目前互聯(lián)網(wǎng)視頻數(shù)據(jù)處理過程主要還是將一個視頻作為整體進(jìn)行數(shù)據(jù)處理,而多數(shù)視頻的時長通常較大,導(dǎo)致視頻編輯時間也較長,效率低下,并且技術(shù)人員得到整個視頻數(shù)據(jù)后,容易造成視頻版權(quán)的泄露。
技術(shù)實現(xiàn)要素:
本發(fā)明提供一種視頻數(shù)據(jù)處理方法及裝置,用以提高視頻數(shù)據(jù)處理效率,防止視頻版權(quán)泄露。
根據(jù)本發(fā)明實施例的第一方面,提供一種視頻數(shù)據(jù)處理方法,可包括:
從所述視頻數(shù)據(jù)中識別出語音數(shù)據(jù);
按照在視頻數(shù)據(jù)中的時間順序?qū)⑺稣Z音數(shù)據(jù)依序分段,獲得至少一個語音數(shù)據(jù)段,每個語音數(shù)據(jù)段的時長等于或小于預(yù)設(shè)時長;
將所述至少一個語音數(shù)據(jù)段分別發(fā)送給不同的處理部件,所述處理部件用于對自身接收到的語音數(shù)據(jù)段進(jìn)行文字識別處理;
接收所述處理設(shè)備各自傳送來的文字識別結(jié)果和相應(yīng)的語音數(shù)據(jù)段的信息;
將接收到的文字識別結(jié)果按照相應(yīng)的語音數(shù)據(jù)段在視頻數(shù)據(jù)中的時間順序,進(jìn)行拼接處理;
獲取所述視頻數(shù)據(jù)的字幕信息。
在一個實施例中,所述處理部件可包括處理設(shè)備和/或處理程序。
在一個實施例中,所述按照在視頻數(shù)據(jù)中的時間順序?qū)⑺稣Z音數(shù)據(jù)依序分段,獲得至少一個語音數(shù)據(jù)段之后,可包括:
對至少一個語音數(shù)據(jù)段分別進(jìn)行標(biāo)識處理,獲得每個語音數(shù)據(jù)段的標(biāo)識;
所述將所述至少一個語音數(shù)據(jù)段分別發(fā)送給不同的處理部件的同時,還可包括:
將所述語音數(shù)據(jù)段的標(biāo)識同時發(fā)送給處理該語音數(shù)據(jù)段的處理部件;
所述接收所述處理設(shè)備各自傳送來的文字識別結(jié)果和相應(yīng)的語音數(shù)據(jù)段的信息,可包括:
接收所述處理設(shè)備各自傳送來的文字識別結(jié)果和相應(yīng)的語音數(shù)據(jù)段的標(biāo)識。
在一個實施例中,所述將接收到的文字識別結(jié)果按照相應(yīng)的語音數(shù)據(jù)段在視頻數(shù)據(jù)中的時間順序,進(jìn)行拼接處理,可包括:
將所述字幕信息與原視頻數(shù)據(jù)進(jìn)行整合。
根據(jù)本發(fā)明實施例的第二方面,提供一種視頻數(shù)據(jù)處理裝置,可包括:
識別模塊,用于從所述視頻數(shù)據(jù)中識別出語音數(shù)據(jù);
分段模塊,用于按照在視頻數(shù)據(jù)中的時間順序?qū)⑺稣Z音數(shù)據(jù)依序分段,獲得至少一個語音數(shù)據(jù)段,每個語音數(shù)據(jù)段的時長等于或小于預(yù)設(shè)時長;
發(fā)送模塊,用于將所述至少一個語音數(shù)據(jù)段分別發(fā)送給不同的處理部件,所述處理部件用于對自身接收到的語音數(shù)據(jù)段進(jìn)行文字識別處理;
接收模塊,用于接收所述處理設(shè)備各自傳送來的文字識別結(jié)果和相應(yīng)的語音數(shù)據(jù)段的信息;
處理模塊,用于將接收到的文字識別結(jié)果按照相應(yīng)的語音數(shù)據(jù)段在視頻數(shù)據(jù)中的時間順序,進(jìn)行拼接處理;
獲取模塊,用于獲取所述視頻數(shù)據(jù)的字幕信息。
在一個實施例中,所述處理部件可包括處理設(shè)備和/或處理程序。
在一個實施例中,所述分段模塊,可包括:
標(biāo)識子模塊,用于對至少一個語音數(shù)據(jù)段分別進(jìn)行標(biāo)識處理,獲得每個語
音數(shù)據(jù)段的標(biāo)識;
所述發(fā)送模塊,可包括:
發(fā)送子模塊,用于將所述語音數(shù)據(jù)段的標(biāo)識同時發(fā)送給處理該語音數(shù)據(jù)段的處理部件;
所述接收模塊,可包括:
接收子模塊,用于接收所述處理設(shè)備各自傳送來的文字識別結(jié)果和相應(yīng)的語音數(shù)據(jù)段的標(biāo)識。
在一個實施例中,所述處理模塊,可包括:
整合子模塊,用于將所述字幕信息與原視頻數(shù)據(jù)進(jìn)行整合。
本發(fā)明實施例提供的技術(shù)方案可產(chǎn)生以下有益效果:通過從視頻數(shù)據(jù)中識別出語音數(shù)據(jù);按照在視頻數(shù)據(jù)中的時間順序?qū)⑺稣Z音數(shù)據(jù)依序分段,獲得至少一個語音數(shù)據(jù)段,每個語音數(shù)據(jù)段的時長等于或小于預(yù)設(shè)時長;將所述至少一個語音數(shù)據(jù)段分別發(fā)送給不同的處理部件,所述處理部件用于對自身接收到的語音數(shù)據(jù)段進(jìn)行文字識別處理;接收所述處理設(shè)備各自傳送來的文字識別結(jié)果和相應(yīng)的語音數(shù)據(jù)段的信息;將接收到的文字識別結(jié)果按照相應(yīng)的語音數(shù)據(jù)段在視頻數(shù)據(jù)中的時間順序,進(jìn)行拼接處理;獲取所述視頻數(shù)據(jù)的字幕信息。即分段對視頻中的語音數(shù)據(jù)進(jìn)行處理并生成字幕信息,從而使視頻編輯人員可以相互獨立地對各分段視頻進(jìn)行編輯,不僅提高了視頻數(shù)據(jù)處理工作的效率,還能有效防止視頻版權(quán)的泄露。
本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過在所寫的說明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。
下面通過附圖和實施例,對本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
附圖說明
附圖用來提供對本發(fā)明的進(jìn)一步理解,并且構(gòu)成說明書的一部分,與本發(fā)明的實施例一起用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的限制。在附圖中:
圖1為本發(fā)明根據(jù)一示例性實施例示出的視頻數(shù)據(jù)處理方法的流程圖;
圖2為本發(fā)明根據(jù)一示例性實施例示出的視頻數(shù)據(jù)處理裝置的框圖;
圖3為本發(fā)明根據(jù)一示例性實施例示出的另一視頻數(shù)據(jù)處理裝置的框圖;
圖4為本發(fā)明根據(jù)一示例性實施例示出的另一視頻數(shù)據(jù)處理裝置的框圖;
圖5為本發(fā)明根據(jù)一示例性實施例示出的另一視頻數(shù)據(jù)處理裝置的框圖;
圖6為本發(fā)明根據(jù)一示例性實施例示出的另一視頻數(shù)據(jù)處理裝置的框圖。
具體實施方式
以下結(jié)合附圖對本發(fā)明的優(yōu)選實施例進(jìn)行說明,應(yīng)當(dāng)理解,此處所描述的優(yōu)選實施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。
本公開實施例提供了一種視頻數(shù)據(jù)處理方法,該方法可用于視頻數(shù)據(jù)處理或者其它用于視頻數(shù)據(jù)處理的設(shè)備中,如圖1所示,該方法包括步驟S101-S106:
在步驟S101中,從視頻數(shù)據(jù)中識別出語音數(shù)據(jù)。
在步驟S102中,按照在視頻數(shù)據(jù)中的時間順序?qū)⑺稣Z音數(shù)據(jù)依序分段,獲得至少一個語音數(shù)據(jù)段,每個語音數(shù)據(jù)段的時長等于或小于預(yù)設(shè)時長。
例如,在一個時長為兩小時的視頻中,將該視頻平均分成10段,則分段后的每段視頻時長為12分鐘,即每個語音數(shù)據(jù)段的時長也是12分鐘。
在步驟S103中,將上述至少一個語音數(shù)據(jù)段分別發(fā)送給不同的處理部件,處理部件用于對自身接收到的語音數(shù)據(jù)段進(jìn)行文字識別處理。
例如,將上述步驟S102中分成的10個語音數(shù)據(jù)段,分別發(fā)送給10個處 理處理部件,并分別獨立地進(jìn)行數(shù)據(jù)處理,識別出各語音數(shù)據(jù)段中包含的語言信息,進(jìn)而生成文字形式的識別結(jié)果。
在步驟S104中,接收處理設(shè)備各自傳送來的文字識別結(jié)果和相應(yīng)的語音數(shù)據(jù)段的信息。
其中,語音數(shù)據(jù)段的信息可以是其在視頻中的位置或時長。
在步驟S105中,將接收到的文字識別結(jié)果按照相應(yīng)的語音數(shù)據(jù)段在視頻數(shù)據(jù)中的時間順序,進(jìn)行拼接處理。
在一個應(yīng)用場景中,由于各處理部件生成文字識別結(jié)果的用時不同,所以接收到的各數(shù)據(jù)段的順序并非是各自在原視頻中的順序,此時,需要對各視頻段按照各自在原視頻中的位置進(jìn)行重新排列。
在步驟S106中,獲取視頻數(shù)據(jù)的字幕信息。
其中,獲取到的字幕信息是連貫地、按照原視頻中音頻數(shù)據(jù)的播放順序進(jìn)行拼接排列后的整體。
上述方法的有益效果是,有效提高了視頻數(shù)據(jù)處理的效率,并且防止了視頻版權(quán)的泄露。
在一個實施例中,上述處理部件可包括處理設(shè)備和/或處理程序。
例如處理設(shè)備是可以是電子計算機、多媒體終端等,處理程序可以是AdobePremiere、會聲會影等。
在一個實施例中,步驟S102還可實施為:
對至少一個語音數(shù)據(jù)段分別進(jìn)行標(biāo)識處理,獲得每個語音數(shù)據(jù)段的標(biāo)識;
其中,標(biāo)識處理可以是記錄該音頻數(shù)據(jù)段在視頻中的位置或者某個特定幀對應(yīng)的音頻信號。
則此時,步驟S103可實施為:將語音數(shù)據(jù)段的標(biāo)識同時發(fā)送給處理該語音數(shù)據(jù)段的處理部件;
相應(yīng)地,步驟S104可實施為:接收所述處理設(shè)備各自傳送來的文字識別結(jié)果和相應(yīng)的語音數(shù)據(jù)段的標(biāo)識。
上述方法的有益效果是:提高各音頻數(shù)據(jù)段拼接的速度和準(zhǔn)確性,還方便技術(shù)人員日后對視頻進(jìn)行二次或多次編輯時,可以僅通過查找某個音頻數(shù)據(jù)段的標(biāo)識從而獲取整個視頻數(shù)據(jù)段,提高了編輯效率。
在一個實施例中,步驟S105還可實施為:
將所述字幕信息與原視頻數(shù)據(jù)進(jìn)行整合。
具體實施為將獲取的字幕信息與原視頻進(jìn)行合成處理,使視頻中的音頻與音頻數(shù)據(jù)對應(yīng)的字幕信息實現(xiàn)同步;此時步驟S106可實施為,獲取將字幕信息與原視頻數(shù)據(jù)進(jìn)行合成后的視頻。有益效果是使觀眾能夠更加全面的掌握視頻內(nèi)容。
對應(yīng)本發(fā)明實施例提供的視頻數(shù)據(jù)處理方法,本發(fā)明還提供視頻數(shù)據(jù)處理裝置,如圖2所示,該裝置可包括:
識別模塊21,用于從視頻數(shù)據(jù)中識別出語音數(shù)據(jù);
分段模塊22,用于按照在視頻數(shù)據(jù)中的時間順序?qū)⒄Z音數(shù)據(jù)依序分段,獲得至少一個語音數(shù)據(jù)段,每個語音數(shù)據(jù)段的時長等于或小于預(yù)設(shè)時長;
發(fā)送模塊23,用于將上述至少一個語音數(shù)據(jù)段分別發(fā)送給不同的處理部件,處理部件用于對自身接收到的語音數(shù)據(jù)段進(jìn)行文字識別處理;
接收模塊24,用于接收處理設(shè)備各自傳送來的文字識別結(jié)果和相應(yīng)的語音數(shù)據(jù)段的信息;
處理模塊25,用于將接收到的文字識別結(jié)果按照相應(yīng)的語音數(shù)據(jù)段在視頻數(shù)據(jù)中的時間順序,進(jìn)行拼接處理;
獲取模塊26,用于獲取視頻數(shù)據(jù)的字幕信息。
在一個實施例中,處理部件可包括處理設(shè)備和/或處理程序。
在一個實施例中,如圖3所示,分段模塊22可包括:
標(biāo)識子模塊221,用于對至少一個語音數(shù)據(jù)段分別進(jìn)行標(biāo)識處理,獲得每
個語音數(shù)據(jù)段的標(biāo)識;
如圖4所示,發(fā)送模塊23可包括:
發(fā)送子模塊231,用于將語音數(shù)據(jù)段的標(biāo)識同時發(fā)送給處理該語音數(shù)據(jù)段的處理部件;
如圖5所示,接收模塊24可包括:
接收子模塊241,用于接收處理設(shè)備各自傳送來的文字識別結(jié)果和相應(yīng)的語音數(shù)據(jù)段的標(biāo)識。
在一個實施例中,如圖6所示,處理模塊25可包括:
整合子模塊251,用于將字幕信息與原視頻數(shù)據(jù)進(jìn)行整合。
本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實施例可提供為方法、系統(tǒng)、或計算機程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器和光學(xué)存儲器等)上實施的計算機程序產(chǎn)品的形式。
本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設(shè)備(系統(tǒng))、和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些計算機程序指令也可存儲在能引導(dǎo)計算機或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個 流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進(jìn)行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。