一種多媒體文件制作、播放方法及智能終端的制作方法
【專利摘要】本發(fā)明提供一種多媒體文件制作、播放方法及智能終端,所述方法包括以下步驟:預(yù)設(shè)存儲有至少一個動態(tài)光效源文件的資料庫;采集音頻數(shù)據(jù)流,同時將采集的所述音頻數(shù)據(jù)流識別為字幕流信息,并予以緩存;建立緩存的所述音頻數(shù)據(jù)流和字幕流信息之間的同步關(guān)系以生成播放源文件;將所述播放源文件與所述動態(tài)光效源文件進(jìn)行關(guān)聯(lián)成多媒體文件,并將所述多媒體文件存儲至所述資料庫。本發(fā)明的多媒體文件制作、播放方法及智能終端,可以實(shí)現(xiàn)按照錄入的語音能正確的顯示字幕出來,不但確保了語音記錄的高準(zhǔn)確率,還能在播放時隨著屏幕色彩的變幻循環(huán)在顯示屏上循環(huán)滾動,進(jìn)而提高了智能終端的娛樂性和用戶體驗(yàn)。
【專利說明】一種多媒體文件制作、播放方法及智能終端
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種智能終端,特別是涉及一種多媒體文件制作、播放方法及智能終端。
【背景技術(shù)】
[0002]手機(jī)是一種常用的移動終端,隨著手機(jī)普及率的提高,人們對手機(jī)性能要求的期望值越來越高,手機(jī)不僅僅成為人們隨身攜帶的必備通信工具,更多地作為一種具有娛樂或者消遣類的電子產(chǎn)品而使用,因而設(shè)計(jì)人性化的手機(jī)已成為各類人群工作、生活、社交不可或缺的得力助手,進(jìn)而對手機(jī)的功能提出了更多的要求。
【發(fā)明內(nèi)容】
[0003]鑒于以上所述現(xiàn)有技術(shù)的缺點(diǎn),本發(fā)明的目的在于提供一種多媒體文件制作、播放方法及智能終端,用于實(shí)現(xiàn)錄入的語音正確播放出來的同時顯示字幕并伴隨屏幕的色彩變幻而循環(huán)滾動的目的。
[0004]為實(shí)現(xiàn)上述目的及其他相關(guān)目的,本發(fā)明提供一種多媒體文件制作方法,包括以下步驟:預(yù)設(shè)存儲有至少一個動態(tài)光效源文件的資料庫;采集音頻數(shù)據(jù)流,同時將采集的所述音頻數(shù)據(jù)流識別為字幕流信息,并予以緩存;建立緩存的所述音頻數(shù)據(jù)流和字幕流信息之間的同步關(guān)系以生成播放源文件;將所述播放源文件與所述動態(tài)光效源文件進(jìn)行關(guān)聯(lián)成多媒體文件,并將所述多媒體文件存儲至所述資料庫。
[0005]優(yōu)選地,所述的將采集的所述音頻數(shù)據(jù)識別為文字信息步驟進(jìn)一步包括:將采集的音頻數(shù)據(jù)流以秒為單位劃分為多個數(shù)據(jù)塊,并標(biāo)注各該數(shù)據(jù)塊的錄入時序;將各該數(shù)據(jù)塊識別為文字,并標(biāo)注所述文字的識別時序;依據(jù)所述的識別時序?qū)⑽淖诌M(jìn)行排序以生成字幕流信息;緩存采集的音頻數(shù)據(jù)流及識別的字幕流信息。
[0006]優(yōu)選地,所述的依據(jù)所述的識別時序?qū)⑽淖诌M(jìn)行排序以生成字幕流信息的步驟進(jìn)一步包括:輸出生成的字幕流信息;判斷是否保存,若是則緩存采集的音頻數(shù)據(jù)流及識別的字幕流信息;若否則返回重新采集音頻數(shù)據(jù)流。
[0007]優(yōu)選地,所述生成播放源文件的步驟進(jìn)一步包括:提取緩存的音頻數(shù)據(jù)流及字幕流信息;建立各該數(shù)據(jù)塊的標(biāo)注的錄入時序和所述文字的識別時序的同步關(guān)系;依據(jù)所述同步關(guān)系將所述音頻數(shù)據(jù)流和字幕流信息關(guān)聯(lián)成播放源文件。
[0008]本發(fā)明還提供一種多媒體文件播放方法,包括以下步驟:提取存儲于資料庫中的多媒體文件,解析所述多媒體文件中的播放源文件與所述動態(tài)光效源文件;解析所述播放源文件中的同步關(guān)系;顯示所述動態(tài)光效源文件,同時播放所述播放源文件中的音頻數(shù)據(jù)流,并依據(jù)該同步關(guān)系在顯示的所述動態(tài)光效文件的預(yù)設(shè)位置顯示與所述音頻數(shù)據(jù)流同步
的字幕流信息。
[0009]優(yōu)選地,解析所述播放源文件中的同步關(guān)系的步驟進(jìn)一步包括:解析各該數(shù)據(jù)塊預(yù)先標(biāo)注的錄入時序和所述文字的識別時序。[0010]本發(fā)明再提供一種智能終端,包括:存儲模塊,存儲有至少一個動態(tài)光效源文件;音頻采集模塊,采集音頻數(shù)據(jù)流;音頻識別模塊,將采集的所述音頻數(shù)據(jù)流識別為字幕流信息并予以緩存;處理模塊,建立緩存的所述音頻數(shù)據(jù)流和字幕流信息之間的同步關(guān)系以生成播放源文件,并將所述播放源文件與所述動態(tài)光效源文件進(jìn)行關(guān)聯(lián)成多媒體文件,并存儲至所述存儲模塊;音頻輸出模塊,播放所述存儲模塊中存儲的播放源文件中的音頻數(shù)據(jù)流;顯示模塊,與所述音頻輸出模塊同步顯示所述動態(tài)光效源文件,并依據(jù)所述處理模塊建立的同步關(guān)系在顯示的所述動態(tài)光效文件的預(yù)設(shè)位置顯示與所述音頻數(shù)據(jù)流同步的字幕流息。
[0011]優(yōu)選地,所述音頻識別模塊將采集的音頻數(shù)據(jù)流以秒為單位劃分為多個數(shù)據(jù)塊,并標(biāo)注各該數(shù)據(jù)塊的錄入時序,將各該數(shù)據(jù)塊識別為文字,并標(biāo)注所述文字的識別時序,依據(jù)所述的識別時序?qū)⑽淖诌M(jìn)行排序以生成字幕流信息并緩存。
[0012]優(yōu)選地,所述音頻識別模塊還包括一判斷單元,用以判斷輸出生成的字幕流信息是否保存,若是則緩存采集的音頻數(shù)據(jù)流及識別的字幕流信息;若否則返回重新采集音頻數(shù)據(jù)流。
[0013]優(yōu)選地,所述處理模塊提取緩存的音頻數(shù)據(jù)流及字幕流信息,建立各該數(shù)據(jù)塊的標(biāo)注的錄入時序和所述文字的識別時序的同步關(guān)系;依據(jù)所述同步關(guān)系將所述音頻數(shù)據(jù)流和字幕流信息關(guān)聯(lián)成播放源文件,并將所述多媒體文件存儲至所述存儲模塊。
[0014]優(yōu)選地,所述處理模塊包括解析模塊,用于提取存儲于資料庫中的多媒體文件,解析所述多媒體文件中的播放源文件與所述動態(tài)光效源文件;以及解析所述播放源文件中的同步關(guān)系,并令所述音頻輸出模塊播放所述播放源文件中的音頻數(shù)據(jù)流,同時令所述顯示模塊顯示所述動態(tài)光效源文件以及依據(jù)該同步關(guān)系在顯示的所述動態(tài)光效文件的預(yù)設(shè)位置顯示與所述音頻數(shù)據(jù)流同步的字幕流信息。
[0015]如上所述,本發(fā)明的多媒體文件制作、播放方法及智能終端,可以實(shí)現(xiàn)按照錄入的語音能正確的顯示字幕出來,不但確保了語音記錄的高準(zhǔn)確率,還能在播放時隨著屏幕色彩的變幻循環(huán)在顯示屏上循環(huán)滾動,進(jìn)而提高了智能終端的娛樂性和用戶體驗(yàn)。
【專利附圖】
【附圖說明】
[0016]圖1顯示為本發(fā)明多媒體文件制作方法的流程示意圖。
[0017]圖2顯示為本發(fā)明多媒體文件播放方法的流程示意圖。
[0018]圖3顯示為本發(fā)明智能終端的架構(gòu)示意圖。
[0019]元件標(biāo)號說明
[0020]2智能終端
[0021]21存儲模塊
[0022]22音頻采集模塊
[0023]23音頻識別模塊
[0024]24處理模塊
[0025]25音頻輸出模塊
[0026]26顯示模塊
[0027]Sll ~S14 步驟[0028]S31 ?S33 步驟【具體實(shí)施方式】
[0029]以下通過特定的具體實(shí)例說明本發(fā)明的實(shí)施方式,本領(lǐng)域技術(shù)人員可由本說明書所揭露的內(nèi)容輕易地了解本發(fā)明的其他優(yōu)點(diǎn)與功效。本發(fā)明還可以通過另外不同的【具體實(shí)施方式】加以實(shí)施或應(yīng)用,本說明書中的各項(xiàng)細(xì)節(jié)也可以基于不同觀點(diǎn)與應(yīng)用,在沒有背離本發(fā)明的精神下進(jìn)行各種修飾或改變。
[0030]需要說明的是,本部分所提供的圖示僅以示意方式說明本發(fā)明的基本構(gòu)想,遂圖式中僅顯示與本發(fā)明中有關(guān)的組件而非按照實(shí)際實(shí)施時的組件數(shù)目、形狀及尺寸繪制,其實(shí)際實(shí)施時各組件的型態(tài)、數(shù)量及比例可為一種隨意的改變,且其組件布局型態(tài)也可能更為復(fù)雜。
[0031]本發(fā)明提供一種多媒體文件制作方法,應(yīng)用于智能終端中,于本實(shí)施例中,所述智能終端例如為智能手機(jī)、平板電腦、筆記本電腦等具有語音識別功能及多媒體播放功能的電子裝置,所述電子裝置包含的硬件包括CPU(中央處理器),存儲器(例如為FLASH存儲器),麥克風(fēng),揚(yáng)聲器,顯示屏(例如為觸敏顯示屏),播放器,音頻電路,通信模塊,系統(tǒng)總線以及輸入輸出端口等。請參閱圖1,顯示為本發(fā)明多媒體文件制作方法的流程示意圖,如圖所示,所述多媒體文件制作方法包括以下步驟:
[0032]步驟S11,預(yù)設(shè)存儲有至少一個動態(tài)光效源文件的資料庫;于本實(shí)施例中,所述動態(tài)光效源文件為光效flash源文件、PSD源文件、AE (After Effects)源文件,及MOV源文件中的一種,所述動態(tài)光效源文件可以展現(xiàn)的光效例如為夢幻、星光、煙花、彩燈、線條、3D、漫畫、或者自然景觀等主題的光效。所述資料庫位于存儲器中,所述存儲器例如為智能終端的內(nèi)置存儲器,亦可為外部存儲器,所述外部存儲器例如為U盤或者外接硬盤等存儲器件。如果用戶重新刷版本或是恢復(fù)出廠設(shè)置后保證數(shù)據(jù)不丟失,則選擇外部儲存器保存所述動態(tài)光效源文件。
[0033]步驟S12,采集音頻數(shù)據(jù)流,同時將采集的所述音頻數(shù)據(jù)流識別為字幕流信息,并予以緩存;于本實(shí)施例中,比如用戶通過開啟電子設(shè)備的錄音更能,激活麥克風(fēng)及其音頻信號轉(zhuǎn)換電路采集音頻數(shù)據(jù)流,例如采集的音頻數(shù)據(jù)流為語音,該語音例如為中文普通話、地區(qū)方言等中文語音或者包括英語、法語、日語等外語語音。
[0034]于本實(shí)施例中,上述的將采集的所述音頻數(shù)據(jù)識別為文字信息步驟進(jìn)一步包括:
[0035]將采集的音頻數(shù)據(jù)流以秒為單位劃分為多個數(shù)據(jù)塊,并標(biāo)注各該數(shù)據(jù)塊的錄入時序;具體地,所述電子設(shè)備采集到音頻數(shù)據(jù)流時,以秒為單位所述音頻數(shù)據(jù)流劃分為多個數(shù)據(jù)塊,舉例而言,所述電子設(shè)備采集到一段時間為2秒鐘“今天下午3點(diǎn)開會”的語音錄入,電子設(shè)備將該段語音以秒為單位劃分為“今天下午”和“3點(diǎn)開會”這兩個數(shù)據(jù)塊,并標(biāo)注“今天下午”這個數(shù)據(jù)塊的錄入時序?yàn)棰?,?biāo)注“3點(diǎn)開會”這個數(shù)據(jù)塊的錄入時序?yàn)棰?。然后將每一個數(shù)據(jù)塊識別為文字,分別為“今天下午”和“3點(diǎn)開會”,并標(biāo)注所述文字“今天下午”的識別時序?yàn)棰伲瑯?biāo)注所述文字“3點(diǎn)開會”的識別時序?yàn)棰凇?br>
[0036]依據(jù)所述的識別時序?qū)⑽淖诌M(jìn)行排序以生成字幕流信息;具體地,依據(jù)所述的識別時序①和②將兩部分文字“今天下午”和“3點(diǎn)開會”排序以生成字幕流信息“今天下午3點(diǎn)開會”。[0037]在實(shí)際的操作過程中,為了進(jìn)一步提高記錄的準(zhǔn)確性,可進(jìn)一步包括步驟:
[0038]輸出生成的字幕流信息;具體地,電子裝置輸出顯示生成的字幕流信息,令用戶進(jìn)一步判斷輸入的語音和輸出的識別結(jié)果是否一致,藉此來確定是否保存輸入的語音和針對該段語音識別的字幕。
[0039]判斷是否保存,具體地,電子裝置彈出是否保存的對話框,令用戶通過輸入操作指令來執(zhí)行是否保存的操作。若用戶輸入的指令為保存,則緩存采集的音頻數(shù)據(jù)流及識別的字幕流信息;若用戶輸入的指令為不保存,則返回重新采集音頻數(shù)據(jù)流。所述的緩存采集的音頻數(shù)據(jù)流及識別的字幕流信息例如為將采集的錄入時間為2秒鐘“今天下午3點(diǎn)開會”這段語音和識別的“今天下午3點(diǎn)開會”這串字幕存儲至電子設(shè)備的系統(tǒng)緩存中。
[0040]步驟S13,建立緩存的所述音頻數(shù)據(jù)流和字幕流信息之間的同步關(guān)系以生成播放源文件;于本實(shí)施例中,所述生成的播放源文件的步驟進(jìn)一步包括:
[0041]提取緩存的音頻數(shù)據(jù)流及字幕流信息;具體地,指從系統(tǒng)緩存中提取緩存的音頻數(shù)據(jù)流及字幕流信息,例如為指從系統(tǒng)緩存中提取錄入時間為2秒鐘“今天下午3點(diǎn)開會”這段語音和識別的“今天下午3點(diǎn)開會”這串字幕。
[0042]建立各該數(shù)據(jù)塊的標(biāo)注的錄入時序和所述文字的識別時序的同步關(guān)系;例如為,依據(jù)標(biāo)注“今天下午”這個數(shù)據(jù)塊的錄入時序?yàn)棰伲瑯?biāo)注“3點(diǎn)開會”這個數(shù)據(jù)塊的錄入時序?yàn)棰?;以及?biāo)注所述文字“今天下午”的識別時序?yàn)棰伲瑯?biāo)注所述文字“3點(diǎn)開會”的識別時序?yàn)棰?。分別將錄入時序和識別時序均為①的建立同步關(guān)系,將錄入時序和識別時序均為②的建立同步關(guān)系。
[0043]依據(jù)所述同步關(guān)系將所述音頻數(shù)據(jù)流和字幕流信息關(guān)聯(lián)成播放源文件。具體為依據(jù)所述同步關(guān)系將所述音頻數(shù)據(jù)流和字幕流信息關(guān)聯(lián)成可以在播放語音的同時顯示語音同步字幕的播放源文件。
[0044]步驟S14,將所述播放源文件與所述動態(tài)光效源文件進(jìn)行關(guān)聯(lián)成多媒體文件,并將所述多媒體文件存儲至所述資料庫。于本實(shí)施例中,所述多媒體文件為AVI文件、wma文件、rmvb文件、rm文件、flash文件、mp3文件、mid文件、或者3GP文件中的任意一種。比如,實(shí)施多媒體文件為flash文件,用戶按播放鍵播放該flash文件時,此時手機(jī)屏幕就按照原先錄音進(jìn)去的語音從揚(yáng)聲器播放同時顯示字幕出現(xiàn)在手機(jī)屏幕上且屏幕出現(xiàn)不同色彩的變換一直循環(huán)滾動直到按停止鍵和退出鍵結(jié)束。
[0045]本發(fā)明還提供一種多媒體文件播放方法,應(yīng)用于智能終端中,于本實(shí)施例中,所述智能終端例如為智能手機(jī)、平板電腦、筆記本電腦等具有語音識別功能及多媒體播放功能的電子裝置,所述電子裝置包含的硬件包括CPU (中央處理器),存儲器(例如為FLASH存儲器),麥克風(fēng),揚(yáng)聲器,顯示屏(例如為觸敏顯示屏),播放器,音頻電路,通信模塊,系統(tǒng)總線以及輸入輸出端口等。請參閱圖2,顯示為本發(fā)明多媒體文件播放方法的流程示意圖,如圖所示,所述多媒體文件播放方法包括以下步驟:
[0046]步驟S31,提取存儲于資料庫中的多媒體文件,解析所述多媒體文件中的播放源文件與所述動態(tài)光效源文件;于本實(shí)施例中,所述多媒體文件為AVI文件、wma文件、rmvb文件、rm文件、flash文件、mp3文件、mid文件、或者3GP文件中的任意一種。所述動態(tài)光效源文件為光效flash源文件、PSD源文件、AE (After Effects)源文件,及MOV源文件中的一種,所述動態(tài)光效源文件可以展現(xiàn)的光效例如為夢幻、星光、煙花、彩燈、線條、3D、漫畫、或者自然景觀等主題的光效。所述播放源文件包括依據(jù)同步關(guān)系相關(guān)聯(lián)的音頻數(shù)據(jù)流和字幕流信息,例如音頻數(shù)據(jù)流為播放時間長度為2秒鐘“今天下午3點(diǎn)開會”這段語音,所述字幕流信息為“今天下午3點(diǎn)開會”這串包含有8個字的字幕。
[0047]所述同步關(guān)系為建立的各該數(shù)據(jù)塊的標(biāo)注的錄入時序和所述文字的識別時序;
[0048]所述資料庫位于存儲器中,所述存儲器例如為智能終端的內(nèi)置存儲器,亦可為外部存儲器,所述外部存儲器例如為U盤或者外接硬盤等存儲器件。如果用戶重新刷版本或是恢復(fù)出廠設(shè)置后保證數(shù)據(jù)不丟失,則選擇外部儲存器保存所述動態(tài)光效源文件。
[0049]步驟S32,解析所述播放源文件中的同步關(guān)系;于本實(shí)施例中,解析各該數(shù)據(jù)塊預(yù)先標(biāo)注的錄入時序和所述文字的識別時序。例如為,解析標(biāo)注的“今天下午”這個數(shù)據(jù)塊的錄入時序?yàn)棰伲馕鰳?biāo)注的“3點(diǎn)開會”這個數(shù)據(jù)塊的錄入時序?yàn)棰?;以及解析?biāo)注的所述文字“今天下午”的識別時序?yàn)棰?,解析?biāo)注的所述文字“3點(diǎn)開會”的識別時序?yàn)棰冢謩e將錄入時序和識別時序均為①解析為同步,將錄入時序和識別時序均為②解析為同步。
[0050]步驟S33,顯示所述動態(tài)光效源文件,同時播放所述播放源文件中的音頻數(shù)據(jù)流,并依據(jù)該同步關(guān)系在顯示的所述動態(tài)光效文件的預(yù)設(shè)位置顯示與所述音頻數(shù)據(jù)流同步的字幕流信息。于本實(shí)施例中,在播放音頻數(shù)據(jù)流中語音信息的時候,同步顯示與該語音信息相匹配的字母信息,同時動態(tài)光效源文件展現(xiàn)的光效例如為夢幻、星光、煙花、彩燈、線條、3D、漫畫、或者自然景觀等主題的光效,直循環(huán)滾動直到按停止鍵和退出鍵結(jié)束。
[0051]本發(fā)明提供再一種智能終端,于本實(shí)施例中,所述智能終端例如為智能手機(jī)、平板電腦、筆記本電腦等具有語音識別功能及多媒體播放功能的電子裝置,所述電子裝置包含的硬件包括CPU (中央處理器),存儲器(例如為FLASH存儲器),麥克風(fēng),揚(yáng)聲器,顯示屏(例如為觸敏顯示屏),播放器,音頻電路,通信模塊,系統(tǒng)總線以及輸入輸出端口等。請參閱圖3,顯示為本發(fā)明智能終端的架構(gòu)示意圖,如圖所示,所述智能終端2包括:存儲模塊21,音頻采集模塊22,音頻識別模塊23,處理模塊24,音頻輸出模塊25,以及顯示模塊26。
[0052]所述存儲模塊21存儲有至少一個動態(tài)光效源文件;于本實(shí)施例中,所述存儲器存儲模塊21例如為FLASH存儲器,所述存儲器例如為智能終端2的內(nèi)置存儲器,亦可為外部存儲器,所述外部存儲器例如為U盤或者外接硬盤等存儲器件。如果用戶重新刷版本或是恢復(fù)出廠設(shè)置后保證數(shù)據(jù)不丟失,則選擇外部儲存器保存所述動態(tài)光效源文件。
[0053]所述動態(tài)光效源文件為光效flash源文件、PSD源文件、AE (After Effects)源文件,及MOV源文件中的一種,所述動態(tài)光效源文件可以展現(xiàn)的光效例如為夢幻、星光、煙花、彩燈、線條、3D、漫畫、或者自然景觀等主題的光效。
[0054]所述音頻采集模塊22采集音頻數(shù)據(jù)流;所述音頻采集模塊22例如為麥克風(fēng)及其音頻信號轉(zhuǎn)換電路。于本實(shí)施例中,比如用戶通過開啟電子設(shè)備的錄音更能,激活麥克風(fēng)及其音頻信號轉(zhuǎn)換電路采集音頻數(shù)據(jù)流,例如采集的音頻數(shù)據(jù)流為語音,該語音例如為中文普通話、地區(qū)方言等中文語音或者包括英語、法語、日語等外語語音。
[0055]所述音頻識別模塊23將采集的所述音頻數(shù)據(jù)流識別為字幕流信息并予以緩存;于本實(shí)施例中,所述音頻識別模塊23將采集的音頻數(shù)據(jù)流以秒為單位劃分為多個數(shù)據(jù)塊,并標(biāo)注各該數(shù)據(jù)塊的錄入時序,將各該數(shù)據(jù)塊識別為文字,并標(biāo)注所述文字的識別時序,依據(jù)所述的識別時序?qū)⑽淖诌M(jìn)行排序以生成字幕流信息并緩存。具體地,所述電子設(shè)備采集到音頻數(shù)據(jù)流時,以秒為單位所述音頻數(shù)據(jù)流劃分為多個數(shù)據(jù)塊,舉例而言,所述電子設(shè)備采集到一段時間為2秒鐘“今天下午3點(diǎn)開會”的語音錄入,電子設(shè)備將該段語音以秒為單位劃分為“今天下午”和“3點(diǎn)開會”這兩個數(shù)據(jù)塊,并標(biāo)注“今天下午”這個數(shù)據(jù)塊的錄入時序?yàn)棰?,?biāo)注“3點(diǎn)開會”這個數(shù)據(jù)塊的錄入時序?yàn)棰?。然后將每一個數(shù)據(jù)塊識別為文字,分別為“今天下午”和“3點(diǎn)開會”,并標(biāo)注所述文字“今天下午”的識別時序?yàn)棰?,?biāo)注所述文字“3點(diǎn)開會”的識別時序?yàn)棰凇?br>
[0056]依據(jù)所述的識別時序?qū)⑽淖诌M(jìn)行排序以生成字幕流信息具體地為依據(jù)所述的識別時序①和②將兩部分文字“今天下午”和“3點(diǎn)開會”排序以生成字幕流信息“今天下午3點(diǎn)開會”。
[0057]在實(shí)際的操作過程中,為了進(jìn)一步提高記錄的準(zhǔn)確性,所述音頻識別模塊23還包括一判斷單元,用以判斷輸出生成的字幕流信息是否保存,若是則緩存采集的音頻數(shù)據(jù)流及識別的字幕流信息;若否則返回重新采集音頻數(shù)據(jù)流。
[0058]具體地,智能終端2輸出顯示生成的字幕流信息,令用戶進(jìn)一步判斷輸入的語音和輸出的識別結(jié)果是否一致,藉此來確定是否保存輸入的語音和針對該段語音識別的字眷。
[0059]判斷是否保存,具體地,智能終端2彈出是否保存的對話框,令用戶通過輸入操作指令來執(zhí)行是否保存的操作。若用戶輸入的指令為保存,則緩存采集的音頻數(shù)據(jù)流及識別的字幕流信息;若用戶輸入的指令為不保存,則返回重新采集音頻數(shù)據(jù)流。所述的緩存采集的音頻數(shù)據(jù)流及識別的字幕流信息例如為將采集的錄入時間為2秒鐘“今天下午3點(diǎn)開會”這段語音和識別的“今天下午3點(diǎn)開會”這串字幕存儲至智能終端2的系統(tǒng)緩存中。
[0060]所述處理模塊24建立緩存的所述音頻數(shù)據(jù)流和字幕流信息之間的同步關(guān)系以生成播放源文件,并將所述播放源文件與所述動態(tài)光效源文件進(jìn)行關(guān)聯(lián)成多媒體文件,并存儲至所述存儲模塊21 ;于本實(shí)施例中,所述多媒體文件為AVI文件、wma文件、rmvb文件、rm文件、flash文件、mp3文件、mid文件、或者3GP文件中的任意一種。
[0061]于本實(shí)施例中,所述處理模塊24為中央處理器(CPU),建立各該數(shù)據(jù)塊的標(biāo)注的錄入時序和所述文字的識別時序的同步關(guān)系例如為依據(jù)標(biāo)注“今天下午”這個數(shù)據(jù)塊的錄入時序?yàn)棰?,?biāo)注“3點(diǎn)開會”這個數(shù)據(jù)塊的錄入時序?yàn)棰?;以及?biāo)注所述文字“今天下午”的識別時序?yàn)棰伲瑯?biāo)注所述文字“3點(diǎn)開會”的識別時序?yàn)棰?。分別將錄入時序和識別時序均為①的建立同步關(guān)系,將錄入時序和識別時序均為②的建立同步關(guān)系。
[0062]依據(jù)所述同步關(guān)系將所述音頻數(shù)據(jù)流和字幕流信息關(guān)聯(lián)成播放源文件具體為依據(jù)所述同步關(guān)系將所述音頻數(shù)據(jù)流和字幕流信息關(guān)聯(lián)成可以在播放語音的同時顯示語音同步字幕的播放源文件。
[0063]所述音頻輸出模塊25播放所述存儲模塊21中存儲的播放源文件中的音頻數(shù)據(jù)流;于本實(shí)施例中,所述音頻輸出模塊25包括音頻輸出電路及揚(yáng)聲器。
[0064]所述處理模塊24包括解析模塊,用于提取存儲于資料庫中的多媒體文件,解析所述多媒體文件中的播放源文件與所述動態(tài)光效源文件;以及解析所述播放源文件中的同步關(guān)系,并令所述音頻輸出模塊25播放所述播放源文件中的音頻數(shù)據(jù)流,同時令所述顯示模塊26顯示所述動態(tài)光效源文件以及依據(jù)該同步關(guān)系在顯示的所述動態(tài)光效文件的預(yù)設(shè)位置顯示與所述音頻數(shù)據(jù)流同步的字幕流信息。
[0065]解析所述播放源文件中的同步關(guān)系具體為解析各該數(shù)據(jù)塊預(yù)先標(biāo)注的錄入時序和所述文字的識別時序。例如為,解析標(biāo)注的“今天下午”這個數(shù)據(jù)塊的錄入時序?yàn)棰?,解析?biāo)注的“3點(diǎn)開會”這個數(shù)據(jù)塊的錄入時序?yàn)棰?;以及解析?biāo)注的所述文字“今天下午”的識別時序?yàn)棰?,解析?biāo)注的所述文字“3點(diǎn)開會”的識別時序?yàn)棰?,分別將錄入時序和識別時序均為①解析為同步,將錄入時序和識別時序均為②解析為同步。
[0066]所述顯示模塊26與所述音頻輸出模塊25同步顯示所述動態(tài)光效源文件,并依據(jù)所述處理模塊24建立的同步關(guān)系在顯示的所述動態(tài)光效文件的預(yù)設(shè)位置顯示與所述音頻數(shù)據(jù)流同步的字幕流信息。于本實(shí)施例中,所述顯示模塊26為觸敏顯示屏的顯示器。在播放音頻數(shù)據(jù)流中語音信息的時候,同步顯示與該語音信息相匹配的字母信息,同時動態(tài)光效源文件展現(xiàn)的光效例如為夢幻、星光、煙花、彩燈、線條、3D、漫畫、或者自然景觀等主題的光效,直循環(huán)滾動直到按停止鍵和退出鍵結(jié)束。
[0067]綜上所述,本發(fā)明的多媒體文件制作、播放方法及智能終端,可以實(shí)現(xiàn)按照錄入的語音能正確的顯示字幕出來,不但確保了語音記錄的高準(zhǔn)確率,還能在播放時隨著屏幕色彩的變幻循環(huán)在顯示屏上循環(huán)滾動,進(jìn)而提高了智能終端的娛樂性和用戶體驗(yàn)。所以,本發(fā)明有效克服了現(xiàn)有技術(shù)中的種種缺點(diǎn)而具高度產(chǎn)業(yè)利用價(jià)值。
[0068]上述實(shí)施例僅例示性說明本發(fā)明的原理及其功效,而非用于限制本發(fā)明。任何熟悉此技術(shù)的人士皆可在不違背本發(fā)明的精神及范疇下,對上述實(shí)施例進(jìn)行修飾或改變。因此,舉凡所屬【技術(shù)領(lǐng)域】中具有通常知識者在未脫離本發(fā)明所揭示的精神與技術(shù)思想下所完成的一切等效修飾或改變,仍應(yīng)由本發(fā)明的權(quán)利要求所涵蓋。
【權(quán)利要求】
1.一種多媒體文件制作方法,其特征在于,包括以下步驟: 預(yù)設(shè)存儲有至少一個動態(tài)光效源文件的資料庫; 采集音頻數(shù)據(jù)流,同時將采集的所述音頻數(shù)據(jù)流識別為字幕流信息,并予以緩存; 建立緩存的所述音頻數(shù)據(jù)流和字幕流信息之間的同步關(guān)系以生成播放源文件; 將所述播放源文件與所述動態(tài)光效源文件進(jìn)行關(guān)聯(lián)成多媒體文件,并將所述多媒體文件存儲至所述資料庫。
2.根據(jù)權(quán)利要求1所述的多媒體文件制作方法,其特征在于:所述的將采集的所述音頻數(shù)據(jù)識別為文字信息步驟進(jìn)一步包括: 將采集的音頻數(shù)據(jù)流以秒為單位劃分為多個數(shù)據(jù)塊,并標(biāo)注各該數(shù)據(jù)塊的錄入時序; 將各該數(shù)據(jù)塊識別為文字,并標(biāo)注所述文字的識別時序; 依據(jù)所述的識別時序?qū)⑽淖诌M(jìn)行排序以生成字幕流信息; 緩存采集的音頻數(shù)據(jù)流及識別的字幕流信息。
3.根據(jù)權(quán)利要求2所述的多媒體文件制作方法,其特征在于:所述的依據(jù)所述的識別時序?qū)⑽淖诌M(jìn)行排序以生成字幕流信息的步驟進(jìn)一步包括: 輸出生成的字幕流信息; 判斷是否保存,若是則緩存采集的音頻數(shù)據(jù)流及識別的字幕流信息;若否則返回重新采集音頻數(shù)據(jù)流。
4.根據(jù)權(quán)利要求2或3所述的多媒體文件制作方法,其特征在于:所述生成播放源文件的步驟進(jìn)一步包括: 提取緩存的音頻數(shù)據(jù)流及字幕流信息; 建立各該數(shù)據(jù)塊的標(biāo)注的錄入時序和所述文字的識別時序的同步關(guān)系; 依據(jù)所述同步關(guān)系將所述音頻數(shù)據(jù)流和字幕流信息關(guān)聯(lián)成播放源文件。
5.一種多媒體文件播放方法,其特征在于,包括以下步驟: 提取存儲于資料庫中的多媒體文件,解析所述多媒體文件中的播放源文件與所述動態(tài)光效源文件; 解析所述播放源文件中的同步關(guān)系; 顯示所述動態(tài)光效源文件,同時播放所述播放源文件中的音頻數(shù)據(jù)流,并依據(jù)該同步關(guān)系在顯示的所述動態(tài)光效文件的預(yù)設(shè)位置顯示與所述音頻數(shù)據(jù)流同步的字幕流信息。
6.根據(jù)權(quán)利要求5所述的多媒體文件播放方法,其特征在于:解析所述播放源文件中的同步關(guān)系的步驟進(jìn)一步包括:解析各該數(shù)據(jù)塊預(yù)先標(biāo)注的錄入時序和所述文字的識別時序。
7.一種智能終端,其特征在于,包括: 存儲模塊,存儲有至少一個動態(tài)光效源文件; 音頻采集模塊,采集音頻數(shù)據(jù)流; 音頻識別模塊,將采集的所述音頻數(shù)據(jù)流識別為字幕流信息并予以緩存; 處理模塊,建立緩存的所述音頻數(shù)據(jù)流和字幕流信息之間的同步關(guān)系以生成播放源文件,并將所述播放源文件與所述動態(tài)光效源文件進(jìn)行關(guān)聯(lián)成多媒體文件,并存儲至所述存儲模塊; 音頻輸出模塊,播放所述存儲模塊中存儲的播放源文件中的音頻數(shù)據(jù)流;顯示模塊,與所述音頻輸出模塊同步顯示所述動態(tài)光效源文件,并依據(jù)所述處理模塊建立的同步關(guān)系在顯示的所述動態(tài)光效文件的預(yù)設(shè)位置顯示與所述音頻數(shù)據(jù)流同步的字幕流信息。
8.根據(jù)權(quán)利要求7所述的智能終端,其特征在于:所述音頻識別模塊將采集的音頻數(shù)據(jù)流以秒為單位劃分為多個數(shù)據(jù)塊,并標(biāo)注各該數(shù)據(jù)塊的錄入時序,將各該數(shù)據(jù)塊識別為文字,并標(biāo)注所述文字的識別時序,依據(jù)所述的識別時序?qū)⑽淖诌M(jìn)行排序以生成字幕流信息并緩存。
9.根據(jù)權(quán)利要求8所述的智能終端,其特征在于:所述音頻識別模塊還包括一判斷單元,用以判斷輸出生成的字幕流信息是否保存,若是則緩存采集的音頻數(shù)據(jù)流及識別的字幕流信息;若否則返回重新采集音頻數(shù)據(jù)流。
10.根據(jù)權(quán)利要求8所述的智能終端,其特征在于:所述處理模塊提取緩存的音頻數(shù)據(jù)流及字幕流信息,建立各該數(shù)據(jù)塊的標(biāo)注的錄入時序和所述文字的識別時序的同步關(guān)系;依據(jù)所述同步關(guān)系將所述音頻數(shù)據(jù)流和字幕流信息關(guān)聯(lián)成播放源文件,并將所述多媒體文件存儲至所述存儲模塊。
11.根據(jù)權(quán)利要求8所述的智能終端,其特征在于:所述處理模塊包括解析模塊,用于提取存儲于資料庫中的多媒體文件,解析所述多媒體文件中的播放源文件與所述動態(tài)光效源文件;以及解析所述播放源文件中的同步關(guān)系,并令所述音頻輸出模塊播放所述播放源文件中的音頻數(shù)據(jù)流,同時令所述顯示模塊顯示所述動態(tài)光效源文件以及依據(jù)該同步關(guān)系在顯示的所述動態(tài)光效文件 的預(yù)設(shè)位置顯示與所述音頻數(shù)據(jù)流同步的字幕流信息。
【文檔編號】G06F17/30GK103544978SQ201310548804
【公開日】2014年1月29日 申請日期:2013年11月7日 優(yōu)先權(quán)日:2013年11月7日
【發(fā)明者】肖乾洪 申請人:上海斐訊數(shù)據(jù)通信技術(shù)有限公司