音頻與字幕的同步方法和裝置制造方法
【專利摘要】本發(fā)明是關(guān)于一種音頻與字幕的同步方法,包括:根據(jù)控制指令啟動(dòng)視頻的字幕編輯模式并顯示編輯界面;根據(jù)所述視頻的當(dāng)前播放時(shí)間獲取至少兩條字幕,在所述編輯界面顯示所述獲取的字幕,所述至少兩條字幕的初始顯示時(shí)間或終止顯示時(shí)間距離所述當(dāng)前播放時(shí)間在預(yù)設(shè)時(shí)間范圍之內(nèi);當(dāng)接收到對(duì)所述至少兩條字幕中的任一條字幕的選擇操作時(shí),在所述編輯界面顯示所述視頻對(duì)應(yīng)的音軌軸,根據(jù)所述音軌軸來(lái)同步所選擇的字幕與其對(duì)應(yīng)的音頻。本發(fā)明實(shí)現(xiàn)了在音頻與字幕不同步時(shí),能夠通過(guò)操作來(lái)調(diào)整字幕的顯示時(shí)間,從而實(shí)現(xiàn)音頻與字幕的同步。本發(fā)明還公開(kāi)了用于實(shí)現(xiàn)上述方法的裝置。
【專利說(shuō)明】音頻與字幕的同步方法和裝置
【技術(shù)領(lǐng)域】
[0001] 本公開(kāi)涉及智能電視【技術(shù)領(lǐng)域】,尤其涉及一種音頻與字幕的同步方法和裝置。
【背景技術(shù)】
[0002] 智能電視作為一種智能信息終端,不僅可以搜索電視頻道、錄制電視節(jié)目、播放衛(wèi) 星和有線電視節(jié)目,還可以下載安裝軟件、進(jìn)行網(wǎng)絡(luò)搜索、播放網(wǎng)絡(luò)視頻、本地視頻及音樂(lè) 等等,為用戶帶來(lái)了更多的個(gè)性化體驗(yàn)。
[0003] 用戶經(jīng)常通過(guò)智能電視來(lái)觀看影視節(jié)目,大多數(shù)的影視節(jié)目都配有字幕顯示,以 提高用戶觀影時(shí)的感受。但是,可能受制于視頻壓縮方式、視頻大小、播放器解碼能力等因 素的影響,視頻播放過(guò)程中會(huì)出現(xiàn)字幕與聲音不能同步的問(wèn)題,很大程度上影響了用戶感 受,尤其是在播放非母語(yǔ)的影片過(guò)程中,字幕與聲音的不同步會(huì)令用戶更加難以接受。
【發(fā)明內(nèi)容】
[0004] 為克服相關(guān)技術(shù)存在的問(wèn)題,本公開(kāi)提供一種音頻與字幕的同步方法和裝置,在 音頻與字幕不同步時(shí),能夠通過(guò)操作來(lái)調(diào)整字幕的顯示時(shí)間,從而實(shí)現(xiàn)音頻與字幕的同步。
[0005] 根據(jù)本公開(kāi)實(shí)施例的第一方面,提供一種音頻與字幕的同步方法,包括:
[0006] 根據(jù)控制指令啟動(dòng)視頻的字幕編輯模式并顯示編輯界面;
[0007] 根據(jù)所述視頻的當(dāng)前播放時(shí)間獲取至少兩條字幕,在所述編輯界面顯示所述獲取 的字幕,所述至少兩條字幕的初始顯示時(shí)間或終止顯示時(shí)間距離所述當(dāng)前播放時(shí)間在預(yù)設(shè) 時(shí)間范圍之內(nèi);
[0008] 當(dāng)接收到對(duì)所述至少兩條字幕中的任一條字幕的選擇操作時(shí),在所述編輯界面顯 示所述視頻對(duì)應(yīng)的音軌軸,根據(jù)所述音軌軸來(lái)同步所選擇的字幕與其對(duì)應(yīng)的音頻。
[0009] 當(dāng)音頻與字幕不同步時(shí)進(jìn)入字幕編輯模式,通過(guò)操作來(lái)調(diào)整字幕的顯示時(shí)間,實(shí) 現(xiàn)首頻與子辱的冋步。
[0010] 所述根據(jù)控制指令啟動(dòng)視頻的字幕編輯模式并顯示編輯界面,包括:
[0011] 當(dāng)接收到對(duì)預(yù)設(shè)菜單選項(xiàng)的選擇操作或?qū)b控器上預(yù)設(shè)的單個(gè)按鍵或組合按鍵 的點(diǎn)擊操作時(shí),啟動(dòng)視頻的字幕編輯模式,并顯示編輯界面。通過(guò)遙控器或者在終端設(shè)備上 的操作都能夠開(kāi)啟該字幕編輯模式,為用戶操作提供便利。
[0012] 所述在所述編輯界面顯示所述視頻對(duì)應(yīng)的音軌軸,并根據(jù)所述音軌軸來(lái)同步所選 擇的子.與其對(duì)應(yīng)的首頻,包括:
[0013] 在所述編輯界面顯示所述視頻對(duì)應(yīng)的音軌軸,并定位所述音軌軸在所選擇的字幕 對(duì)應(yīng)的音頻位置處;
[0014] 根據(jù)用戶調(diào)整所述音軌軸的操作,確定所選擇的字幕中第一個(gè)字對(duì)應(yīng)的音頻的起 始時(shí)間;
[0015] 根據(jù)所述起始時(shí)間同步所選擇的字幕與其對(duì)應(yīng)的音頻。通過(guò)音軌軸更精確的找到 音頻與字幕吻合的時(shí)間點(diǎn),使音頻與字幕的同步更準(zhǔn)確。
[0016] 所述方法還包括:
[0017] 根據(jù)控制指令啟動(dòng)視頻的字幕編輯模式并顯示編輯界面的同時(shí),暫停對(duì)所述視頻 的播放。便于用戶在調(diào)整字幕與聲音同步后,可以準(zhǔn)確定位視頻播放進(jìn)度,不影響用戶的觀 看體驗(yàn)。
[0018] 所述根據(jù)所述音軌軸來(lái)同步所選擇字幕與其對(duì)應(yīng)的音頻之后,所述方法還包括:
[0019] 建立同步后的所述視頻的字幕和音頻的匹配關(guān)系;
[0020] 根據(jù)所述匹配關(guān)系,從所述視頻的暫停處繼續(xù)播放所述視頻。
[0021] 根據(jù)用戶確定的起始時(shí)間與所選擇字幕的起始時(shí)間的時(shí)間差,建立字幕和音頻的 匹配關(guān)系,自動(dòng)調(diào)整字幕文件中其他字幕的起始時(shí)間,使其他字幕自動(dòng)與音頻實(shí)現(xiàn)同步。
[0022] 所述方法還包括:
[0023] 將同步后的字幕上傳到云端,所述同步后的字幕用于和所述云端上存儲(chǔ)的所述視 頻進(jìn)行關(guān)聯(lián);
[0024] 當(dāng)接收到對(duì)所述視頻的播放請(qǐng)求時(shí),從云端獲取與所述視頻關(guān)聯(lián)的所述同步后的 字署=;
[0025] 播放所述視頻時(shí),顯示所述同步后的字幕。再次播放該視頻文件時(shí)使用同步后的 字幕文件,方便用戶,提高觀影感受。
[0026] 根據(jù)本公開(kāi)實(shí)施例的第二方面,提供一種音頻與字幕的同步裝置,包括:
[0027] 處理模塊,用于根據(jù)控制指令啟動(dòng)視頻的字幕編輯模式并顯示編輯界面;
[0028] 第一獲取模塊,用于根據(jù)所述視頻的當(dāng)前播放時(shí)間獲取至少兩條字幕,在所述編 輯界面顯示所述獲取的字幕,所述至少兩條字幕的初始顯示時(shí)間或終止顯示時(shí)間距離所述 當(dāng)前播放時(shí)間在預(yù)設(shè)時(shí)間范圍之內(nèi);
[0029] 同步模塊,用于當(dāng)接收到對(duì)所述至少兩條字幕中的任一條字幕的選擇操作時(shí),在 所述編輯界面顯示所述視頻對(duì)應(yīng)的音軌軸,根據(jù)所述音軌軸來(lái)同步所選擇的字幕與其對(duì)應(yīng) 的音頻。
[0030] 所述處理模塊包括:
[0031] 處理單元,用于當(dāng)接收到對(duì)預(yù)設(shè)菜單選項(xiàng)的選擇操作或?qū)b控器上預(yù)設(shè)的單個(gè)按 鍵或組合按鍵的點(diǎn)擊操作時(shí),啟動(dòng)視頻的字幕編輯模式,并顯示編輯界面。
[0032] 所述同步模塊包括:
[0033] 顯示單元,用于在所述編輯界面顯示所述視頻對(duì)應(yīng)的音軌軸,并定位所述音軌軸 在所選擇的字幕對(duì)應(yīng)的音頻位置處;
[0034] 確定單元,用于根據(jù)用戶調(diào)整所述音軌軸的操作,確定所選擇的字幕中第一個(gè)字 對(duì)應(yīng)的音頻的起始時(shí)間;
[0035] 同步單元,用于根據(jù)所述起始時(shí)間同步所選擇的字幕與其對(duì)應(yīng)的音頻。
[0036] 所述裝置還包括:
[0037] 暫停模塊,用于根據(jù)控制指令啟動(dòng)視頻的字幕編輯模式并顯示編輯界面的同時(shí), 暫停對(duì)所述視頻的播放。
[0038] 所述裝置還包括:
[0039] 建立模塊,用于建立同步后的所述視頻的字幕和音頻的匹配關(guān)系;
[0040] 播放模塊,用于根據(jù)所述匹配關(guān)系,從所述視頻的暫停處繼續(xù)播放所述視頻。
[0041] 所述裝置還包括:
[0042] 上傳模塊,用于將同步后的字幕上傳到云端,所述同步后的字幕用于和所述云端 上存儲(chǔ)的所述視頻進(jìn)行關(guān)聯(lián);
[0043] 第二獲取模塊,用于當(dāng)接收到對(duì)所述視頻的播放請(qǐng)求時(shí),從云端獲取與所述視頻 關(guān)聯(lián)的所述同步后的字幕;
[0044] 顯示模塊,用于播放所述視頻時(shí),顯示所述同步后的字幕。
[0045] 根據(jù)本公開(kāi)實(shí)施例的第三方面,提供一種音頻與字幕的同步裝置,包括:
[0046] 處理器;
[0047] 用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;
[0048] 其中所述處理器被配置為:
[0049] 根據(jù)控制指令啟動(dòng)視頻的字幕編輯模式并顯示編輯界面;
[0050] 根據(jù)所述視頻的當(dāng)前播放時(shí)間獲取至少兩條字幕,在所述編輯界面顯示所述獲取 的字幕,所述至少兩條字幕的初始顯示時(shí)間或終止顯示時(shí)間距離所述當(dāng)前播放時(shí)間在預(yù)設(shè) 時(shí)間范圍之內(nèi);
[0051] 當(dāng)接收到對(duì)所述至少兩條字幕中的任一條字幕的選擇操作時(shí),在所述編輯界面顯 示所述視頻對(duì)應(yīng)的音軌軸,根據(jù)所述音軌軸來(lái)同步所選擇的字幕與其對(duì)應(yīng)的音頻。
[0052] 本公開(kāi)的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:當(dāng)音頻與字幕不同步時(shí) 進(jìn)入字幕編輯模式,通過(guò)操作來(lái)調(diào)整字幕的顯示時(shí)間,實(shí)現(xiàn)音頻與字幕的同步;通過(guò)遙控器 或者在終端設(shè)備上的操作都能夠開(kāi)啟該字幕編輯模式,為用戶操作提供便利;通過(guò)音軌軸 更精確的找到音頻與字幕吻合的時(shí)間點(diǎn),使音頻與字幕的同步更準(zhǔn)確;同步調(diào)整時(shí)暫停視 頻的播放,便于用戶在調(diào)整字幕與聲音同步后,可以準(zhǔn)確定位視頻播放進(jìn)度,不影響用戶的 觀看體驗(yàn);根據(jù)用戶確定的起始時(shí)間與所選擇字幕的起始時(shí)間的時(shí)間差,建立字幕和音頻 的匹配關(guān)系,自動(dòng)調(diào)整字幕文件中其他字幕的起始時(shí)間,使其他字幕自動(dòng)與音頻實(shí)現(xiàn)同步; 再次播放該視頻文件時(shí)使用同步后的字幕文件,方便用戶,提高觀影感受。
[0053] 應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不 能限制本公開(kāi)。
【專利附圖】
【附圖說(shuō)明】
[0054] 此處的附圖被并入說(shuō)明書中并構(gòu)成本說(shuō)明書的一部分,示出了符合本公開(kāi)的實(shí)施 例,并與說(shuō)明書一起用于解釋本公開(kāi)的原理。
[0055] 圖1是根據(jù)一示例性實(shí)施例示出的一種音頻與字幕的同步方法的流程圖。
[0056] 圖2是根據(jù)一示例性實(shí)施例示出的字幕編輯模式的編輯界面示意圖。
[0057] 圖3是根據(jù)一示例性實(shí)施例示出的字幕編輯模式的編輯界面示意圖。
[0058] 圖4是根據(jù)一示例性實(shí)施例示出一種音頻與字幕的同步方法的流程圖。
[0059] 圖5是根據(jù)一示例性實(shí)施例示出一種音頻與字幕的同步方法的流程圖
[0060] 圖6是根據(jù)一示例性實(shí)施例示出的一種音頻與字幕的同步裝置的框圖。
[0061] 圖7是根據(jù)一示例性實(shí)施例示出的處理模塊的框圖。
[0062] 圖8是根據(jù)一示例性實(shí)施例示出的同步模塊的框圖。
[0063] 圖9是根據(jù)一示例性實(shí)施例示出的一種音頻與字幕的同步裝置的框圖。
[0064] 圖10是根據(jù)一示例性實(shí)施例示出的一種音頻與字幕的同步裝置的框圖。
[0065] 圖11是根據(jù)一示例性實(shí)施例示出的一種音頻與字幕的同步裝置的框圖。
【具體實(shí)施方式】
[0066] 這里將詳細(xì)地對(duì)示例性實(shí)施例進(jìn)行說(shuō)明,其示例表示在附圖中。下面的描述涉及 附圖時(shí),除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例 中所描述的實(shí)施方式并不代表與本公開(kāi)相一致的所有實(shí)施方式。相反,它們僅是與如所附 權(quán)利要求書中所詳述的、本公開(kāi)的一些方面相一致的裝置和方法的例子。
[0067] 圖1是根據(jù)一示例性實(shí)施例示出的一種音頻與字幕的同步方法的流程圖,如圖1 所示,該音頻與字幕的同步方法用于終端設(shè)備,如智能電視中,包括以下步驟。
[0068] 在步驟S101中,根據(jù)控制指令啟動(dòng)視頻的字幕編輯模式并顯示編輯界面。
[0069] 用戶在觀看影視劇等視頻節(jié)目的過(guò)程中,如果發(fā)現(xiàn)聲音與顯示字幕不同步,則啟 動(dòng)編輯模式來(lái)調(diào)整聲音與字幕的同步性。在一個(gè)實(shí)施例中,用戶對(duì)遙控裝置上預(yù)設(shè)的單 個(gè)按鍵或組合按鍵進(jìn)行點(diǎn)擊操作時(shí),遙控裝置發(fā)送相應(yīng)的控制指令至終端設(shè)備(如智能電 視)。終端設(shè)備接收到來(lái)自遙控裝置的控制指令后,啟動(dòng)視頻的字幕編輯模式并顯示編輯界 面?;蛘?,在一個(gè)實(shí)施例中,終端設(shè)備在播放視頻的界面中顯示用于啟動(dòng)視頻的字幕編輯模 式的預(yù)設(shè)菜單選項(xiàng)。用戶在終端設(shè)備上通過(guò)按鍵操作或手勢(shì)操作來(lái)選擇該預(yù)設(shè)菜單選項(xiàng), 或者通過(guò)遙控器的方向鍵來(lái)選擇該預(yù)設(shè)菜單選項(xiàng)。終端設(shè)備接收到上述選擇操作后,觸發(fā) 相應(yīng)的控制指令來(lái)啟動(dòng)視頻的字幕編輯模式并顯示編輯界面。
[0070] 終端設(shè)備在接收到啟動(dòng)字幕編輯模式的控制指令后,調(diào)低當(dāng)前播放的視頻的亮 度,在低亮度視頻的上層顯示該字幕編輯模式的編輯界面,該編輯界面可以如圖2所示,包 括字幕顯示區(qū)域,該字幕顯示區(qū)域用于顯示當(dāng)前播放視頻的字幕。在一個(gè)實(shí)施例中,為了便 于用戶在調(diào)整字幕與聲音同步后,可以準(zhǔn)確定位視頻播放進(jìn)度,不影響用戶的觀看體驗(yàn),終 端設(shè)備根據(jù)控制指令啟動(dòng)視頻的字幕編輯模式并顯示編輯界面的同時(shí),暫停對(duì)當(dāng)前視頻的 播放,在同步完字幕與聲音后,可以從視頻暫停處繼續(xù)播放視頻。
[0071] 在步驟S102中,根據(jù)視頻的當(dāng)前播放時(shí)間獲取至少兩條字幕,在編輯界面顯示獲 取的字幕,該至少兩條字幕的初始顯示時(shí)間或終止顯示時(shí)間距離當(dāng)前播放時(shí)間在預(yù)設(shè)時(shí)間 范圍之內(nèi)。
[0072] 其中,字幕的初始顯示時(shí)間是該條字幕在視頻中開(kāi)始顯示時(shí)的時(shí)間,終止顯示時(shí) 間是該條字幕在視頻中消失時(shí)的時(shí)間;終止顯示時(shí)間與初始顯示時(shí)間之間的差值,就是該 條子辱在視頻中顯不的持續(xù)時(shí)間。
[0073] 例如,該預(yù)設(shè)時(shí)間范圍是±20秒,啟動(dòng)視頻的字幕編輯模式時(shí),該視頻的當(dāng)前播 放時(shí)間為23分35秒,則終端設(shè)備獲取距離該當(dāng)前播放時(shí)間23分35秒的±20秒范圍之內(nèi), 即從23分15秒至23分55秒之間的字幕顯示在編輯界面,以便于用戶在編輯界面中選擇 需要與音頻進(jìn)行同步調(diào)整的字幕。
[0074] 在步驟S103中,當(dāng)接收到對(duì)至少兩條字幕中的任一條字幕的選擇操作時(shí),在編輯 界面顯示視頻對(duì)應(yīng)的音軌軸,根據(jù)音軌軸來(lái)同步所選擇的字幕與其對(duì)應(yīng)的音頻。
[0075] 如圖3所示,當(dāng)用戶在編輯界面中選擇了一條字幕進(jìn)行聲音同步調(diào)整時(shí),在字幕 顯示區(qū)域下方,顯示當(dāng)前播放的視頻文件對(duì)應(yīng)的音軌軸。音軌軸中的音頻波形與字幕之間 通過(guò)時(shí)間點(diǎn)來(lái)建立對(duì)應(yīng)關(guān)系,并定位該音軌軸在所選擇字幕對(duì)應(yīng)的音頻范圍內(nèi)。
[0076] 用戶根據(jù)音軌軸將所選擇的字幕和其對(duì)應(yīng)的音頻進(jìn)行同步。在一個(gè)實(shí)施例中,上 述同步過(guò)程可通過(guò)以下步驟來(lái)實(shí)現(xiàn):
[0077] 在步驟S103a中,在編輯界面顯示音軌軸,并定位音軌軸在所選擇字幕對(duì)應(yīng)的音 頻位置處。
[0078] 音頻與字幕通過(guò)時(shí)間點(diǎn)進(jìn)行對(duì)應(yīng),終端設(shè)備顯示出當(dāng)前播放視頻的音軌軸,并根 據(jù)該視頻的當(dāng)前播放時(shí)間將音軌軸定位在所選擇的字幕對(duì)應(yīng)的音頻位置處,例如,圖3所 示的音軌軸上箭頭所在的水平位置,代表所選擇的字幕對(duì)應(yīng)的音頻所在位置。用戶在該視 頻的當(dāng)前播放時(shí)間啟動(dòng)字幕編輯模式,說(shuō)明在當(dāng)前播放時(shí)間附近出現(xiàn)了音頻與字幕不同步 的現(xiàn)象,用戶所選擇的字幕也通常出現(xiàn)在該當(dāng)前播放時(shí)間附近,因此根據(jù)該當(dāng)前播放時(shí)間 能夠?qū)⒁糗壿S定位在所選擇的字幕對(duì)應(yīng)的音頻位置附近,當(dāng)用戶所選擇的字幕是該視頻在 當(dāng)前播放時(shí)間顯示的字幕時(shí),能夠?qū)⒁糗壿S定位在所選擇的字幕對(duì)應(yīng)的音頻位置處。
[0079] 在步驟S103b中,根據(jù)用戶調(diào)整音軌軸的操作,確定選擇的字幕中第一個(gè)字對(duì)應(yīng) 的音頻的起始時(shí)間。
[0080] 用戶通過(guò)遙控裝置或者直接在終端設(shè)備上進(jìn)行操作來(lái)調(diào)整音軌軸中的箭頭在水 平方向上的位置。例如,用戶通過(guò)遙控器的方向鍵來(lái)控制音軌軸中的箭頭在水品方向上移 動(dòng)。
[0081] 當(dāng)用戶在水平方向上移動(dòng)該箭頭在音軌軸中的位置時(shí),終端設(shè)備輸出該箭頭所在 位置的音頻波形所對(duì)應(yīng)的聲音內(nèi)容,以幫助用戶確定與選擇的字幕吻合的聲音內(nèi)容在音軌 軸中的位置。例如,所選擇的字幕為"我們都在同一個(gè)城市生活"。用戶移動(dòng)該箭頭在水平 方向的位置,在移動(dòng)該箭頭的過(guò)程中,終端設(shè)備播放該箭頭所在位置的音頻的聲音內(nèi)容。當(dāng) 終端設(shè)備播放出"我"字的聲音時(shí),說(shuō)明該箭頭當(dāng)前位置對(duì)應(yīng)的音頻波形與所選擇的字幕的 第一個(gè)字"我"對(duì)應(yīng),用戶可進(jìn)一步在播放出"我"字的位置附近進(jìn)行微調(diào),找到最早播放出 "我"字的位置,從而確定與所選擇的字幕的第一個(gè)字"我"對(duì)應(yīng)的音頻在音軌軸水平方向的 位置。
[0082] 用戶通過(guò)確認(rèn)操作來(lái)確定與所選擇的字幕對(duì)應(yīng)的音頻所在位置,例如,點(diǎn)擊遙控 器的確認(rèn)鍵,或者點(diǎn)擊終端設(shè)備的確認(rèn)鍵。將此時(shí)該箭頭在音軌軸水平方向的位置所對(duì)應(yīng) 的時(shí)間信息,作為與選擇的字幕對(duì)應(yīng)的音頻的起始時(shí)間。
[0083] 在步驟S103c中,根據(jù)起始時(shí)間同步所選擇的字幕與其對(duì)應(yīng)的音頻。
[0084] 終端設(shè)備將所選擇的字幕的起始時(shí)間調(diào)整為由用戶確定的所述起始時(shí)間,從而使 所選擇的字幕與對(duì)應(yīng)音頻播放出的聲音內(nèi)容能夠吻合,達(dá)到音頻與字幕同步的效果。
[0085] 音頻與字幕的同步調(diào)整結(jié)束后,用戶退出該編輯模式,終端設(shè)備繼續(xù)播放視頻文 件。
[0086] 在音頻與字幕不同步時(shí),上述技術(shù)方案可以使用戶能夠通過(guò)操作來(lái)調(diào)整字幕的顯 示時(shí)間,實(shí)現(xiàn)音頻與字幕的同步,提升了觀影感受。
[0087] 對(duì)于所選擇的字幕所在的字幕文件來(lái)說(shuō),經(jīng)常出現(xiàn)的情形是,一條字幕與音頻不 同步,則該字幕文件中的其他字幕幾乎都不能與音頻同步,而且通常具有相同的延遲時(shí)間 或提前時(shí)間。因此,在一個(gè)實(shí)施例中,通過(guò)上述步驟中對(duì)音頻與字幕的同步調(diào)整,可重新建 立音頻與字幕的匹配關(guān)系,該匹配關(guān)系通過(guò)時(shí)間關(guān)系來(lái)表示,使得音頻和字幕能夠同步,例 如,終端設(shè)備計(jì)算所選擇的字幕的起始時(shí)間與由用戶確定的起始時(shí)間之間的時(shí)間差,該時(shí) 間差即可作為同步音頻與字幕的參照,來(lái)建立字幕與音頻的匹配關(guān)系。該音頻與字幕的同 步方法,如圖4所示,進(jìn)一步包括以下步驟。
[0088] 在步驟S104中,建立同步后的視頻的字幕和音頻的匹配關(guān)系。
[0089] 在步驟S105中,根據(jù)匹配關(guān)系,從視頻的暫停處繼續(xù)播放視頻。
[0090] 如上所述,確定所選擇的字幕的起始時(shí)間與由用戶確定的起始時(shí)間之間的時(shí)間 差,根據(jù)該時(shí)間差調(diào)整字幕文件中其他字幕的顯示時(shí)間。當(dāng)所述時(shí)間差值是正值時(shí),說(shuō)明所 選擇的字幕相對(duì)于音頻延遲顯示在屏幕上,則終端設(shè)備將所選擇的字幕所在字幕文件的其 他字幕的起始時(shí)間都提前該時(shí)間差進(jìn)行顯示,以達(dá)到音頻與字幕的同步;當(dāng)所述時(shí)間差值 是負(fù)值時(shí),說(shuō)明所選擇的字幕相對(duì)于音頻提前顯示在屏幕上,則終端設(shè)備將所選擇的字幕 所在字幕文件的其他字幕的起始時(shí)間都延遲該時(shí)間差進(jìn)行顯示,從而達(dá)到音頻與字幕的同 止 /J/ 〇
[0091] 本技術(shù)方案中,啟動(dòng)視頻的字幕編輯模式后,終端設(shè)備暫停播放該視頻。用戶根據(jù) 音軌軸完成音頻與字幕的同步調(diào)整后,退出該字幕編輯模式,終端設(shè)備從暫停處繼續(xù)播放 該視頻。終端設(shè)備從暫停處繼續(xù)播放該視頻時(shí),根據(jù)同步后的視頻的字幕和音頻的匹配關(guān) 系繼續(xù)播放該視頻,使該視頻的其他字幕自動(dòng)與音頻實(shí)現(xiàn)同步,用戶無(wú)需再次進(jìn)行手動(dòng)調(diào) 整,減少用戶操作,提高效率。
[0092] 視頻播放完畢后,如果用戶針對(duì)該視頻的字幕文件進(jìn)行了與音頻的同步調(diào)整,則 為了使該用戶和其他用戶能夠共同使用調(diào)整后的字幕文件,終端設(shè)備將調(diào)整后的字幕文件 上傳至云端服務(wù)器,在一個(gè)實(shí)施例中,如圖5所示,該音頻與字幕的同步方法還包括以下步 驟:
[0093] 在步驟S106中,將冋步后的子辱上傳到z?端,冋步后的子辱用于和z?端上存儲(chǔ)的 視頻進(jìn)行關(guān)聯(lián)。
[0094] 終端設(shè)備將同步后的字幕上傳至云端服務(wù)器后,該云端服務(wù)器通過(guò)視頻名稱等標(biāo) 識(shí)性的信息將該視頻與同步后的字幕文件進(jìn)行關(guān)聯(lián)。
[0095] 在步驟S107中,當(dāng)接收到對(duì)視頻的播放請(qǐng)求時(shí),從云端獲取與視頻關(guān)聯(lián)的同步后 的子署=。
[0096] 當(dāng)終端設(shè)備接收到來(lái)自用戶的再次播放該視頻的請(qǐng)求時(shí),就可以從云端服務(wù)器獲 取與該視頻關(guān)聯(lián)的同步后的字幕文件,而其他用戶使用的終端設(shè)備也可以從云端服務(wù)器獲 取與該視頻關(guān)聯(lián)的同步后的字幕文件,實(shí)現(xiàn)共享。
[0097] 在步驟S108中,播放視頻時(shí),顯不冋步后的子辱。
[0098] 終端設(shè)備再次播放該視頻時(shí),就會(huì)使用同步后的字幕文件,降低了音頻與字幕再 次出現(xiàn)不同步現(xiàn)象的幾率,提升用戶的觀看感受。
[0099] 圖6是根據(jù)一示例性實(shí)施例示出的一種音頻與字幕的同步裝置的框圖。參照?qǐng)D6, 該裝置包括處理模塊20,第一獲取模塊21和同步模塊22。
[0100] 該處理模塊20被配置為用于根據(jù)控制指令啟動(dòng)視頻的字幕編輯模式并顯示編輯 界面;
[0101] 該第一獲取模塊21被配置為用于根據(jù)視頻的當(dāng)前播放時(shí)間獲取至少兩條字幕, 在編輯界面顯示獲取的字幕,至少兩條字幕的初始顯示時(shí)間或終止顯示時(shí)間距離當(dāng)前播放 時(shí)間在預(yù)設(shè)時(shí)間范圍之內(nèi);
[0102] 該同步模塊22被配置為用于當(dāng)接收到對(duì)至少兩條字幕中的任一條字幕的選擇操 作時(shí),在編輯界面顯示視頻對(duì)應(yīng)的音軌軸,根據(jù)音軌軸來(lái)同步所選擇的字幕與其對(duì)應(yīng)的音 頻。
[0103] 在一個(gè)實(shí)施例中,如圖7所示,該處理模塊20包括處理單元200。
[0104] 該處理單元200被配置為用于當(dāng)接收到對(duì)預(yù)設(shè)菜單選項(xiàng)的選擇操作或?qū)b控器 上預(yù)設(shè)的單個(gè)按鍵或組合按鍵的點(diǎn)擊操作時(shí),啟動(dòng)視頻的字幕編輯模式,并顯示編輯界面。
[0105] 在一個(gè)實(shí)施例中,如圖8所示,該同步模塊22包括顯示單元220,確定單元221和 同步單元222。
[0106] 該顯示單元220被配置為用于在編輯界面顯示視頻對(duì)應(yīng)的音軌軸,并定位音軌軸 在所選擇的字幕對(duì)應(yīng)的音頻位置處;
[0107] 該確定單元221被配置為用于根據(jù)用戶調(diào)整音軌軸的操作,確定所選擇的字幕中 第一個(gè)字對(duì)應(yīng)的音頻的起始時(shí)間;
[0108] 該同步單元222被配置為用于根據(jù)起始時(shí)間同步所選擇的字幕與其對(duì)應(yīng)的音頻。
[0109] 在一個(gè)實(shí)施例中,如圖9所示,該裝置還包括暫停模塊23,建立模塊24和播放模塊 25〇
[0110] 該暫停模塊23被配置為用于根據(jù)控制指令啟動(dòng)視頻的字幕編輯模式并顯示編輯 界面的同時(shí),暫停對(duì)視頻的播放。
[0111] 該建立模塊24被配置為用于建立同步后的視頻的字幕和音頻的匹配關(guān)系;
[0112] 該播放模塊25被配置為用于根據(jù)匹配關(guān)系,從視頻的暫停處繼續(xù)播放視頻。
[0113] 在一個(gè)實(shí)施例中,如圖10所示,該裝置還包括上傳模塊26,第二獲取模塊27和顯 示模塊28。
[0114] 該上傳模塊26被配置為用于將同步后的字幕上傳到云端,同步后的字幕用于和 z?端上存儲(chǔ)的視頻進(jìn)行關(guān)聯(lián);
[0115] 該第二獲取模塊27被配置為用于當(dāng)接收到對(duì)視頻的播放請(qǐng)求時(shí),從云端獲取與 視頻關(guān)聯(lián)的同步后的字.;
[0116] 該顯示模塊28被配置為用于播放視頻時(shí),顯示同步后的字幕。
[0117] 關(guān)于上述實(shí)施例中的裝置,其中各個(gè)模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法 的實(shí)施例中進(jìn)行了詳細(xì)描述,此處將不做詳細(xì)闡述說(shuō)明。
[0118] 圖11是根據(jù)一示例性實(shí)施例示出的一種音頻與字幕的同步裝置800的框圖。例 如,裝置800可以是移動(dòng)電話,計(jì)算機(jī),數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺(tái),平板設(shè) 備,醫(yī)療設(shè)備,健身設(shè)備,個(gè)人數(shù)字助理等。
[0119] 參照?qǐng)D11,裝置800可以包括以下一個(gè)或多個(gè)組件:處理組件802,存儲(chǔ)器804,電 源組件806,多媒體組件808,音頻組件810,輸入/輸出(I/O)的接口 812,傳感器組件814, 以及通信組件816。
[0120] 處理組件802通??刂蒲b置800的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信,相 機(jī)操作和記錄操作相關(guān)聯(lián)的操作。處理元件802可以包括一個(gè)或多個(gè)處理器820來(lái)執(zhí)行指 令,以完成上述的方法的全部或部分步驟。此外,處理組件802可以包括一個(gè)或多個(gè)模塊, 便于處理組件802和其他組件之間的交互。例如,處理部件802可以包括多媒體模塊,以方 便多媒體組件808和處理組件802之間的交互。
[0121] 存儲(chǔ)器804被配置為存儲(chǔ)各種類型的數(shù)據(jù)以支持在設(shè)備800的操作。這些數(shù)據(jù)的 示例包括用于在裝置800上操作的任何應(yīng)用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話簿數(shù)據(jù), 消息,圖片,視頻等。存儲(chǔ)器804可以由任何類型的易失性或非易失性存儲(chǔ)設(shè)備或者它們的 組合實(shí)現(xiàn),如靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM),電可擦除可編程只讀存儲(chǔ)器(EEPR0M),可擦除 可編程只讀存儲(chǔ)器(EPROM),可編程只讀存儲(chǔ)器(PR0M),只讀存儲(chǔ)器(R0M),磁存儲(chǔ)器,快閃 存儲(chǔ)器,磁盤或光盤。
[0122] 電力組件806為裝置800的各種組件提供電力。電力組件806可以包括電源管理 系統(tǒng),一個(gè)或多個(gè)電源,及其他與為裝置800生成、管理和分配電力相關(guān)聯(lián)的組件。
[0123] 多媒體組件808包括在所述裝置800和用戶之間的提供一個(gè)輸出接口的屏幕。在 一些實(shí)施例中,屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面板, 屏幕可以被實(shí)現(xiàn)為觸摸屏,以接收來(lái)自用戶的輸入信號(hào)。觸摸面板包括一個(gè)或多個(gè)觸摸傳 感器以感測(cè)觸摸、滑動(dòng)和觸摸面板上的手勢(shì)。所述觸摸傳感器可以不僅感測(cè)觸摸或滑動(dòng)動(dòng) 作的邊界,而且還檢測(cè)與所述觸摸或滑動(dòng)操作相關(guān)的持續(xù)時(shí)間和壓力。在一些實(shí)施例中,多 媒體組件808包括一個(gè)前置攝像頭和/或后置攝像頭。當(dāng)設(shè)備800處于操作模式,如拍攝 模式或視頻模式時(shí),前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個(gè)前置 攝像頭和后置攝像頭可以是一個(gè)固定的光學(xué)透鏡系統(tǒng)或具有焦距和光學(xué)變焦能力。
[0124] 音頻組件810被配置為輸出和/或輸入音頻信號(hào)。例如,音頻組件810包括一個(gè) 麥克風(fēng)(MIC),當(dāng)裝置800處于操作模式,如呼叫模式、記錄模式和語(yǔ)音識(shí)別模式時(shí),麥克風(fēng) 被配置為接收外部音頻信號(hào)。所接收的音頻信號(hào)可以被進(jìn)一步存儲(chǔ)在存儲(chǔ)器804或經(jīng)由通 信組件816發(fā)送。在一些實(shí)施例中,音頻組件810還包括一個(gè)揚(yáng)聲器,用于輸出音頻信號(hào)。
[0125] I/0接口 812為處理組件802和外圍接口模塊之間提供接口,上述外圍接口模塊可 以是鍵盤,點(diǎn)擊輪,按鈕等。這些按鈕可包括但不限于:主頁(yè)按鈕、音量按鈕、啟動(dòng)按鈕和鎖 定按鈕。
[0126] 傳感器組件814包括一個(gè)或多個(gè)傳感器,用于為裝置800提供各個(gè)方面的狀態(tài)評(píng) 估。例如,傳感器組件814可以檢測(cè)到設(shè)備800的打開(kāi)/關(guān)閉狀態(tài),組件的相對(duì)定位,例如 所述組件為裝置800的顯示器和小鍵盤,傳感器組件814還可以檢測(cè)裝置800或裝置800 一個(gè)組件的位置改變,用戶與裝置800接觸的存在或不存在,裝置800方位或加速/減速和 裝置800的溫度變化。傳感器組件814可以包括接近傳感器,被配置用來(lái)在沒(méi)有任何的物 理接觸時(shí)檢測(cè)附近物體的存在。傳感器組件814還可以包括光傳感器,如CMOS或C⑶圖像 傳感器,用于在成像應(yīng)用中使用。在一些實(shí)施例中,該傳感器組件814還可以包括加速度傳 感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。
[0127] 通信組件816被配置為便于裝置800和其他設(shè)備之間有線或無(wú)線方式的通信。裝 置800可以接入基于通信標(biāo)準(zhǔn)的無(wú)線網(wǎng)絡(luò),如WiFi,2G或3G,或它們的組合。在一個(gè)示例性 實(shí)施例中,通信部件816經(jīng)由廣播信道接收來(lái)自外部廣播管理系統(tǒng)的廣播信號(hào)或廣播相關(guān) 信息。在一個(gè)示例性實(shí)施例中,所述通信部件816還包括近場(chǎng)通信(NFC)模塊,以促進(jìn)短程 通信。例如,在NFC模塊可基于射頻識(shí)別(RFID)技術(shù),紅外數(shù)據(jù)協(xié)會(huì)(IrDA)技術(shù),超寬帶 (UWB)技術(shù),藍(lán)牙(BT)技術(shù)和其他技術(shù)來(lái)實(shí)現(xiàn)。
[0128] 在示例性實(shí)施例中,裝置800可以被一個(gè)或多個(gè)應(yīng)用專用集成電路(ASIC)、數(shù)字 信號(hào)處理器(DSP)、數(shù)字信號(hào)處理設(shè)備(DSPD)、可編程邏輯器件(PLD)、現(xiàn)場(chǎng)可編程門陣列 (FPGA)、控制器、微控制器、微處理器或其他電子元件實(shí)現(xiàn),用于執(zhí)行上述方法。
[0129] 在示例性實(shí)施例中,還提供了一種包括指令的非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),例 如包括指令的存儲(chǔ)器804,上述指令可由裝置800的處理器820執(zhí)行以完成上述音頻與字幕 的同步方法。例如,所述非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是ROM、隨機(jī)存取存儲(chǔ)器(RAM)、 ⑶-ROM、磁帶、軟盤和光數(shù)據(jù)存儲(chǔ)設(shè)備等。
[0130] 一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),當(dāng)所述存儲(chǔ)介質(zhì)中的指令由移動(dòng)終端的處理 器執(zhí)行時(shí),使得移動(dòng)終端能夠執(zhí)行一種音頻與字幕的同步方法,所述方法包括:
[0131] 根據(jù)控制指令啟動(dòng)視頻的字幕編輯模式并顯示編輯界面;
[0132] 根據(jù)所述視頻的當(dāng)前播放時(shí)間獲取至少兩條字幕,在所述編輯界面顯示所述獲取 的字幕,所述至少兩條字幕的初始顯示時(shí)間或終止顯示時(shí)間距離所述當(dāng)前播放時(shí)間在預(yù)設(shè) 時(shí)間范圍之內(nèi);
[0133] 當(dāng)接收到對(duì)所述至少兩條字幕中的任一條字幕的選擇操作時(shí),在所述編輯界面顯 示所述視頻對(duì)應(yīng)的音軌軸,根據(jù)所述音軌軸來(lái)同步所選擇的字幕與其對(duì)應(yīng)的音頻。
[0134] 所述根據(jù)控制指令啟動(dòng)視頻的字幕編輯模式并顯示編輯界面,包括:
[0135] 當(dāng)接收到對(duì)預(yù)設(shè)菜單選項(xiàng)的選擇操作或?qū)b控器上預(yù)設(shè)的單個(gè)按鍵或組合按鍵 的點(diǎn)擊操作時(shí),啟動(dòng)視頻的字幕編輯模式,并顯示編輯界面。
[0136] 所述在所述編輯界面顯示所述視頻對(duì)應(yīng)的音軌軸,并根據(jù)所述音軌軸來(lái)同步所選 擇的子.與其對(duì)應(yīng)的首頻,包括:
[0137] 在所述編輯界面顯示所述視頻對(duì)應(yīng)的音軌軸,并定位所述音軌軸在所選擇的字幕 對(duì)應(yīng)的音頻位置處;
[0138] 根據(jù)用戶調(diào)整所述音軌軸的操作,確定所選擇的字幕中第一個(gè)字對(duì)應(yīng)的音頻的起 始時(shí)間;
[0139] 根據(jù)所述起始時(shí)間同步所選擇的字幕與其對(duì)應(yīng)的音頻。
[0140] 所述方法還包括:
[0141] 根據(jù)控制指令啟動(dòng)視頻的字幕編輯模式并顯示編輯界面的同時(shí),暫停對(duì)所述視頻 的播放。
[0142] 所述根據(jù)所述音軌軸來(lái)同步所選擇字幕與其對(duì)應(yīng)的音頻之后,所述方法還包括:
[0143] 建立同步后的所述視頻的字幕和音頻的匹配關(guān)系;
[0144] 根據(jù)所述匹配關(guān)系,從所述視頻的暫停處繼續(xù)播放所述視頻。
[0145] 所述方法還包括:
[0146] 將同步后的字幕上傳到云端,所述同步后的字幕用于和所述云端上存儲(chǔ)的所述視 頻進(jìn)行關(guān)聯(lián);
[0147] 當(dāng)接收到對(duì)所述視頻的播放請(qǐng)求時(shí),從云端獲取與所述視頻關(guān)聯(lián)的所述同步后的 字署=;
[0148] 播放所述視頻時(shí),顯示所述同步后的字幕。
[0149] 本領(lǐng)域技術(shù)人員在考慮說(shuō)明書及實(shí)踐這里公開(kāi)的發(fā)明后,將容易想到本公開(kāi)的其 它實(shí)施方案。本申請(qǐng)旨在涵蓋本公開(kāi)的任何變型、用途或者適應(yīng)性變化,這些變型、用途或 者適應(yīng)性變化遵循本公開(kāi)的一般性原理并包括本公開(kāi)未公開(kāi)的本【技術(shù)領(lǐng)域】中的公知常識(shí) 或慣用技術(shù)手段。說(shuō)明書和實(shí)施例僅被視為示例性的,本公開(kāi)的真正范圍和精神由下面的 權(quán)利要求指出。
[0150] 應(yīng)當(dāng)理解的是,本公開(kāi)并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并 且可以在不脫離其范圍進(jìn)行各種修改和改變。本公開(kāi)的范圍僅由所附的權(quán)利要求來(lái)限制。
【權(quán)利要求】
1. 一種音頻與字幕的同步方法,其特征在于,包括: 根據(jù)控制指令啟動(dòng)視頻的字幕編輯模式并顯示編輯界面; 根據(jù)所述視頻的當(dāng)前播放時(shí)間獲取至少兩條字幕,在所述編輯界面顯示所述獲取的字 幕,所述至少兩條字幕的初始顯示時(shí)間或終止顯示時(shí)間距離所述當(dāng)前播放時(shí)間在預(yù)設(shè)時(shí)間 范圍之內(nèi); 當(dāng)接收到對(duì)所述至少兩條字幕中的任一條字幕的選擇操作時(shí),在所述編輯界面顯示所 述視頻對(duì)應(yīng)的音軌軸,根據(jù)所述音軌軸來(lái)同步所選擇的字幕與其對(duì)應(yīng)的音頻。
2. 如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)控制指令啟動(dòng)視頻的字幕編輯模 式并顯示編輯界面,包括: 當(dāng)接收到對(duì)預(yù)設(shè)菜單選項(xiàng)的選擇操作或?qū)b控器上預(yù)設(shè)的單個(gè)按鍵或組合按鍵的點(diǎn) 擊操作時(shí),啟動(dòng)視頻的字幕編輯模式,并顯示編輯界面。
3. 如權(quán)利要求1所述的方法,其特征在于,所述在所述編輯界面顯示所述視頻對(duì)應(yīng)的 音軌軸,并根據(jù)所述音軌軸來(lái)同步所選擇的字幕與其對(duì)應(yīng)的音頻,包括: 在所述編輯界面顯示所述視頻對(duì)應(yīng)的音軌軸,并定位所述音軌軸在所選擇的字幕對(duì)應(yīng) 的音頻位置處; 根據(jù)用戶調(diào)整所述音軌軸的操作,確定所選擇的字幕中第一個(gè)字對(duì)應(yīng)的音頻的起始時(shí) 間; 根據(jù)所述起始時(shí)間同步所選擇的字幕與其對(duì)應(yīng)的音頻。
4. 如權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 根據(jù)控制指令啟動(dòng)視頻的字幕編輯模式并顯示編輯界面的同時(shí),暫停對(duì)所述視頻的播 放。
5. 如權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述音軌軸來(lái)同步所選擇字幕與 其對(duì)應(yīng)的音頻之后,所述方法還包括: 建立冋步后的所述視頻的子.和首頻的匹配關(guān)系; 根據(jù)所述匹配關(guān)系,從所述視頻的暫停處繼續(xù)播放所述視頻。
6. 如權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 將同步后的字幕上傳到云端,所述同步后的字幕用于和所述云端上存儲(chǔ)的所述視頻進(jìn) 行關(guān)聯(lián); 當(dāng)接收到對(duì)所述視頻的播放請(qǐng)求時(shí),從云端獲取與所述視頻關(guān)聯(lián)的所述同步后的字 辱; 播放所述視頻時(shí),顯示所述同步后的字幕。
7. -種音頻與字幕的同步裝置,其特征在于,包括: 處理模塊,用于根據(jù)控制指令啟動(dòng)視頻的字幕編輯模式并顯示編輯界面; 第一獲取模塊,用于根據(jù)所述視頻的當(dāng)前播放時(shí)間獲取至少兩條字幕,在所述編輯界 面顯示所述獲取的字幕,所述至少兩條字幕的初始顯示時(shí)間或終止顯示時(shí)間距離所述當(dāng)前 播放時(shí)間在預(yù)設(shè)時(shí)間范圍之內(nèi); 同步模塊,用于當(dāng)接收到對(duì)所述至少兩條字幕中的任一條字幕的選擇操作時(shí),在所述 編輯界面顯示所述視頻對(duì)應(yīng)的音軌軸,根據(jù)所述音軌軸來(lái)同步所選擇的字幕與其對(duì)應(yīng)的音 頻。
8. 如權(quán)利要求7所述的裝置,其特征在于,所述處理模塊包括: 處理單元,用于當(dāng)接收到對(duì)預(yù)設(shè)菜單選項(xiàng)的選擇操作或?qū)b控器上預(yù)設(shè)的單個(gè)按鍵或 組合按鍵的點(diǎn)擊操作時(shí),啟動(dòng)視頻的字幕編輯模式,并顯示編輯界面。
9. 如權(quán)利要求7所述的裝置,其特征在于,所述同步模塊包括: 顯示單元,用于在所述編輯界面顯示所述視頻對(duì)應(yīng)的音軌軸,并定位所述音軌軸在所 選擇的字幕對(duì)應(yīng)的音頻位置處; 確定單元,用于根據(jù)用戶調(diào)整所述音軌軸的操作,確定所選擇的字幕中第一個(gè)字對(duì)應(yīng) 的音頻的起始時(shí)間; 同步單元,用于根據(jù)所述起始時(shí)間同步所選擇的字幕與其對(duì)應(yīng)的音頻。
10. 如權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括: 暫停模塊,用于根據(jù)控制指令啟動(dòng)視頻的字幕編輯模式并顯示編輯界面的同時(shí),暫停 對(duì)所述視頻的播放。
11. 如權(quán)利要求10所述的裝置,其特征在于,所述裝置還包括: 建立模塊,用于建立同步后的所述視頻的字幕和音頻的匹配關(guān)系; 播放模塊,用于根據(jù)所述匹配關(guān)系,從所述視頻的暫停處繼續(xù)播放所述視頻。
12. 如權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括: 上傳模塊,用于將同步后的字幕上傳到云端,所述同步后的字幕用于和所述云端上存 儲(chǔ)的所述視頻進(jìn)行關(guān)聯(lián); 第二獲取模塊,用于當(dāng)接收到對(duì)所述視頻的播放請(qǐng)求時(shí),從云端獲取與所述視頻關(guān)聯(lián) 的所述冋步后的子.; 顯示模塊,用于播放所述視頻時(shí),顯示所述同步后的字幕。
13. -種音頻與字幕的同步裝置,包括: 處理器; 用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器; 其中所述處理器被配置為: 根據(jù)控制指令啟動(dòng)視頻的字幕編輯模式并顯示編輯界面; 根據(jù)所述視頻的當(dāng)前播放時(shí)間獲取至少兩條字幕,在所述編輯界面顯示所述獲取的字 幕,所述至少兩條字幕的初始顯示時(shí)間或終止顯示時(shí)間距離所述當(dāng)前播放時(shí)間在預(yù)設(shè)時(shí)間 范圍之內(nèi); 當(dāng)接收到對(duì)所述至少兩條字幕中的任一條字幕的選擇操作時(shí),在所述編輯界面顯示所 述視頻對(duì)應(yīng)的音軌軸,根據(jù)所述音軌軸來(lái)同步所選擇的字幕與其對(duì)應(yīng)的音頻。
【文檔編號(hào)】H04N21/472GK104104986SQ201410367424
【公開(kāi)日】2014年10月15日 申請(qǐng)日期:2014年7月29日 優(yōu)先權(quán)日:2014年7月29日
【發(fā)明者】訾佳逸, 劉朱坤, 劉小鶴 申請(qǐng)人:小米科技有限責(zé)任公司