顯示終端中的對(duì)話語音對(duì)應(yīng)的文本的方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種顯示終端中的對(duì)話語音對(duì)應(yīng)的文本的方法和裝置。該方法的一【具體實(shí)施方式】包括:從所述對(duì)話語音中獲取第一語音和第二語音;檢測(cè)所述第一語音和所述第二語音中,是否存在位于相同時(shí)間段內(nèi)的語音;若存在位于相同時(shí)間段內(nèi)的語音,則獲取第一文本和第二文本,所述第一文本、所述第二文本分別為所述第一語音、所述第二語音中位于所述相同時(shí)間段內(nèi)的語音對(duì)應(yīng)的文本;將所述第一文本與所述第二文本顯示在表征所述相同時(shí)間段的區(qū)域中。該實(shí)施方式實(shí)現(xiàn)了顯示的對(duì)話語音對(duì)應(yīng)的文本,可以體現(xiàn)出該對(duì)話內(nèi)容與時(shí)間的對(duì)應(yīng)關(guān)系,尤其可以體現(xiàn)哪些對(duì)話內(nèi)容是位于相同時(shí)間段上的。
【專利說明】顯示終端中的對(duì)話語音對(duì)應(yīng)的文本的方法和裝置
【技術(shù)領(lǐng)域】
[0001] 本申請(qǐng)涉及計(jì)算機(jī)【技術(shù)領(lǐng)域】,具體涉及文本顯示領(lǐng)域,尤其涉及顯示終端中的對(duì) 話語音對(duì)應(yīng)的文本的方法和裝置。
【背景技術(shù)】
[0002] 現(xiàn)有技術(shù)中,可以采用左對(duì)齊方式和右對(duì)齊方式,并按照時(shí)間順序從上到下顯示 對(duì)話雙方的文本。
[0003] 具體的,采用左對(duì)齊的方式顯示第一對(duì)話方的對(duì)話文本,采用右對(duì)齊的方式顯示 第二對(duì)話方的對(duì)話文本,并且各語音文本是按照時(shí)間順序從上到下依次顯示的。如,現(xiàn)有的 短信顯示方式。
[0004] 但是,當(dāng)對(duì)話雙方在時(shí)間上存在語音重疊時(shí),無法通過顯示的語音文本體現(xiàn)出來。
【發(fā)明內(nèi)容】
[0005] 本申請(qǐng)?zhí)峁┝艘环N顯示終端中的對(duì)話語音對(duì)應(yīng)的文本的方法和裝置,解決了當(dāng)對(duì) 話雙方在時(shí)間上存在語音重疊時(shí),無法通過顯示的語音文本體現(xiàn)出來的問題。
[0006] 第一方面,提供了一種顯示終端中的對(duì)話語音對(duì)應(yīng)的文本的方法,包括:
[0007] 從所述對(duì)話語音中獲取第一語音和第二語音;
[0008] 檢測(cè)所述第一語音和所述第二語音中,是否存在位于相同時(shí)間段內(nèi)的語音;
[0009] 若存在位于相同時(shí)間段內(nèi)的語音,則獲取第一文本和第二文本,所述第一文本、所 述第二文本分別為所述第一語音、所述第二語音中位于所述相同時(shí)間段內(nèi)的語音對(duì)應(yīng)的文 本;
[0010] 將所述第一文本與所述第二文本顯示在表征所述相同時(shí)間段的區(qū)域中。
[0011] 在某些實(shí)施方式中,所述表征相同時(shí)間段的區(qū)域?yàn)橹辽僖恍谢蛑辽僖涣?,所述?少一行和所述至少一列位于表征所述相同時(shí)間段的位置上。
[0012] 在某些實(shí)施方式中,若所述表征相同時(shí)間段的區(qū)域?yàn)橹辽僖恍?,則所述第一文本 與所述第二文本,分別顯示在所述至少一行的左側(cè)區(qū)域與右側(cè)區(qū)域中,或者,分別顯示在所 述右側(cè)區(qū)域與所述左側(cè)區(qū)域中。
[0013] 在某些實(shí)施方式中,所述左側(cè)區(qū)域與所述右側(cè)區(qū)域的范圍,是根據(jù)所述第一文本 與所述第二文本的字符數(shù)量確定的。
[0014] 在某些實(shí)施方式中,所述范圍包括高度;
[0015] 所述左側(cè)區(qū)域與所述右側(cè)區(qū)域的高度,是根據(jù)所述第一文本與所述第二文本中, 字符數(shù)量最大的文本確定的。
[0016] 在某些實(shí)施方式中,所述范圍包括寬度;
[0017] 所述左側(cè)區(qū)域的寬度與所述右側(cè)區(qū)域的寬度之比,為所述第一文本的字符數(shù)量與 所述第二文本的字符數(shù)量之比。
[0018] 在某些實(shí)施方式中,若所述表征相同時(shí)間段的區(qū)域?yàn)橹辽僖涣?,則所述第一文本 與所述第二文本,分別顯示在所述至少一列的上側(cè)區(qū)域與下側(cè)區(qū)域中,或者,分別顯示在所 述下側(cè)區(qū)域與所述上側(cè)區(qū)域中。
[0019] 在某些實(shí)施方式中,所述至少一列的寬度,是根據(jù)所述第一文本和/或所述第二 文本的字符數(shù)量確定的。
[0020] 在某些實(shí)施方式中,所述相同時(shí)間段的起始時(shí)間戳,是根據(jù)所述第一語音的起始 時(shí)間戳與所述第二語音的起始時(shí)間戳中,最晚的起始時(shí)間戳確定的。
[0021] 在某些實(shí)施方式中,所述相同時(shí)間段的起始時(shí)間戳為所述最晚的起始時(shí)間戳。
[0022] 在某些實(shí)施方式中,所述相同時(shí)間段的結(jié)束時(shí)間戳,是根據(jù)所述第一語音的結(jié)束 時(shí)間戳與所述第二語音的結(jié)束時(shí)間戳中,最早的結(jié)束時(shí)間戳確定的。
[0023] 在某些實(shí)施方式中,所述相同時(shí)間段的結(jié)束時(shí)間戳為所述最早的結(jié)束時(shí)間戳。
[0024] 在某些實(shí)施方式中,所述方法還包括:
[0025] 若不存在位于相同時(shí)間段內(nèi)的語音,則將所述第一語音對(duì)應(yīng)的文本與所述第二語 音對(duì)應(yīng)的文本,分別顯示在表征不同時(shí)間段的區(qū)域中。
[0026] 在某些實(shí)施方式中,所述表征不同時(shí)間段的區(qū)域之間顯示有表征目標(biāo)時(shí)間間隔的 空白區(qū)域,所述目標(biāo)時(shí)間間隔為所述第一語音與所述第二語音之間的時(shí)間間隔。
[0027] 在某些實(shí)施方式中,所述對(duì)話語音為如下任一項(xiàng):視頻中的對(duì)話語音、音頻中的對(duì) 話語音。
[0028] 在某些實(shí)施方式中,所述音頻中的對(duì)話語音為終端的通話語音。
[0029] 第二方面,提供了一種顯示終端中的對(duì)話語音對(duì)應(yīng)的文本的裝置,包括:
[0030] 獲取單元,用于從所述對(duì)話語音中獲取第一語音和第二語音;
[0031] 檢測(cè)單元,用于檢測(cè)所述獲取單元獲取的所述第一語音和所述第二語音中,是否 存在位于相同時(shí)間段內(nèi)的語音;
[0032] 所述獲取單元,還用于若所述檢測(cè)單元檢測(cè)存在位于相同時(shí)間段內(nèi)的語音,則獲 取第一文本和第二文本,所述第一文本、所述第二文本分別為所述第一語音、所述第二語音 中位于所述相同時(shí)間段內(nèi)的語音對(duì)應(yīng)的文本;
[0033] 顯示單元,用于將所述獲取單元獲取的所述第一文本與所述第二文本顯示在表征 所述相同時(shí)間段的區(qū)域中。
[0034] 在某些實(shí)施方式中,所述表征相同時(shí)間段的區(qū)域?yàn)橹辽僖恍谢蛑辽僖涣?,所述?少一行和所述至少一列位于表征所述相同時(shí)間段的位置上。
[0035] 在某些實(shí)施方式中,若所述表征相同時(shí)間段的區(qū)域?yàn)橹辽僖恍?,則所述第一文本 與所述第二文本,分別顯示在所述至少一行的左側(cè)區(qū)域與右側(cè)區(qū)域中,或者,分別顯示在所 述右側(cè)區(qū)域與所述左側(cè)區(qū)域中。
[0036] 在某些實(shí)施方式中,所述左側(cè)區(qū)域與所述右側(cè)區(qū)域的范圍,是根據(jù)所述第一文本 與所述第二文本的字符數(shù)量確定的。
[0037] 在某些實(shí)施方式中,所述范圍包括高度;
[0038] 所述左側(cè)區(qū)域與所述右側(cè)區(qū)域的高度,是根據(jù)所述第一文本與所述第二文本中, 字符數(shù)量最大的文本確定的。
[0039] 在某些實(shí)施方式中,所述范圍包括寬度;
[0040] 所述左側(cè)區(qū)域的寬度與所述右側(cè)區(qū)域的寬度之比,為所述第一文本的字符數(shù)量與 所述第二文本的字符數(shù)量之比。
[0041] 在某些實(shí)施方式中,若所述表征相同時(shí)間段的區(qū)域?yàn)橹辽僖涣?,則所述第一文本 與所述第二文本,分別顯示在所述至少一列的上側(cè)區(qū)域與下側(cè)區(qū)域中,或者,分別顯示在所 述下側(cè)區(qū)域與所述上側(cè)區(qū)域中。
[0042] 在某些實(shí)施方式中,所述至少一列的寬度,是根據(jù)所述第一文本和/或所述第二 文本的字符數(shù)量確定的。
[0043] 在某些實(shí)施方式中,所述相同時(shí)間段的起始時(shí)間戳,是根據(jù)所述第一語音的起始 時(shí)間戳與所述第二語音的起始時(shí)間戳中,最晚的起始時(shí)間戳確定的。
[0044] 在某些實(shí)施方式中,所述相同時(shí)間段的起始時(shí)間戳為所述最晚的起始時(shí)間戳。
[0045] 在某些實(shí)施方式中,所述相同時(shí)間段的結(jié)束時(shí)間戳,是根據(jù)所述第一語音的結(jié)束 時(shí)間戳與所述第二語音的結(jié)束時(shí)間戳中,最早的結(jié)束時(shí)間戳確定的。
[0046] 在某些實(shí)施方式中,所述相同時(shí)間段的結(jié)束時(shí)間戳為所述最早的結(jié)束時(shí)間戳。
[0047] 在某些實(shí)施方式中,所述顯示單元,還用于若所述檢測(cè)單元檢測(cè)不存在位于相同 時(shí)間段內(nèi)的語音,則將所述第一語音對(duì)應(yīng)的文本與所述第二語音對(duì)應(yīng)的文本,分別顯示在 表征不同時(shí)間段的區(qū)域中。
[0048] 在某些實(shí)施方式中,所述表征不同時(shí)間段的區(qū)域之間顯示有表征目標(biāo)時(shí)間間隔的 空白區(qū)域,所述目標(biāo)時(shí)間間隔為所述第一語音與所述第二語音之間的時(shí)間間隔。
[0049] 在某些實(shí)施方式中,所述對(duì)話語音為如下任一項(xiàng):視頻中的對(duì)話語音、音頻中的對(duì) 話語音。
[0050] 在某些實(shí)施方式中,所述音頻中的對(duì)話語音為終端的通話語音。
[0051] 在本方案中,在顯示終端中的對(duì)話語音對(duì)應(yīng)的文本時(shí),獲取對(duì)話語音第一語音和 第二語音;檢測(cè)所述第一語音和所述第二語音中,是否存在位于相同時(shí)間段內(nèi)的語音;若 存在位于相同時(shí)間段內(nèi)的語音,則獲取第一文本和第二文本,所述第一文本、所述第二文本 分別為所述第一語音、所述第二語音中位于所述相同時(shí)間段內(nèi)的語音對(duì)應(yīng)的文本;將所述 第一文本與所述第二文本顯示在表征相同時(shí)間段的區(qū)域中。與現(xiàn)有技術(shù)中,通過左對(duì)齊和 右對(duì)齊的方式顯示相比,本方案顯示的對(duì)話語音對(duì)應(yīng)的文本,可以體現(xiàn)出該對(duì)話內(nèi)容與時(shí) 間的對(duì)應(yīng)關(guān)系,尤其可以體現(xiàn)哪些對(duì)話內(nèi)容是位于相同時(shí)間段上的。
【專利附圖】
【附圖說明】
[0052] 通過閱讀參照以下附圖所作的對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本申請(qǐng)的其它 特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:
[0053] 圖1示出了本申請(qǐng)?zhí)峁┑娘@示終端中的對(duì)話語音對(duì)應(yīng)的文本的方法的一種實(shí)施 例的流程圖;
[0054] 圖2示出了本申請(qǐng)?zhí)峁┑娘@示終端中的對(duì)話語音對(duì)應(yīng)的文本的方法的另一種實(shí) 施例的流程圖;
[0055] 圖3a、3b示出了本申請(qǐng)?zhí)峁┑膬煞N"A2"子語音與"B1"子語音存在位于相同時(shí)間 段內(nèi)的語音的示意圖;
[0056] 圖4a、4b、4c、4d示出了本申請(qǐng)?zhí)峁┑乃姆N不同情況下,位于相同時(shí)間段內(nèi)的語音 的不意圖;
[0057] 圖5示出了本申請(qǐng)?zhí)峁┑囊环N當(dāng)所述表征相同時(shí)間段的區(qū)域?yàn)橹辽僖恍袝r(shí),顯示 的對(duì)話語音對(duì)應(yīng)的文本的示意圖;
[0058] 圖6示出了本申請(qǐng)?zhí)峁┑乃霰碚飨嗤瑫r(shí)間段的區(qū)域?yàn)橹辽僖恍械氖疽鈭D;
[0059] 圖7示出了本申請(qǐng)?zhí)峁┑囊环N當(dāng)所述表征相同時(shí)間段的區(qū)域?yàn)橹辽僖涣袝r(shí),顯示 的對(duì)話語音對(duì)應(yīng)的文本的示意圖;
[0060] 圖8a、8b、8c示出了本申請(qǐng)?zhí)峁┑牧硗馊N當(dāng)所述表征相同時(shí)間段的區(qū)域?yàn)橹辽?一列時(shí),顯示的對(duì)話語音對(duì)應(yīng)的文本的示意圖;
[0061] 圖9示出了本申請(qǐng)?zhí)峁┑牧硪环N當(dāng)所述表征相同時(shí)間段的區(qū)域?yàn)橹辽僖恍袝r(shí),顯 示的對(duì)話語音對(duì)應(yīng)的文本的示意圖;
[0062] 圖10示出了本申請(qǐng)?zhí)峁┑娘@示終端中的對(duì)話語音對(duì)應(yīng)的文本的裝置的一種實(shí)施 例的結(jié)構(gòu)不意圖;
[0063] 圖11示出了本申請(qǐng)?zhí)峁┑囊环N計(jì)算機(jī)的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0064] 下面結(jié)合附圖和實(shí)施例對(duì)本申請(qǐng)作進(jìn)一步的詳細(xì)說明??梢岳斫獾氖?,此處所描 述的具體實(shí)施例僅僅用于解釋相關(guān)發(fā)明,而非對(duì)該發(fā)明的限定。另外還需要說明的是,為了 便于描述,附圖中僅示出了與有關(guān)發(fā)明相關(guān)的部分。
[0065] 需要說明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相 互組合。下面將參考附圖并結(jié)合實(shí)施例來詳細(xì)說明本申請(qǐng)。
[0066] 本申請(qǐng)?zhí)峁┮环N顯示終端中的對(duì)話語音對(duì)應(yīng)的文本的方法的一個(gè)實(shí)施例,該實(shí)施 例通過應(yīng)用于終端中來舉例說明,該終端可以但不限于包括智能手機(jī)、平板電腦、膝上型便 攜計(jì)算機(jī)和臺(tái)式計(jì)算機(jī)等。
[0067] 如圖1所示,所述顯示終端中的對(duì)話語音對(duì)應(yīng)的文本的方法可以包括如下步驟: [0068] 101、從所述對(duì)話語音中獲取第一語音和第二語音。
[0069] 通常的,終端中可以包括有對(duì)話語音,該對(duì)話語音可以是通過錄音得到的,也可以 是通過接收其他設(shè)備發(fā)送的等,如,本地終端與對(duì)端終端通話時(shí),可以存儲(chǔ)通話語音,或者, 通過終端錄制對(duì)話語音等。為了便于用戶理解對(duì)話內(nèi)容,終端不僅可以播放本地的對(duì)話語 音,還可以顯示對(duì)話語音的文本。對(duì)話語音中包括對(duì)話雙方的第一語音和第二語音,在顯示 對(duì)話語音的文本前,首先需要從所述對(duì)話語音中獲取第一語音和第二語音。
[0070] 通常的,對(duì)話語音為對(duì)話雙方交替對(duì)話,每一對(duì)話方可以包括位于至少一個(gè)子時(shí) 間段的子語音,如,第一語音為對(duì)話方A的語音,第二語音為對(duì)話方B的語音,對(duì)話語音描述 的內(nèi)容和時(shí)間可以但不限于分別如下:Al :"今晚有空嗎?",時(shí)間:17點(diǎn)01分35秒至17點(diǎn) 01分37秒,Bl :"有空,但是我需要出去一會(huì)買本書",時(shí)間:17點(diǎn)01分38秒至17點(diǎn)01分 41秒,A2 :"麻煩回來的時(shí)候帶些飲料",時(shí)間:17點(diǎn)01分39秒至17點(diǎn)01分42秒,B2 :"好 的",時(shí)間:17點(diǎn)01分45秒至17點(diǎn)01分46秒。其中,第一語音包括位于17點(diǎn)01分35秒 至17點(diǎn)01分37秒的"A1"子語音,和17點(diǎn)01分35秒至17點(diǎn)01分37秒內(nèi)的"A2"子語 音,第二語音包括位于17點(diǎn)01分38秒至17點(diǎn)01分41秒的"B1"子語音,和17點(diǎn)01分 45秒至17點(diǎn)01分46秒內(nèi)的"B2"子語音。
[0071] 在本實(shí)施例中,第一語音和第二語音可以包括相應(yīng)對(duì)話方的所有語音或部分語 音,如,第一語音可以包括上述"A1"和"A2"兩段子語音,也可以只包括"A1"或"A2" 一段 子語音,具體可以根據(jù)實(shí)際需要進(jìn)行設(shè)定,在此不作贅述。下面的實(shí)施例的相應(yīng)內(nèi)容中均以 第一語音包括上述"A2" 一段子語音,第二語音包括上述"B1" 一段子語音為例進(jìn)行說明。
[0072] 102、檢測(cè)所述第一語音和所述第二語音中,是否存在位于相同時(shí)間段內(nèi)的語音。
[0073] 第一語音與第二語音均對(duì)應(yīng)于相應(yīng)的時(shí)間戳,終端可以獲取第一語音和第二語音 中的子語音所位于的時(shí)間段,然后,可以檢測(cè)第一語音與第二語音包括的子語音中,是否存 在位于相同時(shí)間段內(nèi)的語音,即是否存在在時(shí)間軸上重疊的語音。本實(shí)施例對(duì)終端獲取第 一語音與第二語音所位于的時(shí)間段的方法不作限定,為本領(lǐng)域技術(shù)人員熟知的技術(shù),在此 不作贅述。
[0074] 例如,"B1"子語音的時(shí)間為:17點(diǎn)01分38秒至17點(diǎn)01分41秒,"A2"子語音的 時(shí)間為:17點(diǎn)01分39秒至17點(diǎn)01分42秒,由此可知,第一語音與第二語音存在位于相 同時(shí)間段內(nèi)的語音,該相同時(shí)間段可以確定為:17點(diǎn)01分39秒至17點(diǎn)01分41秒。
[0075] 103、若存在位于相同時(shí)間段內(nèi)的語音,貝U獲取第一文本和第二文本。
[0076] 其中,所述第一文本、所述第二文本分別為所述第一語音、所述第二語音中位于所 述相同時(shí)間段內(nèi)的語音對(duì)應(yīng)的文本。
[0077] 例如,第一語音即"A2"子語音中,位于"17點(diǎn)01分39秒至17點(diǎn)01分41秒"時(shí) 間段內(nèi)的語音對(duì)應(yīng)的第一文本可以包括:"需要出去一會(huì)買本書",第二語音即"B1"子語音 中,位于"17點(diǎn)01分39秒至17點(diǎn)01分41秒"時(shí)間段內(nèi)的語音對(duì)應(yīng)的第二文本可以包括 "麻煩回來的"。
[0078] 104、將所述第一文本與所述第二文本顯示在表征所述相同時(shí)間段的區(qū)域中。
[0079] 為了使顯示的文本可以體現(xiàn)出對(duì)話內(nèi)容與時(shí)間的對(duì)應(yīng)關(guān)系,尤其可以體現(xiàn)出哪些 對(duì)話內(nèi)容是位于相同時(shí)間段上的,終端可以將所述第一文本與所述第二文本顯示在表征所 述相同時(shí)間段的區(qū)域中。
[0080] 在本方案中,在顯示終端中的對(duì)話語音對(duì)應(yīng)的文本時(shí),獲取對(duì)話語音第一語音和 第二語音;檢測(cè)所述第一語音和所述第二語音中,是否存在位于相同時(shí)間段內(nèi)的語音;若 存在位于相同時(shí)間段內(nèi)的語音,則獲取第一文本和第二文本,所述第一文本、所述第二文本 分別為所述第一語音、所述第二語音中位于所述相同時(shí)間段內(nèi)的語音對(duì)應(yīng)的文本;將所述 第一文本與所述第二文本顯示在表征相同時(shí)間段的區(qū)域中。與現(xiàn)有技術(shù)中,通過左對(duì)齊和 右對(duì)齊的方式顯示相比,本方案顯示的對(duì)話語音對(duì)應(yīng)的文本,可以體現(xiàn)出該對(duì)話內(nèi)容與時(shí) 間的對(duì)應(yīng)關(guān)系,尤其可以體現(xiàn)哪些對(duì)話內(nèi)容是位于相同時(shí)間段上的。
[0081] 本申請(qǐng)?zhí)峁┮环N顯示終端中的對(duì)話語音對(duì)應(yīng)的文本的方法的另一個(gè)實(shí)施例,該實(shí) 施例是對(duì)圖1所示的實(shí)施例的進(jìn)一步擴(kuò)展和優(yōu)化,如圖2所示,可以包括:
[0082] 201、從所述對(duì)話語音中獲取第一語音和第二語音。
[0083] 進(jìn)一步地,對(duì)話語音可以但不限于為如下任一項(xiàng):視頻中的對(duì)話語音、音頻中的對(duì) 話語音。
[0084] 進(jìn)一步地,所述音頻中的對(duì)話語音可以但不限于為終端的通話語音。
[0085] 本實(shí)施例對(duì)對(duì)話語音不作限定,具體可以根據(jù)實(shí)際需要進(jìn)行設(shè)定,在此不作贅述。
[0086] 202、檢測(cè)所述第一語音和所述第二語音中,是否存在位于相同時(shí)間段內(nèi)的語音。 若存在,則執(zhí)行步驟203,若不存在,則執(zhí)行步驟205。
[0087] 例如,終端可以首先獲取起始時(shí)間較早的"B1"子語音,判斷"A2"子語音的起始時(shí) 間戳與"B1"子語音的時(shí)間段的關(guān)系,可以但不限于包括:判斷"A2"子語音的起始時(shí)間戳是 位于"B1"子語音的時(shí)間段之后還是之中,如圖3a所示,若"A2"子語音的起始時(shí)間戳位于 "B1"子語音的時(shí)間段之中,則說明"A2"子語音與"B1"子語音存在位于相同時(shí)間段內(nèi)的語 音,圖3b所示,若"A2"子語音的起始時(shí)間戳位于"B1"子語音的時(shí)間段后,則說明"A2"子 語音與"B1"子語音不存在位于相同時(shí)間段內(nèi)的語音。
[0088] 本實(shí)施例對(duì)檢測(cè)所述第一語音和所述第二語音中,是否存在位于相同時(shí)間段內(nèi)的 語音的方法不作限定,為本領(lǐng)域技術(shù)人員熟知的技術(shù),在此不作贅述。
[0089] 203、獲取第一文本和第二文本。
[0090] 所述第一文本、所述第二文本分別為所述第一語音、所述第二語音中位于所述相 同時(shí)間段內(nèi)的語音對(duì)應(yīng)的文本。
[0091] 終端在獲取第一文本與第二文本之前,首先需要確定所述相同時(shí)間段。
[0092] 進(jìn)一步地,所述相同時(shí)間段的起始時(shí)間戳,是根據(jù)所述第一語音的起始時(shí)間戳與 所述第二語音的起始時(shí)間戳中,最晚的起始時(shí)間戳確定的。
[0093] 具體的,確定的所述相同時(shí)間段的起始時(shí)間戳與所述最晚的起始時(shí)間戳之間相隔 的時(shí)間段小于預(yù)設(shè)時(shí)間段。其中,預(yù)設(shè)時(shí)間段可以但不限于為:1秒、〇. 5秒等。
[0094] 進(jìn)一步地,所述相同時(shí)間段的起始時(shí)間戳可以但不限于為所述最晚的起始時(shí)間 戳。
[0095] 進(jìn)一步地,所述相同時(shí)間段的結(jié)束時(shí)間戳,是根據(jù)所述第一語音的結(jié)束時(shí)間戳與 所述第二語音的結(jié)束時(shí)間戳中,最早的結(jié)束時(shí)間戳確定的。
[0096] 具體的,確定的所述相同時(shí)間段的結(jié)束時(shí)間戳與所述最早的結(jié)束時(shí)間戳之間相隔 的時(shí)間段小于預(yù)設(shè)時(shí)間段。其中,預(yù)設(shè)時(shí)間段可以但不限于為:1秒、〇. 5秒等。
[0097] 進(jìn)一步地,所述相同時(shí)間段的結(jié)束時(shí)間戳可以但不限于為所述最早的結(jié)束時(shí)間 戳。
[0098] 例如,如圖4a所示,根據(jù)步驟202可知,"A2"子語音和"B1"子語音中存在位于相 同時(shí)間段內(nèi)的語音,且"A2"子語音的起始時(shí)間戳晚于"B1"子語音的起始時(shí)間戳,"A2"子語 音的結(jié)束時(shí)間戳晚于"B1"子語音的結(jié)束時(shí)間戳。所述相同時(shí)間段的起始時(shí)間戳可以根據(jù) "B1"子語音的起始時(shí)間戳確定,如,可以將所述相同時(shí)間段的起始時(shí)間戳確定為"B1"子語 音的起始時(shí)間戳,所述相同時(shí)間段的結(jié)束時(shí)間戳可以根據(jù)"A2"子語音的結(jié)束時(shí)間戳確定, 如,可以將所述相同時(shí)間段的結(jié)束時(shí)間戳確定為"A2"子語音的起始時(shí)間戳。由此可知,所 述相同時(shí)間段可以為:17點(diǎn)01分39秒至17點(diǎn)01分41秒。
[0099] 另外,如圖4b所示,在"A2"子語音與"B1"子語音存在位于相同時(shí)間段內(nèi)的語音 的情況下,若"A2"子語音的起始時(shí)間戳晚于"B1"子語音的起始時(shí)間戳,且"A2"子語音的 結(jié)束時(shí)間戳早于"B1"子語音的結(jié)束時(shí)間戳,則可以將所述相同時(shí)間段的起始時(shí)間戳確定為 "A2"子語音的起始時(shí)間戳,可以將所述相同時(shí)間段的結(jié)束時(shí)間戳確定為"A2"子語音的結(jié)束 時(shí)間戳;如圖4c所示,若"A2"子語音的起始時(shí)間戳早于"B1"子語音的起始時(shí)間戳,且"A2" 子語音的結(jié)束時(shí)間戳早于"B1"子語音的結(jié)束時(shí)間戳,則可以將所述相同時(shí)間段的起始時(shí)間 戳確定為"B1"子語音的起始時(shí)間戳,可以將所述相同時(shí)間段的結(jié)束時(shí)間戳確定為"A2"子 語音的結(jié)束時(shí)間戳;如圖4d所示,若"A2"子語音的起始時(shí)間戳早于"B1"子語音的起始時(shí) 間戳,且"A2"子語音的結(jié)束時(shí)間戳晚于"B1"子語音的結(jié)束時(shí)間戳,則可以將所述相同時(shí)間 段的起始時(shí)間戳確定為"B1"子語音的起始時(shí)間戳,可以將所述相同時(shí)間段的結(jié)束時(shí)間戳確 定為"B1"子語音的結(jié)束時(shí)間戳。
[0100] 終端在確定所述相同時(shí)間段的起始時(shí)間戳和結(jié)束時(shí)間戳后,可以但不限于分別獲 取第一語音和第二語音中,位于所述相同時(shí)間段內(nèi)的語音,再分別獲取該語音對(duì)應(yīng)的第一 文本和第二文本。
[0101] 例如,如圖4a所示,終端可以確定第一語音中位于"17點(diǎn)01分39秒至17點(diǎn)01 分41秒"時(shí)間段內(nèi)的第一目標(biāo)語音,然后,可以通過語音識(shí)別技術(shù)獲取與第一目標(biāo)語音對(duì) 應(yīng)的第一文本,第一文本可以包括:"需要出去一會(huì)買本書",終端可以確定第一語音中位于 "17點(diǎn)01分39秒至17點(diǎn)01分41秒"時(shí)間段內(nèi)的第二目標(biāo)語音,然后,可以通過語音識(shí)別 技術(shù)獲取第二目標(biāo)語音對(duì)應(yīng)的第二文本,第二文本可以包括:"麻煩回來的時(shí)候"。
[0102] 本實(shí)施例對(duì)通過語音識(shí)別技術(shù)獲取相應(yīng)語音對(duì)應(yīng)的文本的方法不作限定,為本領(lǐng) 域技術(shù)人員熟知的技術(shù),在此不作贅述。
[0103] 204、將所述第一文本與所述第二文本顯示在表征所述相同時(shí)間段的區(qū)域中。
[0104] 進(jìn)一步地,所述表征相同時(shí)間段的區(qū)域可以但不限于為至少一行或至少一列,所 述至少一行和所述至少一列位于表征所述相同時(shí)間段的位置上。
[0105] 進(jìn)一步地,若所述表征相同時(shí)間段的區(qū)域?yàn)橹辽僖恍?,則所述第一文本與所述第 二文本,分別顯示在所述至少一行的左側(cè)區(qū)域與右側(cè)區(qū)域中,或者,分別顯示在所述右側(cè)區(qū) 域與所述左側(cè)區(qū)域中。
[0106] 在本實(shí)施例,當(dāng)對(duì)話語音為通話語音時(shí),將對(duì)話語音轉(zhuǎn)換成相應(yīng)的文本之后,通常 采用左對(duì)齊方式和右對(duì)齊方式顯示不同對(duì)話方對(duì)應(yīng)的文本,如,短信的顯示方式。這樣,如 圖5所示,為了通過顯示的字幕呈現(xiàn)在時(shí)間上對(duì)話的重疊,則可以將與所述相同時(shí)間段對(duì) 應(yīng)的文本顯示在至少一行中,即將所述第一文本與所述第二文本顯示在表征所述相同時(shí)間 段的至少一行中。
[0107] 進(jìn)一步地,所述左側(cè)區(qū)域與所述右側(cè)區(qū)域的范圍,是根據(jù)所述第一文本與所述第 二文本的字符數(shù)量確定的。
[0108] 進(jìn)一步地,所述范圍可以但不限于包括高度。所述左側(cè)區(qū)域與所述右側(cè)區(qū)域的高 度,是根據(jù)所述第一文本與所述第二文本中,字符數(shù)量最大的文本確定的。所述范圍還可以 包括寬度。所述左側(cè)區(qū)域的寬度與所述右側(cè)區(qū)域的寬度之比,為所述第一文本的字符數(shù)量 與所述第二文本的字符數(shù)量之比。
[0109] 具體的,如圖6所示,左側(cè)區(qū)域?qū)挾扰c所述右側(cè)區(qū)域?qū)挾瓤梢缘幌抻跐M足如下
【權(quán)利要求】
1. 一種顯示終端中的對(duì)話語音對(duì)應(yīng)的文本的方法,其特征在于,包括: 從所述對(duì)話語音中獲取第一語音和第二語音; 檢測(cè)所述第一語音和所述第二語音中,是否存在位于相同時(shí)間段內(nèi)的語音; 若存在位于相同時(shí)間段內(nèi)的語音,則獲取第一文本和第二文本,所述第一文本、所述第 二文本分別為所述第一語音、所述第二語音中位于所述相同時(shí)間段內(nèi)的語音對(duì)應(yīng)的文本; 將所述第一文本與所述第二文本顯示在表征所述相同時(shí)間段的區(qū)域中。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述表征相同時(shí)間段的區(qū)域?yàn)橹辽僖恍?或至少一列,所述至少一行和所述至少一列位于表征所述相同時(shí)間段的位置上。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,若所述表征相同時(shí)間段的區(qū)域?yàn)橹辽僖?行,則所述第一文本與所述第二文本,分別顯示在所述至少一行的左側(cè)區(qū)域與右側(cè)區(qū)域中, 或者,分別顯示在所述右側(cè)區(qū)域與所述左側(cè)區(qū)域中。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述左側(cè)區(qū)域與所述右側(cè)區(qū)域的范圍,是 根據(jù)所述第一文本與所述第二文本的字符數(shù)量確定的。
5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述范圍包括高度; 所述左側(cè)區(qū)域與所述右側(cè)區(qū)域的高度,是根據(jù)所述第一文本與所述第二文本中,字符 數(shù)量最大的文本確定的。
6. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述范圍包括寬度; 所述左側(cè)區(qū)域的寬度與所述右側(cè)區(qū)域的寬度之比,為所述第一文本的字符數(shù)量與所述 第二文本的字符數(shù)量之比。
7. 根據(jù)權(quán)利要求2所述的方法,其特征在于,若所述表征相同時(shí)間段的區(qū)域?yàn)橹辽僖?列,則所述第一文本與所述第二文本,分別顯示在所述至少一列的上側(cè)區(qū)域與下側(cè)區(qū)域中, 或者,分別顯示在所述下側(cè)區(qū)域與所述上側(cè)區(qū)域中。
8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,所述至少一列的寬度,是根據(jù)所述第一文 本和/或所述第二文本的字符數(shù)量確定的。
9. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述相同時(shí)間段的起始時(shí)間戳,是根據(jù)所 述第一語音的起始時(shí)間戳與所述第二語音的起始時(shí)間戳中,最晚的起始時(shí)間戳確定的。
10. 根據(jù)權(quán)利要求9所述的方法,其特征在于,所述相同時(shí)間段的起始時(shí)間戳為所述最 晚的起始時(shí)間戳。
11. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述相同時(shí)間段的結(jié)束時(shí)間戳,是根據(jù) 所述第一語音的結(jié)束時(shí)間戳與所述第二語音的結(jié)束時(shí)間戳中,最早的結(jié)束時(shí)間戳確定的。
12. 根據(jù)權(quán)利要求11所述的方法,其特征在于,所述相同時(shí)間段的結(jié)束時(shí)間戳為所述 最早的結(jié)束時(shí)間戳。
13. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 若不存在位于相同時(shí)間段內(nèi)的語音,則將所述第一語音對(duì)應(yīng)的文本與所述第二語音對(duì) 應(yīng)的文本,分別顯示在表征不同時(shí)間段的區(qū)域中。
14. 根據(jù)權(quán)利要求13所述的方法,其特征在于,所述表征不同時(shí)間段的區(qū)域之間顯示 有表征目標(biāo)時(shí)間間隔的空白區(qū)域,所述目標(biāo)時(shí)間間隔為所述第一語音與所述第二語音之間 的時(shí)間間隔。
15. 根據(jù)權(quán)利要求1至14中任一項(xiàng)所述的方法,其特征在于,所述對(duì)話語音為如下任一 項(xiàng):視頻中的對(duì)話語音、音頻中的對(duì)話語音。
16. 根據(jù)權(quán)利要求15所述的方法,其特征在于,所述音頻中的對(duì)話語音為終端的通話 語音。
17. -種顯示終端中的對(duì)話語音對(duì)應(yīng)的文本的裝置,其特征在于,包括: 獲取單元,用于從所述對(duì)話語音中獲取第一語音和第二語音; 檢測(cè)單元,用于檢測(cè)所述獲取單元獲取的所述第一語音和所述第二語音中,是否存在 位于相同時(shí)間段內(nèi)的語音; 所述獲取單元,還用于若所述檢測(cè)單元檢測(cè)存在位于相同時(shí)間段內(nèi)的語音,則獲取第 一文本和第二文本,所述第一文本、所述第二文本分別為所述第一語音、所述第二語音中位 于所述相同時(shí)間段內(nèi)的語音對(duì)應(yīng)的文本; 顯示單元,用于將所述獲取單元獲取的所述第一文本與所述第二文本顯示在表征所述 相同時(shí)間段的區(qū)域中。
【文檔編號(hào)】G06F17/30GK104408042SQ201410553220
【公開日】2015年3月11日 申請(qǐng)日期:2014年10月17日 優(yōu)先權(quán)日:2014年10月17日
【發(fā)明者】馮穗豫, 樸在善 申請(qǐng)人:廣州三星通信技術(shù)研究有限公司, 三星電子株式會(huì)社