語音信息處理方法和裝置制造方法

文檔序號：2827730閱讀：249來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

語音信息處理方法和裝置制造方法
【專利摘要】本申請公開了語音信息處理方法和裝置。所述方法的一【具體實施方式】包括：獲取語音信息；將根據(jù)所述語音信息得到的文字信息進(jìn)行顯示；根據(jù)所述文字信息處理所述語音信息。該實施方式拓展了終端處理語音信息的能力。
【專利說明】語音信息處理方法和裝置

【技術(shù)領(lǐng)域】
[0001]本申請涉及計算機(jī)【技術(shù)領(lǐng)域】，具體涉及終端【技術(shù)領(lǐng)域】，尤其涉及語音信息處理方法和裝置。

【背景技術(shù)】
[0002]語音信息是一種信息表現(xiàn)形式，通過將想要說的話進(jìn)行錄音可以生成語音信息，然后再將語音信息發(fā)給一個或多個用戶進(jìn)行收聽，就實現(xiàn)了信息的傳遞。與傳統(tǒng)的文字信息相比，語音信息的錄入更加方便，并且還能傳遞發(fā)送者特有的聲音、語氣等信息，因此被越來越廣泛地使用在各類通信應(yīng)用中。現(xiàn)有技術(shù)中，對于接收到的語音消息只能進(jìn)行收聽、保存或轉(zhuǎn)發(fā)等操作。

【發(fā)明內(nèi)容】

[0003]本申請?zhí)峁┝艘环N語音信息處理方法和裝置。
[0004]一方面，本申請?zhí)峁┝艘环N語音信息處理方法，所述方法包括:獲取語音信息；將根據(jù)所述語音信息得到的文字信息進(jìn)行顯示；根據(jù)所述文字信息處理所述語音信息。
[0005]在某些實施方式中，所述根據(jù)所述文字信息處理所述語音信息包括:接收對所述文字信息的選擇操作，得到被選中的文字片段；獲取所述語音信息中與所述被選中的文字片段對應(yīng)的語音片段。
[0006]在某些實施方式中，當(dāng)被選中的文字片段為多個時，所述獲取所述語音信息中與所述文字片段對應(yīng)的語音片段包括:獲取所述語音信息中與所述文字片段對應(yīng)的多個語音片段；將所述多個語音片段進(jìn)行組合。
[0007]在某些實施方式中，所述將根據(jù)所述語音信息得到的文本信息進(jìn)行顯示包括:將所述語音信息進(jìn)行語音識別得到文字信息；將所述文字信息進(jìn)行顯示。
[0008]在某些實施方式中，所述文字信息與所述語音信息按照時間關(guān)系相互對應(yīng)。
[0009]在某些實施方式中，所述方法還包括:將所述語音信息對應(yīng)的音頻波形進(jìn)行顯示。
[0010]在某些實施方式中，所述文字信息中文字的顯示位置與所述音頻波形的顯示位置按照時間關(guān)系相互對應(yīng)。
[0011]在某些實施方式中，所述方法還包括:當(dāng)接收對所述文字信息的選擇操作時，將被選中的文字片段和與所述文字片段對應(yīng)的被選中的音頻波形片段同時或先后顯示為被選中狀態(tài)；和/或當(dāng)接收對所述音頻波形的選擇操作時，將被選中的音頻波形片段和與所述音頻波形片段對應(yīng)的被選中的文字片段同時或先后顯示為被選中狀態(tài)。
[0012]在某些實施方式中，所述接收對所述音頻波形的選擇操作包括:獲取時間桿在所述音頻波形上的位置信息；根據(jù)所述位置信息，獲取對所述音頻波形的選擇操作。
[0013]在某些實施方式中，所述獲取所述語音信息中與所述被選擇中的文字片段對應(yīng)的語音片段，包括:獲取所述語音信息中與所述被選中的音頻波形片段對應(yīng)的語音片段。
[0014]在某些實施方式中，所述方法還包括:獲取生成所述語音信息的用戶信息；將所述用戶信息與所述語音片段進(jìn)行關(guān)聯(lián)。
[0015]在某些實施方式中，所述方法還包括:將所述語音片段保存為語音文件，其中，所述語音文件的屬性信息包括所述用戶信息。
[0016]在某些實施方式中，所述關(guān)聯(lián)的表現(xiàn)形式包括視覺關(guān)聯(lián)和/或聽覺關(guān)聯(lián)。
[0017]在某些實施方式中，所述方法還包括:將所述語音片段進(jìn)行試聽、保存、轉(zhuǎn)發(fā)、共享操作或設(shè)置為鈴聲。
[0018]第二方面，本申請?zhí)峁┝艘环N語音信息處理裝置，所述裝置包括:語音信息獲取模塊，用于獲取語音信息；文字信息顯示模塊，用于將根據(jù)所述語音信息得到的文字信息進(jìn)行顯示；語音信息處理模塊，用于根據(jù)所述文字信息處理所述語音信息。
[0019]在某些實施方式中，所述語音信息處理模塊包括:文字信息選擇單元，用于接收對所述文字信息的選擇操作，得到被選中的文字片段；語音片段獲取單元，用于獲取所述語音信息中與所述被選中的文字片段對應(yīng)的語音片段。
[0020]在某些實施方式中，當(dāng)被選中的文字片段為多個時，所述語音片段獲取單元包括:語音片段獲取子單元，用于獲取所述語音信息中與所述文字片段對應(yīng)的多個語音片段；語音片段組合子單元，用于將所述多個語音片段進(jìn)行組合。
[0021]在某些實施方式中，所述文字信息顯示模塊包括:語音信息識別單元，用于將所述語音信息進(jìn)行語音識別得到文字信息；文字信息顯示單元，用于將所述文字信息進(jìn)行顯示。
[0022]在某些實施方式中，所述文字信息與所述語音信息按照時間關(guān)系相互對應(yīng)。
[0023]在某些實施方式中，所述裝置還包括:音頻波形顯示模塊，用于將所述語音信息對應(yīng)的音頻波形進(jìn)行顯示。
[0024]在某些實施方式中，所述文字信息中文字的顯示位置與所述音頻波形的顯示位置按照時間關(guān)系相互對應(yīng)。
[0025]在某些實施方式中，所述裝置還包括:第一顯示模塊，用于當(dāng)接收對所述文字信息的選擇操作時，將被選中的文字片段和與所述文字片段對應(yīng)的被選中的音頻波形片段同時或先后顯示為被選中狀態(tài)；第二顯示模塊，用于當(dāng)接收對所述音頻波形的選擇操作時，將被選中的音頻波形片段和與所述音頻波形片段對應(yīng)的被選中的文字片段同時或先后顯示為被選中狀態(tài)。
[0026]在某些實施方式中，所述接收對所述音頻波形的選擇操作包括:獲取時間桿在所述音頻波形上的位置信息；根據(jù)所述位置信息，獲取對所述音頻波形的選擇操作。
[0027]在某些實施方式中，所述語音片段獲取單元包括:波形片段獲取單元，用于獲取所述語音信息中與所述被選中的音頻波形片段對應(yīng)的語音片段。
[0028]在某些實施方式中，所述裝置還包括:用戶信息獲取模塊，用于獲取生成所述語音信息的用戶信息；用戶信息關(guān)聯(lián)模塊，用于將所述用戶信息與所述語音片段進(jìn)行關(guān)聯(lián)。
[0029]在某些實施方式中，所述裝置還包括:語音片段保存模塊，用于將所述語音片段保存為語音文件，其中，所述語音文件的屬性信息包括所述用戶信息。
[0030]在某些實施方式中，所述關(guān)聯(lián)的表現(xiàn)形式包括視覺關(guān)聯(lián)和/或聽覺關(guān)聯(lián)。
[0031]在某些實施方式中，所述裝置還包括:語音片段處理模塊，用于將所述語音片段進(jìn)行試聽、保存、轉(zhuǎn)發(fā)、共享操作或設(shè)置為鈴聲。
[0032]本申請?zhí)峁┑恼Z音信息處理方法和裝置，通過獲取語音信息，然后將根據(jù)所述語音信息得到的文字信息進(jìn)行顯示，最后根據(jù)所述文字信息處理所述語音信息，實現(xiàn)了通過文字信息獲取語音信息內(nèi)容并進(jìn)一步對語音信息進(jìn)行處理的目的，拓展了終端處理語音信息的能力。

【專利附圖】

【附圖說明】
[0033]通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細(xì)描述，本申請的其它特征、目的和優(yōu)點將會變得更明顯:
[0034]圖1是本申請語音信息處理方法的一個實施例的流程圖；
[0035]圖2是本申請語音信息處理方法的另一個實施例的流程圖；
[0036]圖3A是圖2所示實施例的一個應(yīng)用場景的示意圖；
[0037]圖3B是圖3A所述應(yīng)用場景中語首/[目息與文字/[目息的對應(yīng)關(guān)系不意圖；
[0038]圖4是本申請語音信息處理方法的再一個實施例的流程圖；
[0039]圖5A是圖4所示實施例的一個應(yīng)用場景的示意圖；
[0040]圖5B是圖4所示實施例的另一個應(yīng)用場景的示意圖；
[0041]圖6是本申請語音信息處理裝置的一個實施例的結(jié)構(gòu)示意圖；
[0042]圖7是本申請語音信息處理裝置的另一個實施例的結(jié)構(gòu)示意圖；
[0043]圖8是本申請語音信息處理裝置的再一個實施例的結(jié)構(gòu)示意圖。

【具體實施方式】
[0044]下面結(jié)合附圖和實施例對本申請作進(jìn)一步的詳細(xì)說明?？梢岳斫獾氖?，此處所描述的具體實施例僅僅用于解釋相關(guān)發(fā)明，而非對該發(fā)明的限定。另外還需要說明的是，為了便于描述，附圖中僅示出了與有關(guān)發(fā)明相關(guān)的部分。
[0045]需要說明的是，在不沖突的情況下，本申請中的實施例及實施例中的特征可以相互組合。下面將參考附圖并結(jié)合實施例來詳細(xì)說明本申請。
[0046]請參考圖1，其示出了語音信息處理的一個實施例的流程100。本實施例主要以該方法應(yīng)用于包含有顯示屏的終端中來舉例說明，該終端可以包括智能手機(jī)、平板電腦、電子書閱讀器、MP3 播放器(Moving Picture Experts Group Aud1 Layer III，動態(tài)影像專家壓縮標(biāo)準(zhǔn)音頻層面 3)、MP4 (Moving Picture Experts Group Aud1 Layer IV,動態(tài)影像專家壓縮標(biāo)準(zhǔn)音頻層面4)播放器、膝上型便攜計算機(jī)和臺式計算機(jī)等等。所述在全屏應(yīng)用下使用小組件的方法，包括以下步驟:
[0047]步驟101、獲取語音信息。
[0048]在本實施例中，所述語音信息中承載的語音是指人類通過發(fā)音器官發(fā)出來的、具有一定意義的、目的是用來進(jìn)行社會交際的聲音。在獲取語音信息時，可以由上述終端通過有線連接方式或者無線連接方式來獲取語音信息，也可以直接獲取預(yù)先存儲在所述終端本地的語首?目息。
[0049]在由上述終端通過有線連接方式或者無線連接方式來獲取語音信息時，可以是通過即時通信軟件來接收對方發(fā)送的語音信息，也可以是從網(wǎng)絡(luò)服務(wù)器上下載暫存的語音信息，其中，所述無線連接方式包括但不限于3G連接、WiFi連接、藍(lán)牙連接、WiMAX連接、Zigbee連接、UWB (ultra wideband)連接或者其它未來將開發(fā)的無線連接方式。
[0050]步驟102、將根據(jù)所述語音信息得到的文字信息進(jìn)行顯示。
[0051]在本實施例中，上述終端可以根據(jù)預(yù)定的語音判別規(guī)則對獲取到的語音消息中的音頻數(shù)據(jù)進(jìn)行識別，識別出音頻數(shù)據(jù)中包含的字詞，然后將其轉(zhuǎn)換為文本形式，從而得到了上述文字信息。如果所述語音信息是從一首歌曲中截取的部分片段，也可以首先根據(jù)所述歌曲的名稱等信息來獲取相應(yīng)的歌詞，然后將歌詞中與所述部分片段對應(yīng)的語句作為所述文字信息。在獲取到文字信息后，還可以在所述終端的顯示屏上顯示所述文字信息。
[0052]步驟103、根據(jù)所述文字信息處理所述語音信息。
[0053]在本實施例中，可以根據(jù)文字信息來確定所述語音信息要傳遞的具體內(nèi)容，然后再根據(jù)所述具體內(nèi)容的特點選擇不同的處理方式來處理所述語音信息。例如，當(dāng)用戶正在開會時，不方便隨時收聽接收到的語音信息，此時就可以根據(jù)所述文字信息來獲取所述語音信息的具體內(nèi)容，然后直接用文字進(jìn)行回復(fù)，從而避免了因無法及時收聽語音信息造成的誤解或損失。
[0054]本申請的上述實施例提供的方法通過獲取語音信息，然后將根據(jù)所述語音信息得到的文字信息進(jìn)行顯示，最后根據(jù)所述文字信息處理所述語音信息，實現(xiàn)了通過文字信息獲取語音信息內(nèi)容并進(jìn)一步對語音信息進(jìn)行處理的目的，拓展了終端處理語音信息的能力。
[0055]進(jìn)一步參考圖2，其示出了語音信息處理方法的另一個實施例的流程200。該語音信息處理方法的流程200，包括以下步驟:
[0056]步驟201、獲取語音信息。
[0057]在本實施例中，所述語音信息中承載的語音是指人類通過發(fā)音器官發(fā)出來的、具有一定意義的、目的是用來進(jìn)行社會交際的聲音。在獲取語音信息時，可以由上述終端通過有線連接方式或者無線連接方式來獲取語音信息，也可以直接獲取預(yù)先存儲在所述終端本地的語首?目息。
[0058]在由上述終端通過有線連接方式或者無線連接方式來獲取語音信息時，可以是通過即時通信軟件來接收對方發(fā)送的語音信息，也可以是從網(wǎng)絡(luò)服務(wù)器上下載暫存的語音信息，其中，所述無線連接方式包括但不限于3G連接、WiFi連接、藍(lán)牙連接、WiMAX連接、Zigbee連接、UWB(ultra wideband)連接或者其它未來將開發(fā)的無線連接方式。
[0059]步驟202、將根據(jù)所述語音信息得到的文字信息進(jìn)行顯示。
[0060]在本實施例中，上述終端可以根據(jù)預(yù)定的語音判別規(guī)則對獲取到的語音消息中的音頻數(shù)據(jù)進(jìn)行識別，識別出音頻數(shù)據(jù)中包含的字詞，然后將其轉(zhuǎn)換為文本形式，從而得到了上述文字信息。如果所述語音信息是從一首歌曲中截取的部分片段，也可以首先根據(jù)所述歌曲的名稱等信息來獲取相應(yīng)的歌詞，然后將歌詞中與所述部分片段對應(yīng)的語句作為所述文字信息。在獲取到文字信息后，還可以在所述終端的顯示屏上顯示所述文字信息。
[0061]在本實施例的一個可選實現(xiàn)方式中，所述將根據(jù)所述語音信息得到的文本信息進(jìn)行顯示可以包括:將所述語音信息進(jìn)行語音識別得到文字信息；將所述文字信息進(jìn)行顯示。其中，所述語音識別是一種以語音為研究對象，通過語音信號處理和模式識別讓機(jī)器自動識別和理解人類口述語言的技術(shù)。語音識別一般分為兩個步驟:學(xué)習(xí)階段和識別階段，其中，學(xué)習(xí)階段的任務(wù)是建立識別基本單元的聲學(xué)模型以及語言模型，識別階段是將輸入的目標(biāo)語音的特征參數(shù)和模型進(jìn)行比較，得到識別結(jié)果。本實施例中所述語言識別主要利用識別階段的方法將所述語音信息識別為文字信息，進(jìn)行識別的主要方法包括預(yù)處理、特征提取、模式匹配等步驟，最終的匹配結(jié)果就是語音識別結(jié)果，也就是本實施例中的文字信息，然后在將所述文字信息轉(zhuǎn)換為文本形式，并顯示在所述終端的顯示屏上。
[0062]在本實施例的一個可選實現(xiàn)方式中，所述文字信息與所述語音信息可以按照時間關(guān)系相互對應(yīng)?，F(xiàn)有技術(shù)在進(jìn)行語音識別時，通常只關(guān)心語音所對應(yīng)的文字是什么，而不會記錄語音中每個音節(jié)在語音信息中的具體位置。而本實施例在進(jìn)行語音識別時，不但識別到了語音信息的文字內(nèi)容，而且可以將文字信息與語音信息按照時間關(guān)系相互對應(yīng)。
[0063]具體地說，本實施例的語音信息處理方法在進(jìn)行語音識別時，把語音信號按時間分成離散的多個段，每個段稱為一幀，然后進(jìn)行語音識別。在識別時，首先把幀識別成狀態(tài)，通常多個幀會被識別為一個狀態(tài)，然后再把狀態(tài)組合成音素，最后結(jié)合預(yù)先設(shè)置的語音數(shù)據(jù)庫、上下文語境等因素，將所述音素組合為字，其中，所述字在英語中指單詞，在漢語中指漢字；所述音素代表字的發(fā)音，例如，漢語中可以將全部聲母和韻母作為音素集；所述狀態(tài)是指比音素更細(xì)致的語音單位。這樣通過語音識別得到的文字信息中的每一個字，都可以在所述語音信息中找到對應(yīng)的多個幀，從而實現(xiàn)了文字信息與語音信息在時間關(guān)系上的相互對應(yīng)。
[0064]步驟203、接收對所述文字信息的選擇操作，得到被選中的文字片段。
[0065]在本實施例中，在接收對上述文字信息的選擇操作時，可以首先通過上述終端接收在所述文字信息的顯示位置上的選擇軌跡，其中，所述選擇軌跡可以通過接收鼠標(biāo)的點擊和移動軌跡得到；當(dāng)所述終端的顯示屏幕為觸控屏?xí)r，所述選擇軌跡還可以通過接收人的手指或觸控筆在所述顯示屏幕上的滑動軌跡得到。然后可以根據(jù)所述選擇軌跡的位置與所述文字信息的顯示位置獲取前述兩個位置的重疊部分，此時位于所述重疊部分的文字信息就是被選中的文字片段。
[0066]在本實施例中，在獲取被選中的文字片段時，還可以進(jìn)一步在被選中的文字片段上同時顯示特殊標(biāo)識，以便用戶判斷選中的內(nèi)容是否為想選的內(nèi)容，其中特殊標(biāo)識的表現(xiàn)形式可以是加粗文字、改變文字顏色或改變文字底色等。
[0067]步驟204、獲取所述語音信息中與所述被選中的文字片段對應(yīng)的語音片段。
[0068]在本實施例中，當(dāng)通過步驟203得到被選中的文字片段后，就可以對所述文字片段進(jìn)行分析，由于所述文字信息與語音信息是按照時間關(guān)系相互對應(yīng)的，因此可以根據(jù)所述被選中的文字片段中第一個字和最后一個字，得到在所述語音信息中所述第一個字起始發(fā)音的位置和所述最后一個字結(jié)束發(fā)音的位置，在這兩個位置之間的語音片段，就是與所述被選中的文字片段處于相同時間段的語音片段，也就是與所述被選中的文字片段對應(yīng)的語音片段。
[0069]在本實施例的一個可選實現(xiàn)方式中，當(dāng)被選中的文字片段為多個時，所述獲取所述語音信息中與所述文字片段對應(yīng)的語音片段包括:獲取所述語音信息中與所述文字片段對應(yīng)的多個語音片段；將所述多個語音片段進(jìn)行組合。在本實施例中，如果上述選擇軌跡的位置與上述文字信息的顯示位置相互重疊的部分有多個，就可以認(rèn)為有多個文字片段被選中。此時若要獲取與所述多個文字片段對應(yīng)的語音片段，就需要獲取所述多個文字片段中的每一個文字片段的第一個字和最后一個字在所述語音信息中的位置，然后將這兩個位置之間的語音片段作為被選中的語音片段，由于每個文字片段都對應(yīng)一個語音片段，因此可以得到多個語音片段。在本實施例中，為了方便用戶進(jìn)一步對所述多個語音片段進(jìn)行保存或轉(zhuǎn)發(fā)等操作，還可以進(jìn)一步將所述多個語音片段進(jìn)行組合，得到組合后的語音片段。在對所述多個語音片段進(jìn)行組合時，還可以在語音片段中每句話的句首、句末或句與句之間添加適當(dāng)?shù)目瞻淄ｎD時間，以避免句與句之間突兀的轉(zhuǎn)換，使得所述組合后的語音片段聽起來更加自然流暢。
[0070]圖3給出了本實施例的一個應(yīng)用場景，如圖3A所示，終端301為具有觸摸屏幕的智能手機(jī)，獲取的語音信息可以顯示在所述智能手機(jī)上。當(dāng)需要獲取所述音信信息中的語音片段時，可以首先對所述語音信息進(jìn)行語音識別得到并顯示文字信息302，然后接收用戶對所述文字信息302的選擇操作，同時將用戶選中的文字片段“今天天氣很好，去白云山玩”和“十點鐘在門口等”的底色上添加陰影，以表示這兩個片段被選中。
[0071]圖3B給出了本實施例中進(jìn)行語音識別時，語音信息與文字信息的時間對應(yīng)關(guān)系，如圖3B所示，語音信息可以按時間分成離散的段，每段可以稱為幀303，多個幀會被識別為一個狀態(tài)304，然后再把狀態(tài)組合成音素305，最后結(jié)合預(yù)先設(shè)置的語音數(shù)據(jù)庫、上下文語境等因素，將所述音素組合為字306。下面以被選中的文字片段“今天天氣很好，去白云山玩”中的第一個字為“今”為例，具體說明文字與語音的對應(yīng)關(guān)系。如圖3B所示，組成“今”字的音素有“ j ”，“ i ”和“η”，為了獲取“今”在語音信息中的起始位置，需要進(jìn)一步分析第一個音素“j”，而組成第一個音素“j”的狀態(tài)有S1209，S124和S561這三個，接下來進(jìn)一步分析第一個狀態(tài)S1209，從圖中可以看到S1209由5個幀組成，那么第一個幀所在的位置Tl就是“今”的起始位置，也就是語音片段的起始位置。同理，“玩”的最后一幀所在的位置T2就是語音片段的結(jié)束位置，那么在Tl和T2之間的語音片段就是與文字片段“今天天氣很好，去白云山玩”對應(yīng)的語音片段。
[0072]需要特別說明的是，在確定所述語音片段的起始或結(jié)束位置時，為了避免了句與句之間突兀的轉(zhuǎn)換，還可以將語音片段中第一個字與之前語音的最后一個字中間的幀作為起始幀，或者將語音片段中第一個字與之后語音的第一個字中間的幀作為結(jié)束幀。例如，圖3B中的語音片段以“玩”字結(jié)尾，如果以“玩”的最后一幀作為結(jié)尾，那么語音片段就會產(chǎn)生一種戛然而止的突兀感，此時就可以獲取語音片段的下一句話“你帶小孩去嗎”的第一個字“你”的第一幀，然后將“玩”的最后一幀和“你”的第一幀中間的那一幀作為語音片段的最后一幀，以獲得流暢自然的語音片段。
[0073]在圖3A所示的應(yīng)用場景中，用戶一共選擇了兩個文字片段，因此可以得到兩個語音片段，在“今天天氣很好，去白云山玩”對應(yīng)的語音片段中包含了重要的地點信息“白云山”，而在語音片段“十點鐘在門口等”對應(yīng)的語音片段中包含了重要的時間信息“十點鐘”和地點信息“門口”。當(dāng)用戶需要同時保留這三個重要信息時，就可以將所述兩個語音片段進(jìn)行組合，得到合并后的一個語音片段，其對應(yīng)的內(nèi)容應(yīng)該是“今天天氣很好，去白云山玩，十點鐘在門口等”。為了使合并后的語音片段聽起來更加自然流暢，還可以在“去白云山玩”與“十點鐘在門口等”之間添加適當(dāng)?shù)目瞻淄ｎD時間。
[0074]從圖2中可以看出，與圖1對應(yīng)的實施例不同的是，本實施例中的語音信息處理方法的流程200多出了接收對所述文字信息的選擇操作，得到被選中的文字片段的步驟203，以及獲取所述語音信息中與所述被選中的文字片段對應(yīng)的語音片段的步驟204。通過增加的步驟203和步驟204，本實施例描述的方案可以通過選擇部分文字實現(xiàn)對語音信息的部分截取，有助于從整段語音信息獲取需要的語音片段，從而提高了語音信息的可編輯性。
[0075]進(jìn)一步參考圖4，其示出了語音信息處理方法的再一個實施例的流程400。該語音信息處理方法，包括以下步驟:
[0076]步驟401，獲取語音信息；
[0077]在本實施例中，獲取語音信息時，可以由上述終端通過有線連接方式或者無線連接方式來獲取語音信息，也可以直接獲取預(yù)先存儲在所述終端本地的語音信息。
[0078]步驟402，將根據(jù)所述語音信息得到的文字信息進(jìn)行顯示；。
[0079]在本實施例中，上述終端可以根據(jù)預(yù)定的語音判別規(guī)則對獲取到的語音消息中的音頻數(shù)據(jù)進(jìn)行識別，識別出音頻數(shù)據(jù)中包含的字詞，然后將其轉(zhuǎn)換為文本形式，從而得到了上述文字信息。在獲取到文字信息后，還可以在所述終端的顯示屏上顯示所述文字信息。
[0080]步驟403，將所述語音信息對應(yīng)的音頻波形進(jìn)行顯示。
[0081]在本實施例中，所述語音信息中的語音，其物理基礎(chǔ)主要有音高、音強(qiáng)、音長和音色，這四者是構(gòu)成語音四要素，其中，音高指聲波頻率，即每秒鐘振動次數(shù)的多少；音強(qiáng)指聲波振幅的大??；音長指聲波振動持續(xù)時間的長短，也稱為"時長"；音色指聲音的特色和本質(zhì)，也稱作“音質(zhì)”。根據(jù)所述語音四要素在所述語音信息中的變化情況，可以得到與所述語音信息對應(yīng)的音頻波形，例如音高不同時，波形表現(xiàn)出彈簧式的伸縮；音強(qiáng)不同時，波形表現(xiàn)出山峰式的起伏；音長不同時，波形持續(xù)的時間不同；音色不同時，對應(yīng)不同的波形。
[0082]在本實施例的一個可選實現(xiàn)方式中，所述文字信息中文字的顯示位置與所述音頻波形的顯示位置按照時間關(guān)系相互對應(yīng)。由于步驟402中得到的文字信息與所述語音信息可以是按照時間關(guān)系相互對應(yīng)的，因此所述文字信息與所述音頻波形也是按照時間關(guān)系相互對應(yīng)的。在同時顯示所述文字信息和所述音頻波形的時候，可以根據(jù)二者的時間對應(yīng)關(guān)系，將它們的顯示位置相互對應(yīng)，以便用戶直觀的獲得文字和波形的關(guān)系。
[0083]步驟404，當(dāng)接收對所述文字信息的選擇操作時，將被選中的文字片段和與所述文字片段對應(yīng)的被選中的音頻波形片段同時或先后顯示為被選中狀態(tài)。
[0084]在本實施例中，在接收對上述文字信息的選擇操作時，可以首先通過上述終端接收在所述文字信息的顯示位置上生成的選擇軌跡，其中，所述選擇軌跡可以通過接收鼠標(biāo)的點擊和移動軌跡得到；當(dāng)所述終端的顯示屏幕為觸控屏?xí)r，所述選擇軌跡還可以通過接收人的手指或觸控筆在所述顯示屏幕上的滑動軌跡的得到。然后可以根據(jù)所述選擇軌跡的位置與所述文字信息的顯示位置獲取前述兩個位置的重疊部分，位于所述重疊部分的文字信息就是被選中的文字片段。由于所述文字信息與所述音頻波形是按照時間關(guān)系相互對應(yīng)的，因此在獲得被選中的文字片段的同時，也可以獲得與所述文字片段處于相同時間段的音頻波形片段，并將其作為被選中的音頻波形片段。
[0085]在獲取被選中的文字片段時，還可以進(jìn)一步在被選中的文字片段和與所述文字片段對應(yīng)的被選中的音頻波形片段上顯示特殊標(biāo)識，使得所述被選中的文字片段和被選中的音頻波形片段顯示為被選中狀態(tài)，所述被選中的音頻波形片段可以與所述被選中的文字片段同時顯示為被選中狀態(tài)，也可以在完成對文字片段的選擇操作后顯示為被選中狀態(tài)。
[0086]步驟405，當(dāng)接收對所述音頻波形的選擇操作時，將被選中的音頻波形片段和與所述音頻波形片段對應(yīng)的被選中的文字片段同時或先后顯示為被選中狀態(tài)。
[0087]在本實施例中，在接收對上述音頻波形的選擇操作時，可以首先通過上述終端接收在所述音頻波形的顯示位置上生成的選擇軌跡，其中，所述選擇軌跡可以通過接收鼠標(biāo)的點擊和移動軌跡得到；當(dāng)所述終端的顯示屏幕為觸控屏?xí)r，所述選擇軌跡還可以通過接收人的手指或觸控筆在所述顯示屏幕上的滑動軌跡的得到。然后可以根據(jù)所述選擇軌跡的位置與所述音頻波形的顯示位置獲取前述兩個位置的重疊部分，位于所述重疊部分的音頻波形就是被選中的音頻波形片段。由于所述音頻波形與所述文字信息是按照時間關(guān)系相互對應(yīng)的，因此在獲得被選中的音頻波形片段的同時，也可以獲得與所述音頻波形片段處于相同時間段的文字片段，并將其作為被選中的文字片段。
[0088]在獲取被選中的音頻波形片段時，還可以進(jìn)一步在被選中的音頻波形片段和與所述音頻波形片段對應(yīng)的被選中的文字片段上顯示特殊標(biāo)識，使得所述被選中的音頻波形片段和被選中的文字片段顯示為被選中狀態(tài)，所述被選中的文字片段可以與所述被選中的音頻波形片段同時顯示為被選中狀態(tài)，也可以在完成對音頻波形片段的選擇操作后顯示為被選中狀態(tài)。需要說明的是，在接收對音頻波形的選擇操作時，只有當(dāng)一個字在音頻波形中所對應(yīng)的所有幀都被選中時，這個字才能被顯示為被選中狀態(tài)。
[0089]在本實施例的一個可選實現(xiàn)方式中，上述接收對所述音頻波形的選擇操作包括:獲取時間桿在所述音頻波形上的位置信息；根據(jù)所述位置信息，獲取對所述音頻波形的選擇操作。其中，所述時間桿可以用于確定一個精準(zhǔn)的時間點，本實施例可以在所述音頻波形上設(shè)置至少一對時間桿，并將成對的時間桿之間的音頻波形片段作為上述被選中的音頻波形片段，還可以進(jìn)一步通過調(diào)整時間桿在所述音頻波形上的位置，對所述被選中的音頻波形片段的起始和結(jié)束時間做出精確調(diào)整，還可以根據(jù)選擇需要增加或減少時間桿的數(shù)量。
[0090]需要說明的是，對于步驟404和步驟405來說，對文字進(jìn)行選擇和對音頻波形進(jìn)行選擇是可以相互對應(yīng)的，在實際的選擇過程中，用戶可以只選擇文字，也可以只選擇音頻波形，還可以既選擇文字又選擇音頻波形，最終都可以實現(xiàn)本實施例獲取音頻波形片段的目的，本申請對此不做具體限制。
[0091]步驟406，獲取所述語音信息中與所述被選中的音頻波形片段對應(yīng)的語音片段。
[0092]在本實施例中，上述音頻波形是根據(jù)所述語音信息中語音的音高、音強(qiáng)、音長和音色的變化情況得到的，因此，所述音頻波形片段實際上就是所述語音信息的組成部分，所以可以直接根據(jù)所述被選中的音頻波形片段得到所述語音信息中與所述被選中的音頻波形片段對應(yīng)的語音片段。
[0093]圖5給出了本實施例的一個應(yīng)用場景，如圖5所示為對音頻波形片段進(jìn)行選擇的界面501的示意圖，此時界面501中同時顯示有文字信息502和音頻波形503，并且所述文字信息502中文字的顯示位置與所述音頻波形503的顯示位置按照時間關(guān)系相互對應(yīng)。如圖5A所示，為用戶直接選擇音頻波形時的示意圖，用戶手指劃過的音頻波形會被選中，并且被選中的音頻波形片段及相應(yīng)的文字片段的底色都被顯示為陰影狀態(tài)。如圖5B所示，為利用時間桿504選擇音頻波形時的示意圖，用戶可以左右移動所述時間桿505在音頻波形503上的位置，成對的時間桿504之間的音頻波形會被選中，從而可以有效地去除語音信息中無用的空白段，并且被選中的音頻波形片段及相應(yīng)的文字片段的底色都被顯示為陰影狀態(tài)。此外，用戶還可以通過按鈕505來增加或減少時間桿505的數(shù)量，以滿足不同的選擇需求。
[0094]從圖4中可以看出，與圖1對應(yīng)的實施例不同的是，本實施例中的語音信息處理方法的流程400通過接收對音頻波形的選擇操作，獲得了被選中的音頻波形片段，然后獲取所述語音信息中與所述被選中的音頻波形片段對應(yīng)的語音片段。因此，本實施例描述的方案可以顯示語音信息對應(yīng)的音頻波形，并直接通過選擇音頻波形得到相應(yīng)的語音片段，不但可以有效地去除語音信息中無用的空白段，而且有助于提高截取語音片段的精度。
[0095]在本實施例的一個可選實現(xiàn)方式中，所述語音信息處理方法還可以包括:獲取生成所述語音信息的用戶信息；將所述用戶信息與所述語音片段進(jìn)行關(guān)聯(lián)。具體地，可以根據(jù)所述語音信息的發(fā)送端的標(biāo)識信息獲取生成所述語音信息的用戶信息，然后再將所述用戶信息與所述語音片段進(jìn)行關(guān)聯(lián)，也就是將所述用戶信息與語音片段進(jìn)行對應(yīng)，以確保其他接收到所述語音片段的終端能夠識別出所述語音片段的原始來源。
[0096]在本實施例的一個可選實現(xiàn)方式中，所述方法還包括:將所述語音片段保存為語音文件，其中，所述語音文件的屬性信息包括所述用戶信息。當(dāng)用戶對所述語音信息進(jìn)行截取，得到需要的語音片段之后，還可以直接將所述語音片段保存為語音文件，并將所述用戶信息添加為所述語音文件的屬性信息之一，這樣無論后期對所述語音文件做何種處理，只要能夠獲取到語音文件，就可以從它的屬性信息提取出生成所述語音文件的用戶信息，進(jìn)一步確保了語音片段的可追溯性。
[0097]在本實施例的一個可選實現(xiàn)方式中，所述關(guān)聯(lián)的表現(xiàn)形式包括視覺關(guān)聯(lián)和/或聽覺關(guān)聯(lián)。其中，所述視覺的關(guān)聯(lián)，主要是指在顯示形式上的關(guān)聯(lián)，例如，在對所述語音片段進(jìn)行轉(zhuǎn)發(fā)時，可以在發(fā)送的語音片段上顯示特殊標(biāo)記，所述特殊標(biāo)記包括但不限于“轉(zhuǎn)自XX”這樣的文字描述。所述聽覺的關(guān)聯(lián)，主要是指在所述語音片段中加入能夠標(biāo)識出用戶信息的語音，所述語音包括但不限于在語音片段的結(jié)尾加入“來自XX”這樣的音頻信息。這樣使得語音片段的接收方可以方便地辨別出該語音片段的來源，提高了語音片段的可識別性。
[0098]在本實施例的一個可選實現(xiàn)方式中，所述方法還包括:將所述語音片段進(jìn)行試聽、保存、轉(zhuǎn)發(fā)、共享操作或設(shè)置為鈴聲。用戶得到上述語音片段后，可以進(jìn)行試聽，以確認(rèn)該語音片段的內(nèi)容是否滿足要求；還可以直接將其進(jìn)行保存，以便反復(fù)使用；還可以將其轉(zhuǎn)發(fā)給相關(guān)聯(lián)系人或在各類網(wǎng)絡(luò)平臺中進(jìn)行共享；也可以直接將其設(shè)置為鈴聲，從而擴(kuò)展了語音信息的適用范圍。
[0099]進(jìn)一步參考圖6，其示出了語音信息處理裝置的一個實施例的結(jié)構(gòu)示意圖。
[0100]如圖6所示，本實施例所述的語音信息處理裝置600包括:語音信息獲取模塊610，文字信息顯示模塊620和語音信息處理模塊630。
[0101]語音信息獲取模塊610,用于獲取語音信息。
[0102]文字信息顯示模塊620，用于將根據(jù)所述語音信息獲取模塊610獲取的語音信息得到的文字信息進(jìn)行顯示。
[0103]語音信息處理模塊630，用于根據(jù)所述文字信息顯示模塊620顯示的文字信息處理所述語音信息。
[0104]在本實施例中可以通過語音信息獲取模塊610獲取語音信息，然后語音信息處理模塊630將根據(jù)所述語音信息獲取模塊610獲取的語音信息得到的文字信息進(jìn)行顯示，最后語音信息處理模塊630根據(jù)所述文字信息顯示模塊620顯示的文字信息處理所述語音信息，實現(xiàn)了通過文字信息獲取語音信息內(nèi)容并進(jìn)一步對語音信息進(jìn)行處理的目的，拓展了終端處理語音信息的能力。
[0105]在一些可選實施方式，如圖7所示，所述語音信息處理模塊630包括:文字信息選擇單元631和語音片段獲取單元632。
[0106]文字信息選擇單元631，用于接收對所述文字信息顯示模塊620顯示的文字信息的選擇操作，得到被選中的文字片段。
[0107]語音片段獲取單元632，用于獲取所述語音信息中與所述文字信息選擇單元631得到的被選中的文字片段對應(yīng)的語音片段。
[0108]在一些可選實施方式中，當(dāng)被選中的文字片段為多個時，所述語音片段獲取單元632包括:語音片段獲取子單元和語音片段組合子單元(圖中未示出)。
[0109]語音片段獲取子單元，用于獲取所述語音信息中與所述文字片段對應(yīng)的多個語音片段。
[0110]語音片段組合子單元，用于將所述語音片段獲取子單元獲取的多個語音片段進(jìn)行組合。
[0111]在一些可選實施方式中，所述文字信息顯示模塊620包括:語音信息識別單元621和文字?目息顯不單兀622。
[0112]語音信息識別單元621，用于將所述語音信息進(jìn)行語音識別得到文字信息。
[0113]文字信息顯示單元622，用于將所述語音信息識別單元621得到的文字信息進(jìn)行顯不O
[0114]在一些可選實施方式中，所述文字信息與所述語音信息按照時間關(guān)系相互對應(yīng)。
[0115]本實施例描述的方案可以通過選擇部分文字實現(xiàn)對語音信息的部分截取，有助于從整段語音信息獲取需要的語音片段，從而提高了語音信息的可編輯性。
[0116]在一些可選實施方式中，如圖8所示，所述裝置600還包括:
[0117]音頻波形顯示模塊640，用于將所述語音信息獲取模塊610獲取的語音信息對應(yīng)的音頻波形進(jìn)行顯示。
[0118]在一些可選實施方式中，所述文字信息中文字的顯示位置與所述音頻波形的顯示位置按照時間關(guān)系相互對應(yīng)。
[0119]在一些可選實施方式中，所述裝置600還包括:
[0120]第一顯示模塊650，用于當(dāng)接收對所述文字信息的選擇操作時，將被選中的文字片段和與所述文字片段對應(yīng)的被選中的音頻波形片段同時或先后顯示為被選中狀態(tài)。
[0121]第二顯示模塊660，用于當(dāng)接收對所述音頻波形的選擇操作時，將被選中的音頻波形片段和與所述音頻波形片段對應(yīng)的被選中的文字片段同時或先后顯示為被選中狀態(tài)。
[0122]在一些可選實施方式中，所述接收對所述音頻波形的選擇操作包括:
[0123]獲取時間桿在所述音頻波形上的位置信息；
[0124]根據(jù)所述位置信息，獲取對所述音頻波形的選擇操作。
[0125]在一些可選實施方式中，所述語音片段獲取單元632包括:
[0126]波形片段獲取子單元(圖中未示出)，用于獲取所述語音信息中與所述被選中的音頻波形片段對應(yīng)的語音片段。
[0127]在一些可選實施方式中，所述裝置還600包括:
[0128]用戶信息獲取模塊(圖中未示出)，用于獲取生成所述語音信息的用戶信息。
[0129]用戶信息關(guān)聯(lián)模塊(圖中未示出)，用于將所述用戶信息獲取模塊670獲取的用戶信息與所述語音片段進(jìn)行關(guān)聯(lián)。
[0130]在一些可選實施方式中，所述裝置600還包括:
[0131]語音片段保存模塊(圖中未示出)，用于將所述語音片段保存為語音文件，其中，所述語音文件的屬性信息包括所述用戶信息。
[0132]在一些可選實施方式中，所述關(guān)聯(lián)的表現(xiàn)形式包括視覺關(guān)聯(lián)和/或聽覺關(guān)聯(lián)。
[0133]在一些可選實施方式中，所述裝置600還包括:
[0134]語音片段處理模塊(圖中未示出)，用于將所述語音片段進(jìn)行試聽、保存、轉(zhuǎn)發(fā)、共享操作或設(shè)置為鈴聲。
[0135]本實施例描述的方案可以顯示語音信息對應(yīng)的音頻波形，并直接通過選擇音頻波形得到相應(yīng)的語音片段，不但可以有效地去除語音信息中無用的空白段，而且有助于提高截取語音片段的精度。
[0136]描述于本申請實施例中所涉及到的模塊可以通過軟件的方式實現(xiàn)，也可以通過硬件的方式來實現(xiàn)。所描述的模塊也可以設(shè)置在處理器中，例如，可以描述為:一種處理器包括語音信息獲取模塊，文字信息顯示模塊和語音信息處理模塊。其中，這些模塊的名稱在某種情況下并不構(gòu)成對該模塊本身的限定，例如，語音信息獲取模塊還可以被描述為“用于獲取語音信息的模塊”。
[0137]作為另一方面，本申請還提供了一種計算機(jī)可讀存儲介質(zhì)，該計算機(jī)可讀存儲介質(zhì)可以是上述實施例中所述裝置中所包含的計算機(jī)可讀存儲介質(zhì)；也可以是單獨存在，未裝配入終端中的計算機(jī)可讀存儲介質(zhì)。所述計算機(jī)可讀存儲介質(zhì)存儲有一個或者一個以上程序，所述程序被一個或者一個以上的處理器用來執(zhí)行描述于本申請的語音信息處理方法。
[0138]以上描述僅為本申請的較佳實施例以及對所運用技術(shù)原理的說明。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解，本申請中所涉及的發(fā)明范圍，并不限于上述技術(shù)特征的特定組合而成的技術(shù)方案，同時也應(yīng)涵蓋在不脫離所述發(fā)明構(gòu)思的情況下，由上述技術(shù)特征或其等同特征進(jìn)行任意組合而形成的其它技術(shù)方案。例如上述特征與本申請中公開的(但不限于)具有類似功能的技術(shù)特征進(jìn)行互相替換而形成的技術(shù)方案。
【權(quán)利要求】
1.一種語音信息處理方法，其特征在于，所述方法包括: 獲取語首?目息；將根據(jù)所述語音信息得到的文字信息進(jìn)行顯示；根據(jù)所述文字信息處理所述語音信息。
2.根據(jù)權(quán)利要求1所述的語音信息處理方法，其特征在于，所述根據(jù)所述文字信息處理所述語音信息包括: 接收對所述文字信息的選擇操作，得到被選中的文字片段；獲取所述語音信息中與所述被選中的文字片段對應(yīng)的語音片段。
3.根據(jù)權(quán)利要求2所述的語音信息處理方法，其特征在于，當(dāng)被選中的文字片段為多個時，所述獲取所述語音信息中與所述文字片段對應(yīng)的語音片段包括: 獲取所述語音信息中與所述文字片段對應(yīng)的多個語音片段；將所述多個語音片段進(jìn)行組合。
4.根據(jù)權(quán)利要求1所述的語音信息處理方法，其特征在于，所述將根據(jù)所述語音信息得到的文本信息進(jìn)行顯示包括: 將所述語音信息進(jìn)行語音識別得到文字信息；將所述文字信息進(jìn)行顯示。
5.根據(jù)權(quán)利要求4所述的語音信息處理方法，其特征在于，所述文字信息與所述語音信息按照時間關(guān)系相互對應(yīng)。
6.根據(jù)權(quán)利要求5所述的語音信息處理方法，其特征在于，所述方法還包括: 將所述語音信息對應(yīng)的音頻波形進(jìn)行顯示。
7.根據(jù)權(quán)利要求6所述的語音信息處理方法，其特征在于，所述文字信息中文字的顯示位置與所述音頻波形的顯示位置按照時間關(guān)系相互對應(yīng)。
8.根據(jù)權(quán)利要求6或7所述的語音信息處理方法，其特征在于，所述方法還包括: 當(dāng)接收對所述文字信息的選擇操作時，將被選中的文字片段和與所述文字片段對應(yīng)的被選中的音頻波形片段同時或先后顯示為被選中狀態(tài)；和/或當(dāng)接收對所述音頻波形的選擇操作時，將被選中的音頻波形片段和與所述音頻波形片段對應(yīng)的被選中的文字片段同時或先后顯示為被選中狀態(tài)。
9.根據(jù)權(quán)利要求8所述的語音信息處理方法，其特征在于，所述接收對所述音頻波形的選擇操作包括: 獲取時間桿在所述音頻波形上的位置信息；根據(jù)所述位置信息，獲取對所述音頻波形的選擇操作。
10.根據(jù)權(quán)利要求8所述的語音信息處理方法，其特征在于，所述獲取所述語音信息中與所述被選擇中的文字片段對應(yīng)的語音片段，包括: 獲取所述語音信息中與所述被選中的音頻波形片段對應(yīng)的語音片段。
11.根據(jù)權(quán)利要求1所述的語音信息處理方法，其特征在于，所述方法還包括: 獲取生成所述語音信息的用戶信息；將所述用戶信息與所述語音片段進(jìn)行關(guān)聯(lián)。
12.根據(jù)權(quán)利要求11所述的語音信息處理方法，其特征在于，所述方法還包括: 將所述語音片段保存為語音文件，其中，所述語音文件的屬性信息包括所述用戶信息。
13.根據(jù)權(quán)利要求11或12所述的語音信息處理方法，其特征在于，所述關(guān)聯(lián)的表現(xiàn)形式包括視覺關(guān)聯(lián)和/或聽覺關(guān)聯(lián)。
14.根據(jù)權(quán)利要求1所述的語音信息處理方法，其特征在于，所述方法還包括: 將所述語音片段進(jìn)行試聽、保存、轉(zhuǎn)發(fā)、共享操作或設(shè)置為鈴聲。
15.一種語音信息處理裝置，其特征在于，所述裝置包括: 語音信息獲取模塊，用于獲取語音信息；文字信息顯示模塊，用于將根據(jù)所述語音信息得到的文字信息進(jìn)行顯示；語音信息處理模塊，用于根據(jù)所述文字信息處理所述語音信息。
16.根據(jù)權(quán)利要求15所述的語音信息處理裝置，其特征在于，所述語音信息處理模塊包括: 文字信息選擇單元，用于接收對所述文字信息的選擇操作，得到被選中的文字片段；語音片段獲取單元，用于獲取所述語音信息中與所述被選中的文字片段對應(yīng)的語音片段。
17.根據(jù)權(quán)利要求16所述的語音信息處理裝置，其特征在于，當(dāng)被選中的文字片段為多個時，所述語音片段獲取單元包括: 語音片段獲取子單元，用于獲取所述語音信息中與所述文字片段對應(yīng)的多個語音片段；語音片段組合子單元，用于將所述多個語音片段進(jìn)行組合。
18.根據(jù)權(quán)利要求15所述的語音信息處理裝置，其特征在于，所述文字信息顯示模塊包括: 語音信息識別單元，用于將所述語音信息進(jìn)行語音識別得到文字信息；文字信息顯示單元，用于將所述文字信息進(jìn)行顯示。
19.根據(jù)權(quán)利要求18所述的語音信息處理裝置，其特征在于，所述文字信息與所述語音信息按照時間關(guān)系相互對應(yīng)。
20.根據(jù)權(quán)利要求19所述的語音信息處理裝置，其特征在于，所述裝置還包括: 音頻波形顯示模塊，用于將所述語音信息對應(yīng)的音頻波形進(jìn)行顯示。
21.根據(jù)權(quán)利要求20所述的語音信息處理裝置，其特征在于，所述文字信息中文字的顯示位置與所述音頻波形的顯示位置按照時間關(guān)系相互對應(yīng)。
22.根據(jù)權(quán)利要求20或21所述的語音信息處理裝置，其特征在于，所述裝置還包括: 第一顯示模塊，用于當(dāng)接收對所述文字信息的選擇操作時，將被選中的文字片段和與所述文字片段對應(yīng)的被選中的音頻波形片段同時或先后顯示為被選中狀態(tài)；第二顯示模塊，用于當(dāng)接收對所述音頻波形的選擇操作時，將被選中的音頻波形片段和與所述音頻波形片段對應(yīng)的被選中的文字片段同時或先后顯示為被選中狀態(tài)。
23.根據(jù)權(quán)利要求22所述的語音信息處理裝置，其特征在于，所述接收對所述音頻波形的選擇操作包括: 獲取時間桿在所述音頻波形上的位置信息；根據(jù)所述位置信息，獲取對所述音頻波形的選擇操作。
24.根據(jù)權(quán)利要求22所述的語音信息處理裝置，其特征在于，所述語音片段獲取單元包括: 波形片段獲取子單元，用于獲取所述語音信息中與所述被選中的音頻波形片段對應(yīng)的語音片段。
25.根據(jù)權(quán)利要求15所述的語音信息處理裝置，其特征在于，所述裝置還包括: 用戶信息獲取模塊，用于獲取生成所述語音信息的用戶信息；用戶信息關(guān)聯(lián)模塊，用于將所述用戶信息與所述語音片段進(jìn)行關(guān)聯(lián)。
26.根據(jù)權(quán)利要求25所述的語音信息處理裝置，其特征在于，所述裝置還包括: 語音片段保存模塊，用于將所述語音片段保存為語音文件，其中，所述語音文件的屬性信息包括所述用戶信息。
27.根據(jù)權(quán)利要求25或26所述的語音信息處理裝置，其特征在于，所述關(guān)聯(lián)的表現(xiàn)形式包括視覺關(guān)聯(lián)和/或聽覺關(guān)聯(lián)。
28.根據(jù)權(quán)利要求15所述的語音信息處理裝置，其特征在于，所述裝置還包括: 語音片段處理模塊，用于將所述語音片段進(jìn)行試聽、保存、轉(zhuǎn)發(fā)、共享操作或設(shè)置為鈴聲。
【文檔編號】G10L13/06GK104240703SQ201410415839
【公開日】2014年12月24日申請日期:2014年8月21日優(yōu)先權(quán)日:2014年8月21日
【發(fā)明者】顏啟超申請人:廣州三星通信技術(shù)研究有限公司, 三星電子株式會社

完整全部詳細(xì)技術(shù)資料下載