通過語音訪問多媒體互動網(wǎng)站的方法和裝置制造方法
【專利摘要】本申請?zhí)峁┝送ㄟ^語音訪問多媒體互動網(wǎng)站的方法和裝置。其中,該方法包括:為所述多媒體互動網(wǎng)站上的至少一個鏈接編譯可選的人機交互方式,所述可選的人機交互方式至少包括:語音方式和非語音方式;監(jiān)聽用戶在所述多媒體互動網(wǎng)站上選擇的待訪問鏈接,并識別用戶針對所述待訪問鏈接選擇的人機交互方式;當識別出用戶選擇語音方式時,跳轉(zhuǎn)至用于引導(dǎo)用戶提供語音的頁面,引導(dǎo)用戶在所述頁面提供語音,并獲取用戶在所述頁面提供的語音數(shù)據(jù);判斷所述語音數(shù)據(jù)是否滿足設(shè)定的用于觸發(fā)所述待訪問鏈接的要求,如果是,提供所述待訪問鏈接對應(yīng)的信息。采用本發(fā)明,能夠通過語音實現(xiàn)用戶與多媒體網(wǎng)站互動。
【專利說明】通過語音訪問多媒體互動網(wǎng)站的方法和裝置
【技術(shù)領(lǐng)域】
[0001] 本申請涉及網(wǎng)絡(luò)技術(shù),特別涉及通過語音訪問多媒體互動網(wǎng)站的方法和裝置。
【背景技術(shù)】
[0002] 目前,隨著網(wǎng)站技術(shù)的不斷發(fā)展,已產(chǎn)生了很多多媒體網(wǎng)站。其中,在多媒體網(wǎng)站 中,有一種人機強交互性質(zhì)的網(wǎng)站,簡稱多媒體互動網(wǎng)站。
[0003] 其中,用戶與多媒體互動網(wǎng)站交互的方式很多,包括但不限于以下幾種:
[0004] 1,點擊觸發(fā)方式,比如,用戶通過鼠標點擊多媒體互動網(wǎng)站中的鏈接進入鏈接對 應(yīng)的網(wǎng)頁等;
[0005] 2,滾輪觸發(fā)方式,比如,用戶通過鼠標中的滾輪觸發(fā)多媒體互動網(wǎng)站中的鏈接進 入鏈接對應(yīng)的網(wǎng)頁等;
[0006] 3,鍵盤觸發(fā)方式,比如用戶通過鍵盤觸發(fā)多媒體互動網(wǎng)站中的鏈接進入鏈接對應(yīng) 的網(wǎng)頁等;
[0007] 4、觸控方式,比如,用戶通過觸控選擇多媒體互動網(wǎng)站中的鏈接進入鏈接對應(yīng)的 網(wǎng)頁等。
[0008] 在上述用戶與多媒體互動網(wǎng)站交互的方式中,不管采用哪種方式,都無法實現(xiàn)通 過語音實現(xiàn)用戶訪問多媒體互動網(wǎng)站。
[0009] 因此,一種通過語音實現(xiàn)用戶訪問多媒體互動網(wǎng)站的方法是當前亟待解決的技術(shù) 問題。
【發(fā)明內(nèi)容】
[0010] 本申請?zhí)峁┝吮旧暾執(zhí)峁┝送ㄟ^語音訪問多媒體互動網(wǎng)站的方法和裝置,以通過 語音實現(xiàn)用戶訪問多媒體互動網(wǎng)站。
[0011] 本申請?zhí)峁┑募夹g(shù)方案包括:
[0012] 一種通過語音訪問多媒體互動網(wǎng)站的方法,所述多媒體互動網(wǎng)站具有人機交互功 能,該方法包括:
[0013] 為所述多媒體互動網(wǎng)站上的至少一個鏈接編譯可選的人機交互方式,所述可選的 人機交互方式至少包括:語音方式和非語音方式;
[0014] 監(jiān)聽用戶在所述多媒體互動網(wǎng)站上選擇的待訪問鏈接,并識別用戶針對所述待訪 問鏈接選擇的人機交互方式;
[0015] 當識別出用戶選擇語音方式時,跳轉(zhuǎn)至用于引導(dǎo)用戶提供語音的頁面,引導(dǎo)用戶 在所述頁面提供語音,并獲取用戶在所述頁面提供的語音數(shù)據(jù);
[0016] 判斷所述語音數(shù)據(jù)是否滿足設(shè)定的用于觸發(fā)所述待訪問鏈接的要求,如果是,提 供所述待訪問鏈接對應(yīng)的信息。
[0017] 一種通過語音訪問多媒體互動網(wǎng)站的裝置,所述多媒體互動網(wǎng)站具有人機交互功 能,該裝置應(yīng)用于多媒體網(wǎng)站的客戶端,包括:
[0018] 顯示單元,用于顯示多媒體互動網(wǎng)站,所述多媒體互動網(wǎng)站上的至少一個鏈接編 譯了可選的人機交互方式,所述可選的人機交互方式至少包括:語音方式和非語音方式;
[0019] 監(jiān)聽單元,用于監(jiān)聽用戶在所述多媒體互動網(wǎng)站選擇的待訪問鏈接;
[0020] 識別單元,用于識別用戶針對所述待訪問鏈接選擇的人機交互方式;
[0021] 引導(dǎo)單元,用于所述識別單元識別出用戶選擇語音方式時,跳轉(zhuǎn)至用于引導(dǎo)用戶 提供語音的頁面,引導(dǎo)用戶在所述頁面提供語音,并獲取用戶在所述頁面提供的語音數(shù) 據(jù);
[0022] 判斷單元,用于判斷所述語音數(shù)據(jù)是否滿足設(shè)定的用于觸發(fā)所述待訪問鏈接的要 求,如果是,提供所述待訪問鏈接對應(yīng)的信息。
[0023] 由以上技術(shù)方案可以看出,本發(fā)明中,通過在多媒體互動網(wǎng)站上的鏈接編譯可選 的人機交互方式,監(jiān)聽用戶在所述多媒體互動網(wǎng)站選擇的待訪問鏈接,識別用戶針對所述 待訪問鏈接選擇的人機交互方式;當識別出用戶選擇語音方式時,跳轉(zhuǎn)至用于引導(dǎo)用戶提 供語音的頁面;引導(dǎo)用戶在所述頁面提供語音,并獲取用戶在所述頁面提供的語音數(shù)據(jù); 判斷所述語音數(shù)據(jù)是否滿足設(shè)定的用于觸發(fā)所述待訪問鏈接的要求,如果是,提供所述待 訪問鏈接對應(yīng)的信息,這能夠通過語音方式代替?zhèn)鹘y(tǒng)的鼠標、鍵盤等方式實現(xiàn)用戶與多媒 體互動網(wǎng)站之間的互動,這能夠提高用戶訪問多媒體互動網(wǎng)站的效率。
【專利附圖】
【附圖說明】
[0024] 圖1為本發(fā)明實施例提供的方法流程圖;
[0025] 圖2為本發(fā)明實施例提供的多媒體網(wǎng)站上的鏈接示意圖;
[0026] 圖3為本發(fā)明實施例提供的包含語音方式的頁面示意圖;
[0027] 圖4為本發(fā)明實施例提供的步驟104實現(xiàn)流程圖;
[0028] 圖5為本發(fā)明實施例提供的語音音譜示意圖;
[0029] 圖6為本發(fā)明實施例提供的另一語音音譜示意圖;
[0030] 圖7為本發(fā)明實施例提供的裝置結(jié)構(gòu)圖。
【具體實施方式】
[0031] 為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面結(jié)合附圖和具體實施例對 本發(fā)明進行詳細描述。
[0032] 為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面結(jié)合附圖和具體實施例對 本發(fā)明進行詳細描述。
[0033] 本申請?zhí)峁┝送ㄟ^語音訪問多媒體互動網(wǎng)站的方法。這里,多媒體互動網(wǎng)站具有 人機交互功能。
[0034] 參見圖1,圖1為本發(fā)明提供的方法流程圖。如圖1所示,該流程可應(yīng)用于客戶端, 包括以下步驟:
[0035] 步驟101,為所述多媒體互動網(wǎng)站上的至少一個鏈接編譯可選的人機交互方式。
[0036] 這里,多媒體互動網(wǎng)站,其一般是人機強交互性質(zhì)的網(wǎng)站。本發(fā)明中,在現(xiàn)有多媒 體互動網(wǎng)站上做了少許改進,即:針對多媒體互動網(wǎng)站上部分或全部的鏈接編譯可選的人 機交互方式。
[0037] 其中,作為本發(fā)明的一個實施例,所述可選的人機交互方式至少包括:語音方式和 非語音方式。
[0038] 作為本發(fā)明的一個實施例,所述語音方式通過用于表示有麥克風的提示按鈕實 現(xiàn);而所述非語音方式通過用于表示無麥克風的提示按鈕實現(xiàn)。圖2示出了多媒體互動網(wǎng) 站上一個鏈接比如"我要當男主角"上編譯的可選的人機交互方式。
[0039] 步驟102,監(jiān)聽用戶在所述多媒體互動網(wǎng)站上選擇的待訪問鏈接,并識別用戶針對 所述待訪問鏈接選擇的人機交互方式。
[0040] 當用戶進入多媒體互動網(wǎng)站時,用戶會根據(jù)自己的興趣在多媒體互動網(wǎng)站上選擇 待訪問的鏈接。
[0041] 當用戶在所述多媒體互動網(wǎng)站選擇完待訪問鏈接后,基于步驟101描述的,假如 針對該待訪問鏈接編譯了可選的人機交互方式,則用戶會從可選的人機交互方式中選擇其 待使用的交互方式,比如選擇語音方式,或者選擇非語音方式。
[0042] 步驟103,當識別出用戶選擇語音方式時,跳轉(zhuǎn)至用于引導(dǎo)用戶提供語音的頁面, 引導(dǎo)用戶在所述頁面提供語音,并獲取用戶在所述頁面提供的語音數(shù)據(jù)。
[0043] 作為本發(fā)明的一個實施例,本步驟103中,所述跳轉(zhuǎn)至用于引導(dǎo)用戶提供語音的 頁面包括:
[0044] 通過動畫形式展示一個與所述待訪問鏈接關(guān)聯(lián)且用于引導(dǎo)用戶提供語音的新的 頁面;其中,所述頁面中包含用于引導(dǎo)用戶提供語音的引導(dǎo)信息。如圖3所示,圖3示出了 通過動畫形式展示的一個與待訪問鏈接關(guān)聯(lián)且用于引導(dǎo)用戶提供語音的新的頁面。在該新 頁面中,"請對著麥克風說:"為引導(dǎo)信息,引導(dǎo)用戶對著麥克風提供語音數(shù)據(jù)。并且,在圖 3中,還包括一個進程框,用于表示用戶的狀態(tài),當用戶對著麥克風提供語音數(shù)據(jù)時,該進程 框內(nèi)的進程動態(tài)變化,反之,當用戶停止對著麥克風提供語音數(shù)據(jù)時,該進程框內(nèi)的進程不 變。
[0045] 基于跳轉(zhuǎn)的頁面包含引導(dǎo)信息的前提,則本步驟103中,引導(dǎo)用戶在所述頁面提 供語音具體可為:
[0046] 通過所述頁面中的引導(dǎo)信息引導(dǎo)用戶在所述頁面提供語音。
[0047] 需要說明的是,本步驟103是以識別出用戶選擇語音方式為前提執(zhí)行的,而如果 本發(fā)明中,當識別出用戶選擇非語音方式時,則可執(zhí)行以下步驟:
[0048] 提示用戶基于設(shè)定的非語音方式觸發(fā)所述鏈接。
[0049] 其中,該非語音方式與現(xiàn)有人機交互方式類似,包括但不限于以下任一種方式或 任意組合:
[0050] 鼠標;
[0051] 鍵盤;
[0052] 觸控。
[0053] 步驟104,判斷所述語音數(shù)據(jù)是否滿足設(shè)定的用于觸發(fā)所述待訪問鏈接的要求,如 果是,提供所述待訪問鏈接對應(yīng)的信息。
[0054] 優(yōu)選地,作為本發(fā)明的一個優(yōu)選實施例,本步驟104中,當判斷出所述語音數(shù)據(jù)不 滿足設(shè)定的用于觸發(fā)所述待訪問鏈接的要求,則可引導(dǎo)用戶在所述頁面提供語音,并獲取 用戶在所述頁面提供的語音數(shù)據(jù),即返回執(zhí)行步驟103。
[0055] 至此,完成圖1所示流程。
[0056] 從圖1所示流程可以看出,本發(fā)明中,通過語音方式代替?zhèn)鹘y(tǒng)的鼠標、鍵盤等方式 實現(xiàn)用戶與多媒體網(wǎng)站之間的互動,這能夠提高用戶訪問多媒體網(wǎng)站的效率。
[0057] 優(yōu)選地,作為本發(fā)明的一個實施例,在上面描述中,多媒體互動網(wǎng)站上的鏈接編譯 的可選人機交互方式可通過Flash工具編譯。
[0058] 基于多媒體互動網(wǎng)站上的鏈接編譯的可選人機交互方式通過Flash工具編譯,則 在上述步驟103中,獲取用戶在所述頁面提供的語音數(shù)據(jù)可為:
[0059] 通過Flash中腳本語言ActionScript的聲音應(yīng)用接口(SoundMixer API)獲取用 戶在所述頁面提供的語音數(shù)據(jù)。
[0060] 另外,本發(fā)明中,作為本發(fā)明的一個實施例,上述步驟104中的判斷可通過圖4所 示流程實現(xiàn):
[0061] 參見圖4,圖4為本發(fā)明實施例提供的步驟104實現(xiàn)流程圖。如圖4所示,該流程 可包括以下步驟:
[0062] 步驟401,從獲取的語音數(shù)據(jù)中提取出語音音譜。
[0063] 本發(fā)明中,該獲取的語音數(shù)據(jù)是一個二進制數(shù)據(jù)。而從該二進制數(shù)據(jù)組成的語音 數(shù)據(jù)中提取出語音音譜可通過隱馬爾可夫模型(HMM)狀態(tài)關(guān)聯(lián)的數(shù)據(jù)進行操作的快速傅 立葉變換(fft)實現(xiàn)。
[0064] 其中,該提取出的語音音譜由左通道、右通道組成。圖5示出了 fftmode為true 時的一種語音音譜,圖6示出了 fftmode為false時的另一種語音音譜。
[0065] 從圖5或圖6示出的語音音譜可以看出,該語音音譜具體可由左通道、右通道組 成。
[0066] 步驟402,依據(jù)所述語音音譜中左通道或者右通道中語音的高低起伏識別出所述 語音音譜關(guān)聯(lián)的文字數(shù)量。
[0067] 本發(fā)明中,其中,從語音音譜中的兩個不同通道識別出的文字數(shù)量結(jié)果相同,因 此,可選擇從語音音譜中的單一通道比如左通道或者右通道即可識別出語音音譜關(guān)聯(lián)的文 字數(shù)量。
[0068] 具體地,在語音音譜中,不同起伏的兩個語音就是兩個不同的漢字,基于此,依據(jù) 該不同起伏的兩個語音就是兩個不同漢字的原則從語音音譜中左通道或者右通道中語音 的高低起伏識別出所述語音音譜關(guān)聯(lián)的文字數(shù)量。
[0069] 步驟403,判斷在步驟402識別出的文字數(shù)量是否為所述待訪問鏈接要求的文字 數(shù)量,如果是,確定所述語音數(shù)據(jù)滿足設(shè)定的用于觸發(fā)所述待訪問鏈接的要求,如果否,確 定所述語音數(shù)據(jù)不滿足設(shè)定的用于觸發(fā)所述待訪問鏈接的要求。
[0070] 假如所述待訪問鏈接要求的文字數(shù)量為3個漢字,則本步驟403就判斷在步驟402 識別出的文字數(shù)量是否為3個漢字,如果是,則確定所述語音數(shù)據(jù)滿足設(shè)定的用于觸發(fā)所 述待訪問鏈接的要求,如果否,確定所述語音數(shù)據(jù)不滿足設(shè)定的用于觸發(fā)所述待訪問鏈接 的要求。
[0071] 至此,完成圖4所示的流程。
[0072] 可以看出,通過圖4所示的流程,能夠完成步驟104中判斷語音數(shù)據(jù)是否滿足設(shè)定 的用于觸發(fā)所述待訪問鏈接的要求,但是,需要說明的是,圖4所示流程只是判斷語音數(shù)據(jù) 是否滿足設(shè)定的用于觸發(fā)所述待訪問鏈接的要求的一種舉例,并非用于限定本發(fā)明。
[0073] 本領(lǐng)域技術(shù)人員還可以采用其他方式判斷語音數(shù)據(jù)是否滿足設(shè)定的用于觸發(fā)所 述待訪問鏈接的要求,下面僅舉2個例子說明:
[0074] 例1,基于現(xiàn)有語音識別系統(tǒng)識別獲取的語音數(shù)據(jù)中是否存在設(shè)定的語音數(shù)據(jù), 假如設(shè)定的語音數(shù)據(jù)為"我愿意",則就基于現(xiàn)有語音識別系統(tǒng)識別獲取的語音數(shù)據(jù)中是否 "我愿意",如果是,則確定所述語音數(shù)據(jù)滿足設(shè)定的用于觸發(fā)所述待訪問鏈接的要求,如果 否,確定所述語音數(shù)據(jù)不滿足設(shè)定的用于觸發(fā)所述待訪問鏈接的要求。
[0075] 例2,該例2主要是例1和圖4所示流程的結(jié)合,即先基于現(xiàn)有語音識別系統(tǒng)識別 獲取的語音數(shù)據(jù)中是否存在設(shè)定的語音數(shù)據(jù),只有從獲取的語音數(shù)據(jù)中識別出設(shè)定的語音 數(shù)據(jù)時,才執(zhí)行圖4所示流程,否則,確定所述語音數(shù)據(jù)不滿足設(shè)定的用于觸發(fā)所述待訪問 鏈接的要求。通過例2,能夠更加精準依據(jù)用戶需求觸發(fā)所述待訪問鏈接。
[0076] 至此,完成本發(fā)明提供的方法描述。
[0077] 下面對本發(fā)明提供的裝置進行描述:
[0078] 參見圖7,圖7為本發(fā)明實施例提供的裝置結(jié)構(gòu)圖。該裝置應(yīng)用于多媒體互動網(wǎng)站 的客戶端,所述多媒體互動網(wǎng)站具有人機交互功能,如圖7所示,該裝置可包括:
[0079] 顯示單元,用于顯示多媒體互動網(wǎng)站,所述多媒體互動網(wǎng)站上的至少一個鏈接編 譯了可選的人機交互方式,所述可選的人機交互方式至少包括:語音方式和非語音方式;
[0080] 監(jiān)聽單元,用于監(jiān)聽用戶在所述多媒體互動網(wǎng)站選擇的待訪問鏈接;
[0081] 識別單元,用于識別用戶針對所述待訪問鏈接選擇的人機交互方式;
[0082] 引導(dǎo)單元,用于所述識別單元識別出用戶選擇語音方式時,跳轉(zhuǎn)至用于引導(dǎo)用戶 提供語音的頁面,引導(dǎo)用戶在所述頁面提供語音,并獲取用戶在所述頁面提供的語音數(shù) 據(jù);
[0083] 判斷單元,用于判斷所述語音數(shù)據(jù)是否滿足設(shè)定的用于觸發(fā)所述待訪問鏈接的要 求,如果是,提供所述待訪問鏈接對應(yīng)的信息。
[0084] 優(yōu)選地,作為本發(fā)明的一個實施例,所述跳轉(zhuǎn)至用于引導(dǎo)用戶提供語音的頁面包 括:
[0085] 通過動畫形式展示一個與所述待訪問鏈接關(guān)聯(lián)且用于引導(dǎo)用戶提供語音的新的 頁面;其中,所述頁面中包含用于引導(dǎo)用戶提供語音的引導(dǎo)信息;
[0086] 基于此,所述引導(dǎo)用戶在所述頁面提供語音包括:
[0087] 通過所述新頁面中的引導(dǎo)信息引導(dǎo)用戶在所述頁面提供語音。
[0088] 優(yōu)選地,本發(fā)明中,所述所述判斷語音數(shù)據(jù)是否滿足設(shè)定的用于觸發(fā)所述待訪問 鏈接的要求包括:
[0089] 從所述語音數(shù)據(jù)中提取出語音音譜,所述語音音譜由左通道、右通道組成;
[0090] 依據(jù)所述語音音譜中左通道或者右通道中語音的高低起伏識別出所述語音音譜 關(guān)聯(lián)的文字數(shù)量;
[0091] 判斷所述文字數(shù)量是否為所述待訪問鏈接要求的文字數(shù)量,
[0092] 如果是,確定所述語音數(shù)據(jù)滿足設(shè)定的用于觸發(fā)所述待訪問鏈接的要求;
[0093] 如果否,確定所述語音數(shù)據(jù)不滿足設(shè)定的用于觸發(fā)所述待訪問鏈接的要求。
[0094] 優(yōu)選地,本發(fā)明中,所述語音方式通過用于表示有麥克風的提示按鈕實現(xiàn);
[0095] 所述非語音方式通過用于表示無麥克風的提示按鈕實現(xiàn)。
[0096] 優(yōu)選地,本發(fā)明中,所述多媒體互動網(wǎng)站上的鏈接是通過Flash編譯的;
[0097] 所述語音數(shù)據(jù)是通過Flash中腳本語言ActionScript的聲音應(yīng)用接口 SoundMixer API 獲取的。
[0098] 至此,完成圖7所示的裝置描述。
[0099] 由以上技術(shù)方案可以看出,本發(fā)明中,通過在多媒體互動網(wǎng)站上的鏈接編譯可選 的人機交互方式,監(jiān)聽用戶在所述多媒體互動網(wǎng)站選擇的待訪問鏈接;識別用戶針對所述 待訪問鏈接選擇的人機交互方式;當識別出用戶選擇語音方式時,跳轉(zhuǎn)至用于引導(dǎo)用戶提 供語音的頁面;引導(dǎo)用戶在所述頁面提供語音,并獲取用戶在所述頁面提供的語音數(shù)據(jù); 判斷所述語音數(shù)據(jù)是否滿足設(shè)定的用于觸發(fā)所述待訪問鏈接的要求,如果是,提供所述待 訪問鏈接對應(yīng)的信息,這能夠通過語音方式代替?zhèn)鹘y(tǒng)的鼠標、鍵盤等方式實現(xiàn)用戶與多媒 體互動網(wǎng)站之間的互動,這能夠提高用戶訪問多媒體互動網(wǎng)站的效率。
[0100] 以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精 神和原則之內(nèi),所做的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明保護的范圍之內(nèi)。
【權(quán)利要求】
1. 一種通過語音訪問多媒體互動網(wǎng)站的方法,所述多媒體互動網(wǎng)站具有人機交互功 能,其特征在于,該方法包括 : 為所述多媒體互動網(wǎng)站上的至少一個鏈接編譯可選的人機交互方式,所述可選的人機 交互方式至少包括:語音方式和非語音方式; 監(jiān)聽用戶在所述多媒體互動網(wǎng)站上選擇的待訪問鏈接,并識別用戶針對所述待訪問鏈 接選擇的人機交互方式; 當識別出用戶選擇語音方式時,跳轉(zhuǎn)至用于引導(dǎo)用戶提供語音的頁面,引導(dǎo)用戶在所 述頁面提供語音,并獲取用戶在所述頁面提供的語音數(shù)據(jù); 判斷所述語音數(shù)據(jù)是否滿足設(shè)定的用于觸發(fā)所述待訪問鏈接的要求,如果是,提供所 述待訪問鏈接對應(yīng)的信息。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述跳轉(zhuǎn)至用于引導(dǎo)用戶提供語音的頁 面包括: 通過動畫形式展示一個與所述待訪問鏈接關(guān)聯(lián)且用于引導(dǎo)用戶提供語音的新的頁面; 其中,所述頁面中包含用于引導(dǎo)用戶提供語音的引導(dǎo)信息; 所述引導(dǎo)用戶在所述頁面提供語音包括: 通過所述頁面中的引導(dǎo)信息引導(dǎo)用戶在所述頁面提供語音。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于, 所述判斷語音數(shù)據(jù)是否滿足設(shè)定的用于觸發(fā)所述待訪問鏈接的要求包括: 從所述語音數(shù)據(jù)中提取出語音音譜,所述語音音譜由左通道、右通道組成; 依據(jù)所述語音音譜中左通道或者右通道中語音的高低起伏識別出所述語音音譜關(guān)聯(lián) 的文字數(shù)量; 判斷所述文字數(shù)量是否為所述待訪問鏈接要求的文字數(shù)量, 如果是,確定所述語音數(shù)據(jù)滿足設(shè)定的用于觸發(fā)所述待訪問鏈接的要求; 如果否,確定所述語音數(shù)據(jù)不滿足設(shè)定的用于觸發(fā)所述待訪問鏈接的要求。
4. 根據(jù)權(quán)利要求1至3任一所述的方法,其特征在于, 所述語音方式通過用于表示有麥克風的提示按鈕實現(xiàn); 所述非語音方式通過用于表示無麥克風的提示按鈕實現(xiàn)。
5. 根據(jù)權(quán)利要求1至3任一所述的方法,其特征在于,所述多媒體互動網(wǎng)站上的鏈接是 通過Flash編譯的; 所述語音數(shù)據(jù)是通過Flash中腳本語言ActionScript的聲音應(yīng)用接口 SoundMixer API獲取的。
6. -種通過語音訪問多媒體互動網(wǎng)站的裝置,所述多媒體互動網(wǎng)站具有人機交互功 能,其特征在于,該裝置應(yīng)用于多媒體網(wǎng)站的客戶端,包括: 顯示單元,用于顯示多媒體互動網(wǎng)站,所述多媒體互動網(wǎng)站上的至少一個鏈接編譯了 可選的人機交互方式,所述可選的人機交互方式至少包括:語音方式和非語音方式; 監(jiān)聽單元,用于監(jiān)聽用戶在所述多媒體互動網(wǎng)站選擇的待訪問鏈接; 識別單元,用于識別用戶針對所述待訪問鏈接選擇的人機交互方式; 引導(dǎo)單元,用于所述識別單元識別出用戶選擇語音方式時,跳轉(zhuǎn)至用于引導(dǎo)用戶提供 語音的頁面,引導(dǎo)用戶在所述頁面提供語音,并獲取用戶在所述頁面提供的語音數(shù)據(jù); 判斷單元,用于判斷所述語音數(shù)據(jù)是否滿足設(shè)定的用于觸發(fā)所述待訪問鏈接的要求, 如果是,提供所述待訪問鏈接對應(yīng)的信息。
7. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述跳轉(zhuǎn)至用于引導(dǎo)用戶提供語音的頁 面包括: 通過動畫形式展示一個與所述待訪問鏈接關(guān)聯(lián)且用于引導(dǎo)用戶提供語音的新的頁面; 其中,所述頁面中包含用于引導(dǎo)用戶提供語音的引導(dǎo)信息; 所述引導(dǎo)用戶在所述頁面提供語音包括: 通過所述新頁面中的引導(dǎo)信息引導(dǎo)用戶在所述頁面提供語音。
8. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述所述判斷語音數(shù)據(jù)是否滿足設(shè)定的 用于觸發(fā)所述待訪問鏈接的要求包括: 從所述語音數(shù)據(jù)中提取出語音音譜,所述語音音譜由左通道、右通道組成; 依據(jù)所述語音音譜中左通道或者右通道中語音的高低起伏識別出所述語音音譜關(guān)聯(lián) 的文字數(shù)量; 判斷所述文字數(shù)量是否為所述待訪問鏈接要求的文字數(shù)量, 如果是,確定所述語音數(shù)據(jù)滿足設(shè)定的用于觸發(fā)所述待訪問鏈接的要求; 如果否,確定所述語音數(shù)據(jù)不滿足設(shè)定的用于觸發(fā)所述待訪問鏈接的要求。
9. 根據(jù)權(quán)利要求6至8任一所述的裝置,其特征在于, 所述語音方式通過用于表示有麥克風的提示按鈕實現(xiàn); 所述非語音方式通過用于表示無麥克風的提示按鈕實現(xiàn)。
10. 根據(jù)權(quán)利要求6至8任一所述的裝置,其特征在于,所述多媒體互動網(wǎng)站上的鏈接 是通過Flash編譯的; 所述語音數(shù)據(jù)是通過Flash中腳本語言ActionScript的聲音應(yīng)用接口 SoundMixer API獲取的。
【文檔編號】G06F3/16GK104123085SQ201410015324
【公開日】2014年10月29日 申請日期:2014年1月14日 優(yōu)先權(quán)日:2014年1月14日
【發(fā)明者】林雨 申請人:騰訊科技(深圳)有限公司