附圖說明】】
[0051]為了更清楚地說明本發(fā)明實施例的技術(shù)方案,下面將對實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其它的附圖。
[0052]圖1是本發(fā)明實施例所提供的技術(shù)方案使用的系統(tǒng)示例圖;
[0053]圖2是本發(fā)明實施例所提供的語音導(dǎo)航方法的流程示意圖;
[0054]圖3是本發(fā)明實施例所提供的語音導(dǎo)航裝置的功能方塊圖。
【【具體實施方式】】
[0055]為了更好的理解本發(fā)明的技術(shù)方案,下面結(jié)合附圖對本發(fā)明實施例進行詳細描述。
[0056]應(yīng)當(dāng)明確,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其它實施例,都屬于本發(fā)明保護的范圍。
[0057]在本發(fā)明實施例中使用的術(shù)語是僅僅出于描述特定實施例的目的,而非旨在限制本發(fā)明。在本發(fā)明實施例和所附權(quán)利要求書中所使用的單數(shù)形式的“一種”、“所述”和“該”也旨在包括多數(shù)形式,除非上下文清楚地表示其他含義。
[0058]應(yīng)當(dāng)理解,本文中使用的術(shù)語“和/或”僅僅是一種描述關(guān)聯(lián)對象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,A和/或B,可以表示:單獨存在A,同時存在A和B,單獨存在B這三種情況。另外,本文中字符“/”,一般表示前后關(guān)聯(lián)對象是一種“或”的關(guān)系。
[0059]應(yīng)當(dāng)理解,盡管在本發(fā)明實施例中可能采用術(shù)語第一、第二等來描述語音識別結(jié)果,但這些關(guān)鍵詞不應(yīng)限于這些術(shù)語。這些術(shù)語僅用來將關(guān)鍵詞彼此區(qū)分開。例如,在不脫離本發(fā)明實施例范圍的情況下,第一語音識別結(jié)果也可以被稱為第二語音識別結(jié)果,類似地,第二語音識別結(jié)果也可以被稱為第一語音識別結(jié)果。
[0060]取決于語境,如在此所使用的詞語“如果”可以被解釋成為“在……時”或“當(dāng)……時”或“響應(yīng)于確定”或“響應(yīng)于檢測”。類似地,取決于語境,短語“如果確定”或“如果檢測(陳述的條件或事件)”可以被解釋成為“當(dāng)確定時”或“響應(yīng)于確定”或“當(dāng)檢測(陳述的條件或事件)時”或“響應(yīng)于檢測(陳述的條件或事件)”。
[0061]本發(fā)明實施例所提供的技術(shù)方案使用的系統(tǒng)如圖1所示,主要由客戶端和服務(wù)器組成,本發(fā)明實施例所提供的方法和裝置在客戶端側(cè)實現(xiàn),主要用于依據(jù)用戶的語音指令,向用戶提供語音導(dǎo)航服務(wù),實現(xiàn)客戶端的語音導(dǎo)航功能。
[0062]本發(fā)明實施例給出一種語音導(dǎo)航方法,請參考圖2,其為本發(fā)明實施例所提供的語音導(dǎo)航方法的流程示意圖,如圖所示,該方法包括以下步驟:
[0063]S201,采集用戶的第一語音指令。
[0064]S202,依據(jù)當(dāng)前導(dǎo)航狀態(tài),確定語音識別模型。
[0065]S203,利用所述語音識別模型,對所述用戶的第一語音指令進行語音識別,以獲得第一語音識別結(jié)果。
[0066]S204,依據(jù)所述第一語音識別結(jié)果,執(zhí)行導(dǎo)航操作。
[0067]基于上述語音導(dǎo)航方法,本發(fā)明實施例對S201的方法進行具體描述。該步驟具體可以包括:
[0068]首先,客戶端監(jiān)聽用戶的第二語音指令。然后,客戶端利用語音喚醒模型對所述第二語音指令進行語音識別,以獲得第二語音識別結(jié)果。最后,客戶端判斷該第二語音識別結(jié)果是否滿足預(yù)設(shè)的喚醒條件,若所述第二語音識別結(jié)果滿足預(yù)設(shè)的喚醒條件,客戶端采集用戶的第一語音指令。
[0069]需要說明的是,語音導(dǎo)航過程中,為了避免對用戶的語音指令的誤識別,需要實現(xiàn)實時語音喚醒功能,客戶端在語音喚醒狀態(tài)下,如果監(jiān)聽到的用戶的語音指令滿足喚醒條件,進入語音識別狀態(tài),從而才開始接收用戶的語音指令。
[0070]例如,客戶端可以開啟一個監(jiān)聽線程,用于持續(xù)監(jiān)聽用戶的第二語音指令。客戶端利用語音喚醒模型,對監(jiān)聽到得第二語音指令進行語音識別,以獲得第二語音識別結(jié)果。該語音喚醒模型用于識別出第二語音指令中所包含的喚醒詞。如果客戶端判斷出第二語音識別結(jié)果中包含預(yù)設(shè)的喚醒詞,則說明第二語音識別結(jié)果滿足預(yù)設(shè)的喚醒條件,客戶端可以由語音喚醒狀態(tài)轉(zhuǎn)換為語音識別狀態(tài),從而客戶端可以采集用戶的第一語音指令。
[0071]優(yōu)選的,客戶端可以利用音頻采集裝置來采集上述第一語音指令。
[0072]例如,客戶端位于手機或者平板電腦上時,客戶端可以利用麥克風(fēng)采集第一語音指令。
[0073]基于上述語音導(dǎo)航方法,本發(fā)明實施例對S202的方法進行具體描述。該步驟具體可以包括:
[0074]客戶端判斷自身當(dāng)前導(dǎo)航狀態(tài),若所述當(dāng)前導(dǎo)航狀態(tài)為開始導(dǎo)航前,確定所述語音識別模型為第一模型;其中,所述第一模型用于識別出所述第一語音指令中所包含的興趣點搜索指令。若所述當(dāng)前導(dǎo)航狀態(tài)為正在導(dǎo)航中,確定所述語音識別模型為第二模型;其中,所述第二模型用于識別出所述第一語言指令中所包含的以下指令中至少一個:客戶端控制指令、導(dǎo)航提示指令和興趣點搜索指令。
[0075]需要說明的是,本發(fā)明實施例中,在開始導(dǎo)航前和正在導(dǎo)航中兩種導(dǎo)航狀態(tài)下,所使用的語音識別模型是不同的。由于開始導(dǎo)航前,需要依據(jù)用戶通過第一語音指令來指定的興趣點信息,進行興趣點搜索,因此,需要利用第一模型來識別出第一語音指令中所包含的興趣點搜索指令。由于正在導(dǎo)航中,需要依據(jù)用戶通過第一語音指令來指定的相關(guān)指令,進行客戶端控制、導(dǎo)航提示或者興趣點搜索,因此,需要利用第二模型來識別出第一語音指令中所包含的相關(guān)指令。
[0076]基于上述語音導(dǎo)航方法,本發(fā)明實施例對S203的方法進行具體描述。該步驟具體可以包括:
[0077]若客戶端的當(dāng)前導(dǎo)航狀態(tài)為開始導(dǎo)航前,利用第一模型對采集的用戶的第一語音指令進行語音識別,或者,若客戶端的當(dāng)前導(dǎo)航狀態(tài)為正在導(dǎo)航中,利用第二模型對采集的用戶的第一語音指令進行語音識別。
[0078]舉例說明,客戶端利用第一模型或者第二模型對第一語音指令進行語音識別的方法可以包括但不限于:
[0079]首先,客戶端對第一語音指令進行預(yù)處理,可以包括濾波處理、采樣和量化處理、加窗處理、端點檢測處理和預(yù)加重處理等。然后,客戶端對經(jīng)過預(yù)處理的第一語音指令提取特征信息。最后,如果利用第一模型進行語音識別,則客戶端將提取的特征信息與第一模型中的特征信息進行匹配,將匹配分數(shù)最高的特征信息所對應(yīng)的字符信息作為第一語音識別結(jié)果。如果利用第二模型進行語音識別,則客戶端將提取的特征信息與第二模型中的特征信息進行匹配,將匹配分數(shù)最高的特征信息作為第一語音識別結(jié)果。
[0080]需要說明的是,利用第一模型對第一語音指令進行語音識別時,能夠使得第一語音指令的特征信息與第一模型中的興趣點搜索指令的特征信息的匹配分數(shù)較高,這樣就可以將興趣點搜索指令的特征信息作為第一語音識別結(jié)果。同理,利用第二模型對第一語音指令進行語音識別時,能夠使得第一語音指令的特征信息與第二模型中的相關(guān)指令的特征信息的匹配分數(shù)較高,這樣,就可以將這些相關(guān)指令的特征信息作為第一語音識別結(jié)果。本發(fā)明實施例中,針對當(dāng)前導(dǎo)航狀態(tài)的不同,使用不同的語音識別模型,可以有針對性從用戶的語音指令中識別出用戶的導(dǎo)航需求,從而可以提高語音導(dǎo)航的準確性和可靠性。
[0081]基于上述語音導(dǎo)航方法,本發(fā)明實施例對S204的方法進行具體描述。該步驟具體可以包括:
[0082]當(dāng)上面利用第一模型識別出的第一語音識別結(jié)果中所包含的興趣點搜索指令時,若第一語音識別結(jié)果中所包含的興趣點搜索指令為興趣點名稱,客戶端獲得并輸出與該興趣點名稱相匹配的搜索結(jié)果?;蛘撸舻谝徽Z音識別結(jié)果中所包含的興趣點搜索指令為興趣點類型名稱,客戶端獲得并輸出與該興趣點類型名稱相匹配的搜索結(jié)果。
[0083]舉例說明,客戶端獲得與興趣點名稱或者興趣點類型名稱相匹配的搜索結(jié)果的方法可以包括但不限于以下兩種:
[0084]第一種:客戶端可以依據(jù)興趣點