本發(fā)明涉及一種對來電意圖進行識別的技術(shù)。
背景技術(shù):
目前通過撥打電話進行商品或者服務的推銷者在撥打電話尋找潛在的購買者時基本上是隨機撥打,并不了解被推銷者對自己推銷的商品或者服務是否有需求。同時被推銷者在接電話之前對這類營銷電話的大概內(nèi)容也并不清楚,即便現(xiàn)在來電顯示已經(jīng)可以進行相關(guān)提示,例如可以提示用戶當前來電為騷擾電話,或者可以對陌生號碼進行簡單標識,諸如“推銷”、“中介”、“快遞”等,但是,用戶通常仍需在接聽電話并進行一兩句溝通以后才能對推銷者的目的有一定的了解從而知道自己是否有需求。
顯然,現(xiàn)有的來電提示方式仍不能真正滿足用戶的使用需求。大部分用戶即使看到了提示,也不能清楚判斷其是否具有相應的需求,往往仍需接聽來電并簡單溝通后才能決定是否繼續(xù)此次通話。此外,有些用戶看到來電提示之后直接掛斷該來電,也可能錯失其真正需求的信息。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的是提供一種對來電意圖進行識別的方法、裝置以及計算機設備、計算機可讀存儲介質(zhì)與計算機程序產(chǎn)品。
根據(jù)本發(fā)明的一個方面,提供了一種對來電意圖進行識別的方法,其中,該方法包括以下步驟:
-針對一個已被識別為騷擾電話的來電號碼,對其多次通話內(nèi)容分別進行語音識別;
-將每次語音識別的內(nèi)容匹配行業(yè)關(guān)鍵詞庫,以獲得相匹配的一個或多個行業(yè),其中,所述行業(yè)關(guān)鍵詞庫包括多個行業(yè)及其分別對應的一個或多個行業(yè)關(guān)鍵詞;
-根據(jù)所述每次語音識別的內(nèi)容,確定其中每個行業(yè)分別所對應的一個或多個意圖標簽;
-綜合所述多次通話內(nèi)容所對應的各行業(yè)的權(quán)重以及其中每個行業(yè)的各意圖標簽的權(quán)重,以確定所述來電號碼所對應的行業(yè)及其意圖標簽。
根據(jù)本發(fā)明的一個方面,還提供了一種對來電意圖進行識別的裝置,其中,該裝置包括:
用于針對一個已被識別為騷擾電話的來電號碼,對其多次通話內(nèi)容分別進行語音識別的裝置;
用于將每次語音識別的內(nèi)容匹配行業(yè)關(guān)鍵詞庫,以獲得相匹配的一個或多個行業(yè)的裝置,其中,所述行業(yè)關(guān)鍵詞庫包括多個行業(yè)及其分別對應的一個或多個行業(yè)關(guān)鍵詞;
用于根據(jù)所述每次語音識別的內(nèi)容,確定其中每個行業(yè)分別所對應的一個或多個意圖標簽的裝置;
用于綜合所述多次通話內(nèi)容所對應的各行業(yè)的權(quán)重以及其中每個行業(yè)的各意圖標簽的權(quán)重,以確定所述來電號碼所對應的行業(yè)及其意圖標簽的裝置。
根據(jù)本發(fā)明的一個方面,還提供了一種計算機設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其中,所述處理器執(zhí)行所述計算機程序時實現(xiàn)根據(jù)本發(fā)明的一個方面的一種對來電意圖進行識別的方法。
根據(jù)本發(fā)明的一個方面,還提供了一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其中,所述計算機程序被處理器執(zhí)行時實現(xiàn)根據(jù)本發(fā)明的一個方面的一種對來電意圖進行識別的方法。
根據(jù)本發(fā)明的一個方面,還提供了一種計算機程序產(chǎn)品,當所述計算機程序產(chǎn)品被計算機設備執(zhí)行時實現(xiàn)根據(jù)本發(fā)明的一個方面的一種對來電意圖進行識別的方法。
與現(xiàn)有技術(shù)相比,本發(fā)明提供了一種更為準確和細化的來電意圖識別方案,從而可以為用戶提供更細粒度的來電意圖提示。具體地,本發(fā)明通過語音識別從已被打了“推銷”“中介”標簽的電話語音中提取相關(guān)的意圖特征,識別推銷者具體是在推銷什么商品或者服務,進而在來電顯示時提供給用戶的標簽可以根據(jù)識別結(jié)果改進為“推銷保險”“推銷房產(chǎn)”“推銷親子產(chǎn)品”等較為具體的意圖標簽,讓用戶選擇感興趣的進行接聽。
此外,本發(fā)明還可以根據(jù)用戶的接聽行為推測出用戶對什么商品感興趣,從而可以進行更精確地信息(如廣告)推送,以提升用戶體驗并提高轉(zhuǎn)化率。
附圖說明
通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本發(fā)明的其它特征、目的和優(yōu)點將會變得更明顯:
圖1示出適于用來實現(xiàn)本發(fā)明實施方式的示例性計算機系統(tǒng)/服務器12的框圖;
圖2示出根據(jù)本發(fā)明一個實施例的一種對來電意圖進行識別的方法流程圖;
圖3示出根據(jù)本發(fā)明一個示例的意圖標簽在來電提示時的效果示意圖;
圖4示出根據(jù)本發(fā)明一個實施例的一種對來電意圖進行識別的裝置的示意圖。
附圖中相同或相似的附圖標記代表相同或相似的部件。
具體實施方式
在更加詳細地討論示例性實施例之前應當提到的是,一些示例性實施例被描述成作為流程圖描繪的處理或方法。雖然流程圖將各項操作描述成順序的處理,但是其中的許多操作可以被并行地、并發(fā)地或者同時實施。此外,各項操作的順序可以被重新安排。當其操作完成時所述處理可以被終止,但是還可以具有未包括在附圖中的附加步驟。所述處理可以對應于方法、函數(shù)、規(guī)程、子例程、子程序等等。
在上下文中所稱“計算機設備”,也稱為“電腦”,是指可以通過運行預定程序或指令來執(zhí)行數(shù)值計算和/或邏輯計算等預定處理過程的智能電子設備,其可以包括處理器與存儲器,由處理器執(zhí)行在存儲器中預存的程序指令來執(zhí)行預定處理過程,或是由asic、fpga、dsp等硬件執(zhí)行預定處理過程,或是由上述二者組合來實現(xiàn)。計算機設備包括但不限于服務器、個人計算機(pc)、筆記本電腦、平板電腦、智能手機等。
所述計算機設備例如包括用戶設備與網(wǎng)絡設備。其中,所述用戶設備包括但不限于個人計算機(pc)、筆記本電腦、移動終端等,所述移動終端包括但不限于智能手機、pda等;所述網(wǎng)絡設備包括但不限于單個網(wǎng)絡服務器、多個網(wǎng)絡服務器組成的服務器組或基于云計算(cloudcomputing)的由大量計算機或網(wǎng)絡服務器構(gòu)成的云,其中,云計算是分布式計算的一種,由一群松散耦合的計算機集組成的一個超級虛擬計算機。其中,所述計算機設備可單獨運行來實現(xiàn)本發(fā)明,也可接入網(wǎng)絡并通過與網(wǎng)絡中的其他計算機設備的交互操作來實現(xiàn)本發(fā)明。其中,所述計算機設備所處的網(wǎng)絡包括但不限于互聯(lián)網(wǎng)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、vpn網(wǎng)絡等。
需要說明的是,所述用戶設備、網(wǎng)絡設備和網(wǎng)絡等僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的計算機設備或網(wǎng)絡如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。
本文后面所討論的方法(其中一些通過流程圖示出)可以通過硬件、軟件、固件、中間件、微代碼、硬件描述語言或者其任意組合來實施。當用軟件、固件、中間件或微代碼來實施時,用以實施必要任務的程序代碼或代碼段可以被存儲在機器或計算機可讀介質(zhì)(比如存儲介質(zhì))中。(一個或多個)處理器可以實施必要的任務。
這里所公開的具體結(jié)構(gòu)和功能細節(jié)僅僅是代表性的,并且是用于描述本發(fā)明的示例性實施例的目的。但是本發(fā)明可以通過許多替換形式來具體實現(xiàn),并且不應當被解釋成僅僅受限于這里所闡述的實施例。
應當理解的是,雖然在這里可能使用了術(shù)語“第一”、“第二”等等來描述各個單元,但是這些單元不應當受這些術(shù)語限制。使用這些術(shù)語僅僅是為了將一個單元與另一個單元進行區(qū)分。舉例來說,在不背離示例性實施例的范圍的情況下,第一單元可以被稱為第二單元,并且類似地第二單元可以被稱為第一單元。這里所使用的術(shù)語“和/或”包括其中一個或更多所列出的相關(guān)聯(lián)項目的任意和所有組合。
這里所使用的術(shù)語僅僅是為了描述具體實施例而不意圖限制示例性實施例。除非上下文明確地另有所指,否則這里所使用的單數(shù)形式“一個”、“一項”還意圖包括復數(shù)。還應當理解的是,這里所使用的術(shù)語“包括”和/或“包含”規(guī)定所陳述的特征、整數(shù)、步驟、操作、單元和/或組件的存在,而不排除存在或添加一個或更多其他特征、整數(shù)、步驟、操作、單元、組件和/或其組合。
還應當提到的是,在一些替換實現(xiàn)方式中,所提到的功能/動作可以按照不同于附圖中標示的順序發(fā)生。舉例來說,取決于所涉及的功能/動作,相繼示出的兩幅圖實際上可以基本上同時執(zhí)行或者有時可以按照相反的順序來執(zhí)行。
下面結(jié)合附圖對本發(fā)明作進一步詳細描述。
圖1示出了適于用來實現(xiàn)本發(fā)明實施方式的示例性計算機系統(tǒng)/服務器12的框圖。圖1顯示的計算機系統(tǒng)/服務器12僅僅是一個示例,不應對本發(fā)明實施例的功能和使用范圍帶來任何限制。
如圖1所示,計算機系統(tǒng)/服務器12以通用計算設備的形式表現(xiàn)。計算機系統(tǒng)/服務器12的組件可以包括但不限于:一個或者多個處理器或者處理單元16,系統(tǒng)存儲器28,連接不同系統(tǒng)組件(包括系統(tǒng)存儲器28和處理單元16)的總線18。
總線18表示幾類總線結(jié)構(gòu)中的一種或多種,包括存儲器總線或者存儲器控制器,外圍總線,圖形加速端口,處理器或者使用多種總線結(jié)構(gòu)中的任意總線結(jié)構(gòu)的局域總線。舉例來說,這些體系結(jié)構(gòu)包括但不限于工業(yè)標準體系結(jié)構(gòu)(isa)總線,微通道體系結(jié)構(gòu)(mac)總線,增強型isa總線、視頻電子標準協(xié)會(vesa)局域總線以及外圍組件互連(pci)總線。
計算機系統(tǒng)/服務器12典型地包括多種計算機系統(tǒng)可讀介質(zhì)。這些介質(zhì)可以是任何能夠被計算機系統(tǒng)/服務器12訪問的可用介質(zhì),包括易失性和非易失性介質(zhì),可移動的和不可移動的介質(zhì)。
存儲器28可以包括易失性存儲器形式的計算機系統(tǒng)可讀介質(zhì),例如隨機存取存儲器(ram)30和/或高速緩存存儲器32。計算機系統(tǒng)/服務器12可以進一步包括其它可移動/不可移動的、易失性/非易失性計算機系統(tǒng)存儲介質(zhì)。僅作為舉例,存儲系統(tǒng)34可以用于讀寫不可移動的、非易失性磁介質(zhì)(圖1未示出,通常稱為“硬盤驅(qū)動器”)。盡管圖1中未示出,可以提供用于對可移動非易失性磁盤(例如“軟盤”)讀寫的磁盤驅(qū)動器,以及對可移動非易失性光盤(例如cd-rom,dvd-rom或者其它光介質(zhì))讀寫的光盤驅(qū)動器。在這些情況下,每個驅(qū)動器可以通過一個或者多個數(shù)據(jù)介質(zhì)接口與總線18相連。存儲器28可以包括至少一個程序產(chǎn)品,該程序產(chǎn)品具有一組(例如至少一個)程序模塊,這些程序模塊被配置以執(zhí)行本發(fā)明各實施例的功能。
具有一組(至少一個)程序模塊42的程序/實用工具40,可以存儲在例如存儲器28中,這樣的程序模塊42包括——但不限于——操作系統(tǒng)、一個或者多個應用程序、其它程序模塊以及程序數(shù)據(jù),這些示例中的每一個或某種組合中可能包括網(wǎng)絡環(huán)境的實現(xiàn)。程序模塊42通常執(zhí)行本發(fā)明所描述的實施例中的功能和/或方法。
計算機系統(tǒng)/服務器12也可以與一個或多個外部設備14(例如鍵盤、指向設備、顯示器24等)通信,還可與一個或者多個使得用戶能與該計算機系統(tǒng)/服務器12交互的設備通信,和/或與使得該計算機系統(tǒng)/服務器12能與一個或多個其它計算設備進行通信的任何設備(例如網(wǎng)卡,調(diào)制解調(diào)器等等)通信。這種通信可以通過輸入/輸出(i/o)接口22進行。并且,計算機系統(tǒng)/服務器12還可以通過網(wǎng)絡適配器20與一個或者多個網(wǎng)絡(例如局域網(wǎng)(lan),廣域網(wǎng)(wan)和/或公共網(wǎng)絡,例如因特網(wǎng))通信。如圖所示,網(wǎng)絡適配器20通過總線18與計算機系統(tǒng)/服務器12的其它模塊通信。應當明白,盡管圖1中未示出,可以結(jié)合計算機系統(tǒng)/服務器12使用其它硬件和/或軟件模塊,包括但不限于:微代碼、設備驅(qū)動器、冗余處理單元、外部磁盤驅(qū)動陣列、raid系統(tǒng)、磁帶驅(qū)動器以及數(shù)據(jù)備份存儲系統(tǒng)等。
處理單元16通過運行存儲在存儲器28中的程序,從而執(zhí)行各種功能應用以及數(shù)據(jù)處理。
例如,存儲器28中存儲有用于執(zhí)行本發(fā)明的各項功能和處理的計算機程序,處理單元16執(zhí)行相應計算機程序時,本發(fā)明在網(wǎng)絡端實現(xiàn)對來電意圖的識別。
以下將詳細描述本發(fā)明在服務器實現(xiàn)對來電意圖的識別的具體功能/步驟。
圖2示出根據(jù)本發(fā)明的一個實施例,其中具體示出一種對來電意圖進行識別的方法流程圖。
該識別方法由網(wǎng)絡端來執(zhí)行。然而,本領(lǐng)域技術(shù)人員應能理解,盡管對來電意圖的識別是由網(wǎng)絡端來執(zhí)行的,但是由于整個通話過程是在用戶端進行的,故本發(fā)明的識別方法還需要用戶端的輔助。在此,用戶端典型地如手機,網(wǎng)絡端典型地如服務器。如無特別說明,本說明書中網(wǎng)絡端與服務器等同使用。
如圖2所示,在步驟s1中,針對一個經(jīng)初步識別的來電號碼,服務器對其多次通話內(nèi)容分別進行語音識別;在步驟s2中,服務器將每次語音識別的內(nèi)容匹配行業(yè)關(guān)鍵詞庫,以獲得相匹配的一個或多個行業(yè),其中,所述行業(yè)關(guān)鍵詞庫包括多個行業(yè)及其分別對應的一個或多個行業(yè)關(guān)鍵詞;在步驟s3中,服務器根據(jù)所述每次語音識別的內(nèi)容,確定其中每個行業(yè)分別所對應的一個或多個意圖標簽;在步驟s4中,服務器綜合所述多次通話內(nèi)容所對應的各行業(yè)的權(quán)重以及其中每個行業(yè)的各意圖標簽的權(quán)重,以確定所述來電號碼所對應的行業(yè)及其意圖標簽。
具體地,在步驟s1中,針對一個經(jīng)初步識別的來電號碼,服務器對其多次通話內(nèi)容分別進行語音識別。
在此,經(jīng)初步識別的來電號碼包括但不限于已被識別為騷擾電話的來電號碼、已識別有初步標識的來電號碼等。前者例如僅提示用戶為騷擾電話的來電號碼,后者例如已被標識為如“中介”、“推銷”等的來電號碼。本發(fā)明意在對這些通常意義上的騷擾電話進一步提供細化意圖標簽,以使得接聽該來電號碼的用戶能夠根據(jù)其具體需求決定是否接聽該來電,而非僅基于“中介”、“推銷”等標識盲目拒絕該來電,或者浪費時間接聽后發(fā)現(xiàn)并不符合自身的需求。
此外,還需說明的是,本發(fā)明所指“騷擾電話”并不包括“詐騙電話”等具有非法意圖的電話,這些具有非法意圖的電話應當被如運營商過濾,并不在本發(fā)明的討論范圍之內(nèi)。
當用戶接聽經(jīng)初步識別的來電號碼之后,用戶設備將記錄用戶的此次通話,并將通話內(nèi)容上傳至服務器。
在此,為了更好的保護用戶隱私,用戶設備可以僅記錄單方的通話內(nèi)容,例如僅記錄來電方的通話內(nèi)容。對于如“中介”、“推銷”等的來電,通常來電方的通話內(nèi)容中已經(jīng)包含了足夠的信息來確定其來電意圖。
本發(fā)明也考慮了其他的隱私保護方案。例如,用戶設備可以僅記錄不在當前接聽用戶的通訊錄或通話記錄中的電話號碼的通話內(nèi)容。也即,該來電號碼應為陌生號碼。
對于一個經(jīng)初步識別的來電號碼,服務器將對其多次通話內(nèi)容進行語音識別。為了更準確且更精細化地識別一個來電號碼的意圖,服務器需要對其多次通話內(nèi)容進行分析來確定最可能的意圖。一次通話內(nèi)容意指從用戶接聽來電到此次通話被掛斷中產(chǎn)生的通話內(nèi)容。
其中,對通話內(nèi)容的語音識別意在將音頻的通話內(nèi)容轉(zhuǎn)化為文字的通話內(nèi)容。語音識別已為成熟技術(shù),本發(fā)明在此不做具體描述。任何現(xiàn)有的或?qū)淼恼Z音識別技術(shù)如可應用于本發(fā)明,均應被包含于此。
經(jīng)語音識別的內(nèi)容可以是文字形式的通話內(nèi)容,也可以是對該文字形式的通話內(nèi)容的進一步處理,如從其提取關(guān)鍵詞集。在此,一個關(guān)鍵詞集可以是從一次通話內(nèi)容中提取的所有關(guān)鍵詞。
在步驟s2中,服務器將每次語音識別的內(nèi)容匹配行業(yè)關(guān)鍵詞庫,以獲得相匹配的一個或多個行業(yè)。
在此,網(wǎng)絡端還包括一個行業(yè)關(guān)鍵詞庫,其中包括多個行業(yè)以及每個行業(yè)所對應的一個或多個行業(yè)關(guān)鍵詞。
例如,服務器可以將一個經(jīng)初步識別的來電號碼的各關(guān)鍵詞集分別在該行業(yè)關(guān)鍵詞庫中進行匹配查詢,以獲得相匹配的一個或多個行業(yè)。
可替代地,服務器也可以直接將文字形式的通話內(nèi)容與各行業(yè)關(guān)鍵詞進行匹配,以獲得相匹配的一個或多個行業(yè)。
行業(yè)關(guān)鍵詞到行業(yè)的映射可以示例性地如下所示:
“買房、租房、房子、地產(chǎn)、房價、戶型…”->“房地產(chǎn)行業(yè)”
“汽車、買車、試駕、4s店”->“汽車行業(yè)”
“投資、理財、黃金、白銀、股票”->“投資理財行業(yè)”
在步驟s3中,服務器根據(jù)每次語音識別的內(nèi)容,確定其中每個行業(yè)分別所對應的一個或多個意圖標簽。
在通過每次通話內(nèi)容確定來電號碼所對應的行業(yè)之后,本發(fā)明還進一步確定相應行業(yè)下的具體意圖標簽,以使得用戶能夠精確知曉該來電號碼的意圖。
根據(jù)本發(fā)明的一個優(yōu)選實施例,網(wǎng)絡端可以建立一個意圖標簽庫,其中包括各行業(yè)以及每個行業(yè)所對應的意圖標簽。服務器可以將每次語音識別內(nèi)容,例如關(guān)鍵詞集或文字形式的通話內(nèi)容,按照在步驟s2中所識別的行業(yè),匹配查詢其中各行業(yè)所對應的意圖標簽,以獲得所識別的各行業(yè)下的意圖標簽。
具體如,對于一次通話內(nèi)容“請問您對黃金投資有興趣嗎”,經(jīng)識別其對應的行業(yè)為“投資理財”,服務器進一步對該通話內(nèi)容在“投資理財”所對應的各意圖標簽中進行匹配查詢,以獲得相匹配的意圖標簽,如“黃金投資”。其中,“投資理財”行業(yè)所對應的意圖標簽可以諸如“黃金投資”、“白銀投資”、“股票投資”、“外匯投資”等。
根據(jù)本發(fā)明的一個優(yōu)選實施例,網(wǎng)絡端可以針對各具體行業(yè)構(gòu)建相應的意圖規(guī)則。
例如,每個行業(yè)可以設定一組核心關(guān)鍵詞,當服務器對一條通話內(nèi)容中相應于特定行業(yè)匹配到一個或多個核心關(guān)鍵詞,所匹配的核心關(guān)鍵詞對應的意圖標簽即可以作為該條通話內(nèi)容的意圖標簽。
具體地,例如,對于“投資理財”行業(yè),其意圖規(guī)則可以示例性如下:
“黃金”->“黃金投資”
“白銀”->“白銀投資”
“股票”->“股票投資”
“外匯”->“外匯投資”
據(jù)此,當服務器從通話內(nèi)容中在“投資理財”行業(yè)下匹配到核心關(guān)鍵詞如“黃金”,則可以按照以上意圖規(guī)則確定相應的意圖標簽為“黃金投資”。
可替代地,意圖標簽也可以是由核心關(guān)鍵詞實時生成的。例如,仍按上例,當從通話內(nèi)容中在“投資理財”行業(yè)下匹配到核心關(guān)鍵詞如“黃金”,服務器按照“行業(yè)”+“核心關(guān)鍵詞”生成相應的意圖標簽,如“黃金投資”。
又如,服務器按照每個行業(yè)的特定特性,例如每個行業(yè)均使用有特定關(guān)鍵詞,從經(jīng)語音識別的通話內(nèi)容中提取與該(等)特定關(guān)鍵詞相對應的信息,以獲得相應的一個或多個意圖標簽。
具體地,例如,當從通話內(nèi)容中檢測到特定關(guān)鍵詞后,服務器從其上下文中提取與該特定關(guān)鍵詞相對應的信息來作為意圖標簽。這可以被認為是一種通過語義分析來提取意圖標簽的方式。
舉例來說,當前通話內(nèi)容所對應的行業(yè)已確定為“房地產(chǎn)”,當檢測到特定關(guān)鍵詞如“戶型”、“開發(fā)商”后,服務器搜索上下文獲得如“兩居室”、“萬科”,并將“兩居室”和“萬科”作為意圖標簽。優(yōu)選地,行業(yè)“房地產(chǎn)”也可以一并作為意圖標簽。
在此,服務器可以根據(jù)各特定關(guān)鍵詞所對應的表達方式來提取其具體內(nèi)容信息。例如,在“房地產(chǎn)”行業(yè)下,當檢測到特定關(guān)鍵詞“面積”時,服務器可以從其下文中提取xx平米作為相應的信息,從而獲得意圖標簽“房地產(chǎn)”和“xx平米”。
上述分別通過核心關(guān)鍵詞和特定關(guān)鍵詞來獲得意圖標簽的方式可以結(jié)合來獲得通話內(nèi)容的意圖標簽。例如,服務器根據(jù)核心關(guān)鍵詞獲得意圖標簽“黃金投資”,根據(jù)特定關(guān)鍵詞“黃金價格”獲得意圖標簽“276.39”。
在步驟s4中,服務器綜合多次通話內(nèi)容所對應的各行業(yè)的權(quán)重以及其中每個行業(yè)的各意圖標簽的權(quán)重,以確定所述來電號碼所對應的行業(yè)及其意圖標簽。
在此,對于一次通話內(nèi)容而言,其可以對應有一個或多個行業(yè),其中每個行業(yè)又可以對應有一個或多個意圖標簽。服務器可以進一步確定其中各行業(yè)以及意圖標簽的權(quán)重。優(yōu)選地,權(quán)重基于詞頻來確定。
例如,對于通話內(nèi)容t1,其對應行業(yè)h1和h2,其中h1的權(quán)重可以根據(jù)t1在h1下所匹配到的各行業(yè)關(guān)鍵詞的詞頻來確定,如h1所對應的行業(yè)關(guān)鍵詞c1和c2的詞頻分別為3、2,則h1的權(quán)重可以為(3+2)*0.1=0.5,同樣方式確定h2的權(quán)重為0.1。意圖標簽的權(quán)重同樣可以根據(jù)對應核心關(guān)鍵詞和/或特定關(guān)鍵詞的頻次來確定。例如,h1對應有意圖標簽y1和y2,y1由核心關(guān)鍵詞獲取,則y1的權(quán)重可以基于該核心關(guān)鍵詞的詞頻來確定,如0.2,y2由特定關(guān)鍵詞獲取,則y1的權(quán)重可以基于該特定關(guān)鍵詞或其對應信息的詞頻來確定,如0.1。
對于一個經(jīng)初步識別的來電號碼n1,假設記錄有其50次通話內(nèi)容,服務器可以對每次通話內(nèi)容均按照以上方式確定相應的行業(yè)權(quán)重和意圖標簽權(quán)重。進而,服務器綜合這50次通話內(nèi)容所確定的行業(yè)及其權(quán)重以及其中各行業(yè)的意圖標簽及其權(quán)重。例如,服務器從中確定綜合后權(quán)重最高的行業(yè),如相同行業(yè)的權(quán)重相加后,h1的權(quán)重最高,進而確定h1的各意圖標簽中綜合后權(quán)重最高的意圖標簽,如y1的權(quán)重最高,據(jù)此,服務器可以確定該來電號碼n1的行業(yè)h1及其意圖標簽y1。
優(yōu)選地,為了能夠更準確地識別來電意圖,只有當排名最高的意圖標簽的權(quán)重遠高于次位的意圖標簽的權(quán)重時,例如,前者的權(quán)重至少要為后者權(quán)重的10倍以上(該比例可以根據(jù)應用需求來設置),服務器才可確定該權(quán)重最高的意圖標簽為號碼n1的意圖標簽。
之后,如果有用戶收到該號碼n1的來電,服務器則可以將意圖標簽y1提供給用戶,如圖3所示,此時來電界面可以顯示有y1(如黃金理財),以更精確地提示用戶,供用戶參照y1并根據(jù)其具體需求來決定是否接聽該來電。在此,由于意圖標簽中通常包括了行業(yè),故提示用戶來電意圖時,服務器可以僅提供意圖標簽。
進一步地,對于按照y1提示接聽該n1來電的用戶,可以認為其對意圖標簽y1感興趣,進而向其推送與意圖標簽y1相關(guān)的信息。
圖4示出根據(jù)本發(fā)明的一個實施例,其中具體示出一種對來電意圖進行識別裝置的示意圖。
該識別裝置40位于網(wǎng)絡側(cè),其典型地可以裝置于一臺或多臺服務器中。然而,本領(lǐng)域技術(shù)人員應能理解,盡管對來電意圖的識別是由網(wǎng)絡端來執(zhí)行的,但是由于整個通話過程是在用戶端進行的,故本發(fā)明對來電意圖的識別還需要用戶端的輔助。在此,用戶端典型地如手機,網(wǎng)絡端典型地如服務器。如無特別說明,本說明書中網(wǎng)絡端與服務器等同使用。
如圖4所示,識別裝置40包括語音識別裝置41、行業(yè)匹配裝置42、標簽確定裝置43和意圖確定裝置44。
針對一個經(jīng)初步識別的來電號碼,語音識別裝置41對其多次通話內(nèi)容分別進行語音識別;行業(yè)匹配裝置42將每次語音識別的內(nèi)容匹配行業(yè)關(guān)鍵詞庫,以獲得相匹配的一個或多個行業(yè),其中,所述行業(yè)關(guān)鍵詞庫包括多個行業(yè)及其分別對應的一個或多個行業(yè)關(guān)鍵詞;標簽確定裝置43根據(jù)所述每次語音識別的內(nèi)容,確定其中每個行業(yè)分別所對應的一個或多個意圖標簽;意圖確定裝置44綜合所述多次通話內(nèi)容所對應的各行業(yè)的權(quán)重以及其中每個行業(yè)的各意圖標簽的權(quán)重,以確定所述來電號碼所對應的行業(yè)及其意圖標簽。
具體地,針對一個經(jīng)初步識別的來電號碼,語音識別裝置41對其多次通話內(nèi)容分別進行語音識別。
在此,經(jīng)初步識別的來電號碼包括但不限于已被識別為騷擾電話的來電號碼、已識別有初步標識的來電號碼等。前者例如僅提示用戶為騷擾電話的來電號碼,后者例如已被標識為如“中介”、“推銷”等的來電號碼。本發(fā)明意在對這些通常意義上的騷擾電話進一步提供細化意圖標簽,以使得接聽該來電號碼的用戶能夠根據(jù)其具體需求決定是否接聽該來電,而非僅基于“中介”、“推銷”等標識盲目拒絕該來電,或者浪費時間接聽后發(fā)現(xiàn)并不符合自身的需求。
此外,還需說明的是,本發(fā)明所指“騷擾電話”并不包括“詐騙電話”等具有非法意圖的電話,這些具有非法意圖的電話應當被如運營商過濾,并不在本發(fā)明的討論范圍之內(nèi)。
當用戶接聽經(jīng)初步識別的來電號碼之后,用戶設備將記錄用戶的此次通話,并將通話內(nèi)容上傳至服務器。
在此,為了更好的保護用戶隱私,用戶設備可以僅記錄單方的通話內(nèi)容,例如僅記錄來電方的通話內(nèi)容。對于如“中介”、“推銷”等的來電,通常來電方的通話內(nèi)容中已經(jīng)包含了足夠的信息來確定其來電意圖。
本發(fā)明也考慮了其他的隱私保護方案。例如,用戶設備可以僅記錄不在當前接聽用戶的通訊錄或通話記錄中的電話號碼的通話內(nèi)容。也即,該來電號碼應為陌生號碼。
對于一個經(jīng)初步識別的來電號碼,語音識別裝置41將對其多次通話內(nèi)容進行語音識別。為了更準確且更精細化地識別一個來電號碼的意圖,識別裝置40需要對其多次通話內(nèi)容進行分析來確定最可能的意圖。一次通話內(nèi)容意指從用戶接聽來電到此次通話被掛斷中產(chǎn)生的通話內(nèi)容。
其中,對通話內(nèi)容的語音識別意在將音頻的通話內(nèi)容轉(zhuǎn)化為文字的通話內(nèi)容。語音識別已為成熟技術(shù),本發(fā)明在此不做具體描述。任何現(xiàn)有的或?qū)淼恼Z音識別技術(shù)如可應用于本發(fā)明,均應被包含于此。
經(jīng)語音識別的內(nèi)容可以是文字形式的通話內(nèi)容,也可以是對該文字形式的通話內(nèi)容的進一步處理,如從其提取關(guān)鍵詞集。在此,一個關(guān)鍵詞集可以是從一次通話內(nèi)容中提取的所有關(guān)鍵詞。
隨后,行業(yè)匹配裝置42將每次語音識別的內(nèi)容匹配行業(yè)關(guān)鍵詞庫,以獲得相匹配的一個或多個行業(yè)。
在此,網(wǎng)絡端還包括一個行業(yè)關(guān)鍵詞庫,其中包括多個行業(yè)以及每個行業(yè)所對應的一個或多個行業(yè)關(guān)鍵詞。
例如,行業(yè)匹配裝置42可以將一個經(jīng)初步識別的來電號碼的各關(guān)鍵詞集分別在該行業(yè)關(guān)鍵詞庫中進行匹配查詢,以獲得相匹配的一個或多個行業(yè)。
可替代地,行業(yè)匹配裝置42也可以直接將文字形式的通話內(nèi)容與各行業(yè)關(guān)鍵詞進行匹配,以獲得相匹配的一個或多個行業(yè)。
行業(yè)關(guān)鍵詞到行業(yè)的映射可以示例性地如下所示:
“買房、租房、房子、地產(chǎn)、房價、戶型…”->“房地產(chǎn)行業(yè)”
“汽車、買車、試駕、4s店”->“汽車行業(yè)”
“投資、理財、黃金、白銀、股票”->“投資理財行業(yè)”
接著,標簽確定裝置43根據(jù)每次語音識別的內(nèi)容,確定其中每個行業(yè)分別所對應的一個或多個意圖標簽。
在通過每次通話內(nèi)容確定來電號碼所對應的行業(yè)之后,本發(fā)明還進一步確定相應行業(yè)下的具體意圖標簽,以使得用戶能夠精確知曉該來電號碼的意圖。
根據(jù)本發(fā)明的一個優(yōu)選實施例,網(wǎng)絡端可以建立一個意圖標簽庫,其中包括各行業(yè)以及每個行業(yè)所對應的意圖標簽。標簽確定裝置43可以將每次語音識別內(nèi)容,例如關(guān)鍵詞集或文字形式的通話內(nèi)容,按照由行業(yè)匹配裝置42所識別的行業(yè),匹配查詢其中各行業(yè)所對應的意圖標簽,以獲得所識別的各行業(yè)下的意圖標簽。
具體如,對于一次通話內(nèi)容“請問您對黃金投資有興趣嗎”,經(jīng)行業(yè)匹配裝置42識別其對應的行業(yè)為“投資理財”,標簽確定裝置43進一步對該通話內(nèi)容在“投資理財”所對應的各意圖標簽中進行匹配查詢,以獲得相匹配的意圖標簽,如“黃金投資”。其中,“投資理財”行業(yè)所對應的意圖標簽可以諸如“黃金投資”、“白銀投資”、“股票投資”、“外匯投資”等。
根據(jù)本發(fā)明的一個優(yōu)選實施例,標簽確定裝置43可以針對各具體行業(yè)構(gòu)建相應的意圖規(guī)則。
例如,每個行業(yè)可以設定一組核心關(guān)鍵詞,當標簽確定裝置43對一條通話內(nèi)容中相應于特定行業(yè)匹配到一個或多個核心關(guān)鍵詞,所匹配的核心關(guān)鍵詞對應的意圖標簽即可以作為該條通話內(nèi)容的意圖標簽。
具體地,例如,對于“投資理財”行業(yè),其意圖規(guī)則可以示例性如下:
“黃金”->“黃金投資”
“白銀”->“白銀投資”
“股票”->“股票投資”
“外匯”->“外匯投資”
據(jù)此,當標簽確定裝置43從通話內(nèi)容中在“投資理財”行業(yè)下匹配到核心關(guān)鍵詞如“黃金”,則可以按照以上意圖規(guī)則確定相應的意圖標簽為“黃金投資”。
可替代地,意圖標簽也可以是由核心關(guān)鍵詞實時生成的。例如,仍按上例,當從通話內(nèi)容中在“投資理財”行業(yè)下匹配到核心關(guān)鍵詞如“黃金”,標簽確定裝置43按照“行業(yè)”+“核心關(guān)鍵詞”生成相應的意圖標簽,如“黃金投資”。
又如,標簽確定裝置43按照每個行業(yè)的特定特性,例如每個行業(yè)均使用有特定關(guān)鍵詞,從經(jīng)語音識別的通話內(nèi)容中提取與該(等)特定關(guān)鍵詞相對應的信息,以獲得相應的一個或多個意圖標簽。
具體地,例如,當從通話內(nèi)容中檢測到特定關(guān)鍵詞后,標簽確定裝置43從其上下文中提取與該特定關(guān)鍵詞相對應的信息來作為意圖標簽。這可以被認為是一種通過語義分析來提取意圖標簽的方式。
舉例來說,當前通話內(nèi)容所對應的行業(yè)已確定為“房地產(chǎn)”,當檢測到特定關(guān)鍵詞如“戶型”、“開發(fā)商”后,標簽確定裝置43搜索上下文獲得如“兩居室”、“萬科”,并將“兩居室”和“萬科”作為意圖標簽。優(yōu)選地,行業(yè)“房地產(chǎn)”也可以一并作為意圖標簽。
在此,標簽確定裝置43可以根據(jù)各特定關(guān)鍵詞所對應的表達方式來提取其具體內(nèi)容信息。例如,在“房地產(chǎn)”行業(yè)下,當檢測到特定關(guān)鍵詞“面積”時,標簽確定裝置43可以從其下文中提取xx平米作為相應的信息,從而獲得意圖標簽“房地產(chǎn)”和“xx平米”。
上述分別通過核心關(guān)鍵詞和特定關(guān)鍵詞來獲得意圖標簽的方式可以結(jié)合來獲得通話內(nèi)容的意圖標簽。例如,標簽確定裝置43根據(jù)核心關(guān)鍵詞獲得意圖標簽“黃金投資”,根據(jù)特定關(guān)鍵詞“黃金價格”獲得意圖標簽“276.39”。
隨后,意圖確定裝置44綜合多次通話內(nèi)容所對應的各行業(yè)的權(quán)重以及其中每個行業(yè)的各意圖標簽的權(quán)重,以確定所述來電號碼所對應的行業(yè)及其意圖標簽。
在此,對于一次通話內(nèi)容而言,其可以對應有一個或多個行業(yè),其中每個行業(yè)又可以對應有一個或多個意圖標簽。意圖確定裝置44可以進一步確定其中各行業(yè)以及意圖標簽的權(quán)重。優(yōu)選地,權(quán)重基于詞頻來確定。
例如,對于通話內(nèi)容t1,其對應行業(yè)h1和h2,其中h1的權(quán)重可以根據(jù)t1在h1下所匹配到的各行業(yè)關(guān)鍵詞的詞頻來確定,如h1所對應的行業(yè)關(guān)鍵詞c1和c2的詞頻分別為3、2,則h1的權(quán)重可以為(3+2)*0.1=0.5,同樣方式確定h2的權(quán)重為0.1。意圖標簽的權(quán)重同樣可以根據(jù)對應核心關(guān)鍵詞和/或特定關(guān)鍵詞的頻次來確定。例如,h1對應有意圖標簽y1和y2,y1由核心關(guān)鍵詞獲取,則y1的權(quán)重可以基于該核心關(guān)鍵詞的詞頻來確定,如0.2,y2由特定關(guān)鍵詞獲取,則y1的權(quán)重可以基于該特定關(guān)鍵詞或其對應信息的詞頻來確定,如0.1。
對于一個經(jīng)初步識別的來電號碼n1,假設記錄有其50次通話內(nèi)容,意圖確定裝置44可以對每次通話內(nèi)容均按照以上方式確定相應的行業(yè)權(quán)重和意圖標簽權(quán)重。進而,意圖確定裝置44綜合這50次通話內(nèi)容所確定的行業(yè)及其權(quán)重以及其中各行業(yè)的意圖標簽及其權(quán)重。例如,意圖確定裝置44從中確定綜合后權(quán)重最高的行業(yè),如相同行業(yè)的權(quán)重相加后,h1的權(quán)重最高,進而確定h1的各意圖標簽中綜合后權(quán)重最高的意圖標簽,如y1的權(quán)重最高,據(jù)此,意圖確定裝置44可以確定該來電號碼n1的行業(yè)h1及其意圖標簽y1。
優(yōu)選地,為了能夠更準確地識別來電意圖,只有當排名最高的意圖標簽的權(quán)重遠高于次位的意圖標簽的權(quán)重時,例如,前者的權(quán)重至少要為后者權(quán)重的10倍以上(該比例可以根據(jù)應用需求來設置),意圖確定裝置44才可確定該權(quán)重最高的意圖標簽為號碼n1的意圖標簽。
識別裝置40還可以包括一標簽提示裝置(未示出)。在意圖確定裝置44確定號碼n1的意圖標簽之后,如果有用戶收到該號碼n1的來電,標簽提示裝置則可以將意圖標簽y1提供給用戶,如圖3所示,此時來電界面可以顯示有y1(如黃金理財),以更精確地提示用戶,供用戶參照y1并根據(jù)其具體需求來決定是否接聽該來電。在此,由于意圖標簽中通常包括了行業(yè),故提示用戶來電意圖時,標簽提示裝置可以僅提供意圖標簽。
本發(fā)明可以采用一個或多個計算機可讀的介質(zhì)的任意組合。計算機可讀介質(zhì)可以是計算機可讀信號介質(zhì)或者計算機可讀存儲介質(zhì)。計算機可讀存儲介質(zhì)例如可以是——但不限于——電、磁、光、電磁、紅外線、或半導體的系統(tǒng)、裝置或器件,或者任意以上的組合。計算機可讀存儲介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個或多個導線的電連接、便攜式計算機磁盤、硬盤、隨機存取存儲器(ram)、只讀存儲器(rom)、可擦式可編程只讀存儲器(eprom或閃存)、光纖、便攜式緊湊磁盤只讀存儲器(cd-rom)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本文件中,計算機可讀存儲介質(zhì)可以是任何包含或存儲程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。
計算機可讀的信號介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號,其中承載了計算機可讀的程序代碼。這種傳播的數(shù)據(jù)信號可以采用多種形式,包括——但不限于——電磁信號、光信號或上述的任意合適的組合。計算機可讀的信號介質(zhì)還可以是計算機可讀存儲介質(zhì)以外的任何計算機可讀介質(zhì),該計算機可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。
計算機可讀介質(zhì)上包含的程序代碼可以用任何適當?shù)慕橘|(zhì)傳輸,包括——但不限于——無線、電線、光纜、rf等等,或者上述的任意合適的組合。
可以以一種或多種程序設計語言或其組合來編寫用于執(zhí)行本發(fā)明操作的計算機程序代碼,所述程序設計語言包括面向?qū)ο蟮某绦蛟O計語言—諸如java、smalltalk、c++,還包括常規(guī)的過程式程序設計語言—諸如“c”語言或類似的程序設計語言。程序代碼可以完全地在用戶計算機上執(zhí)行、部分地在用戶計算機上執(zhí)行、作為一個獨立的軟件包執(zhí)行、部分在用戶計算機上部分在遠程計算機上執(zhí)行、或者完全在遠程計算機或服務器上執(zhí)行。在涉及遠程計算機的情形中,遠程計算機可以通過任意種類的網(wǎng)絡——包括局域網(wǎng)(lan)或廣域網(wǎng)(wan)—連接到用戶計算機,或者,可以連接到外部計算機(例如利用因特網(wǎng)服務提供商來通過因特網(wǎng)連接)。
需要注意的是,本發(fā)明可在軟件和/或軟件與硬件的組合體中被實施,例如,本發(fā)明的各個裝置可采用專用集成電路(asic)或任何其他類似硬件設備來實現(xiàn)。另外,本發(fā)明的一些步驟或功能可采用硬件來實現(xiàn),例如,作為與處理器配合從而執(zhí)行各個步驟或功能的電路。
對于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實施例的細節(jié),而且在不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實現(xiàn)本發(fā)明。因此,無論從哪一點來看,均應將實施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán)利要求而不是上述說明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化涵括在本發(fā)明內(nèi)。系統(tǒng)權(quán)利要求中陳述的多個單元或裝置也可以由一個單元或裝置通過軟件或者硬件來實現(xiàn)。