語音使能的人機對話系統(tǒng),諸如與娛樂系統(tǒng)或個人設(shè)備的語音交互,取決于用戶話音的精確識別。例如,有效的語音搜索應(yīng)用必須精確地識別用戶提交的查詢,從而返回給用戶的信息與用戶在提交查詢時的意圖相關(guān)。此類系統(tǒng)的精度能夠通過將此類系統(tǒng)所使用的語言模型或口語語言理解(SLU)模型針對具體用戶或一組類似用戶而不是總的用戶群體個性化來改進。
現(xiàn)有的用于個性化語言和SLU模型的方法主要依賴于用戶過去的某些類型的言辭以及來自用戶記錄的個人使用模式。這些方法假設(shè)與未來言辭的詞匯相似度,諸如未來的用戶查詢;也即,用戶將會詢問與之前相同的問題。但是這些方法對于語義上或者類別上相似但是包含不同內(nèi)容的未來言辭是無效的。特別地,這些方法不能提供用于在已經(jīng)觀察到的詞語序列模式上擴展從而預(yù)測未見的用戶查詢的解決方案。
技術(shù)實現(xiàn)要素:
提供該發(fā)明內(nèi)容以便以簡化的形式來引入下面的具體實施方式中進一步描述的概念的選擇。該發(fā)明內(nèi)容不旨在確定所要求保護的主題的關(guān)鍵特征或主要特征,也不旨在用于限定所要求保護的主題的范圍。
本發(fā)明的實施例涉及通過針對具體用戶或用戶群體特點調(diào)整語言模型所使用的知識源來改進用于話音識別的語言模型的系統(tǒng)和方法。特別地,通過將特定用戶的個人使用歷史信息并入,可以針對該特定用戶個性化諸如知識圖的知識源。如進一步所描述的,在一個實施例中,個人使用歷史可以包括用戶的網(wǎng)絡(luò)查詢記錄、桌面或個人設(shè)備查詢記錄、社交網(wǎng)絡(luò)交互、所訪問的網(wǎng)站和類似的用戶交互信息。從該數(shù)據(jù),可以確定、提取實體和用戶動作信息以及將其投射或映射到知識源上,從而針對用戶個性化知識源。個性化知識源隨后能夠用于通過利用對應(yīng)于在用戶的使用歷史信息中出現(xiàn)的實體或?qū)嶓w對的查詢訓(xùn)練語言模型來構(gòu)建個人語言模型。
一些實施例還包括使用個性化知識源來確定具有類似的興趣或意圖的用戶。以此方式,可以基于類似用戶所共有的群體特點來構(gòu)建語言模型。而且,在目標用戶的個人使用歷史稀少或未知的情況下,可基于對類似用戶個性化的知識源來擴展或增強對該目標用戶個性化的知識源。
附圖說明
在附圖中通過示例而不是限制的方式圖示說明了本發(fā)明,在附圖中相似的附圖標記指代相似的元件,并且其中:
圖1是可以采用本發(fā)明的實施例的示例的系統(tǒng)架構(gòu)的框圖;
圖2描繪了依照本發(fā)明的實施例的個性化的知識圖的一個示例的部分;
圖3-5描繪了依照本發(fā)明的實施例的基于用戶歷史來個性化特定用戶的語言模型從而更好地理解該特定用戶的未來查詢的方法的流程圖;以及
圖6是適合在實現(xiàn)本發(fā)明的實施例時使用的示范性的計算環(huán)境的框圖。
具體實施方式
在本文具體地描述了本發(fā)明的主題以符合法規(guī)要求。然而,說明書本身不旨在限制該專利的范圍。相反,發(fā)明人已經(jīng)想到,要求保護的主題也可能與其它當前或未來的技術(shù)相結(jié)合而通過其它方式來具體實施,以包含類似于該文檔中所描述的步驟的不同步驟或步驟的組合。而且,雖然術(shù)語“步驟”和/或“框”可在本文用來暗含所采用的方法的不同要素,該術(shù)語不應(yīng)解釋為暗示在本文公開的各步驟之中或之間的任何特定順序,除非以及除了明確地描述各個步驟的順序。
在本文所描述的技術(shù)的方面一般涉及用于通過針對具體用戶或用戶群體特點來調(diào)整語言模型所使用的知識源來改進用于話音識別的語言模型或SLU模型以及其它事項的系統(tǒng)、方法和計算機存儲介質(zhì)。特別地,通過將用戶信息并入知識源中,可以對特定用戶個性化諸如知識圖的知識源,從而創(chuàng)建個性化知識源。
當創(chuàng)建個性化知識源時,可以使用用戶的各種個人信息源以及更一般的知識源,諸如域數(shù)據(jù)庫和知識圖。個性化知識源隨后可用于構(gòu)建個性化語言模型,例如通過利用對應(yīng)于用戶的使用歷史信息中出現(xiàn)的實體或?qū)嶓w對的查詢訓(xùn)練語言模型。例如,在一個實施例中,通過將來自諸如查詢記錄和社交網(wǎng)絡(luò)交互的各種個人源的個人使用歷史信息映射到一般的知識圖上,生成個性化知識圖。然后,個性化知識圖用于定制用戶的語言模型以改善話音識別,例如通過使用個性化知識圖中的實體關(guān)系來預(yù)測用戶的未來查詢。
一些實施例還包括使用個性化知識源來確定具有類似興趣或意圖的用戶,例如通過聚類(clustering)。以此方式,可基于類似用戶所共有的群體特點來構(gòu)建語言模型。而且,可以基于對類似用戶個性化的知識源來擴展或增強針對特定用戶個性化的知識源。因此,在新用戶的個人使用歷史稀少或未知的情況下,來自類似用戶的信息,包括例如關(guān)于實體、實體關(guān)系對、意圖或?qū)嶓w流行性的信息,可以用于訓(xùn)練新用戶的語言模型。
現(xiàn)在轉(zhuǎn)到圖1,提供了框圖,示出了適合于實現(xiàn)本發(fā)明的實施例且通常由系統(tǒng)100指示的示例的系統(tǒng)架構(gòu)的各方面。應(yīng)當理解,本文所描述的該布置以及其它布置僅作為示例闡述。因此,系統(tǒng)100僅表示適合的計算系統(tǒng)架構(gòu)的一個示例。除了或者不使用示出的那些可以使用其它的布置和元素(例如,用戶設(shè)備、數(shù)據(jù)庫等),并且一些元素可為了清晰的原因而一起省去。此外,本文所描述的多個元素是可以實現(xiàn)為離散的或分布的組件或者與其它組件相結(jié)合來實現(xiàn)以及在任何適合的組合和位置實現(xiàn)的功能實體。在本文中描述為由一個或多個實體所執(zhí)行的各種功能可以通過硬件、固件和/或軟件來實施。例如,一些功能可以通過處理器執(zhí)行存儲在存儲器中的指令來實施。
在未示出的其它組件中,系統(tǒng)100包括與一個或多個用戶設(shè)備(例如,項102和104)通信耦合的網(wǎng)絡(luò)115、存儲設(shè)備106以及個性化知識源生成器120。圖1所示的組件可以利用一個或多個計算設(shè)備,諸如結(jié)合圖6所描述的計算設(shè)備600來實現(xiàn)。網(wǎng)絡(luò)115可以包括但不限于一個或多個局域網(wǎng)(LAN)和/或廣域網(wǎng)(WAN)。這些聯(lián)網(wǎng)環(huán)境常見于辦公室、企業(yè)域計算機網(wǎng)絡(luò)、內(nèi)聯(lián)網(wǎng)和因特網(wǎng)。應(yīng)當理解,可以在本發(fā)明的范圍內(nèi)在系統(tǒng)100內(nèi)采用任何數(shù)量的用戶設(shè)備、存儲組件和個性化知識源生成器。每個均可以包括單個設(shè)備或在分布式環(huán)境中配合的多個設(shè)備。例如,個性化知識源生成器120可以經(jīng)由布置在統(tǒng)一地提供本文所描述的功能的分布式環(huán)境中的多個設(shè)備來提供。另外,未示出的其它組件也可以包含在網(wǎng)絡(luò)環(huán)境內(nèi)。例如,還可以提供知識圖數(shù)據(jù)庫以便單獨地存儲能夠易于由本文所描述的實施例訪問的知識圖。
示例的用戶設(shè)備102和104各自包括能夠接收來自用戶的輸入的任意類型的用戶設(shè)備,諸如下文所述。雖然圖1示出了兩個示例的用戶設(shè)備102和104,但是用戶可以僅與一個用戶設(shè)備或多于兩個的設(shè)備相關(guān)聯(lián)。在一些實施例中,接收到來自用戶的輸入的用戶設(shè)備與用戶的用戶標識相關(guān)聯(lián)。
在一個實施例中,用戶設(shè)備102和104可以是關(guān)于本文的圖6所描述的類型的計算設(shè)備。通過示例而不是限制的方式,用戶設(shè)備可具體實現(xiàn)為個人數(shù)據(jù)助理(PDA)、移動設(shè)備、膝上型設(shè)備、平板設(shè)備、遠程控件、娛樂系統(tǒng)、車輛計算機系統(tǒng)、嵌入式系統(tǒng)控制器、電器、消費電子設(shè)備、或者能夠接收來自用戶的輸入的其它電子設(shè)備。輸入可通過多個不同模態(tài)中的一個接收,諸如通過示例而不是限制的方式,通過語音或聲音、文本、觸摸、點擊、姿勢、用戶的物理環(huán)境或結(jié)合圖6所描述的其它輸入技術(shù)。例如,用戶可以使用搜索引擎來輸入查詢,打算接收與查詢高度相關(guān)的信息?;蛘?,用戶可以與一個或多個社交網(wǎng)站交互并且提供用戶打算與朋友或者甚至陌生人共享的輸入。用戶還可以與社交網(wǎng)站交互,表明用戶已經(jīng)閱讀且喜歡另一用戶的發(fā)帖。此外,用戶可以對游戲系統(tǒng)、電視機等使用語音命令。所有這些形式的輸入以及其它未在此具體提及的輸入被認為在本發(fā)明的范圍內(nèi)。
存儲設(shè)備106通常存儲一個或多個知識源107以及個人源109,其在一個實施例中被用來構(gòu)建語言模型以改進話音識別例如精確地確定用戶下一言辭的可能性。在一些實施例中,一個或多個語言模型(未示出),包括從知識源107構(gòu)建的語言模型和/或從知識源107和個人源109構(gòu)建的語言模型,也存儲在存儲設(shè)備106中。此外,雖然描繪為單一數(shù)據(jù)庫組件,存儲設(shè)備106可以具體實現(xiàn)為一個或多個數(shù)據(jù)庫,或者可以在云端。
在一個實施例中,知識源107包括關(guān)系數(shù)據(jù)庫,該關(guān)系數(shù)據(jù)庫包含域數(shù)據(jù)庫、知識庫、知識圖或類似的信息源。在一個實施例中,知識源107包括結(jié)構(gòu)化語義知識庫,諸如Sematic Web。通過后臺,Sematic Web(或類似的結(jié)構(gòu)化知識庫或web規(guī)模的語義圖)能夠利用資源描述架構(gòu)(RDF)來表示,其為三基關(guān)聯(lián)結(jié)構(gòu),典型地包括通過某關(guān)系鏈接的兩個實體且類似于公知的預(yù)測/變元(argument)結(jié)構(gòu)。示例是“directed_by(Avatar,James Cameron)”。隨著RDF在使用和流行度方面的增加,已經(jīng)出現(xiàn)了覆蓋各種域的三元庫(稱為知識庫或知識圖),諸如Freebase.org。在一個實施例中,知識源107包括一個或多個知識圖(或者關(guān)系圖),其包括指示兩個實體之間的關(guān)系的三元組(例如,Avatar-directed by-James Cameron),并且可被匯編為圖形結(jié)構(gòu)。在圖2中提供了示例的知識圖,其圖示說明了示范性的實體及其關(guān)系,并且將在本文進行更詳細論述。
在一個實例中,知識源確定至少一個實體。如本文所使用的,術(shù)語實體被廣義地定義為包含與其它項具有潛在關(guān)系的任何類型的項,包括概念或?qū)ο?。例如,實體可以包括電影“Life is Beautiful”,導(dǎo)演(director)“Roberto Benigni”,以及獎項“奧斯卡”。這三個實體相關(guān),因為電影“Life is Beautiful”是由“Roberto Benigni”導(dǎo)演的,并且該電影也獲得奧斯卡獎。以某種方式相關(guān)的多個實體典型地包括域,該域可被視為實體類別,諸如電影、運動、音樂、體育、商業(yè)、產(chǎn)品、組織等。
個人源109包括用戶的一個或多個信息源。通過示例而不是限制的方式,此類用戶信息可以包括:用戶的查詢記錄,包括提交的查詢、查詢結(jié)果和/或點擊結(jié)果;所訪問的網(wǎng)站和瀏覽器歷史;在線購買歷史;社交網(wǎng)絡(luò)交互;以及其它用戶交互信息或使用歷史。在一個實施例中,用戶信息包括在用戶設(shè)備(例如,項102或104)上所采取的動作,該用戶設(shè)備可以與用戶ID相關(guān)。
存儲設(shè)備106還可以存儲根據(jù)本文所描述的實施例生成的個性化知識源或擴展的個性化知識源。例如,如進一步所描述的,個性化知識源可針對特定用戶定制并可以用于定制用于改進對于該特定用戶的話音識別的語言模型。擴展的個性化知識源針對特定用戶定制,而且包含了從具有類似興趣的其它用戶到與個性化知識源相關(guān)聯(lián)的用戶的映射。當我們在此處提到映射時,我們指的是從一個或多個個人源取得數(shù)據(jù)且將其與知識源對齊或?qū)⑵溆成涞街R源的過程。
在一個實施例中,在數(shù)據(jù)包括特定的實體或?qū)嶓w類型的情況下,可以在諸如知識圖的個性化知識源中確定實體或?qū)嶓w類型,并且對該實體或?qū)嶓w類型添加計數(shù)。因此,個性化知識源變成了概率個性化知識源。例如,如果數(shù)據(jù)包含了電影名字“Life is Beautiful”,則該電影名字位于用戶的個性化知識圖中并且該實體的當前計數(shù)增加一。同樣可以在本發(fā)明的實施例的范圍內(nèi)構(gòu)思其它映射方法。例如,算法可用于提供或計算每個實體和/或?qū)嶓w類型的權(quán)重。在這些實施例中,該算法可使用一對一計數(shù)方法或者可以考慮到不同的因素,諸如從哪個源提到了該實體或?qū)嶓w類型,用戶如何表明對該實體或?qū)嶓w類型的興趣,等等。在一個實施例中,在目標用戶的個性化知識源擴展的情況下,來自個性化知識源的加權(quán)可用于測量來自其它用戶的查詢的某些N-gram的計數(shù),從而目標用戶的興趣或意圖仍得以表示。
個性化知識源生成器120包括用戶歷史采集組件122、用戶歷史解析組件124、知識源擴展組件126和映射組件128。個性化知識源生成器120被配置為利用來自特定用戶或者來自被判定為與該特定用戶類似的其它用戶的個人源數(shù)據(jù)來生成個性化知識源和擴展的個性化知識源。在一個實施例中,個人知識源生成器120可實現(xiàn)在一個或多個用戶設(shè)備上,諸如用戶設(shè)備102和104,實現(xiàn)在服務(wù)器或后臺組件(未示出)上,或者實現(xiàn)在云端的分布式平臺(未示出)上。
在一個實施例中,在高級處,通過將個人源數(shù)據(jù)映射到一般(非個性化的)知識源或能夠進一步個性化的個性化知識源來創(chuàng)建個性化知識源。特別地,用戶歷史采集組件122被配置為提取或以其它方式采集該特定用戶的個性化的用戶歷史。該個性化的用戶歷史可以從各種個人源109采集。在一個實施例中,只要能夠與特定用戶結(jié)合,可以使用任何源,諸如需要用戶確定或以其它方式與特定用戶相關(guān)聯(lián)的源。從這些源采集數(shù)據(jù)允許系統(tǒng)捕獲用戶的個人興趣和意圖,該個人興趣和意圖隨后能夠用于預(yù)測或確定看不見的查詢(例如,語音查詢)用于個性化語言建模的可能性。理解用戶的興趣和意圖因此有助于預(yù)測用戶可能對什么感興趣或者用戶在未來的查詢中可能問什么。
除了與僅與特定用戶相關(guān)聯(lián)的用戶歷史,在一些實施例中,用戶歷史采集組件122還負責采集關(guān)于與特定用戶類似的其它用戶的歷史,諸如具有包含其興趣和意圖在內(nèi)的類似的用戶歷史的其它用戶。特別地,在特定用戶的用戶歷史稀少或未知的情況下,其可以有助于利用來自共享與該特定用戶類似的興趣和意圖的其它用戶的數(shù)據(jù)來支持用戶的個性化知識源。通過示例而不是限制的方式,可以確定的是特定用戶一般對電影具有濃厚的興趣,并且頻繁地搜索網(wǎng)絡(luò)以得到各種電影的演員陣容信息。另外地,該用戶的用戶歷史表明該用戶趨于偶爾購買電影。因此,在不同用戶或用戶群組被確定對電影具有相似興趣、搜索電影的演員陣容、以及還有購買電影的趨向的情況下,來自那些用戶的歷史的數(shù)據(jù)可映射到與特定用戶相關(guān)聯(lián)的個性化知識源從而支持個性化知識源對話音識別的有用性。
用戶歷史解析組件124通常被配置為通過用戶歷史采集組件122所提取或采集的可能大量的數(shù)據(jù)來解析以確定任何實體相關(guān)或用戶動作相關(guān)的信息。如本文所使用的,用戶動作是指能夠提供關(guān)于與特定實體和/或?qū)嶓w類型相關(guān)聯(lián)的用戶意圖和用戶興趣水平的信息的用戶所采取的動作。例如,繼續(xù)上述示例,如果用戶對電影感興趣且趨于偶爾在網(wǎng)站上進行電影購票,則電影購票的動作可被確定、解析和映射到用戶的個人知識源。
用戶動作相關(guān)信息可尤其有助于利用來自其它用戶的數(shù)據(jù)擴展用戶的個性化知識圖,因為動作能夠用于判定其它用戶是否具有與特定用戶相似的興趣或意圖。另一示范性的用戶動作包括用戶提供他或她“喜歡”例如社交網(wǎng)站上的某品項(例如,公共人物、名人、書籍、電影、另一用戶的發(fā)帖)。在一些實施例中,與用戶“喜歡”的無論何物相關(guān)聯(lián)的實體都可以通過用戶歷史解析組件124來確定。
除了解析與特定用戶相關(guān)聯(lián)的個性化用戶歷史之外,在一些實施例中,用戶歷史解析組件124還負責解析與和特定用戶有相似的興趣和/或意圖的其它用戶相關(guān)聯(lián)的數(shù)據(jù),如本文所描述的。在這些實施例中,與其它用戶相關(guān)聯(lián)的解析的數(shù)據(jù)隨后可以映射到特定用戶的個性化知識圖中。
知識源擴展組件126被配置為判定是否應(yīng)當擴展特定用戶的個性化知識源,并且在一些實施例中,判定如何擴展以及擴展到何種程度。在一個實施例中,在用戶的個性化知識源未被大量擴展來自用戶歷史的信息的映射的情況下,例如,如果知識源中的實體的計數(shù)或權(quán)重不特別高或者尚未滿足閾值,則可以判定出應(yīng)當擴展用戶的個性化知識源。知識源擴展組件126還可以負責判定應(yīng)如何擴展個人知識源。該判定的一個方面可以包括確定與特定用戶相似的其它用戶或用戶群組。在一個實施例中,類似用戶可以共享群體特點,諸如對具體的領(lǐng)域的興趣、所執(zhí)行的查詢的類型(例如,搜索電影的演員陣容成員)、用戶動作(例如,電影購票)等。
在一個實施例中,擴展個人知識源涉及到對目標用戶的個性化知識源中的實體和實體間關(guān)系加權(quán)。加權(quán)可以基于具體的實體和關(guān)系已經(jīng)從用戶歷史數(shù)據(jù)映射的次數(shù)。類似的加權(quán)可關(guān)于其它用戶的個性化知識源應(yīng)用。如果目標用戶的個性化知識源的具體部分中的實體和實體間關(guān)系具有與其它用戶的個性化知識源的同一部分中的相同的實體和實體間關(guān)系相似的權(quán)重(例如,滿足加權(quán)值的最小閾值),則可以判定該特定用戶和其它用戶在知識圖的該部分的主題上具有相似的興趣。
在另一實施例中,替代實體已經(jīng)映射了多少次的計數(shù)或者除了實體已經(jīng)映射了多少次的計數(shù)而使用知識源中的實體的流行度。例如,在具體的實體對于其它用戶群組具有特別高的流行度的情況下(例如,該具體的實體經(jīng)常被查詢、提及、在社交網(wǎng)站上發(fā)帖),可以預(yù)測出該特定用戶也對該流行的實體感興趣。因此,特定用戶的個性化知識源可以針對該實體來擴展,并且可以包括特定用戶對該實體的個性化知識源的部分感興趣(或者可能感興趣)的指示。
在又一實施例中,用戶的個性化知識源可以用于確定用戶對個性化知識源的第一部分的興趣水平,諸如特定的實體或?qū)嶓w間關(guān)系。例如,確定興趣水平可以包括判定用戶是否滿足指示用戶(或其它用戶)對知識源的某部分感興趣的可能性的某閾值??商娲鼗蛘吡硗獾?,可以存在能夠被滿足以量化用戶對知識源的一部分的興趣的多個興趣水平。
個性化知識源生成器120的映射組件128被配置為將數(shù)據(jù)映射到知識源。如本文所述,用戶歷史解析組件124通常從個人源確定并提取用戶歷史數(shù)據(jù),諸如實體和用戶動作。該數(shù)據(jù)隨后映射到知識源,從而針對用戶調(diào)整或個性化知識源。該數(shù)據(jù)的映射可以多種方式發(fā)生。例如,如上所述,每當在用戶的個人歷史信息中確定了特定實體或?qū)嶓w類型時,知識源中該實體或?qū)嶓w類型的計數(shù)可以增加,使得在任何特定時候,實體或?qū)嶓w類型具有與其相關(guān)聯(lián)的計數(shù)。因此,如果實體已經(jīng)被映射了十次,則與個性化知識源中的實體相關(guān)聯(lián)的計數(shù)可以是10?;蛘呖商娲?,在一個實施例中,可使用算法來計算每個實體的權(quán)重,而不是一對一計數(shù)。算法可以考慮其它因素,諸如實體(或?qū)嶓w類型)在何處和/或如何被提及或以其它方式與例如用戶或上下文鏈接。因此,如本文所使用的,術(shù)語“映射”、“映射到”或“對齊”廣義地用來意指增加知識源中的實體、關(guān)系、實體-實體對或?qū)嶓w類型的計數(shù)、對知識源中的實體、關(guān)系、實體-實體對或?qū)嶓w類型加權(quán)或者創(chuàng)建與知識源中的實體、關(guān)系、實體-實體對或?qū)嶓w類型的關(guān)聯(lián)或者其它用于基于用戶歷史信息來表示用戶對知識源的具體部分的興趣的指示符。
現(xiàn)在轉(zhuǎn)到圖2,依照本發(fā)明的實施例,描繪了個性化知識源的各方面。通過示例的方式,圖2的個性化知識源包括個性化知識圖并且一般地稱為知識圖200。知識圖200表示可以對特定用戶個性化的知識源的一個示例。特別地,如下文所述,圖2示出了將用戶的歷史信息(在該情況下是過去的用戶言辭)與知識圖200對齊以及根據(jù)來自用戶歷史的個人使用統(tǒng)計對圖上的關(guān)系加權(quán)的示例。
知識圖可以劃分成多個部分,每個部分稱為子圖。示例的知識圖200的兩個部分或子圖顯示在圖2中:對應(yīng)于電影域202的部分和對應(yīng)于書籍域204的部分。為清晰的原因,電影域202和書籍域204各僅示出了該域中實體和實體間關(guān)系的子集。具體地,示出了以電影實體“Life is Beautiful”為中心的電影域202,并且示出了以書籍實體“Leviathan”為中心的書籍域204。如三個點(項214和216)所指示,知識圖的其它子部分(例如,其它電影,其它書籍)存在,但是沒有示出。
在圖2中還示出了用戶歷史信息的框206。在該示例中,用戶歷史信息包括過去的用戶交互,諸如用戶詢問Roberto Benigni的電影所提交的之前的查詢。此處,實體“Roberto Benigni”和實體關(guān)系“導(dǎo)演”是從用戶言辭中確定的并且映射(箭頭209)到知識圖200。第二個示例示出了用戶動作,表明用戶已經(jīng)購買了電影“Life is Beautiful”的副本。箭頭211顯示出該用戶動作如何與知識圖200中的“Life is Beautiful”實體對齊。類似地,框206示出了其它用戶查詢的示例,其可以來自與用戶相關(guān)聯(lián)的一個或多個查詢記錄。這些查詢包括例如詢問奧斯卡獲獎電影。此處,“奧斯卡”可以被確定為實體并且映射到知識圖中的“奧斯卡,最佳男演員”實體210,和/或如此處所示,映射到與“奧斯卡,最佳男演員”實體210連接的“獲獎”的實體間關(guān)系,因為用戶的意圖是確定已經(jīng)獲得奧斯卡獎的電影。下一示例代表了來自包含了在用戶設(shè)備上進行的來自用戶的過去查詢的桌面(或用戶設(shè)備)查詢記錄的查詢。此處,用戶正在搜索本地地保存在他或她的用戶設(shè)備上作為小說的書籍。因此,“小說”被識別為實體并且可以映射到小說實體和/或映射到與小說連接的實體關(guān)系“流派”,因為用戶的意圖是找到作為小說的書籍。
最后,提供了用戶提交“Paul Auster書籍”的查詢的例子。如圖所示,實體“Paul Auster”可以映射到用戶的個性化知識圖作為實體或者作為具有作者(實體)“Paul Auster”的書籍(實體)“Leviathan”之間的關(guān)系。以該方式,通過將在框206中提供的示例的用戶歷史信息映射到知識圖200,知識圖200變得針對用戶個性化。
如圖2中進一步示出,一些實體,諸如“Prix Medicis Etranger”208、“Roberto Benigni”212和“奧斯卡,最佳男演員”210,可以被確定為是該特定用戶較感興趣的,如每當對該實體發(fā)生映射時,由被置于實體下方的橢圓形(例如,表示計數(shù))所指示的??商娲?,與某些實體、實體-實體對或關(guān)系相關(guān)聯(lián)的計數(shù)或權(quán)重能夠提供用戶對那些實體、實體-實體對或關(guān)系感興趣的另一指示(諸如相關(guān)聯(lián)的值)。
轉(zhuǎn)到圖3,提供了圖示說明用于基于用戶歷史信息將該特定目標用戶的語言模型個性化的一個示范性的方法300的流程圖。根據(jù)方法300所創(chuàng)建的個性化語言模型可用于目標用戶的話音識別,諸如通過預(yù)測用戶所提交的未來看不見的查詢(例如,語音查詢)。
在高級處,方法300的實施例首先利用該目標用戶的各種個人信息源以及可用的知識源創(chuàng)建了個性化知識源,其可以包括非個性化知識源或者能夠針對目標用戶個性化的知識源。從用戶歷史信息的過去的言辭、用戶的交互和其它個人源提取的信息與知識源對齊。例如,用戶過去的言辭與知識圖的部分的基于實體的相似性可被確定且映射到那些部分上??筛櫝霈F(xiàn)在用戶歷史中的實體和實體類型,并且當構(gòu)建個性化語言模型時可以使用它們的計數(shù)。一個實施例還包括:給定過去的用戶言辭(或其它用戶數(shù)據(jù)),使用用于應(yīng)用域的目標口語語言理解模型來估計特定域的概率,和/或給定過去的用戶言辭,使用用于應(yīng)用域的目標口語語言理解模型來估計用戶意圖和特定關(guān)系的概率。
P(域|過去的用戶言辭),P(意圖&關(guān)系|過去的用戶言辭)
該概率能夠在構(gòu)建個性化語言模型時用來提升知識源的具體部分的計數(shù),如圖2中所示。
繼續(xù)圖3,在步驟310中,從一個或多個個人源接收目標用戶的使用歷史信息。使用歷史包括從諸如結(jié)合圖1所描述的個人源109的一個或多個個人源采集到的與目標用戶相關(guān)的數(shù)據(jù);例如,目標用戶經(jīng)由用戶設(shè)備執(zhí)行的來自查詢記錄的過去的用戶查詢、網(wǎng)站交互、用戶動作等。用戶意圖可以從使用歷史所表示的過去行為推理出。
在一個實施例中,使用歷史被采集且存儲在數(shù)據(jù)庫中,諸如圖1的存儲設(shè)備106。例如,在目標用戶登錄到用戶設(shè)備、運行于設(shè)備上的應(yīng)用、或者具體的網(wǎng)站或諸如搜索引擎的在線服務(wù)上的情況下,關(guān)于使用歷史的信息能夠被采集且與用戶相關(guān)聯(lián)。在一個實施例中,到使用歷史信息的地址或指針可以被存儲而使得可以接收到使用歷史并且可以在下一步中從使用歷史解析具體的信息。
在步驟320中,解析使用歷史信息以確定一個或多個實體和/或用戶動作。在一個實施例中,步驟320包括從與該目標用戶相關(guān)聯(lián)的使用歷史信息中提取包括實體-實體對和實體關(guān)系的實體和/或用戶動作。
在步驟330中,經(jīng)解析的實體或用戶動作映射到知識源上,從而創(chuàng)建個性化知識源并且指示知識源的目標用戶最感興趣的部分。因此,如使用歷史所表示的用戶的個人興趣和意圖被捕獲到個性化知識源上并且隨后可用于個性化的語言建模,諸如預(yù)測未來看不見的查詢(例如,語音查詢)。例如,目標用戶的用戶言辭或過去的交互可以對齊到知識圖上,諸如結(jié)合圖2所描述的。
在一個實施例中,步驟330包括使得可由知識源表示的現(xiàn)有的語言模型適應(yīng)目標用戶的使用歷史,如過去的言辭。假設(shè)用戶通常具有對符合他們的一般興趣的對話系統(tǒng)的請求,他們可以重復(fù)來自相似域且具有相似意圖的請求,但是意圖的變元不同。因此,通過捕獲用戶的較高水平的興趣和意圖,能夠創(chuàng)建預(yù)期相似的意圖但是具有不同變元(即,沒有出現(xiàn)在使用歷史中的變元)的語言模型。如上所述,在一個實施例中,這是通過確定使用歷史與知識源的部分的基于實體的相似度以及將它們映射到知識源的對應(yīng)部分上來實現(xiàn)的。因此,跟蹤出現(xiàn)在用戶歷史中的實體和實體類型,并且當構(gòu)建個性化的語言模型時使用這些實體和實體類型的計數(shù)。在一些實施例中,在該步驟所確定的個性化知識源表示概率知識源,因為來自用戶歷史的使用統(tǒng)計被用于對知識源的關(guān)系和實體加權(quán)(或者增加對其的計數(shù))。
在步驟340中,使用個性化知識源來個性化(或訓(xùn)練)該目標用戶的語言模型。在高級處,步驟340的實施例可以包括將個性化的概率知識源并入個性化的語言模型,例如通過根據(jù)對應(yīng)于在使用歷史中確定的實體或?qū)嶓w-實體對的查詢來訓(xùn)練語言模型(例如,N-gram)。通過首先訓(xùn)練用于該目標用戶的查詢的模型以及隨后將來自所有用戶的相同的實體或?qū)嶓w-實體對的查詢插入其中,可以針對目標用戶進一步訓(xùn)練語言模型??商娲兀蓪τ谀繕擞脩舻闹R源空間來訓(xùn)練全部用戶的語言模型,諸如通用語言模型(ULM)。在兩種情況下,來自目標用戶的知識源的權(quán)重可用于測量來自其它用戶的查詢的某N-gram的計數(shù),使得目標用戶的興趣或意圖仍得以表示。
在一個實施例中,可以分析與其它用戶相關(guān)聯(lián)的個性化知識圖。從這些個性化的知識圖中,可以將這些其它用戶中的一個或多個確定為具有與目標用戶相似的興趣和/或意圖,諸如通過與目標用戶具有共映射的實體和實體間關(guān)系。以此方式,與其它相似用戶相關(guān)聯(lián)的實體和/或用戶動作可以映射到目標用戶的個性化知識圖上。該增加了目標用戶的個性化知識圖而使得用戶的個性化語言模型更佳地適應(yīng)以改善話音識別。在一個實施例中,兩個用戶或用戶群組之間的興趣和/或意圖的相似度可通過將與每個用戶或群組相關(guān)聯(lián)的兩個概率知識圖空間比較來確定,其中每個空間是利用概率圖表示的。利用該相似度度量,可以評估插入權(quán)重以確定哪些權(quán)重將用于利用相似用戶的或用戶群組的源插入目標用戶的個性化知識源。
方法300的一些實施例包括通過采集、解析這些交互以及將這些交互映射到如上所述的知識源上,使用相似網(wǎng)絡(luò)中的社交網(wǎng)絡(luò)交互或其它用戶輸入用于語言模型個性化。在一些實施例中,知識源已經(jīng)針對目標用戶個性化并且可進一步通過映射社交網(wǎng)絡(luò)交互來個性化或擴展。在這些實施例中或者在目標用戶的個性化知識源基于與其它用戶的相似度來擴展的實施例中,其它類似的用戶或社交網(wǎng)絡(luò)朋友的語言模型能夠用于插入目標用戶的個性化語言模型。然后,假設(shè)社交網(wǎng)絡(luò)朋友將對目標用戶的未來查詢產(chǎn)生某些影響,則新的個性化語言模型可用于預(yù)測目標用戶的未來查詢。
現(xiàn)在參考圖4,提供了示出基于用戶歷史信息和來自相似用戶的信息來個性化特定目標用戶的語言模型的示范性的方法400的流程圖。個性化的語言模型可用于目標用戶的話音識別,例如通過預(yù)測目標用戶所提交的未來看不見的查詢。
在高級處,方法400的實施例可用于通過并入來自針對相似用戶和/或社交網(wǎng)絡(luò)朋友個性化的知識源的信息而“擴展”對目標用戶個性化的知識源。可以擴展個性化知識圖的一種方式是使用已知的個人關(guān)系。示例的關(guān)系可以包括三元組,比如“在<公司>工作”或者“是<聯(lián)系人>的父親”。然后,如先前的使用歷史所激活的網(wǎng)絡(luò)規(guī)模知識圖的子圖可擴充到該擴展后的個人知識圖。在這些實施例中,節(jié)點和邊(例如,知識圖的實體和實體間關(guān)系)關(guān)于使用歷史加權(quán),使得語言模型訓(xùn)練能夠立即受益。這些權(quán)重隨后可確定用于激活圖的該部分的N-gram的權(quán)重。此外,一旦用戶具有擴展后的個性化知識源,其它用戶的個性化知識源可用于增強目標用戶的知識源。例如,可以利用基于聯(lián)系頻率的在先權(quán)重,使用其它用戶的語言模型來調(diào)整目標用戶的語言模型。
類似地,可通過使用類似于目標用戶的其它用戶的知識源來擴展個性化知識源。例如,假設(shè)每個用戶具有個性化的語言模型,然后可以對于不同的用戶群體特點來創(chuàng)建語言模型,該個性化的語言模型可通過基于他們的使用歷史和元數(shù)據(jù)所確定的概率個性化知識源來提供,諸如結(jié)合圖3所描述的。在一個實施例中,可以通過將對應(yīng)于用戶的個性化知識源的語言模型聚類來確定相似用戶。可以應(yīng)用本領(lǐng)域技術(shù)人員所知的多種各類用于聚類的技術(shù)中的任一種。在一個實施例中,應(yīng)用自底向上聚類,其中關(guān)于某度量彼此最相似的一對語言模型迭代地合并(在一個實施例中,與相等的權(quán)重組合)。可以使用通常用于計算兩個概率分布之間的距離的對稱Kullback Leibler距離或者類似的度量。在另一實施例中,應(yīng)用K均值聚類,其中候選語言模型首先對于數(shù)量為N的聚類分成N個箱(bin)。利用其內(nèi)部的語言模型的非加權(quán)線性插值來計算語言模型。每個語言模型隨后移動到最相似的箱,也是利用一些距離或相似度度量。
作為補充的方法,在一些實施例中,除了詞匯信息之外,基于圖相似度的聚類方法能夠用于對個性化知識圖聚類從而確定具有相似的興趣或意圖的用戶群組。可依賴于用戶的動作模式的這些實施例導(dǎo)致語義上聚類的用戶。在一個實施例中,可以使用用于聚類數(shù)據(jù)庫條目的方法,諸如潛在語義索引(LSI)。在一些情況下,知識源是知識圖,圖能夠被展平為語義三元組的關(guān)系表(關(guān)系/實體對,諸如“Cameron-director-Avatar”)。在這些實施例中,不是對圖條目聚類,通過簡單表格變換基于它們對三元組的使用來對用戶聚類。一旦聚類被確定,則聚類可用于提供更平滑的語言模型,因為模型可利用更大數(shù)量的相似數(shù)據(jù)來訓(xùn)練。
繼續(xù)圖4,在步驟410中,從目標用戶的使用歷史中確定包括至少一個實體或至少一個用戶動作的第一組數(shù)據(jù)。至少一個實體可以包括一個或多個實體、實體-實體對或者對應(yīng)于知識源的實體關(guān)系。在一些實施例中,來自目標用戶的一個或多個個人信息源的使用歷史被分析以確定第一組數(shù)據(jù),并且在一些實施例中,從使用歷史中解析第一組數(shù)據(jù),如在圖3的步驟320中所描述的。
在步驟420中,將第一組數(shù)據(jù)映射到目標用戶的個性化知識源。在實施例中,知識源包括在映射第一組數(shù)據(jù)時被個性化的一般(非個性化)知識源??商娲兀诹硪粚嵤├?,第一組數(shù)據(jù)被映射到已經(jīng)針對目標用戶個性化的知識源上,諸如依照圖3的方法300所創(chuàng)建的個性化知識源。在實施例中,可以映射包含了至少一個實體或用戶動作的第一組數(shù)據(jù),如圖3的步驟330中所描述的。
在步驟430中,確定與目標用戶相似的一組用戶。在一個實施例中,通過諸如上述的聚類來確定一個或多個相似用戶。在一個實施例中,步驟430包括:對目標用戶的個性化知識源中的實體和實體間關(guān)系加權(quán)。該加權(quán)可以基于具體的實體和關(guān)系已經(jīng)從用戶歷史數(shù)據(jù)映射的次數(shù)??梢詫τ谄渌脩舻膫€性化知識源應(yīng)用相似的加權(quán)。如果在目標用戶的個性化知識源的具體部分中的實體和實體間關(guān)系具有與其它用戶的個性化知識源的同一部分中的相同的實體和實體間關(guān)系相似的權(quán)重(例如,符合加權(quán)值最小閾值),則可以確定目標用戶和其它用戶對知識圖的該部分中的主題具有相似的興趣。
在另一實施例中,使用知識源中的實體的流行度,而不是實體已經(jīng)被映射多少次的計數(shù)。例如,如果具體的實體對于目標用戶的社交網(wǎng)絡(luò)朋友的群組具有特別高的流行度(例如,其被頻繁地查詢,提及,在社交網(wǎng)站上發(fā)帖),則目標用戶也對該流行的實體感興趣的可能性增加。因此,目標用戶的個性化知識源可關(guān)于該實體擴展(如步驟440中所描述),并且可以包括特定用戶對個性化知識源的針對該實體的部分感興趣(或者可能感興趣)的指示。
在另一實施例中,目標用戶和其它用戶的興趣水平是利用目標用戶的個性化知識源和其它用戶的個性化知識源來確定的。例如,可以在相應(yīng)的知識源的第一部分中比較興趣水平以判定在用戶之間是否存在相似或重疊的興趣。在一個實例中,能夠判定所確定的興趣水平是否滿足最小閾值以及其它用戶的群組是否對知識源的第一部分具有與目標用戶的興趣水平可比較的興趣水平。雖然在一個實施例中存在一個用于確定用戶的興趣水平的閾值,但是在不同的實施例中,使用多于一個的閾值而使得例如可能存在低興趣水平閾值、中等興趣水平閾值、高興趣水平閾值等。在一個實施例中,包括與目標用戶共享相似興趣的一組用戶的用戶彼此具有共同的興趣。在本發(fā)明的范圍內(nèi)構(gòu)思本文沒有具體公開的用于確定用戶相似度的其它方法。
在步驟440中,將對應(yīng)于類似于目標用戶的一組用戶的第二組數(shù)據(jù)映射到目標用戶的個性化知識源,從而擴展目標用戶的個性化知識源。該第二組數(shù)據(jù)包括至少一個實體(包含實體-實體對或?qū)嶓w關(guān)系)或者用戶動作。在一些實施例中,從相似用戶的個性化知識源確定和提取第二組數(shù)據(jù)。在一個實施例中,第二組數(shù)據(jù)包括更頻繁地出現(xiàn)在該組相似用戶的個性化知識源中的實體信息和/或相關(guān)元數(shù)據(jù),其可以通過閾值來確定。在步驟450中,已經(jīng)擴展的目標用戶的個性化知識源用來個性化(或訓(xùn)練)目標用戶的語言模型。步驟450的實施例與結(jié)合方法300(圖3)的步驟340所描述的實施例相似。
轉(zhuǎn)到圖5,提供了示出用于擴展針對目標用戶個性化的知識圖的示范性的方法500的流程圖。擴展后的個性化的知識圖可用于將目標用戶的語言模型個性化。個性化的語言模型可用于目標用戶的話音識別,諸如通過預(yù)測目標用戶所提交的未來看不見的查詢。
在步驟510中,聚集來自與第一用戶相關(guān)聯(lián)的一個或多個個人源的使用歷史。使用歷史包括來自一個或多個個人源(例如結(jié)合圖1所描述的個人源109)的與第一用戶相關(guān)的數(shù)據(jù)。例如,第一用戶經(jīng)由用戶設(shè)備執(zhí)行的來自查詢記錄的過去的用戶查詢、網(wǎng)站交互、用戶動作等。
在步驟520中,從第一用戶的聚集的使用歷史中提取實體和用戶動作信息。實體和用戶動作信息可以包括一個或多個實體、實體-實體對、實體關(guān)系或者用戶動作有關(guān)的信息。在一個實施例中,從如方法300(圖3)的步驟320中描述的聚集的使用歷史來解析實體和用戶動作信息。
在步驟530中,在步驟520中提取的實體和用戶動作信息映射到與第一用戶相關(guān)聯(lián)的第一知識圖上,從而將用戶的第一知識圖個性化。在一個實施例中,在步驟530中所執(zhí)行的映射操作類似于在方法300(圖3)的步驟330中所描述的映射操作,其中知識源是知識圖。
在步驟540中,確定類似于第一用戶的第二用戶。在一個實施例中,步驟540包括:通過判定第二用戶的個性化的知識圖類似于第一用戶的個性化的知識圖,確定類似于第一用戶的第二用戶。在一個實施例中,第二用戶來自通過如方法400(圖4)的步驟430中所描述的聚類或其它方式所判定的一組相似用戶。如之前所述,基于所確定的第一用戶與第二用戶之間的相似度,能夠預(yù)測出第一用戶和第二用戶具有共享相似興趣和意圖的可能性。
在步驟550中,擴展第一用戶的個性化的知識圖以包含來自與步驟540中所確定的第二(相似)用戶相關(guān)聯(lián)的個性化的知識圖的信息。在實施例中,步驟550包括將來自第二用戶的個性化的知識圖的實體或用戶動作信息映射到第一用戶的個性化的知識圖上。步驟550的一些實施例類似于結(jié)合方法400(圖4)的步驟440所描述的實施例,其中知識源是知識圖。在一個實施例中,在擴展第一圖之前,第二個性化知識圖比第一個性化知識圖更發(fā)達(包含更多信息)。在方法500的一些實施例中,擴展后的個性化知識圖可用于將第一用戶的語言模型個性化,諸如在方法400(圖4)的步驟450中所描述的。
因此,我們已經(jīng)說明了涉及到通過針對具體用戶或用戶群體特點來調(diào)整語言模型所使用的知識源來改進用于話音識別的語言模型的系統(tǒng)和方法的技術(shù)的各個方面。特別地,通過并入特定用戶的個人使用歷史信息,針對該特定用戶個性化諸如知識圖的知識源。因此,經(jīng)由知識源來擴展使用歷史從而捕獲個人興趣且預(yù)測待用于個性化語言建模的看不見的語音查詢。
以類似的方式,SLU模型可適應(yīng)個性化知識源而用于自然語言理解系統(tǒng)(NLU)。例如,在用于創(chuàng)建個性化SLU模型的一個實施例中,可以從個性化知識源中確定相關(guān)的實體模式。這些模式可用于改進實體槽類型的預(yù)測,例如通過針對個性化知識源偏置或調(diào)整槽填充模型。
應(yīng)當理解的是,本文所描述的實施例的各個特征、子組合和變型例是實用的并且可用于不參考其它特征或子組合的其它實施例。而且,示例的方法300、400和500中所示的步驟的順序和序列不意在以任何方式限制本發(fā)明的范圍,實際上,步驟可以在其實施例內(nèi)以多種不同的序列出現(xiàn)。這些變型例及其組合也構(gòu)思于本發(fā)明的實施例的范圍之內(nèi)。
已經(jīng)描述了本發(fā)明的各個實施例,現(xiàn)在描述適合于實現(xiàn)本發(fā)明的實施例的示范性的計算環(huán)境。參考圖6,提供了示范性的計算設(shè)備,并且一般稱為計算設(shè)備600。計算設(shè)備600僅是適合的計算環(huán)境的一個示例,而不意在暗示對本發(fā)明的使用范圍或功能加以任何限制。計算設(shè)備600也不應(yīng)解釋為具有與圖示的組件中的任一個或組合有關(guān)的任何依賴性或要求。
在計算機代碼或機器可用指令的一般背景下描述了本發(fā)明的實施例,計算機代碼或機器可用指令包括通過計算機或諸如個人數(shù)據(jù)助理、智能電話、平板式PC或其它手持式設(shè)備的其它機器所執(zhí)行的計算機可用或計算機可執(zhí)行指令,諸如程序模塊。一般地,包含例程、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu)等在內(nèi)的程序模塊是指執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定的抽象數(shù)據(jù)類型的代碼。本發(fā)明的實施例可以實現(xiàn)在多種系統(tǒng)配置中,包括手持式設(shè)備、消費電子設(shè)備、通用計算機、更專業(yè)化的計算設(shè)備等。本發(fā)明的實施例還可以實現(xiàn)于分布式計算環(huán)境中,其中通過通信網(wǎng)鏈接的遠程處理設(shè)備執(zhí)行任務(wù)。在分布式計算環(huán)境中,程序模塊可以位于包含存儲器存儲設(shè)備的本地及遠程計算機存儲介質(zhì)中。
參考圖6,計算設(shè)備600包括直接或間接地耦合以下設(shè)備的總線610:存儲器612、一個或多個處理器614、一個或多個呈現(xiàn)組件616、一個或多個輸入/輸出(I/O)端口618、一個或多個I/O組件620以及示例性的電源622。總線610表示了一個或多個總線可以是何種總線(例如地址總線、數(shù)據(jù)總線或其組合)。雖然為了清晰起見用線示出了圖6的各個框,實際上,這些框表示邏輯的而不一定是真實的組件。例如,可以將諸如顯示設(shè)備的呈現(xiàn)組件視為I/O組件。而且,處理器具有存儲器。本發(fā)明的發(fā)明人認識到,這是本領(lǐng)域的本質(zhì)并且重申圖6的圖僅是示例說明能夠與本發(fā)明的一個或多個實施例結(jié)合使用的示范性的計算設(shè)備。不在諸如“工作站”、“服務(wù)器”、“膝上型設(shè)備”、“手持式設(shè)備”等類別之間做區(qū)分,因為都在圖1的范圍內(nèi)構(gòu)思并且參考了“計算設(shè)備”。
計算設(shè)備600典型地包括各種計算機可讀介質(zhì)。計算機可讀介質(zhì)可以是任何能夠由計算設(shè)備600訪問的可用介質(zhì)并且包括易失性和非易失性的介質(zhì)、可移除的和非可移除的介質(zhì)。通過示例而不是限制的方式,計算機可讀介質(zhì)可以包括計算機存儲介質(zhì)和通信介質(zhì)。計算機存儲介質(zhì)包括以用于諸如計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù)的信息的存儲的任何方法或技術(shù)實現(xiàn)的易失性和非易失性的、可移除的和非可移除的介質(zhì)。計算機存儲介質(zhì)包括但不限于RAM、ROM、EEPROM、閃存或其它存儲器技術(shù)、CD-ROM、數(shù)字多功能盤(DVD)或其它光盤存儲設(shè)備、磁盒、磁帶、磁盤存儲設(shè)備或其它磁存儲設(shè)備或任何其它能夠用來存儲所需的信息且能夠由計算設(shè)備600訪問的介質(zhì)。計算機存儲介質(zhì)不包括信號本身。通信介質(zhì)通常具體實施計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或調(diào)制數(shù)據(jù)信號中的其它數(shù)據(jù),如載波或其它傳輸機制,并且包括任何信息輸送介質(zhì)。術(shù)語“調(diào)制數(shù)據(jù)信號”可以是指使其一個或多個特性以將信息編碼在信號中的方式來設(shè)定或改變的信號。通過示例而不是限制的方式,通信介質(zhì)包括諸如有線網(wǎng)或直接接線連接的有線介質(zhì)以及諸如聲波、RF、紅外和其它無線介質(zhì)的無線介質(zhì)。上述任意的組合也應(yīng)當包含在計算機可讀介質(zhì)的范圍內(nèi)。
存儲器612包括易失性和/或非易失性存儲器形式的計算機存儲介質(zhì)。存儲器可以是可移除的、非可移除的或者其組合。示范性的硬件設(shè)備包括固態(tài)存儲器、硬盤、光盤驅(qū)動器等。計算設(shè)備600包括一個或多個處理器614,其從諸如存儲器612或I/O組件620的各種實體讀取數(shù)據(jù)。呈現(xiàn)組件616向用戶或其它設(shè)備呈現(xiàn)數(shù)據(jù)指示。示范性的呈現(xiàn)組件包括顯示設(shè)備、揚聲器、打印組件、振動組件等。
I/O端口618允許計算設(shè)備600與包括I/O組件620的其它設(shè)備邏輯耦合,其中一些可內(nèi)置于計算設(shè)備600內(nèi)。示例性的組件包括麥克風(fēng)、操縱桿、游戲板、衛(wèi)星盤、掃描儀、打印機、通信組件(例如,網(wǎng)絡(luò)通信組件、無線電或無線通信組件或類似組件)等。I/O組件620可以提供處理由用戶生成的懸浮手勢、語音或其它生理輸入的自然用戶接口(NUI)。在一些實例中,輸入可以發(fā)送給適當?shù)木W(wǎng)絡(luò)元件以進行進一步處理。NUI可以實現(xiàn)話音識別、觸摸與觸針識別、面部識別、生物計量識別、在屏幕上的以及鄰近屏幕的姿勢識別、懸浮手勢、頭與眼跟蹤以及與計算設(shè)備600上的顯示相關(guān)聯(lián)的觸摸識別的任意組合。計算設(shè)備600可配備有深度照相機,諸如立體照相機系統(tǒng)、紅外照相機系統(tǒng)、RGB照相機系統(tǒng)以及這些的組合,用于姿勢檢測和識別。另外地,計算設(shè)備600可以配備有實現(xiàn)運動檢測的加速度計或陀螺儀。加速度計或陀螺儀的輸出可提供給計算設(shè)備600的顯示器以渲染沉浸式增強現(xiàn)實或虛擬現(xiàn)實。
所描繪的各個組件以及沒有示出的組件的多種不同的布置是可能的,而不背離下文的權(quán)利要求的范圍。為了示例而不是限制的意圖描述了本發(fā)明的實施例。在閱讀本公開后以及由于閱讀了本公開,可替代的實施例對于本公開的讀者而言是顯然的。實現(xiàn)上文的可替代的方式能夠完成,而不背離下文的權(quán)利要求的范圍。一些特征和子組合是實用的并且可在不參考其它特征和子組合的情況下采用并且是在權(quán)利要求的范圍內(nèi)構(gòu)思的。
因此,在一個方面,本發(fā)明的實施例涉及其中具體實施有計算機可執(zhí)行指令的一個或多個計算機可讀介質(zhì),當由具有處理器和存儲器的計算系統(tǒng)執(zhí)行時,所述計算機可執(zhí)行指令使得計算系統(tǒng)執(zhí)行用于基于用戶歷史信息個性化特定的目標用戶的語言模型的方法。該方法包括:接收來自一個或多個源的目標用戶的使用歷史信息,解析使用歷史信息以確定實體或用戶動作中的一個或多個,以及將實體或用戶動作中的一個或多個映射到知識源,諸如知識圖,從而創(chuàng)建個性化知識源。在一個實施例中,該方法還包括使用個性化知識源來個性化目標用戶的語言模型。
在另一方面,提供了其中具體實施了計算機可執(zhí)行指令的一個或多個計算機可讀介質(zhì),當由具有處理器和存儲器的計算系統(tǒng)執(zhí)行時,所述計算機可執(zhí)行指令使得計算系統(tǒng)執(zhí)行用于將特定目標用戶的語言模型個性化的方法。該方法包括從與目標用戶相關(guān)聯(lián)的使用歷史中確定第一組數(shù)據(jù),該第一組數(shù)據(jù)包括至少一個實體或用戶動作,以及將第一組數(shù)據(jù)映射到目標用戶的個性化知識源。該方法還包括:確定類似于目標用戶的一組用戶,以及將第二組數(shù)據(jù)映射到該目標用戶的個性化知識源,第二組數(shù)據(jù)包括對應(yīng)于與目標用戶相似的一組用戶的至少一個實體或用戶動作,從而創(chuàng)建擴展的個性化知識源。在一個實施例中,該方法還包括使用擴展的個性化知識源來個性化該特定用戶的語言模型。
在又一方面中,本發(fā)明的實施例涉及其中具體實施有計算機可執(zhí)行指令的一個或多個計算機可讀介質(zhì),當由具有處理器和存儲器的計算系統(tǒng)執(zhí)行時,所述計算機可執(zhí)行指令使所述計算系統(tǒng)執(zhí)行用于擴展針對目標用戶個性化的知識圖的方法。該方法包括:聚集來自一個或多個源的第一用戶的使用歷史,從使用歷史中提取實體和用戶動作信息,以及將提取的實體和用戶動作信息映射到第一用戶的第一知識圖上,從而創(chuàng)建第一個性化知識圖。該方法還包括:確定與第一用戶相似的第二用戶,以及利用來自第二用戶的第二個性化知識圖的信息來擴展第一個性化知識圖。在實施例中,該方法還包括:使用擴展的第一個性化知識圖來個性化第一用戶的語言模型。