專利名稱:信息導(dǎo)航的實現(xiàn)方法、信息導(dǎo)航服務(wù)器和信息處理系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本申請涉及信息處理技術(shù),尤其涉及信息導(dǎo)航(Guided Search)的實現(xiàn)方法、信息導(dǎo)航服務(wù)器和信息處理系統(tǒng)。
背景技術(shù):
在信息處理領(lǐng)域中,經(jīng)常會出現(xiàn)這樣的情形,S卩用戶在客戶端輸入文字,希望得到與輸入的文字相關(guān)的信息,信息導(dǎo)航服務(wù)器獲得客戶端提供的文字后,對文字進行分析, 識別用戶的查詢意圖,向客戶端提供與用戶輸入的文字相關(guān)的信息,縮小用戶的查詢范圍, 以使用戶盡快找到需要的信息。
目前,信息導(dǎo)航服務(wù)器一般會預(yù)先存儲查詢信息與導(dǎo)航信息之間映射關(guān)系的映射表。查詢信息例如是用戶在客戶端輸入的文字,導(dǎo)航信息例如是與用戶輸入的文字相關(guān)的信息。信息導(dǎo)航服務(wù)器獲得查詢信息后,在映射表中查找與查詢信息對應(yīng)的導(dǎo)航信息,如果在映射表中查找到與查詢信息對應(yīng)的導(dǎo)航信息,則將查找到的導(dǎo)航信息發(fā)送給客戶端。
在對現(xiàn)有技術(shù)的研究和實踐過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中存在以下問題在上述的信息導(dǎo)航技術(shù)中,只有在用戶輸入的查詢信息與上述映射表中的查詢信息完全一致的情況下,信息導(dǎo)航服務(wù)器才會在上述映射表中查找到與用戶輸入的查詢信息對應(yīng)的導(dǎo)航信息,并將查找到的導(dǎo)航信息發(fā)送給客戶端。如果用戶輸入的查詢信息與上述映射表中的任何一個查詢信息都不一致,那么信息導(dǎo)航服務(wù)器在上述映射表中無法查找到與用戶輸入的查詢信息對應(yīng)的導(dǎo)航信息,當(dāng)然也不會向客戶端發(fā)送導(dǎo)航信息。所以,在現(xiàn)有的信息導(dǎo)航技術(shù)中,信息導(dǎo)航服務(wù)器無法為客戶端提供與映射表中不存在的查詢信息對應(yīng)的導(dǎo)航信息。
發(fā)明內(nèi)容
本申請實施例的目的是提供信息導(dǎo)航的實現(xiàn)方法、信息導(dǎo)航服務(wù)器和信息處理系統(tǒng),用以解決信息導(dǎo)航服務(wù)器無法為客戶端提供與映射表中不存在的查詢信息對應(yīng)的導(dǎo)航 fn息ο 為解決上述技術(shù)問題,本申請實施例提供了一種信息導(dǎo)航的實現(xiàn)方法,適用于包括信息導(dǎo)航服務(wù)器的信息處理系統(tǒng),所述信息導(dǎo)航服務(wù)器用于根據(jù)客戶端發(fā)送的查詢信息查詢導(dǎo)航信息,所述信息導(dǎo)航服務(wù)器存儲有記錄查詢信息與導(dǎo)航信息之間映射關(guān)系的映射表,所述方法是這樣實現(xiàn)的信息導(dǎo)航服務(wù)器獲得客戶端提供的查詢信息;所述信息導(dǎo)航服務(wù)器通過模式提取算法對所述查詢信息進行分析,得到至少一個模式,所述模式為從所述查詢信息中提取的信息或?qū)λ霾樵冃畔⑦M行語義轉(zhuǎn)換后獲得的信息,所述模式用于表征所述查詢信息;所述信息導(dǎo)航服務(wù)器如果得到多個模式,則計算每個模式的相似度,所述模式的相似度用于表示模式與所述查詢信息之間的相似程度;所述信息導(dǎo)航服務(wù)器按照相似度高低的順序,對所有的模式進行排序;所述信息導(dǎo)航服務(wù)器按照所述排序,將模式作為關(guān)鍵詞,在所述映射表中查找與模式對應(yīng)的導(dǎo)航信息;所述信息導(dǎo)航服務(wù)器將查找到的導(dǎo)航信息發(fā)送給客戶端。
為解決上述技術(shù)問題,本申請實施例還提供了一種信息導(dǎo)航服務(wù)器,適用于包括信息導(dǎo)航服務(wù)器的信息處理系統(tǒng),所述信息導(dǎo)航服務(wù)器用于根據(jù)客戶端發(fā)送的查詢信息查詢導(dǎo)航信息,所述信息導(dǎo)航服務(wù)器包括存儲單元,用于存儲記錄查詢信息與導(dǎo)航信息之間映射關(guān)系的映射表;獲得單元,用于獲得客戶端提供的查詢信息;分析單元,用于通過模式提取算法對所述查詢信息進行分析,得到至少一個模式,所述模式為從所述查詢信息中提取的信息或?qū)λ霾樵冃畔⑦M行語義轉(zhuǎn)換后獲得的信息,所述模式用于表征所述查詢信息;計算單元,用于在所述分析單元得到多個模式時,計算每個模式的相似度,所述模式的相似度用于表示模式與所述查詢信息之間的相似程度;排序單元,用于按照相似度高低的順序,對所有的模式進行排序;查找單元,用于按照所述排序,將模式作為關(guān)鍵詞,在所述映射表中查找與模式對應(yīng)的導(dǎo)航信息;發(fā)送單元,用于將查找到的導(dǎo)航信息發(fā)送給客戶端。
為解決上述技術(shù)問題,本申請實施例還提供了一種信息處理系統(tǒng),包括信息導(dǎo)航服務(wù)器;所述信息導(dǎo)航服務(wù)器用于獲得客戶端提供的查詢信息;通過模式提取算法對所述查詢信息進行分析,得到至少一個模式,所述模式為從所述查詢信息中提取的信息或?qū)λ霾樵冃畔⑦M行語義轉(zhuǎn)換后獲得的信息,所述模式用于表征所述查詢信息;如果得到多個模式,則計算每個模式的相似度,所述模式的相似度用于表示模式與所述查詢信息之間的相似程度;按照相似度高低的順序,對所有的模式進行排序;按照所述排序,將模式作為關(guān)鍵詞,在所述映射表中查找與模式對應(yīng)的導(dǎo)航信息,將查找到的導(dǎo)航信息發(fā)送給客戶端。
為解決上述技術(shù)問題,本申請實施例還提供了一種信息導(dǎo)航的實現(xiàn)方法,適用于包括信息導(dǎo)航服務(wù)器的信息處理系統(tǒng),所述信息導(dǎo)航服務(wù)器用于根據(jù)客戶端發(fā)送的查詢信息查詢導(dǎo)航信息,所述信息導(dǎo)航服務(wù)器存儲有記錄查詢信息與導(dǎo)航信息之間映射關(guān)系的映射表,所述方法包括信息導(dǎo)航服務(wù)器獲得客戶端提供的查詢信息;所述信息導(dǎo)航服務(wù)器使用方式(1)查找與所述查詢信息對應(yīng)的導(dǎo)航信息,并采用機器學(xué)習(xí)方式預(yù)測到與所述查詢信息對應(yīng)的導(dǎo)航信息;所述信息導(dǎo)航服務(wù)器如果使用方式(1)查找到與所述查詢信息對應(yīng)的導(dǎo)航信息,則根據(jù)兩種方式得到的導(dǎo)航信息,確定提供給客戶端的導(dǎo)航信息,并將確定提供給客戶端的導(dǎo)航信息發(fā)送給客戶端;其中,所述方式(1)包括所述信息導(dǎo)航服務(wù)器通過模式提取算法對所述查詢信息進行分析,得到至少一個模式,所述模式為從所述查詢信息中提取的信息或?qū)λ霾樵冃畔⑦M行語義轉(zhuǎn)換后獲得的信息,所述模式用于表征所述查詢信息;所述信息導(dǎo)航服務(wù)器如果得到多個模式,則計算每個模式的相似度,所述模式的相似度用于表示模式與所述查詢信息之間的相似程度;所述信息導(dǎo)航服務(wù)器按照相似度高低的順序,對所有的模式進行排序;所述信息導(dǎo)航服務(wù)器按照所述排序,將模式作為關(guān)鍵詞, 在所述映射表中查找與模式對應(yīng)的導(dǎo)航信息。
為解決上述技術(shù)問題,本申請實施例還提供了一種信息導(dǎo)航服務(wù)器,適用于包括信息導(dǎo)航服務(wù)器的信息處理系統(tǒng),所述信息導(dǎo)航服務(wù)器用于根據(jù)客戶端發(fā)送的查詢信息查詢導(dǎo)航信息,所述信息導(dǎo)航服務(wù)器包括存儲單元,用于存儲記錄查詢信息與導(dǎo)航信息之間映射關(guān)系的映射表;獲得單元,用于獲得客戶端提供的查詢信息;第一查找單元,用于使用方式(1)查找與所述查詢信息對應(yīng)的導(dǎo)航信息;第二查找單元,采用機器學(xué)習(xí)方式預(yù)測到與所述查詢信息對應(yīng)的導(dǎo)航信息;導(dǎo)航信息確定單元,用于如果所述第一查找單元使用方式(1)查找到與所述查詢信息對應(yīng)的導(dǎo)航信息,則根據(jù)所述第一查找單元得到的導(dǎo)航信息和所述第二查找單元得到的導(dǎo)航信息,確定提供給客戶端的導(dǎo)航信息;發(fā)送單元,用于將確定提供給客戶端的導(dǎo)航信息發(fā)送給客戶端;所述方式(1)包括通過模式提取算法對所述查詢信息進行分析,得到至少一個模式,所述模式為從所述查詢信息中提取的信息或?qū)λ霾樵冃畔⑦M行語義轉(zhuǎn)換后獲得的信息,所述模式用于表征所述查詢信息;如果得到多個模式,則計算每個模式的相似度,所述模式的相似度用于表示模式與所述查詢信息之間的相似程度;按照相似度高低的順序,對所有的模式進行排序;按照所述排序,將模式作為關(guān)鍵詞,在所述映射表中查找與模式對應(yīng)的導(dǎo)航信息。
為解決上述技術(shù)問題,本申請實施例還提供了一種信息處理系統(tǒng),包括客戶端及信息導(dǎo)航服務(wù)器;所述客戶端用于與所述信息導(dǎo)航服務(wù)器交互信息;所述信息導(dǎo)航服務(wù)器用于獲得客戶端提供的查詢信息,使用方式(1)查找與所述查詢信息對應(yīng)的導(dǎo)航信息,并采用機器學(xué)習(xí)方式預(yù)測到與所述查詢信息對應(yīng)的導(dǎo)航信息,如果使用方式(1)查找到與所述查詢信息對應(yīng)的導(dǎo)航信息,則根據(jù)所述方式(1)和機器學(xué)習(xí)方式兩種方式得到的導(dǎo)航信息,確定提供給客戶端的導(dǎo)航信息,并將確定提供給客戶端的導(dǎo)航信息發(fā)送給客戶端;所述方式(1)包括通過模式提取算法對所述查詢信息進行分析,得到至少一個模式,所述模式為從所述查詢信息中提取的信息或?qū)λ霾樵冃畔⑦M行語義轉(zhuǎn)換后獲得的信息,所述模式用于表征所述查詢信息;如果得到多個模式,則計算每個模式的相似度,所述模式的相似度用于表示模式與所述查詢信息之間的相似程度;按照相似度高低的順序,對所有的模式進行排序;按照所述排序,將模式作為關(guān)鍵詞,在記錄查詢信息與導(dǎo)航信息之間映射關(guān)系的映射表中查找與模式對應(yīng)的導(dǎo)航信息。
可見,本申請實施例中,信息導(dǎo)航服務(wù)器在獲得客戶端提供的查詢信息后,可以通過模式提取算法對所述查詢信息進行分析,得到至少一個模式,如果得到多個模式,則計算每個模式的相似度,按照相似度高低的順序,對所有的模式進行排序,再按照所述排序,將模式作為關(guān)鍵詞,在記錄查詢信息與導(dǎo)航信息之間映射關(guān)系的映射表中查找與模式對應(yīng)的導(dǎo)航信息。這種情況下,即使從客戶端獲得的查詢信息在映射表中不存在,那么由于模式可能會在映射表中存在,所以也有可能查找到合適的導(dǎo)航信息,解決了信息導(dǎo)航服務(wù)器無法為客戶端提供與映射表中不存在的查詢信息對應(yīng)的導(dǎo)航信息。
為了更清楚地說明本申請實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請中記載的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下, 還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本申請實施例應(yīng)用的網(wǎng)絡(luò)環(huán)境示意圖; 圖2為本申請實施例的一種信息導(dǎo)航的實現(xiàn)方法的流程圖; 圖3為本申請實施例的一種信息導(dǎo)航服務(wù)器的邏輯結(jié)構(gòu)示意圖; 圖4為本申請實施例的另一種信息導(dǎo)航的實現(xiàn)方法的流程圖; 圖5為本申請實施例的另一種信息導(dǎo)航服務(wù)器的邏輯結(jié)構(gòu)示意圖。
具體實施例方式本申請實施例提供一種信息導(dǎo)航的實現(xiàn)方法、信息導(dǎo)航服務(wù)器和信息處理系統(tǒng)。
在介紹信息導(dǎo)航的實現(xiàn)方法、信息導(dǎo)航服務(wù)器和信息處理系統(tǒng)之前,首先介紹本申請實施例應(yīng)用的網(wǎng)絡(luò)環(huán)境和涉及的一些專業(yè)知識。
本申請實施例應(yīng)用的網(wǎng)絡(luò)環(huán)境如圖1所示。客戶端102與具有信息導(dǎo)航功能的信息導(dǎo)航服務(wù)器101之間可以交互信息??蛻舳?02可以將用戶輸入的查詢信息發(fā)給信息導(dǎo)航服務(wù)器101,信息導(dǎo)航服務(wù)器101根據(jù)查詢信息查找對應(yīng)的導(dǎo)航信息,如果找到對應(yīng)的導(dǎo)航信息,則將查找到的導(dǎo)航信息發(fā)送給客戶端102,客戶端102向用戶展示導(dǎo)航信息。
查詢信息可以是指用戶在客戶端輸入的需要查詢的信息。查詢信息可以包括文字、數(shù)字、符號、字母等元素。在實際應(yīng)用中,查詢信息例如是產(chǎn)品的名稱、型號等信息。
導(dǎo)航信息可以是指具有導(dǎo)航作用的信息,便于用戶快速的找到需要的信息。導(dǎo)航信息也可以包括文字、數(shù)字、符號、字母等元素。在實際應(yīng)用中,導(dǎo)航信息例如是產(chǎn)品所屬的類目等信息。例如,如果查詢信息是“Nokia N95”(產(chǎn)品的型號),那么導(dǎo)航信息可以是“手機”(類目)。
在實際應(yīng)用中,一個查詢信息可以只對應(yīng)一個導(dǎo)航信息,例如,“NokiaN95”可以只對應(yīng)“手機”這個類目;一個查詢信息也可以對應(yīng)多個導(dǎo)航信息,例如,“Nokia N95”可以對應(yīng)“手機”、“電子產(chǎn)品”等多個類目;多個查詢信息可以對應(yīng)同一個導(dǎo)航信息,例如,“Nokia N95”和“Moto A1800”都可以對應(yīng)“手機”這個類目。
本申請的所有實施例都適用于包括信息導(dǎo)航服務(wù)器的信息處理系統(tǒng),信息導(dǎo)航服務(wù)器用于根據(jù)客戶端發(fā)送的查詢信息查詢導(dǎo)航信息,信息導(dǎo)航服務(wù)器存儲有記錄查詢信息與導(dǎo)航信息之間映射關(guān)系的映射表。
下面對本申請實施例的一種信息導(dǎo)航的實現(xiàn)方法進行說明。如圖2所示,這種方法包括 S201 信息導(dǎo)航服務(wù)器獲得客戶端提供的查詢信息。
用戶在客戶端輸入查詢信息,客戶端可以將查詢信息發(fā)送給信息導(dǎo)航服務(wù)器,這樣,信息導(dǎo)航服務(wù)器就獲得了客戶端提供的查詢信息。
S202 所述信息導(dǎo)航服務(wù)器通過模式提取算法對所述查詢信息進行分析,得到至少一個模式,所述模式為從所述查詢信息中提取的信息或?qū)λ霾樵冃畔⑦M行語義轉(zhuǎn)換后獲得的信息,所述模式用于表征所述查詢信息。
模式提取算法包括對查詢信息進行分析的步驟、信息提取的規(guī)則等。模式提取算法通常會結(jié)合自然語言處理技術(shù),例如句法分析、長度為N的短語(N-Gram)、丟詞短語 (Skip-Gram)(來源于rouge評測標(biāo)準(zhǔn))等。模式提取算法可以預(yù)先存儲在信息導(dǎo)航服務(wù)器中。信息導(dǎo)航服務(wù)器獲得查詢信息后,可以查找預(yù)先存儲的模式提取算法,并根據(jù)模式提取算法對查詢信息進行分析。
信息導(dǎo)航服務(wù)器對查詢信息進行分析,主要是獲得至少一個模式。模式可以是指從查詢信息中提取的信息,模式可以用于表征查詢信息,合適的模式可以不失去查詢信息的語義,或者盡量不失去查詢信息的語義。模式可以是查詢信息的組成部分,例如,假設(shè)查詢信息是 “car mp3 player with fm transmitter911”,那么模式可以是“car mp3 player”、"car player”。模式也可以是由查詢信息轉(zhuǎn)換過來的信息,例如,假設(shè)查詢信息是 "Nokia N95”,那么模式可以是“諾基亞手機”。
在實際應(yīng)用中,模式提取算法可以根據(jù)實際需要而包括不同的信息,這種情況下,信息導(dǎo)航服務(wù)器可以按照多種方式對查詢信息進行分析,得到至少一個模式。
例如,如果模式提取算法指明可以從查詢信息中提取出中心詞和/或中心短語, 那么信息導(dǎo)航服務(wù)器在對查詢信息進行分析時,就需要提取出中心詞和/或中心短語作為查詢信息的模式。中心詞是表征查詢信息的基本含義的詞,中心短語是表征查詢信息的基本含義的短語。以查詢信息“car mp3 player withfm transmitter 911”為例,信息導(dǎo)航服務(wù)器可以從這個查詢信息中提取出中心詞為“player”,提取出中心短語為“mp3 player", 當(dāng)然,提取出的中心短語也可以是“car mp3 player”,一般來說,提取的中心詞的數(shù)量是一個,提取的中心短語的數(shù)量也是一個。
例如,如果模式提取算法指明可以從查詢信息中提取出指定長度的短語作為查詢信息的模式,那么信息導(dǎo)航服務(wù)器在對查詢信息進行分析時,就需要提取出指定長度的短語。短語的長度是指短語包括的詞的數(shù)量。具體的,信息導(dǎo)航服務(wù)器可以通過丟詞的方式提取指定長度的短語,在丟詞過程中,所丟詞的位置可以不相鄰。例如,以查詢信息“car mp3 player with fm transmitter 911”為例,信息導(dǎo)航服務(wù)器可以連續(xù)丟掉“with”、“fm,,、 “transmitter”、^”,提取出“car mp3 player”作為模式,信息導(dǎo)航服務(wù)器也可以分別丟掉 “fm”和 “911”,提取出 “car mp3 player with transmitter”。
一般來說,提取出的短語都包括中心詞或中心短語,所以,提取出的指定長度的短語可以包括中心詞或中心短語。以查詢信息“car mp3 player with fmtransmitter 911” 為例,假設(shè)中心詞是“player”,信息導(dǎo)航服務(wù)器可以從這個查詢信息中提取出長度為2的短語,長度為2的短語例如是“mp3 player”等短語,信息導(dǎo)航服務(wù)器也可以從這個查詢信息中提取出長度為3的短語,長度為3的短語例如是“car mp3 player”等短語。
再例如,如果模式提取算法要求對查詢信息進行語義轉(zhuǎn)換,那么信息導(dǎo)航服務(wù)器在對查詢信息進行分析時,就需要對查詢信息進行語義轉(zhuǎn)換。以查詢信息“Nokia N95”為例,信息導(dǎo)航服務(wù)器可以將“Nokia N95”轉(zhuǎn)換為“諾基亞手機”等模式。
當(dāng)然,不同的模式提取算法會定義不同的查詢信息分析方式,這里不再一一舉例說明。
S203:所述信息導(dǎo)航服務(wù)器如果得到多個模式,則計算每個模式的相似度,所述模式的相似度用于表示模式與所述查詢信息之間的相似程度。
在實際應(yīng)用中,信息導(dǎo)航服務(wù)器可以通過多種方式計算每個模式的相似度。
例如,對于一個模式,信息導(dǎo)航服務(wù)器可以計算這個模式相對于查詢信息丟掉每一個詞的情況下所得的分?jǐn)?shù)。之后,計算上述所有分?jǐn)?shù)之和,這個分?jǐn)?shù)之和就是這個模式的相似度。信息導(dǎo)航服務(wù)器在計算這個模式相對于查詢信息丟掉一個詞的情況下所得的分?jǐn)?shù)時,可以首先判斷丟掉的這個詞的詞性,從預(yù)先設(shè)置的記錄詞性與分值之間映射關(guān)系的映射表中查找與這個詞的詞性對應(yīng)的分值,與這個詞的詞性對應(yīng)的分值為第一分值;信息導(dǎo)航服務(wù)器也可以計算這個詞在查詢信息中的位置與中心詞在查詢信息中的位置之間的距離的得分,這個詞在查詢信息中的位置與中心詞在查詢信息中的位置之間的距離的得分為第二分值;信息導(dǎo)航服務(wù)器還可以計算這個詞在查詢信息中的位置與中心短語在查詢信息中的位置之間的距離的得分,這個詞在查詢信息中的位置與中心短語在查詢信息中的位置之間的距離的得分為第三分值;之后,信息導(dǎo)航服務(wù)器根據(jù)預(yù)先設(shè)置的分值算法,對第一分值、第二分值及第三分值進行計算,計算結(jié)果為這個模式相對于查詢信息丟掉一個詞的情況下所得的分?jǐn)?shù)。在實際應(yīng)用中,本領(lǐng)域技術(shù)人員可以根據(jù)實際需要設(shè)計出多種分值算法。例如,計算第一分值、第二分值及第三分值的平均值;例如,計算任意兩個分值的平均值;例如,計算任意兩個分值的平均值后,再與剩余的一個平均值相加或相乘。當(dāng)然,分值算法還可以是其他形式的算法,這里不再一一舉例說明。
需要說明的是,信息導(dǎo)航服務(wù)器計算第一分值、計算第二分值和計算第三分值這三個步驟之間沒有必然的先后順序關(guān)系,也就是說,信息導(dǎo)航服務(wù)器先計算哪個分值都可以。
為使本領(lǐng)域技術(shù)人員更加清楚的理解上述計算一個模式的相似度的方法,下面以查詢信息“wl w2 w3 w4 w5 w6”、其中的一個模式“w3 w5 w6”、中心短語“w4 w5 w6”、中心詞 6”為例,對上述計算一個模式的相似度的方法再次進行說明,其中,“wl”、“w2”、“w3”、 “w4”、“w5”、“w6”分別代表查詢信息中的6個詞。
對于模式“w3 w5 w6”,其相對于查詢信息“wl w2 w3 w4 w5 6”丟掉的詞為“《1”、 “w2,,、“w4,,。模式 3 w5 w6”丟掉“wl”、“w2”、“w4”的計算方法分別如下: (1)計算模式 3 w5 w6"丟掉wl情況下的得分 假設(shè)wl為副詞,在詞性與分值對應(yīng)的映射表中,副詞對應(yīng)0.2分,那么通過查表, 可以得到fp。s = 0.2; 丟掉的詞在查詢信息中的位置與中心詞在查詢信息中的位置之間的距離的得分的計算公式為fdw= 1-((1-1)*λ,d表示丟掉的詞在查詢信息中的位置與中心詞在查詢信息中的位置之間的距離,這里的λ表示fdw在fp。s、fdw*fdp中的權(quán)重。對于wl,wl在查詢信息中的位置與w6(中心詞)在查詢信息中的位置之間的距離為5,假設(shè)λ為0.0002,這種情況下,fdw = l-(d-l)*A = l-(5-l)*0. 0002 = 0. 9992。
丟掉的詞在查詢信息中的位置與中心短語在查詢信息中的位置之間的距離的得分的計算公式為fdp= 1-(1*λ,d表示丟掉的詞在查詢信息中的位置與中心短語的中間詞在查詢信息中的位置之間的距離,這里的λ表示fdp在fp。s、fdw*fdp中的權(quán)重。需要說明的是,在實際應(yīng)用中,有些中心短語沒有實際的中間詞,例如,中心短語“mp3 player”沒有中間詞,這種情況下,丟掉的詞在查詢信息中的位置與中心短語的中間詞在查詢信息中的位置之間的距離可以按照這種方式來計算,即,先計算中心短語的最后一個詞在查詢信息中的位置與中心短語的第一個詞在查詢信息中的位置之間的差值,將差值除以2后取上限的整數(shù),再將第一個詞在查詢信息中的位置與所述取上限的整數(shù)相加,之后,再減去丟掉的詞在查詢信息中的位置,最后,取絕對值。例如,假設(shè)查詢信息為“car mp3 player with fm transmitter 911”,中心短語為“mp3 player”,再假設(shè)丟掉的詞為car,那么“car”與“mp3 player"的中間詞之間的距離是| 2+((3-2)/2取上限整數(shù))_11 = 2。
對于wl,wl在查詢信息中的位置與w5(中心短語的中間詞)在查詢信息中的位置之間的距離為4,假設(shè)λ為0. 0001,這種情況下,fdp = 1-(1*λ = 1-4*0. 0001 = 0. 9996。
一個模式丟掉一個詞的情況下的得分的計算公式為score = (fp。s+fdw+fdp)/3,模式"w3 w5 w6,,丟掉 wl 的得分為 scorel = (0. 2+0. 9992+0. 9996)/3 = 0. 73290 (2)計算模式 3 w5 w6"丟掉w2情況下的得分 假設(shè)w2為名詞,在詞性與分值對應(yīng)的映射表中,名詞對應(yīng)1分,那么通過查表,可以得到fp。s = 1 ; w2在查詢信息中的位置與w6(中心詞)在查詢信息中的位置之間的距離為4,假設(shè)人為 0. 0002,這種情況下,fdw = l-(d-l)*A = 1-(4-1)^0. 0002 = 0. 99940 w2在查詢信息中的位置與w5 (中心短語的中間詞)在查詢信息中的位置之間的距離為 4,假設(shè) λ 為 0. 0001,這種情況下,fdp = l-d*A = 1-3*0. 0001 = 0. 9997。
模式“w3 w5 w6” 丟掉 w2 的得分為 score2 = (1+0. 9994+0. 9997)/3 = 0. 9997。
(3)計算模式 3 w5 w6"丟掉w4情況下的得分 假設(shè)w4為形容詞,在詞性與分值對應(yīng)的映射表中,形容詞對應(yīng)0. 6分,那么通過查表,可以得到fp。s = 0.6; w4在查詢信息中的位置與w6(中心詞)在查詢信息中的位置之間的距離為2,假設(shè)人為 0. 0002,這種情況下,fdw = l-(d-l)*A = 1-(2-1)^0. 0002 = 0. 99980 w4在查詢信息中的位置與w5 (中心短語的中間詞)在查詢信息中的位置之間的距離為 1,假設(shè) λ 為 0. 0001,這種情況下,fdp = 1-(1*λ = 1-1*0. 0001 = 0. 9999。
模式“w3w5 w6”丟掉 w4 的得分為 score2 = (0· 6+0. 9998+0. 9999)/3 = 0. 8666。
綜合上述(1)、O)、(3),查詢信息 3 w5 w6"的得分為score = scorel+score2+score3 = 0. 7329+0. 9997+0. 8666 = 2. 5992。
當(dāng)然,信息導(dǎo)航服務(wù)器還可以通過其他方式計算每個模式的相似度,例如,計算模式相對于查詢信息丟掉的詞的數(shù)量,每丟掉一個詞可以記為1分,得分越多,相似度越低。 對于計算每個模式的相似度的其他方式,這里不再一一舉例說明。
S204 所述信息導(dǎo)航服務(wù)器按照相似度高低的順序,對所有的模式進行排序。
在實際應(yīng)用中,信息導(dǎo)航服務(wù)器既可以按照相似度由高到低的順序,對所有的模式進行排序,還可以按照相似度由低到高的順序,對所有的模式進行排序。
以查詢信息“car mp3 player with fm transmitter 911”為例,假設(shè)信息導(dǎo)航服務(wù)器提取出的模式是“player”(中心詞)、“mp3 player”(中心短語),"car mp3player”(指定長度的短語)和“car mp3 player with transmitter”(丟詞短語),假設(shè)相似度用分值來表示,再假設(shè)分值越高,相似度越高,信息導(dǎo)航服務(wù)器對每個模式都計算了分值,分值由高至Ij低的短語依次為"car mp3 player withtransmitter,,、“car mp3 player'\"mp3 player”、“player”,那么信息導(dǎo)航服務(wù)器按照分值由高到低的順序,對這些模式的排序依
"car mp3 player withtransmitter'^^car mp3 player”、“mp3 player”、“player”。
S205:所述信息導(dǎo)航服務(wù)器按照所述排序,將模式作為關(guān)鍵詞,在記錄查詢信息與導(dǎo)航信息之間映射關(guān)系的映射表中查找與模式對應(yīng)的導(dǎo)航信息。
信息導(dǎo)航服務(wù)器提取模式后,可以按照多種方式以模式為關(guān)鍵詞,在映射表中查找導(dǎo)航信息。
例如,假設(shè)信息導(dǎo)航服務(wù)器按照相似度由高到低的順序,對所有的模式進行了排序。這種情況下,信息導(dǎo)航服務(wù)器可以將排序第一的模式作為關(guān)鍵詞,在映射表中查找與排序第一的模式對應(yīng)的導(dǎo)航信息。如果查找到與排序第一的模式對應(yīng)的導(dǎo)航信息,則將查找到的導(dǎo)航信息發(fā)送給客戶端。如果沒有查找到與排序第一的模式對應(yīng)的導(dǎo)航信息,則將排序第二的模式作為關(guān)鍵詞,在映射表中查找與排序第二的模式對應(yīng)的導(dǎo)航信息。以此類推, 直至查找到與模式對應(yīng)的導(dǎo)航信息為止,或者,直至將所有的模式作為關(guān)鍵詞,在映射表中查找完與所有的模式對應(yīng)的導(dǎo)航信息為止。
以查詢信息“car mp3 player with fm transmitter 911”為例,假設(shè)信息導(dǎo)航服務(wù)器提取出的模式是“player”(中心詞)、“mp3 player”(中心短語),"car mp3player”(指定長度的短語)和“car mp3 player with transmitter”(丟詞短語),再假設(shè)相似度用分值來表示,信息導(dǎo)航服務(wù)器對每個模式都計算了分值,分值由高到低的短語依次為“car mp3 player with transmitter,,、“car mp3 player,,、“mp3 player,,、“player,,,那么信息導(dǎo)航服務(wù)器按照分值由高到低的順序,對這些模式的排序依次為“car mp3 player with transmitter,,、"car mp3 player,,、“mp3 player,,、“player,,。之后,信息導(dǎo)航服務(wù)器首先以 "car mp3 player withtransmitter,,為關(guān)鍵詞,在映身寸表中查找與"car mp3 player with transmitter”對應(yīng)的類目(導(dǎo)航信息),如果查找到對應(yīng)的類目,則可以停止查找,否則,再以“car mp3 player”為關(guān)鍵詞,在映射表中查找與“car mp3 player”對應(yīng)的類目(導(dǎo)航信息),如果查找到對應(yīng)的類目,則可以停止查找,否則,再以“mp3player”為關(guān)鍵詞,在映射表中查找與“mp3 player”對應(yīng)的類目(導(dǎo)航信息),如果查找到對應(yīng)的類目,則可以停止查找,否則,再以“player”為關(guān)鍵詞,在映射表中查找與“player”對應(yīng)的類目(導(dǎo)航信息),如果查找到對應(yīng)的類目,則可以停止查找,否則,對于查詢信息“car mp3 player with fm transmitter 911”,在映射表中查找不到任何對應(yīng)的類目。
再例如,信息導(dǎo)航服務(wù)器可以按照排序,查找相似度較高的幾個模式對應(yīng)的導(dǎo)航信息,也就是說,無論在映射表中是否查找到相似度最高的模式對應(yīng)的導(dǎo)航信息,都在映射表中查找其他幾個相似度比較高的模式對應(yīng)的導(dǎo)航信息。這樣,在后續(xù)將導(dǎo)航信息發(fā)送給客戶端的步驟中,信息導(dǎo)航服務(wù)器可以將這些相似度較高的模式對應(yīng)的導(dǎo)航信息都發(fā)送給客戶端。
S206 所述信息導(dǎo)航服務(wù)器將查找到的導(dǎo)航信息發(fā)送給客戶端。
信息導(dǎo)航服務(wù)器可以根據(jù)不同的情形,通過不同的方式將查找到的導(dǎo)航信息發(fā)送給客戶端。
例如,映射表中可以記錄查詢信息與導(dǎo)航信息的置信度,查詢信息與導(dǎo)航信息的置信度用于表示查詢信息與導(dǎo)航信息之間的關(guān)聯(lián)程度。置信度可以用概率來表示,也可以用分值來表示,當(dāng)然,還可以用其他形式來表示。置信度越高,說明查詢信息與導(dǎo)航信息的關(guān)聯(lián)程度越高。信息導(dǎo)航服務(wù)器如果查找到與某個模式對應(yīng)的多個導(dǎo)航信息,那么可以將查找到的置信度最高的導(dǎo)航信息發(fā)送給客戶端,或者可以將多個導(dǎo)航信息按照置信度大小進行排序,并按照該排序?qū)⒍鄠€導(dǎo)航信息均發(fā)送給客戶端。還是以查詢信息“car mp3 player with fmtransmitter 911”為例,信息導(dǎo)航服務(wù)器如果以模式“car mp3 player withtransmitter"為關(guān)鍵詞,在映射表中查找到“播放器”、“電子產(chǎn)品,,這兩個類目,并且還查找到 “car mp3 player with transmitter” 與“播放器”的置信度為 90%,“car mp3 player with transmitter”與“電子產(chǎn)品”的置信度為10%,那么可以只將“播放器”這個類目發(fā)送給客戶端,或者將“播放器”排在第一位,將“電子產(chǎn)品”排在第二位后,將“播放器” 和“電子產(chǎn)品,,都發(fā)送給客戶端。
在實際應(yīng)用中,還可以將相似度與置信度結(jié)合,向客戶端返回查詢結(jié)果。例如,信息導(dǎo)航服務(wù)器在獲得查詢信息后,通過模式提取算法對查詢信息進行分析,得到多個模式, 計算每個模式的相似度,按照相似度高低的順序?qū)λ械哪J竭M行排序。之后,首先將排序第一的模式作為關(guān)鍵詞,在映射表中查找與排序第一的模式對應(yīng)的導(dǎo)航信息。如果查找到與排序第一的模式對應(yīng)的多個導(dǎo)航信息,并且查找到排序第一的模式與每個對應(yīng)的導(dǎo)航信息的置信度,則將置信度最高的導(dǎo)航信息發(fā)送給客戶端。
在實際應(yīng)用中,可以通過多種方式計算置信度。
例如,置信度可以由人工指定,也就是說,映射表中的置信度可以由人工配置。
再例如,信息導(dǎo)航服務(wù)器可以獲得記錄查詢信息與對應(yīng)的導(dǎo)航信息的歷史記錄。 歷史記錄可以存儲在一個獨立于信息導(dǎo)航服務(wù)器的數(shù)據(jù)庫服務(wù)器中,當(dāng)信息導(dǎo)航服務(wù)器需要獲得歷史記錄時,從數(shù)據(jù)庫服務(wù)器中獲得歷史記錄。歷史記錄也可以存儲在信息導(dǎo)航服務(wù)器中,當(dāng)信息導(dǎo)航服務(wù)器需要獲得歷史記錄時,直接在本地獲得歷史記錄即可。歷史記錄中例如記錄查詢信息與對應(yīng)的導(dǎo)航信息共同出現(xiàn)的次數(shù)、查詢信息單獨出現(xiàn)的次數(shù)、對應(yīng)的導(dǎo)航信息單獨出現(xiàn)的次數(shù)等信息。如果信息導(dǎo)航服務(wù)器或其他服務(wù)器在獲得某個查詢信息后,又獲得客戶端對某個導(dǎo)航信息的觸發(fā),那么信息導(dǎo)航服務(wù)器或其他服務(wù)器可以確定這個查詢信息與這個導(dǎo)航信息對應(yīng)。對于歷史記錄中的每個查詢信息,信息導(dǎo)航服務(wù)器可以計算查詢信息與對應(yīng)的每個導(dǎo)航信息的條件概率,查詢信息與對應(yīng)的導(dǎo)航信息的條件概率即為查詢信息與對應(yīng)的導(dǎo)航信息之間的置信度。
如果歷史記錄中記錄一個查詢信息與一個導(dǎo)航信息直接對應(yīng),并且還記錄這個查詢信息與中間信息直接對應(yīng),中間信息能夠與這個導(dǎo)航信息直接對應(yīng),那么信息導(dǎo)航服務(wù)器可以計算這個查詢信息與這個導(dǎo)航信息同時出現(xiàn)的次數(shù)與這個查詢信息出現(xiàn)的總次數(shù)之間的比值,為描述方便,這里將這個查詢信息與這個導(dǎo)航信息同時出現(xiàn)的次數(shù)與這個查詢信息出現(xiàn)的總次數(shù)之間的比值稱為條件概率1。本申請實施例中的中間信息是指查詢信息和導(dǎo)航信息對應(yīng)的同一個信息,查詢信息和導(dǎo)航信息可以通過中間信息建立對應(yīng)關(guān)系。 例如,假設(shè)某個查詢信息與某個信息對應(yīng),再假設(shè)某個導(dǎo)航信息也與這個信息對應(yīng),那么這個查詢信息就與這個導(dǎo)航信息對應(yīng)。信息導(dǎo)航服務(wù)器還可以計算這個查詢信息與中間信息同時出現(xiàn)的次數(shù)與這個查詢信息出現(xiàn)的總次數(shù)之間的比值,為描述方便,這里將查詢信息與中間信息同時出現(xiàn)的次數(shù)與這個查詢信息出現(xiàn)的總次數(shù)之間的比值稱為條件概率2。之后,信息導(dǎo)航服務(wù)器計算條件概率1與對應(yīng)條件概率1的權(quán)重的乘積,計算條件概率2與對應(yīng)條件概率2的權(quán)重的乘積,并將兩個乘積相加,得到這個查詢信息與這個導(dǎo)航信息的條件概率。對應(yīng)條件概率1的權(quán)重和對應(yīng)條件概率2的權(quán)重可以根據(jù)經(jīng)驗值或者線性回歸方法確定。
下面再以導(dǎo)航信息為類目為例,說明如何確定一個查詢信息與一個導(dǎo)航信息的置信度。
給定用戶輸入的查詢信息Queryi,對應(yīng)Queryi的類目集合為Icategory1, Category2. . . category」· . . },貝U對于δ+旬信;窗、queryi7 queryj 與 Categoryj 的條件才既率定義為 ρ (Categoryj | query,)。對于所有的類目,滿足條件I —y,) = 1。
j . 一 .一 · 在實際應(yīng)用中,一個用戶在輸入查詢信息后,可能會點擊某個類目,也可能只點擊其他信息(例如某個產(chǎn)品的信息)而不點擊類目。另外,由于其他信息與類目之間也可能具有對應(yīng)關(guān)系,例如,一個產(chǎn)品的信息是屬于某個類目的,所以,信息導(dǎo)航服務(wù)器或者其他服務(wù)器可以預(yù)先配置有記錄其他信息與類目之間映射關(guān)系的映射表,當(dāng)然,也可以實時更新映射表。所以,即使用戶在輸入查詢信息后,沒有點擊類目而是直接點擊其他信息,那么信息導(dǎo)航服務(wù)器或者其他服務(wù)器也可以確定查詢信息與類目之間的對應(yīng)關(guān)系。這里的其他信息就是一種中間信息。因此,在計算queryi與category」的條件概率時,不但可以考慮查詢信息與類目直接對應(yīng)的情形,還可以考慮查詢信息與類目間接對應(yīng)的情形。
在具體實現(xiàn)時,信息導(dǎo)航服務(wù)器獲得歷史記錄后,可以查找queryi與category」同時出現(xiàn)的次數(shù)。如果用戶在輸入queryi后,又點擊category」,則記錄Queryi與category」 同時出現(xiàn)1次。信息導(dǎo)航服務(wù)器還要查找Queryi出現(xiàn)的總次數(shù)。Queryi出現(xiàn)的總次數(shù)是指所有的用戶輸入Queryi的總次數(shù)。信息導(dǎo)航服務(wù)器計算Queryi與category」直接對應(yīng)的條件概率為
權(quán)利要求
1.一種信息導(dǎo)航的實現(xiàn)方法,其特征在于,適用于包括信息導(dǎo)航服務(wù)器的信息處理系統(tǒng),所述信息導(dǎo)航服務(wù)器用于根據(jù)客戶端發(fā)送的查詢信息查詢導(dǎo)航信息,所述信息導(dǎo)航服務(wù)器存儲有記錄查詢信息與導(dǎo)航信息之間映射關(guān)系的映射表,所述方法包括信息導(dǎo)航服務(wù)器獲得客戶端提供的查詢信息;所述信息導(dǎo)航服務(wù)器通過模式提取算法對所述查詢信息進行分析,得到至少一個模式,所述模式為從所述查詢信息中提取的信息或?qū)λ霾樵冃畔⑦M行語義轉(zhuǎn)換后獲得的信息,所述模式用于表征所述查詢信息;所述信息導(dǎo)航服務(wù)器如果得到多個模式,則計算每個模式的相似度,所述模式的相似度用于表示模式與所述查詢信息之間的相似程度;所述信息導(dǎo)航服務(wù)器按照相似度高低的順序,對所有的模式進行排序;所述信息導(dǎo)航服務(wù)器按照所述排序,將模式作為關(guān)鍵詞,在所述映射表中查找與模式對應(yīng)的導(dǎo)航信息;所述信息導(dǎo)航服務(wù)器將查找到的導(dǎo)航信息發(fā)送給客戶端。
2.如權(quán)利要求1所述的方法,其特征在于,所述信息導(dǎo)航服務(wù)器按照下述方式對所述查詢信息進行分析,得到至少一個模式所述信息導(dǎo)航服務(wù)器從所述查詢信息中提取中心詞和/或中心短語。
3.如權(quán)利要求2所述的方法,其特征在于,所述信息導(dǎo)航服務(wù)器還從所述查詢信息中提取指定長度的短語,所述指定長度的短語包括所述中心詞或中心短語。
4.如權(quán)利要求3所述的方法,其特征在于,所述信息導(dǎo)航服務(wù)器按照下述方式計算每個模式的相似度對于一個模式,所述信息導(dǎo)航服務(wù)器計算所述模式相對于所述查詢信息丟掉每一個詞的情況下所得的分?jǐn)?shù);所述信息導(dǎo)航服務(wù)器計算上述所有分?jǐn)?shù)之和,所述分?jǐn)?shù)之和為所述模式的相似度。
5.如權(quán)利要求4所述的方法,其特征在于,所述信息導(dǎo)航服務(wù)器按照下述方式計算所述模式相對于所述查詢信息丟掉一個詞的情況下所得的分?jǐn)?shù)所述信息導(dǎo)航服務(wù)器判斷丟掉的所述詞的詞性,從預(yù)先設(shè)置的記錄詞性與分值之間映射關(guān)系的映射表中查找與所述詞的詞性對應(yīng)的分值,與所述詞的詞性對應(yīng)的分值為第一分值;所述信息導(dǎo)航服務(wù)器計算所述詞在所述查詢信息中的位置與所述中心詞在所述查詢信息中的位置之間的距離的得分,所述詞在所述查詢信息中的位置與所述中心詞在所述查詢信息中的位置之間的距離的得分為第二分值;所述信息導(dǎo)航服務(wù)器計算所述詞在所述查詢信息中的位置與所述中心短語在所述查詢信息中的位置之間的距離的得分,所述詞在所述查詢信息中的位置與所述中心短語在所述查詢信息中的位置之間的距離的得分為第三分值;所述信息導(dǎo)航服務(wù)器根據(jù)預(yù)先設(shè)置的分值算法,對所述第一分值、所述第二分值及所述第三分值進行計算,計算結(jié)果為所述模式相對于所述查詢信息丟掉一個詞的情況下所得的分?jǐn)?shù)。
6.如權(quán)利要求1所述的方法,其特征在于,所述信息導(dǎo)航服務(wù)器按照下述方式按照所述排序,將模式作為關(guān)鍵詞,在所述映射表中查找與模式對應(yīng)的導(dǎo)航信息所述信息導(dǎo)航服務(wù)器將排序第一的模式作為關(guān)鍵詞,在所述映射表中查找與排序第一的模式對應(yīng)的導(dǎo)航信息;所述信息導(dǎo)航服務(wù)器如果查找到與排序第一的模式對應(yīng)的導(dǎo)航信息,則將查找到的導(dǎo)航信息發(fā)送給客戶端;所述信息導(dǎo)航服務(wù)器如果沒有查找到與排序第一的模式對應(yīng)的導(dǎo)航信息,則將排序第二的模式作為關(guān)鍵詞,在所述映射表中查找與排序第二的模式對應(yīng)的導(dǎo)航信息;以此類推,直至查找到與模式對應(yīng)的導(dǎo)航信息為止,或者,直至將所有的模式作為關(guān)鍵詞,在所述映射表中查找完與所有的模式對應(yīng)的導(dǎo)航信息為止。
7.如權(quán)利要求1-6任意一項所述的方法,其特征在于,所述映射表中還記錄查詢信息與導(dǎo)航信息的置信度,所述查詢信息與導(dǎo)航信息的置信度用于表示查詢信息與導(dǎo)航信息之間的關(guān)聯(lián)程度;所述信息導(dǎo)航服務(wù)器如果查找到與一個模式對應(yīng)的多個導(dǎo)航信息,則將查找到的置信度最高的導(dǎo)航信息發(fā)送給客戶端,或?qū)⑺龆鄠€導(dǎo)航信息排序后發(fā)送給客戶端。
8.如權(quán)利要求7所述的方法,其特征在于,在所述信息導(dǎo)航服務(wù)器獲得客戶端提供的查詢信息之前,還包括所述信息導(dǎo)航服務(wù)器獲得記錄查詢信息與對應(yīng)的導(dǎo)航信息的歷史記錄; 對于歷史記錄中的每個查詢信息,所述信息導(dǎo)航服務(wù)器計算查詢信息與對應(yīng)的每個導(dǎo)航信息的條件概率,查詢信息與對應(yīng)的導(dǎo)航信息的條件概率為查詢信息與對應(yīng)的導(dǎo)航信息之間的置信度。
9.如權(quán)利要求8所述的方法,其特征在于,如果歷史記錄中記錄一個查詢信息與一個導(dǎo)航信息直接對應(yīng),并且還記錄所述查詢信息與中間信息直接對應(yīng),中間信息能夠與所述導(dǎo)航信息直接對應(yīng),則所述信息導(dǎo)航服務(wù)器按照下述方式計算查詢信息與所述導(dǎo)航信息的條件概率所述信息導(dǎo)航服務(wù)器計算所述查詢信息與所述導(dǎo)航信息同時出現(xiàn)的次數(shù)與所述查詢信息出現(xiàn)的總次數(shù)之間的比值,所述查詢信息與所述導(dǎo)航信息同時出現(xiàn)的次數(shù)與所述查詢信息出現(xiàn)的總次數(shù)之間的比值為條件概率1 ;所述信息導(dǎo)航服務(wù)器計算所述查詢信息與所述中間信息同時出現(xiàn)的次數(shù)與所述查詢信息出現(xiàn)的總次數(shù)之間的比值,所述查詢信息與所述中間信息同時出現(xiàn)的次數(shù)與所述查詢信息出現(xiàn)的總次數(shù)之間的比值為條件概率2 ;所述信息導(dǎo)航服務(wù)器計算條件概率1與對應(yīng)條件概率1的權(quán)重的乘積,計算條件概率 2與對應(yīng)條件概率2的權(quán)重的乘積,并將兩個乘積相加,得到所述查詢信息與所述導(dǎo)航信息的條件概率。
10.如權(quán)利要求1所述的方法,其特征在于,所述信息導(dǎo)航服務(wù)器如果沒有查找到與任何模式對應(yīng)的導(dǎo)航信息,則采用機器學(xué)習(xí)方式預(yù)測到與所述查詢信息對應(yīng)的導(dǎo)航信息。
11.一種信息導(dǎo)航服務(wù)器,其特征在于,適用于包括信息導(dǎo)航服務(wù)器的信息處理系統(tǒng), 所述信息導(dǎo)航服務(wù)器用于根據(jù)客戶端發(fā)送的查詢信息查詢導(dǎo)航信息,所述信息導(dǎo)航服務(wù)器包括存儲單元,用于存儲記錄查詢信息與導(dǎo)航信息之間映射關(guān)系的映射表; 獲得單元,用于獲得客戶端提供的查詢信息;分析單元,用于通過模式提取算法對所述查詢信息進行分析,得到至少一個模式,所述模式為從所述查詢信息中提取的信息或?qū)λ霾樵冃畔⑦M行語義轉(zhuǎn)換后獲得的信息,所述模式用于表征所述查詢信息;計算單元,用于在所述分析單元得到多個模式時,計算每個模式的相似度,所述模式的相似度用于表示模式與所述查詢信息之間的相似程度;排序單元,用于按照相似度高低的順序,對所有的模式進行排序; 查找單元,用于按照所述排序,將模式作為關(guān)鍵詞,在所述映射表中查找與模式對應(yīng)的導(dǎo)航信息;發(fā)送單元,用于將查找到的導(dǎo)航信息發(fā)送給客戶端。
12.如權(quán)利要求11所述的信息導(dǎo)航服務(wù)器,其特征在于,所述分析單元具體用于從所述查詢信息中提取中心詞和/或中心短語。
13.如權(quán)利要求12所述的信息導(dǎo)航服務(wù)器,其特征在于,所述分析單元具體用于從所述查詢信息中提取指定長度的短語,所述指定長度的短語包括所述中心詞或中心短語。
14.如權(quán)利要求13所述的信息導(dǎo)航服務(wù)器,其特征在于,對于一個模式,所述計算單元具體用于計算所述模式相對于所述查詢信息丟掉每一個詞的情況下所得的分?jǐn)?shù),并計算上述所有分?jǐn)?shù)之和,所述分?jǐn)?shù)之和為所述模式的相似度。
15.如權(quán)利要求14所述的信息導(dǎo)航服務(wù)器,其特征在于,所述存儲單元還存儲記錄詞性與分值之間映射關(guān)系的映射表;所述計算單元包括判斷子單元,用于判斷丟掉的所述詞的詞性;查找子單元,用于從所述映射表中查找與所述詞的詞性對應(yīng)的分值,與所述詞的詞性對應(yīng)的分值為第一分值;第一計算子單元,用于計算所述詞在所述查詢信息中的位置與所述中心詞在所述查詢信息中的位置之間的距離的得分,所述詞在所述查詢信息中的位置與所述中心詞在所述查詢信息中的位置之間的距離的得分為第二分值;第二計算子單元,用于計算所述詞在所述查詢信息中的位置與所述中心短語在所述查詢信息中的位置之間的距離的得分,所述詞在所述查詢信息中的位置與所述中心短語在所述查詢信息中的位置之間的距離的得分為第三分值;第三計算子單元,用于根據(jù)預(yù)先設(shè)置的分值算法,對所述第一分值、所述第二分值及所述第三分值進行計算,計算結(jié)果為所述模式相對于所述查詢信息丟掉一個詞的情況下所得的分?jǐn)?shù)。
16.如權(quán)利要求11所述的信息導(dǎo)航服務(wù)器,其特征在于,所述查找單元將排序第一的模式作為關(guān)鍵詞,在所述映射表中查找與排序第一的模式對應(yīng)的導(dǎo)航信息;如果所述查找單元查找到與排序第一的模式對應(yīng)的導(dǎo)航信息,則所述發(fā)送單元將查找到的導(dǎo)航信息發(fā)送給客戶端;如果所述查找單元沒有查找到與排序第一的模式對應(yīng)的導(dǎo)航信息,則所述查找單元將排序第二的模式作為關(guān)鍵詞,在所述映射表中查找與排序第二的模式對應(yīng)的導(dǎo)航信息;以此類推,直至所述查找單元查找到與模式對應(yīng)的導(dǎo)航信息為止,或者,直至所述查找單元將所有的模式作為關(guān)鍵詞,在所述映射表中查找完與所有的模式對應(yīng)的導(dǎo)航信息為止。
17.如權(quán)利要求11-16任意一項所述的信息導(dǎo)航服務(wù)器,其特征在于,所述映射表中還記錄查詢信息與導(dǎo)航信息的置信度,所述查詢信息與導(dǎo)航信息的置信度用于表示查詢信息與導(dǎo)航信息之間的關(guān)聯(lián)程度;如果所述查找單元查找到與一個模式對應(yīng)的多個導(dǎo)航信息,則所述發(fā)送單元將查找到的置信度最高的導(dǎo)航信息發(fā)送給客戶端,或?qū)⑺龆鄠€導(dǎo)航信息排序后發(fā)送給客戶端。
18.如權(quán)利要求17所述的信息導(dǎo)航服務(wù)器,其特征在于,所述獲得單元獲得客戶端提供的查詢信息之前,還獲得記錄查詢信息與對應(yīng)的導(dǎo)航信息的歷史記錄;對于歷史記錄中的每個查詢信息,所述計算單元計算查詢信息與對應(yīng)的每個導(dǎo)航信息的條件概率,查詢信息與對應(yīng)的導(dǎo)航信息的條件概率為查詢信息與對應(yīng)的導(dǎo)航信息之間的置信度。
19.如權(quán)利要求18所述的信息導(dǎo)航服務(wù)器,其特征在于,如果歷史記錄中記錄一個查詢信息與一個導(dǎo)航信息直接對應(yīng),并且還記錄所述查詢信息與中間信息直接對應(yīng),中間信息能夠與所述導(dǎo)航信息直接對應(yīng),則所述計算單元包括第四計算單元,用于計算所述查詢信息與所述導(dǎo)航信息同時出現(xiàn)的次數(shù)與所述查詢信息出現(xiàn)的總次數(shù)之間的比值,所述查詢信息與所述導(dǎo)航信息同時出現(xiàn)的次數(shù)與所述查詢信息出現(xiàn)的總次數(shù)之間的比值為條件概率1 ;第五計算單元,用于計算所述查詢信息與所述中間信息同時出現(xiàn)的次數(shù)與所述查詢信息出現(xiàn)的總次數(shù)之間的比值,所述查詢信息與所述中間信息同時出現(xiàn)的次數(shù)與所述查詢信息出現(xiàn)的總次數(shù)之間的比值為條件概率2 ;第六計算單元,用于計算條件概率1與對應(yīng)條件概率1的權(quán)重的乘積,計算條件概率 2與對應(yīng)條件概率2的權(quán)重的乘積,并將兩個乘積相加,得到所述查詢信息與所述導(dǎo)航信息的條件概率。
20.如權(quán)利要求11-16任意一項所述的信息導(dǎo)航服務(wù)器,其特征在于,還包括機器學(xué)習(xí)單元,用于在所述查找單元沒有查找到與任何模式對應(yīng)的導(dǎo)航信息時,獲得所述查找單元的觸發(fā),采用機器學(xué)習(xí)方式預(yù)測到與所述查詢信息對應(yīng)的導(dǎo)航信息。
21.一種信息處理系統(tǒng),其特征在于,包括客戶端及信息導(dǎo)航服務(wù)器;所述客戶端用于與所述信息導(dǎo)航服務(wù)器交互信息;所述信息導(dǎo)航服務(wù)器用于獲得客戶端提供的查詢信息;通過模式提取算法對所述查詢信息進行分析,得到至少一個模式,所述模式為從所述查詢信息中提取的信息或?qū)λ霾樵冃畔⑦M行語義轉(zhuǎn)換后獲得的信息,所述模式用于表征所述查詢信息;如果得到多個模式,則計算每個模式的相似度,所述模式的相似度用于表示模式與所述查詢信息之間的相似程度;按照相似度高低的順序,對所有的模式進行排序;按照所述排序,將模式作為關(guān)鍵詞,在所述映射表中查找與模式對應(yīng)的導(dǎo)航信息,將查找到的導(dǎo)航信息發(fā)送給客戶端。
22.一種信息導(dǎo)航的實現(xiàn)方法,其特征在于,適用于包括信息導(dǎo)航服務(wù)器的信息處理系統(tǒng),所述信息導(dǎo)航服務(wù)器用于根據(jù)客戶端發(fā)送的查詢信息查詢導(dǎo)航信息,所述信息導(dǎo)航服務(wù)器存儲有記錄查詢信息與導(dǎo)航信息之間映射關(guān)系的映射表,所述方法包括信息導(dǎo)航服務(wù)器獲得客戶端提供的查詢信息;所述信息導(dǎo)航服務(wù)器使用方式(1)查找與所述查詢信息對應(yīng)的導(dǎo)航信息,并采用機器學(xué)習(xí)方式預(yù)測到與所述查詢信息對應(yīng)的導(dǎo)航信息;所述信息導(dǎo)航服務(wù)器如果使用方式(1)查找到與所述查詢信息對應(yīng)的導(dǎo)航信息,則根據(jù)所述方式(1)和機器學(xué)習(xí)方式兩種方式得到的導(dǎo)航信息,確定提供給客戶端的導(dǎo)航信息,并將確定提供給客戶端的導(dǎo)航信息發(fā)送給客戶端;其中,所述方式(1)包括所述信息導(dǎo)航服務(wù)器通過模式提取算法對所述查詢信息進行分析,得到至少一個模式,所述模式為從所述查詢信息中提取的信息或?qū)λ霾樵冃畔⑦M行語義轉(zhuǎn)換后獲得的信息,所述模式用于表征所述查詢信息;所述信息導(dǎo)航服務(wù)器如果得到多個模式,則計算每個模式的相似度,所述模式的相似度用于表示模式與所述查詢信息之間的相似程度;所述信息導(dǎo)航服務(wù)器按照相似度高低的順序,對所有的模式進行排序; 所述信息導(dǎo)航服務(wù)器按照所述排序,將模式作為關(guān)鍵詞,在所述映射表中查找與模式對應(yīng)的導(dǎo)航信息。
23.一種信息導(dǎo)航服務(wù)器,其特征在于,適用于包括信息導(dǎo)航服務(wù)器的信息處理系統(tǒng), 所述信息導(dǎo)航服務(wù)器用于根據(jù)客戶端發(fā)送的查詢信息查詢導(dǎo)航信息,所述信息導(dǎo)航服務(wù)器包括存儲單元,用于存儲記錄查詢信息與導(dǎo)航信息之間映射關(guān)系的映射表; 獲得單元,用于獲得客戶端提供的查詢信息;第一查找單元,用于使用方式(1)查找與所述查詢信息對應(yīng)的導(dǎo)航信息; 第二查找單元,采用機器學(xué)習(xí)方式預(yù)測到與所述查詢信息對應(yīng)的導(dǎo)航信息; 導(dǎo)航信息確定單元,用于如果所述第一查找單元使用方式(1)查找到與所述查詢信息對應(yīng)的導(dǎo)航信息,則根據(jù)所述第一查找單元得到的導(dǎo)航信息和所述第二查找單元得到的導(dǎo)航信息,確定提供給客戶端的導(dǎo)航信息;發(fā)送單元,用于將確定提供給客戶端的導(dǎo)航信息發(fā)送給客戶端; 所述方式(1)包括通過模式提取算法對所述查詢信息進行分析,得到至少一個模式, 所述模式為從所述查詢信息中提取的信息或?qū)λ霾樵冃畔⑦M行語義轉(zhuǎn)換后獲得的信息, 所述模式用于表征所述查詢信息;如果得到多個模式,則計算每個模式的相似度,所述模式的相似度用于表示模式與所述查詢信息之間的相似程度;按照相似度高低的順序,對所有的模式進行排序;按照所述排序,將模式作為關(guān)鍵詞,在所述映射表中查找與模式對應(yīng)的導(dǎo)航信息。
24.一種信息處理系統(tǒng),其特征在于,包括客戶端及信息導(dǎo)航服務(wù)器; 所述客戶端用于與所述信息導(dǎo)航服務(wù)器交互信息;所述信息導(dǎo)航服務(wù)器用于獲得客戶端提供的查詢信息,使用方式(1)查找與所述查詢信息對應(yīng)的導(dǎo)航信息,并采用機器學(xué)習(xí)方式預(yù)測到與所述查詢信息對應(yīng)的導(dǎo)航信息,如果使用方式(1)查找到與所述查詢信息對應(yīng)的導(dǎo)航信息,則根據(jù)所述方式(1)和機器學(xué)習(xí)方式兩種方式得到的導(dǎo)航信息,確定提供給客戶端的導(dǎo)航信息,并將確定提供給客戶端的導(dǎo)航信息發(fā)送給客戶端;所述方式(1)包括通過模式提取算法對所述查詢信息進行分析,得到至少一個模式, 所述模式為從所述查詢信息中提取的信息或?qū)λ霾樵冃畔⑦M行語義轉(zhuǎn)換后獲得的信息, 所述模式用于表征所述查詢信息;如果得到多個模式,則計算每個模式的相似度,所述模式的相似度用于表示模式與所述查詢信息之間的相似程度;按照相似度高低的順序,對所有的模式進行排序;按照所述排序,將模式作為關(guān)鍵詞,在記錄查詢信息與導(dǎo)航信息之間映射關(guān)系的映射表中查找與模式對應(yīng)的導(dǎo)航信息。
全文摘要
本申請實施例公開了一種信息導(dǎo)航的實現(xiàn)方法,包括信息導(dǎo)航服務(wù)器獲得客戶端提供的查詢信息;所述信息導(dǎo)航服務(wù)器通過模式提取算法對所述查詢信息進行分析,得到至少一個模式;所述信息導(dǎo)航服務(wù)器如果得到多個模式,則計算每個模式的相似度;所述信息導(dǎo)航服務(wù)器按照相似度高低的順序,對所有的模式進行排序;所述信息導(dǎo)航服務(wù)器按照所述排序,將模式作為關(guān)鍵詞,在記錄查詢信息與導(dǎo)航信息之間映射關(guān)系的映射表中查找與模式對應(yīng)的導(dǎo)航信息;所述信息導(dǎo)航服務(wù)器將查找到的導(dǎo)航信息發(fā)送給客戶端。本申請實施例解決了信息導(dǎo)航服務(wù)器無法為客戶端提供與映射表中不存在的查詢信息對應(yīng)的導(dǎo)航信息。
文檔編號G06F17/30GK102193939SQ201010123209
公開日2011年9月21日 申請日期2010年3月10日 優(yōu)先權(quán)日2010年3月10日
發(fā)明者廖劍, 林鋒, 張壽松, 張勤 申請人:阿里巴巴集團控股有限公司