專利名稱:在線商業(yè)意圖的自動檢測的制作方法
在線商業(yè)意圖的自動檢測背景現(xiàn)代社會已經(jīng)十分依賴計算機和計算機技術(shù)。在公司為客戶和產(chǎn)品銷售激 烈競爭的商業(yè)競技場上,尤其如此。具有即時庫存和準(zhǔn)確聚焦的廣告戰(zhàn)略的公 司通常比競爭對手產(chǎn)品更便宜并能更快地將產(chǎn)品遞送到顧客手中。計算機技術(shù) 通過將商業(yè)、信息和顧客聯(lián)網(wǎng)在一起,使該類業(yè)務(wù)優(yōu)勢成為可能。雖然最初,計算機經(jīng)由僅由局域網(wǎng)(LAN)組成的網(wǎng)絡(luò)與其它計算機通信,但是因特網(wǎng)的 出現(xiàn)允許基本上擁有計算機的每個人參與到全球網(wǎng)絡(luò)中。這使得小企業(yè)能夠與 較大企業(yè)進行競爭而無需籌資和建立網(wǎng)絡(luò)結(jié)構(gòu)。隨著計算和網(wǎng)絡(luò)化技術(shù)越來越穩(wěn)健、安全和可靠,更多的消費者、批發(fā)商、 零售商、企業(yè)家、教育機構(gòu)等都轉(zhuǎn)變樣式并采用因特網(wǎng)來執(zhí)行業(yè)務(wù),代替使用 傳統(tǒng)的實體店。目前,許多企業(yè)提供web站點和在線服務(wù)。例如,當(dāng)今,消費 者可經(jīng)由因特網(wǎng)訪問其銀行賬戶并進行數(shù)量不斷增多的可用交易,諸如余額査 詢、資金轉(zhuǎn)帳和賬單支付。此外,電子商務(wù)已經(jīng)普及到幾乎所有可以想到的業(yè)務(wù)類型。人們開始期望 他們喜歡的商店不僅有實體業(yè)務(wù)點,而且還能通常經(jīng)由因特網(wǎng)萬維網(wǎng)(WWW) 來進行"在線"訪問。Web使顧客能夠查看企業(yè)的商店和產(chǎn)品的圖形表示。家 中的簡易使用以及便捷的購買方法通常引起銷售的增加。買家享受能夠比較商 店而無需花費時間和金錢來在商店間奔波的自由。這會導(dǎo)致在線企業(yè)之間的激烈競爭,使在線廣告至關(guān)重要。 一般而言,廣 告是幾乎任何商業(yè)市場或背景下的關(guān)鍵收入來源。為了到達(dá)盡可能多的顧客, 廣告通常是經(jīng)由廣告牌、電視、無線電和諸如報紙和雜質(zhì)之類的印刷媒體來呈 現(xiàn)的。然而,通過因特網(wǎng),廣告客戶找到了到達(dá)分布在廣闊多樣的地理范圍上 的大量潛在客戶的新且可能是更便宜的媒介。因特網(wǎng)廣告可以通過由瀏覽器和 /或能夠呈現(xiàn)因特網(wǎng)內(nèi)容的其它客戶機設(shè)備而呈現(xiàn)的任何內(nèi)容來查看。這可以 包括電子郵件、游戲控制臺、經(jīng)由TV的視頻點播、web頁面、和/或web站點以及訪問特定站點時的彈出窗口等等。因此,諸如因特網(wǎng)的全球通信網(wǎng)絡(luò)已經(jīng)提供了到達(dá)大量潛在顧客的商機。在 過去幾年中,大量用戶已經(jīng)轉(zhuǎn)向因特網(wǎng)作為新聞、研究資源和各種其它類型信 息的可靠來源。此外,在線購物、訂餐、以及購買音樂會門票和/或電影票只 是當(dāng)前坐在計算機前通過因特網(wǎng)進行的少數(shù)幾種常見活動。訪問因特網(wǎng)越來越 容易,這也推動了web站點通信量的指數(shù)增加。通常,企業(yè)希望確保就向其廣告展示的通信量類型以某種擔(dān)保來證明廣告成 本合理。如果廣告客戶相信他們到達(dá)準(zhǔn)備購買的用戶(即處于商業(yè)"交易階段" 的用戶),但是實際上大多數(shù)用戶只是研究特定類型的產(chǎn)品(即處于商業(yè)"信息階段"的用戶)或者甚至他們僅僅是出于娛樂而瀏覽Web (即處于非商業(yè)階 段的用戶),則企業(yè)會對為推算針對其產(chǎn)品類型的實際潛在購買者的廣告支付 高費用十分不滿。收到不需要的廣告的用戶也可能會形成對在他們不想購買時 持續(xù)用廣告轟炸他們的企業(yè)產(chǎn)生負(fù)面印象。注意到這一點非常重要,因為將產(chǎn) 品與買家相匹配通常是企業(yè)在商業(yè)中立足之本。當(dāng)發(fā)生顯著失配時,廣告客戶 會撤資離開,導(dǎo)致廣告收入損失。概述以下引入主題的簡化概述以便提供對主題實施例某些方面的基本理解。本 概述不是對主題的詳盡總覽。它不旨在標(biāo)識實施例的重要/關(guān)鍵元素或者刻劃 本主題的范圍。其唯一目的是以簡化形式呈現(xiàn)本主題的某些概念,作為以下呈 現(xiàn)的更詳細(xì)描述的序言。本主題一般涉及網(wǎng)絡(luò)搜索和/或瀏覽,尤其涉及確定用戶的網(wǎng)絡(luò)搜索和/ 或瀏覽意圖的系統(tǒng)和方法。利用從網(wǎng)絡(luò)瀏覽器頁面和/或網(wǎng)絡(luò)搜索查詢中提取 的特征,以便于檢測用戶的瀏覽和/或搜索意圖。從這些特征構(gòu)建的機器學(xué)習(xí) 分類器自動檢測用戶的在線商業(yè)意圖(0CI)。用戶的意圖可以是商業(yè)或非商 業(yè)的,其中商業(yè)意圖是信息性或交易性的。在一個實例中,對搜索引擎采用0CI排序機制,以便于提供根據(jù)用戶意圖 排序的搜索結(jié)果。這還提供一種將購買廣告與更有可能準(zhǔn)備進行購買(交易階 段)的潛在顧客相匹配的手段。此外,可以將信息廣告匹配到正研究潛在購買(信息階段)的用戶。因此,可以在廣告拍賣方法和系統(tǒng)中采用這些實例以提 供增強的性能和增加的收入。為了實現(xiàn)以上和相關(guān)目的,本文中結(jié)合以下描述和附圖對實施例的某些說 明性方面進行描述。然而,這些方面僅指示可以采用本主題原理的各種方法中 的幾個,并且本主題旨在包括所有這些方面及其等效方案。結(jié)合附圖考慮以下 詳細(xì)描述,本主題的其它優(yōu)點和新穎特征將變得顯而易見。附圖簡述
圖1是根據(jù)實施例一方面的意圖確定系統(tǒng)的框圖。圖2是根據(jù)實施例一方面的意圖確定系統(tǒng)的另一框圖。圖3是根據(jù)實施例一方面的意圖確定系統(tǒng)的又一框圖。圖4是根據(jù)實施例一方面的意圖確定系統(tǒng)的再一框圖。 圖5是根據(jù)實施例一方面的搜索中意圖變化示例的圖示。 圖6是根據(jù)實施例一方面的在線商業(yè)意圖(0CI)的程度的圖示。 圖7是根據(jù)實施例一方面的構(gòu)建web頁面意圖分類器的示例的圖示。 圖8是根據(jù)實施例一方面的使用web頁面意圖分類器預(yù)測web頁面意圖的 示例的圖示。圖9是根據(jù)實施例一方面的構(gòu)建搜索意圖分類器的示例的圖示。 圖10是根據(jù)實施例一方面的使用web頁面意圖分類器和組合引擎作為搜 索意圖分類器來預(yù)測搜索意圖的示例的圖示。圖11是根據(jù)實施例一方面的在線商業(yè)意圖系統(tǒng)體系結(jié)構(gòu)的示例實現(xiàn)的圖示。圖12是根據(jù)實施例一方面的0CI廣告排序系統(tǒng)的示例實現(xiàn)的圖示。圖13是根據(jù)實施例一方面的在線商業(yè)意圖系統(tǒng)的示例用戶界面的圖示。圖14是根據(jù)實施例一方面的構(gòu)建網(wǎng)絡(luò)瀏覽信息意圖分類器的方法的流程圖。圖15是根據(jù)實施例一方面的對網(wǎng)絡(luò)瀏覽信息的意圖進行分類的方法的流 程圖。圖16是根據(jù)實施例一方面的構(gòu)建搜索意圖分類器的方法的流程圖。圖17是根據(jù)實施例一方面的對搜索信息的意圖進行分類的方法的流程圖。圖18示出一實施例發(fā)揮功能的示例操作環(huán)境。圖19示出一實施例發(fā)揮功能的另一示例操作環(huán)境。詳細(xì)描述現(xiàn)在參照附圖描述主題,其中相同的附圖標(biāo)記用于指示相同的元素。在以 下描述中,出于解釋目的,闡述了許多具體細(xì)節(jié)以便提供對本主題的透徹理解。 然而,顯然,本主題實施例能夠在無需這些具體細(xì)節(jié)的情況下實施。在其它實 例中,以框圖形式示出公知的結(jié)構(gòu)和設(shè)備以便于描述這些實施例。如本申請中所使用的,術(shù)語"組件"旨在指代計算機相關(guān)實體,無論是硬 件、軟硬件組合、軟件還是執(zhí)行中的軟件。例如,組件可以是,但不限于正在 處理器上運行的進程、處理器、對象、可執(zhí)行代碼、執(zhí)行線程、程序和/或計 算機。作為說明,在服務(wù)器上運行的應(yīng)用程序以及該服務(wù)器都可以是計算機組 件。 一個或多個組件可以駐留在進程和/或執(zhí)行線程內(nèi),并且組件可以位于一 個計算機上和/或分布在兩個或多個計算機之間。在線用戶取決于他們是從因特網(wǎng)搜尋信息還是決定要購買的品牌和產(chǎn)品/ 服務(wù)而具有不同的信息需求。對購買階段提供正確的廣告能夠顯著增加廣告戰(zhàn) 役的效率。例如,當(dāng)用戶仍在信息階段時,廣告客戶更適合提供用戶所需產(chǎn)品 的更多選擇,以及誘導(dǎo)用戶返回該站點。另一方面,當(dāng)用戶已經(jīng)處于交易階段, 則廣告客戶最好顯示與具體產(chǎn)品有關(guān)的詳細(xì)價格、特征和/或折扣信息等,以代替充斥許多產(chǎn)品的列表。本文中系統(tǒng)和方法的示例檢測用戶購買意圖的不同程度。即,用戶是否處 于購買過程中,如果是,則他們購買的愿望有多強。在一個實例中,web頁面 (即網(wǎng)絡(luò)瀏覽信息)首先被分類到三種在線商業(yè)分類之一中。接下來,將搜索 査詢分類到三種在線商業(yè)分類之一中。然后,在給定用戶搜索査詢的情況下, 提供適當(dāng)類型的廣告。以這種方式,提供一種更加有效的傳遞適當(dāng)廣告的手段。在圖1中,示出根據(jù)實施例一方面的意圖確定系統(tǒng)100的框圖。意圖確定 系統(tǒng)100由接收網(wǎng)絡(luò)關(guān)聯(lián)信息104并提供在線商業(yè)意圖(0CI) 106的意圖確定組件102組成。意圖確定組件102 —般結(jié)合有使用網(wǎng)絡(luò)關(guān)聯(lián)訓(xùn)練信息的已提取特征和/或內(nèi)容來訓(xùn)練的機器學(xué)習(xí)算法。也可以使用標(biāo)簽以便于該訓(xùn)練。這些標(biāo)簽可以通過基于器官(例如用戶在視覺上確定0CI類型等)的手段和/或通 過基于機器的手段(例如機器學(xué)習(xí)機制等)來提供。一旦執(zhí)行了訓(xùn)練,則意圖確定組件102提取網(wǎng)絡(luò)關(guān)聯(lián)信息104的特征和/ 或內(nèi)容,它們確定了在線商業(yè)意圖106。然后,使用這些特征和/或內(nèi)容來確定 0CI類型,諸如非商業(yè)性、信息性或交易性,隨后將其輸出作為在線商業(yè)意圖 106??蓪λ阉饕娌捎靡鈭D確定系統(tǒng)100以便于0CI驅(qū)動的排序系統(tǒng)、廣告 0CI排序系統(tǒng)、和/或其它基于意圖的系統(tǒng)等等。雖然100通常可用于期望尋找 商品和/或服務(wù)的可能買家的系統(tǒng),但是100還可以在期望尋找無商業(yè)意圖的 用戶的系統(tǒng)中采用。可以將意圖確定系統(tǒng)100無縫地集成到系統(tǒng)中使得它能夠基本上實時地 顯示意圖。例如,搜索web頁面可以在搜索關(guān)鍵詞輸入點附近包括用戶意圖指 示器。能夠用于方便意圖確定的數(shù)據(jù)源包括,但不限于,搜索日志、片段、贊 助鏈接、點擊日志、和/或廣告點擊日志等等。網(wǎng)絡(luò)關(guān)聯(lián)信息104可以包括,但不限于,網(wǎng)絡(luò)瀏覽信息和/或搜索信息等 等。意圖確定系統(tǒng)100可以用于諸如內(nèi)聯(lián)網(wǎng)等的本地網(wǎng)絡(luò)和/或諸如因特網(wǎng)等 的全球網(wǎng)絡(luò)。因此,網(wǎng)絡(luò)瀏覽信息可以包括,但不限于,因特網(wǎng)和/或內(nèi)聯(lián)網(wǎng) web頁面、統(tǒng)一資源定位符(URL)、和/或統(tǒng)計瀏覽數(shù)據(jù)等等。搜索信息可以 包括,但不限于,搜索關(guān)鍵詞和/或短語、和/或統(tǒng)計搜索數(shù)據(jù)等等。參見圖2,示出根據(jù)實施例一方面的意圖確定系統(tǒng)200的另一框圖。意圖 確定系統(tǒng)200由獲取搜索信息204和/或網(wǎng)絡(luò)瀏覽信息206并提供OCI類型208 的意圖確定組件202組成。意圖確定組件202由接收組件210和機器學(xué)習(xí)分類 器組件212組成。接收組件210從諸如內(nèi)聯(lián)網(wǎng)和/或因特網(wǎng)來源等獲取搜索信 息204和/或網(wǎng)絡(luò)瀏覽信息206。搜索信息204和/或網(wǎng)絡(luò)瀏覽信息206表示要 相對于意圖進行分類的信息。因此,接收組件210將所獲得的信息204和/或 206中繼到機器學(xué)習(xí)分類器組件212。機器學(xué)量機(SVM)。使用搜索特征214和/或網(wǎng)絡(luò)瀏覽特征216等來訓(xùn)練意圖模型。 如下文更詳細(xì)描述的,可以對特征(包括搜索關(guān)鍵詞等)進行標(biāo)記和/或提取, 使得它們便于創(chuàng)建能夠基于這些差別特征等來確定意圖的模型。因此,機器學(xué) 習(xí)分類器組件212對搜索信息204和/或網(wǎng)絡(luò)瀏覽信息206進行處理并提供在 線商業(yè)意圖(0CI)類型208 (例如非商業(yè)性、信息性、交易性)。參見圖3,示出根據(jù)實施例一方面的意圖確定系統(tǒng)300的又一框圖。意圖 確定系統(tǒng)300由獲取搜索信息304和/或網(wǎng)絡(luò)瀏覽信息306并提供搜索意圖308 和/或頁面意圖310的意圖確定組件302組成。意圖確定組件302由接收組件 312、搜索意圖分類器組件314、以及頁面意圖分類器組件316組成。接收組件 312從諸如內(nèi)聯(lián)網(wǎng)和/或因特網(wǎng)來源等獲取搜索信息304和/或網(wǎng)絡(luò)瀏覽信息 306。搜索信息304和/或網(wǎng)絡(luò)瀏覽信息306表示要相對于意圖進行分類的信息。頁面意圖分類器組件316確定網(wǎng)絡(luò)瀏覽信息306的意圖并提供頁面意圖 310。 316采用利用網(wǎng)絡(luò)瀏覽特征320進行訓(xùn)練的頁面意圖模型。搜索意圖分類 器組件314采用利用搜索特征318進行訓(xùn)練的搜索意圖模型(可以包括諸如頁 面意圖模型的全部或部分)。搜索意圖分類器組件314從接收組件312接收搜 索信息304,并且通過至少部分地利用基于搜索信息304的搜索結(jié)果以及頁面 意圖分類器組件316來處理搜索信息304,以便于對網(wǎng)絡(luò)瀏覽信息306進行分 類。采用頁面意圖分類器組件316來處理搜索結(jié)果,然后利用所學(xué)習(xí)的組合系 數(shù)(以下詳細(xì)描述)對所確定的意圖進行組合以提供搜索意圖308。參見圖4,示出根據(jù)實施例一方面的意圖確定系統(tǒng)400的再一框圖。意圖 確定系統(tǒng)400由獲取搜索信息404和/或網(wǎng)絡(luò)瀏覽信息406并提供搜索引擎意 圖驅(qū)動排序408和/或基于意圖的網(wǎng)絡(luò)廣告排序410的意圖確定組件402組成。 與意圖確定系統(tǒng)300類似,意圖確定系統(tǒng)400可以用于提供意圖確定以支持不 同類型的系統(tǒng),諸如搜索引擎意圖驅(qū)動排序408和/或基于意圖的網(wǎng)絡(luò)廣告排 序410等等。意圖確定組件402能夠采用利用搜索特征412和/或網(wǎng)絡(luò)瀏覽特 征414進行訓(xùn)練的意圖模型以便于確定意圖。因此,意圖確定系統(tǒng)400能夠提 供用于基于意圖的搜索引擎的在線商業(yè)意圖和/或基于意圖的廣告機制等等。本文中系統(tǒng)和方法的實例提供通過用戶的在線行為(例如瀏覽和/或搜索 網(wǎng)絡(luò))來自動檢測用戶購買意圖(即在線商業(yè)意圖或OCI)的程度的手段。在線廣告的基本商業(yè)原理是用戶的在線活動指示用戶可能處于購買過程中。通 常,購買活動中有兩個主要階段,即信息階段——其中用戶研究品牌和/或產(chǎn) 品/服務(wù)信息,以及交易階段——其中用戶決定購買哪個品牌和/或產(chǎn)品/服務(wù)。圖5示出根據(jù)實施例一方面的搜索中意圖變化的示例500。示例500示出關(guān)于 購買跑車的意圖變化。在線用戶在這兩個不同階段中具有不同的信息需求。對購買階段提供正確 的廣告能夠顯著增加廣告戰(zhàn)役的效率。對于以上示例500,當(dāng)用戶仍然處于搜 索"福特Freestyle"的信息階段502時,廣告客戶最好提供對"福特Freestyle" 的更多信息和/或選擇,和/或誘導(dǎo)用戶返回商家的web站點,而不僅是向用戶 提供福特Freestyle汽車之一和價格標(biāo)簽。另一方面,當(dāng)用戶已經(jīng)處于交易階 段504時,搜索"坎貝爾福特奈爾斯密歇根",廣告客戶最好顯示例如與 汽車商有關(guān)的詳細(xì)價格、特征和/或折扣信息等,而不是充斥許多其它汽車的 列表。用戶不同程度的購買意圖,即用戶是否處于購買過程中,如果是則用戶購 買的愿望有多強,被定義為在線商業(yè)意圖并在圖6的圖表600中示出。首先, 在線活動被分成兩組,商業(yè)性602 (例如用戶瀏覽在線商店產(chǎn)品購買頁面和/ 或產(chǎn)品/價格比較站點等)以及非商業(yè)性604 (例如用戶瀏覽學(xué)術(shù)課程頁面、政 府頁面和/或新聞頁面等)。對于商業(yè)活動,基于用戶在在線購買過程中通常 歷經(jīng)的兩個階段來定義兩個子類,這兩個階段即信息性——當(dāng)用戶研究產(chǎn)品和 /或服務(wù)時以及交易性——當(dāng)用戶有強烈的購買意圖(例如準(zhǔn)備將物品放入購 物車和/或意愿清單中)。本文中系統(tǒng)和方法的實例可以用于提供自動檢測網(wǎng)絡(luò)瀏覽活動背后的在 線商業(yè)意圖和/或自動檢測網(wǎng)絡(luò)搜索活動背后的在線商業(yè)意圖的手段。為了自 動將web頁面/或搜索査詢分類到正確的意圖,基于從web頁面和/或搜索查詢 提取的特征來構(gòu)建機器學(xué)習(xí)分類器。一實例還可用于提供OCI驅(qū)動的排序機制。傳統(tǒng)搜索弓I擎基于來自搜索査 詢的關(guān)鍵詞與來自web頁面內(nèi)容的關(guān)鍵詞之間的內(nèi)容相似性來提供信息。OCI 驅(qū)動的排序提出與所瀏覽的web頁面和/或搜索査詢背后的意圖相匹配的信息。 這種排序機制能夠基本上改進用戶滿意度,尤其是對提供廣告而言。另一實例為廣告出價系統(tǒng)提供0CI。例如可以對在具有極強購買意圖的web頁面上示出 廣告設(shè)置較高的價格,等等。其它實例可用于便于系統(tǒng)和/或方法確定在線用 戶是否旨在購買和/或該用戶購買意愿有多強。例如,本文中系統(tǒng)和方法的實例可以用于將web頁面(例如包括廣告頁面) 和/或搜索查詢分類到三種在線商業(yè)意圖中,即非商業(yè)性、商業(yè)一信息性(即 "信息性")、以及商業(yè)一交易性(即"交易性")。例如,實例還可以利用 諸如頁面意圖分類器將web頁面自動分類到三種在線商業(yè)意圖中。此外,實例 還可以利用諸如搜索意圖分類器將搜索査詢自動分類到三種在線商業(yè)意圖中。 而且此外,實例還可以提供優(yōu)化從搜索查詢檢索在線商業(yè)意圖的性能的機器學(xué) 習(xí)算法。在圖7中,示出根據(jù)實施例一方面的構(gòu)建web頁面意圖分類器708的示例 700的圖示。首先,對web頁面特征提取704使用帶有意圖標(biāo)簽的訓(xùn)練web頁 面702。所提取的特征區(qū)分來自web頁面內(nèi)容的不同頁面OCI。通過使用來自 訓(xùn)練web頁面702的意圖標(biāo)簽以及來自web頁面特征提取704的提取特征,實 現(xiàn)模型訓(xùn)練706。應(yīng)用機器訓(xùn)練算法,來基于所提取的特征(例如關(guān)鍵詞模式、 位置、鏈接、布局等)訓(xùn)練模型以提供web頁面意圖分類器708。參見圖8,示出根據(jù)實施例一方面的使用web頁面意圖分類器預(yù)測web頁 面意圖的示例800的圖示。當(dāng)獲取了web頁面802以供分類時,進行web頁面 特征提取804。所提取的特征至少部分地是在訓(xùn)練階段使用的特征。然后,web 頁面意圖分類器806使用所提取的特征(例如關(guān)鍵詞模式、位置、鏈接、布局 等)以基于該web頁面802的在線商業(yè)意圖確定web頁面意圖。轉(zhuǎn)向圖9,示出根據(jù)實施例一方面的構(gòu)建搜索意圖分類器912的示例900 的圖示。帶有標(biāo)記意圖902的查詢由搜索引擎904進行處理。將從搜索引擎904 返回的結(jié)果頁面和/或該搜索的前N個結(jié)果(其中N是從1到無窮大的整數(shù)) 發(fā)送給web頁面意圖分類器906。通常,在優(yōu)化方法中使用第一 (或最高排序) 結(jié)果頁面。搜索結(jié)果頁面可以包含例如查詢片段、贊助鏈接和/或與搜索查詢 相關(guān)的其它信息等等。搜索結(jié)果頁面和/或前N個結(jié)果的每一個都被視為web 頁面。web頁面意圖分類器906為搜索結(jié)果頁面和/或每個搜索結(jié)果確定OCI。 例如在某些實例中,web頁面意圖分類器906可以包括特別構(gòu)建成處理搜索結(jié)果頁面的特別固定頁面結(jié)構(gòu)的頁面分類器。組合引擎908組合從搜索引擎904 返回的搜索結(jié)果頁面和/或前N個搜索結(jié)果的0CI,以為帶有標(biāo)記意圖902的査 詢計算搜索意圖,從而提供搜索意圖分類器912。在此,組合引擎908中的N 和權(quán)重系數(shù)被優(yōu)化,以便獲得最佳分類準(zhǔn)確性。在一個實例中,組合引擎908利用搜索結(jié)果的線性組合??梢岳脦в袠?biāo) 記意圖902的査詢來訓(xùn)練組合系數(shù)910??梢岳脵C器學(xué)習(xí)算法來調(diào)諧這些參 數(shù)。web頁面意圖分類器906和組合引擎908可以一起使用,作為搜索意圖分 類器912。本領(lǐng)域技術(shù)人員可以意識到,可以使用其它參數(shù)來代替和/或擴充前 N個結(jié)果,并且仍在本文中系統(tǒng)和方法的范圍之內(nèi)。例如,也可以使用諸如搜 索日志、片段、贊助鏈接、點擊日志和/或廣告點擊日志等的其它數(shù)據(jù)源。參照圖10,示出根據(jù)實施例一方面的將web頁面意圖分類器1006和組合 引擎1008用作搜索意圖分類器1012來預(yù)測搜索意圖的示例的圖示。當(dāng)搜索查 詢1002傳入時,將該搜索査詢1002發(fā)送到搜索引擎1004。搜索結(jié)果頁面和/ 或前P個搜索結(jié)果被搜索引擎1004獲得,其中P是從1到無窮大的整數(shù)(并 且可與N不同)。搜索結(jié)果頁面和/或前P個結(jié)果被視為各個web頁面。然后, 將每個web頁面?zhèn)鬟f到為每個搜索結(jié)果確定OCI的web頁面意圖分類器1006。 例如在某些實例中,web頁面意圖分類器1006可以包括特別構(gòu)建成處理搜索結(jié) 果頁面的特別固定頁面結(jié)構(gòu)的頁面分類器。然后,將0CI傳遞給組合引擎1008。 組合引擎1008可以將經(jīng)優(yōu)化的系數(shù)應(yīng)用到OCI并返回經(jīng)組合的OCI作為該査 詢的搜索意圖1010。本領(lǐng)域技術(shù)人員可以意識到,可以使用其它參數(shù)來代替和 /或擴充前P個結(jié)果,并且仍在本文中系統(tǒng)和方法的范圍之內(nèi)。例如,也可以 使用諸如搜索日志、片段、贊助鏈接、點擊日志和/或廣告點擊日志等的其它 數(shù)據(jù)源。參見圖11,示出根據(jù)實施例一方面的在線商業(yè)意圖系統(tǒng)體系結(jié)構(gòu)1100的 示例實現(xiàn)的圖示。體系結(jié)構(gòu)1100在一個系統(tǒng)中提供訓(xùn)練進程、在線進程和特 征提取進程(其中Q表示從1到無窮大的整數(shù))。參見圖12,示出根據(jù)實施例 一方面的OCI廣告排序系統(tǒng)1200的示例實現(xiàn)的圖示(其中Z表示從1到無窮 大的整數(shù))。本文中系統(tǒng)和方法的實例還可以被納入如圖13所示的示例用戶 界面1300中。用于搜索輸入的工具欄1302顯示搜索査詢1304,隨后顯示OCI1306。如果用戶點擊OCI 1306,則出現(xiàn)輔助顯示1308,示出OCI類型的百分 比。就以上所示或所述的示例性系統(tǒng)而言,可以參照圖14-17的流程圖更好地 理解可根據(jù)實施例實現(xiàn)的方法。雖然出于說明簡潔目的,可將這些方法示出和 描述為一系列框,但是應(yīng)該理解和意識到,這些實施例并不受框次序的限制, 因為根據(jù)一實施例,某些框可以與本文所示和所述的不同次序和/或與其它框 并發(fā)進行。此外,并非所有示出的框都是實現(xiàn)根據(jù)本發(fā)明的方法所必須的。可以在由一個或多個組件執(zhí)行的諸如程序模塊的計算機可執(zhí)行指令的一 般上下文中描述這些實施例。通常,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽 象數(shù)據(jù)類型的例程、程序、對象、數(shù)據(jù)結(jié)構(gòu)等。通常,可以按照實施例各個實 例中所需要地對程序模塊的功能進行組合和分布。圖14中,示出根據(jù)實施例一方面的構(gòu)建網(wǎng)絡(luò)瀏覽信息意圖分類器的方法 1400的流程圖。方法1400通過獲取網(wǎng)絡(luò)瀏覽信息以便于模型訓(xùn)練1404而在 1402開始。網(wǎng)絡(luò)瀏覽信息可以包括,但不限于,因特網(wǎng)和/或內(nèi)聯(lián)網(wǎng)web頁面、 統(tǒng)一資源定位符(URL)、和/或統(tǒng)計瀏覽數(shù)據(jù)等等。然后,從網(wǎng)絡(luò)瀏覽信息提 取意圖區(qū)分特征和/或內(nèi)容1406。這些特征/內(nèi)容便于區(qū)分在線商業(yè)意圖(OCI) 的不同類型,即非商業(yè)性、信息性和交易性。這些特征可以包括,但不限于, 關(guān)鍵詞模式、位置、鏈接和/或布局等。應(yīng)用機器學(xué)習(xí)進程以基于所提取的特 征和/或內(nèi)容訓(xùn)練意圖模型1408。機器學(xué)習(xí)進程可以包括例如基于SVM的學(xué)習(xí) 等等。然后,基于意圖模型構(gòu)建網(wǎng)絡(luò)瀏覽信息意圖分類器1410,結(jié)束流程1412。 可以采用該分類器以便于確定例如web頁面等的OCI類型。參見圖15,示出根據(jù)實施例一方面的對網(wǎng)絡(luò)瀏覽信息的意圖進行分類的 方法1500的流程圖。方法1500通過獲取網(wǎng)絡(luò)瀏覽信息以供分類1504而開始 1502。網(wǎng)絡(luò)瀏覽信息可以包括,但不限于,因特網(wǎng)和/或內(nèi)聯(lián)網(wǎng)web頁面、統(tǒng) 一資源定位符(URL)、和/或統(tǒng)計瀏覽數(shù)據(jù)等等。例如,信息可以源自廣告系 統(tǒng)、直接來自用戶、和/或來自需要搜索結(jié)果頁面被處理的搜索引擎等等。然 后,從網(wǎng)絡(luò)瀏覽信息提取意圖特征和/或內(nèi)容1506。然后,使用網(wǎng)絡(luò)瀏覽信息 意圖分類器來確定網(wǎng)絡(luò)瀏覽信息的意圖1508,結(jié)束流程1510。網(wǎng)絡(luò)瀏覽信息意圖分類器將所提取的意圖特征和/或內(nèi)容與區(qū)分在線商業(yè)意圖(0CI)的不同 類型的特征進行比較以確定意圖。參照圖16,示出根據(jù)實施例一方面的構(gòu)建搜索意圖分類器的方法1600的 流程圖。方法1600通過獲取標(biāo)記意圖的查詢信息1604而開始1602。查詢信 息可以包括,但不限于,搜索關(guān)鍵詞和/或短語、和/或統(tǒng)計搜索數(shù)據(jù)等等。然 后,用搜索引擎對標(biāo)記查詢信息進行處理以尋找搜索結(jié)果頁面和/或前"N"個 查詢結(jié)果1606,其中"N"是從1到無窮大的整數(shù)。通常,在優(yōu)化方法中使用 第一 (或最高排序)結(jié)果頁面。搜索結(jié)果頁面可以包含例如査詢片段、贊助鏈 接和/或與搜索查詢相關(guān)的其它信息等等。然后經(jīng)由采用網(wǎng)絡(luò)瀏覽信息意圖分 類器來確定與搜索結(jié)果頁面和/或每一前"N"查詢結(jié)果相關(guān)聯(lián)的網(wǎng)絡(luò)瀏覽信息 的意圖1608。例如在某些實例中,網(wǎng)絡(luò)瀏覽信息意圖分類器可以包括特別構(gòu)建 成處理搜索結(jié)果頁面的特別固定頁面結(jié)構(gòu)的意圖分類器。利用所學(xué)習(xí)的組合系 數(shù)來組合來自搜索結(jié)果頁面和/或前"N"個查詢結(jié)果的意圖,以構(gòu)建搜索意圖 分類器1610,結(jié)束流程1612。可以采用機器學(xué)習(xí),以便于組合系數(shù)的學(xué)習(xí)。 本領(lǐng)域技術(shù)人員可以意識到,可以使用其它參數(shù)來代替或擴充搜索結(jié)果頁面和 /或前N個結(jié)果,并且仍在本文中系統(tǒng)和方法的范圍之內(nèi)。例如,也可以使用 諸如搜索日志、片段、贊助鏈接、點擊日志和/或廣告點擊日志等的其它數(shù)據(jù) 源。參見圖17,示出根據(jù)實施例一方面的對搜索信息的意圖進行分類的方法 1700的流程圖。方法1700通過獲取查詢信息以供分類1704而開始1702。然 后,用搜索引擎對査詢信息進行處理以尋找搜索結(jié)果頁面和/或前"P"個查詢 結(jié)果1706,其中"P"是從1到無窮大的整數(shù)(注意用于訓(xùn)練查詢意圖模型 的結(jié)果數(shù)量不必與用于對查詢意圖進行分類的結(jié)果數(shù)量相同)。通常,在優(yōu)化 方法中使用第一 (或最高排序)結(jié)果頁面。搜索結(jié)果頁面可以包含例如查詢片 段、贊助鏈接和/或與搜索査詢相關(guān)的其它信息等等。然后經(jīng)由采用網(wǎng)絡(luò)瀏覽 信息意圖分類器來確定與搜索結(jié)果頁面和/或每一前"P"個査詢結(jié)果相關(guān)聯(lián)的 網(wǎng)絡(luò)瀏覽信息的意圖1708。網(wǎng)絡(luò)瀏覽信息意圖分類器可以按照以上方法1400 構(gòu)建并按照以上方法1500使用。例如在某些實例中,網(wǎng)絡(luò)瀏覽信息意圖分類 器可以包括特別構(gòu)建成處理搜索結(jié)果頁面的特別固定頁面結(jié)構(gòu)的意圖分類器。通過使用所學(xué)習(xí)的組合系數(shù)對來自搜索結(jié)果頁面和/或前"P"個查詢結(jié)果的意圖進行組合,來確定搜索意圖1710,結(jié)束流程1712。本領(lǐng)域技術(shù)人員可以意 識到,可以使用其它參數(shù)來代替或擴充搜索結(jié)果頁面和/或前"N"個結(jié)果,并 且仍在本文中系統(tǒng)和方法的范圍之內(nèi)。例如,也可以使用諸如搜索日志、片段、 贊助鏈接、點擊日志和/或廣告點擊日志等的其它數(shù)據(jù)源。為了提供實現(xiàn)實施例各個方面的附加上下文,圖18和以下討論旨在提供 可以執(zhí)行本發(fā)明各方面的合適計算環(huán)境1800的簡要、 一般描述。雖然以上在 運行于本地計算機和/或遠(yuǎn)程計算機的計算機程序的計算機可執(zhí)行指令的一般 上下文中對實施例進行了描述,但是本領(lǐng)域技術(shù)人員可以認(rèn)識到,也可以結(jié)合 其它程序模塊執(zhí)行這些實施例。通常,程序模塊包括執(zhí)行特定任務(wù)和/或?qū)崿F(xiàn) 特定抽象數(shù)據(jù)類型的例程、程序、組件、數(shù)據(jù)結(jié)構(gòu)等。此外,本領(lǐng)域技術(shù)人員 會意識到,可以采用其它計算機系統(tǒng)配置來實踐本發(fā)明的方法,包括單處理器 或多處理器計算機系統(tǒng)、小型計算機、大型計算機以及個人計算機、手持式計 算設(shè)備、基于微處理器和/或可編程消費電子產(chǎn)品等等,其中每個都能夠與一 個或多個關(guān)聯(lián)設(shè)備有效通信。還可以在分布式計算環(huán)境中實踐本發(fā)明的所示方 面,其中特定任務(wù)可以通過經(jīng)由通信網(wǎng)絡(luò)鏈接的遠(yuǎn)程處理設(shè)備來執(zhí)行。然而,即使不是實施例的全部方面,實施例的部分也可以在獨立計算機上實踐。在分 布式計算環(huán)境中,程序模塊可以位于本地和/或遠(yuǎn)程存儲器存儲設(shè)備中。參照圖18,用于執(zhí)行實施例各方面的示例性系統(tǒng)環(huán)境1800包括常規(guī)計算 機1802,包括處理單元1804、系統(tǒng)存儲器1806和將包括系統(tǒng)存儲器在內(nèi)的各 種系統(tǒng)組件耦合到處理單元1804的系統(tǒng)總線1808。處理單元1804可以是任何 市場上可購買的或?qū)S锰幚砥鳌4送?,處理單元可以實現(xiàn)為由諸如并行連接的 一個以上處理器形成的多處理器。系統(tǒng)總線1808可以是若干類型總線結(jié)構(gòu)中任一種,包括存儲器總線或存 儲器控制器、外圍總線和使用諸如PCI、 VESA、微信道、ISA、和EISA的各種 常規(guī)總線體系結(jié)構(gòu)中任一種的局域總線。系統(tǒng)存儲器1806包括只讀存儲器 (ROM) 1810和隨機存取存儲器(RAM) 1812?;据斎?輸出系統(tǒng)(BIOS) 1814 存儲在ROM 1810中,包含幫助在諸如啟動期間在計算機1802內(nèi)元件之間傳遞 信息的基本例程。計算機1802還包括諸如對可移動磁盤1820讀寫的硬盤驅(qū)動器1816、磁 盤驅(qū)動器1828,以及對CD-R0M盤1824或其它光學(xué)介質(zhì)讀寫的光盤驅(qū)動器1822。 硬盤驅(qū)動器1816,磁盤驅(qū)動器1818和光盤驅(qū)動器1822分別通過硬盤驅(qū)動器接 口 1826、磁盤驅(qū)動器接口 1828和光盤驅(qū)動器接口 1830連接于系統(tǒng)總線1808。 驅(qū)動器1816-1822及其關(guān)聯(lián)計算機可讀介質(zhì)為計算機1802提供數(shù)據(jù)、數(shù)據(jù)結(jié) 構(gòu)、計算機可執(zhí)行指令等的非易失性存儲。雖然以上計算機可讀介質(zhì)的描述涉 及硬盤、可移動磁盤和CD,但是本領(lǐng)域技術(shù)人員應(yīng)該意識到,在示例性操作環(huán) 境1800中還可以使用可由計算機讀取的其它類型介質(zhì),諸如磁帶盒、閃存、 數(shù)字視頻盤、貝努利盒式磁帶等,并且任何這種介質(zhì)可以包含用于執(zhí)行本實施 例方法的計算機可執(zhí)行指令。多個程序模塊可以存儲在驅(qū)動器1816-1822和RAM 1812中,包括操作系 統(tǒng)1832、 一個或多個應(yīng)用程序1834、其它程序模塊1836和程序數(shù)據(jù)1838。操 作系統(tǒng)1832可以是任何合適的操作系統(tǒng)或操作系統(tǒng)的組合。通過示例,應(yīng)用 程序1834和程序模塊1836可以包括根據(jù)實施例的一方面的意圖確定方案。用戶能夠通過諸如鍵盤1840和定點設(shè)備(例如鼠標(biāo)1842)的一個或多個 用戶輸入設(shè)備向計算機1802中輸入命令和信息。其它輸入設(shè)備(未輸出)可 以包括麥克風(fēng)、操縱桿、游戲手柄、圓盤式衛(wèi)星天線、無線遙控、掃描儀等。 這些和其它輸入設(shè)備通常經(jīng)由耦合到系統(tǒng)總線1808的串行端口接口 1844連接 到處理單元1804,但是可以通過諸如并行端口、游戲端口或通用串行總線(USB) 的其它接口連接。還可以經(jīng)由視頻適配器1848將監(jiān)視器1846或其它類型的顯 示設(shè)備連接到系統(tǒng)總線1808。除了監(jiān)視器1846之外,計算機1802可以包括其 它外圍輸出設(shè)備(未輸出),諸如揚聲器、打印機等。應(yīng)該意識到,計算機1802能夠在使用到一個或多個遠(yuǎn)程計算機1860的邏 輯連接的網(wǎng)絡(luò)化環(huán)境中操作。遠(yuǎn)程計算機1860可以是工作站、服務(wù)器計算機、 路由器、對等設(shè)備或其它公共網(wǎng)絡(luò)結(jié)點,并且通常包括相關(guān)于計算機1802描 述的元件的某些或全部,雖然出于簡潔目的,在圖18中只示出存儲器存儲設(shè) 備1862。圖18所示的邏輯連接可以包括局域網(wǎng)(LAN) 1864和廣域網(wǎng)(WAN) 1866。這種網(wǎng)絡(luò)環(huán)境在辦公室、企業(yè)范圍計算機網(wǎng)絡(luò)、內(nèi)聯(lián)網(wǎng)和因特網(wǎng)中十分 常見。例如,當(dāng)在LAN聯(lián)網(wǎng)環(huán)境中使用時,計算機1802經(jīng)由網(wǎng)絡(luò)接口或適配器 1868連接到局域網(wǎng)1864。當(dāng)在WAN聯(lián)網(wǎng)環(huán)境中使用時,計算機1802通常包括 調(diào)制解調(diào)器(例如電話、DSL、纜線等)1870,或者連接到LAN上的通信服務(wù) 器,或者具有用于在諸如因特網(wǎng)的WAN 1866上建立通信的其它裝置。對計算 機1802或為內(nèi)置或為外置的調(diào)制解調(diào)器1870經(jīng)由串行端口接口 1844連接到 系統(tǒng)總線1808。在網(wǎng)絡(luò)化環(huán)境中,程序模塊(包括應(yīng)用程序1834)和/或程序 數(shù)據(jù)1838可以存儲在遠(yuǎn)程存儲器存儲設(shè)備1862中。應(yīng)該意識到,所示網(wǎng)絡(luò)連 接是示例性的,并且在執(zhí)行實施例一方面時可以使用在計算機1802與1860之 間建立通信鏈路的其它裝置(例如有線或無線)。根據(jù)計算機編程領(lǐng)域中技術(shù)人員的實踐,除非另行指出,否則參照由諸如 計算機1802或遠(yuǎn)程計算機1860之類的計算機所執(zhí)行動作和操作的符號表示來 描述實施例。這些動作和操作有時被稱為計算機執(zhí)行。應(yīng)該意識到,這些動作 和符號表示的操作包括由處理單元1804對表示導(dǎo)致電信號表示的變換或縮減 的數(shù)據(jù)位的電信號的操控,以及數(shù)據(jù)位在存儲器系統(tǒng)(包括系統(tǒng)存儲器1806、 硬盤驅(qū)動器1816、軟盤1820、 CD-ROM 1824和遠(yuǎn)程存儲器1862)的存儲器位 置上的維護以重新配置或以其他方式改變計算機系統(tǒng)操作、以及其它信號處 理。維護這些數(shù)據(jù)位的存儲器位置是具有與數(shù)據(jù)位對應(yīng)的特定電、磁或光性質(zhì) 的物理位置。圖19是實施例能夠交互的示例計算環(huán)境1900的另一框圖。系統(tǒng)1900還 示出包括一個或多個客戶機1902的系統(tǒng)??蛻魴C1902可以是硬件和/或軟件(例如線程、進程、計算設(shè)備)。系統(tǒng)1900還包括一個或多個服務(wù)器1904。 服務(wù)器1904也可以是硬件和/或軟件(例如線程、進程、計算設(shè)備)??蛻魴C 1902與服務(wù)器1904之間的一種可能通信可以采用適于在兩個或多個計算進程 之間傳送的數(shù)據(jù)分組的形式。系統(tǒng)1900包括可以采用以便于客戶機1902與服 務(wù)器1904之間通信的通信框架1908??蛻魴C1902連接到可用于將信息存儲到 客戶機1902本地的一個或多個客戶機數(shù)據(jù)存儲1910。類似地,服務(wù)器1904 連接到可用于將信息存儲到服務(wù)器1904本地的一個或多個服務(wù)器數(shù)據(jù)存儲 1906。應(yīng)該意識到,實施例的系統(tǒng)和/或方法可以在便于計算機組件和非計算機 相關(guān)組件等的意圖確定中使用。此外,本領(lǐng)域技術(shù)人員會認(rèn)識到,實施例的系 統(tǒng)和/或方法可以在大量相關(guān)電子技術(shù)中采用,包括但不限于計算機、服務(wù)器 和/或手持式電子設(shè)備等。以上所描述的包括實施例的示例。當(dāng)然,不可能為了描述實施例而描述組 件或方法的所有可構(gòu)想組合,但是本領(lǐng)域技術(shù)人員可以認(rèn)識到,本發(fā)明的許多 其它組合和排列也有可能。相應(yīng)地,本主題旨在涵蓋落在所附權(quán)利要求書的精 神和范圍內(nèi)的所有這些更改、修改和變化。此外,就在詳細(xì)描述或權(quán)利要求書 中使用的術(shù)語"包含"而言,該術(shù)語旨在以與術(shù)語"包括"類似的方式表示包 括性,如同"包含"在權(quán)利要求中用作過渡詞匯時所解讀的一樣。
權(quán)利要求
1.一種便于確定意圖的系統(tǒng),包括接收至少部分地包括搜索信息和/或網(wǎng)絡(luò)瀏覽信息的網(wǎng)絡(luò)關(guān)聯(lián)信息的組件;以及分類器組件,確定所述網(wǎng)絡(luò)關(guān)聯(lián)信息的意圖并提供所述搜索信息和/或網(wǎng)絡(luò)瀏覽信息的在線商業(yè)意圖類型。
2. 如權(quán)利要求1所述的系統(tǒng),其特征在于,所述分類器組件采用根 據(jù)所述網(wǎng)絡(luò)瀏覽信息的所提取特征和/或內(nèi)容訓(xùn)練的意圖模型。
3. 如權(quán)利要求1所述的系統(tǒng),其特征在于,所述分類器組件采用根 據(jù)搜索結(jié)果頁面和/或前N個搜索結(jié)果的列表以及組合系數(shù)訓(xùn)練的意圖模型, 其中N是從1到無窮大的整數(shù)。
4. 如權(quán)利要求1所述的系統(tǒng),其特征在于,所述在線商業(yè)意圖類型 包括非商業(yè)意圖、信息意圖或交易意圖。
5. 如權(quán)利要求1所述的系統(tǒng),其特征在于,所述分類器組件利用網(wǎng) 絡(luò)瀏覽器信息分類器以便于對至少一個搜索查詢進行分類。
6. 如權(quán)利要求1所述的系統(tǒng),其特征在于,所述分類器組件采用機 器學(xué)習(xí)以便于確定意圖。
7. 如權(quán)利要求1所述的系統(tǒng),其特征在于,所述網(wǎng)絡(luò)瀏覽信息包括 至少一個web頁面和/或至少一個搜索結(jié)果頁面。
8. —種采用如權(quán)利要求1所述的系統(tǒng)以便于基于搜索意圖對搜索結(jié)果排序的搜索引擎。
9. 一種采用如權(quán)利要求1所述的系統(tǒng)以便于確定在線廣告的定價和/或?qū)V告關(guān)聯(lián)到網(wǎng)絡(luò)關(guān)聯(lián)信息的在線廣告系統(tǒng)。
10. —種便于確定意圖的方法,包括 從網(wǎng)絡(luò)獲取瀏覽訓(xùn)練信息以便于模型訓(xùn)練; 從所述網(wǎng)絡(luò)瀏覽訓(xùn)練信息提取意圖區(qū)分特征和/或內(nèi)容; 應(yīng)用機器學(xué)習(xí)進程以基于所提取的特征和/或內(nèi)容訓(xùn)練意圖模型;以及 基于所述意圖模型構(gòu)建網(wǎng)絡(luò)瀏覽信息意圖分類器。
11. 如權(quán)利要求10所述的方法,其特征在于,還包括 將所述網(wǎng)絡(luò)瀏覽信息意圖分類器構(gòu)建成至少部分地包括便于處理搜索結(jié)果頁面的結(jié)構(gòu)特征的意圖分類器。
12. 如權(quán)利要求10所述的方法,其特征在于,還包括 從網(wǎng)絡(luò)獲取瀏覽信息用于意圖分類; 從所述網(wǎng)絡(luò)瀏覽信息提取至少一個意圖特征;以及 采用所述網(wǎng)絡(luò)瀏覽信息意圖分類器來確定所述網(wǎng)絡(luò)瀏覽信息的意圖。
13. 如權(quán)利要求12所述的方法,其特征在于,還包括: 將web頁面自動分類到在線商業(yè)意圖(0CI)類型中。
14. 如權(quán)利要求IO所述的方法,其特征在于,還包括 獲取標(biāo)記意圖的查詢信息以便于搜索意圖模型訓(xùn)練;用搜索引擎處理所述標(biāo)記意圖的査詢信息以確定搜索結(jié)果頁面和/或前N 個査詢結(jié)果的列表,其中N是從1到無窮大的整數(shù);經(jīng)由采用所述網(wǎng)絡(luò)瀏覽信息意圖分類器,確定與所述搜索結(jié)果頁面和/或的瀏覽信息的意圖;以及至少部分地利用組合系數(shù)對來自所述搜索結(jié)果頁面和/或所述前N個查詢 結(jié)果的意圖進行組合,以構(gòu)建搜索意圖分類器。
15. 如權(quán)利要求14所述的方法,其特征在于,還包括 獲得查詢信息以供意圖分類;用搜索引擎處理所述査詢信息以確定搜索結(jié)果頁面和/或前p個查詢結(jié)果的列表,其中P是從1到無窮大的整數(shù);經(jīng)由采用所述網(wǎng)絡(luò)瀏覽信息意圖分類器,確定與所述搜索結(jié)果頁面和/或每一前P個査詢結(jié)果相關(guān)聯(lián)的網(wǎng)絡(luò)瀏覽信息的意圖;以及通過至少部分地利用所述組合系數(shù)對來自所述搜索結(jié)果頁面和/或所述前 p個査詢結(jié)果的意圖進行組合,來確定搜索意圖。
16. 如權(quán)利要求15所述的方法,其特征在于,還包括 采用機器學(xué)習(xí)算法來便于優(yōu)化檢測搜索查詢意圖的性能;
17. 如權(quán)利要求15所述的方法,其特征在于,還包括 將所述查詢信息自動分類到在線商業(yè)意圖(0CI)類型中。
18. —種至少部分地釆用如權(quán)利要求15所述的方法的廣告銷售方法。
19. 一種便于確定意圖的系統(tǒng),包括接收至少部分地包括搜索信息和/或網(wǎng)絡(luò)瀏覽信息的網(wǎng)絡(luò)關(guān)聯(lián)信息的裝置;確定所述網(wǎng)絡(luò)關(guān)聯(lián)信息的意圖的裝置;以及提供所述搜索信息和/或網(wǎng)絡(luò)瀏覽信息的在線商業(yè)意圖類型的裝置。
20. —種采用如權(quán)利要求1所述的系統(tǒng)的設(shè)備,包括選自計算機、服 務(wù)器和手持式電子設(shè)備中的至少一個。
全文摘要
利用從網(wǎng)絡(luò)瀏覽器頁面和/或網(wǎng)絡(luò)搜索查詢中提取的特征,以便于檢測用戶的瀏覽和/或搜索意圖。從這些特征構(gòu)建的機器學(xué)習(xí)分類器自動檢測用戶的在線商業(yè)意圖(OCI)。用戶的意圖可以是商業(yè)性或非商業(yè)性的,其中商業(yè)意圖是信息性或交易性的。在一個實例中,對搜索引擎采用OCI排序機制,以便于提供根據(jù)用戶意圖排序的搜索結(jié)果。這還提供一種將購買廣告與更有可能準(zhǔn)備進行購買(交易階段)的潛在顧客相匹配的手段。此外,可以將信息廣告匹配到研究潛在(信息階段)的用戶。
文檔編號G06F17/00GK101331475SQ200680046842
公開日2008年12月24日 申請日期2006年11月13日 優(yōu)先權(quán)日2005年12月14日
發(fā)明者L·王, L·趙, Y·李, 文繼榮, 聶再清 申請人:微軟公司