專利名稱:共同選擇圖像分類的制作方法
技術(shù)領(lǐng)域:
本公開涉及數(shù)據(jù)處理,具體地涉及圖像分類。
背景技術(shù):
用戶可以通過將搜索查詢提交給搜索引擎來定位在因特網(wǎng)上可獲得的圖像。搜索查詢可以是文本查詢,其包括描述用戶正試圖定位的圖像主題的詞。搜索系統(tǒng)識別對應(yīng)于該主題的圖像,并且提供包括對所識別的圖像的引用的圖像搜索結(jié)果。圖像可以例如基于與圖像相關(guān)聯(lián)的標(biāo)簽和/或在圖像與其一起展現(xiàn)的網(wǎng)頁上的圖像附近出現(xiàn)的文本來識別。所識別的圖像可以是例如與網(wǎng)頁一起展現(xiàn)的圖像。許多不同類別的網(wǎng)頁可以包括響應(yīng)于搜索查詢而識別的圖像。例如,圖像與可以由許多不同個體發(fā)布的網(wǎng)頁一起提供,所述網(wǎng)頁諸如網(wǎng)絡(luò)博客(“博客”)、社交網(wǎng)絡(luò)頁面以及新聞組。在單個域(例如,www. example, com)內(nèi),可能存在數(shù)千網(wǎng)頁,其中的許多具有不同的單獨作者。由于大量不同作者創(chuàng)建位于同一域中的網(wǎng)頁,可能困難的是,將通過該域提供的圖像分類為屬于共同主題。例如,在單個博客域內(nèi),用戶可能發(fā)布針對范圍從運動到政治、 養(yǎng)育建議或甚至露骨(例如,色情)主題的主題的博客。因此,如果通過共同域可獲得的每一個圖像被分類為屬于共同主題,則圖像可能沒有被準(zhǔn)確分類。與圖像相關(guān)聯(lián)的標(biāo)簽和/或在圖像附近出現(xiàn)的文本可能不準(zhǔn)確地描述圖像的主題或在不同主題之間是有歧義的。例如,在博客中出現(xiàn)的貝比魯斯的圖像可以與文本“貝比”相關(guān)聯(lián)。雖然該文本與圖像有關(guān),但是可能的是,圖像可能是貝比魯斯、扮演貝比魯斯的演員、在名為“貝比”的電影中主演的小豬的,或甚至露骨圖像。提供與用戶查詢的主題較不相關(guān)的圖像可能減少圖像搜索結(jié)果的質(zhì)量。當(dāng)包括露骨內(nèi)容(例如,色情描繪)的圖像在對未針對該露骨內(nèi)容的查詢作出響應(yīng)的搜索結(jié)果中被引用時,這尤其如此。例如,對正搜索貝比魯斯的圖像的用戶而言,包括露骨圖像的響應(yīng)于對“貝比電影”的搜索查詢的搜索結(jié)果可能顯著降低搜索結(jié)果的質(zhì)量。當(dāng)圖像被準(zhǔn)確分類,使得與用戶查詢不相關(guān)的圖像可以被過濾或抑制時,可以提高圖像搜索結(jié)果的質(zhì)量。
發(fā)明內(nèi)容
圖像分類系統(tǒng)對圖像選擇數(shù)據(jù)進行分析以基于先前選擇的圖像屬于的主題來對圖像分類并且加標(biāo)簽(to label)。然后可以使用這些標(biāo)簽來過濾圖像搜索結(jié)果,以移除對與除搜索查詢針對的主題外的主題更相關(guān)的圖像的引用。另外,可以使用標(biāo)簽來過濾針對主題(例如,露骨內(nèi)容)的所有圖像,除非用戶選擇使對這些圖像的引用展現(xiàn)。還可以使用標(biāo)簽來基于圖像屬于的主題來調(diào)整圖像在圖像搜索結(jié)果中引用的展現(xiàn)位置??偟膩碚f,在本說明書中描述的主題的一個方面可以在包括以下動作的方法中實現(xiàn)為引用圖像獲取引用標(biāo)簽,引用標(biāo)簽是指定引用圖像屬于的第一主題的標(biāo)簽;在數(shù)據(jù)處理系統(tǒng)中識別在其期間引用圖像被選擇用于展現(xiàn)的用戶會話,每一個用戶會話是圖像的選擇被關(guān)聯(lián)成會話集的時段;在數(shù)據(jù)處理系統(tǒng)中為引用圖像識別在用戶會話期間被選擇用于展現(xiàn)的共同選擇圖像,共同選擇圖像是繼對引用圖像的選擇之后被選擇的圖像;對于每一個共同選擇圖像,在數(shù)據(jù)處理系統(tǒng)中,基于對關(guān)于引用圖像的共同選擇圖像的選擇的頻率來生成主題分值,主題分值表示共同選擇圖像與第一主題的相關(guān)性的度量;以及將具有滿足閾值主題分值的主題分值的共同選擇圖像加標(biāo)簽為屬于第一主題。本方面的這個和其他實施例包括對應(yīng)的系統(tǒng)、裝置和計算機程序產(chǎn)品。 這些和其他實施例可以可選地包括以下特征中的一個或多個。該方法可以進一步包括以下動作為用戶會話識別對引用圖像的第一選擇時間;識別對在用戶會話期間選擇的共同選擇圖像的隨后選擇時間;以及僅將具有在相對于第一選擇時間的閾值時間段內(nèi)的隨后選擇時間的圖像識別為共同選擇圖像,其中用戶會話具有會話時間段,以及閾值時間段小于會話時間段。 主題分值可以通過為共同選擇圖像獲取初始主題分值來生成,每一個初始主題分值是圖像與第一主題的初始相關(guān)性度量;為共同選擇圖像獲取共同選擇數(shù)據(jù),共同選擇數(shù)據(jù)指定相對于對引用圖像或其他共同選擇圖像的選擇的對共同選擇圖像的選擇;基于初始主題分值和共同選擇數(shù)據(jù)的函數(shù)來為共同選擇圖像計算更新的主題分值;確定是否已發(fā)生停止條件;當(dāng)尚未發(fā)生停止條件時,基于共同選擇數(shù)據(jù)和先前計算的更新的主題分值來計算另外的更新的主題分值;當(dāng)已發(fā)生停止條件時,基于更新的主題分值來對共同選擇圖像進行分類;以及其中加標(biāo)簽基于更新的主題分值。本發(fā)明的特定實施例可以被實現(xiàn),以實現(xiàn)以下優(yōu)勢中的一個或多個?;谙鄬τ谝弥黝}的引用圖像的共同選擇數(shù)據(jù),可以將未分類的圖像屬于的主題識別為屬于引用主題??梢詫⒈蛔R別為屬于引用主題的圖像從圖像搜索結(jié)果過濾出。相對于沒有被識別為屬于引用主題的圖像,屬于引用主題的圖像可以被選擇用于在圖像搜索結(jié)果中的更高或更低展現(xiàn)位置處展現(xiàn)?;谙鄬τ谝弥黝}的引用圖像的共同選擇數(shù)據(jù),可以用對應(yīng)于引用主題的標(biāo)簽為圖像加標(biāo)簽?;谠趯哂袨樯榈妮^高可能性的圖像的選擇之后的對圖像的隨后選擇,可以將圖像識別并加標(biāo)簽為色情圖像。圖像語料庫中的每一個圖像可以基于其相對于引用主題的引用圖像的選擇的選擇來被分類。在附圖和下面的描述中闡述了本發(fā)明的一個或多個實施例的細(xì)節(jié)。本發(fā)明的其他特征、方面和優(yōu)勢從描述、附圖和權(quán)利要求將變得顯而易見。
圖1是在其中搜索系統(tǒng)提供搜索服務(wù)的示例環(huán)境的框圖。圖2是用于將圖像分類到主題的示例過程的流程圖。圖3是在其中生成并索引用戶會話數(shù)據(jù)的示例環(huán)境。圖4是使用選擇數(shù)據(jù)來生成的加權(quán)圖的圖示。圖5是用于生成加權(quán)圖的示例過程的流程圖。圖6A是其中可以存儲并跟蹤圖像集的主題分值的示例表。圖6B是其中可以存儲定義共同選擇矩陣的共同選擇數(shù)據(jù)的示例表。圖7A-7D是在迭代的主題分值生成過程的不同點處的示例加權(quán)圖。圖8是用于迭代地生成主題分值的示例過程。
各附圖中相同的參考數(shù)字和標(biāo)記指示相同的元素。
具體實施例方式圖像分類系統(tǒng)對圖像選擇數(shù)據(jù)進行分析以基于先前選擇的圖像屬于的主題來對圖像分類并且加標(biāo)簽。然后可以使用這些標(biāo)簽來過濾圖像搜索結(jié)果,以移除對與除搜索查詢針對的主題外的主題更相關(guān)的圖像的引用。另外,可以使用標(biāo)簽來過濾針對主題(例如, 露骨內(nèi)容)的所有圖像,除非用戶選擇使對這些圖像的引用展現(xiàn)。在下面描述了在其中提供搜索服務(wù)的在線環(huán)境。關(guān)于該在線環(huán)境,將基于選擇數(shù)據(jù)來為圖像加標(biāo)簽的圖像分類系統(tǒng)描述為搜索系統(tǒng)的子系統(tǒng)。然而,圖像分類子系統(tǒng)可以獨立于圖像搜索系統(tǒng)實現(xiàn)。圖1是在其中搜索系統(tǒng)110提供搜索服務(wù)的示例環(huán)境100的框圖。示例環(huán)境100 包括網(wǎng)絡(luò),諸如局域網(wǎng)(LAN)、廣域網(wǎng)(WAN)、因特網(wǎng)或其組合,其連接網(wǎng)站104、用戶設(shè)備 106和搜索系統(tǒng)110。在線環(huán)境100可以包括成千上萬的網(wǎng)站104和用戶設(shè)備106。網(wǎng)站104是與域名相關(guān)聯(lián)并且由一個或多個服務(wù)器托管的一個或多個資源。示例網(wǎng)站是以超文本標(biāo)記語言(HTML)格式化的網(wǎng)頁集合,其可以包含文本、圖像、多媒體內(nèi)容和例如腳本的編程元素。每一個網(wǎng)站104由發(fā)布者維護,所述發(fā)布者例如管理和/或擁有該網(wǎng)站的實體。資源是可以由網(wǎng)站104通過網(wǎng)絡(luò)102提供并且與資源地址相關(guān)聯(lián)的任何數(shù)據(jù)。資源包括HTML頁面、字處理文檔以及可移植文檔格式(PDF)文檔、圖像、視頻以及饋給源,僅列出一些。資源可以包括內(nèi)容,例如字、短語、圖像和聲音,以及可以包括嵌入式信息(諸如元信息和超鏈接)和/或嵌入式指令(諸如JavMcript腳本)。每一個資源具有能夠被唯一識別的可尋址的存儲位置??蓪ぶ返奈恢糜芍T如統(tǒng)一資源定位符(URL)的資源定位符尋址。用戶設(shè)備106是受用戶控制并且能夠通過網(wǎng)絡(luò)102請求并接收資源的電子設(shè)備。 示例用戶設(shè)備106包括個人計算機、移動通信設(shè)備和能夠通過網(wǎng)絡(luò)102發(fā)送并接收數(shù)據(jù)的其他設(shè)備。用戶設(shè)備106典型地包括便于通過網(wǎng)絡(luò)102發(fā)送及接收數(shù)據(jù)的用戶應(yīng)用,諸如 web瀏覽器。為了便于搜索這些資源,搜索系統(tǒng)110通過爬取并索引發(fā)布者在網(wǎng)頁104上提供的資源來識別資源。關(guān)于資源的數(shù)據(jù)可以基于數(shù)據(jù)與之相對應(yīng)的資源來索引。資源的索引的以及可選地緩存的副本被存儲在索引緩存112中。用戶設(shè)備106將搜索查詢109提交給搜索系統(tǒng)110。作為響應(yīng),搜索系統(tǒng)110訪問索引緩存112,以識別與搜索查詢109相關(guān)的資源。搜索系統(tǒng)110以搜索結(jié)果111形式識別資源,并且以搜索結(jié)果頁的形式將搜索結(jié)果111返回給用戶設(shè)備106。搜索結(jié)果111是搜索系統(tǒng)110生成、識別對特定搜索查詢作出響應(yīng)的資源并且包括指向該資源的鏈接的數(shù)據(jù)。示例搜索結(jié)果111可以包括網(wǎng)頁標(biāo)題、從網(wǎng)頁提取的文本摘錄或圖像的部分以及網(wǎng)頁的 URL。對于文本內(nèi)容的搜索,搜索結(jié)果基于與搜索結(jié)果所識別的資源有關(guān)的分值來排名,所述分值諸如信息檢索(“頂”)分值,以及可選地每一個資源相對于其他資源的獨立排名(“頁面排名”分值)。在一些實施方式中,IR分值從與搜索查詢109和資源相對應(yīng)的特征向量的點積來計算,以及搜索結(jié)果的排名基于為頂分值和頁面質(zhì)量分值的組合的相關(guān)性分值。搜索結(jié)果111根據(jù)這些相關(guān)性分值來排序,并且按照該順序提供給用戶設(shè)備。對于針對圖像并且使用文本查詢作為輸入的搜索,搜索系統(tǒng)110可以將資源的相關(guān)性分值與嵌入在資源中的圖像的相關(guān)性反饋分值相組合。示例相關(guān)性反饋分值是當(dāng)圖像在搜索結(jié)果中引用時從該圖像的選擇率得到的分值。然后使用這些組合分值來展現(xiàn)針對嵌入在資源中的圖像的搜索結(jié)果。用戶設(shè)備106例如以一個或多個網(wǎng)頁的形式接收搜索結(jié)果頁,并且呈現(xiàn)所述頁面以向用戶展現(xiàn)。響應(yīng)于用戶在用戶設(shè)備106處選擇搜索結(jié)果中的鏈接,用戶設(shè)備106請求該鏈接所識別的資源。托管該資源的網(wǎng)站104從用戶設(shè)備106接收對該資源的請求,并且將該資源提供給發(fā)出請求的用戶設(shè)備106。在用戶會話期間提交的搜索查詢109被存儲在諸如歷史數(shù)據(jù)存儲114的數(shù)據(jù)存儲中。指定響應(yīng)于在用戶會話期間提供的搜索結(jié)果而采取的動作的選擇數(shù)據(jù)也被存儲在諸如歷史數(shù)據(jù)存儲114的數(shù)據(jù)存儲中。這些動作可以包括搜索結(jié)果是否被選擇和/或與選擇相關(guān)聯(lián)的“停留時間”(即在選擇和隨后選擇之間的時間段)??梢允褂么鎯υ跉v史數(shù)據(jù)存儲 114中的數(shù)據(jù)來將在用戶會話期間提交的搜索查詢109映射到在搜索結(jié)果111中識別的資源和用戶采取的動作,例如在用戶會話期間選擇用于展現(xiàn)的排序的資源列表。用戶會話是期間指定關(guān)于資源采取的動作的數(shù)據(jù)與共同會話標(biāo)識符相關(guān)聯(lián)的時段。該用戶會話的時段可以由時間、采取的動作的數(shù)量或用戶動作的一些其他描述來度量。 例如,用戶會話可以包括在一分鐘、一小時、一天或任何其他時間段期間關(guān)于資源的用戶動作。類似地,用戶會話可以包括閾值數(shù)量的對資源的用戶選擇。每一個用戶會話可以與唯一會話標(biāo)識符相關(guān)聯(lián)。唯一會話標(biāo)識符可以例如基于以下的一個或多個來生成用戶設(shè)備標(biāo)識符、用戶會話的時間指示符以及指示用戶會話的語境的其他數(shù)據(jù)(例如,用戶會話產(chǎn)生自的地理區(qū)域)。用戶設(shè)備標(biāo)識符可以是例如與用戶會話與之相對應(yīng)的用戶設(shè)備106相關(guān)聯(lián)的匿名標(biāo)識符,諸如已被匿名的cookie (即,充作用戶會話的標(biāo)識符的匿名文本串)。因此,可以使在用戶會話期間發(fā)生的動作與動作產(chǎn)生自的特定用戶設(shè)備106失去關(guān)聯(lián)。將在特定用戶會話期間發(fā)生的動作,諸如對圖像的選擇,與相同唯一會話標(biāo)識符相關(guān)聯(lián)。另外,可以將在特定用戶會話期間發(fā)生的每一個動作與指示動作發(fā)生的時間的另外時間數(shù)據(jù)相關(guān)聯(lián)。該時間可以是絕對時間,諸如動作發(fā)生的格林尼治時間,或相對于用戶會話的開始的時間或相對于另一個用戶動作的時間。指定在每一個用戶會話期間發(fā)生的動作的用戶會話數(shù)據(jù)可以被存儲在諸如歷史數(shù)據(jù)114的數(shù)據(jù)存儲中。可以使用用戶會話數(shù)據(jù)來識別在特定用戶會話期間按順序選擇的圖像,以及基于其順序選擇來識別屬于共同主題的圖像。搜索系統(tǒng)110包括圖像分類子系統(tǒng)120。在一些實施方式中,圖像分類子系統(tǒng)120 包括被配置成基于用戶會話數(shù)據(jù)來將圖像分類到主題的一個或多個處理器。圖像分類子系統(tǒng)120對用戶會話數(shù)據(jù)進行分析以識別繼對引用圖像的選擇之后選擇的圖像。引用圖像是被預(yù)分類有已知主題的圖像,例如具有指定引用圖像屬于的主題的標(biāo)簽的圖像。在特定用戶會話期間繼對引用圖像的選擇之后選擇的圖像被稱為關(guān)于引用圖像的共同選擇圖像。用戶在特定用戶會話期間選擇的圖像通常更可能屬于同一主題。因此,關(guān)于引用圖像的共同選擇圖像比不是關(guān)于引用圖像的共同選擇圖像的圖像更可能屬于與引用圖像相同的主題。例如,為關(guān)于色情引用圖像的共同選擇圖像的圖像比不是關(guān)于色情圖像的共同選擇圖像的圖像更可能是色情圖像。類似地,為關(guān)于非色情引用圖像被共同選擇的圖像更可能是非色情圖像。因此,為關(guān)于引用圖像或引用圖像集的頻繁共同選擇圖像的圖像可以以高置信度被分類為屬于與引用圖像相同的主題。在一些實施方式中,圖像分類子系統(tǒng)120生成主題分值,該主題分值表示共同選擇圖像屬于與引用圖像相同的主題的可能性。共同選擇圖像的主題分值可以例如基于以下來生成該圖像與引用圖像被共同選擇的頻率和相對于對引用圖像的選擇的對該圖像的共同選擇的接近度(例如,在選擇之間的時間或動作)。分別參考圖2和圖6-7描述了生成主題分值的方法。具有閾值主題分值的共同選擇圖像被識別為屬于與引用圖像相同的主題。閾值主題分值例如可以被指定為絕對主題分值、或在其他閾值(例如,具有最高M個主題分值的圖像)之中的最高N百分比的主題分值。圖像分類子系統(tǒng)120可以用對應(yīng)于主題的文本數(shù)據(jù)為被識別為屬于與引用圖像相同的主題的共同選擇圖像加標(biāo)簽。替選地,指示共同選擇圖像屬于主題的由數(shù)據(jù)位表示的主題標(biāo)志可以被設(shè)置并且存儲在與索引緩存112中的共同選擇圖像相關(guān)聯(lián)的存儲器位置處。進而,共同選擇圖像可以被識別為該主題的新的引用圖像,使得繼對該新的引用圖像的選擇之后對其他圖像的選擇將是該其他圖像也屬于該主題的指示。該分類過程可以傳播通過圖像語料庫,直到閾值數(shù)量的圖像或所有圖像已被分類。在一些實施方式中,對搜索查詢109作出響應(yīng)的圖像搜索結(jié)果111可以基于經(jīng)由圖像分類系統(tǒng)120的分類來被過濾或重新排序來展現(xiàn)。例如,可以使識別被識別為色情圖像的圖像的分類數(shù)據(jù)(例如,標(biāo)簽或主題標(biāo)志)對搜索系統(tǒng)110可用。搜索系統(tǒng)110可以使用該分類數(shù)據(jù)來對響應(yīng)于搜索查詢109的圖像搜索結(jié)果進行分析,以確定由圖像搜索結(jié)果引用的任何圖像是否是色情圖像。對色情圖像的引用可以被移除或在搜索結(jié)果的不太顯著的位置處展現(xiàn),以增加搜索結(jié)果的質(zhì)量。這樣的修改可以受支配于用戶偏好。類似地,為搜索查詢109生成的圖像搜索結(jié)果可以基于標(biāo)簽來排除或選擇待在圖像搜索結(jié)果中引用的圖像。例如,搜索系統(tǒng)110可以使用存儲在與索引緩存112中的圖像相關(guān)聯(lián)的存儲器位置處的標(biāo)簽數(shù)據(jù)來獲取與搜索查詢109相關(guān)的圖像。與和搜索查詢109 更相關(guān)的標(biāo)簽相關(guān)聯(lián)的圖像可以被識別為比與和搜索查詢109不太相關(guān)的圖像相關(guān)聯(lián)的圖像與搜索查詢109更相關(guān)。例如,如果圖像分類子系統(tǒng)120用文本數(shù)據(jù)“棒球”為貝比魯斯的圖像加標(biāo)簽,則貝比魯斯的圖像將比對“小豬電影”的搜索查詢109與對“棒球”的搜索查詢109更相關(guān)。 因此,對貝比魯斯的圖像的引用將在對“棒球”的圖像搜索結(jié)果中出現(xiàn)更高,以及可以不在搜索查詢“小豬電影”的圖像搜索結(jié)果中出現(xiàn)。圖2是用于將圖像分類到主題的示例過程200的流程圖。過程200可以例如由圖 1的圖像分類子系統(tǒng)120來實現(xiàn)。為引用圖像獲取引用標(biāo)簽002)。在一些實施方式中,引用標(biāo)簽是指定引用圖像屬于的引用主題的標(biāo)簽。引用標(biāo)簽例如可以是指示引用主題的文本標(biāo)簽或主題標(biāo)志。例如,對應(yīng)于引用主題的引用標(biāo)簽可以由被設(shè)置為指定的二進制值的與引用主題相對應(yīng)的數(shù)據(jù)位表示。替選地,引用標(biāo)簽可以是與引用標(biāo)簽相對應(yīng)的文本數(shù)據(jù)。例如,可以用文本“露骨”或“色情”來為色情圖像加標(biāo)簽。在一些實施方式中,人力評估器可以識別色情圖像,并且用將該圖像識別為色情圖像的引用標(biāo)簽來為該色情圖像加標(biāo)簽。在其他實施方式中,機器能夠識別色情圖像,并且相應(yīng)地用引用標(biāo)簽來為其加標(biāo)簽。進而,評估器能夠?qū)σ脴?biāo)簽驗證準(zhǔn)確性。引用標(biāo)簽可以從存儲對應(yīng)于圖像的標(biāo)簽的數(shù)據(jù)存儲獲取,或基于與圖像相關(guān)聯(lián)的數(shù)據(jù)來生成。圖像的標(biāo)簽可以使用圖像處理技術(shù)來確定圖像的視覺特征是否指示色情圖像和/或使用文本分析來確定與圖像相關(guān)聯(lián)的文本是否指示色情圖像,來生成。引用圖像的引用標(biāo)簽可以例如基于圖像處理技術(shù)來生成。在一些實施方式中,可以將圖像的視覺特征(即,顏色和/或紋理)與先前已用引用標(biāo)簽加標(biāo)簽或已被識別為屬于引用標(biāo)簽表示的主題(例如,被識別為色情圖像)的圖像的視覺特征進行比較。例如,識別色情圖像的一種方法是識別圖像的為“皮膚像素”(即,具有與膚色相對應(yīng)的色彩值的像素)的像素部分(例如,數(shù)量或百分比)。當(dāng)該像素部分超過閾值時,可以將圖像識別為色情圖像,并且用對應(yīng)于色情主題的引用標(biāo)簽為其加標(biāo)簽。引用標(biāo)簽還可以例如基于位于在引用圖像與其一起展現(xiàn)的網(wǎng)頁上的引用圖像附近的文本數(shù)據(jù)來生成。例如,可以對在引用圖像的閾值數(shù)量的像素內(nèi)出現(xiàn)的文本進行分析, 以識別可能與引用圖像相關(guān)的主題。引用標(biāo)簽還可以基于與引用圖像相關(guān)聯(lián)的其他文本來生成。例如,引用標(biāo)簽可以基于包括在引用圖像的文件名中的文本、指向圖像的鏈接的錨文本或與引用圖像明確相關(guān)聯(lián)的文本來生成。發(fā)布者可以將文本與引用圖像明確相關(guān)聯(lián),以便于將圖像識別為與對特定主題的搜索查詢相關(guān)。例如,發(fā)布者可以對棒球運動員的圖像指定文本“棒球”,以增加該圖像響應(yīng)于包括詞語“棒球”的搜索查詢而被識別的可能性。在一些實施方式中,要求引用圖像的引用標(biāo)簽具有準(zhǔn)確描述引用圖像的內(nèi)容的閾值可能性。圖像的標(biāo)簽的準(zhǔn)確性可以例如基于標(biāo)簽反饋來確定。標(biāo)簽反饋是從用戶獲取的、 為圖像指定引用標(biāo)簽或提供在標(biāo)簽和引用圖像之間的相關(guān)性的度量的數(shù)據(jù)。標(biāo)簽反饋可以從已被請求為圖像加標(biāo)簽或確認(rèn)圖像的現(xiàn)有標(biāo)簽的用戶接收。替選地,標(biāo)簽反饋可以從被提供圖像并且被請求選擇圖像與其最相關(guān)和/或最不相關(guān)的主題的匿名用戶接收。例如,可以向用戶提供圖像和M個主題的列表。用戶可以選擇M個主題中的與圖像最相關(guān)或最準(zhǔn)確描述圖像的內(nèi)容的一個??梢跃奂c圖像的內(nèi)容最相關(guān)的主題的用戶選擇來確定圖像屬于的主題。例如,如果閾值百分比的用戶將特定主題選擇為與圖像最相關(guān),則可以將該特定主題選擇為圖像屬于的主題。還可以對標(biāo)簽反饋進行分析來確定引用圖像的現(xiàn)有標(biāo)簽是準(zhǔn)確的可能性。圖像的現(xiàn)有標(biāo)簽是準(zhǔn)確的可能性可以基于將現(xiàn)有標(biāo)簽識別為用于圖像的準(zhǔn)確標(biāo)簽的用戶反饋的一部分。例如,如果閾值百分比的用戶反饋指示現(xiàn)有標(biāo)簽是用于圖像的準(zhǔn)確標(biāo)簽,則可以將現(xiàn)有標(biāo)簽識別為引用圖像的引用標(biāo)簽。進而,可以將引用圖像識別為屬于引用標(biāo)簽指定的主題。在一些實施方式中,將圖像識別為屬于引用圖像指定的主題的部分用戶反饋可以用作引用圖像對于主題的強度的度量。例如,標(biāo)簽是準(zhǔn)確的可能性可以用作圖像是屬于標(biāo)簽指定的主題的引用圖像的概率。圖像是引用圖像的可能性可以進而用作識別圖像作為標(biāo)簽所指定的主題的引用圖像的強度的權(quán)重。如在下面參考圖4所述的,當(dāng)為其他圖像生成主題分值時,可以使用圖像作為引用圖像的強度。識別在其期間引用圖像被選擇用于展現(xiàn)的用戶會話004)。在其期間圖像被選擇用于展現(xiàn)的該用戶會話可以通過識別與關(guān)于引用圖像的選擇數(shù)據(jù)相關(guān)聯(lián)的唯一會話標(biāo)識符來識別。例如,可以為引用圖像獲取存儲在圖1的歷史數(shù)據(jù)114中的選擇數(shù)據(jù)。進而,可以對與選擇數(shù)據(jù)相關(guān)聯(lián)的唯一會話標(biāo)識符進行分析來識別在其期間引用圖像被選擇用于展現(xiàn)的用戶會話。參考圖3更詳細(xì)地描述了關(guān)于用戶會話的選擇數(shù)據(jù)的生成。識別在用戶會話期間被選擇用于展現(xiàn)的關(guān)于引用圖像的共同選擇圖像006)。在一些實施方式中,共同選擇圖像可以基于關(guān)于與用戶會話的唯一會話標(biāo)識符相關(guān)聯(lián)的圖像的選擇數(shù)據(jù)來識別。例如,可以獲取圖1的歷史數(shù)據(jù)114中的與關(guān)于引用圖像的唯一會話標(biāo)識符相關(guān)聯(lián)的選擇數(shù)據(jù)。對選擇數(shù)據(jù)進行分析以識別與引用圖像共同選擇的圖像。例如,可以對包括在關(guān)于圖像的選擇數(shù)據(jù)中的時間數(shù)據(jù)進行分析來確定圖像是在對引用圖像的選擇之前還是之后被選擇用于展現(xiàn)。繼對引用圖像的選擇之后被選擇用于展現(xiàn)的圖像被識別為共同選擇圖像。對引用圖像是否在另一個用戶會話期間被選擇作出確定008)。該確定可以例如通過確定關(guān)于引用圖像的選擇數(shù)據(jù)是否與另一個唯一會話標(biāo)識符相關(guān)聯(lián)來作出。當(dāng)關(guān)于引用圖像的選擇數(shù)據(jù)與另一個唯一會話標(biāo)識符相關(guān)聯(lián)時,引用圖像可以被識別為在另一個用戶會話期間被選擇。如果引用圖像在另一個用戶會話期間被選擇,則識別在該用戶會話期間被選擇用于展現(xiàn)的關(guān)于引用圖像的共同選擇圖像(206)。當(dāng)引用圖像在另一個用戶會話期間未被選擇時或在所有的另外用戶會話已被識別之后,基于相對于對引用圖像的選擇的對共同選擇圖像的選擇來為每一個共同選擇圖像生成主題分值010)。在一些實施方式中,主題分值是共同選擇圖像與主題的相關(guān)性的度量。繼對引用圖像的選擇之后的對共同選擇圖像的每一個選擇增加了共同選擇圖像與引用圖像相關(guān)、因此屬于與引用圖像相同的主題的可能性。例如,在對引用圖像的選擇之后比另一個共同選擇圖像被更頻繁選擇的共同選擇圖像比更少頻繁選擇的共同選擇圖像可能與和引用圖像相同的主題更相關(guān)。共同選擇圖像與引用圖像相關(guān)的可能性還可以基于與共同選擇圖像的選擇相關(guān)聯(lián)的停留時間。例如,具有比另一個共同選擇圖像更長的停留時間的共同選擇圖像更可能與和引用圖像相同的主題相關(guān),因為用戶以更長停留時間花費更多的時間查看共同選擇圖像。共同選擇圖像與引用圖像相關(guān)的可能性還可以基于對共同選擇圖像的選擇與對引用圖像的選擇的接近度。選擇的接近度可以以時間單位、用戶動作的數(shù)量或用戶會話的任何其他描述來度量。例如,為在對引用圖像的選擇之后被選擇的第一圖像的共同選擇圖像比為在對引用圖像的選擇之后被選擇的第四圖像的另一個共同選擇圖像更可能與和引用圖像相同的主題相關(guān)。因此,在對引用圖像的選擇之后被首先選擇的共同選擇圖像比稍后選擇的共同選擇圖像更可能屬于與引用圖像相同的主題。在一些實施方式中,圖像必須在相對于對引用圖像的選擇的閾值時間段內(nèi)被選擇,以被識別為共同選擇圖像。例如,當(dāng)用戶會話持續(xù)時間長于在其內(nèi)隨后選擇的圖像被識別為共同選擇圖像的時段時,可以使用閾值時間段來確定在對引用圖像的選擇之后被選擇的圖像是否是關(guān)于該引用圖像的共同選擇圖像。在一些實施方式中,共同選擇圖像的主題分值可以是對共同選擇圖像的選擇相對于對引用圖像的選擇的頻率和/或接近度的函數(shù)的結(jié)果。例如,主題分值可以是在對引用圖像的選擇之后的對共同選擇圖像的總選擇的總和。類似地,主題分值可以對應(yīng)于圖像相對于其被共同選擇的引用圖像的數(shù)量。例如,是關(guān)于十個引用圖像的共同選擇圖像的圖像可以具有“10”的主題分值,而是關(guān)于五個引用圖像的共同選擇圖像的圖像可以具有“5”的主題分值。共同選擇圖像的每一個選擇可以由指示該選擇相對于對引用圖像的選擇的接近度的因子賦予權(quán)重。例如,每一個選擇可以由因子1/(選擇數(shù)量)賦予權(quán)重,使得緊接在對引用圖像的選擇之后的對共同選擇圖像的選擇將具有1(即,1/1)的權(quán)重。類似地,在對引用圖像的選擇之后的第二和第三共同選擇圖像將分別具有1/2和1/3的權(quán)重。為了示例目的,提供了所描述的權(quán)重因子。權(quán)重因子可以是共同選擇圖像選擇相對于對引用圖像的選擇的接近度的任何比率或函數(shù)。在一些實施方式中,可以通過使用加權(quán)圖來映射相對于對引用圖像的選擇的對共同選擇圖像的選擇,來便于為共同選擇圖像生成主題分值。引用圖像和共同選擇圖像由加權(quán)圖中的節(jié)點來表示,以及表示共同選擇圖像的順序選擇的邊連接節(jié)點。參考圖4-5更詳細(xì)地描述了加權(quán)圖的生成。為具有滿足閾值主題分值的主題分值的共同選擇圖像加標(biāo)簽012)。在一些實施方式中,當(dāng)主題分值滿足或超過閾值主題分值時,滿足閾值主題分值。閾值主題分值例如可以被指定為絕對主題分值、或在其他閾值(例如,具有最高M個主題分值的圖像)之中的最高N百分比的主題分值。在一些實施方式中,為共同選擇圖像加標(biāo)簽以將共同選擇圖像識別為屬于與引用圖像相同的主題。例如,可以將匹配引用圖像的引用標(biāo)簽的文本數(shù)據(jù)與共同選擇圖像相關(guān)聯(lián)。替選地,可以設(shè)置用于共同選擇圖像的主題標(biāo)志來將共同選擇圖像識別為屬于與引用圖像相同的主題??梢詫?biāo)簽存儲在與共同選擇圖像相關(guān)聯(lián)的存儲器位置處,并且使其對諸如搜索系統(tǒng)的其他系統(tǒng)或子系統(tǒng)可用。圖3是在其中生成并索引用戶會話數(shù)據(jù)的示例環(huán)境300。圖像分類子系統(tǒng)120和搜索系統(tǒng)110在圖3中被表示為直接通信,但是圖像分類子系統(tǒng)120和搜索系統(tǒng)110可以被實現(xiàn)成通過網(wǎng)絡(luò)102通信。用戶會話一般由用戶設(shè)備106發(fā)起。例如,用戶設(shè)備106可以通過網(wǎng)絡(luò)102提交圖像搜索查詢或?qū)λ阉鹘Y(jié)果的另一個請求。請求可以與唯一會話標(biāo)識符相關(guān)聯(lián),并且例如由搜索引擎110處理。搜索引擎110向用戶設(shè)備106提供對搜索查詢作出響應(yīng)的圖像搜索結(jié)果302。圖像搜索結(jié)果302包括結(jié)果圖像302-1-302-N,其是對已被搜索系統(tǒng)110識別為與搜索查詢相關(guān)的圖像的引用(例如,縮略圖)。識別搜索查詢的用戶會話數(shù)據(jù)和由圖像搜索結(jié)果引用的圖像與用戶會話的唯一會話標(biāo)識符相關(guān)聯(lián),并且被存儲在歷史數(shù)據(jù)114中。用戶會話數(shù)據(jù)可以包括時間數(shù)據(jù),其指示用戶會話被發(fā)起的時間(例如,搜索查詢被接收的時間)和/或向用戶設(shè)備106提供搜索結(jié)果111的時間。
用戶設(shè)備106的用戶可以從圖像搜索結(jié)果302選擇結(jié)果圖像302-1-302-N中的一個或多個。對結(jié)果圖像302-1-302-N的每一個選擇生成對所選擇的結(jié)果圖像所指定的資源位置的請求。例如,對結(jié)果圖像302-1的選擇可以生成對結(jié)果圖像302-1所引用的圖像與其一起展現(xiàn)的網(wǎng)頁的請求。進而,可以向用戶設(shè)備106提供網(wǎng)頁以供展現(xiàn)。通過網(wǎng)絡(luò)將對結(jié)果圖像302-1-302-N的每一個選擇作為選擇數(shù)據(jù)304提供給圖像
搜索系統(tǒng)110。選擇數(shù)據(jù)304包括指定唯一會話標(biāo)識符的數(shù)據(jù)(例如,IDUID2.....ID3),
所述唯一會話標(biāo)識符識別對應(yīng)于選擇的用戶會話。選擇數(shù)據(jù)304還包括例如基于對圖像結(jié)
果302-1-302-N的選擇,識別被選擇用于展現(xiàn)的圖像的數(shù)據(jù)(例如,IS11、IS12.....IS1N)。
選擇數(shù)據(jù)304可以進一步包括指定圖像中的每一個被選擇用于展現(xiàn)的時間的時間數(shù)據(jù)。選擇數(shù)據(jù)304由搜索系統(tǒng)110通過網(wǎng)絡(luò)102獲取,并且被存儲在歷史數(shù)據(jù)114的與唯一會話標(biāo)識符相關(guān)聯(lián)的存儲器位置處。選擇數(shù)據(jù)304可以為請求圖像的每一個用戶設(shè)備106并且在每一個用戶會話持續(xù)時間期間獲取。因此,關(guān)于用戶設(shè)備106在多個用戶會話期間選擇的每一個圖像的選擇數(shù)據(jù)可從歷史數(shù)據(jù)114訪問。在一些實施方式中,圖像分類子系統(tǒng)120使用選擇數(shù)據(jù)來構(gòu)建加權(quán)圖400,以映射相對于對引用圖像的選擇的對共同選擇圖像的總計選擇。進而,可以使用加權(quán)圖400來對共同選擇圖像進行分類。圖4是使用選擇數(shù)據(jù)來生成的加權(quán)圖400的圖示。在一些實施方式中,加權(quán)圖400 由圖像分類系統(tǒng)120生成。例如,圖像分類系統(tǒng)120可以從歷史數(shù)據(jù)120獲取選擇數(shù)據(jù),其指定在多個用戶會話期間對引用圖像的選擇和對關(guān)于引用圖像的共同選擇圖像的選擇。圖像分類子系統(tǒng)120定義加權(quán)圖400中的節(jié)點,其表示引用圖像和共同選擇圖像。進而,圖像分類子系統(tǒng)120基于選擇數(shù)據(jù)來生成并遞增在表示隨后選擇的節(jié)點的節(jié)點之間的邊權(quán)重。 一旦加權(quán)圖400被生成,其可以用于基于連接到表示對其他共同選擇的節(jié)點和對引用圖像的共同選擇圖像的節(jié)點的加權(quán)邊來對該共同選擇圖像進行分類。加權(quán)圖400包括引用節(jié)點402,該引用節(jié)點402表示正為其識別共同選擇圖像的引用圖像。在一些實施方式中,引用節(jié)點402表示被識別為色情圖像的圖像,例如因為該圖像被識別為屬于色情主題。如在上面參考圖2所論述的,引用圖像屬于的主題可以例如基于與引用圖像相關(guān)聯(lián)的引用標(biāo)簽或另一個主題指示符來識別。加權(quán)圖400可以包括另外的引用圖像460和480。當(dāng)另外的引用圖像440和460 被識別并且被包括在加權(quán)圖中時,基于相對于引用圖像中的每一個的對共同選擇圖像的選擇,來為引用圖像402、460和480中的每一個識別共同選擇圖像以及為到共同選擇圖像的邊賦予權(quán)重。另外的引用圖像460和480可以表示也被識別為屬于引用主題(例如,色情圖像)的圖像或被識別為不屬于引用主題(例如,不是色情圖像)的圖像。加權(quán)圖還包括節(jié)點410-420,其表示關(guān)于引用圖像的共同選擇圖像。例如,節(jié)點 410-420中的每一個表示為關(guān)于引用圖像402的共同選擇圖像的圖像。表示按順序選擇的圖像的節(jié)點在加權(quán)圖中由邊連接。例如,邊450將節(jié)點402連接到節(jié)點410,其表示對引用圖像和由節(jié)點410表示的共同選擇圖像的順序用戶選擇。類似地,邊451表示繼對由節(jié)點410表示的共同選擇圖像的選擇之后的對由節(jié)點411表示的共同選擇圖像的順序選擇。邊起源自的節(jié)點被稱為源節(jié)點,以及邊在其終止的節(jié)點被稱為目的節(jié)點。繼續(xù)上面的示例,邊450的源節(jié)點是引用節(jié)點402,以及目的節(jié)點是節(jié)點410。類似地,節(jié)點410是邊451的源節(jié)點,而節(jié)點411是目的節(jié)點。加權(quán)圖400中的每一條邊由指向目的節(jié)點的箭頭表示。雙向邊指示對由節(jié)點表示的圖像的相互順序選擇。例如,引用節(jié)點402和418由雙向邊452連接。雙向邊452指示對引用圖像的用戶選擇,后跟對節(jié)點418表示的共同選擇圖像的選擇和對引用圖像的第二選擇。替選地,替代雙向邊,可以使用一對單向邊。邊中的每一個可以具有權(quán)重,其指示分別由源和目的節(jié)點表示的圖像的順序選擇的數(shù)量。例如,如果由節(jié)點410表示的圖像在對引用圖像的選擇之后被選擇10次,則邊450 可以具有與10個選擇相對應(yīng)的權(quán)重。邊的權(quán)重可以響應(yīng)于每一個所識別的選擇而被增加例如常數(shù)增量,或權(quán)重可以基于選擇的數(shù)量的函數(shù)來增加。例如,邊的權(quán)重可以對應(yīng)于由源和目的節(jié)點所表示的圖像的順序選擇的數(shù)量或權(quán)重可以是順序選擇的數(shù)量的對數(shù)函數(shù)或指數(shù)。緊接在對引用圖像的選擇之后的對共同選擇圖像的選擇可以比在對一個或多個其他共同選擇圖像的選擇之后被選擇的圖像更指示與引用圖像相關(guān)的圖像。例如,節(jié)點412 表示在對引用圖像402和節(jié)點410表示的共同選擇圖像的選擇之后被選擇的共同選擇圖像。因此,由于選擇節(jié)點410表示的圖像的居間動作,對節(jié)點412表示的圖像的選擇可以比對節(jié)點410表示的圖像的選擇較不指示圖像與引用圖像402的相關(guān)性。在一些實施方式中,每一條邊的權(quán)重可以基于其與引用圖像的接近度來調(diào)整。例如,邊權(quán)重可以基于其與引用節(jié)點402的接近度通過提升因子來提升。例如對于將引用節(jié)點402連接到表示共同選擇節(jié)點的節(jié)點510、417、418和419的邊,提升因子可以是最高的。 例如基于在邊和引用節(jié)點之間的節(jié)點的數(shù)量,對于與引用節(jié)點402較不接近的邊,可以降低提升因子。在一些實施方式中,邊的權(quán)重或響應(yīng)于選擇邊權(quán)重增加的量可以基于關(guān)于共同選擇圖像的引用節(jié)點的引用權(quán)重。引用權(quán)重是規(guī)范化或調(diào)整在對引用圖像的選擇之后的圖像選擇的重要性的因子。引用權(quán)重可以基于對關(guān)于引用圖像的標(biāo)簽反饋進行分析來確定引用圖像被準(zhǔn)確識別為屬于引用主題的可能性。例如,基于標(biāo)簽反饋,引用圖像402可以以0.7的概率(例如,標(biāo)簽反饋中的70% 將引用圖像402識別為色情圖像)被識別為色情圖像,而引用圖像460可以以0. 6的概率被識別為色情圖像。因此,引用圖像402可以被分配0.7的引用權(quán)重,而引用圖像480可以被分配0.6的引用權(quán)重。例如可以使用引用權(quán)重來調(diào)整到共同選擇圖像的邊權(quán)重被增加的遞增量?;谝脠D像屬于主題的可能性來調(diào)整邊權(quán)重被增加的遞增量,便于對關(guān)于具有屬于引用主題的不同可能性的不同引用圖像的共同選擇圖像的邊權(quán)重的直接比較。繼續(xù)上面的示例,引用圖像402比引用圖像460具有更高的為色情圖像的可能性。 因此,緊接在對引用圖像402的選擇之后的對圖像的選擇比緊接在對引用圖像460的選擇之后的對另一個圖像的選擇更指示所選擇的圖像是色情圖像。因此,關(guān)于引用圖像402的共同選擇圖像(例如,418)的邊(例如,452)的權(quán)重響應(yīng)于單個選擇將比關(guān)于引用圖像460 的共同選擇圖像(例如,560)的邊(例如,570)的權(quán)重響應(yīng)于單個選擇增加更多。邊權(quán)重的這些增加表示這些引用圖像402和460中的每一個被準(zhǔn)確識別為色情圖像的相對可能性。
在一些實施方式中,一旦構(gòu)建了圖,就基于識別節(jié)點所表示的圖像屬于引用主題的可能性的機器過程來為節(jié)點中的每一個分配初始權(quán)重。然后基于共同選擇數(shù)據(jù)來調(diào)整初始權(quán)重。如上所述,圖像中的每一個屬于引用主題的可能性可以基于對圖像的視覺特征、 與圖像相關(guān)聯(lián)的文本和指示圖像屬于的主題的其他數(shù)據(jù)的分析來確定。在這些實施方式中,對于其來說節(jié)點是源的邊可以以類似于上述方式的方式基于該節(jié)點的引用權(quán)重被賦予權(quán)重。圖5是用于生成加權(quán)圖的示例過程500的流程圖。加權(quán)圖用于基于在共同用戶會話期間圖像被選擇的圖像選擇順序和接近度來識別圖像間的關(guān)系。加權(quán)圖被生成來包括表示引用圖像的引用節(jié)點和表示共同選擇圖像的節(jié)點。加權(quán)圖包括表示在共同用戶會話期間對圖像的順序選擇的邊。關(guān)于許多不同用戶會話的選擇數(shù)據(jù)可以被聚焦并且在加權(quán)圖中表示。過程500參考單個引用圖像來描述,但是可以利用許多不同引用圖像來實現(xiàn)。過程500 可以例如由圖1的圖像分類子系統(tǒng)120來實現(xiàn)。在加權(quán)圖中將引用圖像表示為引用節(jié)點(502)。在一些實施方式中,引用圖像是被識別為屬于引用主題的圖像。例如,引用圖像可以是基于與和引用圖像相關(guān)聯(lián)的色情主題相對應(yīng)的引用標(biāo)簽被識別為色情圖像的圖像。引用圖像可以例如從存儲圖像和對應(yīng)于圖像的標(biāo)簽的數(shù)據(jù)存儲來識別。遍及過程500的描述,表示圖像的節(jié)點可以由與其表示的圖像相同的特征(例如,引用標(biāo)簽和選擇數(shù)據(jù))來表征。因此,可替換地提及表示圖像的節(jié)點和圖像自身。識別期間引用圖像被選擇的用戶會話(504)。在一些實施方式中,用戶會話可以基于關(guān)于引用圖像的選擇數(shù)據(jù)來識別。例如,對引用圖像的選擇可以從關(guān)于引用圖像的選擇數(shù)據(jù)識別。進而,可以使用與關(guān)于引用圖像的選擇數(shù)據(jù)相關(guān)聯(lián)的唯一會話標(biāo)識符來識別具有與相同的唯一會話標(biāo)識符相關(guān)聯(lián)的選擇數(shù)據(jù)的其他圖像。關(guān)于引用圖像的選擇數(shù)據(jù)可以例如從歷史數(shù)據(jù)存儲114獲取。一旦識別了在其中引用圖像被選擇的用戶會話,就識別在用戶會話期間對共同選擇圖像的隨后選擇(506)。如上所述,對共同選擇圖像的隨后選擇可以基于與和引用圖像相同的唯一會話標(biāo)識符相關(guān)聯(lián)的選擇數(shù)據(jù)來識別。關(guān)于用戶會話的選擇數(shù)據(jù)可以包括指定對共同選擇圖像的選擇相對于對引用圖像的選擇發(fā)生的時間的時間數(shù)據(jù)。因此,可以使用時間數(shù)據(jù)來將共同選擇圖像識別為在共同用戶會話期間在對引用圖像的選擇之后的時間被選擇的圖像。例如,如果引用圖像在2009年1月1日上午12:00被選擇,則具有與和引用圖像相同的唯一會話標(biāo)識符相關(guān)聯(lián)的選擇數(shù)據(jù)和具有指定晚于2009年1月1日上午12:00的另一個時間的時間數(shù)據(jù)的每一個圖像是關(guān)于引用圖像的共同選擇圖像。在一些實施方式中,僅僅在對引用圖像的選擇之后的閾值時間段內(nèi)被選擇的共同選擇圖像被識別為關(guān)于引用圖像的共同選擇圖像。閾值時間段便于使用為具有長于期間共同選擇圖像待被識別的時間段的持續(xù)時間的用戶會話獲取的選擇數(shù)據(jù)。例如,可能已為具有一小時的持續(xù)時間的用戶會話獲取了選擇數(shù)據(jù)。然而,在特定應(yīng)用中,共同選擇圖像可以被定義為僅僅在對引用圖像的選擇的10分鐘內(nèi)被選擇的那些圖像。在這種情況下,可以使用閾值時間段來確定在該一個小時用戶會話期間被選擇的圖像是否可以被識別為關(guān)于引用圖像的共同選擇圖像。例如,可以將在對該圖像的選擇和對引用圖像的選擇之間的時間與閾值時間段進行比較。如果在相對選擇之間的時間小于或等于閾值,則該圖像被識別為關(guān)于引用圖像的共同選擇圖像。在一些實施方式中,關(guān)于特定用戶會話的選擇數(shù)據(jù)可以包括在用戶會話期間被選擇的圖像的列表。該列表可以例如按照圖像在用戶會話期間被選擇的順序來排序。因此, 一旦在關(guān)于用戶會話的選擇數(shù)據(jù)中識別對引用圖像的選擇,在引用圖像之后被引用的每個圖像就可以被識別為共同選擇圖像。識別表示共同選擇圖像的節(jié)點(508)。在一些實施方式中,例如在計算機存儲器中,響應(yīng)于第一識別的選擇來定義表示共同選擇圖像的節(jié)點。在這些實施方式中,在計算機存儲器中定義表示共同選擇圖像的節(jié)點之后,可以從該節(jié)點被定義在的計算機存儲器位置識別該節(jié)點。例如,節(jié)點可以響應(yīng)于初始識別的選擇在加權(quán)圖中定義,然后為共同選擇圖像的隨后識別的選擇在加權(quán)圖中識別。在其他實施方式中,圖像語料庫中的每一個圖像最初由加權(quán)圖中的節(jié)點表示,而不考慮圖像是否是共同選擇圖像。當(dāng)識別對共同選擇圖像的選擇時,節(jié)點可以例如基于與共同選擇圖像相對應(yīng)并且與節(jié)點相關(guān)聯(lián)的唯一標(biāo)識符(例如,URL)來識別。例如,唯一圖像標(biāo)識符可以為每一個共同選擇圖像生成,并且與圖像和其對應(yīng)的節(jié)點相關(guān)聯(lián)。當(dāng)識別對共同選擇圖像的選擇時,與唯一標(biāo)識符相關(guān)聯(lián)的節(jié)點可以被識別為表示共同選擇圖像。共同選擇圖像中的每一個由加權(quán)圖中的獨立節(jié)點表示,以及加權(quán)圖中的節(jié)點可以表示在單個或多個用戶會話期間關(guān)于引用圖像的共同選擇圖像。為共同選擇圖像遞增邊權(quán)重(510)。在一些實施方式中,當(dāng)生成加權(quán)圖時,在每一個節(jié)點間的邊權(quán)重可以被初始化為0( S卩,在節(jié)點之間不存在邊)。因此,對共同選擇圖像的第一順序選擇將生成具有與一個標(biāo)準(zhǔn)單位相對應(yīng)的權(quán)重(例如,權(quán)重1)的邊。對共同選擇圖像的另外順序選擇將類似地以與標(biāo)準(zhǔn)單位相對應(yīng)的遞增量遞增連接節(jié)點的邊的權(quán)重。如上所述,邊權(quán)重被遞增的權(quán)重可以基于以下來調(diào)整提升因子、節(jié)點的引用權(quán)重或用于調(diào)整正對其遞增邊權(quán)重的選擇的相對重要性的另一個因子。對共同選擇圖像的另外選擇是否仍然關(guān)于該用戶會話作出確定(512)。另外選擇可以是緊接在對引用圖像的選擇之后的選擇或繼對其他圖像的選擇之后的選擇。另外選擇可以例如基于選擇與對應(yīng)于用戶會話的唯一會話標(biāo)識符相關(guān)聯(lián)來識別。當(dāng)對共同選擇圖像的另外選擇仍然關(guān)于該用戶會話時,識別表示另一個共同選擇圖像的節(jié)點(508)。當(dāng)對共同選擇圖像的另外選擇不再關(guān)于該用戶會話時,對引用圖像是否在另一個用戶會話期間被選擇作出可選選擇(514)。如上所述,對引用圖像的另一個選擇可以例如基于關(guān)于引用圖像的選擇數(shù)據(jù)來識別。當(dāng)對引用圖像的另一個選擇被識別時,識別在用戶會話期間的對共同選擇圖像的隨后選擇(506)。當(dāng)沒有被識別到對引用圖像的另一個選擇時,過程500結(jié)束(516)。一旦生成加權(quán)圖,就可以對其進行更新以表示對引用圖像的另外選擇和關(guān)于另外引用圖像的共同選擇圖像。加權(quán)圖可以基于更新條件被滿足來周期性更新。更新條件例如可以是自最后更新起的指定量的時間、用戶動作、用戶會話或其他度量??梢曰诩訖?quán)圖中的連接到表示圖像的節(jié)點的邊來為共同選擇圖像生成主題分值。如參考圖2所描述的,在一些實施方式中,特定圖像的主題分值可以是連接到表示圖像的節(jié)點的邊權(quán)重的總和。當(dāng)圖像的主題分值滿足閾值主題分值時,將該圖像加標(biāo)簽為屬于主題。進而,該圖像可以被識別為新的引用圖像,并且在加權(quán)圖中被定義如此。在其他實施方式中,可以為加權(quán)圖中的節(jié)點所表示的圖像中的每一個迭代地生成主題分值,直到停止條件發(fā)生。如下所述,迭代地生成主題分值以便于遍及加權(quán)圖傳播主題分值。例如,當(dāng)在一個或多個迭代期間圖像中的每一個的主題分值的改變小于閾值改變 (即,趨同)時,停止條件可以發(fā)生。在這些實施方式中,主題分值可以基于引用圖像和/或其他圖像屬于引用主題的可能性和關(guān)于圖像的共同選擇數(shù)據(jù)來迭代地生成。圖像中的每一個屬于引用主題的可能性可以被表示為主題分值的向量。初始主題分值例如可以對應(yīng)于上述引用權(quán)重。圖6A是其中可以存儲并跟蹤圖像集的主題分值的示例表600。表600包括列602, 在其中存儲識別加權(quán)圖中的每一個節(jié)點的節(jié)點標(biāo)識符。表600還包括列604,在其中存儲與列602中識別的節(jié)點相對應(yīng)的主題分值。表600中提供的主題分值是分別與節(jié)點標(biāo)識符 702『70加相對應(yīng)的節(jié)點的初始主題分值。初始主題分值表示列602中識別的節(jié)點所表示的每一個圖像屬于引用主題的初始可能性。主題分值可以是從0. 00至1. 00的值,其中具有主題分值0. 00的圖像是已知不屬于引用主題的圖像,以及具有主題分值1. 00的圖像是已知屬于引用主題的圖像。在一些實施方式中,被識別為屬于引用主題的圖像(S卩,引用圖像)的初始主題分值中的每一個可以被最初設(shè)置為1.0,而其他圖像的初始主題分值被設(shè)置為0. 0或一些其他默認(rèn)值。通過下述迭代過程,可以為最初未被識別為屬于引用主題的圖像中的每一個計算最終主題分值。在其他實施方式中,基于圖像中的每一個的屬于引用主題的初始可能性,為圖像中的每一個指定初始主題分值。圖像中的每一個屬于引用主題的初始可能性可以例如基于以下來確定標(biāo)簽反饋、圖像分析技術(shù)和文本分析技術(shù),其每一個在上面參考圖2被描述。在一些實施方式中,關(guān)于圖像的共同選擇數(shù)據(jù)可以為在一個或多個用戶會話期間共同選擇圖像定義共同選擇矩陣。例如,關(guān)于每一個圖像對的共同選擇數(shù)據(jù)可以是NXN共同選擇矩陣中的值,其中N是在一個或多個用戶會話期間選擇的圖像的數(shù)量。關(guān)于圖像對的共同選擇數(shù)據(jù)例如可以指定圖像中的一個在對另一個圖像的選擇之后的順序選擇率或用于圖像對的另一個選擇度量(例如,總計順序選擇)。共同選擇數(shù)據(jù)可以是定向或單向的。在一些實施方式中,關(guān)于圖像對的共同選擇數(shù)據(jù)可以對應(yīng)于加權(quán)圖中的連接表示圖像的節(jié)點對的邊的權(quán)重。圖6B是其中可以存儲定義共同選擇矩陣的共同選擇數(shù)據(jù)的示例表650。表650包括關(guān)于在一個或多個用戶會話期間選擇的每一個節(jié)點(例如,702『70加)的行和列。關(guān)于每一個圖像對(例如,節(jié)點70 和節(jié)點702c)的共同選擇數(shù)據(jù)占據(jù)與該對中的圖像中的每一個相對應(yīng)的單元格。當(dāng)共同選擇數(shù)據(jù)對圖像對不可獲得時,可以將值“0. 00”輸入與表示圖像的節(jié)點對相對應(yīng)的單元格中。如在上面參考圖2所描述的,關(guān)于圖像對的共同選擇數(shù)據(jù)可以例如基于關(guān)于用戶會話的選擇數(shù)據(jù)來識別??梢允褂脕碜员?00的主題分值和來自共同選擇矩陣650的共同選擇數(shù)據(jù)來為已在一個或多個用戶會話中共同選擇的圖像識別最終主題分值。例如,可以迭代地計算節(jié)點的主題分值和共同選擇矩陣的乘積,直到停止條件發(fā)生。圖7A-7D是在迭代的主題分值生成過程的不同點處的示例加權(quán)圖。迭代過程可以例如由圖1的圖像分類子系統(tǒng)120來執(zhí)行。圖7A-7D圖示了相對于單個引用主題的圖像的單個主題分值的識別。然而,關(guān)于其他引用主題的主題分值可以在加權(quán)圖700或具有與加權(quán)圖700中的節(jié)點相對應(yīng)的節(jié)點的另一個圖中計算。參考圖7A,加權(quán)圖700由圖像分類子系統(tǒng)120生成,其包括與圖6A的初始主題分值相對應(yīng)的節(jié)點7(^a-e的初始主題分值。例如,加權(quán)圖700包括分別用于節(jié)點70 和702b 的初始主題分值“0. 00”和“1. 00”。節(jié)點702c-e每一個具有初始主題分值“0. 50”。類似地,在每一個節(jié)點對之間的邊具有與在圖6B的表650中指定的共同選擇數(shù)據(jù)相對應(yīng)的權(quán)重。使用這些初始主題分值和共同選擇數(shù)據(jù),圖像分類子系統(tǒng)120可以例如基于初始主題分值和共同選擇數(shù)據(jù)的乘積來為節(jié)點70^-70 所表示的圖像中的每一個生成更新的主題分值。參考圖7B,加權(quán)圖700示出了在迭代的主題分值生成過程的一次迭代之后節(jié)點 702a-e中的每一個的更新的主題分值。在該示例中,節(jié)點70 +的主題分值被分別固定在“0. 00”和“1. 00”。節(jié)點702a的主題分值被固定在“0. 00”,因為節(jié)點702a表示的圖像最初被識別為不屬于引用主題。節(jié)點702b的主題分值被固定在“1. 00”,因為節(jié)點702b表示的圖像最初被識別為屬于引用主題(即,引用主題的引用圖像)。例如,基于由共同選擇矩陣和初始主題分值的乘積產(chǎn)生的向量的值,節(jié)點702c_e 的更新的主題分值現(xiàn)分別為“0. 25 ViO. 73”和“0. 53”。節(jié)點70 和702c與其他節(jié)點相比的相對較高幅度(“0. 7”)的共同選擇數(shù)據(jù)導(dǎo)致節(jié)點702c的更新的主題分值(“0. 25”)比節(jié)點702c的初始主題分值(“0. 5”)更接近于節(jié)點702a的主題分值(“0. 00”)。類似地, 節(jié)點702b和702d與其他節(jié)點相比的相對較高值(“0. 7”)的共同選擇數(shù)據(jù)給予節(jié)點702d 比其他節(jié)點的主題分值更接近于節(jié)點702b的主題分值(“1. 00”)的主題分值(“0. 73”)。 節(jié)點70 以及節(jié)點702b和702d中的每一個的共同選擇數(shù)據(jù)的值(“0. 5”)比節(jié)點70 以及節(jié)點70 和702c中的每一個的共同選擇數(shù)據(jù)的值(“0.4”)稍微更高。因此,節(jié)點 702e的更新的主題分值增加稍微接近節(jié)點702b和702d的主題分值。在一些實施方式中,圖像分類子系統(tǒng)120用圖7B的更新的主題分值來替換節(jié)點 702a-e的初始主題分值。例如,可以使用更新的主題分值來重寫存儲在圖6B的表600中的初始主題分值。然后使用更新的主題分值和共同選擇數(shù)據(jù)來例如通過計算更新的主題分值和共同選擇數(shù)據(jù)的乘積,為節(jié)點生成另外更新的主題分值。參考圖7C,加權(quán)圖700示出了在經(jīng)由圖像分類子系統(tǒng)120的迭代的主題分值生成過程的兩次迭代之后節(jié)點70h-e的更新的主題分值。節(jié)點702c的更新的主題分值增加了 “0. 01”至“0. 26”。節(jié)點702d的更新的主題分值增加了“0. 01”至“0. 74”。節(jié)點702e的更新的主題分值增加了“0. 01”至“0. 54在一些實施方式中,當(dāng)在隨后迭代之間的每一個更新的主題分值的改變低于諸如“0. 01”的特定閾值時,圖像分類子系統(tǒng)120停止迭代的主題分值生成。參考圖7D,加權(quán)圖700示出了在經(jīng)由圖像分類子系統(tǒng)120的迭代的主題分值生成過程的四次迭代之后節(jié)點70h-e的更新的主題分值。節(jié)點702d的更新的主題分值增加了 “0. 01”至“0. 75”。節(jié)點7(^a-e的更新的主題分值在第四次迭代之后每一個已在“0. 01”內(nèi)趨同。因此,圖像分類子系統(tǒng)120停止迭代的主題分值生成過程,并且輸出節(jié)點70h-e所表示的圖像的主題分值。替選地,圖像分類子系統(tǒng)可以在閾值數(shù)量的迭代之后停止迭代過程。閾值數(shù)量的迭代可以是例如加權(quán)圖中的兩個特定節(jié)點之間的節(jié)點的數(shù)量的函數(shù)。圖8是用于迭代地生成主題分值的示例過程800。過程800可以例如由圖1的圖像分類子系統(tǒng)120來實現(xiàn)。為圖像組獲取初始主題分值(802)。在一些實施方式中,圖像組包括在一個或多個用戶會話期間被共同選擇的圖像。每一個圖像的初始主題分值是指定該圖像屬于引用主題的可能性的值。如參考圖2所描述的,初始主題分值可以例如基于對圖像、與圖像相關(guān)聯(lián)的文本和/或關(guān)于圖像的標(biāo)簽反饋數(shù)據(jù)的分析來獲取??梢詾閳D像中的每一個或圖像子集指定初始主題分值。當(dāng)為圖像中的每一個指定初始主題分值時,值可以是在“0. 00”和“1. 00”之間,其中值“0. 00”指示已知不屬于引用主題的圖像,以及值“1.00”指示已知屬于引用主題的圖像。當(dāng)為圖像子集指定初始主題分值時,圖像子集可以僅包括已知屬于引用主題的那些圖像。例如,圖像中的已知屬于引用主題的每一個(即,引用主題的引用圖像)可以具有 “1.00”的初始主題值,而每個其他圖像具有“0. 00”的初始主題值??梢允褂贸跏贾黝}分值來定義主題分值的向量,其中每一個初始主題分值是向量的組分。獲取圖像組的共同選擇數(shù)據(jù)(804)。在一些實施方式中,共同選擇數(shù)據(jù)指定圖像組中的每一個圖像對的相對選擇率。例如,如果從對另一個圖像的每10個選擇里,特定圖像被選擇八次,則該特定圖像相對于另一個圖像的相對選擇率可以被指定為“0.8”。如參考圖2所描述的,共同選擇數(shù)據(jù)可以例如基于關(guān)于用戶會話的選擇數(shù)據(jù)來獲取。如在上面參考圖6B所描述的,可以使用共同選擇數(shù)據(jù)來定義共同選擇矩陣。為圖像組計算更新的主題分值(806)。在一些實施方式中,每一個圖像的主題分值是主題分值和共同選擇數(shù)據(jù)的函數(shù)的結(jié)果。例如,可以計算主題分值向量和共同選擇矩陣的乘積來生成主題分值向量,其指定圖像中的每一個的更新的主題分值。對停止條件是否已發(fā)生作出確定(808)。在一些實施方式中,當(dāng)對更新的主題分值中的每一個的改變低于閾值改變(即,主題分值趨同)時,停止條件發(fā)生。對更新的主題分值的改變可以是相對于一個或多個先前迭代中的主題分值的。例如,在一個迭代期間對每一個主題分值的絕對改變或在多個迭代期間的窗口平均改變。如上所述,在其他實施方式中,停止條件可以是完成閾值數(shù)量的迭代。當(dāng)停止條件已發(fā)生時,基于更新的主題分值對圖像組進行分類(810)。在一些實施方式中,具有至少閾值主題分值的圖像被分類為屬于引用主題。在其他實施方式中,具有在最高部分的主題分值之中的主題分值的閾值數(shù)量的圖像被分類為屬于引用主題。最高部分的主題分值例如可以是整數(shù)數(shù)量的最高主題分值或最高百分比的主題分值。將被分類為屬于引用主題的圖像與對應(yīng)于引用主題的標(biāo)簽相關(guān)聯(lián)(812)。在一些實施方式中,標(biāo)簽是與引用主題相對應(yīng)的文本數(shù)據(jù)。例如,可以將被識別為色情圖像的圖像與文本“露骨的”或“色情的”相關(guān)聯(lián)。在其他實施方式中,被識別為屬于引用主題的圖像可以具有被設(shè)置為指示該圖像屬于主題的二進制值的數(shù)據(jù)標(biāo)志。在上面描述了關(guān)于節(jié)點的若干示例值。例如,表示屬于引用主題的圖像的節(jié)點可以被分配“1.0”的值,而表示不屬于引用類的圖像的節(jié)點可以被分配“0.0”的初始值。另夕卜,節(jié)點可以被分配與節(jié)點所表示的圖像屬于引用主題的可能性相對應(yīng)的值。雖然為示例目的提供了這些值,可以將其他值分配給表示圖像的節(jié)點。例如,表示屬于引用主題的圖像的節(jié)點可以被分配“1.0”的值,而不屬于引用主題的圖像可以被分配“-1.0”的值。類似地, 可以將表示圖像屬于引用主題的可能性的替選值分配給節(jié)點。在上面的描述同樣適用于將值分配給節(jié)點的任何方式。在本說明書中描述的本發(fā)明的實施例和所有功能操作可以以數(shù)字電子電路,或者以計算機軟件、固件或硬件,包括在本說明書中公開的結(jié)構(gòu)以及其結(jié)構(gòu)等價物,或者以以上的一個或多個的組合來實現(xiàn)??梢詫⒈景l(fā)明的實施例實現(xiàn)為一個或多個計算機程序產(chǎn)品, 即一個或多個計算機程序指令模塊,其被編碼在計算機可讀介質(zhì)上、由數(shù)據(jù)處理裝置執(zhí)行或控制數(shù)據(jù)處理裝置的操作。計算機可讀介質(zhì)可以是計算機可讀存儲設(shè)備、機器可讀存儲基片、存儲器設(shè)備、產(chǎn)生機器可讀傳播信號的物質(zhì)成分、或以上的一個或多個的組合。術(shù)語 “數(shù)據(jù)處理裝置”包含用于處理數(shù)據(jù)的所有裝置、設(shè)備以及機器,包括例如可編程處理器、計算機、或多個處理器或計算機。除硬件外,裝置可以包括創(chuàng)建用于討論中的計算機程序的執(zhí)行環(huán)境的代碼,例如構(gòu)成處理器固件、協(xié)議堆棧、數(shù)據(jù)庫管理系統(tǒng)、操作系統(tǒng)、或以上的一個或多個的組合的代碼。傳播信號是非自然生成的信號,例如機器生成的電的、光學(xué)或電磁的信號,其被生成以編碼用于傳輸?shù)竭m當(dāng)接收器裝置的信息。計算機程序(也稱作程序、軟件、軟件應(yīng)用、腳本或代碼)可以以任何形式的編程語言編寫,包括編譯或解釋語言,并且其可以以任何形式部署,包括作為獨立程序或作為模塊、組件、子程序或適于在計算環(huán)境中使用的其他單元。計算機程序不必對應(yīng)于文件系統(tǒng)中的文件??梢詫⒊绦虼鎯υ诒3制渌绦蚧驍?shù)據(jù)的文件(例如,存儲在標(biāo)記語言文檔中的一個或多個腳本)的一部分、專用于討論中的程序的單個文件或者多個協(xié)調(diào)文件(例如,存儲一個或多個模塊、子程序或部分代碼的文件)中??梢詫⒂嬎銠C程序部署為在一個計算機上或者在位于一個地點或跨多個地點分布并且由通信網(wǎng)絡(luò)互連的多個計算機上執(zhí)行。在本說明書中描述的過程和邏輯流可以由執(zhí)行一個或多個計算機程序的一個或多個可編程處理器執(zhí)行以通過操作輸入數(shù)據(jù)并且生成輸出來執(zhí)行功能。過程和邏輯流還可以由專用邏輯電路執(zhí)行,以及裝置還可以被實現(xiàn)為專用邏輯電路,所述專用邏輯電路例如 FPGA (現(xiàn)場可編程門陣列)或ASIC (專用集成電路)。適于執(zhí)行計算機程序的處理器包括例如通用和專用微處理器兩者,以及任何類型的數(shù)字計算機的任何一個或多個處理器。通常,處理器將從只讀存儲器或隨機存取存儲器或兩者接收指令和數(shù)據(jù)。計算機的主要元件是用于執(zhí)行指令的處理器和用于存儲指令和數(shù)據(jù)的一個或多個存儲器設(shè)備。通常,計算機還包括用于存儲數(shù)據(jù)的一個或多個海量存儲設(shè)備,例如磁、磁光盤或光盤,或可操作地耦接以從所述一個或多個海量存儲設(shè)備接收數(shù)據(jù)或向所述一個或多個海量存儲設(shè)備傳送數(shù)據(jù),或兩者。然而,計算機不必具有這樣的設(shè)備。此夕卜,可以將計算機嵌入另一個設(shè)備中,所述設(shè)備例如移動電話、個人數(shù)字助理(PDA)、移動音頻播放器、全球定位系統(tǒng)(GPQ接收器,僅列出一些。適于存儲計算機程序指令和數(shù)據(jù)的計算機可讀介質(zhì)包括所有形式的非易失性存儲器、介質(zhì)和存儲器設(shè)備,包括例如半導(dǎo)體存儲器設(shè)備,例如EPROM、EEPROM和閃存設(shè)備;磁盤,例如內(nèi)部硬盤或可移動盤;磁光盤;以及 CD-ROM和DVD-ROM盤。處理器和存儲器可以由專用邏輯電路補充,或合并入專用邏輯電路。
為了提供與用戶的交互,本發(fā)明的實施例可以在具有下述的計算機上實現(xiàn)用于向用戶顯示信息的顯示設(shè)備,例如CRT (陰極射線管)或LCD (液晶顯示)監(jiān)視器;以及用戶通過其可以向計算機提供輸入的鍵盤和指示設(shè)備,例如鼠標(biāo)或跟蹤球。也可以使用其他類型的設(shè)備來提供與用戶的交互;例如,提供給用戶的反饋可以是任何形式的感知反饋,例如視覺反饋、聽覺反饋或觸覺反饋;以及可以以任何形式,包括聲學(xué)的、話音或觸覺的輸入,接收來自用戶的輸入。本發(fā)明的實施例可以在計算系統(tǒng)中實現(xiàn),所述計算系統(tǒng)包括例如作為數(shù)據(jù)服務(wù)器的后端組件、或者包括例如應(yīng)用服務(wù)器的中間件組件、或者包括前端組件,例如具有用戶通過其可以與本發(fā)明的實施方式交互的圖形用戶界面或Web瀏覽器的客戶端計算機、或者一個或多個這樣的后端、中間件或前端組件的任何組合。系統(tǒng)的組件可以通過例如通信網(wǎng)絡(luò)的任何形式或介質(zhì)的數(shù)字?jǐn)?shù)據(jù)通信互連。通信網(wǎng)絡(luò)的示例包括局域網(wǎng)(“LAN")和廣域網(wǎng)(“WAN"),例如因特網(wǎng)。計算系統(tǒng)可以包括客戶端和服務(wù)器。客戶端和服務(wù)器通常彼此遠(yuǎn)離并且典型地通過通信網(wǎng)絡(luò)交互??蛻舳撕头?wù)器的關(guān)系依靠在各個計算機上運行并且彼此具有客戶端-服務(wù)器關(guān)系的計算機程序產(chǎn)生。雖然本說明書包含許多細(xì)節(jié),但是這些細(xì)節(jié)不應(yīng)當(dāng)被解釋為對本發(fā)明或可以主張的內(nèi)容的范圍的限制,而應(yīng)當(dāng)被解釋為對具體到本發(fā)明的特定實施例的特征的描述。還可以將在本說明書中在分立的實施例的情境中描述的某些特征組合在單個實施例中實現(xiàn)。相反地,也可以將在單個實施例的情境中描述的各種特征分離地在多個實施例中實現(xiàn)或在任何適當(dāng)?shù)淖咏M合中實現(xiàn)。此外,盡管可能在上面將特征描述為在某些組合中起作用,甚至最初主張如此,但是可以在一些情況下將來自所主張的組合的一個或多個特征從組合中刪去,以及可以將所主張的組合指向子組合或者子組合的變體。類似地,雖然在附圖中以特定順序描繪了操作,但是不應(yīng)當(dāng)將這理解為需要以所示的特定順序或者以連續(xù)順序執(zhí)行這樣的操作、或者需要執(zhí)行所有圖示的操作,才能達(dá)到期望的結(jié)果。在某些情況下,多任務(wù)以及并行處理可以是有利的。此外,不應(yīng)當(dāng)將在上述實施例中的各種系統(tǒng)組件的分離理解為在所有實施例中均需要這樣的分離,而應(yīng)當(dāng)理解的是,通??梢詫⑺枋龅某绦蚪M件和系統(tǒng)集成到一起成為單個軟件產(chǎn)品或封裝為多個軟件因此,已經(jīng)描述了本發(fā)明的特定實施例。其他實施例在所附權(quán)利要求的范圍內(nèi)。例如,可以以不同的順序來執(zhí)行權(quán)利要求中記載的動作并且仍然達(dá)到期望的結(jié)果。
權(quán)利要求
1.一種計算機實現(xiàn)的方法,包括為引用圖像獲取引用標(biāo)簽,所述引用標(biāo)簽是指定所述引用圖像屬于的第一主題的標(biāo)簽;在數(shù)據(jù)處理系統(tǒng)中識別在其期間所述引用圖像被選擇用于展現(xiàn)的用戶會話,每一個用戶會話是對圖像的選擇被關(guān)聯(lián)成會話集的時段;在所述數(shù)據(jù)處理系統(tǒng)中為所述引用圖像識別在所述用戶會話期間被選擇用于展現(xiàn)的共同選擇圖像,共同選擇圖像是繼對所述引用圖像的選擇之后被選擇的圖像;對于每一個共同選擇圖像,在所述數(shù)據(jù)處理系統(tǒng)中,基于對關(guān)于所述引用圖像的所述共同選擇圖像的選擇的頻率來生成主題分值,所述主題分值表示所述共同選擇圖像與所述第一主題的相關(guān)性的度量;以及將具有滿足閾值主題分值的主題分值的共同選擇圖像加標(biāo)簽為屬于所述第一主題。
2.根據(jù)權(quán)利要求1所述的方法,進一步包括 為用戶會話識別對所述引用圖像的第一選擇時間;識別對在所述用戶會話期間選擇的共同選擇圖像的隨后選擇時間;以及僅將具有在相對于所述第一選擇時間的閾值時間段內(nèi)的隨后選擇時間的圖像識別為共同選擇圖像,其中所述用戶會話具有會話時間段并且所述閾值時間段小于所述會話時間段。
3.根據(jù)權(quán)利要求1所述的方法,其中識別所述共同選擇圖像包括在所述數(shù)據(jù)處理系統(tǒng)中,將所述引用圖像和所述共同選擇圖像表示為加權(quán)圖中的節(jié)點,每一個節(jié)點通過加權(quán)邊連接到其他節(jié)點,所述加權(quán)邊表示對由所述節(jié)點和所述其他節(jié)點所表示的所述圖像的順序選擇;以及其中每一個共同選擇圖像的所述主題分值基于所述加權(quán)邊來生成。
4.根據(jù)權(quán)利要求3所述的方法,其中連接節(jié)點對的加權(quán)邊具有指示對由所述節(jié)點對所表示的圖像的順序選擇的數(shù)量的權(quán)重。
5.根據(jù)權(quán)利要求4所述的方法,其中每一個加權(quán)邊具有指示源圖像和目的圖像的定向組分,所述源圖像是在所述目的圖像被選擇用于展現(xiàn)之前被選擇用于展現(xiàn)的圖像。
6.根據(jù)權(quán)利要求5所述的方法,其中加權(quán)邊的每一個定向組分被獨立地賦予權(quán)重。
7.根據(jù)權(quán)利要求3所述的方法,其中生成主題分值包括為每一個共同選擇圖像,識別將表示所述引用圖像的節(jié)點連接到表示所述共同選擇圖像的節(jié)點的加權(quán)邊;以及基于所述加權(quán)邊的權(quán)重來生成所述主題分值。
8.根據(jù)權(quán)利要求3所述的方法,其中生成主題分值包括為每一個共同選擇圖像,識別通過一個或多個另外節(jié)點將表示所述引用圖像的節(jié)點連接到表示所述共同選擇圖像的節(jié)點的兩個或更多個加權(quán)邊;以及基于與所述加權(quán)邊相對應(yīng)的邊權(quán)重的函數(shù)來生成所述主題分值。
9.根據(jù)權(quán)利要求8所述的方法,其中基于邊權(quán)重的函數(shù)來生成所述主題分值包括基于邊權(quán)重的函數(shù)來生成所述主題分值,每一個邊權(quán)重基于在所述加權(quán)邊和表示所述引用圖像的所述節(jié)點之間的節(jié)點的數(shù)量來調(diào)節(jié)。
10.根據(jù)權(quán)利要求1所述的方法,其中所述主題指示色情內(nèi)容。
11.根據(jù)權(quán)利要求1所述的方法,進一步包括接收對被分類為屬于不同于所述第一主題的第二主題的查詢作出響應(yīng)的圖像搜索結(jié)果;以及對所述圖像搜索結(jié)果進行過濾以移除對具有指示圖像屬于所述第一主題的標(biāo)簽的所述圖像的引用。
12.根據(jù)權(quán)利要求1所述的方法,進一步包括接收對被分類為屬于不同于所述第一主題的第二主題的查詢作出響應(yīng)的圖像搜索結(jié)果;以及當(dāng)所述圖像搜索結(jié)果包括對具有指示圖像屬于所述第一主題的標(biāo)簽的所述圖像的引用時,對所述圖像搜索結(jié)果重新排序。
13.根據(jù)權(quán)利要求1所述的方法,其中生成主題分值包括為所述共同選擇圖像獲取初始主題分值,每一個初始主題分值是所述圖像與所述第一主題的初始相關(guān)性度量;為所述共同選擇圖像獲取共同選擇數(shù)據(jù),所述共同選擇數(shù)據(jù)指定相對于對所述引用圖像或其他共同選擇圖像的選擇的對所述共同選擇圖像的選擇;基于所述初始主題分值和所述共同選擇數(shù)據(jù)的函數(shù)為所述共同選擇圖像計算更新的主題分值;確定是否已發(fā)生停止條件;當(dāng)尚未發(fā)生所述停止條件時,基于所述共同選擇數(shù)據(jù)和先前計算的更新的主題分值來計算另外的更新的主題分值;當(dāng)已發(fā)生所述停止條件時,基于所述更新的主題分值對所述共同選擇圖像進行分類;以及其中所述加標(biāo)簽基于所述更新的主題分值。
14.一種系統(tǒng),包括數(shù)據(jù)存儲,所述數(shù)據(jù)存儲存儲引用圖像的引用標(biāo)簽和關(guān)于多個用戶會話的用戶會話數(shù)據(jù),所述引用標(biāo)簽是指定所述引用圖像屬于的第一主題的標(biāo)簽,所述用戶會話數(shù)據(jù)指定在所述多個用戶會話期間對圖像的選擇;以及包括至少一個處理器的圖像分類子系統(tǒng),所述圖像分類子系統(tǒng)被配置成為所述引用圖像識別共同選擇圖像,生成表示所述共同選擇圖像中的每一個與所述主題的相關(guān)性的度量的主題分值,以及將具有滿足閾值主題分值的主題分值的所述共同選擇圖像加標(biāo)簽為屬于所述第一主題,所述共同選擇圖像是在所述用戶會話期間繼對所述引用圖像的選擇之后被選擇用于展現(xiàn)的圖像,以及所述主題分值基于對所述共同選擇圖像的選擇的頻率。
15.根據(jù)權(quán)利要求14所述的系統(tǒng),其中所述圖像分類子系統(tǒng)被進一步配置成為用戶會話識別對所述引用圖像的第一選擇時間和對共同選擇圖像的隨后選擇時間,其中所述共同選擇圖像僅僅是具有在相對于所述第一選擇時間的閾值時間段內(nèi)的隨后選擇時間的圖像。
16.根據(jù)權(quán)利要求14所述的系統(tǒng),其中所述圖像分類子系統(tǒng)被配置成基于加權(quán)圖來識別共同選擇圖像,其中所述圖像分類子系統(tǒng)將所述引用圖像和所述共同選擇圖像表示為所述加權(quán)圖中的節(jié)點,每一個節(jié)點通過加權(quán)邊連接到其他節(jié)點,所述加權(quán)邊表示對由通過所述加權(quán)邊所連接的節(jié)點所表示的所述圖像的順序選擇。
17.根據(jù)權(quán)利要求16所述的系統(tǒng),其中所述圖像分類子系統(tǒng)基于關(guān)于表示所述共同選擇圖像的節(jié)點的所述加權(quán)邊為由所述加權(quán)圖中的所述節(jié)點所表示的所述共同選擇圖像生成所述主題分值。
18.根據(jù)權(quán)利要求16所述的系統(tǒng),其中連接節(jié)點對的每一個加權(quán)邊具有指示對由所述節(jié)點對所表示的圖像的順序選擇的數(shù)量的權(quán)重。
19.根據(jù)權(quán)利要求18所述的系統(tǒng),其中每一個加權(quán)邊具有指示源圖像和目的圖像的定向組分,所述源圖像是在所述目的圖像被選擇用于展現(xiàn)之前被選擇用于展現(xiàn)的圖像。
20.根據(jù)權(quán)利要求14所述的系統(tǒng),其中所述主題指示色情內(nèi)容。
21.根據(jù)權(quán)利要求14所述的系統(tǒng),其中所述圖像分類子系統(tǒng)被進一步配置成接收對被識別為屬于不同于所述第一主題的第二主題的查詢作出響應(yīng)的圖像搜索結(jié)果,以及對所述圖像搜索結(jié)果進行過濾以移除對具有指示圖像屬于所述第一主題的標(biāo)簽的所述圖像的引用。
22.根據(jù)權(quán)利要求14所述的系統(tǒng),其中所述圖像分類子系統(tǒng)被進一步配置成接收對被識別為屬于不同于所述第一主題的第二主題的查詢作出響應(yīng)的圖像搜索結(jié)果,以及調(diào)整具有與所述第一主題相對應(yīng)的標(biāo)簽的圖像被引用的展現(xiàn)位置。
23.—種編碼有包括指令的計算機程序的計算機可讀介質(zhì),所述指令當(dāng)被執(zhí)行時操作地促使計算機執(zhí)行操作為引用圖像獲取引用標(biāo)簽,所述引用標(biāo)簽是指定所述引用圖像屬于的第一主題的標(biāo)簽;在數(shù)據(jù)處理系統(tǒng)中識別在其期間所述引用圖像被選擇用于展現(xiàn)的用戶會話,每一個用戶會話是對圖像的選擇被關(guān)聯(lián)成會話集的時段;在所述數(shù)據(jù)處理系統(tǒng)中為所述引用圖像識別在所述用戶會話期間被選擇用于展現(xiàn)的共同選擇圖像,共同選擇圖像是繼對所述引用圖像的選擇之后被選擇的圖像;對于每一個共同選擇圖像,在所述數(shù)據(jù)處理系統(tǒng)中,基于對關(guān)于所述引用圖像的所述共同選擇圖像的選擇的頻率來生成主題分值,所述主題分值表示所述共同選擇圖像與所述第一主題的相關(guān)性的度量;以及將具有滿足閾值主題分值的主題分值的共同選擇圖像加標(biāo)簽為屬于所述第一主題。
24.根據(jù)權(quán)利要求23所述的計算機可讀介質(zhì),其中生成主題分值的所述操作包括操作為所述共同選擇圖像獲取初始主題分值,每一個初始主題分值是所述圖像與所述第一主題的初始相關(guān)性度量;為所述共同選擇圖像獲取共同選擇數(shù)據(jù),所述共同選擇數(shù)據(jù)指定相對于對所述引用圖像或其他共同選擇圖像的選擇的對所述共同選擇圖像的選擇;基于所述初始主題分值和所述共同選擇數(shù)據(jù)的函數(shù)為所述共同選擇圖像計算更新的主題分值;確定是否已發(fā)生停止條件;當(dāng)尚未發(fā)生所述停止條件時,基于所述共同選擇數(shù)據(jù)和先前計算的更新的主題分值來計算另外的更新的主題分值;當(dāng)已發(fā)生所述停止條件時,基于所述更新的主題分值對所述共同選擇圖像進行分類;以及其中所述加標(biāo)簽基于所述更新的主題分值。
全文摘要
基于主題分值來為共同選擇圖像加標(biāo)簽,該主題分值是共同選擇圖像與引用圖像屬于的第一主題的相關(guān)性的度量?;谂c引用圖像相關(guān)聯(lián)的引用標(biāo)簽來識別引用圖像屬于的第一主題。共同選擇圖像是在用戶會話期間繼對引用圖像的選擇之后被選擇用于展現(xiàn)的圖像?;陉P(guān)于用戶會話的選擇數(shù)據(jù)來識別共同選擇圖像,在所述用戶會話中引用圖像被選擇用于展現(xiàn)?;诠餐x擇圖像的選擇的頻率來生成主題分值??梢詫﹃P(guān)于第二主題的圖像搜索結(jié)果進行過濾以移除被加標(biāo)簽為屬于第一主題的圖像,或可以對圖像搜索結(jié)果重新排序以基于圖像屬于的主題來調(diào)整圖像被引用的展現(xiàn)位置。
文檔編號G06F17/30GK102483745SQ200980160571
公開日2012年5月30日 申請日期2009年6月3日 優(yōu)先權(quán)日2009年6月3日
發(fā)明者布恩-洛克·約, 張勇, 景宇石, 李光華, 李琿, 李鋼江 申請人:谷歌公司