測量在線觀眾的系統(tǒng)、方法和產(chǎn)品的制作方法
【專利摘要】本發(fā)明描述了在內(nèi)容顯示站點監(jiān)測媒體內(nèi)容的方法和裝置。示例方法包括以下步驟:獲得與在所測量的位置訪問網(wǎng)頁的多名小組成員相對應(yīng)的小組成員數(shù)據(jù),根據(jù)小組成員的人口統(tǒng)計信息對小組成員數(shù)據(jù)進(jìn)行分類,基于對未測量的位置的網(wǎng)頁訪問的估計產(chǎn)生虛擬小組,并且基于與該虛擬小組相對應(yīng)的數(shù)據(jù)對與該未測量的位置相關(guān)聯(lián)的頁面查看數(shù)據(jù)進(jìn)行分類。
【專利說明】測量在線觀眾的系統(tǒng)、方法和產(chǎn)品
[0001]相關(guān)申請
[0002]本專利要求2012年I月26日提交的美國臨時專利申請61/591,263的優(yōu)先權(quán),該申請在此已被全文引用。
【技術(shù)領(lǐng)域】
[0003]本說明書大體上涉及觀眾測量,更具體地涉及在線觀眾測量的系統(tǒng)、方法和產(chǎn)品。
【背景技術(shù)】
[0004]基于小組成員設(shè)備計量的在線觀眾測量和基于網(wǎng)站/網(wǎng)頁標(biāo)記的在線觀眾測量共同擁有測量網(wǎng)站流量的目標(biāo)。在每種情況下,該目標(biāo)是以計數(shù)或者估計人有機會看到在線媒體的元素(例如,內(nèi)容,廣告等)的機會的次數(shù)。該目標(biāo)還可以包括對暴露于特定網(wǎng)站的獨特觀眾總數(shù)進(jìn)行估計。
【專利附圖】
【附圖說明】
[0005]圖1是例示根據(jù)本說明書的指示構(gòu)造的、用于測量在線觀眾的公開的示例系統(tǒng)的框圖。
[0006]圖2是可以被用來實現(xiàn)圖1的混合在線觀眾測量系統(tǒng)的示例系統(tǒng)的框圖。
[0007]圖3是實現(xiàn)圖2的虛擬小組產(chǎn)生器的示例虛擬小組產(chǎn)生器的框圖。
[0008]圖4是表示可以被執(zhí)行以實現(xiàn)圖1和/或圖2的混合在線觀眾測量系統(tǒng)以測量網(wǎng)站的在線觀眾的示例計算機可讀指令的流程圖。
[0009]圖5是表示示例計算機可讀指令的流程圖,當(dāng)示例計算機可讀指令被執(zhí)行時,其使處理器從一組流量數(shù)據(jù)中過濾非人為流量。
[0010]圖6是表示示例計算機可讀指令的流程圖,當(dāng)示例計算機可讀指令被執(zhí)行時,其使處理器估計從未測量的位置訪問網(wǎng)站。
[0011]圖7是表示示例計算機可讀指令的流程圖,當(dāng)示例計算機可讀指令被執(zhí)行時,其使處理器計算負(fù)二項分布參數(shù)。
[0012]圖8是表示示例計算機可讀指令的流程圖,當(dāng)示例計算機可讀指令被執(zhí)行時,其使處理器計算負(fù)二項分布。
[0013]圖9是表示示例計算機可讀指令的流程圖,當(dāng)示例計算機可讀指令被執(zhí)行時,其使處理器選擇小組成員以表示未測量的位置的觀眾。
[0014]圖1OA和圖1OB共同包括表示示例計算機可讀指令的流程圖,當(dāng)示例計算機可讀指令被執(zhí)行時,其使處理器使用所選擇的小組成員以估計未測量的位置的觀眾。
[0015]圖1lA和圖1lB共同包括表示示例計算機可讀指令的流程圖,當(dāng)示例計算機可讀指令被執(zhí)行時,其使處理器使用所選擇的小組成員以估計未測量的位置的觀眾。
[0016]圖12是表示示例計算機可讀指令的流程圖,當(dāng)示例計算機可讀指令被執(zhí)行時,其使處理器平滑數(shù)量(volume)度量。
[0017]圖13A和圖13B共同包括表示示例計算機可讀指令的流程圖,當(dāng)示例計算機可讀指令被執(zhí)行時,其使處理器計算在線觀眾。
[0018]圖14例示針對星期中一天的時段的人口統(tǒng)計群體之間的示例小組流分布百分比。
[0019]圖15例示針對圖14的星期中一天的時段的人口統(tǒng)計群體的流的數(shù)量的分布。
[0020]圖16例示針對報告時段的圖14的人口統(tǒng)計群體的示例一的普查流的數(shù)量的計笪
ο
[0021]圖17例示針對圖14的示例人口統(tǒng)計群體的縮放的普查會話的計算。
[0022]圖18是能夠執(zhí)行圖4-圖13B的指令以實現(xiàn)圖1、圖2和/或圖3的系統(tǒng)的示例處理器平臺的框圖。
【具體實施方式】
[0023]在此公開的示例系統(tǒng)、方法、裝置和產(chǎn)品通過觀測的以用戶為中心的方法使用的小組數(shù)據(jù)(例如,從參加者中的小組處獲得的數(shù)據(jù),諸如,已經(jīng)同意使他們的在線瀏覽活動受監(jiān)測的小組成員)作為核心源數(shù)據(jù)產(chǎn)生混合在線觀眾測量數(shù)據(jù)。在一些示例中,使用從以網(wǎng)站為中心的普查數(shù)據(jù)導(dǎo)出的信息(例如,網(wǎng)站服務(wù)器的網(wǎng)頁點擊計數(shù))對該小組數(shù)據(jù)進(jìn)行校準(zhǔn)。在此公開的示例觀測的以用戶為中心的方法有效地對已知的在線觀眾測量系統(tǒng)的缺點進(jìn)行糾正,能夠報告任何網(wǎng)站,和/或能夠確定從小組數(shù)據(jù)可得的附加的分析,該分析先前不能根據(jù)基于普查的數(shù)據(jù)確定。
[0024]在此公開的示例系統(tǒng)、方法、裝置和產(chǎn)品提供了對在之前未測量的位置(例如,家庭和工作環(huán)境以外的位置)的觀眾曝光和行為的測量。此類之前未測量的位置的示例包括由多個用戶共享的工作計算機的使用、家庭里的輔助計算機、公共訪問位置(例如,公共圖書館的電腦),移動設(shè)備使用,和/或其它之前未測量的設(shè)備。來自未測量的位置的觀眾與來自已測量的位置的觀眾相結(jié)合,以得到總獨特觀眾。該結(jié)合的已測量的和未測量的觀眾比根據(jù)先前方法獲得的總獨特在線觀眾準(zhǔn)確。
[0025]在一些示例中,參與公布者和/或網(wǎng)站在它們各自內(nèi)容的源代碼內(nèi)插入或者嵌入標(biāo)記(例如,HTML代碼)。該標(biāo)記可以包括Java,Javascript和/或其它可執(zhí)行指令,當(dāng)該標(biāo)記在瀏覽器上執(zhí)行時,使該頁面查看由數(shù)據(jù)收集設(shè)備記錄。
[0026]標(biāo)記從Blumenau的美國專利6108637已知,其在此已被全文引用。因為標(biāo)記被嵌入定義網(wǎng)頁的HTML中和/或在網(wǎng)頁的HTML中的指針?biāo)?,所以每?dāng)瀏覽器提供相應(yīng)的網(wǎng)頁,該標(biāo)記就被執(zhí)行。通常,標(biāo)記將使該瀏覽器向數(shù)據(jù)收集設(shè)備發(fā)送內(nèi)容請求。該請求可以被認(rèn)為是“假性請求”,在于其不同于常規(guī)的互聯(lián)網(wǎng)請求,該假性請求通常不尋求內(nèi)容的下載。相反,該假性請求實際上用來將觀眾測量信息傳送到數(shù)據(jù)收集設(shè)備。為此,該假性請求的有效載荷攜帶要由該數(shù)據(jù)收集設(shè)備待收集,編譯和/或分析的標(biāo)識信息。該標(biāo)識信息可以標(biāo)識與該標(biāo)記相關(guān)聯(lián)的網(wǎng)頁,在上面訪問該網(wǎng)頁的用戶設(shè)備,在上面訪問該網(wǎng)頁的瀏覽器,用戶等。在一些示例中,該數(shù)據(jù)收集設(shè)備通過從該請求用戶設(shè)備請求cookie對假性請求的接收做出響應(yīng)。在一些示例中,如果未接收到c00kie(g卩,目前并未在該用戶設(shè)備上設(shè)置數(shù)據(jù)收集設(shè)備的域內(nèi)的cookie),設(shè)置cookie以便于逐個網(wǎng)頁訪問來標(biāo)識該裝置。
[0027]如上所述的標(biāo)記的優(yōu)點在于它能夠收集普查之類的數(shù)據(jù)。也就是說,因為訪問已標(biāo)記的網(wǎng)頁的每個瀏覽器將通過發(fā)送該假性請求對該標(biāo)記做出響應(yīng),該數(shù)據(jù)收集設(shè)備將獲知每一次對該網(wǎng)頁的訪問。此外,此數(shù)據(jù)的收集并不需要在用戶設(shè)備處使用專用的瀏覽器,或者專用的計量軟件。不如說,因為假性請求看似常規(guī)商用的瀏覽器(例如,火狐,微軟瀏覽器等),如任何其它請求以檢索互聯(lián)網(wǎng)媒體(如請求以獲得作為該網(wǎng)頁部分顯示的內(nèi)容或者廣告素材),任何此類瀏覽器將參與觀眾測量流程,無需修改。因此,加標(biāo)記能夠收集來自小組成員和非小組成員之類的觀眾測量數(shù)據(jù)。通過加標(biāo)記方法收集到的數(shù)據(jù),如上文所述,在此被描述為普查數(shù)據(jù)。
[0028]如上所述,小組成員是已經(jīng)同意受例如觀眾測量實體(如尼爾森公司(美國)有限責(zé)任公司)監(jiān)測的人。通常情況下,小組成員當(dāng)他們登記參加小組時提供詳細(xì)的人口統(tǒng)計信息(例如,種族、年齡、收入、家庭地址、教育程度、性別等)。此外,向小組成員提供了收集他們的媒體曝光的計量表。例如,諸Coffey的美國專利5,675,510 (在此已全文引用)中公開的軟件儀可以被下載到該小組成員的計算機、智能電話、平板電腦和/或其它的瀏覽設(shè)備中。該計量表將收集顯示媒體訪問活動(例如,網(wǎng)站名稱、訪問日期/次數(shù)、點擊流數(shù)據(jù)、和/或其它標(biāo)識該小組成員所接觸的媒體(例如,網(wǎng)頁內(nèi)容,廣告等)的信息的數(shù)據(jù)。該數(shù)據(jù)被定期地或者不定期地上傳給數(shù)據(jù)收集設(shè)備。在此,由計量表收集到的數(shù)據(jù)稱為小組成員數(shù)據(jù)。小組成員數(shù)據(jù)的優(yōu)點在于它與詳細(xì)的人口統(tǒng)計信息相結(jié)合,因為該小組成員已經(jīng)提供了他們的人口統(tǒng)計資料作為登記的一部分,并且由該計量表收集到的活動數(shù)據(jù)可以因而與人口統(tǒng)計信息相關(guān)聯(lián)。當(dāng)小組成員用戶設(shè)備訪問已標(biāo)記的頁面時,該訪問將由該計量表和該數(shù)據(jù)收集設(shè)備經(jīng)由上述提及的標(biāo)記裝置進(jìn)行記錄。因此,訪問已標(biāo)記的網(wǎng)頁的小組成員在小組成員數(shù)據(jù)和普查數(shù)據(jù)之間提供了橋梁。
[0029]基于經(jīng)由該計量表收到的小組成員信息和經(jīng)由該標(biāo)記收到的普查信息,在此公開的示例系統(tǒng)和方法使用以下技術(shù)產(chǎn)生了在線觀眾測量信息(例如,曝光統(tǒng)計,人口統(tǒng)計等):(1)對基于普查的數(shù)據(jù)應(yīng)用過濾技術(shù)以去除不期望的流量(例如,網(wǎng)頁的自動/程序化刷新,其造成該網(wǎng)頁上額外的點擊、機械人流量、源自市場外地理位置的流量等);(2)應(yīng)用字典定義以對觀察到的行為、網(wǎng)站、品牌,和/或通道進(jìn)行分類;(3)確定來自未測量的位置的訪問該網(wǎng)頁的人口規(guī)模和/或人口統(tǒng)計;和(4)對已測量的和未測量的位置的行為進(jìn)行加權(quán)以表示觀測到的流量。
[0030]在此公開的一些示例方法包括獲得與在已測量的位置訪問網(wǎng)頁的多名小組成員對應(yīng)的小組成員數(shù)據(jù),根據(jù)該小組成員的人口統(tǒng)計信息對該小組成員數(shù)據(jù)進(jìn)行分類,基于對在未測量的位置的網(wǎng)頁訪問的估計產(chǎn)生虛擬小組,以及基于與該虛擬小組相對應(yīng)的數(shù)據(jù)對與該未測量的位置相關(guān)聯(lián)的頁面查看數(shù)據(jù)進(jìn)行分類。
[0031]在此公開的一些示例方法包括基于第一估計特征對多名小組成員進(jìn)行賦予權(quán)重,基于該權(quán)重選擇該小組成員中的子集,基于第二估計特征對所選擇的小組成員重新加權(quán),以及產(chǎn)生包括作為虛擬小組成員的所選擇的小組成員的虛擬小組,其中,基于所述重新加權(quán)對從所選擇的小組成員處收集到的針對所述虛擬小組的數(shù)據(jù)賦予權(quán)重。
[0032]在此公開的示例裝置包括:小組數(shù)據(jù)收集器,其用于收集與在已測量的位置訪問網(wǎng)頁的多名小組成員對應(yīng)的小組成員數(shù)據(jù);虛擬小組產(chǎn)生器,其用于基于對在未測量的位置的網(wǎng)頁訪問的估計產(chǎn)生虛擬小組;以及觀眾分類器,其用于根據(jù)該小組成員的人口統(tǒng)計信息對該小組成員數(shù)據(jù)進(jìn)行分類,并且基于該虛擬小組所對應(yīng)的數(shù)據(jù)對與該未測量的位置相關(guān)聯(lián)的頁面查看數(shù)據(jù)進(jìn)行分類。
[0033]在此公開的示例裝置包括:樣本加權(quán)器,其用于基于第一估計特征對多名小組成員賦予權(quán)重;樣本選擇裝置,其用于基于該權(quán)重選擇該小組成員中的集合;以及樣本重新加權(quán)器,其用于基于第二估計特征對所選擇的小組成員進(jìn)行重新加權(quán),并且用于產(chǎn)生虛擬小組,該虛擬小組包括作為虛擬小組成員的所選擇的小組成員,其中,從所選擇的小組成員處收集到的針對虛擬小組的數(shù)據(jù)將基于該重新加權(quán)被賦予權(quán)重。
[0034]如在此所用的,被定義下列術(shù)語來表示:
[0035]統(tǒng)一資源定位器(URL)模式-一組類似URL的實例,由于內(nèi)容和/或目的的相似性,其被歸類在一起。
[0036]URL實例-獨特URL字符串?;谠揢RL字符串的特殊性、URL字符串中的命令行參數(shù),和/或任何其它使該URL獨特的URL字符串的變更,URL實例可以有別于屬于URL模式的其它URL實例。
[0037]頁面查看-在此與“曝光”可互換地使用,是指在有或沒有任何關(guān)于所提供的網(wǎng)頁實際上被消費者或者請求方瀏覽的指示的情況下,網(wǎng)頁或者其它網(wǎng)絡(luò)媒體(例如,內(nèi)容、廣告、視頻、圖像、音頻等)被提供(例如,成功發(fā)送)給消費者或請求方或設(shè)備。
[0038]流-在此也與“曝光”可互換地使用,是指提供流視頻和/或音頻的實例,除了是指不同類型的媒體之外,類似于頁面查看。
[0039]會話-個人在網(wǎng)上從登錄到注銷所耗用的時間,或者在特定的網(wǎng)站或者多個網(wǎng)站的連續(xù)沖浪。
[0040]總體/人口-關(guān)注的個人/設(shè)備/家庭的總數(shù),可以僅限于在線的個人/設(shè)備/家庭。
[0041]基于普查的數(shù)據(jù)-基于標(biāo)記或不限于小組測量的另一種機制所收集到的數(shù)據(jù)。
[0042]小組成員-已經(jīng)同意使他們的行為的一個或者更多個方面(例如,瀏覽活動,看電視等)受監(jiān)測的個人或者人群。
[0043]小組成員數(shù)據(jù)-由與小組成員相關(guān)聯(lián)的計量表收集到的數(shù)據(jù)。
[0044]計量表-收集反映(或者能夠確定)用戶的身份和/或個人(例如,小組成員)曝光的媒體標(biāo)識的數(shù)據(jù)的任何類型的工具(例如,軟件和/或硬件)。
[0045]媒體-經(jīng)由任何類型的傳送機制(例如,網(wǎng)頁、電視、視頻、音頻等)傳送的任何類型的內(nèi)容和/或廣告。
[0046]已測量的地點-安裝了用于收集小組成員數(shù)據(jù)的計量表的用戶設(shè)備或者實際位置(例如,房間)。
[0047]未測量的地點-計量表未監(jiān)測的用戶設(shè)備或者實際位置。
[0048]已測量的流量-從一個或者更多個已測量的地點對媒體的一次或者更多次地訪問。
[0049]未測量的流量-從未測量的地點對媒體的一次或者更多次地訪問。
[0050]為簡便起見,以下僅參照頁面查看描述了示例。然而,在此公開的一些示例適用于其它類型的媒體,諸如,視頻流、音頻流、和/或任何其它類型的可測量的在線流量。
[0051]圖1是例示了根據(jù)本說明書的指導(dǎo)構(gòu)建的公開的用于測量在線觀眾的示例系統(tǒng)100的框圖。圖1的示例系統(tǒng)100基于應(yīng)答者的小組或者小組成員獲得來自已測量的地點的在線觀眾流量的測量結(jié)果,基于普查數(shù)據(jù)估計來自未測量的地點的在線觀眾流量,并且基于從已測量的地點的測量的流量和未測量的流量的估計來估計網(wǎng)站的在線觀眾總數(shù)。該示例系統(tǒng)100還可以提供有關(guān)該估計的網(wǎng)站的在線觀眾(例如,通過已測量的和不可測的地點)總數(shù)的人口統(tǒng)計數(shù)據(jù)。
[0052]圖1的示例系統(tǒng)100包括混合在線觀眾測量系統(tǒng)102、總體估計器104、被測量的網(wǎng)站服務(wù)器106、108、網(wǎng)絡(luò)110、以及在線觀眾小組112。
[0053]圖1的示例混合在線觀眾測量系統(tǒng)102獲得(例如,接收、檢索、收集,等)基于小組的在線觀眾測量數(shù)據(jù)、基于普查的測量數(shù)據(jù),以及基于調(diào)查的觀眾數(shù)據(jù),并且確定針對具體媒體的在線觀眾(規(guī)模和/或人口構(gòu)成)。圖1的示例混合在線觀眾測量系統(tǒng)102可以確定針對關(guān)注網(wǎng)站(諸如,由示例網(wǎng)絡(luò)服務(wù)器106,108所服務(wù)的網(wǎng)站)和/或針對屬于通道、品牌、和/或父輩(parent)實體的網(wǎng)站的聚集體的指定報告周期的在線觀眾。由該示例混合在線觀眾測量系統(tǒng)102產(chǎn)生的在線觀眾測量信息可以用于改善網(wǎng)站流量,為了購買廣告空間、價格廣告投放,和/或在線觀眾測量信息的任何其它用途而進(jìn)行網(wǎng)站分析。
[0054]如下所述,圖1的本示例混合在線觀眾測量系統(tǒng)102通過組合基于小組的觀眾測量的優(yōu)點與或者基于普查的觀眾測量的優(yōu)點,提供了比已知的觀眾測量系統(tǒng)精確的在線觀眾測量。例如,基于小組的測量在人口統(tǒng)計學(xué)和其它有用的統(tǒng)計方面具有較精確地表示待測量的人口或者總體的優(yōu)點。相反地,基于普查的觀眾測量具有精確地測量在線流量總量的優(yōu)點。
[0055]圖1的示例總體估計器104產(chǎn)生在線觀眾的估計,包括在線觀眾的人口統(tǒng)計、位置、和/或行為。在一些示例中,該總體估計器104提供獨立的和/或連續(xù)的枚舉研究以提供在線人口的當(dāng)前估計。圖1的示例總體估計器104從持續(xù)的季度互聯(lián)網(wǎng)總體枚舉調(diào)查產(chǎn)生估計。該示例調(diào)查使用通過遠(yuǎn)程數(shù)字撥號(RDD)的方法招募的小組成員的樣本以搜集互聯(lián)網(wǎng)用戶的互聯(lián)網(wǎng)訪問信息(例如,訪問過的網(wǎng)頁、上網(wǎng)花費的時間等)和/或人口資料(例如,年齡,性別等)。圖1的示例總體估計器104收集互聯(lián)網(wǎng)訪問信息,其包括小組成員的在除已測量的環(huán)境(例如,工作和/或家庭)之外的位置(例如,在未測量的位置,諸如,覆蓋了由多名用戶共享的計算機的工作環(huán)境應(yīng)用、家庭環(huán)境中的輔助計算機、公共訪問位置、移動使用、和之前未測量的設(shè)備)的在線行為的估計。對與未測量的位置相對應(yīng)的行為進(jìn)行估計提高了整體反應(yīng)率并且降低了可以與非專有的,綜合性的調(diào)查相關(guān)聯(lián)的反應(yīng)偏見。
[0056]圖1的示例網(wǎng)絡(luò)服務(wù)器106,108可通信地耦接到該網(wǎng)絡(luò)110 (例如,互聯(lián)網(wǎng))以向請求設(shè)備提供網(wǎng)頁、視頻流、和/或其它網(wǎng)絡(luò)流量。在圖1的示例系統(tǒng)100中,該網(wǎng)絡(luò)服務(wù)器106,108提供已經(jīng)按照上面解釋過的布盧梅瑙方法標(biāo)記過的用于測量的網(wǎng)頁和/或視頻流。例如,該網(wǎng)絡(luò)服務(wù)器106,108可以通過在所提供的每個網(wǎng)頁和/或視頻流中包括一個或者更多個監(jiān)測指令來對所提供的網(wǎng)頁和/或視頻流進(jìn)行標(biāo)記。該示例標(biāo)記代碼可以是動態(tài)內(nèi)容(例如,Javascript指令,Java指令,HTML5指令等),其使接收到該標(biāo)記過的網(wǎng)頁和/或視頻流的該設(shè)備執(zhí)行該指令以對示例混合在線觀眾測量系統(tǒng)102 (例如,對后臺程序136以存儲該瀏覽器信息),對該網(wǎng)絡(luò)服務(wù)器106,108,和/或?qū)Σ煌娜罩痉?wù)器提供信息。
[0057]圖1的示例在線觀眾小組112提供了小組成員114的在線活動的測量,諸如訪問過的網(wǎng)頁、下載的視頻流,和/或瀏覽該網(wǎng)頁和/或播放視頻流所用的時長。該示例小組成員114與各個計算機116相關(guān)聯(lián)的,當(dāng)該小組成員114成為該在線觀眾小組112中的成員時,其每一個均被設(shè)置在線監(jiān)測應(yīng)用(即,計量表118)。該在線監(jiān)測應(yīng)用118唯一地與各個用戶設(shè)備116相關(guān)聯(lián),因此,它們收集到的活動數(shù)據(jù)可以被映射到該小組成員114的人口特征。因此,該小組成員114的已測量的活動與該小組成員114的人口特征相關(guān)(correlated)。該示例在線監(jiān)測應(yīng)用118記錄在計算機116處接收到的網(wǎng)頁和/或視頻流的統(tǒng)一資源定位符(URLs)、輸入的擊鍵,通過光標(biāo)點擊的對象和/或使用計算機116通過該小組成員114進(jìn)行的任何其它交互動作。該示例計算機118還執(zhí)行嵌入在受監(jiān)測的網(wǎng)頁(例如,監(jiān)測指令)內(nèi)的標(biāo)記。在一些示例中,該標(biāo)記由該計量表118識別。在其它示例中,該標(biāo)記是在混合在線觀眾測量系統(tǒng)102處后臺程序136記錄,而不是由該計量表118識另O。該在線監(jiān)測應(yīng)用118將該小組成員的在線活動的日志發(fā)送給該示例混合在線觀眾測量系統(tǒng)102。該日志可以按規(guī)則間隔(例如,每天、每周、每兩周、每月等),按照需要,響應(yīng)于事件或者請求,在預(yù)定的時間和/或根據(jù)任何其它計劃和/或條件而被發(fā)送。
[0058]由一個或者更多個計量表118所監(jiān)測的用戶設(shè)備和/或位置被稱為已測量的位置。已測量的位置可以包括家庭環(huán)境120(例如,位于該小組成員家里的計算機)和工作環(huán)境122(例如,位于該小組成員雇傭位置的計算機)。給定的小組成員114的活動可以在家庭環(huán)境120、工作環(huán)境122和/或家庭和工作環(huán)境這兩者進(jìn)行測量。由于一些企業(yè)阻止計量表118的安裝,一些小組成員僅在他們的家庭環(huán)境受監(jiān)測,而不在他們的工作環(huán)境受監(jiān)測。
[0059]在線活動還發(fā)生在該家庭和工作環(huán)境120,122以外。圖1的示例系統(tǒng)100并未在未測量的位置直接地進(jìn)行在線活動測量,但這些活動導(dǎo)致了由該示例服務(wù)器106,108所提供的額外的頁面查看和/或視頻流??梢援a(chǎn)生網(wǎng)站流量的這種示例未測量的位置包括:由工作環(huán)境122中的不包括計量表118的計算機124(例如,由包括非小組成員、小組成員和非小組成員等的多個用戶126共享的計算機)、在家庭環(huán)境120中的輔助(例如,非主要的)計算機128,在公共訪問位置(例如,圖書館,大學(xué)等)的計算機130、移動設(shè)備132 (例如,移動電話、智能手機、平板電腦等),和/或任何其它類型的未測量的設(shè)備(例如,連接到互聯(lián)網(wǎng)的電器,如智能電視、數(shù)字媒體播放器、游戲機等)產(chǎn)生的網(wǎng)站流量。在未測量的位置的活動(例如,媒體曝光)可以是由小組成員和/或非小組成員進(jìn)行的。
[0060]圖1的該示例網(wǎng)絡(luò)服務(wù)器106,108包括服務(wù)器監(jiān)測器134,其測量由各個網(wǎng)絡(luò)服務(wù)器106,108提供的網(wǎng)絡(luò)流量(例如,提供過的網(wǎng)頁,提供過的視頻流等)。圖1的示例服務(wù)器監(jiān)測器134收集信息,例如,從該服務(wù)器106,108請求網(wǎng)頁和/或視頻流的瀏覽器或者其它應(yīng)用的詳細(xì)信息、請求方的IP地址、該服務(wù)器106,108上的個人瀏覽會話的長度和/或可以由該服務(wù)器106,108確定的任何其它信息(例如,經(jīng)由記錄和/或分析針對網(wǎng)頁的請求和/或經(jīng)由cookie)。經(jīng)由該服務(wù)器監(jiān)測器134收集到的數(shù)據(jù)被認(rèn)為是基于服務(wù)器的、以服務(wù)器為中心的數(shù)據(jù)。以服務(wù)器為中心的數(shù)據(jù)被認(rèn)為存在限制。例如,這種服務(wù)器側(cè)數(shù)據(jù)受到操控(例如,由該服務(wù)器的所有方和/或由可被編程以反復(fù)從服務(wù)器請求數(shù)據(jù)的機器人或者其它設(shè)備)。因此,服務(wù)器側(cè)的數(shù)據(jù)可以多計頁面訪問。因為網(wǎng)頁經(jīng)常被高速緩存在用戶設(shè)備中,對網(wǎng)頁的第二次或者之后訪問可能不涉及對服務(wù)器的請求。相反地,可以從該用戶設(shè)備的本地高速緩存簡便地取得,或者由介于之間的代理服務(wù)器提供。因此,服務(wù)器側(cè)的數(shù)據(jù)會額外地少計頁面查看。
[0061]與服務(wù)器側(cè)數(shù)據(jù)這些潛在的多計和少計的問題相反,由該標(biāo)記系統(tǒng)收集到的普查數(shù)據(jù)是準(zhǔn)確的,因為對標(biāo)記過的網(wǎng)頁(無論來自高速緩存與否)的每次訪問,將使該標(biāo)記擊發(fā),導(dǎo)致假性請求的發(fā)出和對該標(biāo)記過的網(wǎng)頁的曝光的記錄。
[0062]圖2是圖1的混合在線觀眾測量系統(tǒng)102的示例實現(xiàn)方式的框圖。圖2的示例混合在線觀眾測量系統(tǒng)102獲得輸入數(shù)據(jù),其包括基于小組的在線活動數(shù)據(jù),在線人口的總量和/或子集的估計和/或針對特定網(wǎng)站的流量的普查數(shù)據(jù)測量結(jié)果?;谠撦斎霐?shù)據(jù),圖2的該示例混合在線觀眾測量系統(tǒng)102對反映了針對網(wǎng)站、通道、品牌、父輩和/或任何其它關(guān)注的組織單位的在線觀眾的數(shù)據(jù)進(jìn)行分類和/或輸出。在一些示例中,該混合在線觀眾測量系統(tǒng)102對反映了特定報告周期,星期的某天,和/或一天的時段的在線觀眾的數(shù)據(jù)進(jìn)行分類。
[0063]圖2的示例混合在線觀眾測量系統(tǒng)102從基于普查的數(shù)據(jù)收集器202、基于調(diào)查的數(shù)據(jù)收集器204和小組數(shù)據(jù)收集器206獲取數(shù)據(jù)。該示例混合在線觀眾測量系統(tǒng)102可以經(jīng)由網(wǎng)絡(luò)(例如,圖1的網(wǎng)絡(luò)110),經(jīng)由人工數(shù)據(jù)輸入(例如,調(diào)查響應(yīng)的輸入)和/或使用任何其它接收數(shù)據(jù)的方法獲得數(shù)據(jù)。
[0064]圖2的示例基于普查的數(shù)據(jù)收集器202接收基于普查的流量信息?;谄詹榈臄?shù)據(jù)可以從,例如,由該服務(wù)器監(jiān)測器134產(chǎn)生的服務(wù)器日志、由該后臺程序136收集到的基于標(biāo)記的數(shù)據(jù),和/或普查數(shù)據(jù)的任何其它來源獲得?;谄詹榈牧髁啃畔⒖梢园?從標(biāo)記過的網(wǎng)頁中的標(biāo)記的執(zhí)行引起的對普查數(shù)據(jù)收集器202做出的假性請求而收集到的數(shù)據(jù)、和/或反映針對網(wǎng)頁的請求的基于服務(wù)器日志經(jīng)由服務(wù)器監(jiān)測器134收集到的統(tǒng)計信息、和/或可經(jīng)由服務(wù)監(jiān)測器134收集的其它流量信息。在一些示例中,基于普查的數(shù)據(jù)收集器202實現(xiàn)該示例后臺程序136以收集、解析和/或存儲響應(yīng)以執(zhí)行標(biāo)記指令而從圖1的裝置116、124、128、130、132接收到的數(shù)據(jù)。
[0065]圖2的示例基于調(diào)查的數(shù)據(jù)收集器204接收基于調(diào)查的行為信息,例如,觀眾總數(shù)和/或在線觀眾中的子集的“總體估計”(例如,從圖1的示例總體估計器104)。在圖1和圖2的示例中,該總體估計是從個人訪談獲得的,其可以通過電話進(jìn)行。該訪談提供了互聯(lián)網(wǎng)訪問信息和互聯(lián)網(wǎng)用戶的人口資料,包括針對已測量的位置(諸如工作和家庭)的估計以及針對未測量的位置(諸如工作和家庭外)。調(diào)查數(shù)據(jù)基于應(yīng)答方準(zhǔn)確地回憶起他們活動的能力以及如實匯報的意愿。
[0066]圖2的示例小組數(shù)據(jù)收集器206接收小組成員數(shù)據(jù),其包括表示小組活動的頁面查看數(shù)據(jù)(例如,經(jīng)由諸如計量表這樣的監(jiān)測應(yīng)用118所收集的)。該小組成員數(shù)據(jù)可以包括訪問過的網(wǎng)站(例如,URL)、包括多個URL的會話、反映網(wǎng)站請求和/或會話的發(fā)生時間/日期的時間戳、小組成員的人口統(tǒng)計特征、和/或可以經(jīng)由圖1的在線監(jiān)測應(yīng)用收集到的任何其它信息。所例示的示例過濾器的示例小組數(shù)據(jù)收集器206根據(jù)規(guī)則過濾接收到的小組成員數(shù)據(jù)。附加地或者另選地,該示例小組數(shù)據(jù)收集器206可以根據(jù)人口統(tǒng)計類別、星期中的某天信息、和/或時間段信息將接收到的小組成員數(shù)據(jù)進(jìn)行排序以獲得更精確的數(shù)據(jù)。
[0067]圖2的示例小組數(shù)據(jù)收集器206相對于總體基于該小組成員的確定的表示對小組成員網(wǎng)站請求和/或會話進(jìn)行加權(quán)。例如,比第二小組成員表示該總體中大的部分的第一小組成員的行為將進(jìn)行比第二小組成員的活動大的權(quán)重(例如,乘以較大的系數(shù))。圖2的示例小組數(shù)據(jù)收集器206確定針對個別已測量的位置和針對總體上已測量的位置的估計的活動(例如,通過去除重疊或者重復(fù)的觀眾條目)。個別小組成員可以在多個已測量的位置(例如,家庭和工作)進(jìn)行計數(shù),因此通過去除明顯的重復(fù)觀眾成員來對小組成員在多個位置的存在進(jìn)行計數(shù)。
[0068]圖2的示例混合在線觀眾測量系統(tǒng)102處理基于普查的流量信息以對該數(shù)據(jù)進(jìn)行清理和/或分類。為此,該示例混合在線觀眾測量系統(tǒng)102包括流量過濾器208和站點分類器210。
[0069]很多網(wǎng)站(例如,網(wǎng)絡(luò)服務(wù)器106、108)接收通過非人為和/或間接的人為活動(例如,機器人、網(wǎng)絡(luò)爬蟲網(wǎng)絡(luò)蜘蛛、自動頁面刷新、和/或并非由個人清醒地或者有意地請求網(wǎng)站而產(chǎn)生的其它流量)而產(chǎn)生的流量(例如,頁面查看)。該示例流量過濾器208清理了基于普查的信息(例如,服務(wù)器日志和/或基于標(biāo)記的計數(shù))以避免計數(shù)不相關(guān)的數(shù)據(jù)及/或其它非人為活動。例如,圖2的流量過濾器208將一列已知的用戶代理、已知的IP地址和/或活動持續(xù)時間閾值應(yīng)用于基于普查的信息以識別和去除非人為流量。該列已知的用戶代理和/或已知的IP地址可以從互動廣告局(IAB)/發(fā)行量組織稽核電子部(ABCE)國際蜘蛛和機器人列表處獲得。在一些示例中,該流量過濾器208還應(yīng)用基于活動的過濾器以檢測非人為流量。
[0070]圖2的示例流量過濾器208通過使用請求設(shè)備的IP地址按地理區(qū)域(例如,州、地區(qū)、國家,大陸等)對基于普查的數(shù)據(jù)進(jìn)行分類。因此,如果不關(guān)注特定用途,則可以去除對網(wǎng)站服務(wù)器106、108的國際流量。圖2的示例流量過濾器208還去除自動網(wǎng)頁刷新(例如,網(wǎng)頁代碼,其造成針對同一網(wǎng)頁的更新版本的請求被發(fā)送,通常是以接收到初始網(wǎng)頁之后的特定間隔)。因為該示例監(jiān)測應(yīng)用118識別標(biāo)記,所以該示例小組數(shù)據(jù)收集器206通過識別人為請求的頁面查看可以估計自動刷新的頁面查看活動并且區(qū)分來源于自動刷新的頁面查看。例如,該監(jiān)測應(yīng)用118(例如,計量表)通過跟蹤瀏覽器活動并且確定發(fā)生了對應(yīng)的小組成員動作(例如,按鈕點擊,擊鍵等)以造成網(wǎng)頁刷新和/或是否該網(wǎng)頁源代碼中的執(zhí)行的瀏覽器指令造成該網(wǎng)頁刷新,可以識別網(wǎng)頁刷新(例如,網(wǎng)頁請求),。
[0071]人為頁面查看和自動刷新頁面查看可以被轉(zhuǎn)換為比率或者比值,其中,圖2的示例流量過濾器208將該比率或者比值應(yīng)用于基于普查的流量(例如,頁面查看)以減少或者去除歸因于自動刷新的頁面查看。例如,自動刷新比率可以針對URL模式從基于小組的數(shù)據(jù)按照星期中的某天和一天的時段來確定,作為自動刷新產(chǎn)生的頁面查看次數(shù)與所有網(wǎng)頁查看量之比。然后,該自動刷新比率或者比例被應(yīng)用于所選擇的URL模式(URL頁面查看)的基于普查的頁面訪問(例如,其已清理了其它非人為和/或非地域市場流量)以確定基于普查的URL頁面查看的調(diào)整或者清理數(shù)(調(diào)整后的URL頁面查看)。以下算式示出了示例的計算:調(diào)整后的URL頁面查看=URL頁面查看* (1-自動刷新比率)。
[0072]圖2的示例站點分類器210接收了過濾后的基于普查的流量信息(例如,針對關(guān)注的URL的調(diào)整后的URL頁面查看)并且將該URL(例如,網(wǎng)頁和/或視頻流)劃分類別(例如,體育,零售等)。例如,圖2的站點分類器210應(yīng)用分類字典以協(xié)助依照類別對小組成員的活動進(jìn)行分類和/或建模。該示例站點分類器210按照多種方式進(jìn)行分類,例如,品牌、父輩實體、通道、互聯(lián)網(wǎng)領(lǐng)域、互聯(lián)網(wǎng)子域,和/或以任何其它方式。例如,父輩可以包括多個品牌,其中的每一個可以包括多個通道。
[0073]圖2的示例混合在線觀眾測量系統(tǒng)102還包括虛擬小組產(chǎn)生器212。圖3是圖2的示例虛擬小組產(chǎn)生器212的示例實現(xiàn)方式的框圖。雖然示例小組成員數(shù)據(jù)和示例普查數(shù)據(jù)可以被用來有效地對在已測量的位置(例如,圖1的工作和家庭環(huán)境120,122)的在線觀眾進(jìn)行估計和/或分類,基于普查的流量經(jīng)常指示出不斷增加的流量來源于未測量的位置。該示例虛擬小組產(chǎn)生器212產(chǎn)生虛擬小組以是的能夠比之前可能準(zhǔn)確地估計來自未測量的位置的流量。示例未測量的位置可以包括但不限于,工作環(huán)境中的共享計算機、家庭環(huán)境中的輔助或者次輔助計算機、公共訪問位置的計算機、移動設(shè)備和/或通過基于小組的方法未測量和/或不可測量的其它設(shè)備。
[0074]在圖2的示例中,負(fù)二項分布(NBD)計算器214確定從未測量的位置訪問該網(wǎng)站的數(shù)量。該負(fù)二項分布是在一系列η個獨立伯努利試驗中成功數(shù)量r的離散概率分布(每個伯努利試驗的結(jié)果被限定為成功或者失敗)。在小組成員是否訪問URL的試驗中,該示例NBD計算器214可以認(rèn)為成功是由特定小組成員對該URL的頁面查看。圖2的示例NBD計算器214確定僅從未測量的位置(例如,并非由測量已測量的位置的小組成員數(shù)據(jù)所表示的)訪問網(wǎng)頁的觀眾的特征(例如,規(guī)模和/或人口組成)。為了確定在未測量的位置處的觀眾,圖2的示例NBD計算器214接收針對根據(jù)該小組成員數(shù)據(jù)所確定的每個多人口群體的加權(quán)觀眾特征數(shù)據(jù),針對根據(jù)該小組成員數(shù)據(jù)所確定的每個多人口群體的加權(quán)會話數(shù)據(jù),在由流量過濾器208處理后根據(jù)基于普查的數(shù)據(jù)所確定的每個多人口群體的經(jīng)清理的會話的次數(shù),以及根據(jù)調(diào)查數(shù)據(jù)所確定的觀眾規(guī)模的總體估計。該人口統(tǒng)計群體可以被限定為總體或者人口中的子集。相應(yīng)地,例示的示例的示例NBD計算器214計算與多個人口統(tǒng)計組群對應(yīng)的多個NBD計算。圖2的示例NBD計算器214確定用于NBD處理的變量,并且基于該變量計算人口統(tǒng)計組群的NBD。下面描述用于計算NBD和NBD的輸入變量的示例處理(例如,計算機可讀指令)。
[0075]在確定了僅從未測量的位置處訪問該網(wǎng)站的數(shù)量(例如,從該NBD計算器214)時,該示例虛擬小組產(chǎn)生器產(chǎn)生表示針對未測量的位置的虛擬小組。圖2的示例虛擬小組產(chǎn)生器212通過選擇已測量的位置(如,家庭和工作環(huán)境)中的子集,復(fù)制所選擇的小組成員(以及他們相應(yīng)的在線行為)以形成未測量的位置樣本,來產(chǎn)生該虛擬小組(例如,該未測量位置樣本)。在圖2的示例中,該小組成員的復(fù)制版本被提供單獨的標(biāo)識符以將復(fù)制的小組成員模擬或者表示為實際小組成員。該示例虛擬小組產(chǎn)生器212選擇該小組成員中的子集以具有與未測量的位置的觀眾的估計的人口分布類似的人口構(gòu)成,并且使得復(fù)制的小組成員的活動表示未測量的位置的觀眾的被調(diào)查行為。該示例虛擬小組產(chǎn)生器212可以選擇該復(fù)制的小組成員的所有或部分活動以滿足數(shù)量(volume)目標(biāo)(基于小組成員數(shù)據(jù)和基于普查的數(shù)據(jù)之間的差異計算的對網(wǎng)站的頁面瀏覽量)。
[0076]圖3的示例虛擬小組產(chǎn)生器212包括示例加權(quán)器302、樣本選擇器304和采樣重新加權(quán)器306。該示例虛擬小組產(chǎn)生器212接收得到的虛擬小組的所選擇的樣本大小308 (例如,通過操作輸入的反映期望的小組規(guī)模的值,諸如10,000名成員)、針對一個或者更多個人口統(tǒng)計組群的觀眾目標(biāo)310 (例如,基于普查的觀眾和基于小組的觀眾之間的差異和/或源于未測量的位置的頁面查看的估計的次數(shù))、小組行為數(shù)據(jù)312(例如,在線活動),NBD輸出314 (例如,從圖2的該NBD計算器214的計算),和估計的針對未測量的位置316的總體規(guī)模。
[0077]圖3的所選擇的樣本大小308表示要選擇的(例如,通過樣本選擇器304)用于形成虛擬小組的小組成員數(shù)量。所選擇的樣本大小308可能至少同表示僅從未測量的位置處訪問網(wǎng)頁的觀眾(例如,在諸如家庭或者工作這樣的已測量的位置環(huán)境不活躍于在線的人群)的人口統(tǒng)計信息和/或活動所需的小組成員的數(shù)量一樣多。
[0078]該示例小組成員行為數(shù)據(jù)312(例如,小組成員數(shù)據(jù)中的子集)包括表示針對每個待加權(quán)和/或針對虛擬小組而被考慮的小組成員的活動的數(shù)據(jù)。圖3的示例樣本加權(quán)器302和/或示例樣本重新加權(quán)器306將在小組行為數(shù)據(jù)312中反映的活動與未測量的位置中的活動進(jìn)行比較以確定小組成員的權(quán)重。
[0079]圖3的示例觀眾目標(biāo)310 (例如,預(yù)期的或者估計的觀眾數(shù)量)被計算作為基于普查的觀眾估計(例如,針對基于清理后的基于普查的頁面查看的一個或者更多個網(wǎng)頁的觀眾總數(shù)的估計)和基于小組的觀眾估計(例如,在已測量的位置的觀眾的估計)之間的差異。圖3的觀眾目標(biāo)310是僅在未測量的位置發(fā)生在線活動的觀眾成員的估計或者預(yù)期的數(shù)量?;谛〗M的觀眾估計由圖2的NBD計算器214來計算?;谄詹榈挠^眾估計基于基于普查的網(wǎng)站流量(例如,頁面請求或者觀展的數(shù)量,視頻流的數(shù)量等)以及基于小組的頁面查看量計算(例如,網(wǎng)頁請求或者觀展和小組成員會話)來計算。例如,從清理后的基于普查的數(shù)據(jù)確定的針對URL模式的頁面查看量可以除以每名小組成員(例如,觀眾成員)的平均頁面查看量以確定針對基于普查的數(shù)據(jù)的觀眾成員的估計數(shù)量。在一些示例中,該觀眾目標(biāo)310包括針對全體人口的觀眾總目標(biāo),以及針對與人口統(tǒng)計子組群對應(yīng)的人口的單個子集的觀眾目標(biāo)。
[0080]在例示的示例中,針對未測量的位置316的總體規(guī)模基于總體規(guī)模(例如,通過調(diào)查所確定的在線總體)以及已測量的位置的總觀眾(例如,從小組成員數(shù)據(jù)所確定的所有已測量的位置的觀眾)來確定。在圖3的示例中,針對未測量的位置316的總體規(guī)模是總體規(guī)模和針對已測量的位置的所有觀眾之間的差異。
[0081]圖2的示例基于調(diào)查的數(shù)據(jù)收集器204向虛擬小組產(chǎn)生器212提供從未測量的位置處訪問該網(wǎng)站的人口的估計規(guī)模和人口組成?;谄詹榈臄?shù)據(jù)收集器202提供基于普查的網(wǎng)頁瀏覽信息并且小組數(shù)據(jù)收集器206向虛擬小組產(chǎn)生器212提供基于小組的信息。該小組成員數(shù)據(jù)和該普查數(shù)據(jù)逐個站點地提供關(guān)于從未測量的位置處的頁面查看的指引,諸如,在從已測量的位置處的頁面查看的估計和由基于普查的數(shù)據(jù)收集器202(例如,經(jīng)由服務(wù)器監(jiān)測器134和/或后臺程序136)所測量到的頁面查看之間的頁面查看量的差異性。
[0082]為了創(chuàng)建該虛擬小組(例如,未測量的位置樣本),示例虛擬小組產(chǎn)生器212 (例如,經(jīng)由該樣本加權(quán)器302)向每名小組成員應(yīng)用或者賦予權(quán)重。示例加權(quán)器302產(chǎn)生權(quán)重,該權(quán)重表示每名示例小組成員針對表示在未測量的位置的觀眾的期許性或者適用性。例如,該示例加權(quán)器302基于觀眾目標(biāo)310(其中包括人口統(tǒng)計目標(biāo)(例如,未測量的位置的估計的人口統(tǒng)計))和/或?qū)嶓w目標(biāo)(例如,由NBD計算器214確定的在未測量的位置的估計的獨特的觀眾314,估計的在基于普查的數(shù)據(jù)和小組成員數(shù)據(jù)之間的頁面查看的差值)可以確定該期許性。使用卡爾馬(Calmar)加權(quán),圖2的示例樣本加權(quán)器302基于小組成員的個人在線活動和/或人口統(tǒng)計特征相比于人口統(tǒng)計學(xué)和/或?qū)嶓w目標(biāo),向每名小組成員賦予權(quán)重。當(dāng)卡爾馬加權(quán)收斂時,確定每名小組成員的權(quán)重。該加權(quán)指定該小組成員是多么接近地表示在未測量的位置的典型個人。與從未測量的位置訪問網(wǎng)站的個人的所估計的人口統(tǒng)計資料和/或行為資料類似的小組成員被給予較高的權(quán)重。
[0083]在加權(quán)之后,圖3的示例樣本選擇器304使用隨機選擇來選擇要納入該虛擬小組的多個小組成員。由樣本加權(quán)器302計算出的每名小組成員的權(quán)重被用作選擇(或者納入)概率。具有高的權(quán)重的小組成員將具有較高的可能性被樣本選擇器304選擇。示例虛擬小組產(chǎn)生器212使用例如FastCube方法可以隨機地選擇多名小組成員(例如,固定數(shù)量)。所選擇的小組成員和他們相應(yīng)的人口統(tǒng)計、行為和/或其它數(shù)據(jù)被復(fù)制以創(chuàng)建虛擬小組成員,同時在小組中保留原始小組成員。
[0084]在選擇(例如,產(chǎn)生)該虛擬小組成員后,圖3的示例樣本重新加權(quán)器306相對于該人口統(tǒng)計目標(biāo)和/或觀眾目標(biāo)對所選擇的虛擬小組成員進(jìn)行重新加權(quán)。用于重新加權(quán)的不例目標(biāo)可以與第一加權(quán)期間的相同或者不同于第一加權(quán)的,依賴于對在未測量的位置觀眾和/或行為了解的多少。示例虛擬小組產(chǎn)生器212輸出包括所選擇的小組成員的集合以及表示觀眾和/或行為目標(biāo)的相應(yīng)的權(quán)重的虛擬小組。
[0085]該示例小組成員數(shù)據(jù)(例如,小組成員的行為信息)、基于普查的數(shù)據(jù)和虛擬小組(例如,針對復(fù)制的和/或選擇的針對該虛擬小組的小組成員的小組成員數(shù)據(jù))被提供給活動實現(xiàn)器216。圖2的示例活動履行器216履行(估計起源)已測量的和未測量的小組數(shù)量之間的任何剩余活動以及基于已測量的普查的數(shù)量。為了履行虛擬小組活動,該示例活動履行器216確定活動量以履行(例如,估計,匹配)由基于普查的數(shù)據(jù)收集器202所收集、但是針對每個一天的時段的每個人口統(tǒng)計組群不被小組成員數(shù)據(jù)和虛擬小組計入的活動?;顒拥牟町愋钥梢栽醋杂谝褱y量的環(huán)境中的未測量的活動(例如,位于家庭和/或工作環(huán)境中的裝置上但不被計量的活動)。然后,該示例活動履行器216隨機地和/或概率地復(fù)制小組成員活動的實例(例如,針對小組成員而記錄的頁面查看和/或視頻流的日志、小組成員的在線會話等的集合)以補償活動的差異。
[0086]圖2的示例活性履行器216產(chǎn)生和/或輸出觀眾的報告、觀眾的人口統(tǒng)計數(shù)據(jù)、和/或針對所測量的URL、所測量的類似URL的集合、所測量的品牌、所測量的通道、所測量的父輩實體和/或針對任何其它所測量的實體或者子實體的觀眾的所確定的活動。
[0087]圖2的示例混合在線觀眾測量系統(tǒng)102還包括觀眾分類器218。該示例觀眾分類器218接收針對已測量的位置(例如,從小組數(shù)據(jù)收集器206)和未測量的位置(例如,從虛擬小組產(chǎn)生器212)所確定的觀眾,以及并非由小組(例如,從活動履行器216)所表示的額外的活動。示例觀眾分類器218還接收來自示例基于普查的數(shù)據(jù)收集器202的頁面查看數(shù)據(jù)和/或來自站點分類器210清理過的頁面查看數(shù)據(jù)。圖2的觀眾分類器218基于該小組成員數(shù)據(jù)(例如,針對已測量的位置)對該頁面查看數(shù)據(jù)的第一部分進(jìn)行分類并且基于該虛擬小組(例如,針對未測量的位置)對頁面查看數(shù)據(jù)的第二部分進(jìn)行分類。對該頁面查看數(shù)據(jù)進(jìn)行分類可以包括產(chǎn)生統(tǒng)計數(shù)據(jù)和/或報告以對URL和/或?qū)嶓w、一天的時段、星期中的某天、和/或任何其他分類的組合的觀眾和/或流量進(jìn)行分類。圖2的示例觀眾分類器218對報告期間針對一家或者更多家網(wǎng)站的觀眾進(jìn)行估計。例如,例示的示例的觀眾分類器218估計網(wǎng)站的獨特觀眾成員的數(shù)量和網(wǎng)站觀眾人口統(tǒng)計。
[0088]盡管圖1的實現(xiàn)混合在線觀眾測量系統(tǒng)102的示例方式已在圖2中例示并且圖2的實現(xiàn)虛擬小組產(chǎn)生器212的示例方式已在圖3中例示,但是在圖1-圖3中示出的一個或者更多個元件、流程和/或裝置可以被組合、分割、重新排列、省略、消除和/或以任何其它方式來實現(xiàn)。進(jìn)而,示例混合在線觀眾測量系統(tǒng)102,示例總體估計器104,示例網(wǎng)絡(luò)服務(wù)器106、108,示例監(jiān)測應(yīng)用118,示例服務(wù)器監(jiān)測器134,示例基于普查的數(shù)據(jù)收集器202,示例基于調(diào)查的數(shù)據(jù)收集器204、示例小組數(shù)據(jù)收集器206、示例流量過濾器208、示例站點分類器210、示例虛擬小組產(chǎn)生器212、示例NBD計算器214、示例活動履行器216、示例觀眾分類器218、示例樣本加權(quán)器302、示例樣本選擇器304、示例樣本二次加權(quán)器306和/或,更廣泛地,示例系統(tǒng)100、示例混合在線觀眾測量系統(tǒng)102和/或圖1、圖2和/或圖3的示例虛擬小組產(chǎn)生器212可以通過硬件、軟件、固件和/或硬件、軟件和/或固件的任何組合來實現(xiàn)。因此,例如,任何示例混合在線觀眾測量系統(tǒng)102,示例總體估計器104、示例網(wǎng)絡(luò)服務(wù)器106、108、示例監(jiān)測應(yīng)用118、示例服務(wù)器監(jiān)測器134、示例基于普查的數(shù)據(jù)收集器202、示例基于調(diào)查的數(shù)據(jù)收集器204、示例小組數(shù)據(jù)收集器206,示例流量過濾器208、示例站點分類器21 O、示例虛擬小組產(chǎn)生器212,示例NBD計算器214,示例活動履行器216、示例觀眾分類器218、示例加權(quán)器302、示例樣本選擇器304、示例樣本重新加權(quán)器306和/或,更廣泛地,示例系統(tǒng)100、示例混合在線觀眾測量系統(tǒng)102、和/或示例虛擬小組產(chǎn)生器212可以通過一個或者更多個電路、可編程的處理器、應(yīng)用專用集成電路(ASIC),可編程邏輯設(shè)備(PLD)和/或現(xiàn)場可編程邏輯裝置(FPLD)等來實現(xiàn)。當(dāng)讀取本專利的任何裝置或者系統(tǒng)權(quán)利要求以覆蓋單純軟件和/或固件實現(xiàn)時,示例混合在線觀眾測量系統(tǒng)102、示例總體估計器104、示例網(wǎng)絡(luò)服務(wù)器106、108、示例監(jiān)測應(yīng)用118、示例服務(wù)器監(jiān)測器134、示例基于普查的數(shù)據(jù)收集器202、示例基于調(diào)查的數(shù)據(jù)收集器204、示例小組數(shù)據(jù)收集器206,示例流量過濾器208、示例站點分類器210、示例虛擬小組產(chǎn)生器212、示例NBD計算器214、示例活動履行器216、示例觀眾分類器218、示例加權(quán)器302、示例樣本選擇器304,和/或示例樣本二次加權(quán)器306中至少一個在此被明確地限定以包括有形計算機可讀存儲介質(zhì),例如,存儲器、DVD、CD、藍(lán)光等存儲軟件和/或固件。進(jìn)而仍然,除了或者代替那些由圖1、圖2和/或圖3所示的,圖1、圖2和/或圖3的示例系統(tǒng)100、示例混合在線觀眾測量系統(tǒng)102和/或示例虛擬小組產(chǎn)生器212可以包括一個或者更多個元件、流程和/或設(shè)備,和/或可以包括不止所例示的元件、流程和設(shè)備的任意或者全部之一。
[0089]在圖4-圖13B中示出了用于圖1-圖3的執(zhí)行混合在線觀眾測量系統(tǒng)102的示例機器可讀指令的流程圖表示。在這些示例中,該機器可讀指令包括由處理器執(zhí)行的程序,例如,下文討論的示例處理平臺1800結(jié)合圖18所示的處理器1812。該程序可以嵌入存儲在有形的計算機可讀存儲介質(zhì),例如,⑶-ROM、軟盤、硬盤驅(qū)動器、數(shù)字多功能光盤(DVD)、藍(lán)光光盤、或者與處理器1812相關(guān)聯(lián)的存儲器的軟件上,但是整個程序和/或其中部件可以替換地由不同于處理器1812和/或嵌入在固件或者專用硬件以外的裝置來執(zhí)行。此外,盡管該示例程序參照圖4-圖13B中所示的流程圖進(jìn)行了描述,實現(xiàn)示例混合在線觀眾測量系統(tǒng)102和/或示例虛擬小組產(chǎn)生器212的多種其它方法可以另選地地使用。例如,塊的執(zhí)行的順序可以改變,和/或所描述塊中一部分可以改變,刪除或者組合。
[0090]如上所述,圖4-圖13B的示例流程可以使用存儲在有形的計算機可讀介質(zhì)的編碼指令來實現(xiàn),例如,存儲驅(qū)動器、存儲磁盤、硬盤驅(qū)動器、閃存、只讀存儲器(ROM)、光盤(CD)、數(shù)字式通用光盤(DVD)、藍(lán)光盤、高速緩存、隨機存取存儲器(RAM)和/或其中用于持續(xù)期(例如,用于較長時間段、永久、短暫,用于暫時緩沖,和/或用于信息的高速緩存)內(nèi)信息存儲的任何其它儲存裝置或者儲存盤。如在此所用,術(shù)語有形的計算機可讀存儲介質(zhì)被明確地定義以包括任何類型的計算機可讀存儲設(shè)備和/或存儲盤并且不包括傳播信號。另外地或者可選地,圖4-圖13B的示例流程可以使用存儲在非臨時性計算機可讀介質(zhì)中的編碼指令(例如,計算機可讀指令)來執(zhí)行,例如,硬盤驅(qū)動器、閃速存儲器、只讀存儲器、光盤、數(shù)字式通用光盤、高速緩存、隨機存取存儲器和/或其中用于持續(xù)期(例如,用于較長時間段、永久、短暫,用于暫時緩沖,和/或用于信息的緩存)內(nèi)信息存儲的任何其它儲存裝置或者儲存盤。如在此所用,術(shù)語非臨時性計算機可讀介質(zhì)被明確地限定為包括任何類型的計算機可讀存儲設(shè)備和/或存儲盤,無論存儲的持續(xù)時間并且不包括傳播信號。如在此所用,當(dāng)“至少”一詞被用作權(quán)利要求中的前序部分的過渡詞時,它是開放式的,與開放式的術(shù)語“包括”為相同的方式。
[0091]圖4是表示示例計算機測量指令400,其可以被執(zhí)行以實現(xiàn)圖1和/或圖2的混合在線觀眾測量系統(tǒng)102以測量網(wǎng)站的在線觀眾的流程圖。
[0092]圖4的示例指令400包括獲得(例如,接收,收集)總體估計(例如,經(jīng)由圖2的基于調(diào)查的數(shù)據(jù)收集器204)(塊402)。該示例總體估計包括在線人口的估計(例如,能夠訪問網(wǎng)站的數(shù)量或者在線人口的另一個定義)。該總體估計還可以包括在線人口的調(diào)查行為。
[0093]該示例混合在線觀眾測量系統(tǒng)102 (例如,經(jīng)由基于普查的數(shù)據(jù)收集器202)獲得針對網(wǎng)站的以服務(wù)器為中心或者基于普查的數(shù)據(jù)(塊404)。該基于普查的數(shù)據(jù)可以包括基于標(biāo)記的數(shù)據(jù)和/或由圖1的示例服務(wù)器監(jiān)測器134進(jìn)行的網(wǎng)站流量的測量結(jié)果。該示例混合在線觀眾測量系統(tǒng)102過濾(例如,經(jīng)由該流量過濾器208)基于普查的數(shù)據(jù)以去除不期望的流量(塊406)。不期望的(或者不具有表示性的)流量的示例包括非人為流量,諸如機器人或者蜘蛛,來自非表示性地理位置的流量,和/或自動刷新頁面造成的流量。用于實現(xiàn)塊406的示例計算機可讀指令在下文參照圖5進(jìn)行描述。示例混合在線觀眾測量系統(tǒng)102獲得已測量的位置的小組成員數(shù)據(jù)(例如,圖2的小組數(shù)據(jù)收集器206)(塊408)。示例小組成員數(shù)據(jù)包括個人小組成員的人口統(tǒng)計和在線行為信息。
[0094]該示例混合在線觀眾測量系統(tǒng)102對網(wǎng)站的小組成員數(shù)據(jù)、基于普查的數(shù)據(jù)、和/或基于調(diào)查的數(shù)據(jù)進(jìn)行分類(例如,經(jīng)由圖2的站點分類器210)(塊410)。例如,站點分類器210可以使用分類字典(例如,體育、零售等)對URL、類似的URL的集合,通道、品牌、父輩實體和/或網(wǎng)站的任意其它組織進(jìn)行分類。
[0095]該示例混合在線觀眾測量系統(tǒng)102估計來自未測量的位置的流量和/或觀眾(例如,經(jīng)由圖2的NBD計算器214)(塊412)。示例NBD計算器214基于普查數(shù)據(jù)、小組成員數(shù)據(jù)以及基于調(diào)查的數(shù)據(jù)估計來自未測量的位置的流量和/或觀眾。用于實現(xiàn)塊412的示例計算機可讀指令在下文參照圖6-圖8描述。
[0096]示例混合在線觀眾測量系統(tǒng)102基于對未測量的位置的觀眾的估計產(chǎn)生虛擬小組(例如,經(jīng)由圖2中的虛擬小組產(chǎn)生器212)(塊414)。例如,虛擬小組產(chǎn)生器212可以基于小組成員的人口統(tǒng)計特征和/或在線行為對包含在基于人口統(tǒng)計目標(biāo)、觀眾目標(biāo)和/或活動目標(biāo)的小組成員數(shù)據(jù)中的小組成員加權(quán)。示例虛擬小組產(chǎn)生器212基于針對納入虛擬小組的權(quán)重選擇多個小組成員。用于實現(xiàn)塊414的示例計算機指令在下文參照圖9描述。
[0097]示例混合在線觀眾測量系統(tǒng)102使用所選擇的小組成員對未測量的位置的觀眾進(jìn)行估計(例如,經(jīng)由圖2中的虛擬小組產(chǎn)生器212)(塊416)。例如,虛擬小組產(chǎn)生器212可以對在塊414中選擇的小組成員進(jìn)行重新加權(quán)以表示人口統(tǒng)計目標(biāo)、觀眾目標(biāo)和/或活動目標(biāo)。在虛擬小組中被重新加權(quán)的小組成員的組合可以提供針對未測量的位置的估計的觀眾,包括估計的觀眾的人口統(tǒng)計特征。
[0098]示例混合在線觀眾測量系統(tǒng)102確定未由該小組測量所表示的額外的活動(例如,通過圖2中的活動履行器216)(塊418)。例如,活動履行器216可以確定網(wǎng)站流量的基于普查的測量結(jié)果和網(wǎng)站流量的基于小組(例如,已測量小組和虛擬小組)的估計之間的差異。示例活動履行器216產(chǎn)生和/或基于實際的小組成員活動對額外的觀眾活動進(jìn)行分類以表示該差異?;顒拥牟町惪梢园ㄔ谝褱y量的位置(例如,家庭環(huán)境,工作環(huán)境)進(jìn)行的但未由小組測量的或者表示的活動。用于實現(xiàn)塊418的示例計算機讀指令在下文參照下圖1OA和圖1OB和/或圖1lA和圖1lB描述。
[0099]示例混合在線觀眾測量系統(tǒng)102使用已測量的位置的觀眾、未測量的位置的觀眾以及額外的活動確定網(wǎng)站的在線觀眾進(jìn)行(塊420)。在一些示例中,該混合在線觀眾測量系統(tǒng)102對與特定的標(biāo)準(zhǔn)(諸如,人口統(tǒng)計組群、地理區(qū)域、一天的時段、星期中的某天,和/或其它標(biāo)準(zhǔn))相對應(yīng)的在線觀眾進(jìn)行分類和/或?qū)υ诰€觀眾中的部分進(jìn)行確定。在一些示例中,混合在線觀眾測量系統(tǒng)102基于該虛擬小組所對應(yīng)的數(shù)據(jù)對與未測量的位置相關(guān)聯(lián)的頁面查看數(shù)據(jù)進(jìn)行分類。然后,圖4的示例指令400可以終止和/或迭代以確定額外的在線觀眾。
[0100]圖5是示例計算機可讀指令500的流程圖表示,當(dāng)被執(zhí)行時,其使得處理器從流量數(shù)據(jù)的集合(例如,頁面查看數(shù)據(jù))過濾流量(例如,網(wǎng)頁瀏覽)。圖5的該示例指令500可以由圖2的示例流量過濾器208執(zhí)行以進(jìn)行圖4的塊406。隨后進(jìn)行該示例指令500以獲取針對已測量的網(wǎng)站的基于普查的數(shù)據(jù)(例如,由圖1中網(wǎng)絡(luò)服務(wù)器106、108的服務(wù)器監(jiān)測器134產(chǎn)生的流量日志)。
[0101]示例流量過濾器208獲得表示非人為流量的已知的用戶代理和/或IP地址的列表(塊502)。例如,流量過濾器208可以獲得IAB/ABCe國際蜘蛛和機器人列表。示例流量過濾器208在基于普查的數(shù)據(jù)中選擇URL (塊504)?;谄詹榈臄?shù)據(jù)可具有針對URL的多個條目(例如,網(wǎng)頁瀏覽,視頻流)和/或相同的URL模式所對應(yīng)的URL的一個或者更多個變體。示例流量過濾器208選擇針對所選擇的URL的基于普查的數(shù)據(jù)的條目(塊506)。每個示例輸入包括有關(guān)頁面查看或者視頻流的信息,諸如,請求設(shè)備的IP地址、用于請求該設(shè)備的用戶代理、頁面查看被請求的時間和/或其它信息。
[0102]示例流量過濾器208確定了是否所選擇的條目的IP地址和/或用戶代理與用戶代理和/或IP地址的列表匹配(塊508)。如果不存在匹配,則示例流量過濾器208確定該IP地址是否對應(yīng)于要被排除在線觀眾測量結(jié)果之外的地理區(qū)域(例如,來自另一個國家的流量)(塊510)。例如,該流量過濾器208可以將所選擇的條目的IP地址與IP地址對地理區(qū)域的映射進(jìn)行比較。如果所選擇的條目的IP地址和/或用戶代理對應(yīng)于非人為的IP地址和/或用戶代理的列表(塊508)的如果所選擇的條目的IP地址對應(yīng)于被排除的地理區(qū)域(塊510),則示例流量過濾器208從基于普查的數(shù)據(jù)中去除所選擇的條目(塊512)。在一些示例中,流量過濾器208存檔所選擇的條目或者以其它方式標(biāo)記所選擇的條目以不被用于確定在線觀眾。
[0103]在去除所選擇的條目(塊512)后,或者如果所選擇的條目不匹配IP地址和/或用戶代理(塊508)的列表并且不對應(yīng)于被排除的地理區(qū)域(塊510),則示例流量過濾器確定是否存在所選擇的URL(或者URL模式)的額外的條目(塊514)。如果存在額外的條目(塊514),則控制返回到塊506以選擇基于普查的數(shù)據(jù)中的另一個條目。當(dāng)不存在針對所選擇的URL的額外的條目(例如,非人為和/或排除的地理區(qū)域的條目已被去除)(塊514),則示例流量過濾器208確定針對URL (或URL模式)是否存在可用的自動刷新率(塊516)。例如,針對URL的自動刷新率可以根據(jù)基于小組的對URL的自動刷新的平均數(shù)的觀察進(jìn)行確定。
[0104]如果存在可用的自動刷新率(塊516),則示例流量過濾器208基于該自動刷新率去除所選擇的URL的多個條目(塊518)。例如,流量過濾器208可以依照每個人的請求去除多個與自動刷新的平均次數(shù)成正比的URL的條目。在去除條目(塊518)之后,或者如果不存在針對URL可用的自動刷新率可用數(shù)據(jù)(塊516),則示例流量過濾器208確定基于普查的數(shù)據(jù)中是否存在額外的URL (塊520)。如果存在額外的URL (或者URL模式)(塊520),則控制返回到塊504以從基于普查的數(shù)據(jù)中選擇另一個URL。當(dāng)不存在更多的URL時(塊520),圖5的示例指令500結(jié)束并且控制返回到圖4的塊408。
[0105]圖6是示例計算機可讀指令600的流程圖表示,當(dāng)被執(zhí)行時,其使處理器估計來自未測量的位置對網(wǎng)站訪問。圖6的示例指令600可以由圖2的示例NBD計算器214來進(jìn)行以實現(xiàn)圖4的塊412。在一些示例中,該指令600使NBD計算器214以對僅具有從未測量的位置訪問的觀眾進(jìn)行估計。
[0106]圖2的示例NBD計算器214計算NBD參數(shù)(塊602)。例如,NBD計算器214可以確定是否存在柏松條件和/或計算用于針對每個待測量的人口統(tǒng)計組群的NBD處理的變量。用于計算NBD參數(shù)的示例指令在下文參照圖7描述。使用計算出的參數(shù),示例NBD計算器214計算人口統(tǒng)計組群的NBD(塊604)。用于計算NBD的示例指令在下文參照圖8描述。
[0107]圖6的示例指令600可以然后結(jié)束并且將觀眾總數(shù)估計,其中包括來自未測量的位置的觀眾返回到虛擬小組產(chǎn)生器212和/或圖2的活動履行器216??刂品祷氐綀D4的塊 414。
[0108]圖7是示例計算機可讀指令700的流程圖表示,當(dāng)被執(zhí)行時,其使處理器計算負(fù)二項分布參數(shù)。圖7的該實例指令700可以由圖2的示例NBD計算器214進(jìn)行以實現(xiàn)圖6的框 602。
[0109]示例NBD計算器214獲得用于確定NBD參數(shù)(塊702)的輸入。對NBD計算器214的示例輸入包括針對人口統(tǒng)計組群(Ui)的加權(quán)的小組觀眾、針對人口統(tǒng)計組群(Vi)的加權(quán)的小組會話、針對人口統(tǒng)計組群(Xi)的清理過的服務(wù)器會話以及針對人口統(tǒng)計組群(Yi)的估計的總體。
[0110]針對人口統(tǒng)計組群Ui的加權(quán)的小組觀眾是在針對關(guān)注URL具有至少一次頁面查看的所選擇的人口統(tǒng)計組群中所估計的人的數(shù)量,其被縮放來表示所測量的位置的總體。確定針對人口統(tǒng)計組群的加權(quán)的觀眾的示例在下文中描述。針對人口統(tǒng)計組群Vi的加權(quán)小組會話是該小組成員的會話的估計的數(shù)量,其被縮放來表示所測量的位置的總體。確定針對人口統(tǒng)計組群Xi的清理過的服務(wù)器會話在下文參照圖13A和圖13B描述。針對人口統(tǒng)計組群Yi的估計的總體可以從調(diào)查數(shù)據(jù)進(jìn)行確定并且表示關(guān)注的總?cè)丝谥性谌丝诮y(tǒng)計組群中的數(shù)量。
[0111]基于輸入,示例NBD計算器214能夠計算出額外的信息,其包括針對人口統(tǒng)計組群的總體中每個人的小組會話(例如,Gr = 100*Vi/Yi),針對人口統(tǒng)計組群的總體中每個人的調(diào)整后的小組會話(例如,Gp = 100*Xi/Yi),以及具有零頁面查看的人員的權(quán)重比例(例如,fr(0) = 1-Ui/Yi)。
[0112]示例NBD計算器214然后修訂變量(需要時),從表示針對人口統(tǒng)計組群的100%覆蓋(例如,在報告期間曾訪問該網(wǎng)站的人口統(tǒng)計組群總體中的所有成員)和/或針對人口討論組群的0%覆蓋(例如,人口統(tǒng)計組群總體中的成員都不曾訪問該網(wǎng)站)(塊704)。例如,如果fr(0) = 1,那么fr(0)被改變?yōu)槁孕∮贗的數(shù)字(例如,0.999)。相反地,如果fr(0) =0,那么fr(0)被改變?yōu)槁源笥贠的數(shù)字(例如,0.001)。
[0113]示例NBD計算器214還確定針對在NBD參數(shù)的計算中使用的常數(shù)“c”的值(塊706)。在圖7的示例中,該常數(shù)“c”被計算為c = Gr/ (100*ln (fr (O)))。示例NBD計算器214確定常數(shù)“c”的值是否大于或者等于-1,以確定泊松條件是否存在(塊708)。泊松條件表示人口統(tǒng)計組群的成員具有小于訪問網(wǎng)站或者風(fēng)格的網(wǎng)站的閾值可能性的情況。
[0114]如果該泊松條件不存在(例如,常量“c”小于-1)(塊708),則示例NBD計算器214估計NBD參數(shù)“A”。為了估計參數(shù)“A”,示例NBD計算器214設(shè)置A = _2*(l+c)(塊710)。示例NBD計算器214設(shè)置等于“A”的占位符變量“B” (塊712)。NBD計算器214基于“A”的先前值并且基于常量“C”計算出A的更新值(例如,A = C* (A- (1+A) *LN(1+A)) / (1+A+C))(塊 714)。
[0115]示例NBD計算器214確定是否“A”的值已經(jīng)收斂(例如,確定是否A的更新值是在B(或者A的先前值)的閾值量以內(nèi))(塊716)。如果“A”的值尚未收斂(塊716),則控制返回到塊712以進(jìn)行迭代計算。當(dāng)“A”值已經(jīng)收斂時(塊716),示例NBD計算器214設(shè)置第二 NBD參數(shù)“k” (塊718)。在圖7的示例中,NBD計算器214設(shè)置NBD參數(shù)k = Gr/(100*A)。
[0116]示例NBD計算器214通過計算參數(shù)A’ = A*(Xi/Vi)(塊720)和計算調(diào)整后的NBD參數(shù)a = I/A,(塊722)來縮放NBD參數(shù)A以與清理過的頁面查看和/或視頻流一致。
[0117]如果存在泊松條件(塊708),則NBD被視為具有一個參數(shù)(λ )的泊松分布。因而,該示例NBD計算器214不計算NBD參數(shù)α和k,而是,計算泊松參數(shù)λ = Gr/100 (塊724)。當(dāng)計算NBD參數(shù)α和k (塊722)或者計算泊松參數(shù)時(塊724),圖7中的示例指令700結(jié)束并且控制返回到圖6的塊604。
[0118]圖8是示例計算機可讀指令800的流程圖表示,當(dāng)被執(zhí)行時,其使處理器計算負(fù)二項分布。圖8的示例指令800可以由圖2的示例NBD計算器214進(jìn)行,以實現(xiàn)圖6的框604。圖8的示例NBD計算人口統(tǒng)計。相應(yīng)地,示例NBD計算器214可以在報告時段針對不同的人口統(tǒng)計組群迭代指令800。
[0119]圖2中的示例NBD計算器214確定泊松條件是否存在(塊802)。例如,NBD計算器214可以確定針對NBD計算,計算哪些參數(shù)(例如,如果泊松條件存在,則λ ;如果泊松條件不存在,則α和k)。如果泊松條件不存在(塊802),則示例NBD計算器214計算針對人口統(tǒng)計組群(塊804)的縮放覆蓋率。例如,圖2的NBD計算器214計算縮放范圍=100*(l-(a/(a+t))k),其中時間變量“t”是單位時間,諸如,報告時段(例如,t天)。該時間變量“t”可以被設(shè)置為I以縮放獨特觀眾成員以與例示的示例中的清理過的頁面查看和/或視頻流匹配(例如,每天的頁面查看,每日報告等)。
[0120]圖2的示例NBD計算器214計算零曝光(例如,頁面查看)的概率(塊806)。例如,零頁面查看的概率,fp(o),可以根據(jù)fp(0) = (a/(a+t))k確定,其中時間變量“t”被設(shè)置為I以縮放獨特觀眾成員以與清理過的頁面查看和/或視頻流匹配。圖2的示例NBD計算器214計算η次頁面查看的概率,其中η > I (塊808)。例如,η次頁面查看的概率fp (η)可以根據(jù) fp(n) = ((k+n-l)/n)*((t/(a+t))*fp(n-l)確定,其中時間變量“t”被設(shè)置為I以縮放獨特觀眾成員以與清理過的頁面查看和/或視頻流匹配。因而,多次頁面查看的概率fp(n)是基于較低次數(shù)的頁面查看(fp(n-l), fp(n-x))的概率。
[0121]圖2的示例NBD計算器214計算出頁面查看的平均次數(shù)(或者平均頻率)AveF (塊810)。頁面查看的平均次數(shù)可以由AveF = kt/a確定,其中時間變量“t”被設(shè)置為1,以縮放獨特觀眾成員以與清理過的頁面查看和/或視頻流匹配。
[0122]示例NBD計算器214計算針對人口統(tǒng)計組總體的每個人的小組會話的數(shù)量,表示達(dá)時間“t”的總評價點(GRP(t))(塊812)。每個人小組的會話次數(shù)可以由GRP(t) = t*Gr確定,其中時間變量“t”被設(shè)置為I以縮放獨特觀眾以與清理過的頁面查看和/或視頻流匹配。
[0123]如果泊松條件存在(塊802),則示例NBD計算器214確定時間t的頻率分布fp(i),其中“i”是頁面查看的次數(shù)(塊814)。例如,該示例NBD計算器214可以根據(jù)fp (i)=(λ t)1*e_At/i !(其中,!表示階乘運算子)來確定達(dá)時間t的頻率分布fp(i)(例如,頁面查看量次數(shù)的分布)。
[0124]圖2的示例NBD計算器214確定t天(塊816)的計劃覆蓋率(按百分率表示)(塊816)??s放的覆蓋率可以根據(jù)覆蓋率=100*(l-e_At)進(jìn)行確定。圖2的示例NBD計算器214確定每個人的小組會話的次數(shù)(Gp (t))(塊818)。每個人的小組會話的次數(shù)(Gp (t))可以根據(jù)Gp (t) = t*Gr確定。
[0125]在針對泊松條件(塊814-818)或者非泊松條件(塊804-812)進(jìn)行NBD之后,該不例指令800結(jié)束并且控制返回到圖4的塊414。該不例指令800可以返回根據(jù)NBD確定的計算結(jié)果,諸如,輸入變量(例如,X1、V1、Y1、Ui)、針對人口統(tǒng)計組群的縮放的覆蓋率、針對人口統(tǒng)計組群的η > O的頁面查看的概率、針對人口統(tǒng)計組群的頁面查看的平均次數(shù)、針對人口統(tǒng)計組群的每個人的小組會話和/或人口統(tǒng)計組群的一個或者更多個時間周期的頻率分布。
[0126]圖9是示例計算機可讀指令900的流程圖表示,當(dāng)被執(zhí)行時,其使處理器選擇小組成員以表示未測量的位置的觀眾。該示例指令900可以由圖2的示例虛擬小組產(chǎn)生器212來執(zhí)行以實現(xiàn)圖4的塊414。
[0127]圖2的示例虛擬小組產(chǎn)生器212獲得針對未測量的位置所對應(yīng)的觀眾的人口統(tǒng)計目標(biāo)(塊902)。該人口統(tǒng)計目標(biāo)可以從基于調(diào)查的數(shù)據(jù)收集器204處收集到并且提供未測量的位置的預(yù)計的人口統(tǒng)計。示例樣本加權(quán)器302獲得觀眾目標(biāo)和數(shù)量目標(biāo)(塊904)。該示例觀眾目標(biāo)是針對已測量的位置(例如,家庭和工作環(huán)境)所報告的獨特觀眾與由NBD計算器214所確定的估計的獨特觀眾(例如,家庭、工作和未測量的環(huán)境或者位置)之間的差異。該示例數(shù)量目標(biāo)是頁面查看量的報告數(shù)量(例如,從基于普查數(shù)據(jù)收集器202處接收到的)和/或視頻流和/或頁面查看和/或視頻流的經(jīng)平滑的數(shù)量,以及扣除自未測量的位置的流量。圖2的虛擬小組產(chǎn)生器212假定數(shù)量度量(諸如頁面查看和視頻流)符合帕累托(Pareto)分布。用于產(chǎn)生該經(jīng)光滑的數(shù)量的示例指令在下文參照圖12描述。給定了具體實體的觀眾和數(shù)量目標(biāo),可以通過計算機計算的帕累托分布的所選擇的百分比來產(chǎn)生用于樣本選擇的數(shù)量目標(biāo)。在一些示例中,在計算該百分比之前,該數(shù)量度量可被分類為有限的等級。
[0128]該示例樣品加權(quán)器302從針對已測量的位置的小組成員的集合選擇小組成員(塊906)。該成組小組成員可以從示例小組數(shù)據(jù)收集器206處獲得。示例樣本加權(quán)器302基于所選擇的小組成員的人口統(tǒng)計信息和/或所測量的活動與未測量的位置的人口的目標(biāo)人口統(tǒng)計學(xué)信息和/或目標(biāo)行為的一致性對所選擇的小組成員賦予權(quán)重(塊908)。該示例樣本加權(quán)器302確定是否存在待加權(quán)的額外的小組成員(塊910)。如果存在額外的小組成員(塊906),則控制返回到塊906以選擇另一個小組成員。
[0129]當(dāng)不存在額外的待加權(quán)的小組成員(塊910)時,該示例樣本選擇器304將該小組成員權(quán)重轉(zhuǎn)化為選擇概率(塊912)。例如,較高的小組成員權(quán)重得到相應(yīng)的小組成員的較高的選擇概率?;谠撨x擇概率,示例樣本選擇器304選擇數(shù)個小組成員(塊914)。在一些示例中,該示例選擇器304使用該選擇概率隨機地選擇小組成員以確定隨機地選擇任何給定的小組成員的可能性。所選擇的小組成員的數(shù)量可以基于用于表示未測量的位置觀眾的小組成員的數(shù)量預(yù)先確定(例如,圖3的所選擇的樣本規(guī)模308)和/或可以動態(tài)地確定。
[0130]示例重新加權(quán)器306對所選擇的小組成員(塊916)重新加權(quán)。該重新加權(quán)可以類似于或者相同于在塊908內(nèi)進(jìn)行的加權(quán)和/或可以基于類似的或者相同的系數(shù)。該重新加權(quán)使該選擇的小組成員較緊密地表示未測量的位置觀眾的人口統(tǒng)計、觀眾和/或數(shù)量目標(biāo)。然后,該示例指令900可以結(jié)束并且控制返回到圖4的塊416。
[0131]圖1OA和圖1OB示出了示例計算機可讀指令1000的流程圖表示,當(dāng)被執(zhí)行時,其使用基于概率的方法使處理器實現(xiàn)額外的活動。該示例指令1000可以被執(zhí)行以實現(xiàn)圖2的示例活動履行器216以進(jìn)行圖4的塊408。
[0132]圖2的示例活動履行器216將基于小組數(shù)量(例如,頁面查看、視頻流)與基于普查的數(shù)量進(jìn)行比較以確定需要多少活動以填補基于普查的數(shù)據(jù)和基于小組的數(shù)據(jù)之間的差距(塊1002)。示例基于小組的數(shù)量是基于來自已測量的位置和未測量的位置的小組活動(例如,實際小組成員數(shù)據(jù)和虛擬小組成員數(shù)據(jù))。示例活動履行器216從URL模式的列表中選擇URL模式(例如,從URL的基于普查的列表和/或由服務(wù)器106、108所請求和/或提供的URL模式)(塊1004)。在一些示例中,圖1和/或圖2的活動履行器216和/或服務(wù)器監(jiān)測器134將URL的實例聚集到URL模式中。
[0133]該示例活動履行器216選擇一天的時段和人口統(tǒng)計組群(塊1006)的組合。示例一天的時段類別是在下表I中例示。示例人口統(tǒng)計組群(例如,性別/年齡類別)在下表2中例示。人口統(tǒng)計組群可以包括額外的和/或另選的區(qū)別。圖2的示例活動履行器216選擇示例一天的時段類別中的一個和示例人口統(tǒng)計組群中的一個。
[0134]
【權(quán)利要求】
1.一種對觀眾數(shù)據(jù)分類的方法,該方法包括以下步驟: 獲得與在所測量的位置訪問網(wǎng)頁的多名小組成員相對應(yīng)的小組成員數(shù)據(jù); 根據(jù)所述小組成員的人口統(tǒng)計信息對所述小組成員數(shù)據(jù)進(jìn)行分類; 基于對在未測量的位置的網(wǎng)頁訪問的估計產(chǎn)生虛擬小組;以及 基于與所述虛擬小組相對應(yīng)的數(shù)據(jù)對與所述未測量的位置相關(guān)聯(lián)的頁面查看數(shù)據(jù)進(jìn)行分類。
2.根據(jù)權(quán)利要求1中所限定的方法,其中,所述虛擬小組包括所述多名小組成員的子集。
3.根據(jù)權(quán)利要求1中所限定的方法,其中,產(chǎn)生所述虛擬小組的步驟包括估計總觀眾。
4.根據(jù)權(quán)利要求1中所限定的方法,其中,產(chǎn)生所述虛擬小組的步驟基于頁面查看的基于普查的計數(shù)、所述小組成員數(shù)據(jù)和估計的總體。
5.根據(jù)權(quán)利要求4中所限定的方法,其中,產(chǎn)生所述虛擬小組的步驟包括使用負(fù)二項分布對在未測量的位置的觀眾進(jìn)行估計。
6.根據(jù)權(quán)利要求1中所限定的方法,其中,產(chǎn)生所述虛擬小組的步驟是基于人口統(tǒng)計目標(biāo)或者活動目標(biāo)中的至少一方。
7.根據(jù)權(quán)利要求1中所限定的方法,其中,對所述小組成員數(shù)據(jù)進(jìn)行分類的步驟包括基于所述小組成員數(shù)據(jù)對在線觀眾的第一部分進(jìn)行估計。
8.根據(jù)權(quán)利要求7中所限定的方法,其中,對所述頁面查看數(shù)據(jù)進(jìn)行分類的步驟包括對所述在線觀眾的第二部分進(jìn)行估計,所述第一部分和所述第二部分包括獨特觀眾成員的數(shù)量。
9.根據(jù)權(quán)利要求1中所限定的方法,所述方法還包括以下步驟: 確定頁面查看的基于普查的計數(shù)和與所述頁面查看數(shù)據(jù)的第一部分和第二部分相關(guān)聯(lián)的頁面查看的數(shù)量之間的差異;以及 基于所述差異對未由所述多名小組成員和所述虛擬小組表示的額外的觀眾活動進(jìn)行估計。
10.一種產(chǎn)生虛擬小組的方法,該方法包括以下步驟: 基于第一估計特征對多名小組成員賦予權(quán)重; 基于所述權(quán)重來選擇所述小組成員的子集; 基于第二估計特征對所選擇的小組成員重新加權(quán);以及 產(chǎn)生虛擬小組,該虛擬小組包括作為虛擬小組成員的所選擇的小組成員,其中,基于所述重新加權(quán)對從所選擇的小組成員處收集到的針對所述虛擬小組的數(shù)據(jù)賦予權(quán)重。
11.根據(jù)權(quán)利要求10中所限定的方法,所述方法還包括以下步驟:對觀眾進(jìn)行估計,所述小組成員的第一估計特征基于所估計的觀眾。
12.根據(jù)權(quán)利要求11中所限定的方法,其中,所述第一估計特征是基于所估計的觀眾和所測量的觀眾之間的差異。
13.根據(jù)權(quán)利要求10中所限定的方法,其中,選擇所述小組成員的集合的步驟包括使用分配給對應(yīng)的小組成員的權(quán)重作為針對所述對應(yīng)的小組成員的選擇概率,來隨機地選擇所述小組成員。
14.根據(jù)權(quán)利要求10中所限定的方法,所述方法還包括以下步驟:基于人口統(tǒng)計目標(biāo)或者活動目標(biāo)中至少一方來計算所述第一估計特征。
15.根據(jù)權(quán)利要求14中所限定的方法,其中,計算所述第一估計特征的步驟包括將所述小組成員的在線活動與基于普查的網(wǎng)頁查看數(shù)據(jù)進(jìn)行比較。
16.一種裝置,該裝置包括: 小組數(shù)據(jù)收集器,其用于收集與在所測量的位置訪問網(wǎng)頁的多名小組成員相對應(yīng)的小組成員數(shù)據(jù); 虛擬小組產(chǎn)生器,其用于基于對在未測量的位置的網(wǎng)頁訪問的估計產(chǎn)生虛擬小組;以及 觀眾分類器,其用于根據(jù)所述小組成員的人口統(tǒng)計信息對所述小組成員數(shù)據(jù)進(jìn)行分類,并且基于與該虛擬小組相對應(yīng)的數(shù)據(jù)對與所述未測量的位置相關(guān)聯(lián)的頁面查看數(shù)據(jù)進(jìn)行分類。
17.根據(jù)權(quán)利要求16中所限定的裝置,所述裝置還包括負(fù)二項分布計算器,其用于基于所述多名小組成員和總體估計來估計在未測量的位置的觀眾。
18.根據(jù)權(quán)利要求16中所限定的裝置,所述裝置還包括:活動履行器,其用于基于所述多名小組成員來確定在線活動,所述觀眾分類器用于基于所述在線活動對所述頁面查看數(shù)據(jù)的第三部分進(jìn)行分類。
19.根據(jù)權(quán)利要求16中所限定的裝置,所述裝置還包括:基于普查的數(shù)據(jù)收集器,其用于接收表示來自已測量的和未測量的位置的網(wǎng)頁的頁面查看的數(shù)量的頁面查看數(shù)據(jù)。
20.根據(jù)權(quán)利要求16中所限定的裝置,所述裝置還包括:基于調(diào)查的數(shù)據(jù)收集器,其用于收集總體估計,所述虛擬小組產(chǎn)生器用于基于所述總體估計產(chǎn)生所述虛擬小組。
21.一種裝置,所述裝置包括: 樣本加權(quán)器,其用于基于第一估計特征對多名小組成員賦予權(quán)重; 樣本選擇器,用于基于所述權(quán)重選擇所述小組成員的子集;以及 樣本重新加權(quán)器,用于基于第二估計特征對所選擇的小組成員重新加權(quán),并且用于產(chǎn)生虛擬小組,所述虛擬小組包括作為虛擬小組成員的所選擇的小組成員,其中,基于所述重新加權(quán),對從所選擇的小組成員處收集到的針對所述虛擬小組的數(shù)據(jù)賦予權(quán)重。
22.根據(jù)權(quán)利要求21中所限定的裝置,其中,所述樣本加權(quán)器: 獲得估計的觀眾;以及 基于所述估計的觀眾計算所述小組成員的第一估計特征。
23.根據(jù)權(quán)利要求22中所限定的裝置,其中,所述樣本加權(quán)器基于所估計的觀眾和所測量的觀眾之間的差異計算所述第一估計特征。
24.根據(jù)權(quán)利要求21中所限定的裝置,其中,所述樣本選擇器通過以下方式選擇所述子集中的小組成員:使用賦予對應(yīng)的小組成員的權(quán)重作為針對所述對應(yīng)的小組成員的選擇概率,來隨機地選擇所述小組成員。
25.根據(jù)權(quán)利要求21中所限定的裝置,其中,所述樣本加權(quán)器基于人口統(tǒng)計目標(biāo)或者活動目標(biāo)中至少一方來計算所述第一估計特征。
26.根據(jù)權(quán)利要求25中所限定的裝置,其中,所述樣本加權(quán)器通過將所述小組成員的在線活動與所測量的頁面查看數(shù)據(jù)進(jìn)行比較來計算所述第一估計特征。
27.一種有形的計算機可讀存儲介質(zhì),其包括機器可讀指令,在所述機器可讀指令被執(zhí)行時使處理器至少: 獲得與在所測量的位置訪問網(wǎng)頁的多名小組成員相對應(yīng)的小組成員數(shù)據(jù); 根據(jù)所述小組成員的人口統(tǒng)計信息對所述小組成員數(shù)據(jù)進(jìn)行分類; 基于與在未測量的位置的網(wǎng)頁訪問的估計產(chǎn)生虛擬小組;以及基于與所述虛擬小組相對應(yīng)的數(shù)據(jù)對與所述未測量的位置相關(guān)聯(lián)的頁面查看數(shù)據(jù)進(jìn)行分類。
28.根據(jù)權(quán)利要求27中所限定的存儲介質(zhì),其中,所述虛擬小組包括所述多名小組成員的子集。
29.根據(jù)權(quán)利要求27中所限定的存儲介質(zhì),其中,所述指令使所述處理器通過對總觀眾進(jìn)行估計來產(chǎn)生所述虛擬小組。
30.根據(jù)權(quán)利要求27中所限定的存儲介質(zhì),其中,所述指令使所述處理器基于頁面查看的基于普查的計數(shù)、所述小組成員數(shù)據(jù),和估計的總體產(chǎn)生所述虛擬小組。
31.根據(jù)權(quán)利要求27中所限定的存儲介質(zhì),其中,所述指令使所述處理器通過使用負(fù)二項分布對在未測量的位置的觀眾進(jìn)行估計來產(chǎn)生所述虛擬小組。
32.根據(jù)權(quán)利要求27中所限定的存儲介質(zhì),其中,所述指令使所述處理器基于人口統(tǒng)計目標(biāo)或者活動目標(biāo)中至少一方來產(chǎn)生所述虛擬小組。
33.根據(jù)權(quán)利要求27中所限定的存儲介質(zhì),其中,所述指令使所述處理器通過基于所述小組成員數(shù)據(jù)對在線觀眾的第一部分進(jìn)行估計來對所述小組成員數(shù)據(jù)進(jìn)行分類。
34.根據(jù)權(quán)利要求33中所限定的存儲介質(zhì),其中,所述指令使所述處理器通過對在線觀眾的第二部分進(jìn)行估計來對所述頁面查看數(shù)據(jù)進(jìn)行分類,所述第一部分和所述第二部分包括獨特觀眾成員的數(shù)量。
35.根據(jù)權(quán)利要求27中所限定的存儲介質(zhì),其中,所述指令還使所述處理器: 確定頁面查看的基于普查的計數(shù)和與所述頁面查看數(shù)據(jù)的第一部分和第二部分相關(guān)聯(lián)的頁面查看的數(shù)量之間的差異;以及 基于所述差異對未由所述多名小組成員和所述虛擬小組表示的額外的觀眾活動進(jìn)行估計。
36.一種計算機可讀存儲介質(zhì),其包括機器可讀指令,在所述機器可讀指令被執(zhí)行時使處理器: 基于第一估計特征對多名小組成員賦予權(quán)重; 基于所述權(quán)重來選擇所述小組成員的子集; 基于第二估計特征對所選擇的小組成員重新加權(quán);以及 產(chǎn)生虛擬小組,該虛擬小組包括作為虛擬小組成員的所選擇的小組成員,其中,從所選擇的小組成員處收集到的針對所述虛擬小組的數(shù)據(jù)將基于所述重新加權(quán)被賦予權(quán)重。
37.根據(jù)權(quán)利要求36中所限定的計算機可讀存儲介質(zhì),其中,所述指令還使所述處理器估計觀眾,所述小組成員的第一估計特征基于所估計的觀眾。
38.根據(jù)權(quán)利要求37中所限定的計算機可讀存儲介質(zhì),其中,所述第一估計特征是基于所估計的觀眾和所測量的觀眾之間的差異。
39.根據(jù)權(quán)利要求36中所限定的計算機可讀存儲介質(zhì),其中,所述指令還使所述處理器通過以下方式選擇所述小組成員的子集:使用賦予對應(yīng)的小組成員的權(quán)重作為針對所述對應(yīng)的小組成員的選擇概率,來隨機地選擇所述小組成員。
40.根據(jù)權(quán)利要求36中所限定的計算機可讀存儲介質(zhì),其中,所述指令還使所述處理器基于人口統(tǒng)計目標(biāo)或者活動目標(biāo)中至少一方來計算所述第一估計特征。
41.根據(jù)權(quán)利要求40中所限定的計算機可讀存儲介質(zhì),其中,所述指令還使所述處理器通過將該小組成員的在線活動與基于普查的網(wǎng)頁查看數(shù)據(jù)進(jìn)行比較來計算所述第一估計特征。
【文檔編號】G06F19/00GK104205158SQ201380017096
【公開日】2014年12月10日 申請日期:2013年1月25日 優(yōu)先權(quán)日:2012年1月26日
【發(fā)明者】J·R·奧利弗, H·F·斯塔克豪斯, P·C·道, C·唐, M·哈 申請人:尼爾森(美國)有限公司