專利名稱:搜索引擎裝置及其方法
技術(shù)領(lǐng)域:
本公開涉及一種搜索引擎裝置及其方法。
背景技術(shù):
信息保護這個問題已經(jīng)越來越受到信息原創(chuàng)者的重視,國內(nèi)的各個新聞門戶網(wǎng)站 已經(jīng)遇到了新的門檻。隨著各個新聞媒體自己網(wǎng)站的出臺和知名度的提高,盡管與各個門 戶網(wǎng)站的合作還存在,但是已經(jīng)有了這樣的趨勢,那就是他們并不愿意給各個門戶網(wǎng)站使 用自己的獨家新聞,尤其是重大的深度的新聞報道。與此同時,網(wǎng)絡(luò)抄襲、非授權(quán)轉(zhuǎn)載等又是一個常見的問題,這侵害了很多信息原創(chuàng) 者的版權(quán)利益。當前搜索引擎的廣告投放體系,只讓搜索引擎公司和轉(zhuǎn)載/抄襲別人信息 的網(wǎng)站獲得利益,而沒有保障信息原創(chuàng)者的利益。
發(fā)明內(nèi)容
根據(jù)本公開的一個方面,提供了一種用于互聯(lián)網(wǎng)的搜索引擎裝置,包括認證單 元,接收用戶的用戶數(shù)據(jù),在所述用戶數(shù)據(jù)與互聯(lián)網(wǎng)上的其它數(shù)據(jù)不同的情況下,將所述用 戶數(shù)據(jù)認證為原創(chuàng)數(shù)據(jù),并創(chuàng)建或者更新所述用戶的賬戶信息;以及檢測單元,檢測所述原 創(chuàng)數(shù)據(jù)在互聯(lián)網(wǎng)上和/或該搜索引擎裝置的搜索結(jié)果頁面上出現(xiàn)的情況,并根據(jù)所述檢測 的結(jié)果更新所述用戶的賬戶信息或者創(chuàng)建報告。根據(jù)本公開的另一個方面,提供了一種用于互聯(lián)網(wǎng)的搜索引擎的方法,包括步驟 接收用戶的用戶數(shù)據(jù),在與互聯(lián)網(wǎng)上和/或該搜索引擎的數(shù)據(jù)庫中的其它數(shù)據(jù)不同的情況 下,將所述用戶數(shù)據(jù)認證為原創(chuàng)數(shù)據(jù),并創(chuàng)建或者更新所述用戶的賬戶信息;以及檢測所述 原創(chuàng)數(shù)據(jù)在互聯(lián)網(wǎng)上和/或該搜索引擎的搜索結(jié)果頁面上出現(xiàn)的情況,并根據(jù)所述檢測的 結(jié)果更新所述用戶的賬戶信息或者創(chuàng)建報告。
從下面結(jié)合附圖對本公開的實施例的詳細描述,本公開的這些和/或其它方面和 優(yōu)點將變得更加清楚并更容易理解,其中,圖1是具有根據(jù)本公開一個實施例的搜索引擎裝置的設(shè)備結(jié)構(gòu)方框圖;圖2是根據(jù)本公開的另一個實施例的搜索引擎裝置的更詳細的方框圖;圖3是根據(jù)本公開一個實施例的搜索引擎的方法的流程圖;圖4是根據(jù)本公開另一個實施例的搜索引擎的方法的流程圖;和圖5是根據(jù)本公開再一個實施例的搜索引擎的方法的流程圖。
具體實施例方式下面將結(jié)合附圖詳細描述本公開的具體實施例。如果對某些相關(guān)現(xiàn)有技術(shù)的詳細 描述可能會混淆本公開的要點,則不會在這里提供其詳細描述。在各個實施例中,相同的附圖標記用于表示執(zhí)行同樣功能的元件或單元。圖1是具有根據(jù)本公開一個實施例的搜索引擎裝置的設(shè)備結(jié)構(gòu)方框圖。如圖1所示,具有根據(jù)本公開的實施例的搜索引擎裝置的設(shè)備100包括搜索引擎 裝置102,中央處理單元(CPU) 104,只讀存儲器(ROM) 106,隨機存取存儲器(RAM) 108,輸入 /輸出(I/O)單元110,用戶接口(I/F)單元112,以及存儲單元114。上述各個單元通過數(shù) 據(jù)和/或命令總線130相互連接。中央處理單元(CPU) 104用于執(zhí)行相關(guān)的程序,以處理各種數(shù)據(jù)并控制設(shè)備100中 的各個單元的操作。只讀存儲器(ROM) 106用于存儲CPU 104進行各種處理和控制所需的 各種程序。隨機存取存儲器(RAM) 108用于存儲CPU 104在處理和控制過程中臨時產(chǎn)生的 中間數(shù)據(jù)。輸入/輸出(I/O)單元110用于與外部設(shè)備連接,以在外部設(shè)備和本設(shè)備100 之間傳輸各種數(shù)據(jù)。用戶接口(I/F)單元112包括鍵盤、鼠標,以及可以用各種顯示裝置實 現(xiàn)的、用于輸入/輸出可視數(shù)據(jù)的顯示部件,和可以輸入/輸出聲音的音頻部件,用于與用 戶進行交互操作,并接收用戶輸入的操作命令等。存儲單元114用于存儲該設(shè)備100所生 成的各種數(shù)據(jù)。
搜索引擎裝置102進一步包括認證單元122和檢測單元126。根據(jù)本公開一個實 施例,認證單元122接收用戶輸入的用戶數(shù)據(jù),并將該用戶輸入的用戶數(shù)據(jù)與互聯(lián)網(wǎng)上和 本搜索引擎裝置的數(shù)據(jù)庫中的其它數(shù)據(jù)進行比較,在該用戶數(shù)據(jù)不同于互聯(lián)網(wǎng)上和本搜索 引擎裝置的數(shù)據(jù)庫中的其它數(shù)據(jù)的情況下,將該用戶數(shù)據(jù)認證為原創(chuàng)數(shù)據(jù),并在數(shù)據(jù)庫中 創(chuàng)建或者更新該用戶的賬戶信息。檢測單元126檢測該原創(chuàng)數(shù)據(jù)在互聯(lián)網(wǎng)上和/或本搜索 引擎裝置的搜索頁面上出現(xiàn)的情況,并根據(jù)其在互聯(lián)網(wǎng)上出現(xiàn)的情況更新該用戶的賬戶信 息或者針對該情況來創(chuàng)建報告。根據(jù)本公開另一個實施例,認證單元122接收用戶數(shù)據(jù)的 方式可以采用但不限于以下方式認證單元122可以以預(yù)定的時間間隔對互聯(lián)網(wǎng)或者其它 數(shù)據(jù)源進行掃描,以發(fā)現(xiàn)并獲取該用戶數(shù)據(jù);或者,由用戶手動地向認證單元122輸入該用 戶數(shù)據(jù),由此將用戶數(shù)據(jù)輸入到認證單元122中進行認證。上述各個部件或者單元不對本公開的范圍構(gòu)成限制。根據(jù)本公開一個實施例,也 可以通過與上述CPU 104、ROM 106、RAM 108、I/O 110、I/F 112以及存儲單元114等相結(jié) 合的功能軟件來實現(xiàn)該搜索引擎裝置102的功能,即通過與上述各個單元相結(jié)合的軟件來 實現(xiàn)認證單元122和檢測單元126的功能。并且,認證單元122和檢測單元126的功能也 可以合并為一個單元來實現(xiàn)。圖2是根據(jù)本公開另一個實施例的搜索引擎裝置的更詳細的方框圖。如圖2所示,搜索引擎裝置102包括認證單元122、檢測單元126、瀏覽器單元212 以及數(shù)據(jù)庫250。認證單元122進一步包括比較單元215,第一判斷單元216,賬戶創(chuàng)建單 元218,第一更新單元219。檢測單元126進一步包括跟蹤單元222,第二判斷單元223,報 告創(chuàng)建單元225和第二更新單元226。上述各個單元通過數(shù)據(jù)和/或命令總線230相互連 接。根據(jù)本公開一個實施例,瀏覽器單元212用來瀏覽互聯(lián)網(wǎng),接收用戶所提交的用 戶數(shù)據(jù),并將該用戶數(shù)據(jù)提供給認證單元122。這里,可以將瀏覽器單元212實現(xiàn)為包括桌 面軟件和/或插件。對于將用戶數(shù)據(jù)提交給認證單元122的方式,可以采用多種方式。例 如,信息原創(chuàng)者(例如是用戶A)通過互聯(lián)網(wǎng)將用戶數(shù)據(jù)(例如是信息A)提交給認證單元122進行認證時,可以選擇以下任意一種或幾種來實現(xiàn)提交(1)通過與搜索引擎裝置102 配套開發(fā)的瀏覽器單元212或其它頁面編輯工具(未示出),以正常模式上載用戶數(shù)據(jù),并 自動提交給搜索引擎裝置102的認證單元122,由此實現(xiàn)自動認證;(2)通過從互聯(lián)網(wǎng)上下 載軟件插件,在生成新頁面時,原創(chuàng)者把該用戶數(shù)據(jù)的URL提交給搜索引擎裝置102的認證 單元122,以進行認證;(3)采用自動掃描的方式,搜索引擎裝置102會定期對互聯(lián)網(wǎng)進行掃 描,獲取并認證該用戶數(shù)據(jù)。搜索引擎裝置102可以支持適用于新聞媒體的大批量提交的 方式。由上述可知,搜索引擎裝置102中也可以不包括瀏覽器單元212。比較單元215將該用戶數(shù)據(jù)與互聯(lián)網(wǎng)上和/或本搜索引擎裝置的數(shù)據(jù)庫250中的 其它數(shù)據(jù)進行比較,并在該用戶數(shù)據(jù)與其它數(shù)據(jù)不同的情況下,確定該用戶數(shù)據(jù)為原創(chuàng)數(shù) 據(jù)。第一判斷單元216判斷擁有該原創(chuàng)數(shù)據(jù)的用戶在搜索引擎裝置102的數(shù)據(jù)庫250中是 否具有賬戶信息。當該原創(chuàng)數(shù)據(jù)的用戶在數(shù)據(jù)庫250中沒有賬戶信息時,賬戶創(chuàng)建單元218通過截 取和/或疊加(組合)該原創(chuàng)數(shù)據(jù)的部分數(shù)據(jù)作為標識數(shù)據(jù),來為該用戶創(chuàng)建一個賬戶信 息。根據(jù)本公開的一個實施例,原創(chuàng)數(shù)據(jù)被最早提交認證的時間也可以作為該標識數(shù)據(jù)的 一部分。在創(chuàng)建該賬戶信息時,賬戶創(chuàng)建單元218將該標識數(shù)據(jù)作為該原創(chuàng)數(shù)據(jù)的識別信 息,同時從該用戶獲得該用戶的身份信息,例如身份證號碼等信息資料,并將這些信息存入 數(shù)據(jù)庫250中,作為該用戶賬戶的基本信息。當該原創(chuàng)數(shù)據(jù)的用戶在數(shù)據(jù)庫250中已經(jīng)具有了賬戶信息時,第一更新單元219 通過截取和/或疊加(組合)該原創(chuàng)數(shù)據(jù)的部分數(shù)據(jù)作為標識數(shù)據(jù),來更新該用戶的賬戶 信息。根據(jù)本公開的一個實施例,原創(chuàng)數(shù)據(jù)被最早提交認證的時間也可以作為該標識數(shù)據(jù) 的一部分。在更新該賬戶信息時,第一更新單元219將該原創(chuàng)數(shù)據(jù)的標識數(shù)據(jù)添加到該賬 戶中,作為新的條目。這表示該用戶在其同一個賬戶中可以擁有多個原創(chuàng)數(shù)據(jù),例如可以擁 有多篇文章的原創(chuàng)權(quán)。也就是說,如果該用戶是第一次提交用戶數(shù)據(jù)而獲得認證,則搜索引擎裝置102 的賬戶創(chuàng)建單元218會為該用戶生成一個新的賬戶并創(chuàng)相應(yīng)的賬戶信息,否則,如果該用 戶以前已經(jīng)提交過用戶數(shù)據(jù)并獲得認證,即該用戶已經(jīng)擁有了賬戶,在這種情況下,對于提 交了新的用戶數(shù)據(jù)并獲得了認證的用戶,僅更新該用戶已有賬戶中的賬戶信息,例如是在 該賬戶中增加所提交的用戶數(shù)據(jù)的標識數(shù)據(jù)等。通過該用戶的賬戶,該用戶可以對搜索被認證的原創(chuàng)數(shù)據(jù)的搜索引擎和使用該原 創(chuàng)數(shù)據(jù)的網(wǎng)站進行授權(quán)。該用戶可以授權(quán)所有的網(wǎng)站轉(zhuǎn)載該原創(chuàng)數(shù)據(jù),只要含有該原創(chuàng)數(shù) 據(jù)的頁面的在線廣告由搜索引擎102負責(zé)投放和按比例分配廣告收益給該用戶即可。該用 戶也可以限制對該原創(chuàng)數(shù)據(jù)的轉(zhuǎn)載,例如按網(wǎng)站類型進行授權(quán),比如只允許無廣告的非營 利網(wǎng)站、政府網(wǎng)站、教育性質(zhì)的網(wǎng)站使用該原創(chuàng)數(shù)據(jù)。也可以列出被授權(quán)的具體網(wǎng)站的域 名。認證單元122中的各個單元也可以任意組合為相應(yīng)的單元來進行工作。根據(jù)本公開的一個實施例,認證單元122通過一定的算法,截取并組合所提交的用戶數(shù)據(jù)中的部分數(shù)據(jù)或內(nèi)容(例如是文字、音頻、或視頻等),并通過模式識別技術(shù),生成 該用戶數(shù)據(jù)的獨一無二的“身份證明”,即上述的標識數(shù)據(jù)??梢詫⑸鲜龅臉俗R數(shù)據(jù)存儲在 數(shù)據(jù)庫250中。數(shù)據(jù)庫250可以被存儲于存儲單元114中。
認證單元122的上述截取并組合用戶數(shù)據(jù)中的部分數(shù)據(jù)以形成標識數(shù)據(jù)的“算法”和“模式識別技術(shù)”不對本公開的范圍構(gòu)成限制,本領(lǐng)域的技術(shù)人員可以采用其它的方 式來生成該標識數(shù)據(jù)。認證單元122進行判斷,如果用戶數(shù)據(jù)(信息A)的標識數(shù)據(jù)已存在于搜索引擎裝 置102的數(shù)據(jù)庫250內(nèi),即說明相同的用戶數(shù)據(jù)已被他人優(yōu)先提交,則搜索引擎裝置102拒 絕將原創(chuàng)權(quán)授予給此次用戶數(shù)據(jù)的提交者(用戶A)。如果該標識數(shù)據(jù)不存在于搜索引擎裝 置102的數(shù)據(jù)庫250內(nèi),即之前無人申請該用戶數(shù)據(jù)的原創(chuàng)權(quán),但同樣的用戶數(shù)據(jù)在其它網(wǎng) 頁可以被搜索到(例如是早前發(fā)表的),則搜索引擎裝置102向該用戶A進行反饋。如果用 戶A聲稱自己是該用戶數(shù)據(jù)(信息A)的原始作者,并且簽署具有法律效力的文件,則搜索 引擎裝置102將該用戶數(shù)據(jù)的原創(chuàng)權(quán)授予給此次信息的提交者(用戶A),反之則拒絕認證 (授權(quán))。如果該用戶數(shù)據(jù)的標識數(shù)據(jù)既不存在于搜索引擎裝置102的數(shù)據(jù)庫250內(nèi),即無 人申請該用戶數(shù)據(jù)的原創(chuàng)權(quán),在其它網(wǎng)頁也無法搜索到,這說明這是該用戶數(shù)據(jù)的首次發(fā) 表,則將該用戶數(shù)據(jù)(信息A)的原創(chuàng)權(quán)授予給提交者(用戶A)。根據(jù)本公開的另一個實施例,檢測單元126中的跟蹤單元222跟蹤在互聯(lián)網(wǎng)上轉(zhuǎn) 載被認證的原創(chuàng)數(shù)據(jù)的網(wǎng)站的頁面或者使用本搜索引擎裝置的搜索結(jié)果頁面。檢測單元 126中的跟蹤單元222通過認證單元122生成的原創(chuàng)數(shù)據(jù)的獨一無二的“身份證明”-標識 數(shù)據(jù),來搜索和跟蹤該原創(chuàng)數(shù)據(jù)在互聯(lián)網(wǎng)上的轉(zhuǎn)載和傳播。第二判斷單元223判斷轉(zhuǎn)載該原創(chuàng)數(shù)據(jù)的頁面是否經(jīng)過授權(quán)。在該頁面是經(jīng)過授 權(quán)的情況下,第二更新單元226更新該原創(chuàng)數(shù)據(jù)的用戶的賬戶信息。如果該原創(chuàng)數(shù)據(jù)出現(xiàn) 在被授權(quán)的網(wǎng)站,并且該網(wǎng)站使用了本公開的搜索引擎102的在線廣告,那么搜索引擎102 在該網(wǎng)站的含有該原創(chuàng)數(shù)據(jù)的頁面所獲取的在線廣告收益,會按照已經(jīng)簽署的用戶協(xié)議中 規(guī)定的分配方案,自動分配給該原創(chuàng)數(shù)據(jù)的用戶,即更新該用戶的賬戶中的權(quán)益信息。如果 本搜索引擎裝置的搜索結(jié)果頁面包含所述原創(chuàng)數(shù)據(jù),同時也有本搜索引擎裝置的廣告收益 產(chǎn)生,則收益也要按比例分配給各所述原創(chuàng)數(shù)據(jù)的所有者。在該頁面是未經(jīng)過授權(quán)的情況下,第二判斷單元223還判斷該頁面是否使用了預(yù) 定數(shù)據(jù)。在該頁面使用了該預(yù)定數(shù)據(jù)的情況下,第二更新單元226更新該原創(chuàng)數(shù)據(jù)的用戶 的賬戶信息。這里,該預(yù)定數(shù)據(jù)可以是搜索引擎裝置102的在線廣告,即在該頁面使用了搜 索引擎裝置102的在線廣告的情況下,向該原創(chuàng)數(shù)據(jù)的用戶的賬戶分配收益,并更新該用 戶的賬戶中的權(quán)益信息。在該頁面未使用該預(yù)定數(shù)據(jù)的情況下,報告創(chuàng)建單元225記錄在互聯(lián)網(wǎng)上轉(zhuǎn)載該 原創(chuàng)數(shù)據(jù)的該頁面,并對該頁面創(chuàng)建報告,以及輸出所創(chuàng)建的報告給該原創(chuàng)數(shù)據(jù)的用戶。也就是說,如果該原創(chuàng)數(shù)據(jù)出現(xiàn)在未經(jīng)授權(quán)的網(wǎng)站,但是該網(wǎng)站使用了根據(jù)本公 開的搜索引擎裝置102的在線廣告(預(yù)定數(shù)據(jù)),那么搜索引擎裝置102在該網(wǎng)站含有該原 創(chuàng)數(shù)據(jù)的頁面所獲取的在線廣告收益,會按照已經(jīng)簽署的用戶協(xié)議中所規(guī)定的分配方案, 自動分配給該原創(chuàng)數(shù)據(jù)的用戶,并更新該用戶的賬戶中的權(quán)益信息。反之,如果該網(wǎng)站未使 用搜索引擎裝置102的在線廣告(預(yù)定數(shù)據(jù)),則搜索引擎裝置102將記錄轉(zhuǎn)載該原創(chuàng)數(shù)據(jù) 的頁面的地址,并監(jiān)督其它搜索引擎在此頁面投放廣告的情況。一旦檢測出有潛在的影響 信息原創(chuàng)者應(yīng)得利益的情況出現(xiàn),搜索引擎102的報告創(chuàng)建單元225就會創(chuàng)建一個報告,并 向該原創(chuàng)數(shù)據(jù)的用戶的賬戶提交該報告。
本公開上述實施例中的各個功能元件(單元)相互之間的連接關(guān)系不對本公開的范圍構(gòu)成限制,其中的多個單元可以合并為一個單元,或者一個單元可以分解為多個單元。上述的用戶數(shù)據(jù)和原創(chuàng)數(shù)據(jù)可以是但不限于用戶在互聯(lián)網(wǎng)上發(fā)表的文字、圖片、 音頻、視頻等中的任何一種或組合。上述預(yù)定數(shù)據(jù)可以是搜索引擎裝置102的在線廣告,并 且該賬戶信息包括該用戶的標識信息(例如身份證明資料等),該原創(chuàng)數(shù)據(jù)的標識數(shù)據(jù)(用 以識別該原創(chuàng)數(shù)據(jù)以與其它用戶數(shù)據(jù)相區(qū)別),以及該在線廣告的收益(權(quán)益信息)等。圖3是根據(jù)本公開一個實施例的搜索引擎的方法的流程圖。如圖3所示,根據(jù)本公開實施例的用于互聯(lián)網(wǎng)的搜索引擎的方法包括步驟S301, 接收用戶的用戶數(shù)據(jù)。在步驟S302,比較所接收的用戶數(shù)據(jù)是否與互聯(lián)網(wǎng)上和/或本搜索 引擎裝置的數(shù)據(jù)庫內(nèi)的其它數(shù)據(jù)相同,即該用戶數(shù)據(jù)是否已經(jīng)存在于互聯(lián)網(wǎng)上和/或本搜 索引擎裝置的數(shù)據(jù)庫內(nèi)。如果步驟S302的判斷結(jié)果為肯定的“是”,則前進到步驟S303。在 步驟S303,拒絕接受該用戶數(shù)據(jù)。相反,如果步驟S302的判斷結(jié)果為否定的“否”,則前進到 步驟S305。在步驟S305,將該用戶數(shù)據(jù)認證為原創(chuàng)數(shù)據(jù)。在步驟S306,創(chuàng)建或者更新該用 戶的賬戶信息。在步驟S307,檢測該原創(chuàng)數(shù)據(jù)在互聯(lián)網(wǎng)上和/或使用本搜索引擎裝置的搜 索結(jié)果頁面上出現(xiàn)的情況,并根據(jù)所檢測的結(jié)果來更新該用戶的賬戶信息或者創(chuàng)建報告。根據(jù)本公開一個實施例,上述步驟S301至步驟S306可以通過搜索引擎裝置102 的認證單元122來實施。更具體地,上述步驟S301可以由瀏覽器單元212來實施,步驟S302 可以由比較單元215來實施,步驟S303和步驟S305可以由第一判斷單元216來實施,步驟 S306可以由賬戶創(chuàng)建單元218或者第一更新單元219來實施。步驟S307可以通過搜索引 擎裝置102的檢測單元126來實施。執(zhí)行上述方法的各個步驟的順序不對本公開的范圍構(gòu)成限制,可以以并行的方 式,或者以不同的順序來執(zhí)行上述各個步驟。圖4是根據(jù)本公開另一個實施例示出圖3中的步驟S306中更細節(jié)的方法的流程 圖。如圖4所示,在步驟S401中,截取和/或疊加(組合)該原創(chuàng)數(shù)據(jù)的部分數(shù)據(jù)作 為該原創(chuàng)數(shù)據(jù)的標識數(shù)據(jù)。在步驟S402,接收用戶的標識信息,例如是用戶的身份信息等資 料。在步驟S403,將所獲得的原創(chuàng)數(shù)據(jù)的標識信息和該用戶的標識信息存入數(shù)據(jù)庫中,由此 來創(chuàng)建或者更新該用戶的賬戶信息。根據(jù)本公開一個實施例,上述步驟S401至步驟S403可以通過搜索引擎裝置102 的賬戶創(chuàng)建單元218或者第一更新單元219來實施。執(zhí)行上述方法的各個步驟的順序不對本公開的范圍構(gòu)成限制,可以以并行的方 式,或者以不同的順序來執(zhí)行上述各個步驟。圖5是根據(jù)本公開再一個實施例示出圖3中的步驟S307中更細節(jié)的方法的流程 圖。如圖5所示,在步驟S501,跟蹤在互聯(lián)網(wǎng)上轉(zhuǎn)載所認定的原創(chuàng)數(shù)據(jù)的網(wǎng)站的頁面。 在步驟S502,判斷轉(zhuǎn)載該原創(chuàng)數(shù)據(jù)的頁面是否經(jīng)過授權(quán)。如果在步驟S502的判斷結(jié)果為 肯定的“是”,則前進到步驟S503,相反,如果在步驟S502的判斷結(jié)果為否定的“否”,則前進 到步驟S504。在步驟S503,更新該原創(chuàng)數(shù)據(jù)的用戶的賬戶信息。在步驟S504,判斷該頁面 是否使用了預(yù)定數(shù)據(jù)。如果在步驟S504的判斷結(jié)果為肯定的“是”,則返回到步驟S503,相反,如果在步驟S504的判斷結(jié)果為否定的“否”,則前進到步驟S505。在步驟S505,對該頁 面創(chuàng)建報告,并輸出該報告給該原創(chuàng)數(shù)據(jù)的用戶的賬戶。根據(jù)本公開一個實施例,上述步驟S501至步驟S505可以通過搜索引擎裝置102 的檢測單元126來實施。更具體地,上述步驟S501可以由跟蹤單元222來實施,步驟S502 和步驟S504可以由第二判斷單元223來實施,步驟S503可以由第二更新單元226來實施, 步驟S505可以由報告創(chuàng)建單元225來實施。執(zhí)行上述方法的各個步驟的順序不對本公開的范圍構(gòu)成限制,可以以并行的方 式,或者以不同的順序來執(zhí)行上述各個步驟。上述的用戶數(shù)據(jù)和原創(chuàng)數(shù)據(jù)可以是但不限于用戶在互聯(lián)網(wǎng)上發(fā)表的文字、圖片、 音頻、視頻等中的任何一種或組合。上述預(yù)定數(shù)據(jù)可以是搜索引擎裝置102的在線廣告,并 且該賬戶信息包括該用戶的標識信息(例如身份證明資料等),該原創(chuàng)數(shù)據(jù)的標識數(shù)據(jù)(用 以識別該原創(chuàng)數(shù)據(jù)以與其它數(shù)據(jù)相區(qū)別),以及該在線廣告的收益(權(quán)益信息)等。根據(jù)本公開一個實施例,本公開的技術(shù)方案可以用于對原創(chuàng)信息(原創(chuàng)數(shù)據(jù))的 認證和后續(xù)管理。上述用戶可以是信息原創(chuàng)者,當用戶提交用戶數(shù)據(jù)(例如是小說、攝影作 品、音像制品等)到互聯(lián)網(wǎng)時,先通過搜索引擎102進行認證。 通過截取/疊加原創(chuàng)數(shù)據(jù)中的部分字段(音頻或者視頻同理),生成獨一無二的標 識數(shù)據(jù),并通過Shingling和Simhash或其它適合的技術(shù)手段進行相同數(shù)據(jù)檢索(本領(lǐng)域 技術(shù)人員也可以使用其它現(xiàn)有技術(shù)來進行),來確認該部分字段的用戶數(shù)據(jù)是否首次出現(xiàn) 于互聯(lián)網(wǎng)上或者搜索引擎102的數(shù)據(jù)庫內(nèi)。同時,搜索引擎裝置102還可以自動記錄所提 交的用戶數(shù)據(jù)通過認證的時間點,提交并通過認證的時間點將是確認信息原創(chuàng)權(quán)的重要因 素。這樣,無論原創(chuàng)數(shù)據(jù)被轉(zhuǎn)載或者抄襲到任何地方,只要使用了搜索引擎裝置102的在線 廣告,那么搜索引擎裝置102的在線廣告收益,會自動的分一部分給信息原創(chuàng)者。被認證的原創(chuàng)數(shù)據(jù)以分布式結(jié)構(gòu)或更適合的方式存儲在文件庫中。同時,搜索引 擎102可以與信息傳播者達成協(xié)議通過該搜索引擎102認證的原創(chuàng)數(shù)據(jù)被轉(zhuǎn)載后,轉(zhuǎn)載的 網(wǎng)站必須允許搜索引擎102在該網(wǎng)站的頁面投放在線廣告。信息原創(chuàng)者也可以授權(quán)搜索引 擎102來查明其原創(chuàng)數(shù)據(jù)被轉(zhuǎn)載的地址,并監(jiān)督轉(zhuǎn)載頁面上其它搜索引擎的廣告投放的情 況。一旦檢測出有非法轉(zhuǎn)載或者有潛在的損害信息原創(chuàng)者應(yīng)得利益的情況出現(xiàn),搜索引擎 102可以生成報告,并向該信息原創(chuàng)者的用戶賬戶提交該報告。本公開的上述實施例僅為示例性描述,它們的具體結(jié)構(gòu)和操作不對本公開的范圍 構(gòu)成限制,本領(lǐng)域的技術(shù)人員可以將上述各個實施例中的不同部分和操作進行組合,產(chǎn)生 新的實施方式,同樣符合本公開的構(gòu)思。本公開的實施例可以通過硬件、軟件、固件或它們之間結(jié)合的方式來實現(xiàn),其實現(xiàn) 方式不對本公開的范圍構(gòu)成限制。雖然上面已經(jīng)結(jié)合附圖示出并描述了本公開的一些實施例,但是本領(lǐng)域的技術(shù)人 員應(yīng)當理解,在不偏離本公開的原則和精神的情況下,可以對這些實施例進行變化和修改, 但它們?nèi)匀宦湓诒竟_的權(quán)利要求及其等價物的范圍之內(nèi)。
權(quán)利要求
一種用于互聯(lián)網(wǎng)的搜索引擎裝置,包括認證單元,接收用戶的用戶數(shù)據(jù),在所述用戶數(shù)據(jù)與互聯(lián)網(wǎng)上的其它數(shù)據(jù)不同的情況下,將所述用戶數(shù)據(jù)認證為原創(chuàng)數(shù)據(jù),并創(chuàng)建或者更新所述用戶的賬戶信息;以及檢測單元,檢測所述原創(chuàng)數(shù)據(jù)在互聯(lián)網(wǎng)上和/或該搜索引擎裝置的搜索結(jié)果頁面上出現(xiàn)的情況,并根據(jù)所述檢測的結(jié)果更新所述用戶的賬戶信息或者創(chuàng)建報告。
2.如權(quán)利要求1所述的搜索引擎裝置,還包括瀏覽器,用于瀏覽互聯(lián)網(wǎng),接收所述用戶數(shù)據(jù),并將所述用戶數(shù)據(jù)提供給所述認證單元。
3.如權(quán)利要求1所述的搜索引擎裝置,所述認證單元以預(yù)定的時間間隔進行掃描,以 獲取所述用戶數(shù)據(jù)。
4.如權(quán)利要求1所述的搜索引擎裝置,由所述用戶向所述認證單元輸入所述用戶數(shù)據(jù)。
5.如權(quán)利要求1所述的搜索引擎裝置,所述認證單元包括比較單元,將所述用戶數(shù)據(jù)與互聯(lián)網(wǎng)上和/或該搜索引擎裝置的數(shù)據(jù)庫中的其它數(shù)據(jù) 進行比較。
6.如權(quán)利要求5所述的搜索引擎裝置,所述認證單元還包括第一判斷單元,判斷所述原創(chuàng)數(shù)據(jù)的用戶在數(shù)據(jù)庫中是否具有賬戶信息。
7.如權(quán)利要求6所述的搜索引擎裝置,所述認證單元還包括賬戶創(chuàng)建單元,當所述原創(chuàng)數(shù)據(jù)的所述用戶不具有賬戶信息時,截取和/或疊加所述 原創(chuàng)數(shù)據(jù)的部分數(shù)據(jù)和最早提交認證的時間作為標識數(shù)據(jù),并為所述用戶創(chuàng)建賬戶信息。
8.如權(quán)利要求6所述的搜索引擎裝置,所述認證單元還包括第一更新單元,當所述原創(chuàng)數(shù)據(jù)的所述用戶已經(jīng)具有賬戶信息時,截取和/或疊加所 述原創(chuàng)數(shù)據(jù)的部分數(shù)據(jù)作為標識數(shù)據(jù),并更新用戶的賬戶信息。
9.如權(quán)利要求1所述的搜索引擎裝置,所述檢測單元包括跟蹤單元,跟蹤在互聯(lián)網(wǎng)上轉(zhuǎn)載所述原創(chuàng)數(shù)據(jù)的網(wǎng)站的頁面和/或使用該搜索引擎裝 置的搜索結(jié)果頁面。
10.如權(quán)利要求9所述的搜索引擎裝置,所述檢測單元還包括 第二判斷單元,判斷轉(zhuǎn)載所述原創(chuàng)數(shù)據(jù)的所述頁面是否經(jīng)過授權(quán)。
11.如權(quán)利要求10所述的搜索引擎裝置,所述檢測單元還包括第二更新單元,在所述頁面是經(jīng)過授權(quán)的情況下,更新所述原創(chuàng)數(shù)據(jù)的用戶的賬戶信息。
12.如權(quán)利要求11所述的搜索引擎裝置,所述第二判斷單元還判斷所述頁面是否使用 了預(yù)定數(shù)據(jù)。
13.如權(quán)利要求12所述的搜索引擎裝置,所述第二更新單元在轉(zhuǎn)載所述原創(chuàng)數(shù)據(jù)的網(wǎng) 站的所述頁面使用了所述預(yù)定數(shù)據(jù)的情況下,更新所述原創(chuàng)數(shù)據(jù)的用戶的賬戶信息。
14.如權(quán)利要求1所述的搜索引擎裝置,所述第二更新單元在使用該搜索引擎裝置的 搜索結(jié)果頁面使用了所述預(yù)定數(shù)據(jù)的情況下,更新所述原創(chuàng)數(shù)據(jù)的用戶的賬戶信息。
15.如權(quán)利要求12所述的搜索引擎裝置,所述檢測單元還包括報告創(chuàng)建單元,在轉(zhuǎn)載所述原創(chuàng)數(shù)據(jù)的網(wǎng)站的所述頁面未使用所述預(yù)定數(shù)據(jù)的情況下,記錄所述頁面,并對所述頁面創(chuàng)建報告,以及輸出所述報告。
16.如權(quán)利要求1所述的搜索引擎裝置,所述用戶數(shù)據(jù)和所述原創(chuàng)數(shù)據(jù)是所述用戶發(fā) 表的文字、圖片、音頻、視頻等中的任何一種或組合。
17.如權(quán)利要求12所述的搜索引擎裝置,所述預(yù)定數(shù)據(jù)是所述搜索引擎裝置的在線廣 告,所述賬戶信息包括所述用戶的標識信息,所述原創(chuàng)數(shù)據(jù)的標識數(shù)據(jù),以及所述在線廣告 的收益信息。
18.一種用于互聯(lián)網(wǎng)的搜索引擎的方法,包括步驟接收用戶的用戶數(shù)據(jù),在與互聯(lián)網(wǎng)上和/或該搜索引擎的數(shù)據(jù)庫中的其它數(shù)據(jù)不同的 情況下,將所述用戶數(shù)據(jù)認證為原創(chuàng)數(shù)據(jù),并創(chuàng)建或者更新所述用戶的賬戶信息;以及檢測所述原創(chuàng)數(shù)據(jù)在互聯(lián)網(wǎng)上和/或該搜索引擎的搜索結(jié)果頁面上出現(xiàn)的情況,并根 據(jù)所述檢測的結(jié)果更新所述用戶的賬戶信息或者創(chuàng)建報告。
19.如權(quán)利要求17所述的方法,還包括步驟通過截取和/或疊加所述原創(chuàng)數(shù)據(jù)的部分數(shù)據(jù)和最早提交認證的時間作為所述原創(chuàng) 數(shù)據(jù)的標識數(shù)據(jù),來創(chuàng)建或更新所述賬戶信息。
20.如權(quán)利要求19所述的方法,還包括步驟 跟蹤在互聯(lián)網(wǎng)上轉(zhuǎn)載所述原創(chuàng)數(shù)據(jù)的網(wǎng)站的頁面; 判斷轉(zhuǎn)載所述原創(chuàng)數(shù)據(jù)的所述頁面是否經(jīng)過授權(quán);以及在所述頁面是經(jīng)過授權(quán)的情況下,更新所述原創(chuàng)數(shù)據(jù)的用戶的賬戶信息。
21.如權(quán)利要求20所述的方法,還包括步驟在轉(zhuǎn)載所述原創(chuàng)數(shù)據(jù)的網(wǎng)站的所述頁面是未經(jīng)過授權(quán)的情況下,判斷所述頁面是否使 用了預(yù)定數(shù)據(jù)。
22.如權(quán)利要求21所述的方法,還包括步驟在轉(zhuǎn)載所述原創(chuàng)數(shù)據(jù)的網(wǎng)站的所述頁面使用了所述預(yù)定數(shù)據(jù)的情況下,更新所述原創(chuàng) 數(shù)據(jù)的用戶的賬戶信息;以及在轉(zhuǎn)載所述原創(chuàng)數(shù)據(jù)的網(wǎng)站的所述頁面未使用所述預(yù)定數(shù)據(jù)的情況下,對所述頁面創(chuàng) 建并輸出報告。
23.如權(quán)利要求18所述的方法,在使用該搜索引擎的搜索結(jié)果頁面使用了所述預(yù)定數(shù) 據(jù)的情況下,更新所述原創(chuàng)數(shù)據(jù)的用戶的賬戶信息。
24.如權(quán)利要求19所述的方法,還包括步驟通過檢測互聯(lián)網(wǎng)上出現(xiàn)的所述標識數(shù)據(jù),來跟蹤所述原創(chuàng)數(shù)據(jù)在互聯(lián)網(wǎng)上出現(xiàn)的情況。
全文摘要
提供了一種用于互聯(lián)網(wǎng)的搜索引擎裝置,包括認證單元,接收用戶的用戶數(shù)據(jù),在所述用戶數(shù)據(jù)與互聯(lián)網(wǎng)上的其它數(shù)據(jù)和本系統(tǒng)數(shù)據(jù)庫內(nèi)的數(shù)據(jù)不同的情況下,將所述用戶數(shù)據(jù)認證為原創(chuàng)數(shù)據(jù),并創(chuàng)建或者更新所述用戶的賬戶信息;以及檢測單元,檢測所述原創(chuàng)數(shù)據(jù)在互聯(lián)網(wǎng)上和該搜索引擎的搜索結(jié)果頁面出現(xiàn)的情況,并根據(jù)所述檢測的結(jié)果更新所述用戶的賬戶信息或者創(chuàng)建報告。
文檔編號G06F21/00GK101826101SQ201010126079
公開日2010年9月8日 申請日期2010年3月17日 優(yōu)先權(quán)日2010年1月25日
發(fā)明者王平 申請人:王平