欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

智能個性化服務網(wǎng)站構造方法

文檔序號:6458322閱讀:190來源:國知局

專利名稱::智能個性化服務網(wǎng)站構造方法
技術領域
:本發(fā)明涉及智能化網(wǎng)站構造技術,應用對象是互聯(lián)網(wǎng)的網(wǎng)站。任何網(wǎng)站都可以利用本發(fā)明技術,實現(xiàn)針對不同的訪問用戶,安排網(wǎng)頁內容和布局,為每個訪問者提供個性化服務。
背景技術
:現(xiàn)在的網(wǎng)站內容安排大多數(shù)都是"靜態(tài)"的,網(wǎng)頁上的內容和布局是事先設計好的,對所有訪問者都是固定不變的,不能根據(jù)每個訪問者的個性來提供"個性化服務"。很多學者提出了下一代互聯(lián)網(wǎng)Web3.0的概念,雖然Web3.0并沒有準確的定義,但其核心思路是更加"智能化"的互聯(lián)網(wǎng)。如何讓互聯(lián)網(wǎng)更加智能化,網(wǎng)站服務的智能化是其發(fā)展的重要組成部分。數(shù)據(jù)挖掘技術起源于上個世紀90年代,其核心思想是"從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程"?,F(xiàn)在有很多人研究數(shù)據(jù)挖掘技術,并將其運用到網(wǎng)站"個性化服務",取得了很多成果。有些成果已經(jīng)得到實際應用,并獲得了較滿意的成效。但也有很多成果在理論上很好,由于計算量大、算法過于復雜,離實際應用還存在相當?shù)木嚯x,在實用上存在諸多的不便。即便是已經(jīng)應用的成果,也存在個性化知識的描述和提取方法的方面的缺陷,個性化刻畫不夠全面、準確以及通用性不強等問題。目前大多數(shù)實現(xiàn)網(wǎng)站個性化服務的方法,都存在兩個問題-第一、.個性不強觀在很多方法和已經(jīng)實現(xiàn)的系統(tǒng),不是針對每個客戶的"個性化服務",而是針對"類"的"個性化服務"。很多"個性化服務"都是通過數(shù)據(jù)挖掘中的"聚類"辦法,將客戶劃分成若干個類,當問客訪問網(wǎng)站時,先將用戶影射到所事先劃分好的"類"中,再根據(jù)"類"的"個性"進行"個性化服務"。嚴格上講,這并不是針對每個用戶的個性化服務,而是針對"類"的個性化服務。第二、只強調客戶對內容的興趣,忽略了訪問習慣一個客戶訪問網(wǎng)站,就如同進入一個商場,不僅僅可以通過其購買的商品反映客戶的個性,'還可以通過其逛商場的習慣行進路徑,如先逛什么地方、再看什么商品等來反映客戶的個性。一個人訪問網(wǎng)站的也是一樣,不僅僅是通過其瀏覽了哪些內容可以反映一個人的個性,還可以通過其習慣性的訪問路徑先看什么內容、后看什么內容來反映一個人的個性?,F(xiàn)在所有實現(xiàn)網(wǎng)站"個性化服務"的方法,都忽略了客戶的"訪問習慣路徑",只是單純地從用戶訪問網(wǎng)站的內容來抽取個性。顯然,只針對用尸訪問內容而不考慮訪問行為習慣的"個性化服務"還是不完備的。發(fā)明.內容為了解決上述存在的問題,本發(fā)明不將用戶劃分成"類",而是完全針對每個用戶進行真正的"個性化服務"。將每個用戶訪問網(wǎng)站的"個性"進行了更加詳細的數(shù)字化分析,將"個性"抽象為三個集合"內容喜好"集合、"預測喜好"集合和"訪問習慣"集合。"內容喜好"集合反映一個人對網(wǎng)站各個欄目內容的喜好程度。"預測喜好"集合對于沒有包含在"內容喜好"中網(wǎng)站欄目喜好的預測,是通過對于與該用戶有相似"內容喜好"用戶的欄目進行關聯(lián)分析所得到的。"訪問習慣"集合是每個用戶每次訪問網(wǎng)站最頻繁出現(xiàn)的欄目訪問行為軌跡。本發(fā)明不直接參與最終的個性化服務,而是以"中間件"的形式提供給網(wǎng)站應用程序,由網(wǎng)站應用程序根據(jù)"中間件"提供的用戶個性知識,來安排網(wǎng)頁內容、頁面架構和布局,提供下一步操作的鏈接索引,從而達到網(wǎng)站智能個性化服務。本發(fā)明目的是通過下述技術方案實現(xiàn)的智能個性化服務網(wǎng)站構造方法,步驟如下(1)數(shù)據(jù)監(jiān)測與清洗程序每天定時讀取訪問記錄,并對訪問記錄進行分析、清洗、過濾,.形成符合客戶個性學習記錄,存入"用戶個性學習集"內;(2)用戶內容喜好分析程序對"用戶個性學習集"中記錄進行統(tǒng)計分析,得到用戶訪問網(wǎng)站各個欄目分別占總欄目訪問數(shù)的百分比集合,即"內容喜好"集合,并保存到"個性知識庫"中,同時形成每個用戶的"內容喜好"集合記錄;(3)預測喜好程序分析程序,以每個用戶的"內容喜好"中的欄目為基本集合,選擇所有其他用戶"內容喜好"中包含該用戶"內容喜好"欄目的記錄,得到每個用戶的"相似喜好"記錄;在這些記錄中,以用戶的"內容喜好"欄目為基本條件/分別對不包含在"內容喜好"的欄目分別逐個進行關聯(lián)分析,并按出現(xiàn)頻率和支持度進行排序,得到每個用戶的"預測喜好",保存到"個性知識庫"中;(4)訪問習慣分析程序,對"用戶個性學習集"中記錄進行統(tǒng)計分析,抽取客戶最經(jīng)常出現(xiàn)的訪問欄目訪問行為軌跡,作為"訪問習慣"個性保存到"個性知識庫"。(5)通過系統(tǒng)接口程序與網(wǎng)站應用程序進行交互,應用程序將用戶ID交給系統(tǒng),系統(tǒng)判斷如客戶ID在知識庫中,系統(tǒng)將用戶的個性"內容喜好"、"預測喜好"和"訪問習慣"返回給應用程序。"用戶個性學習集",為每個用戶保存規(guī)定數(shù)量的學習記錄,當某個用戶學習記錄大規(guī)定數(shù)量時,刪除舊的記錄,補充最新的記錄,以保證用戶個性學習集是最近的記錄。數(shù)據(jù)監(jiān)測與清洗程序步驟如下(1)每天定時讀取訪問記錄,將沒有訪問會話標識SessionID的訪問記錄轉換為有會話標識SessionID的訪問記錄;(2)URL欄目轉換模塊讀取訪問會話Session記錄,查找URL欄目對照表,判斷URL所屬欄目,將訪問會話Session記錄的URL轉換為欄目,保存到用戶欄目訪問記錄;(3)欄目歸并當一個訪問步驟中包含多個相同欄目時,用l個欄目來代替,對欄目訪問記錄進行歸并;內容喜好分析程序的步驟如下(1)讀取用戶個性學習集的記錄,統(tǒng)計用戶欄目訪問數(shù);(2)匯總用戶欄目總訪問數(shù);(3)分別計算客戶訪問每個欄目數(shù)占總欄目訪問數(shù)的百分比,得出客戶對網(wǎng)站的內容喜好;(4)將客戶對網(wǎng)站的內容喜好保存到個性知識庫中,同時臨保存到"客戶對網(wǎng)站內容喜好"中,供分析"預測喜好"使用。預測喜好分析程序步驟如下(1)讀取"內容喜好"集合的記錄,找出包含該"內容喜好"的其他用戶"內容喜好"記錄,為"相似喜好"記錄;(2)分別統(tǒng)計"相似喜好"記錄中,不包含在"內容喜好"中出現(xiàn)欄目的出現(xiàn)次數(shù),再被"相似喜好"記錄總數(shù)除,得到這些欄目的出現(xiàn)頻率;(3)對上面出現(xiàn)頻率進行排序,以排序結果的先后次序,組成"預測喜好"隹a.呆口;(4)將每個用戶的"預測喜好"保存到個性知識庫中。訪問習慣分析程序步驟如下(1)讀取用戶個性學習集的記錄,統(tǒng)計每個用戶欄目訪問序列出現(xiàn)次數(shù);(2)對訪問系列出現(xiàn)次數(shù)進行排序,得到最頻繁出現(xiàn)的欄目訪問序列;(3)將最頻繁出現(xiàn)的欄目訪問序列作為"訪問習慣",保存到個性知識庫中。系統(tǒng)接口程序步驟如下(1)當.某個用戶訪問網(wǎng)站時,應用程序將用戶識別ID傳送給應用接口程序,應用.接口程序判斷用戶識別ID是否在"個性知識庫"中存在?(2)如果存在,提取"內容喜好"、"預測喜好"和"訪問習慣",以擴展標記語言XML格式返回給網(wǎng)站應用程序;(3)如果不存在,應用接口程序返回"沒有個性"信息。本發(fā)明的有益效果本發(fā)明將訪問網(wǎng)站用戶的"個'哮",數(shù)字化地定義和描述為"內容喜好"、"預測喜好"和"訪問習慣"。"內容喜好"刻畫用戶對網(wǎng)站內容的基本內容喜好;"預測喜好"通過比較與該用戶相似的其他用戶的"內容喜好",得到不在該用戶"內容喜好"內的擴展"預測喜好";"訪問.習慣"描述用戶經(jīng)常出現(xiàn)的訪問行為路徑,用這3個數(shù)字化分析和刻畫,構成對每個用戶個性全面數(shù)字化描述的"個性知識庫"。系統(tǒng)為訪問網(wǎng)站的每個用戶動態(tài)地建立知識庫,通過連續(xù)地學習過程,不斷地自動更新知識庫,跟蹤用戶"個性"變化,網(wǎng)站應用程序可以根據(jù)提供的API接口,獲得每個訪問者的"個性",然后,根據(jù)每個用戶的"內容喜好"和"預測喜好",自動產生網(wǎng)頁內容;根據(jù)各自的"訪問習慣",安排網(wǎng)頁鏈接布局等有針對的"個性化服務",引導用戶下一步操作的鏈接索引,方便用戶訪問網(wǎng)站。各種類型的網(wǎng)站,都可以通過使用本發(fā)明技術,來達到為客戶訪問提供個性化服務目的。與現(xiàn)有技術相比本發(fā)明的優(yōu)點如下(1)、個性化服務針對性強本發(fā)明的"個性化服務"不將用戶劃分成"類",不是通過聚類來分析屬性、再影射個性,而是針對每個客戶的"個性化服務",是真正的"個性化服務",針對性強。(2)對用戶興趣刻畫更準確提供"個性化服務"的關鍵,是來如何定義和描述用戶的"個性"?顯然,如果對于"個性"的定義不準確、描述不完備,直接影響到所提供的"個性化服務"質量。本發(fā)明用"內容喜好"、"預測喜好"和"訪問習慣"3個集合來數(shù)字化定義和描述客戶的"個性",可以更全面、準確地刻畫一個用戶的"個性",由此所產生的規(guī)則,可以更加準確地為網(wǎng)站"個性化服務"提供知識支持;(3)簡單易行本發(fā)朋結構簡單,系統(tǒng)流程線路短,不需要復雜的"聚類"運算,用很小的存儲開銷和計算量,就可以得到客戶的個性,在實際應用上簡單易行;(4)技術服務中間件本發(fā)明提供的是一個"中間件"技術,封裝了復雜的數(shù)據(jù)挖掘過程,只提供簡單的知識規(guī)則調用接口程序AH,不直接參與具體的"個性化服務"過程。這樣的好處是因為每個網(wǎng)站的技術結構和服務內容是不同的,如何提供"個性化服務"是網(wǎng)站應用程序的事情,.很難準確地通過一個單一的系統(tǒng)來實現(xiàn)。正如操作系統(tǒng)封裝了復雜的硬件管理程序,提供應用開發(fā)接口程序API—樣,可以讓各種復雜的應用,構造在這個平臺之上,產生各種各樣復雜的應用系統(tǒng)。本發(fā)明最終給網(wǎng)站提供的是一系列"個性化服務"接口程序,而不直接參與具體實現(xiàn)過程。這樣,簡單的體系結構,可以給各種網(wǎng)站提供"個性化服務",網(wǎng)站應用程序,可以根據(jù)自己的需姜,再構建自己的"個性化服務";(5)自適應控制本發(fā)明采用動態(tài)用戶個性學3集的辦法,連續(xù)不斷地跟蹤每個客戶訪問網(wǎng)站記錄,連續(xù)不斷地更新每個用戶訪問網(wǎng)站的個性變化知識,可以最大限度地減少來自各方面的干擾,所提供的"個性化服務"有很好的適應性和魯棒性。圖1是智能個性化服務網(wǎng)站構造方法流程圖;圖2是數(shù)據(jù)監(jiān)測與清洗程序流程圖;圖3是內容喜好分析抽取流程圖;圖4是預測喜好分析抽取流程圖;圖5是訪問習慣分析抽取流程圖;圖6個性化服務應用接口程序流程圖。具體實施例方式智能個性化服務網(wǎng)站構造方法;步驟如下(1)攀據(jù)監(jiān)測與清洗如圖1所示,數(shù)據(jù)監(jiān)測與清洗程序102每天定時分析訪問日志101,將沒有會話標識SessionID的訪問網(wǎng)址URL的記錄(見表1)轉化為有會話標識SessionID的訪問網(wǎng)址URL的訪問記錄(見表2)。表l:User-ID時間URL代理、、、、、、、、、xxxxxxxxxxxxxxxxxxxxxxxx表2:Session-IDUser-ID時間URL代理、、、、、、、、、xxxxxxxxxxxxxxxxxxxx注意,其中表2的表頭中增加了"SessionlD"。如閣2所示,會話Session記錄模塊201分析訪問日志101中記錄,判別當UserID相同、且間隔時間小于系統(tǒng)定義的"會話"Session時間限制TimeOut時,給予一個相同的會話標識SessionID,保存到訪問會話Session記錄模塊202中,形成如表2所示的訪問會話形式的Session記錄。URL欄目轉換模塊204讀取訪問會話Session記錄模塊202中的訪問會話Session記錄,査找"URL欄目對照表"203,將訪問會話Session記錄模塊202中的"URL"轉化為"欄目",見表3。表3:.Session-IDUser-ID時間欄目代理、、、、、、、、、xxxxxxxxxxxxxxxxxxxx此時,表2中"URL"變成了表3的"欄目",保存到用戶欄目訪問記錄205中。欄自歸并模塊206對數(shù)據(jù)進行歸并,形成最后的"用戶個性學習紫'記錄103。欄目歸并分析相同SessionID記錄,如果連續(xù)有多條記錄同屬于一個欄目,歸并為l個欄目訪問,形成l條客戶個性學習記錄;如現(xiàn)有^^千條記錄,見表4。.表4:<table>tableseeoriginaldocumentpage13</column></row><table>按上述規(guī)則,歸并后結果見表5,<table>tableseeoriginaldocumentpage13</column></row><table>注意前3條記錄訪問連續(xù)同為"欄目1",間隔小于30分鐘(假設Web服務器設施超時TimeOut為30分鐘),歸并為1條記錄;后3條記錄訪問同為"欄目2"且滿足條件,也歸并為1條記錄。用戶歸并去掉無關的信息,只保留SessionID和UserID,將SessionID和UserID的相同的記錄按時間順序歸并為1條記錄。如上述記錄可歸并為表6<table>tableseeoriginaldocumentpage13</column></row><table>注意SessionID都是"1111",用戶ID都是"123",歸并為1條記錄,這條記錄可以解釋為用戶"123"某次訪問網(wǎng)站,先訪問了"欄目1",后訪問了"欄目3"。這是1條標準的"學習紫'記錄,保存到"用戶個性學習集"103內。在用戶個性學習集103中,為每個用戶規(guī)定一定數(shù)量的學習記錄(如1000條記錄,網(wǎng)站可自行設定規(guī)定記錄數(shù)),當某個用戶學習記錄超過規(guī)定數(shù)量時,刪除最老的記錄,填補最新的記錄,以保證學習記錄是最新訪問記錄。(2)內容喜好分析與抽取如圖1所示,內容喜好分析程序105對"用戶個性學習集"103中記錄進行統(tǒng)計分析,抽取客戶個性"內容喜好"。"內容喜好",是指通過統(tǒng)計分析一定數(shù)量的訪問記錄,得到用戶訪問網(wǎng)站各個欄巨分別占總欄目訪問數(shù)的百分比集合,以此來代表某個用戶對網(wǎng)站各個欄目的喜歡程度。定義一個客戶對網(wǎng)站的"內容喜好"是一個百分數(shù)的集合。集合中的每個元素是一個百分數(shù),是統(tǒng)計一個客戶訪問網(wǎng)站每個"欄目"的次數(shù)占該客戶總訪問欄目次數(shù)的百分比。設一個網(wǎng)站有n個欄目,.欄目用V表示,第i個欄目的訪問統(tǒng)計數(shù)為Vi,全體欄目訪問數(shù)總為Vt,.總統(tǒng)計數(shù)為Vrvn^v*......+Vi+......vn設Pi是某個欄目Vi訪問數(shù)占總訪問數(shù)Vt的百分比,P產V/VtX100%,某個客戶訪問網(wǎng)站各個欄目數(shù)分別占其總欄目訪問數(shù)的百分比數(shù)的集合為P={Pl,P2,,,,,,Pi,,,,,,Pn},根據(jù)上述"內容喜好"定義,統(tǒng)計"用戶個性學習集"中的記錄,得到每個客戶的"內容喜好",保存到"個性知識庫"109中,同時臨時保存到內容喜好集合106中。如圖3所示,"內容喜好"分析抽取流程為統(tǒng)計用戶欄目訪問數(shù)模塊301對用戶個性學習集103的記錄進行統(tǒng)計,統(tǒng)計每個UserID記錄中每個欄目的被訪問次數(shù),保存到客戶訪問欄目統(tǒng)計數(shù)302模塊內;匯總用戶欄目訪問數(shù)模塊303統(tǒng)計每個用戶訪問各個欄目的總數(shù),保存到客戶欄目總訪問數(shù)模塊304內;然后再計算每個欄目訪問數(shù)分別站欄目總訪問數(shù)的百分比305,得到最后的"客戶對網(wǎng)站內容喜好"數(shù)據(jù)保存在臨時存放"客戶對網(wǎng)站內容喜好"306中供"預測喜好"分析使用,同時保存到"個性知識庫"109中。舉例偶如有結果如表7所示,表7.UserID欄目1欄目2、、、、、、12326UserID=123的用戶總欄目訪問數(shù)為2+6=8。UserID=123的用戶內容喜好集合為{欄目1:2/8,欄目2:6/8}={欄目1:25%,欄目2:75%}其物理意義是用戶123對網(wǎng)站欄目的喜好:欄目1為25%,欄目2為75%。(3)預測喜好分析與抽取"預測喜好"是對不包含在"內容喜好"中欄目的預測。首先選出包含該"內容喜好"的其他用戶的"內容喜好"記錄,稱為"相似喜好用戶",再對不包含在該"內容喜好"中的欄目分別進行關聯(lián)分析,最后再按關聯(lián)分析的支持度進行排序,所得到的欄目序列,可作為對"內容喜好"中不包含欄目的預測。所說"相似喜好用戶",是指:"內容喜好"包含該用戶的內容喜好的其他用戶。如有甲、乙兩個用戶,甲用戶的"內容喜好"是{欄目1:25%,欄目2:7,%}乙用戶的"內容喜好"是.{欄目1:10%,欄目2:20%,欄目3:60%,欄目4:10%},乙用戶的"內容喜好"包含甲用戶的"內容喜好,,"欄目r,和"欄目2",因此,乙就是甲用戶的"相似內容喜好"用戶。圖1中的預測喜好分析程序107對經(jīng)由內容喜好分析模塊105分析得到的內容喜奸集合106中的每個用戶的"內容喜好"進行再分析,得到每個用戶的"預測喜好"。"預測喜好"分析流程如圖4所示,相似喜好尋找模塊401在內容喜好集合106中査找具有"相似喜好"的記錄,形成"相似喜好集合"402。關聯(lián)喜好分析模塊403對"相似喜好集合"402中不包含"內容喜好"內的欄目分別進行關聯(lián)分析,得到不包含"內容喜好"集合其他每個欄目出現(xiàn)的頻度n。設"相似喜好集合"有m條記錄,出現(xiàn)某個不包含在"內容喜好"中的欄目i有n條記錄,欄目i的"支持度"SUPPORT是n除以m乘100%,SUPPORT=(n/m)xlOO%。.舉例如有包含"欄目l,,和"欄目2"的"相似集合"記錄200條,其中,出現(xiàn)包含"欄目3"的記錄有10條,那么,"欄目3"的支持度SUPPORT=l0/200x100%=5。在"相似^:好"集合記錄中,每個非"內容喜好"中的欄目都是"預測喜好"。對這些欄目進行排序,得到"預測喜好集合,,404,并以排序的序列先后次序保存到"個性知識庫"109中。排序的序列代表推薦建議的強度,網(wǎng)站應用程序可以根據(jù)"預測喜好"的排列次序進行內容推薦。預測喜好完整舉例,如網(wǎng)站有6個欄目,得到某個用戶的"內容喜好"是.{欄目1:25%,欄目2:75%}那么如何預測該用戶對"內容喜好"中不包含的6個欄目的喜好呢?{欄目'3,欄目4,欄目5,欄目6}假設經(jīng)過統(tǒng)計,有100條"相似喜好"集合記錄,這4個欄目的出現(xiàn)頻數(shù)分別是欄目3=4,欄目4=6,欄目5=8,欄目6=10;支持度分別是SUPPORT(欄目3)=4/100=4%;SUPPORT(欄目4)=6/100=6%;SUPPORT(欄目5)=詣0=8%;SUPPORT(欄目6)=10/100=10%;排序后得到"預測喜好"集合是{欄目6=10,欄目5=8,欄目4=6,欄目3=4}(4)訪問習慣分析與抽取客戶訪問習慣是用戶每次訪問網(wǎng)站最頻繁出現(xiàn)的欄目"行為軌跡",是一個用戶、一次訪問網(wǎng)站的欄目訪問先后序列。訪問習慣分析與抽取流程如圖5所示,首先對"用戶個性學習集"103中記錄進行統(tǒng)計分析,得到各種訪問行為,見表8。表8Session.IDUserID欄目步驟1112.123欄目1、欄目21113123欄目1、欄目31114123欄目1、欄目21115123欄目1、欄目2統(tǒng)計出每個客戶每個訪問序列出現(xiàn)的頻數(shù)501及客戶訪問序列統(tǒng)計頻數(shù)502統(tǒng)計結果見表9,表9:..UserIP欄目步驟發(fā)生次數(shù)123欄目1、欄目23123欄目1、欄目31其表示,UserID為123的用戶,訪問行為"欄目l、欄目2"發(fā)生過3次;訪問行為"欄目1、欄目3"發(fā)生過1次分別按客戶ID與序列統(tǒng)計頻數(shù)進行排序,得到每個客戶ID最大的出現(xiàn)按序列503,'也就是對"表9"按"發(fā)生次數(shù)"進行排序,得到最頻繁出現(xiàn)的訪問行為軌跡為"欄目1、欄目2",這就是用戶123的"訪問習慣504",保存到"個性知識庫"109中。(5)應用接口程序由于網(wǎng)站服務的多樣,有新聞、體育、音樂、門戶、圖書、交友、零售、批發(fā)、等等,對于不同的服務,都有各自的特性,具體的內容存儲形式也不相同,只有網(wǎng)站應用程序開發(fā)者才最清楚如何進行具體內容個性化推薦服務。因此,本發(fā)明不參與個性化服務的具體內容推薦,而是通過接口程序API與網(wǎng)站應用程序進行交互,具體的內容推薦有網(wǎng)站應用程序來完成。應用接口流程如圖6所示,首先網(wǎng)站應用程序將用戶ID交應用接口程序104,然后判斷在"個性知識庫"109中是否存在這個用戶ID:如果存在該客戶ID,提取該用戶個性,獲得該用戶的"內容喜好"、"預測喜好"和"訪問習慣"返回給應用程序;如果客戶ID不在,返回"沒有該客戶記錄"信息。權利要求1、智能個性化服務網(wǎng)站構造方法,其特征在于步驟如下(1)數(shù)據(jù)監(jiān)測與清洗程序每天定時讀取訪問記錄,并對訪問記錄進行分析、清洗、過濾,形成符合客戶個性學習記錄,存入“用戶個性學習集”內;(2)用戶內容喜好分析程序對“用戶個性學習集”中記錄進行統(tǒng)計分析,得到用戶訪問網(wǎng)站各個欄目分別占總欄目訪問數(shù)的百分比集合,即“內容喜好”集合,并保存到“個性知識庫”中,同時形成每個用戶的“內容喜好”集合記錄;(3)預測喜好程序分析程序,以每個用戶的“內容喜好”中的欄目為基本集合,選擇所有其他用戶“內容喜好”中包含該用戶“內容喜好”欄目的記錄,得到每個用產的“相似喜好”記錄;在這些記錄中,以用戶的“內容喜好”欄目為基本條件,分別對不包含在“內容喜好”的欄目分別逐個進行關聯(lián)分析,并按出現(xiàn)頻率和支持度進行排序,得到每個用戶的“預測喜好”,保存到“個性知識庫”中;(4)訪問習慣分析程序,對“用戶個性學習集”中記錄進行統(tǒng)計分析,抽取客戶最經(jīng)常出現(xiàn)的訪問欄目訪問行為軌跡,作為“訪問習慣”個性保存到“個性知識庫”;(5)通過系統(tǒng)接口程序與網(wǎng)站應用程序進行交互,應用程序將用戶ID交給系統(tǒng),系統(tǒng)判斷如客戶ID在知識庫中,系統(tǒng)將用戶的個性“內容喜好”、“預測喜好”和“訪問習慣”返回給應用程序。2、根據(jù)權利要求1所述的根據(jù)權利要求1所述的智能個性化服務網(wǎng)站構造方法,其特征在于所述的"用戶個性學習集",為每個用戶保存規(guī)定數(shù)量的學習記錄,當某個用戶學習記錄大規(guī)定數(shù)量時,刪除舊的記錄,補充最新的記錄,以保證用戶個性學習集是最近的記錄。3、根據(jù)權利要求1所述的智能個性化服務網(wǎng)站構造方法,其特征在于所述的數(shù)據(jù)監(jiān)測與清洗程序步驟如下(1)每天定時讀取訪問記錄,將沒有訪問會話標識SessionID的訪問記錄轉換為有會話標識SessionID的訪問記錄;(2)URL欄目轉換模塊讀取訪問會話Session記錄,查找URL欄目對照表,判斷URL所屬欄,,將訪問會話Session記錄的URL轉換為欄目,保存到用戶欄目訪問記錄;(3)欄目歸并當一個訪問步驟中包含多個相同欄目時,用l個欄目來代替,對欄目訪問記錄進行歸并。4、根據(jù)權利要求1所述的智能個性化服務網(wǎng)站構造方法,其特征在于所述的內容喜好分析程序的步驟如下:.(1)讀取用戶個性學習集的記錄,統(tǒng)計用戶欄目訪問數(shù);(2)匯總用戶欄目總訪問數(shù);(3)分別計算客戶訪問每個欄目數(shù)占總欄目訪問數(shù)的百分比,得出客戶對網(wǎng)站的內容喜好;(4)將客戶對網(wǎng)站的內容喜好保存到個性知識庫中,同時臨時保存到"客戶對網(wǎng)站內容喜好"中,供"預測喜好"分析使用。5、根據(jù)權利要求1所述的智能個性化服務網(wǎng)站構造方法,其特征在于預測喜好分析程序步驟如下(1)讀取"內容喜好"集合的記錄,找出包含該"內容喜好"的其他用戶"內容喜好"記錄,為"相似喜好"記錄;(2)分別統(tǒng)計"相似喜好"記錄中,不包含在"內容喜好"中出現(xiàn)欄目的出現(xiàn)次數(shù),再被"相似喜好"記錄總數(shù)除,得到這些欄目的出現(xiàn)頻率;(3)對上面出現(xiàn)頻率進行排序,以排序結果的先后次序,組成"預測喜好"魚A.朱口;(4)將每個用戶的"預測喜好"保存到個性知識庫中。6、根據(jù)^(利要求1所述的智能個性化服務網(wǎng)站構造方法,其特征在于訪問習慣分析程序步驟如下(1)讀取用戶個性學習集的記錄,統(tǒng)計每個用戶欄目訪問序列出現(xiàn)次數(shù);(2)對訪問系列出現(xiàn)次數(shù)進行排序,得到最頻繁出現(xiàn)的欄目訪問序列;(3)將最頻繁出現(xiàn)的欄目訪問序列作為"訪問習慣",保存到個性知識庫中。7、根據(jù)權利要求1所述的智能個性化服務網(wǎng)站構造方法,其特征在于所述的系統(tǒng)接口程序步驟如下-(1)當某個用戶訪問網(wǎng)站時,應用程序將用戶識別ID傳送給應用接口程序,應用接口程序判斷用戶識別ID是否在"個性知識庫"中存在?(2)如果存在,提取"內容喜好"、"預測喜好"和"訪問習慣",以擴展標記語言XML格式返回給網(wǎng)站應用程序;(3)如果不存在,應用接口程序返回"沒有個性"信息。全文摘要智能個性化服務網(wǎng)站構造方法,是一個簡單、易用、高效、通用的網(wǎng)站個性化服務方法。本方法封裝了復雜的知識表達和知識獲取過程,不直接參與“個性化服務”,以“中間件”方式,給網(wǎng)站應用程序提供每個客戶的“個性”。將每個客戶的“個性”抽象為“內容喜好”、“預測喜好”和“訪問習慣”3個集合,利用數(shù)據(jù)挖掘技術,通過建立動態(tài)學習集辦法,持續(xù)不斷地更新知識庫,跟蹤分析每個客戶“個性”,以API方式,給網(wǎng)站應用程序提供客戶的“個性”。網(wǎng)站應用程序可根據(jù)所提供的客戶“內容喜好”和、“預測喜好”,安排網(wǎng)頁內容;根據(jù)客戶的“訪問習慣”,安排客戶可以下一步訪問網(wǎng)站的索引鏈接,來達到個性化服務目的。文檔編號G06F17/30GK101236563SQ20081001031公開日2008年8月6日申請日期2008年2月1日優(yōu)先權日2008年2月1日發(fā)明者峰劉,宏孫申請人:劉峰;孫宏
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
彰武县| 滨州市| 自治县| 盐边县| 浪卡子县| 浮梁县| 汝阳县| 宁城县| 德保县| 固阳县| 铁岭市| 宜兴市| 肇庆市| 于田县| 上蔡县| 梅州市| 绥化市| 文成县| 元氏县| 山西省| 鲁山县| 大石桥市| 抚松县| 伊金霍洛旗| 蕉岭县| 沈丘县| 循化| 仪陇县| 依兰县| 澄江县| 岳西县| 康定县| 文水县| 烟台市| 漳浦县| 通许县| 信阳市| 东乌珠穆沁旗| 象州县| 理塘县| 南开区|