欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種網(wǎng)頁多重屬性的標記方法及其實現(xiàn)的制作方法

文檔序號:8361497閱讀:183來源:國知局
一種網(wǎng)頁多重屬性的標記方法及其實現(xiàn)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明提供了一種對具有多重信息屬性的網(wǎng)頁進行標記并實現(xiàn)的方法,屬于計算 機技術(shù)領(lǐng)域中的信息處理。具體來說,在實際業(yè)務(wù)處理中對互聯(lián)網(wǎng)(移動互聯(lián)網(wǎng))的網(wǎng)頁信 息處理時,往往需要從多個層次(即多個屬性類別)、多個維度(某個屬性類別又有多個屬性 值)對網(wǎng)頁進行信息屬性的標記,并基于網(wǎng)頁的信息屬性集合,實現(xiàn)搜索引擎中信息的個性 搜索、信息推送中的信息精準推送、信息分類中的信息準確分類、信息匯聚中的專題聚類。 為此,本發(fā)明專利提出了網(wǎng)頁的多重屬性標記方法,并通過組合應(yīng)用直接的網(wǎng)頁屬性標記、 基于關(guān)鍵詞庫的網(wǎng)頁屬性標記、以及關(guān)鍵詞與規(guī)則庫相結(jié)合進行網(wǎng)頁屬性標記、使用分類 器進行網(wǎng)頁屬性標記等多種方法,能夠有效地標注出網(wǎng)頁的多重信息屬性,從而在實際應(yīng) 用中可方便、高效地對網(wǎng)頁屬性信息進行標記、提取與應(yīng)用。
【背景技術(shù)】
[0002] 隨著網(wǎng)絡(luò)的普及,網(wǎng)頁成為最普遍的信息載體,人們通過搜索或直接點擊網(wǎng)站中 的網(wǎng)頁獲取自己所需要的知識與信息。在使用人工進行信息處理范疇之外,在以搜索引擎、 信息推送和信息分類為基礎(chǔ)功能的實際業(yè)務(wù)應(yīng)用中,通常需要通過抓取分散在不同網(wǎng)站中 的網(wǎng)頁并對其進行分類或聚類等自動信息處理。在對網(wǎng)頁進行分類或聚類等業(yè)務(wù)處理時, 實際應(yīng)用需要從多個層次、多個維度著手,這種情況下,網(wǎng)頁信息屬性就具有多重特征。在 現(xiàn)有的網(wǎng)頁信息處理方法中,往往從網(wǎng)頁的某個屬性著手,缺乏從整體角度綜合處理網(wǎng)頁 各類信息屬性的方法,能夠把網(wǎng)頁屬性重復(fù)、高效地應(yīng)用到整個業(yè)務(wù)處理過程;同時,現(xiàn)有 網(wǎng)頁屬性標記后的信息分類、特別是把網(wǎng)頁歸類到多個類別時,仍然存在效率不高、分類不 準確的問題。我們提供的方法,在信息前期進行處理時對網(wǎng)頁信息屬性標記進行多重標識, 通過組合網(wǎng)頁的屬性集,可以高效地、靈活地、準確實現(xiàn)信息分類,該發(fā)明可以廣泛應(yīng)用到 搜索引擎、信息推送、信息分類、信息個性化展示中。

【發(fā)明內(nèi)容】

[0003] 為解決上述技術(shù)缺陷,本發(fā)明基于實際業(yè)務(wù)需求,需要解決如何對一個具體網(wǎng)頁 設(shè)置出多重信息屬性并賦予信息屬性值,從而提供一種高效、準確、可擴展、可復(fù)用的網(wǎng)頁 多重信息屬性標注方法。
[0004] 在實際信息處理業(yè)務(wù)中,一個網(wǎng)頁屬性(記為符號P)常常是具有多個屬性類別 (記為符號A)的向量。記為:
【主權(quán)項】
1. 一種網(wǎng)頁多重屬性的標記方法及其實現(xiàn),實現(xiàn)后裝置包括H個模塊;A.屬性識別模 塊,用于定義網(wǎng)頁多重信息屬性模型并識別網(wǎng)頁的多重信息屬性向量,并根據(jù)業(yè)務(wù)需求,定 義出屬性域向量;B.屬性配置模塊,根據(jù)屬性類別的屬性域取值是否確定,通過直接賦值 或技術(shù)手段賦值,對網(wǎng)頁的多維信息屬性向量賦予確定的值;C.屬性調(diào)用模塊,用于設(shè)置 網(wǎng)頁信息屬性調(diào)用方法與技術(shù)接口規(guī)范;所述實現(xiàn)方法核也包括;步驟A ;處理抓取的網(wǎng)頁 數(shù)據(jù)與信息,確定信息屬性類別和某個類別的屬性域,生成網(wǎng)頁屬性向量;步驟B ;針對實 際業(yè)務(wù)需求,設(shè)置屬性值向量并對屬性值向量賦值;步驟C ;對標記好的網(wǎng)頁信息屬性定義 調(diào)用方法與接口規(guī)范。
2. 根據(jù)權(quán)利要求1所述的一種網(wǎng)頁多重屬性的標記方法及其實現(xiàn),其特征在于:運用 了整體、系統(tǒng)并可擴展的網(wǎng)頁多重信息屬性模型;網(wǎng)頁多重信息屬性標記過程的直接賦值 與技術(shù)手段賦值相結(jié)合的方法;規(guī)則與關(guān)鍵詞匹配相結(jié)合的信息屬性標記技術(shù)實現(xiàn)過程使 用"先規(guī)則后關(guān)鍵詞匹配"原則;網(wǎng)頁多重信息屬性標記結(jié)果或過程的系統(tǒng)調(diào)用方法與接口 規(guī)范。
【專利摘要】本發(fā)明一種網(wǎng)頁多重屬性的標記方法及其實現(xiàn),涉及網(wǎng)頁信息處理領(lǐng)域,通過提供網(wǎng)頁多重信息屬性標記處理的屬性識別模塊、屬性配置模塊和屬性調(diào)用模塊,主要從整體、系統(tǒng)角度解決對抓取網(wǎng)頁的多重信息屬性進行識別與存儲、多方式標記以及對屬性標記結(jié)果與過程進行靈活可重復(fù)調(diào)用的問題。與現(xiàn)有技術(shù)方案相比,本發(fā)明通過定義網(wǎng)頁多重信息屬性識別模型及標記過程,提出了一種統(tǒng)一的對網(wǎng)頁多重信息屬性進行標記的新方法,可以有效升網(wǎng)頁信息屬性標記處理的效率和準確率,從而為網(wǎng)頁多重信息屬性標記結(jié)果與過程在業(yè)務(wù)處理中的便捷重復(fù)調(diào)用奠定基礎(chǔ),能夠有效提升需要處理網(wǎng)頁多重信息屬性業(yè)務(wù)系統(tǒng)的效率。
【IPC分類】G06F17-30
【公開號】CN104679804
【申請?zhí)枴緾N201410176809
【發(fā)明人】王建平
【申請人】寧波優(yōu)策信息技術(shù)有限公司
【公開日】2015年6月3日
【申請日】2014年4月30日
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
克东县| 青海省| 西乌珠穆沁旗| 永丰县| 南安市| 陇南市| 靖州| 肃宁县| 南平市| 呼图壁县| 宁晋县| 余江县| 安新县| 姜堰市| 平罗县| 吴江市| 建湖县| 莫力| 青神县| 临潭县| 伊金霍洛旗| 扶沟县| 兖州市| 永顺县| 稻城县| 英吉沙县| 壤塘县| 平湖市| 宣恩县| 娄烦县| 邳州市| 满城县| 武安市| 隆回县| 烟台市| 米林县| 大丰市| 麦盖提县| 东乡| 泸溪县| 双桥区|