欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

多標(biāo)桿確定文章相關(guān)性的方法和裝置的制造方法

文檔序號(hào):9765934閱讀:341來源:國知局
多標(biāo)桿確定文章相關(guān)性的方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,具體而言,涉及一種多標(biāo)桿確定文章相關(guān)性的方法和裝置。
【背景技術(shù)】
[0002]在互聯(lián)網(wǎng)領(lǐng)域內(nèi),當(dāng)新的文章出現(xiàn)時(shí),需要將其和已有的文章進(jìn)行比較,確定新的文章和已有的哪些文章是相關(guān)文章關(guān)系,以便于在用戶查看文章時(shí)將相關(guān)文章一起推薦給用戶。
[0003]由于已有文章的數(shù)量龐大,而每個(gè)新的文章都需要與所有已有文章進(jìn)行比較,導(dǎo)致計(jì)算量非常巨大,計(jì)算文章相關(guān)性的效率非常低。

【發(fā)明內(nèi)容】

[0004]鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的多標(biāo)桿確定文章相關(guān)性的方法和裝置。
[0005]依據(jù)本發(fā)明的一種基于多標(biāo)桿確定文章相關(guān)性的方法,包括:將第一文章與預(yù)設(shè)的多個(gè)標(biāo)桿文章進(jìn)行比較,得到所述第一文章與所述多個(gè)標(biāo)桿文章的第一距離集合;將第二文章與所述多個(gè)標(biāo)桿文章進(jìn)行比較,得到所述第二文章與所述多個(gè)標(biāo)桿文章的第二距離集合;基于所述第一距離集合與所述第二距離集合確定所述第一文章與所述第二文章之間的相關(guān)度。
[0006]可選地,前述的方法,基于所述第一距離集合與所述第二距離集合確定所述第一文章與所述第二文章之間的相關(guān)度,具體包括:計(jì)算所述第一距離集合與所述第二距離集合的距離差,根據(jù)所述距離差確定所述第一文章與所述第二文章的相關(guān)度。
[0007]可選地,前述的方法,在將第一文章與預(yù)設(shè)的多個(gè)標(biāo)桿文章進(jìn)行比較之前,還包括:識(shí)別所述第一文章的類型,并從預(yù)設(shè)的標(biāo)桿文章集合中選擇具有相對(duì)應(yīng)類型的所述多個(gè)標(biāo)桿文章。
[0008]可選地,前述的方法,在將第一文章與預(yù)設(shè)的多個(gè)標(biāo)桿文章進(jìn)行比較之前,還包括:獲取所述第一文章中的關(guān)鍵詞,并從預(yù)設(shè)的標(biāo)桿文章集合中選擇具有所述關(guān)鍵詞的所述多個(gè)標(biāo)桿文章。
[0009]可選地,前述的方法,將第一文章與預(yù)設(shè)的多個(gè)標(biāo)桿文章進(jìn)行比較,得到所述第一文章與所述多個(gè)標(biāo)桿文章的第一距離集合,具體包括:獲取所述第一文章的特征屬性,并根據(jù)述第一文章的特征屬性生成所述第一文章對(duì)應(yīng)的向量,將所述第一文章對(duì)應(yīng)的向量與預(yù)設(shè)的所述多個(gè)標(biāo)桿文章對(duì)應(yīng)的向量進(jìn)行比較;將第二文章與所述多個(gè)標(biāo)桿文章進(jìn)行比較,得到所述第二文章與所述多個(gè)標(biāo)桿文章的第二距離集合,具體包括:獲取所述第二文章的特征屬性,并根據(jù)述第二文章的特征屬性生成所述第二文章對(duì)應(yīng)的向量,并將所述第二文章對(duì)應(yīng)的向量與所述多個(gè)標(biāo)桿文章對(duì)應(yīng)的向量進(jìn)行比較。
[0010]可選地,前述的方法,獲取所述第一文章的特征屬性,具體包括:對(duì)所述第一文章進(jìn)行分詞得到多個(gè)詞,計(jì)算所述第一文章的多個(gè)詞的詞頻,作為所述第一文章的特征屬性;獲取所述第二文章的特征屬性,具體包括:對(duì)所述第二文章進(jìn)行分詞得到多個(gè)詞,計(jì)算所述第二文章的多個(gè)詞的詞頻,作為所述第二文章的特征屬性。
[0011]可選地,前述的方法,還包括:在所述距離差均位于預(yù)設(shè)區(qū)間時(shí),將所述第二文章設(shè)置為所述第一文章的相關(guān)文章,以用于在需推送所述第一文章的相關(guān)文章時(shí)推送所述第二文章。
[0012]依據(jù)本發(fā)明的一種基于多標(biāo)桿確定文章相關(guān)性的裝置,包括:第一比較模塊,用于將第一文章與預(yù)設(shè)的多個(gè)標(biāo)桿文章進(jìn)行比較,得到所述第一文章與所述多個(gè)標(biāo)桿文章的第一距離集合;第二比較模塊,用于將第二文章與所述多個(gè)標(biāo)桿文章進(jìn)行比較,得到所述第二文章與所述多個(gè)標(biāo)桿文章的第二距離集合;相關(guān)度確定模塊,用于基于所述第一距離集合與所述第二距離集合確定所述第一文章與所述第二文章之間的相關(guān)度。
[0013]可選地,前述的裝置,所述相關(guān)度確定模塊計(jì)算所述第一距離集合與所述第二距離集合的距離差,根據(jù)所述距離差確定所述第一文章與所述第二文章的相關(guān)度。
[0014]可選地,前述的裝置,還包括:第一選擇模塊,用于識(shí)別所述第一文章的類型,并從預(yù)設(shè)的標(biāo)桿文章集合中選擇具有相對(duì)應(yīng)類型的所述多個(gè)標(biāo)桿文章。
[0015]可選地,前述的裝置,還包括:第二選擇模塊,用于獲取所述第一文章中的關(guān)鍵詞,并從預(yù)設(shè)的標(biāo)桿文章集合中選擇具有所述關(guān)鍵詞的所述多個(gè)標(biāo)桿文章。
[0016]可選地,前述的裝置,所述第一比較模塊獲取所述第一文章的特征屬性,并根據(jù)述第一文章的特征屬性生成所述第一文章對(duì)應(yīng)的向量,將所述第一文章對(duì)應(yīng)的向量與預(yù)設(shè)的所述多個(gè)標(biāo)桿文章對(duì)應(yīng)的向量進(jìn)行比較;所述第二比較模塊獲取所述第二文章的特征屬性,并根據(jù)述第二文章的特征屬性生成所述第二文章對(duì)應(yīng)的向量,并將所述第二文章對(duì)應(yīng)的向量與所述多個(gè)標(biāo)桿文章對(duì)應(yīng)的向量進(jìn)行比較。
[0017]可選地,前述的裝置,所述第一比較模塊對(duì)所述第一文章進(jìn)行分詞得到多個(gè)詞,計(jì)算所述第一文章的多個(gè)詞的詞頻,作為所述第一文章的特征屬性;所述第二比較模塊對(duì)所述第二文章進(jìn)行分詞得到多個(gè)詞,計(jì)算所述第二文章的多個(gè)詞的詞頻,作為所述第二文章的特征屬性。
[0018]可選地,前述的裝置,還包括:設(shè)置模塊,用于在所述距離差均位于預(yù)設(shè)區(qū)間時(shí),將所述第二文章設(shè)置為所述第一文章的相關(guān)文章,以用于在需推送所述第一文章的相關(guān)文章時(shí)推送所述第二文章。
[0019]根據(jù)以上技術(shù)方案,本發(fā)明的基于多標(biāo)桿確定文章相關(guān)性的方法和裝置至少具有以下優(yōu)點(diǎn):
[0020]根據(jù)本發(fā)明的技術(shù)方案,當(dāng)需要分析多個(gè)文章之間的相關(guān)性時(shí),不必進(jìn)行多個(gè)文章之間的對(duì)比,而是進(jìn)行多個(gè)文章與標(biāo)桿文章之間的比較,如果兩個(gè)文章與標(biāo)桿文章之間的距離相似,則說明兩個(gè)文章之間具有一定的類似程度;由于多個(gè)標(biāo)桿文章是固定的,而其他文章不需要進(jìn)行互相之間的對(duì)比,只需要進(jìn)行與標(biāo)桿文章的對(duì)比,即可確定多個(gè)文章之間的相關(guān)性,所以根據(jù)本發(fā)明的技術(shù)方案獲取相關(guān)文章的效率非常高;多個(gè)標(biāo)桿文章的存在,使得得到的第一距離集合、第二距離集合更能反映第一文章、第二文章的特點(diǎn),進(jìn)而根據(jù)第一距離集合、第二距離集合計(jì)算的相關(guān)度更加準(zhǔn)確。
[0021]上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的【具體實(shí)施方式】。
【附圖說明】
[0022]通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
[0023]圖1示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的基于多標(biāo)桿確定文章相關(guān)性的方法的流程圖;
[0024]圖2示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的基于多標(biāo)桿確定文章相關(guān)性的裝置的框
當(dāng)前第1頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
清苑县| 丽江市| 亚东县| 东海县| 安庆市| 沁水县| 莆田市| 凯里市| 闽清县| 资中县| 巴彦淖尔市| 沈阳市| 静安区| 永安市| 海城市| 施秉县| 滁州市| 西丰县| 什邡市| 松桃| 凤冈县| 莒南县| 定兴县| 河源市| 洪洞县| 大冶市| 乐都县| 新疆| 曲阳县| 金坛市| 彭山县| 禄劝| 新晃| 福建省| 夏邑县| 滨海县| 石河子市| 鄄城县| 乐至县| 五莲县| 晴隆县|