欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

多標(biāo)桿確定文章相關(guān)性的方法和裝置的制造方法_3

文檔序號(hào):9765934閱讀:來源:國(guó)知局
以選定作為標(biāo)桿文章。
[0048]第二比較模塊220,用于將第二文章與多個(gè)標(biāo)桿文章進(jìn)行比較,得到第二文章與多個(gè)標(biāo)桿文章的第二距離集合。
[0049]相關(guān)度確定模塊230,用于基于第一距離集合與第二距離集合確定第一文章與第二文章之間的相關(guān)度。在本實(shí)施例中,距離反映了文章之間的差別,本實(shí)施例對(duì)計(jì)算距離的方式不進(jìn)行限制;由于多個(gè)標(biāo)桿文章是固定的,可以理解多個(gè)標(biāo)桿文章以及第一距離集合共同體現(xiàn)了第一文章的特點(diǎn),多個(gè)標(biāo)桿文章和第二距離集合共同體現(xiàn)了第二文章的特點(diǎn),進(jìn)而可以分析第一文章和第二文章的相似度。
[0050]本發(fā)明的一個(gè)實(shí)施例中還提供了一種基于多標(biāo)桿確定文章相關(guān)性的裝置,相比于前述的實(shí)施例,本實(shí)施例的一種基于多標(biāo)桿確定文章相關(guān)性的裝置,相關(guān)度確定模塊230計(jì)算第一距離集合與第二距離集合的距離差,根據(jù)距離差確定第一文章與第二文章的相關(guān)度。根據(jù)本實(shí)施例的技術(shù)方案,多個(gè)標(biāo)桿文章以及第一距離集合共同體現(xiàn)了第一文章的特點(diǎn),多個(gè)標(biāo)桿文章和第二距離集合共同體現(xiàn)了第二文章的特點(diǎn),那么第一距離集合與第二距離集合的距離差則反映了第一文章與第二文章的區(qū)別,可知距離差較大時(shí)第一文章和第二文章相關(guān)度較低,距離差較小時(shí)第一文章和第二文章相關(guān)度較高。例如,標(biāo)桿文章簡(jiǎn)化為《明星A新片尺度大職場(chǎng)御姐范兒就得這么穿》,那么文章a《明星A新片尺度大一集親熱數(shù)次》、文章b《明星A最新新片劇照有范兒》與其距離分別為4、3,距離差為I較?。欢恼耤《大牌就得這么穿》和標(biāo)桿文章距離也為4,這時(shí)再來一篇標(biāo)桿文章《明星A新片上映賣座》與文章a、文章b距離都為2,與文章c距離為0,這樣就體現(xiàn)除了文章a、b與文章c的區(qū)別,由此可見采用多個(gè)標(biāo)桿文章能夠更精準(zhǔn)地識(shí)別文章之間的相關(guān)度。
[0051]如圖3所示,本發(fā)明的一個(gè)實(shí)施例中還提供了一種基于多標(biāo)桿確定文章相關(guān)性的裝置,相比于前述的實(shí)施例,本實(shí)施例的一種基于多標(biāo)桿確定文章相關(guān)性的裝置,還包括:
[0052]第一選擇模塊310,用于識(shí)別第一文章的類型,并從預(yù)設(shè)的標(biāo)桿文章集合中選擇具有相對(duì)應(yīng)類型的多個(gè)標(biāo)桿文章。在本實(shí)施例中,如果第一文章、第二文章與某個(gè)標(biāo)桿文章之間的距離過大,只能說明第一文章、第二文章與該標(biāo)桿文章均有很大不同,但難以說明第一文章、第二文章之間的相關(guān)性如何;而同類型的文章之間具有較高的相關(guān)性,則本實(shí)施例使得第一文章與該標(biāo)桿文章之間的距離較小,說明第一文章與某個(gè)標(biāo)桿文章相關(guān)性較高,則第二文章與某個(gè)標(biāo)桿文章距離大則相當(dāng)于與第一文章距離大,即第一文章與第二文章相關(guān)性較弱,第二文章與標(biāo)桿文章距離小則相當(dāng)于與第一文章距離小,即第一文章與第二文章相關(guān)性較強(qiáng)。例如,如果第一文章為體育文章,則選取的多個(gè)標(biāo)桿文章為體育文章。
[0053]如圖3所示,本發(fā)明的一個(gè)實(shí)施例中還提供了一種基于多標(biāo)桿確定文章相關(guān)性的裝置,相比于前述的實(shí)施例,本實(shí)施例的一種基于多標(biāo)桿確定文章相關(guān)性的裝置,還包括:
[0054]第二選擇模塊320,用于獲取第一文章中的關(guān)鍵詞,并從預(yù)設(shè)的標(biāo)桿文章集合中選擇具有關(guān)鍵詞的多個(gè)標(biāo)桿文章。在本實(shí)施例中,如果第一文章、第二文章與某個(gè)標(biāo)桿文章之間的距離過大,只能說明第一文章、第二文章與該標(biāo)桿文章均有很大不同,但難以說明第一文章、第二文章之間的相關(guān)性如何;而同類型的文章之間具有較高的相關(guān)性,則本實(shí)施例使得第一文章與該標(biāo)桿文章之間的距離較小,說明第一文章與某個(gè)標(biāo)桿文章相關(guān)性較高,則第二文章與某個(gè)標(biāo)桿文章距離大則相當(dāng)于與第一文章距離大,即第一文章與第二文章相關(guān)性較弱,第二文章與標(biāo)桿文章距離小則相當(dāng)于與第一文章距離小,即第一文章與第二文章相關(guān)性較強(qiáng)。例如,如果第一文章的標(biāo)題為《明星A獲獎(jiǎng)》,則選取的標(biāo)桿文章可以是《明星A全紀(jì)錄》、《明星A的經(jīng)歷》,關(guān)鍵詞是明星A。
[0055]本發(fā)明的一個(gè)實(shí)施例中還提供了一種基于多標(biāo)桿確定文章相關(guān)性的裝置,相比于前述的實(shí)施例,本實(shí)施例的一種基于多標(biāo)桿確定文章相關(guān)性的裝置,第一比較模塊210獲取第一文章的特征屬性,并根據(jù)述第一文章的特征屬性生成第一文章對(duì)應(yīng)的向量,將第一文章對(duì)應(yīng)的向量與預(yù)設(shè)的多個(gè)標(biāo)桿文章對(duì)應(yīng)的向量進(jìn)行比較;第二比較模塊220獲取第二文章的特征屬性,并根據(jù)述第二文章的特征屬性生成第二文章對(duì)應(yīng)的向量,并將第二文章對(duì)應(yīng)的向量與多個(gè)標(biāo)桿文章對(duì)應(yīng)的向量進(jìn)行比較。在本實(shí)施例中,對(duì)特征屬性不進(jìn)行限制;利用文章的一個(gè)或多個(gè)特征屬性,容易將文章量化為數(shù)字,能夠更容易、更精確地計(jì)算文章之間的距離。
[0056]本發(fā)明的一個(gè)實(shí)施例中還提供了一種基于多標(biāo)桿確定文章相關(guān)性的裝置,相比于前述的實(shí)施例,本實(shí)施例的一種基于多標(biāo)桿確定文章相關(guān)性的裝置,第一比較模塊210對(duì)第一文章進(jìn)行分詞得到多個(gè)詞,計(jì)算第一文章的多個(gè)詞的詞頻,作為第一文章的特征屬性;第二比較模塊220對(duì)第二文章進(jìn)行分詞得到多個(gè)詞,計(jì)算第二文章的多個(gè)詞的詞頻,作為第二文章的特征屬性。在本實(shí)施例中,根據(jù)計(jì)算得到的詞頻,為第一文章構(gòu)造出一個(gè)文章向量;同樣地,第二文章、標(biāo)桿文章也可以構(gòu)造相應(yīng)的文章向量。
[0057]本發(fā)明的一個(gè)實(shí)施例中還提供了一種基于多標(biāo)桿確定文章相關(guān)性的裝置,相比于前述的實(shí)施例,本實(shí)施例的一種基于多標(biāo)桿確定文章相關(guān)性的裝置,還包括:設(shè)置模塊330,用于在距離差均位于預(yù)設(shè)區(qū)間時(shí),將第二文章設(shè)置為第一文章的相關(guān)文章,以用于在需推送第一文章的相關(guān)文章時(shí)推送第二文章。在本實(shí)施例中,在距離差位于預(yù)設(shè)區(qū)間時(shí),將第二文章設(shè)置為第一文章的相關(guān)文章,以用于在需推送第一文章的相關(guān)文章時(shí)推送第二文章。
[0058]在此提供的算法和顯示不與任何特定計(jì)算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對(duì)任何特定編程語言。應(yīng)當(dāng)明白,可以利用各種編程語言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對(duì)特定語言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。
[0059]在此處所提供的說明書中,說明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說明書的理解。
[0060]類似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本公開并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個(gè)實(shí)施例的所有特征。因此,遵循【具體實(shí)施方式】的權(quán)利要求書由此明確地并入該【具體實(shí)施方
當(dāng)前第3頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
通化县| 砚山县| 广西| 凤山县| 稻城县| 通江县| 萍乡市| 龙川县| 集安市| 长乐市| 孝义市| 青阳县| 潮州市| 吉首市| 博罗县| 龙川县| 双桥区| 岳池县| 高阳县| 乌鲁木齐市| 赤城县| 克什克腾旗| 武冈市| 贵定县| 靖西县| 兴宁市| 康保县| 余庆县| 教育| 铁力市| 永州市| 临夏县| 田林县| 乃东县| 黔江区| 建平县| 德兴市| 海城市| 平江县| 扎兰屯市| 家居|