多新聞之間相關(guān)性計(jì)算方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及計(jì)算機(jī)技術(shù)領(lǐng)域,具體而言,設(shè)及一種多新聞之間相關(guān)性計(jì)算方法和 裝置。
【背景技術(shù)】
[0002] 在互聯(lián)網(wǎng)領(lǐng)域,當(dāng)為一個(gè)新聞出現(xiàn)時(shí),通常需要為該新聞查找相關(guān)的新聞,W-并 推送給用戶。
[0003] 目前的現(xiàn)有技術(shù)中,通常是按照一個(gè)新聞中的字面內(nèi)容來查找相關(guān)新聞。運(yùn)種查 找相關(guān)新聞的方式中存在較大的缺陷:因?yàn)橄嚓P(guān)的兩個(gè)新聞之間可能語義相同而字面內(nèi)容 不同,則根據(jù)現(xiàn)有技術(shù)無法找到語義相同而字面內(nèi)容不同的新聞作為相關(guān)新聞。
【發(fā)明內(nèi)容】
[0004] 鑒于上述問題,提出了本發(fā)明W便提供一種克服上述問題或者至少部分地解決上 述問題的多新聞之間相關(guān)性計(jì)算方法和裝置。
[0005] 依據(jù)本發(fā)明的一種多新聞之間相關(guān)性計(jì)算方法,包括:確定第一新聞與第二新聞 的一級(jí)關(guān)聯(lián)關(guān)系;確定所述第二新聞與第Ξ新聞的一級(jí)關(guān)聯(lián)關(guān)系;根據(jù)所述第一新聞與所 述第二新聞的一級(jí)關(guān)聯(lián)關(guān)系、所述第二新聞與所述第Ξ新聞的一級(jí)關(guān)聯(lián)關(guān)系,建立所述第 一新聞與所述第Ξ新聞之間的二級(jí)關(guān)聯(lián)關(guān)系。
[0006] 可選地,前述的方法,確定第一新聞與第二新聞的一級(jí)關(guān)聯(lián)關(guān)系,具體包括:根據(jù) 所述第一新聞的特征屬性設(shè)置第一向量,根據(jù)所述第二新聞的特征屬性設(shè)置第二向量,計(jì) 算所述第一向量和所述第二向量的余弦相似度作為所述第一新聞與所述第二新聞的一級(jí) 關(guān)聯(lián)關(guān)系;確定所述第二新聞與第Ξ新聞的一級(jí)關(guān)聯(lián)關(guān)系,具體包括:根據(jù)所述第Ξ新聞的 特征屬性設(shè)置第Ξ向量,計(jì)算所述第二向量和所述第Ξ向量的余弦相似度作為所述第二新 聞與所述第Ξ新聞的一級(jí)關(guān)聯(lián)關(guān)系。
[0007] 可選地,前述的方法,根據(jù)所述第一新聞與所述第二新聞的一級(jí)關(guān)聯(lián)關(guān)系、所述第 二新聞與所述第Ξ新聞的一級(jí)關(guān)聯(lián)關(guān)系,建立所述第一新聞與所述第Ξ新聞之間的二級(jí)關(guān) 聯(lián)關(guān)系,具體包括:根據(jù)所述第一新聞與所述第二新聞的一級(jí)關(guān)聯(lián)關(guān)系、所述第二新聞與所 述第Ξ新聞的一級(jí)關(guān)聯(lián)關(guān)系,計(jì)算所述第一新聞與所述第Ξ新聞的信息賭;根據(jù)所述第一 新聞與所述第Ξ新聞的信息賭,確定所述第一新聞與所述第Ξ新聞的二級(jí)關(guān)聯(lián)關(guān)系。
[000引可選地,前述的方法,所述第二新聞為多個(gè);在確定所述第二新聞與第Ξ新聞的一 級(jí)關(guān)聯(lián)關(guān)系之前,還包括:根據(jù)預(yù)設(shè)規(guī)則,為每個(gè)第二新聞查找相應(yīng)的第Ξ新聞;根據(jù)所述 第一新聞與所述第Ξ新聞的信息賭,確定所述第一新聞與所述第Ξ新聞的二級(jí)關(guān)聯(lián)關(guān)系, 具體包括:根據(jù)每個(gè)第Ξ新聞對(duì)應(yīng)的第二新聞在全部第二新聞中的占比,計(jì)算所述每個(gè)第 Ξ新聞的權(quán)重值;根據(jù)所述每個(gè)第Ξ新聞的權(quán)重值、所述每個(gè)第Ξ新聞對(duì)應(yīng)的信息賭,計(jì)算 所述每個(gè)第Ξ新聞與所述第一新聞的二級(jí)關(guān)聯(lián)關(guān)系。
[0009]可選地,前述的方法,所述第Ξ新聞為多個(gè);所述方法還包括:根據(jù)所述多個(gè)第Ξ 新聞與所述第一新聞的二級(jí)關(guān)聯(lián)關(guān)系,對(duì)所述多個(gè)第Ξ新聞進(jìn)行排序。
[0010] 依據(jù)本發(fā)明的一種多新聞之間相關(guān)性計(jì)算裝置,包括:第一關(guān)聯(lián)關(guān)系確定模塊,用 于確定第一新聞與第二新聞的一級(jí)關(guān)聯(lián)關(guān)系;第二關(guān)聯(lián)關(guān)系確定模塊,確定所述第二新聞 與第Ξ新聞的一級(jí)關(guān)聯(lián)關(guān)系;第Ξ關(guān)聯(lián)關(guān)系確定模塊,根據(jù)所述第一新聞與所述第二新聞 的一級(jí)關(guān)聯(lián)關(guān)系、所述第二新聞與所述第Ξ新聞的一級(jí)關(guān)聯(lián)關(guān)系,建立所述第一新聞與所 述第Ξ新聞之間的二級(jí)關(guān)聯(lián)關(guān)系。
[0011] 可選地,前述的裝置,所述第一關(guān)聯(lián)關(guān)系確定模塊根據(jù)所述第一新聞的特征屬性 設(shè)置第一向量,根據(jù)所述第二新聞的特征屬性設(shè)置第二向量,計(jì)算所述第一向量和所述第 二向量的余弦相似度作為所述第一新聞與所述第二新聞的一級(jí)關(guān)聯(lián)關(guān)系;
[0012] 所述第二關(guān)聯(lián)關(guān)系確定模塊根據(jù)所述第Ξ新聞的特征屬性設(shè)置第Ξ向量,計(jì)算所 述第二向量和所述第Ξ向量的余弦相似度作為所述第二新聞與所述第Ξ新聞的一級(jí)關(guān)聯(lián) 關(guān)系。
[0013] 可選地,前述的裝置,所述第Ξ關(guān)聯(lián)關(guān)系確定模塊根據(jù)所述第一新聞與所述第二 新聞的一級(jí)關(guān)聯(lián)關(guān)系、所述第二新聞與所述第Ξ新聞的一級(jí)關(guān)聯(lián)關(guān)系,計(jì)算所述第一新聞 與所述第Ξ新聞的信息賭;W及根據(jù)所述第一新聞與所述第Ξ新聞的信息賭,確定所述第 一新聞與所述第Ξ新聞的二級(jí)關(guān)聯(lián)關(guān)系。
[0014] 可選地,前述的裝置,所述第二新聞為多個(gè);所述裝置還包括:查找模塊,用于根據(jù) 預(yù)設(shè)規(guī)則,為每個(gè)第二新聞查找相應(yīng)的第Ξ新聞;所述第Ξ關(guān)聯(lián)關(guān)系確定模塊根據(jù)每個(gè)第 Ξ新聞對(duì)應(yīng)的第二新聞在全部第二新聞中的占比,計(jì)算所述每個(gè)第Ξ新聞的權(quán)重值;W及 根據(jù)所述每個(gè)第Ξ新聞的權(quán)重值、所述每個(gè)第Ξ新聞對(duì)應(yīng)的信息賭,計(jì)算所述每個(gè)第Ξ新 聞與所述第一新聞的二級(jí)關(guān)聯(lián)關(guān)系。
[0015] 可選地,前述的裝置,所述第Ξ新聞為多個(gè);所述裝置還包括:排序模塊,用于根據(jù) 所述多個(gè)第Ξ新聞與所述第一新聞的二級(jí)關(guān)聯(lián)關(guān)系,對(duì)所述多個(gè)第Ξ新聞進(jìn)行排序。
[0016] 根據(jù)W上技術(shù)方案,本發(fā)明的多新聞之間相關(guān)性計(jì)算方法和裝置至少具有W下優(yōu) 占 . y ?、、·
[0017] 在本發(fā)明的技術(shù)方案中,第一新聞與第二新聞之間的一級(jí)關(guān)聯(lián)關(guān)系反映了第一新 聞與第二新聞的字面內(nèi)容之間的相似程度,第二新聞與第Ξ新聞之間的一級(jí)關(guān)聯(lián)關(guān)系反映 了第一新聞與第二新聞的字面內(nèi)容之間的相似程度,但計(jì)算得到的第一新聞與第Ξ新聞之 間的二級(jí)關(guān)聯(lián)關(guān)系不再受到字面內(nèi)容的限制,因?yàn)榈诙侣勁c第一新聞字面相似的部分、 和第二新聞與第Ξ新聞字面相似的部分可W不同,其實(shí)際上反映的是第一新聞與第Ξ新聞 的語義相似程度,所W根據(jù)本發(fā)明的建立二級(jí)關(guān)聯(lián)關(guān)系,可W查找到字面不同但語義相似 的新聞。
[0018] 上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段, 而可依照說明書的內(nèi)容予W實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠 更明顯易懂,W下特舉本發(fā)明的【具體實(shí)施方式】。
【附圖說明】
[0019] 通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通 技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明 的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
[0020] 圖1示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的多新聞之間相關(guān)性計(jì)算方法的流程圖;
[0021] 圖2示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的多新聞之間相關(guān)性計(jì)算方法的流程圖;
[0022] 圖3示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的多新聞之間相關(guān)性計(jì)算方法的原理圖;
[0023] 圖4示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的多新聞之間相關(guān)性計(jì)算裝置的框圖;
[0024] 圖5示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的多新聞之間相關(guān)性計(jì)算裝置的框圖。
【具體實(shí)施方式】
[0025] 下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開 的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可各種形式實(shí)現(xiàn)本公開而不應(yīng)被運(yùn)里闡述的實(shí)施例 所限制。相反,提供運(yùn)些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍 完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0026] 如圖1所示,本發(fā)明的一個(gè)實(shí)施例中提供了一種多新聞之間相關(guān)性計(jì)算方法,包 括:
[0027] 步驟110,確定第一新聞與第二新聞的一級(jí)關(guān)聯(lián)關(guān)系。在本實(shí)施例中,第一新聞與 第二新聞之間的一級(jí)關(guān)聯(lián)關(guān)系反映了第一新聞與第二新聞的字面內(nèi)容之間的相似程度。 [00%]步驟120,確定第二新聞與第Ξ新聞的一級(jí)關(guān)聯(lián)關(guān)系。第二新聞與第Ξ新聞之間的 一級(jí)關(guān)聯(lián)關(guān)系反映了第一新聞與第二新聞的字面內(nèi)容之間的相似程度。
[0029] 步驟130,根據(jù)第一新聞與第二新聞的一級(jí)關(guān)聯(lián)關(guān)系、第二新聞與第Ξ新聞的一級(jí) 關(guān)聯(lián)關(guān)系,建立第一新聞與第Ξ新聞之間的二級(jí)關(guān)聯(lián)關(guān)系。根據(jù)本實(shí)施的技術(shù)方案,計(jì)算得 到的第一新聞與第Ξ新聞之間的二級(jí)關(guān)聯(lián)關(guān)系不再受到字面內(nèi)容的限制,因?yàn)榈诙侣勁c 第一新聞字面相似的部分、和第二新聞與第Ξ新聞字面相似的部分可W不同,其實(shí)際上反 映的是第一新聞與第Ξ新聞的語義相似程度,所W根據(jù)本發(fā)明的建立二級(jí)關(guān)聯(lián)關(guān)系,可W 查找到字面不同但語義相似的新聞。
[0030] 本發(fā)明的一個(gè)實(shí)施例中還提供了一種多新聞之間相關(guān)性計(jì)算方法,相比于前述的 實(shí)施例,本實(shí)施例的多新聞之間相關(guān)性計(jì)算方法,步驟110,具體包括:
[0031] 根據(jù)第一新聞的特征屬性設(shè)置第一向量,根據(jù)第二新聞的特征屬性設(shè)置第二向 量,計(jì)算第一向量和第二向量的余弦相似度作為第一新聞與第二新