技術(shù)總結(jié)
本發(fā)明公開一種基于稀疏學(xué)習(xí)理論的突發(fā)事件摘要抽取方法,包括:獲取突發(fā)事件話題,對(duì)每個(gè)突發(fā)事件話題進(jìn)行查詢擴(kuò)展,得到事件話題的擴(kuò)展話題詞項(xiàng)集合;根據(jù)每個(gè)事件查詢擴(kuò)展后的擴(kuò)展話題詞項(xiàng)對(duì)每個(gè)事件進(jìn)行檢索,獲得與每個(gè)事件話題相關(guān)的文檔集合;利用非負(fù)矩陣分解的方法依次對(duì)每個(gè)話題的文檔集合進(jìn)行特征選取和語義聚類,得到每個(gè)事件的話題聚類結(jié)果;根據(jù)最大邊緣相關(guān)性方法(MMR),從聚類結(jié)果中抽取具有代表性的句子作為最終的摘要結(jié)果。采用本發(fā)明的技術(shù)方案,在突發(fā)事件爆發(fā)時(shí),面對(duì)海量冗余的新聞報(bào)道流,為用戶提供事件發(fā)展的最新狀況信息。
技術(shù)研發(fā)人員:楊震;姚應(yīng)哲
受保護(hù)的技術(shù)使用者:北京工業(yè)大學(xué)
文檔號(hào)碼:201610841942
技術(shù)研發(fā)日:2016.09.22
技術(shù)公布日:2017.03.08