技術(shù)編號(hào):12665985
提示:您尚未登錄,請(qǐng)點(diǎn) 登 陸 后下載,如果您還沒有賬戶請(qǐng)點(diǎn) 注 冊(cè) ,登陸完成后,請(qǐng)刷新本頁(yè)查看技術(shù)詳細(xì)信息。本發(fā)明涉及語(yǔ)義分析技術(shù)領(lǐng)域,尤其涉及一種新型大規(guī)模文檔主題語(yǔ)義分析方法及系統(tǒng)。背景技術(shù)大數(shù)據(jù)時(shí)代,文檔數(shù)量以不曾出現(xiàn)的驚人速度增長(zhǎng),超出人工處理的時(shí)間和精力成本。日常生活中積累的大量數(shù)據(jù)資料:從文本文件到辦公文件,以及圖片、圖像、影像和音頻等以文檔為主要形式的數(shù)據(jù)往往得不到充分利用,而這些文檔中又存在著大量可以挖掘和學(xué)習(xí)的信息。對(duì)于數(shù)據(jù)當(dāng)中潛藏著巨大的信息價(jià)值,人們無(wú)從下手的原因,一是文檔類型和文檔來(lái)源的多樣性,二是文檔內(nèi)容的高緯度和非結(jié)構(gòu)化的特性,關(guān)鍵是文檔數(shù)據(jù)量大。當(dāng)下,大數(shù)據(jù)分析尤其是海量...
注意:該技術(shù)已申請(qǐng)專利,請(qǐng)尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進(jìn)行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識(shí)儲(chǔ)備,不適合論文引用。
請(qǐng)注意,此類技術(shù)沒有源代碼,用于學(xué)習(xí)研究技術(shù)思路。