欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種信息碎片關(guān)聯(lián)輸出的方法及系統(tǒng)的制作方法

文檔序號:6524802閱讀:203來源:國知局
一種信息碎片關(guān)聯(lián)輸出的方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種信息碎片關(guān)聯(lián)輸出的方法及系統(tǒng),包括:識別用戶選取的多個信息碎片的文本內(nèi)容,將得到的所有信息碎片的文本內(nèi)容進行歸集存儲;將每兩個所述信息碎片的文本內(nèi)容進行相似度計算,得到信息碎片與信息碎片的相似度;在用戶選取要查看的信息碎片后,建立文檔顯示該信息碎片的文本內(nèi)容,以及將其它信息碎片的文本內(nèi)容以所述相似度的大小順序在所述文檔中顯示。本發(fā)明通過識別信息碎片的同時,自動將識別出的信息碎片的文本內(nèi)容儲存,使復(fù)雜繁瑣的操作大大簡化,并且通過為信息碎片之間建立關(guān)聯(lián),降低了以此用戶閱讀、識別帶來的思維精力損耗。
【專利說明】一種信息碎片關(guān)聯(lián)輸出的方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種計算機領(lǐng)域,具體而言,涉及一種信息碎片關(guān)聯(lián)輸出的方法及系統(tǒng)。
【背景技術(shù)】
[0002]當(dāng)前,隨著互聯(lián)網(wǎng)時代的到來,當(dāng)需要完成一個報告或者撰寫一篇文檔的時候,往往要對信息進行收集許多信息大多都以碎片的方式分散在不同的地方,找到后需要對整篇文稿進行復(fù)制、粘貼等操作收集文本內(nèi)容,當(dāng)碎片信息通過系統(tǒng)收集后,帶來另一個問題是這些大規(guī)模的信息碎片是凌亂的,我們需要把這些大量、凌亂的信息按一定規(guī)則進行歸整,以此降低閱讀、識別帶來的思維精力損耗,進一步提升碎片歸整的效率。
【發(fā)明內(nèi)容】

[0003]本發(fā)明旨在提供一種信息碎片關(guān)聯(lián)輸出的方法及系統(tǒng),以解決上述現(xiàn)有技術(shù)中選取的信息碎片不易整理的問題。
[0004]本發(fā)明公開了一種信息碎片關(guān)聯(lián)輸出的方法,包括:
[0005]識別用戶選取的多個信息碎片的文本內(nèi)容,將得到的所有信息碎片的文本內(nèi)容進行歸集存儲;
[0006]將任意兩個所述信息碎片的文本內(nèi)容進行相似度計算,得到任意兩個信息碎片的相似度;
[0007]在用戶選取要查看的信息碎片后,建立文檔顯示該信息碎片的文本內(nèi)容,以及將其它信息碎片的文本內(nèi)容以所述相似度的大小順序在所述文檔中顯示。
[0008]優(yōu)選地,還包括:
[0009]在得到信息碎片與信息碎片的所述相似度后,對于每一個所述信息碎片篩選出與該信息碎片的所述相似度在預(yù)先設(shè)定的第一閾值范圍內(nèi)的其他信息碎片,將篩選出的其他信息碎片與該信息碎片關(guān)聯(lián);
[0010]在所述文檔中顯示所述用戶選取的信息碎片的文本內(nèi)容,以及將與該信息碎片關(guān)聯(lián)的其他信息碎片的文本內(nèi)容以所述相似度的大小順序在所述文檔中顯示。
[0011]優(yōu)選地,所述相似度計算的過程包括:
[0012]選取所述信息碎片中的第一信息碎片D1和第二信息碎片D2 ;
[0013]根據(jù)所述第一信息碎片的文本內(nèi)容和第二信息碎片的文本內(nèi)容,分別確定詞頻高于預(yù)先設(shè)定的第二閥值的關(guān)鍵字/詞作為特征項;
[0014]建立所述第一信息碎片的第一特征集,如下:
[0015]D1= {Tn,W11; T12,W12;……;Tln, W1J ;
[0016]其中,Tln為D1的所述特征項,Wln為根據(jù)詞頻確定的權(quán)重,η為第一特征集中特征項的序號;
[0017]建立所述第二信息碎片的第二特征集,如下:[0018]D2 = {T21,W21 ;T22, W22 ;......;T2m, W2J ;
[0019]其中,Tlm為D2的所述特征項,Wlm為根據(jù)詞頻確定的權(quán)重,η為第二特征集中特征項的序號;
[0020]利用余弦公式計算得到兩個所述信息碎片的所述相似度,所述余弦公式如下:
【權(quán)利要求】
1.一種信息碎片關(guān)聯(lián)輸出的方法,其特征在于,包括: 識別用戶選取的多個信息碎片的文本內(nèi)容,將得到的所有信息碎片的文本內(nèi)容進行歸集存儲; 將任意兩個所述信息碎片的文本內(nèi)容進行相似度計算,得到任意兩個信息碎片的相似度; 在用戶選取要查看的信息碎片后,建立文檔顯示該信息碎片的文本內(nèi)容,以及將其它信息碎片的文本內(nèi)容以所述相似度的大小順序在所述文檔中顯示。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 在得到信息碎片與信息碎片的所述相似度后,對于每一個所述信息碎片篩選出與該信息碎片的所述相似度在預(yù)先設(shè)定的第一閾值范圍內(nèi)的其他信息碎片,將篩選出的其他信息碎片與該信息碎片關(guān)聯(lián); 在所述文檔中顯示所述用戶選取的信息碎片的文本內(nèi)容,以及將與該信息碎片關(guān)聯(lián)的其他信息碎片的文本內(nèi)容以所述相似度的大小順序在所述文檔中顯示。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述相似度計算的過程包括: 選取所述信息碎片中的第一信息碎片D1和第二信息碎片D2 ; 根據(jù)所述第一信息碎片的文本內(nèi)容和第二信息碎片的文本內(nèi)容,分別確定詞頻高于預(yù)先設(shè)定的第二閥值的關(guān)鍵字/詞作為特征項; 建立所述第一信息碎片的第一特征集,如下:`
D1= On,W11;T12,W12;……;Tln, W1J ; 其中,Tln為D1的所述特征項,Wln為根據(jù)詞頻確定的權(quán)重,η為第一特征集中特征項的序號; 建立所述第二信息碎片的第二特征集,如下:
— {T21,W21 ;T22,W22 ;......;T2m,W2m}; 其中,Tlffl為D2的所述特征項,Wlffl為根據(jù)詞頻確定的權(quán)重,m為第二特征集中特征項的序號; 利用余弦公式計算得到兩個所述信息碎片的所述相似度,所述余弦公式如下: Sim(D I, D ?) = cos Θ — f [k-1 w^ x w^k =;



N 其中,所述Sim(Dl,D2)為兩個所述信息碎片的所述相似度,k為特征項的序號。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 為所述歸集存儲的所有信息碎片建立索引目錄; 所述用戶通過在所述索引目錄中選取所述要查看的信息碎片。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,在用戶選取信息碎片后,識別每個信息碎片的信息來源; 每個所述信息碎片的文本內(nèi)容和信息來源具有映射關(guān)系; 在顯示所述信息碎片的文本內(nèi)容的同時,顯示該信息碎片的信息來源。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述信息碎片包括:文本格式和圖片格式。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,還包括: 通過用戶觸發(fā)的多個中的一個全局熱鍵,調(diào)用出相應(yīng)的選取功能,選取文本格式或圖片格式的所述信息碎片。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括 在識別用戶選取的多個信息碎片的文本內(nèi)容后,將每個所述信息碎片的文本內(nèi)容進行對比,在檢測出文本內(nèi)容重復(fù)的情況下,提示用戶是否將文本內(nèi)容重復(fù)部分繼續(xù)進行歸集處理; 并根據(jù)用戶的選擇,繼續(xù)進行所述歸集處理或保留一份所述文本內(nèi)容重復(fù)部分進行歸集處理。
9.一種信息碎片關(guān)聯(lián)輸出的系統(tǒng),其特征在于,包括: 信息識別模塊,用于識別用戶選取的信息碎片的文本內(nèi)容和信息來源,并將識別后的文本內(nèi)容和信息來源放入相應(yīng)的數(shù)據(jù)庫中進行歸集存儲; 所述數(shù)據(jù)庫包括:用于存儲信息碎片的文本內(nèi)容的第一數(shù)據(jù)庫和用于存儲信息碎片的信息來源的第二數(shù)據(jù)庫;同一個信息碎片的文本內(nèi)容和信息來源在兩個數(shù)據(jù)庫中具有映射關(guān)系; 目錄索引模塊,用于為所述數(shù)據(jù)庫中的所有信息碎片建立索引目錄,供用戶選擇; 文檔關(guān)聯(lián)模塊,用于計算每兩個信息碎片的相似度; 文檔輸出模塊,用于將用戶選擇的所述信息碎片的文本內(nèi)容和信息來源,以用戶選定的文檔格式顯示,以及將其它信息碎片的文本內(nèi)容以所述相似度的大小順序在所述文檔中顯不O
10.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,還包括: 解析模塊,用于識別用戶觸發(fā)的全局熱鍵,將識別出的全局熱鍵映射的控制指令發(fā)送給相應(yīng)的選取模塊,提供用戶相應(yīng)的選取功能; 信息查重模塊,用于將通過所述信息識別模塊識別出的文本內(nèi)容之間進行比對,在檢測出文本內(nèi)容重復(fù)的情況下,提示用戶是否將文本內(nèi)容重復(fù)部分繼續(xù)進行歸集處理;并根據(jù)用戶的選擇,繼續(xù)進行所述歸集處理或保留一份所述文本內(nèi)容重復(fù)部分進行歸集處理。
【文檔編號】G06F17/30GK103729422SQ201310712337
【公開日】2014年4月16日 申請日期:2013年12月23日 優(yōu)先權(quán)日:2013年12月23日
【發(fā)明者】江潮 申請人:武漢傳神信息技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
昆明市| 芮城县| 越西县| 北宁市| 伊吾县| 阿巴嘎旗| 三河市| 区。| 荣昌县| 三门峡市| 平泉县| 平原县| 余姚市| 昭苏县| 正镶白旗| 修水县| 信阳市| 岱山县| 竹溪县| 万荣县| 泸州市| 荔浦县| 光泽县| 正定县| 象州县| 玛多县| 江津市| 崇阳县| 高青县| 惠东县| 台江县| 资溪县| 剑阁县| 安溪县| 宝应县| 双牌县| 襄城县| 咸宁市| 惠州市| 庆元县| 油尖旺区|