時(shí)間知識挖掘功能結(jié)構(gòu)如圖7所示。文獻(xiàn)發(fā)表時(shí)間綜合模塊71根據(jù)檢索信息庫中的瀏覽文獻(xiàn)列表和下載文獻(xiàn)列表,計(jì)算出讀者瀏覽文獻(xiàn)發(fā)表時(shí)間段向量72、讀者下載文獻(xiàn)發(fā)表時(shí)間段向量73及各時(shí)間段權(quán)重。發(fā)表時(shí)間段向量總合成模塊74結(jié)合瀏覽文獻(xiàn)發(fā)表時(shí)間段向量72、讀者下載文獻(xiàn)發(fā)表時(shí)間段向量73,以及檢索信息庫中的操作時(shí)間向量,合并成跟蹤時(shí)間段向量75,合并方法可以采用加權(quán)平均或其他常用方法。
[0024]檢索優(yōu)化是如何利用檢索知識模型中的知識,改善讀者下一次檢索。圖8是檢索優(yōu)化功能結(jié)構(gòu)圖。檢索優(yōu)化包括以下方法:推薦檢索詞81將檢索主題向量中的代表性詞或詞組提示給讀者,在輸入檢索詞時(shí)提供參考。推薦檢索類型范圍82將檢索類型向量中的主要類型推薦給讀者,提示是否需要將檢索限制在這些類型范圍內(nèi),以提高檢索準(zhǔn)確率。推薦檢索時(shí)間范圍83將跟蹤時(shí)間段向量中的主要時(shí)間段推薦給讀者,提示是否需要將檢索限制在這些時(shí)間范圍內(nèi),以提高檢索準(zhǔn)確率。檢索結(jié)果組織優(yōu)化84通過將檢索結(jié)果按不同檢索詞、檢索推薦詞、分類、時(shí)間段分別組織和顯示,方便讀者選擇,同時(shí)擴(kuò)展檢索思路。其他優(yōu)化85根據(jù)檢索知識模型中提供的任何知識,對后續(xù)檢索提供的其他優(yōu)化幫助。
[0025]雖然本發(fā)明所揭露的實(shí)施方式如上,但所述的內(nèi)容只是為了便于理解本發(fā)明而采用的實(shí)施方式,并非用以限定本發(fā)明。任何本發(fā)明所屬技術(shù)領(lǐng)域內(nèi)的技術(shù)人員,在不脫離本發(fā)明所揭露的精神和范圍的前提下,可以在實(shí)施的形式上及細(xì)節(jié)上作任何的修改與變化,但本發(fā)明的專利保護(hù)范圍,仍須以所附的權(quán)利要求書所界定的范圍為準(zhǔn)。
【主權(quán)項(xiàng)】
1.一種基于反饋的文獻(xiàn)檢索方法,其特征在于,包括:檢索過程中,記錄讀者的檢索信息,形成檢索信息庫,通過對這些檢索信息進(jìn)行動態(tài)知識挖掘,將信息轉(zhuǎn)化為檢索知識,按預(yù)定知識結(jié)構(gòu)存貯或更新到檢索知識模型中,動態(tài)反映讀者檢索需求,在后續(xù)檢索中,充分利用檢索知識模型中存貯的各種知識反饋,幫助優(yōu)化讀者的檢索式構(gòu)建和檢索結(jié)果展示,提尚后續(xù)的檢索性能和用戶體驗(yàn)。2.如權(quán)利要求1所述的方法,其特征在于,所述檢索信息庫記錄讀者當(dāng)前的檢索過程中產(chǎn)生的相關(guān)信息,包括:檢索詞記錄檢索式經(jīng)過分詞處理后形成的檢索詞向量,可帶權(quán)重;瀏覽文獻(xiàn)列表記錄本次檢索點(diǎn)擊瀏覽過的文獻(xiàn)標(biāo)識,形成瀏覽文獻(xiàn)向量;下載文獻(xiàn)列表記錄本次檢索讀者下載過的文獻(xiàn)標(biāo)識,形成下載文獻(xiàn)向量;操作時(shí)間記錄預(yù)先設(shè)定的不同操作類型占用的時(shí)間量或比率,用于提供檢索知識挖掘時(shí)對操作重要的挖掘依據(jù);其他信息是根據(jù)應(yīng)用記錄的其他有用信息。3.如權(quán)利要求1所述的方法,其特征在于,所述檢索知識模型用于存貯從檢索信息庫中挖掘出的各類知識,包括:檢索主題知識存貯讀者當(dāng)前檢索過程中所關(guān)注主題對應(yīng)的主題向量,對應(yīng)為帶權(quán)重的主題詞或檢索詞向量;分類知識對應(yīng)讀者當(dāng)前檢索過程中關(guān)注的主題涉及到的分類,對應(yīng)為帶權(quán)重的分類號向量;跟蹤時(shí)間時(shí)間對應(yīng)讀者當(dāng)前檢索過程中關(guān)注的主題瀏覽和下載文獻(xiàn)的新舊,對應(yīng)為帶權(quán)重的文獻(xiàn)發(fā)表時(shí)間段;其他知識是根據(jù)應(yīng)用挖掘的其他知識。4.如權(quán)利要求1所述的方法,其特征在于,所述知識挖掘是利用數(shù)據(jù)庫的元數(shù)據(jù)知識,從檢索信息庫中挖掘出檢索知識,更新到檢索知識模型中,包括:主題知識挖掘模塊完成對讀者當(dāng)前檢索主題內(nèi)容的挖掘,分類知識挖掘完成對讀者當(dāng)前檢索主題涉及分類范圍的挖掘,跟蹤時(shí)間知識挖掘完成對讀者當(dāng)前檢索所關(guān)注文獻(xiàn)發(fā)表時(shí)間段的知識挖掘,其他知識挖掘完成對應(yīng)用所需要其他知識的挖掘。5.如權(quán)利要求1、2、3和4所述的方法,其特征在于,所述主題知識挖掘?qū)崿F(xiàn)的功能包括:根據(jù)檢索信息庫中的瀏覽文獻(xiàn)列表和下載文獻(xiàn)列表,綜合計(jì)算出瀏覽文獻(xiàn)中心點(diǎn)向量和下載文獻(xiàn)中心點(diǎn)向量,結(jié)合瀏覽文獻(xiàn)中心點(diǎn)向量、下載文獻(xiàn)中心點(diǎn)向量,以及檢索信息庫中的檢索向量、操作時(shí)間向量,合并成檢索主題向量,更新到檢索知識模型中,合并方法可以采用加權(quán)平均或其他能夠反映當(dāng)前檢索主題內(nèi)容的常用方法。6.如權(quán)利要求1、2、3和4所述的方法,其特征在于,所述分類知識挖掘功能包括:根據(jù)檢索信息庫中的瀏覽文獻(xiàn)列表和下載文獻(xiàn)列表,綜合計(jì)算出瀏覽文獻(xiàn)涉及的類型向量、下載文獻(xiàn)涉及的類型向量及各類型的權(quán)重,結(jié)合瀏覽文獻(xiàn)類型向量、下載文獻(xiàn)類型向量,以及檢索信息庫中的操作時(shí)間向量,合并成類型向量,更新到檢索知識模型中,合并方法可以采用加權(quán)平均或其他常用方法。7.如權(quán)利要求1、2、3和4所述的方法,其特征在于,所述跟蹤時(shí)間知識挖掘功能包括:根據(jù)檢索信息庫中的瀏覽文獻(xiàn)列表和下載文獻(xiàn)列表,綜合計(jì)算出讀者瀏覽文獻(xiàn)發(fā)表時(shí)間段向量、讀者下載文獻(xiàn)發(fā)表時(shí)間段向量及各時(shí)間段權(quán)重,結(jié)合瀏覽文獻(xiàn)發(fā)表時(shí)間段向量、讀者下載文獻(xiàn)發(fā)表時(shí)間段向量,以及檢索信息庫中的操作時(shí)間向量,合并成跟蹤時(shí)間段向量,更新到檢索知識模型中,合并方法可以采用加權(quán)平均或其他常用方法。8.如權(quán)利要求1和4所述的方法,其特征在于,所述檢索優(yōu)化是利用檢索知識模型中的知識,改善讀者后續(xù)的檢索,優(yōu)化功能包括:推薦檢索詞將檢索主題向量中的代表性詞或詞組提示給讀者,在輸入檢索詞時(shí)提供參考;推薦檢索類型范圍將檢索類型向量中的主要類型推薦給讀者,提示是否需要將檢索限制在這些類型范圍內(nèi),以提高檢索準(zhǔn)確率;推薦檢索時(shí)間范圍將跟蹤時(shí)間段向量中的主要時(shí)間段推薦給讀者,提示是否需要將檢索限制在這些時(shí)間范圍內(nèi),以提高檢索準(zhǔn)確率;檢索結(jié)果組織優(yōu)化通過將檢索結(jié)果按不同檢索詞、檢索推薦詞、分類、時(shí)間段分別組織和顯示,方便讀者選擇,同時(shí)擴(kuò)展檢索思路;其他優(yōu)化則根據(jù)檢索知識模型中提供的任何知識,提供的其他優(yōu)化幫助。
【專利摘要】本發(fā)明旨在提出一種基于反饋的文獻(xiàn)檢索方法。讀者檢索時(shí),按預(yù)定結(jié)構(gòu)記錄檢索信息,數(shù)據(jù)庫深度加工的各類元數(shù)據(jù)知識,對初始檢索信息進(jìn)行動態(tài)知識挖掘,將信息轉(zhuǎn)化為檢索知識,按預(yù)定知識結(jié)構(gòu)存貯或更新到讀者檢索知識模型中,包括檢索主題知識、分類知識、跟蹤時(shí)間知識和其他知識。在后續(xù)的檢索過程中,將充分利用檢索知識模型中存貯的知識反饋,幫助優(yōu)化檢索式構(gòu)建和檢索結(jié)果展示,包括將檢索主題知識補(bǔ)充或推薦到檢索式中,將分類知識、跟蹤時(shí)間知識、其他知識加入到檢索范圍或者檢索結(jié)果展示中。通過不斷迭代,檢索知識模型動態(tài)反映讀者檢索需求,幫助提高后續(xù)檢索性能和用戶體驗(yàn)。
【IPC分類】G06F17/30
【公開號】CN105095469
【申請?zhí)枴緾N201510478089
【發(fā)明人】薛德軍
【申請人】薛德軍
【公開日】2015年11月25日
【申請日】2015年8月7日