欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種FTP文件的全文檢索方法及裝置與流程

文檔序號:11432314閱讀:233來源:國知局
一種FTP文件的全文檢索方法及裝置與流程

本發(fā)明涉及計算機應(yīng)用技術(shù)領(lǐng)域,特別是涉及一種ftp文件的全文檢索方法及裝置。



背景技術(shù):

ftp,即filetransferprotocol,文件傳輸協(xié)議。支持ftp協(xié)議的服務(wù)器為ftp服務(wù)器。ftp服務(wù)器可以在互聯(lián)網(wǎng)上提供存儲空間,依照ftp協(xié)議提供服務(wù)。

用戶通過支持ftp協(xié)議的客戶機程序,可以連接到遠程主機上的ftp服務(wù)器程序,進而可以通過客戶機程序向服務(wù)器程序發(fā)出命令,如檢索命令,服務(wù)器程序執(zhí)行用戶發(fā)出的命令,將執(zhí)行結(jié)果返回給客戶機程序。

在實際應(yīng)用中,ftp服務(wù)器中存儲的文件數(shù)量較大,用戶多是通過檢索方式檢索所需的目標(biāo)文件。目前,服務(wù)器程序多是通過將目標(biāo)詞與文件名稱進行匹配,確定文件名稱包含目標(biāo)詞的文件,作為檢索結(jié)果返回給客戶機程序,輸出給用戶。

通過這種檢索方法查找到的文件較為片面,用戶的檢索體驗較差。



技術(shù)實現(xiàn)要素:

本發(fā)明的目的是提供一種ftp文件的全文檢索方法及裝置,以對ftp服務(wù)器中的文件進行全面檢索,避免檢索結(jié)果的片面性,提升用戶的檢索體驗。

為解決上述技術(shù)問題,本發(fā)明提供如下技術(shù)方案:

一種ftp文件的全文檢索方法,包括:

在達到設(shè)定的時間間隔時,確定ftp服務(wù)器中目標(biāo)目錄的新增文件;

針對每個新增文件,建立該新增文件的每個關(guān)鍵詞的數(shù)據(jù)索引;

根據(jù)建立的每個關(guān)鍵詞的數(shù)據(jù)索引,更新所述目標(biāo)目錄對應(yīng)的索引庫;

在接收到針對所述目標(biāo)目錄的目標(biāo)詞的檢索請求時,在所述索引庫中查找所述目標(biāo)詞的數(shù)據(jù)索引,生成并返回檢索結(jié)果。

在本發(fā)明的一種具體實施方式中,所述在達到設(shè)定的時間間隔時,確定ftp服務(wù)器中目標(biāo)目錄的新增文件,包括:

在達到設(shè)定的時間間隔時,獲取ftp服務(wù)器中目標(biāo)目錄的每個文件的修改時間;

針對所述目標(biāo)目錄的每個文件,如果本地配置文件中沒有記錄該文件的修改時間,或者該文件的修改時間在所述本地配置文件中記錄的該文件的修改時間之后,則確定該文件為新增文件。

在本發(fā)明的一種具體實施方式中,在所述確定該文件為新增文件之后,還包括:

在所述本地配置文件中添加或者更新該文件的修改時間。

在本發(fā)明的一種具體實施方式中,所述針對每個新增文件,建立該新增文件的每個關(guān)鍵詞的數(shù)據(jù)索引,包括:

開啟多個線程,每個線程對應(yīng)一個或多個新增文件;

針對每個新增文件,使用該新增文件對應(yīng)的線程對該新增文件進行分析,獲得該新增文件的文件內(nèi)容;

根據(jù)該新增文件的文件內(nèi)容,建立該新增文件的每個關(guān)鍵詞的數(shù)據(jù)索引。

在本發(fā)明的一種具體實施方式中,利用操作系統(tǒng)的定時任務(wù)命令確定所述時間間隔。

在本發(fā)明的一種具體實施方式中,針對每個新增文件的每個關(guān)鍵詞,該關(guān)鍵詞的數(shù)據(jù)索引包括該關(guān)鍵詞在該新增文件中出現(xiàn)的次數(shù)、出現(xiàn)的位置。

一種ftp文件的全文檢索裝置,包括:

新增文件確定模塊,用于在達到設(shè)定的時間間隔時,確定ftp服務(wù)器中目標(biāo)目錄的新增文件;

數(shù)據(jù)索引建立模塊,用于針對每個新增文件,建立該新增文件的每個關(guān)鍵詞的數(shù)據(jù)索引;

索引庫更新模塊,用于根據(jù)建立的每個關(guān)鍵詞的數(shù)據(jù)索引,更新所述目標(biāo)目錄對應(yīng)的索引庫;

檢索結(jié)果返回模塊,用于在接收到針對所述目標(biāo)目錄的目標(biāo)詞的檢索請求時,在所述索引庫中查找所述目標(biāo)詞的數(shù)據(jù)索引,生成并返回檢索結(jié)果。

在本發(fā)明的一種具體實施方式中,所述新增文件確定模塊,包括:

修改時間獲取子模塊,用于在達到設(shè)定的時間間隔時,獲取ftp服務(wù)器中目標(biāo)目錄的每個文件的修改時間;

新增文件確定子模塊,用于針對所述目標(biāo)目錄的每個文件,如果本地配置文件中沒有記錄該文件的修改時間,或者該文件的修改時間在所述本地配置文件中記錄的該文件的修改時間之后,則確定該文件為新增文件。

在本發(fā)明的一種具體實施方式中,還包括修改時間更新子模塊,用于:

在所述確定該文件為新增文件之后,在所述本地配置文件中添加或者更新該文件的修改時間。

在本發(fā)明的一種具體實施方式中,所述數(shù)據(jù)索引建立模塊,具體用于:

開啟多個線程,每個線程對應(yīng)一個或多個新增文件;

針對每個新增文件,使用該新增文件對應(yīng)的線程對該新增文件進行分析,獲得該新增文件的文件內(nèi)容;

根據(jù)該新增文件的文件內(nèi)容,建立該新增文件的每個關(guān)鍵詞的數(shù)據(jù)索引。

應(yīng)用本發(fā)明實施例所提供的技術(shù)方案,在達到設(shè)定的時間間隔時,確定ftp服務(wù)器中目標(biāo)目錄的新增文件,針對每個新增文件,建立該新增文件的每個關(guān)鍵詞的數(shù)據(jù)索引,根據(jù)建立的每個關(guān)鍵詞的數(shù)據(jù)索引,更新目標(biāo)目錄對應(yīng)的索引庫,在接收到針對目標(biāo)目錄的目標(biāo)詞的檢索請求時,在索引庫中查找目標(biāo)詞的數(shù)據(jù)索引,生成并返回檢索結(jié)果??梢詫tp服務(wù)器中的文件進行全面檢索,避免檢索結(jié)果的片面性,提升了用戶的檢索體驗。

附圖說明

為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1為本發(fā)明實施例中一種ftp文件的全文檢索方法的實施流程圖;

圖2為本發(fā)明實施例中ftp文件的全文檢索系統(tǒng)框架示意圖;

圖3為本發(fā)明實施例中一種ftp文件的全文檢索裝置的結(jié)構(gòu)示意圖。

具體實施方式

為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面結(jié)合附圖和具體實施方式對本發(fā)明作進一步的詳細說明。顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。

參見圖1所示,為本發(fā)明實施例所提供的一種ftp文件的全文檢索方法的實施流程圖,該方法可以包括以下步驟:

s110:在達到設(shè)定的時間間隔時,確定ftp服務(wù)器中目標(biāo)目錄的新增文件。

在本發(fā)明實施例中,可以預(yù)先設(shè)定獲取新增文件的時間間隔。在實際應(yīng)用中,可以按照實際情況進行設(shè)定,在用戶對ftp服務(wù)器使用較為頻繁的時段,ftp服務(wù)器中的文件變化較快,可以設(shè)定較短的時間間隔,如設(shè)定為10分鐘,在其他時段可以設(shè)定較長的時間間隔,如1小時。具體可以利用操作系統(tǒng)的定時任務(wù)命令確定時間間隔,在定時任務(wù)命令中可以包含定時參數(shù)和要啟動的獲取新增文件的任務(wù)的可執(zhí)行程序路徑,按照設(shè)定的時間參數(shù)定時啟動新增文件獲取任務(wù)。如果時間參數(shù)設(shè)置的短,則可以近乎實時地對ftp服務(wù)器目標(biāo)目錄中的新增文件進行監(jiān)控。

在達到設(shè)定的時間間隔時,可以確定ftp服務(wù)器中目標(biāo)目錄的新增文件。具體的,可以通過監(jiān)控文件變化的日志進行確定。目標(biāo)目錄為ftp服務(wù)器中預(yù)先設(shè)定的任意一個目錄。

在本發(fā)明的一種具體實施方式中,步驟s110可以包括以下步驟:

步驟一:在達到設(shè)定的時間間隔時,獲取ftp服務(wù)器中目標(biāo)目錄的每個文件的修改時間;

步驟二:針對目標(biāo)目錄的每個文件,如果本地配置文件中沒有記錄該文件的修改時間,或者該文件的修改時間在本地配置文件中記錄的該文件的修改時間之后,則確定該文件為新增文件。

為便于描述,將上述兩個步驟結(jié)合起來進行說明。

在本發(fā)明實施例中,可以通過編程語言接口獲取ftp服務(wù)器中目標(biāo)目錄的每個文件的修改時間。通過文件的修改時間可以確定文件是否為新增文件。

本地配置文件用于記錄目標(biāo)目錄中每個文件的修改時間。針對目標(biāo)目錄的每個文件,如果本地配置文件中沒有記錄該文件的修改時間,則表明之前目標(biāo)目錄中沒有該文件,可以確定該文件為新增文件,或者,如果該文件的修改時間在本地配置文件中記錄的該文件的修改時間之后,則表明該文件有新的變化,其內(nèi)容可能已經(jīng)更改,可以將該文件確定為新增文件。

針對目標(biāo)目錄的每個文件,在確定該文件為新增文件之后,可以在本地配置文件中添加或者更新該文件的修改時間,以便本地配置文件中記錄的均為每個文件的最新修改時間,方便再次達到設(shè)定的時間間隔時,依據(jù)本地配置文件中記錄的文件的修改時間,確定目標(biāo)目錄中哪些文件為新增文件。

s120:針對每個新增文件,建立該新增文件的每個關(guān)鍵詞的數(shù)據(jù)索引。

在步驟s110,確定的ftp服務(wù)器中目標(biāo)目錄的新增文件可能有一個或多個。針對每個新增文件,可以對該新增文件進行分析,獲得該新增文件的文件內(nèi)容,并提取關(guān)鍵詞,建立該新增文件的每個關(guān)鍵詞的數(shù)據(jù)索引。

在實際應(yīng)用中,針對某個新增文件,可以通過分詞技術(shù)對該新增文件的文件內(nèi)容進行分詞處理,獲得該新增文件包含的多個詞,因為“的、吧、呢”等助詞不具有實際意義,在進行數(shù)據(jù)索引時可以不考慮。也就是說,關(guān)鍵詞為新增文件中除預(yù)先設(shè)定的不具有實際意義的詞之外的詞。

在本發(fā)明的一種具體實施方式中,步驟s120可以包括以下步驟:

第一個步驟:開啟多個線程,每個線程對應(yīng)一個或多個新增文件;

第二個步驟:針對每個新增文件,使用該新增文件對應(yīng)的線程對該新增文件進行分析,獲得該新增文件的文件內(nèi)容;

第三個步驟:根據(jù)該新增文件的文件內(nèi)容,建立該新增文件的每個關(guān)鍵詞的數(shù)據(jù)索引。

為便于描述,將上述三個步驟結(jié)合起來進行說明。

在本發(fā)明實施例中,在確定的新增文件有多個的情況下,可以采用多線程方式建立每個新增文件的每個關(guān)鍵詞的數(shù)據(jù)索引。

開啟多個線程,使得每個線程對應(yīng)一個或多個新增文件。

針對每個新增文件,使用該新增文件對應(yīng)的線程對該新增文件進行分析,可以獲得該新增文件的文件內(nèi)容,根據(jù)該新增文件的文件內(nèi)容,可以提取關(guān)鍵詞,建立該新增文件的每個關(guān)鍵詞的數(shù)據(jù)索引。

針對每個新增文件的每個關(guān)鍵詞,該關(guān)鍵詞的數(shù)據(jù)索引包括該關(guān)鍵詞在該新增文件中出現(xiàn)的次數(shù)、出現(xiàn)的位置。當(dāng)然,還可以包括該關(guān)鍵詞在該新增文件中出現(xiàn)的頻率等。

s130:根據(jù)建立的每個關(guān)鍵詞的數(shù)據(jù)索引,更新目標(biāo)目錄對應(yīng)的索引庫。

在本發(fā)明實施例中,ftp服務(wù)器中每個目錄可以對應(yīng)一個索引庫。索引庫中存儲有ftp服務(wù)器中相應(yīng)目錄下每個文件的每個關(guān)鍵詞的數(shù)據(jù)索引。在步驟s120,針對每個新增文件,建立該新增文件的每個關(guān)鍵詞的數(shù)據(jù)索引后,可以根據(jù)建立的每個關(guān)鍵詞的數(shù)據(jù)索引,更新目標(biāo)目錄對應(yīng)的索引庫。以使該索引庫中包含ftp服務(wù)器目標(biāo)目錄下所有文件的每個關(guān)鍵詞的數(shù)據(jù)索引。

s140:在接收到針對所述目標(biāo)目錄的目標(biāo)詞的檢索請求時,在索引庫中查找目標(biāo)詞的數(shù)據(jù)索引,生成并返回檢索結(jié)果。

在本發(fā)明實施例中,每達到設(shè)定的時間間隔時,均可執(zhí)行以上步驟s110至步驟s130的操作,使得索引庫中可以記錄ftp服務(wù)器目標(biāo)目錄的每個新增文件的關(guān)鍵詞的數(shù)據(jù)索引。

用戶可以通過客戶機程序發(fā)送針對目標(biāo)目錄的目標(biāo)詞的檢索請求。在接收到針對目標(biāo)目錄的目標(biāo)詞的檢索請求時,可以在索引庫中將目標(biāo)詞與各關(guān)鍵詞進行匹配,查找與目標(biāo)詞匹配的關(guān)鍵詞的數(shù)據(jù)索引,并根據(jù)查找到的目標(biāo)詞的數(shù)據(jù)索引,生成檢索結(jié)果,并返回該檢索結(jié)果,以響應(yīng)檢索請求。

為方便理解,使用圖2所示系統(tǒng)框架對本發(fā)明實施例進行進一步說明。

設(shè)定定時任務(wù),對ftp服務(wù)器中文件進行定時監(jiān)控。啟動定時任務(wù),在達到設(shè)定的時間間隔時,進行ftp服務(wù)器目標(biāo)目錄中增量文件的獲取,并更新配置文件,該配置文件即為本地配置文件。多線程數(shù)據(jù)索引對增量文件列表中的增量文件進行數(shù)據(jù)索引,將數(shù)據(jù)索引存儲到全文檢索服務(wù)器中,當(dāng)用戶通過客戶機程序發(fā)送檢索請求時,可以向用戶輸出檢索結(jié)果。

應(yīng)用本發(fā)明實施例所提供的方法,在達到設(shè)定的時間間隔時,確定ftp服務(wù)器中目標(biāo)目錄的新增文件,針對每個新增文件,建立該新增文件的每個關(guān)鍵詞的數(shù)據(jù)索引,根據(jù)建立的每個關(guān)鍵詞的數(shù)據(jù)索引,更新目標(biāo)目錄對應(yīng)的索引庫,在接收到針對目標(biāo)目錄的目標(biāo)詞的檢索請求時,在索引庫中查找目標(biāo)詞的數(shù)據(jù)索引,生成并返回檢索結(jié)果??梢詫tp服務(wù)器中的文件進行全面檢索,避免檢索結(jié)果的片面性,提升了用戶的檢索體驗。

相應(yīng)于上面的方法實施例,本發(fā)明實施例還提供了一種ftp文件的全文檢索裝置,下文描述的一種ftp文件的全文檢索裝置與上文描述的一種ftp文件的全文檢索方法可相互對應(yīng)參照。

參見圖3所示,該裝置包括以下模塊:

新增文件確定模塊310,用于在達到設(shè)定的時間間隔時,確定ftp服務(wù)器中目標(biāo)目錄的新增文件;

數(shù)據(jù)索引建立模塊320,用于針對每個新增文件,建立該新增文件的每個關(guān)鍵詞的數(shù)據(jù)索引;

索引庫更新模塊330,用于根據(jù)建立的每個關(guān)鍵詞的數(shù)據(jù)索引,更新所述目標(biāo)目錄對應(yīng)的索引庫;

檢索結(jié)果返回模塊340,用于在接收到針對所述目標(biāo)目錄的目標(biāo)詞的檢索請求時,在所述索引庫中查找所述目標(biāo)詞的數(shù)據(jù)索引,生成并返回檢索結(jié)果。

應(yīng)用本發(fā)明實施例所提供的裝置,在達到設(shè)定的時間間隔時,確定ftp服務(wù)器中目標(biāo)目錄的新增文件,針對每個新增文件,建立該新增文件的每個關(guān)鍵詞的數(shù)據(jù)索引,根據(jù)建立的每個關(guān)鍵詞的數(shù)據(jù)索引,更新目標(biāo)目錄對應(yīng)的索引庫,在接收到針對目標(biāo)目錄的目標(biāo)詞的檢索請求時,在索引庫中查找目標(biāo)詞的數(shù)據(jù)索引,生成并返回檢索結(jié)果??梢詫tp服務(wù)器中的文件進行全面檢索,避免檢索結(jié)果的片面性,提升了用戶的檢索體驗。

在本發(fā)明的一種具體實施方式中,所述新增文件確定模塊310,包括:

修改時間獲取子模塊,用于在達到設(shè)定的時間間隔時,獲取ftp服務(wù)器中目標(biāo)目錄的每個文件的修改時間;

新增文件確定子模塊,用于針對所述目標(biāo)目錄的每個文件,如果本地配置文件中沒有記錄該文件的修改時間,或者該文件的修改時間在所述本地配置文件中記錄的該文件的修改時間之后,則確定該文件為新增文件。

在本發(fā)明的一種具體實施方式中,還包括修改時間更新子模塊,用于:

在所述確定該文件為新增文件之后,在所述本地配置文件中添加或者更新該文件的修改時間。

在本發(fā)明的一種具體實施方式中,所述數(shù)據(jù)索引建立模塊320,具體用于:

開啟多個線程,每個線程對應(yīng)一個或多個新增文件;

針對每個新增文件,使用該新增文件對應(yīng)的線程對該新增文件進行分析,獲得該新增文件的文件內(nèi)容;

根據(jù)該新增文件的文件內(nèi)容,建立該新增文件的每個關(guān)鍵詞的數(shù)據(jù)索引。

在本發(fā)明的一種具體實施方式中,利用操作系統(tǒng)的定時任務(wù)命令確定所述時間間隔。

在本發(fā)明的一種具體實施方式中,針對每個新增文件的每個關(guān)鍵詞,該關(guān)鍵詞的數(shù)據(jù)索引包括該關(guān)鍵詞在該新增文件中出現(xiàn)的次數(shù)、出現(xiàn)的位置。

本說明書中各個實施例采用遞進的方式描述,每個實施例重點說明的都是與其它實施例的不同之處,各個實施例之間相同或相似部分互相參見即可。對于實施例公開的裝置而言,由于其與實施例公開的方法相對應(yīng),所以描述的比較簡單,相關(guān)之處參見方法部分說明即可。

專業(yè)人員還可以進一步意識到,結(jié)合本文中所公開的實施例描述的各示例的單元及算法步驟,能夠以電子硬件、計算機軟件或者二者的結(jié)合來實現(xiàn),為了清楚地說明硬件和軟件的可互換性,在上述說明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計約束條件。專業(yè)技術(shù)人員可以對每個特定的應(yīng)用來使用不同方法來實現(xiàn)所描述的功能,但是這種實現(xiàn)不應(yīng)認為超出本發(fā)明的范圍。

結(jié)合本文中所公開的實施例描述的方法或算法的步驟可以直接用硬件、處理器執(zhí)行的軟件模塊,或者二者的結(jié)合來實施。軟件模塊可以置于隨機存儲器(ram)、內(nèi)存、只讀存儲器(rom)、電可編程rom、電可擦除可編程rom、寄存器、硬盤、可移動磁盤、cd-rom、或技術(shù)領(lǐng)域內(nèi)所公知的任意其它形式的存儲介質(zhì)中。

本文中應(yīng)用了具體個例對本發(fā)明的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本發(fā)明的技術(shù)方案及其核心思想。應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以對本發(fā)明進行若干改進和修飾,這些改進和修飾也落入本發(fā)明權(quán)利要求的保護范圍內(nèi)。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
洱源县| 宾阳县| 宜黄县| 云安县| 通州市| 壤塘县| 桓仁| 娱乐| 平果县| 文水县| 祁阳县| 临邑县| 鸡东县| 玉门市| 醴陵市| 乐平市| 连平县| 阜阳市| 汝州市| 饶平县| 龙胜| 金昌市| 辉南县| 荔浦县| 定安县| 青州市| 商河县| 克什克腾旗| 东乡族自治县| 内江市| 孟州市| 刚察县| 武夷山市| 奉化市| 承德县| 青阳县| 五台县| 安平县| 临夏市| 临夏市| 常山县|