欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種數(shù)據(jù)搜索方法及系統(tǒng)的制作方法

文檔序號:6332642閱讀:146來源:國知局
專利名稱:一種數(shù)據(jù)搜索方法及系統(tǒng)的制作方法
技術領域
本發(fā)明涉及通信技術領域中的數(shù)據(jù)搜索技術領域,尤其涉及一種數(shù)據(jù)搜索方法及系統(tǒng)。
背景技術
隨著計算機硬件和互聯(lián)網(wǎng)的飛速發(fā)展,用戶迫切的希望從海量互聯(lián)網(wǎng)網(wǎng)頁中獲取有用信息,進而出現(xiàn)了傳統(tǒng)的互聯(lián)網(wǎng)搜索引擎技術,它負責采集海量的互聯(lián)網(wǎng)網(wǎng)頁,通過分析和處理,為網(wǎng)頁建立關鍵字到網(wǎng)頁的索引,并采用分布式的檢索架構,為用戶提供實時的搜索服務。但是,隨著信息量的日益增長,搜索引擎所采集到的互聯(lián)網(wǎng)網(wǎng)頁劇增,且網(wǎng)頁所表示的信息多種多樣,進而導致采集的大量網(wǎng)頁的信息雜亂無章,而用戶從這些雜亂無章的網(wǎng)頁中進行搜索,所獲得的搜索結果往往并非用戶實際想要獲知的信息。所以,目前的互聯(lián)網(wǎng)搜索引擎技術無法高效的為用戶提供準確的信息搜索。

發(fā)明內(nèi)容
本發(fā)明實施例提供一種數(shù)據(jù)搜索方法及系統(tǒng),用以解決現(xiàn)有技術中存在的無法為用戶提供準確信息搜索的問題。本發(fā)明實施例提供一種數(shù)據(jù)搜索方法,包括采集網(wǎng)頁數(shù)據(jù)和專業(yè)數(shù)據(jù);根據(jù)采集的網(wǎng)頁數(shù)據(jù)和專業(yè)數(shù)據(jù)分別建立網(wǎng)頁數(shù)據(jù)記錄庫和專業(yè)數(shù)據(jù)記錄庫,所述網(wǎng)頁數(shù)據(jù)記錄庫中包括若干個網(wǎng)頁數(shù)據(jù)記錄,所述專業(yè)數(shù)據(jù)記錄庫中包括若干個專業(yè)數(shù)據(jù)記錄;分別建立關鍵字與網(wǎng)頁數(shù)據(jù)記錄的第一索引和關鍵字與專業(yè)數(shù)據(jù)記錄的第二索引;在接收到用戶的第一搜索請求后,按照所述第一搜索請求中攜帶的檢索關鍵字查詢建立的第一索引和第二索引,獲得與所述檢索關鍵字對應的各網(wǎng)頁數(shù)據(jù)記錄和各專業(yè)數(shù)據(jù)記錄;將獲得的所述各網(wǎng)頁數(shù)據(jù)記錄和所述各專業(yè)數(shù)據(jù)記錄作為第一搜索結果返回給用戶。本發(fā)明實施例還提供一種數(shù)據(jù)搜索系統(tǒng),包括第一采集建立服務器,用于采集網(wǎng)頁數(shù)據(jù);并根據(jù)采集的網(wǎng)頁數(shù)據(jù)建立網(wǎng)頁數(shù)據(jù)記錄庫,所述網(wǎng)頁數(shù)據(jù)記錄庫中包括若干個網(wǎng)頁數(shù)據(jù)記錄;第二采集建立服務器,用于采集專業(yè)數(shù)據(jù);并根據(jù)采集的專業(yè)數(shù)據(jù)建立專業(yè)數(shù)據(jù)記錄庫,所述專業(yè)數(shù)據(jù)記錄庫中包括若干個專業(yè)數(shù)據(jù)記錄;索引建立服務器,用于分別建立關鍵字與網(wǎng)頁數(shù)據(jù)記錄的第一索引和關鍵字與專業(yè)數(shù)據(jù)記錄的第二索引;
5
檢索服務器,用于在接收到用戶的第一搜索請求后,按照所述第一搜索請求中攜帶的檢索關鍵字查詢建立的第一索引和第二索引,獲得與所述檢索關鍵字對應的各網(wǎng)頁數(shù)據(jù)記錄和各專業(yè)數(shù)據(jù)記錄;搜索前臺服務器,用于將獲得的所述各網(wǎng)頁數(shù)據(jù)記錄和所述各專業(yè)數(shù)據(jù)記錄作為第一搜索結果返回給用戶。本發(fā)明實施例提供的方法中,除采集網(wǎng)頁數(shù)據(jù),并根據(jù)采集的網(wǎng)頁數(shù)據(jù)建立網(wǎng)頁數(shù)據(jù)記錄庫,并建立關鍵字與網(wǎng)頁數(shù)據(jù)記錄的第一索引外,還采集專業(yè)數(shù)據(jù),并根據(jù)采集的專業(yè)數(shù)據(jù)建立關鍵字與專業(yè)數(shù)據(jù)記錄的第二索引,當接收到用戶的第一搜索請求后,按照第一搜索請求中攜帶的檢索關鍵字查詢建立的第一索引和第二索引,獲得與檢索關鍵字對應的各網(wǎng)頁數(shù)據(jù)記錄和各專業(yè)數(shù)據(jù)記錄,并將獲得的各網(wǎng)頁數(shù)據(jù)記錄和各專業(yè)數(shù)據(jù)記錄作為第一搜索結果返回給用戶。由于專業(yè)數(shù)據(jù)是對某一領域的原始數(shù)據(jù)經(jīng)過分析、總結和編撰等處理后得到的有指導意義的數(shù)據(jù),相比網(wǎng)頁數(shù)據(jù),其表達的信息更全面、更準確,也更貼近檢索關鍵字的含義,所以,采用本發(fā)明實施例提供的方法,不僅能夠搜索到互聯(lián)網(wǎng)的網(wǎng)頁數(shù)據(jù)記錄,還可以搜索到專業(yè)數(shù)據(jù)記錄,相比現(xiàn)有技術,能夠為用戶提供更準確的信息搜索。


圖1為本發(fā)明實施例提供的數(shù)據(jù)搜索方法流程圖;圖2為本發(fā)明實施例提供的數(shù)據(jù)搜索系統(tǒng)的結構示意圖;圖3為本發(fā)明實施例提供的數(shù)據(jù)搜索方法的詳細流程圖。
具體實施例方式為了給出為用戶提供更準確信息搜索的實現(xiàn)方案,本發(fā)明實施例提供了一種數(shù)據(jù)搜索方法及系統(tǒng),以下結合說明書附圖對本發(fā)明的優(yōu)選實施例進行說明,應當理解,此處所描述的優(yōu)選實施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。并且在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。本發(fā)明實施例提供一種數(shù)據(jù)搜索方法,如圖1所示,包括步驟S101、采集網(wǎng)頁數(shù)據(jù)和專業(yè)數(shù)據(jù)。步驟S102、根據(jù)采集的網(wǎng)頁數(shù)據(jù)和專業(yè)數(shù)據(jù)分別建立網(wǎng)頁數(shù)據(jù)記錄庫和專業(yè)數(shù)據(jù)記錄庫,其中,網(wǎng)頁數(shù)據(jù)記錄庫中包括若干個網(wǎng)頁數(shù)據(jù)記錄,專業(yè)數(shù)據(jù)記錄庫中包括若干個專業(yè)數(shù)據(jù)記錄。步驟S103、分別建立關鍵字與網(wǎng)頁數(shù)據(jù)記錄的第一索引和關鍵字與專業(yè)數(shù)據(jù)記錄的第二索引。步驟S104、在接收到用戶的第一搜索請求后,按照第一搜索請求中攜帶的檢索關鍵字查詢建立的第一索引和第二索引,獲得與檢索關鍵字對應的各網(wǎng)頁數(shù)據(jù)記錄和各專業(yè)數(shù)據(jù)記錄。步驟S105、將獲得的各網(wǎng)頁數(shù)據(jù)記錄和各專業(yè)數(shù)據(jù)記錄作為第一搜索結果返回給用戶。較佳的,上述數(shù)據(jù)檢索方法中,建立的專業(yè)數(shù)據(jù)記錄庫可以有多個,并且是對應每個專業(yè)數(shù)據(jù)記錄庫,分別建立關鍵字與該專業(yè)數(shù)據(jù)記錄庫中的專業(yè)數(shù)據(jù)記錄的第二索引, 以及在確定檢索關鍵字對應的各專業(yè)數(shù)據(jù)記錄時,是查詢與第一搜索請求所指示的專業(yè)數(shù)據(jù)庫對應的第二索引。較佳的,上述數(shù)據(jù)檢索方法中,在將搜索結果返回給用戶之前,還可以包括確定出通過查詢獲得的各網(wǎng)頁數(shù)據(jù)記錄和各專業(yè)數(shù)據(jù)記錄的排序分值,并按照各自的排序分值從高到低的順序返回給用戶。較佳的,上述數(shù)據(jù)檢索方法中,還可以包括選擇專業(yè)數(shù)據(jù)記錄作為數(shù)據(jù)加工算法的先驗數(shù)據(jù),對若干個網(wǎng)頁數(shù)據(jù)記錄和/或若干個專業(yè)數(shù)據(jù)記錄進行加工,得到加工后的數(shù)據(jù)記錄,并建立關鍵字與加工后的數(shù)據(jù)記錄的索引,為用戶提供加工后的數(shù)據(jù)記錄的搜索?;谕话l(fā)明構思,根據(jù)本發(fā)明上述實施例提供的數(shù)據(jù)搜索方法,相應地,本發(fā)明實施例還提供了一種數(shù)據(jù)搜索系統(tǒng),其結構示意圖如圖2所示,包括第一采集建立服務器 201、第二采集建立服務器202、索引建立服務器203、檢索服務器204、搜索前臺服務器205 和加工服務器206。下面結合附圖,基于本發(fā)明實施例提供的圖2所示的數(shù)據(jù)搜索系統(tǒng)所包括的各服務器,對本發(fā)明提供的數(shù)據(jù)檢索方法進行詳細描述。圖3所示為本發(fā)明實施例提供的數(shù)據(jù)搜索方法的詳細流程圖,包括步驟S301、第一采集建立服務器201采集網(wǎng)頁數(shù)據(jù),并根據(jù)采集的網(wǎng)頁數(shù)據(jù)建立網(wǎng)頁數(shù)據(jù)記錄庫,網(wǎng)頁數(shù)據(jù)記錄庫中包括若干個網(wǎng)頁數(shù)據(jù)記錄。本步驟的實現(xiàn),具體如下第一采集建立服務器201根據(jù)注入到系統(tǒng)的種子URL,首先采集種子URL對應的網(wǎng)頁,分析其網(wǎng)頁內(nèi)容和其中包含的網(wǎng)頁鏈接,并根據(jù)新發(fā)現(xiàn)的網(wǎng)頁鏈接,以蔓延的方式采集整個互聯(lián)網(wǎng)的網(wǎng)頁數(shù)據(jù);根據(jù)采集的網(wǎng)頁數(shù)據(jù)建立網(wǎng)頁數(shù)據(jù)記錄庫,其中包括若干個網(wǎng)頁數(shù)據(jù)記錄,每個網(wǎng)頁數(shù)據(jù)記錄與每個網(wǎng)頁相對應,每個網(wǎng)頁數(shù)據(jù)記錄可以包括記錄標識、對應網(wǎng)頁的 URL、記錄標題、記錄正文等字段。第二采集建立服務器202采集專業(yè)數(shù)據(jù);并根據(jù)采集的專業(yè)數(shù)據(jù)建立專業(yè)數(shù)據(jù)記錄庫,專業(yè)數(shù)據(jù)記錄庫中包括若干個專業(yè)數(shù)據(jù)記錄。本步驟的實現(xiàn),具體如下第二采集建立服務器202從專業(yè)數(shù)據(jù)源采集專業(yè)數(shù)據(jù),專業(yè)數(shù)據(jù)一般是對某一領域的原始數(shù)據(jù)經(jīng)過人工分析、總結和編撰等處理后得到的有指導意義的數(shù)據(jù),例如,高校的科技信息數(shù)據(jù)(論文、研究報告等)、某領域?qū)I(yè)機構的行業(yè)報告、互聯(lián)網(wǎng)發(fā)展趨勢報告等。 專業(yè)數(shù)據(jù)源中以各種方式存放這些專業(yè)數(shù)據(jù),比如FTP方式、數(shù)據(jù)庫方式等,針對不同存放方式的專業(yè)數(shù)據(jù)源使用不同的采集方式,比如,對于數(shù)據(jù)庫,可以利用JDBC等方式來采集, 對于FTP,可以重新編寫爬蟲采集。將采集的各種形式的專業(yè)數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一的數(shù)據(jù)格式,建立專業(yè)數(shù)據(jù)記錄庫,以便后續(xù)統(tǒng)一建立索引并檢索,其中包括若干個專業(yè)數(shù)據(jù)記錄,每個專業(yè)數(shù)據(jù)記錄可以包括 記錄標識、記錄標題和記錄內(nèi)容等字段;進一步的根據(jù)需要還可以包括記錄創(chuàng)建時間、記錄修改時間和記錄創(chuàng)建人等。
7
較佳的,本步驟可以對應不同的專業(yè)數(shù)據(jù)源采集專業(yè)數(shù)據(jù),并建立對應的專業(yè)數(shù)據(jù)記錄庫,即可以建立多個專業(yè)數(shù)據(jù)記錄庫。由于不同的專業(yè)數(shù)據(jù)源中的專業(yè)數(shù)據(jù)所表示的信息所屬領域或所屬含義不同,所以不同的專業(yè)數(shù)據(jù)記錄庫中的專業(yè)數(shù)據(jù)記錄也對應表示了不同的含義。步驟S302、較佳的,本發(fā)明實施例中,還可以選擇專業(yè)數(shù)據(jù)記錄庫中的多個專業(yè)數(shù)據(jù)記錄作為數(shù)據(jù)加工算法的先驗數(shù)據(jù),對網(wǎng)頁數(shù)據(jù)庫中的若干個網(wǎng)頁數(shù)據(jù)記錄進行數(shù)據(jù)加工,或者對專業(yè)數(shù)據(jù)庫中的若干個專業(yè)數(shù)據(jù)記錄進行數(shù)據(jù)加工,或者對兩者均進行數(shù)據(jù)加工,并對應得到加工后的數(shù)據(jù)記錄,保存在加工數(shù)據(jù)記錄庫中,以便后續(xù)為用戶提供更準確的搜索結果,數(shù)據(jù)加工的具體方式可以為對若干個數(shù)據(jù)記錄進行分類操作或聚類操作。是否進行數(shù)據(jù)加工,具體可以根據(jù)系統(tǒng)開發(fā)者的需要靈活設置,在此不再進行詳細描述。由于進行數(shù)據(jù)加工時是以多個專業(yè)數(shù)據(jù)記錄作為數(shù)據(jù)加工算法的先驗數(shù)據(jù),而專業(yè)數(shù)據(jù)記錄相比網(wǎng)頁數(shù)據(jù)記錄其表示的信息更全面、也更準確,所以將其作為數(shù)據(jù)加工算法的先驗數(shù)據(jù)對若干個網(wǎng)頁數(shù)據(jù)記錄進行數(shù)據(jù)加工,能夠獲得更好的數(shù)據(jù)加工結果,例如, 使得對若干個網(wǎng)頁數(shù)據(jù)記錄的分類或聚類時,得到的分類結果或聚類結果更合理、也更準確。具體的數(shù)據(jù)加工算法可以采用現(xiàn)有技術中的各種算法,例如,對于分類操作,可以采用C45或樸素貝葉斯算法,首先將專業(yè)數(shù)據(jù)記錄按照其來源可靠性和優(yōu)質(zhì)度,賦予不同的較高權值,將網(wǎng)頁數(shù)據(jù)記錄則賦予相對較低權值,然后將若干個專業(yè)數(shù)據(jù)記錄與若干個網(wǎng)頁數(shù)據(jù)記錄整合到一起,形成分類算法的完整訓練集;然后按照boosting元策略進行分類模型的迭代訓練,每輪迭代中由于專業(yè)數(shù)據(jù)記錄具有較高權重,所以訓練所得分類模型將偏重于保證專業(yè)數(shù)據(jù)記錄不被錯誤分類,所以,與不結合專業(yè)數(shù)據(jù)記錄,僅用從互聯(lián)網(wǎng)采集到的低可靠性網(wǎng)頁數(shù)據(jù)記錄進行訓練所得分類模型相比,本方法所得分類模型將具有更好的分類準確度,達到更好的分類效果。再例如,對于聚類操作,可以采用K-均值算法,K-均值算法為從數(shù)據(jù)集中選擇k個數(shù)據(jù)記錄作為聚類中心,按距離測度分配每個數(shù)據(jù)記錄到其最接近的聚類中心,并使數(shù)據(jù)集聚類中心迭代地更新,直至不再變化,即完成整個數(shù)據(jù)集中所有數(shù)據(jù)記錄的聚類操作,具體步驟如下步驟A-初始化聚類中心從包括S個數(shù)據(jù)記錄的數(shù)據(jù)集中隨機選擇k個數(shù)據(jù)記錄作為中心點。步驟B-分配全部數(shù)據(jù)記錄對數(shù)據(jù)集中的每個數(shù)據(jù)記錄,計算出其與每個中心點的距離,并將其分配到距離最近的中心點所代表的聚類簇中。步驟C-重新計算聚類中心對每個聚類簇,分別計算該聚類簇內(nèi)所有數(shù)據(jù)記錄的平均值,作為該聚類簇更新后的中心點。步驟D 若k個更新后的聚類中心中至少有1個發(fā)生變化,則跳轉(zhuǎn)至步驟B,開始新一輪分配,否則,聚類操作結束,以當前每個聚類簇所包括的數(shù)據(jù)記錄作為該數(shù)據(jù)集中的數(shù)據(jù)記錄的聚類操作結果。本發(fā)明實施例中,在對專業(yè)數(shù)據(jù)記錄庫中的若干個專業(yè)數(shù)據(jù)記錄進行聚類操作時,可以直接采用上述K-均值算法。
在對網(wǎng)頁數(shù)據(jù)記錄庫中的若干個網(wǎng)頁數(shù)據(jù)記錄進行聚類操作時,則選擇從專業(yè)數(shù)據(jù)記錄庫中選擇K個專業(yè)數(shù)據(jù)記錄作為聚類中心,采用上述K-均值算法進行聚類操作。具體所選擇的K個專業(yè)數(shù)據(jù)記錄可以是從專業(yè)數(shù)據(jù)記錄庫中隨機選擇的;也可以在對若干個專業(yè)數(shù)據(jù)記錄進行聚類操作后,選擇聚類操作后得到的K個聚類簇中的中心點所表征的K 個專業(yè)數(shù)據(jù)記錄,作為聚類中心。由于聚類算法中初始選擇的K個聚類中心選擇會直接影響最終聚類結果的優(yōu)劣, 而專業(yè)數(shù)據(jù)記錄相比網(wǎng)頁數(shù)據(jù)記錄其表示的信息更全面、也更準確,所以選擇K個專業(yè)數(shù)據(jù)記錄作為聚類中心,相比隨機選擇K個網(wǎng)頁數(shù)據(jù)記錄作為聚類中心對若干個網(wǎng)頁數(shù)據(jù)記錄進行聚類操作,能夠獲得更高凝聚度的聚類結果。當上述步驟S301中建立了多個專業(yè)數(shù)據(jù)記錄庫時,本步驟中的數(shù)據(jù)加工處理,可以針對每個專業(yè)數(shù)據(jù)記錄庫,選擇其中的多個專業(yè)數(shù)據(jù)記錄作為數(shù)據(jù)加工算法的先驗數(shù)據(jù),進行數(shù)據(jù)加工處理,即同樣是對網(wǎng)頁數(shù)據(jù)記錄中的若干個網(wǎng)頁數(shù)據(jù)記錄進行數(shù)據(jù)加工, 可以對應每個專業(yè)數(shù)據(jù)記錄庫,得到各自對應的加工結果。步驟S303、索引建立服務器203分別建立關鍵字與網(wǎng)頁數(shù)據(jù)記錄的第一索引和關鍵字與專業(yè)數(shù)據(jù)記錄的第二索引。本步驟的實現(xiàn),具體如下索引建立服務器203從網(wǎng)頁數(shù)據(jù)記錄庫中獲取每個網(wǎng)頁數(shù)據(jù)記錄,并根據(jù)記錄內(nèi)容進行分關鍵字,計算關鍵字頻等信息,建立網(wǎng)頁數(shù)據(jù)記錄與關鍵字的正排索引,然后反轉(zhuǎn)正排索引,建立關鍵字與網(wǎng)頁數(shù)據(jù)記錄的倒排索引,即建立了關鍵字與網(wǎng)頁數(shù)據(jù)記錄的第一索引。索引建立服務器203從專業(yè)數(shù)據(jù)記錄庫中獲取每個專業(yè)數(shù)據(jù)記錄,并根據(jù)記錄內(nèi)容進行分關鍵字,計算關鍵字頻等信息,建立專業(yè)數(shù)據(jù)記錄與關鍵字的正排索引,然后反轉(zhuǎn)正排索引,建立關鍵字與專業(yè)數(shù)據(jù)記錄的倒排索引,即建立了關鍵字與專業(yè)數(shù)據(jù)記錄的第二索引。當專業(yè)數(shù)據(jù)記錄庫為多個時,分別對應每個專業(yè)數(shù)據(jù)記錄庫建立對應的第二索引。對于已建立的索引,可以將其存儲到索引庫中,后續(xù)供檢索服務器204查詢。如果在上述步驟S302中的進行了數(shù)據(jù)加工處理,則得到對應的加工后的數(shù)據(jù)記錄,包括加工后的若干個網(wǎng)頁數(shù)據(jù)記錄和加工后的若干個專業(yè)數(shù)據(jù)記錄。當數(shù)據(jù)加工具體為分類或聚類時,則加工后的數(shù)據(jù)記錄即為完成了對若干個網(wǎng)頁數(shù)據(jù)記錄和若干個專業(yè)數(shù)據(jù)記錄的分類操作和聚類操作。相應的,針對加工后的數(shù)據(jù)記錄,索引建立服務器203還可以對其建立關鍵字與加工后的數(shù)據(jù)記錄的索引,具體包括建立關鍵字與加工后的網(wǎng)頁數(shù)據(jù)記錄的第三索引,或者建立關鍵字與加工后的專業(yè)數(shù)據(jù)記錄的第四索引,或者兩者均建立。相比第一索引和第二索引,第三索引和第四索引中的各索引記錄也是進行了分類或聚類的,以便后續(xù)為用戶提供分類搜索。通過上述步驟S301-步驟S303,即完成了關鍵字與數(shù)據(jù)記錄的索引的建立,為后續(xù)響應用戶的搜索請求,向用戶返回搜索結果做好了準確。步驟S304、搜索前臺服務器205接收用戶發(fā)送的搜索請求,并將該搜索請求轉(zhuǎn)發(fā)
9給檢索服務器204,檢索服務器204在接收到搜索請求后,從中獲取檢索關鍵字,并按照獲取的檢索關鍵字查詢索引,獲得與檢索關鍵字對應的數(shù)據(jù)記錄,并將獲得的數(shù)據(jù)記錄返回給搜索前臺服務器205。本發(fā)明實施例中,由于建立的索引可能有多個,比如包括關鍵字與網(wǎng)頁數(shù)據(jù)記錄的第一索引,關鍵字與專業(yè)數(shù)據(jù)記錄的第二索引,關鍵字與加工后的網(wǎng)頁數(shù)據(jù)記錄的第三索引,以及關鍵字與加工后的專業(yè)數(shù)據(jù)記錄的第四索引,所以,用戶的搜索請求中可以包含索引指示信息,用于指示在哪些索引中進行查詢,例如,用戶發(fā)送第一搜索請求,指示在未進行數(shù)據(jù)加工所對應建立的索引中查詢,具體可以指示在第一索引中查詢,或者在第二索引中查詢,或者在第一索引和第二索引中均查詢;用戶發(fā)送第二搜索請求,指示在進行數(shù)據(jù)加工后所對應建立的索引中查詢,具體可以指示在第三索引中查詢,或者在第四索引中查詢,或者在第三索引和第四索引中均查詢。當上述步驟S301中建立了多個專業(yè)數(shù)據(jù)記錄庫時,則可能對應每個專業(yè)數(shù)據(jù)記錄庫建立了各自的第二索引,還可能對應每個專業(yè)數(shù)據(jù)記錄庫進行數(shù)據(jù)加工后建立了各自的第四索引,所以,用戶發(fā)送的搜索請求中還可以攜帶記錄庫指示信息,用于指示專業(yè)數(shù)據(jù)記錄庫,即相當于指示從對應的第二索引或第四索引中查詢。步驟S305、搜索前臺服務器205在接收到檢索服務器返回的與搜索請求對應的各數(shù)據(jù)記錄(根據(jù)搜索請求的指示包括各網(wǎng)頁數(shù)據(jù)記錄,或者各專業(yè)數(shù)據(jù)記錄,或者兩者均有;且包括了加工后的各數(shù)據(jù)記錄)后,則將各數(shù)據(jù)記錄作為搜索結果返回給用戶,具體如下對應獲得的每個數(shù)據(jù)記錄,采用設定排序分值算法確定出該數(shù)據(jù)記錄的排序分值,并在返回搜索結果時,將獲得的各數(shù)據(jù)記錄,按照各自的排序分值從高到底的順序返回給用戶。當獲得的各數(shù)據(jù)記錄中同時包括各網(wǎng)頁數(shù)據(jù)記錄和各專業(yè)數(shù)據(jù)記錄時,可以將各網(wǎng)頁數(shù)據(jù)記錄和各專業(yè)數(shù)據(jù)記錄整合在一起,進行排序并返回給用戶,也可以對各網(wǎng)頁數(shù)據(jù)記錄和各專業(yè)數(shù)據(jù)記錄分別進行排序,并采用分欄顯示的方式返回給用戶,一欄顯示各網(wǎng)頁數(shù)據(jù)記錄,一欄顯示各專業(yè)數(shù)據(jù)記錄。當將各網(wǎng)頁數(shù)據(jù)記錄和各專業(yè)數(shù)據(jù)記錄整合在一起,進行排序并返回給用戶時, 考慮到專業(yè)數(shù)據(jù)記錄相比網(wǎng)頁數(shù)據(jù)記錄所表示的信息可能更全面,也更準確,更能夠為用戶提供其想獲取的信息,所以優(yōu)先將專業(yè)數(shù)據(jù)記錄靠前排序,具體可以通過設置設定排序分值算法中的記錄權值實現(xiàn),具體為對于獲得的各網(wǎng)頁數(shù)據(jù)記錄和各專業(yè)數(shù)據(jù)記錄中的每個數(shù)據(jù)記錄,分別對應設置記錄權值,并且使得每個專業(yè)數(shù)據(jù)記錄的記錄權值均大于每個網(wǎng)頁數(shù)據(jù)記錄的記錄權值,例如,采用如下公式計算排序分值Sd = (1+w) X Score (d);其中,d表示數(shù)據(jù)記錄d ;Score (d)表示基于數(shù)據(jù)記錄d的一些特征信息所確定的分值,如基于檢索關鍵字在數(shù)據(jù)記錄d中的關鍵字頻等信息,具體可以參照現(xiàn)有技術,在此不再進行描述;w為記錄權值。本發(fā)明實施例中,即設定各專業(yè)數(shù)據(jù)記錄的w值大于各網(wǎng)頁數(shù)據(jù)記錄的w值,例如,設置各專業(yè)數(shù)據(jù)記錄的w值的取值范圍為(a,b],設置各網(wǎng)頁數(shù)據(jù)記錄的w值的取值范圍為(0,3],且3<13,其中,a和b的確定可以根據(jù)仿真和經(jīng)驗靈活設置,在此不再進行詳細描述。步驟S306、較佳的,本發(fā)明實施例中,上述數(shù)據(jù)檢索系統(tǒng)還可以包括查詢服務器 207,直接與網(wǎng)頁數(shù)據(jù)記錄庫、專業(yè)數(shù)據(jù)記錄庫和加工數(shù)據(jù)記錄庫相連,為指定用戶提供直接從網(wǎng)頁數(shù)據(jù)記錄庫、專業(yè)數(shù)據(jù)記錄庫和加工數(shù)據(jù)記錄庫中查詢數(shù)據(jù)記錄的服務?;趯Ρ景l(fā)明上述實施例提供的數(shù)據(jù)搜索方法的詳細描述,相應地,通過對本發(fā)明實施例提供的數(shù)據(jù)搜索系統(tǒng)中的各服務器的描述,對本發(fā)明實施例提供的方案做進一步說明,如下本發(fā)明實施例提供的數(shù)據(jù)搜索系統(tǒng)中第一采集建立服務器201,用于采集網(wǎng)頁數(shù)據(jù);并根據(jù)采集的網(wǎng)頁數(shù)據(jù)建立網(wǎng)頁數(shù)據(jù)記錄庫,網(wǎng)頁數(shù)據(jù)記錄庫中包括若干個網(wǎng)頁數(shù)據(jù)記錄;第二采集建立服務器202,用于采集專業(yè)數(shù)據(jù);并根據(jù)采集的專業(yè)數(shù)據(jù)建立專業(yè)數(shù)據(jù)記錄庫,專業(yè)數(shù)據(jù)記錄庫中包括若干個專業(yè)數(shù)據(jù)記錄;索引建立服務器203,用于分別建立關鍵字與網(wǎng)頁數(shù)據(jù)記錄的第一索引和關鍵字與專業(yè)數(shù)據(jù)記錄的第二索引;檢索服務器204,用于在接收到用戶的第一搜索請求后,按照第一搜索請求中攜帶的檢索關鍵字查詢建立的第一索引和第二索引,獲得與檢索關鍵字對應的各網(wǎng)頁數(shù)據(jù)記錄和各專業(yè)數(shù)據(jù)記錄;搜索前臺服務器205,用于將獲得的各網(wǎng)頁數(shù)據(jù)記錄和各專業(yè)數(shù)據(jù)記錄作為第一搜索結果返回給用戶。較佳的,第二采集建立服務器202,具體用于建立多個專業(yè)數(shù)據(jù)記錄庫;索引建立服務器203,具體用于對應每個專業(yè)數(shù)據(jù)記錄庫,分別建立關鍵字與該專業(yè)數(shù)據(jù)記錄庫中的專業(yè)數(shù)據(jù)記錄的第二索引;檢索服務器204,具體用于根據(jù)第一搜索請求中的記錄庫指示信息,確定出記錄庫指示信息所指示的專業(yè)數(shù)據(jù)記錄庫;按照第一搜索請求中攜帶的檢索關鍵字,查詢與指示的專業(yè)數(shù)據(jù)庫對應的第二索引,獲得與檢索關鍵字對應的各專業(yè)數(shù)據(jù)記錄。較佳的,搜索前臺服務器205,還用于基于各網(wǎng)頁數(shù)據(jù)記錄和各專業(yè)數(shù)據(jù)記錄分別對應的記錄權值,采用設定排序分值算法分別確定出各網(wǎng)頁數(shù)據(jù)記錄和各專業(yè)數(shù)據(jù)記錄的排序分值;其中,每個專業(yè)數(shù)據(jù)記錄的記錄權值均大于每個網(wǎng)頁數(shù)據(jù)記錄的記錄權值并將獲得的所述各網(wǎng)頁數(shù)據(jù)記錄和各專業(yè)數(shù)據(jù)記錄,按照各自的排序分值從高到底的順序返回給用戶。較佳的,上述系統(tǒng),還包括加工服務器206,用于選擇專業(yè)數(shù)據(jù)記錄庫中的多個專業(yè)數(shù)據(jù)記錄作為數(shù)據(jù)加工算法的先驗數(shù)據(jù),利用先驗數(shù)據(jù)對若干個網(wǎng)頁數(shù)據(jù)記錄和/或?qū)θ舾蓚€專業(yè)數(shù)據(jù)記錄進行數(shù)據(jù)加工,得到加工后的若干個網(wǎng)頁數(shù)據(jù)記錄和/或加工后的若干個專業(yè)數(shù)據(jù)記錄;索引建立服務器203,還用于建立關鍵字與加工后的網(wǎng)頁數(shù)據(jù)記錄的第三索引和 /或關鍵字與加工后專業(yè)數(shù)據(jù)記錄的第四索引;檢索服務器204,還用于在接收到用戶的第二搜索請求后,按照第二搜索請求中攜帶的檢索關鍵字查詢建立的第三索引和/或第四索引,獲得與檢索關鍵字對應的各加工后的網(wǎng)頁數(shù)據(jù)記錄和/或各加工后的專業(yè)數(shù)據(jù)記錄;
搜索前臺服務器205,還用于將獲得的各加工后的網(wǎng)頁數(shù)據(jù)記錄和/或各加工后的專業(yè)數(shù)據(jù)記錄作為第二搜索結果返回給用戶。較佳的,搜索前臺服務器205,還用于基于各加工后的網(wǎng)頁數(shù)據(jù)記錄和各加工后的專業(yè)數(shù)據(jù)記錄分別對應的記錄權值,采用設定排序分值算法分別確定出各加工后的網(wǎng)頁數(shù)據(jù)記錄和各加工后的專業(yè)數(shù)據(jù)記錄的排序分值;其中,每個加工后的專業(yè)數(shù)據(jù)記錄的記錄權值均大于每個加工后的網(wǎng)頁數(shù)據(jù)記錄的記錄權值;并將獲得的各加工后的網(wǎng)頁數(shù)據(jù)記錄和/或各加工后的專業(yè)數(shù)據(jù)記錄,按照各自的排序分值從高到底的順序返回給用戶。較佳的,加工服務器206,具體用于對若干個網(wǎng)頁數(shù)據(jù)記錄進行分類或聚類操作; 和/或?qū)θ舾蓚€專業(yè)數(shù)據(jù)記錄進行分類或聚類操作。本發(fā)明上述實施例提供的數(shù)據(jù)搜索方案,可以由搜索引擎系統(tǒng)的開發(fā)者自身實現(xiàn),也可以通過在現(xiàn)有互聯(lián)網(wǎng)搜索引擎系統(tǒng)基礎上,開放其中各服務器的應用程序編程接口 API (Application Programming Interface),將其改進為支持開放架構的系統(tǒng),然后可以向指定的第三方開發(fā)者開放各服務器的API,由第三方開發(fā)者根據(jù)需要選擇專業(yè)數(shù)據(jù)源, 將專業(yè)數(shù)據(jù)的搜索引入系統(tǒng)中,實現(xiàn)本發(fā)明上述實施例提供的數(shù)據(jù)搜索方案。綜上所述,本發(fā)明實施例提供的方案,包括采集網(wǎng)頁數(shù)據(jù)和專業(yè)數(shù)據(jù);并根據(jù)采集的網(wǎng)頁數(shù)據(jù)和專業(yè)數(shù)據(jù)分別建立網(wǎng)頁數(shù)據(jù)記錄庫和專業(yè)數(shù)據(jù)記錄庫,其中,網(wǎng)頁數(shù)據(jù)記錄庫中包括若干個網(wǎng)頁數(shù)據(jù)記錄,專業(yè)數(shù)據(jù)記錄庫中包括若干個專業(yè)數(shù)據(jù)記錄;并分別建立關鍵字與網(wǎng)頁數(shù)據(jù)記錄的第一索引和關鍵字與專業(yè)數(shù)據(jù)記錄的第二索引;并在接收到用戶的第一搜索請求后,按照第一搜索請求中攜帶的檢索關鍵字查詢建立的第一索引和第二索引,獲得與檢索關鍵字對應的各網(wǎng)頁數(shù)據(jù)記錄和各專業(yè)數(shù)據(jù)記錄以及將獲得的各網(wǎng)頁數(shù)據(jù)記錄和各專業(yè)數(shù)據(jù)記錄作為第一搜索結果返回給用戶。采用本發(fā)明實施例提供的方案, 能夠為用戶提供更準確的信息搜索。顯然,本領域的技術人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權利要求及其等同技術的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
權利要求
1.一種數(shù)據(jù)搜索方法,其特征在于,包括采集網(wǎng)頁數(shù)據(jù)和專業(yè)數(shù)據(jù);根據(jù)采集的網(wǎng)頁數(shù)據(jù)和專業(yè)數(shù)據(jù)分別建立網(wǎng)頁數(shù)據(jù)記錄庫和專業(yè)數(shù)據(jù)記錄庫,所述網(wǎng)頁數(shù)據(jù)記錄庫中包括若干個網(wǎng)頁數(shù)據(jù)記錄,所述專業(yè)數(shù)據(jù)記錄庫中包括若干個專業(yè)數(shù)據(jù)記錄;分別建立關鍵字與網(wǎng)頁數(shù)據(jù)記錄的第一索引和關鍵字與專業(yè)數(shù)據(jù)記錄的第二索引;在接收到用戶的第一搜索請求后,按照所述第一搜索請求中攜帶的檢索關鍵字查詢建立的第一索引和第二索引,獲得與所述檢索關鍵字對應的各網(wǎng)頁數(shù)據(jù)記錄和各專業(yè)數(shù)據(jù)記錄;將獲得的所述各網(wǎng)頁數(shù)據(jù)記錄和所述各專業(yè)數(shù)據(jù)記錄作為第一搜索結果返回給用戶。
2.如權利要求1所述的方法,其特征在于,建立多個專業(yè)數(shù)據(jù)記錄庫;建立關鍵字與專業(yè)數(shù)據(jù)記錄的第二索引,具體為對應每個專業(yè)數(shù)據(jù)記錄庫,分別建立關鍵字與該專業(yè)數(shù)據(jù)記錄庫中的專業(yè)數(shù)據(jù)記錄的第二索引;按照所述第一搜索請求中攜帶的檢索關鍵字查詢建立的第二索引,獲得與所述檢索關鍵字對應的各專業(yè)數(shù)據(jù)記錄,具體包括根據(jù)所述第一搜索請求中的記錄庫指示信息,確定出所述記錄庫指示信息所指示的專業(yè)數(shù)據(jù)記錄庫;按照所述第一搜索請求中攜帶的檢索關鍵字,查詢與所述指示的專業(yè)數(shù)據(jù)庫對應的第二索引,獲得與所述檢索關鍵字對應的各專業(yè)數(shù)據(jù)記錄。
3.如權利要求1所述的方法,其特征在于,在將獲得的所述各網(wǎng)頁數(shù)據(jù)記錄和所述各專業(yè)數(shù)據(jù)記錄作為搜索結果返回給用戶之前,還包括基于所述各網(wǎng)頁數(shù)據(jù)記錄和所述各專業(yè)數(shù)據(jù)記錄分別對應的記錄權值,采用設定排序分值算法分別確定出所述各網(wǎng)頁數(shù)據(jù)記錄和所述各專業(yè)數(shù)據(jù)記錄的排序分值;其中,每個專業(yè)數(shù)據(jù)記錄的記錄權值均大于每個網(wǎng)頁數(shù)據(jù)記錄的記錄權值;將獲得的所述各網(wǎng)頁數(shù)據(jù)記錄和所述各專業(yè)數(shù)據(jù)記錄作為搜索結果返回給用戶,具體為將獲得的所述各網(wǎng)頁數(shù)據(jù)記錄和所述各專業(yè)數(shù)據(jù)記錄,按照各自的排序分值從高到底的順序返回給用戶。
4.如權利要求1-3任一所述的方法,其特征在于,在建立網(wǎng)頁數(shù)據(jù)記錄庫和專業(yè)數(shù)據(jù)記錄庫后,還包括選擇所述專業(yè)數(shù)據(jù)記錄庫中的多個專業(yè)數(shù)據(jù)記錄作為數(shù)據(jù)加工算法的先驗數(shù)據(jù),利用所述先驗數(shù)據(jù)對若干個網(wǎng)頁數(shù)據(jù)記錄和/或?qū)θ舾蓚€專業(yè)數(shù)據(jù)記錄進行數(shù)據(jù)加工,得到加工后的若干個網(wǎng)頁數(shù)據(jù)記錄和/或加工后的若干個專業(yè)數(shù)據(jù)記錄;建立關鍵字與加工后的網(wǎng)頁數(shù)據(jù)記錄的第三索引和/或關鍵字與加工后專業(yè)數(shù)據(jù)記錄的第四索引;在接收到用戶的第二搜索請求后,按照所述第二搜索請求中攜帶的檢索關鍵字查詢建立的第三索引和/或第四索引,獲得與所述檢索關鍵字對應的各加工后的網(wǎng)頁數(shù)據(jù)記錄和 /或各加工后的專業(yè)數(shù)據(jù)記錄;將獲得的所述各加工后的網(wǎng)頁數(shù)據(jù)記錄和/或所述各加工后的專業(yè)數(shù)據(jù)記錄作為第二搜索結果返回給用戶。
5.如權利要求4所述的方法,其特征在于,在將獲得的所述各加工后的網(wǎng)頁數(shù)據(jù)記錄和/或所述各加工后的專業(yè)數(shù)據(jù)記錄作為第二搜索結果返回給用戶之前,還包括基于所述各加工后的網(wǎng)頁數(shù)據(jù)記錄和所述各加工后的專業(yè)數(shù)據(jù)記錄分別對應的記錄權值,采用設定排序分值算法分別確定出所述各加工后的網(wǎng)頁數(shù)據(jù)記錄和所述各加工后的專業(yè)數(shù)據(jù)記錄的排序分值;其中,每個加工后的專業(yè)數(shù)據(jù)記錄的記錄權值均大于每個加工后的網(wǎng)頁數(shù)據(jù)記錄的記錄權值;將獲得的所述各加工后的網(wǎng)頁數(shù)據(jù)記錄和/或所述各加工后的專業(yè)數(shù)據(jù)記錄作為搜索結果返回給用戶,具體為將獲得的所述各加工后的網(wǎng)頁數(shù)據(jù)記錄和/或所述各加工后的專業(yè)數(shù)據(jù)記錄,按照各自的排序分值從高到底的順序返回給用戶。
6.如權利要求4所述的方法,其特征在于,對若干個網(wǎng)頁數(shù)據(jù)記錄進行數(shù)據(jù)加工和/或?qū)θ舾蓚€專業(yè)數(shù)據(jù)記錄進行加工,具體為對若干個網(wǎng)頁數(shù)據(jù)記錄進行分類或聚類操作;和/或?qū)θ舾蓚€專業(yè)數(shù)據(jù)記錄進行分類或聚類操作。
7.一種數(shù)據(jù)搜索系統(tǒng),其特征在于,包括第一采集建立服務器,用于采集網(wǎng)頁數(shù)據(jù);并根據(jù)采集的網(wǎng)頁數(shù)據(jù)建立網(wǎng)頁數(shù)據(jù)記錄庫,所述網(wǎng)頁數(shù)據(jù)記錄庫中包括若干個網(wǎng)頁數(shù)據(jù)記錄;第二采集建立服務器,用于采集專業(yè)數(shù)據(jù);并根據(jù)采集的專業(yè)數(shù)據(jù)建立專業(yè)數(shù)據(jù)記錄庫,所述專業(yè)數(shù)據(jù)記錄庫中包括若干個專業(yè)數(shù)據(jù)記錄;索引建立服務器,用于分別建立關鍵字與網(wǎng)頁數(shù)據(jù)記錄的第一索引和關鍵字與專業(yè)數(shù)據(jù)記錄的第二索引;檢索服務器,用于在接收到用戶的第一搜索請求后,按照所述第一搜索請求中攜帶的檢索關鍵字查詢建立的第一索引和第二索引,獲得與所述檢索關鍵字對應的各網(wǎng)頁數(shù)據(jù)記錄和各專業(yè)數(shù)據(jù)記錄;搜索前臺服務器,用于將獲得的所述各網(wǎng)頁數(shù)據(jù)記錄和所述各專業(yè)數(shù)據(jù)記錄作為第一搜索結果返回給用戶。
8.如權利要求7所述的系統(tǒng),其特征在于,所述第二采集建立服務器,具體用于建立多個專業(yè)數(shù)據(jù)記錄庫;所述索引建立服務器,具體用于對應每個專業(yè)數(shù)據(jù)記錄庫,分別建立關鍵字與該專業(yè)數(shù)據(jù)記錄庫中的專業(yè)數(shù)據(jù)記錄的第二索引;所述檢索服務器,具體用于根據(jù)所述第一搜索請求中的記錄庫指示信息,確定出所述記錄庫指示信息所指示的專業(yè)數(shù)據(jù)記錄庫;按照所述第一搜索請求中攜帶的檢索關鍵字, 查詢與所述指示的專業(yè)數(shù)據(jù)庫對應的第二索引,獲得與所述檢索關鍵字對應的各專業(yè)數(shù)據(jù)記錄。
9.如權利要求7所述的系統(tǒng),其特征在于,所述搜索前臺服務器,還用于基于所述各網(wǎng)頁數(shù)據(jù)記錄和所述各專業(yè)數(shù)據(jù)記錄分別對應的記錄權值,采用設定排序分值算法分別確定出所述各網(wǎng)頁數(shù)據(jù)記錄和所述各專業(yè)數(shù)據(jù)記錄的排序分值;其中,每個專業(yè)數(shù)據(jù)記錄的記錄權值均大于每個網(wǎng)頁數(shù)據(jù)記錄的記錄權值;并將獲得的所述各網(wǎng)頁數(shù)據(jù)記錄和所述各專業(yè)數(shù)據(jù)記錄,按照各自的排序分值從高到底的順序返回給用戶。
10.如權利要求7-9任一所述的系統(tǒng),其特征在于,還包括加工服務器,用于選擇所述專業(yè)數(shù)據(jù)記錄庫中的多個專業(yè)數(shù)據(jù)記錄作為數(shù)據(jù)加工算法的先驗數(shù)據(jù),利用所述先驗數(shù)據(jù)對若干個網(wǎng)頁數(shù)據(jù)記錄和/或?qū)θ舾蓚€專業(yè)數(shù)據(jù)記錄進行數(shù)據(jù)加工,得到加工后的若干個網(wǎng)頁數(shù)據(jù)記錄和/或加工后的若干個專業(yè)數(shù)據(jù)記錄;所述索引建立服務器,還用于建立關鍵字與加工后的網(wǎng)頁數(shù)據(jù)記錄的第三索引和/或關鍵字與加工后專業(yè)數(shù)據(jù)記錄的第四索引;所述檢索服務器,還用于在接收到用戶的第二搜索請求后,按照所述第二搜索請求中攜帶的檢索關鍵字查詢建立的第三索引和/或第四索引,獲得與所述檢索關鍵字對應的各加工后的網(wǎng)頁數(shù)據(jù)記錄和/或各加工后的專業(yè)數(shù)據(jù)記錄;所述搜索前臺服務器,還用于將獲得的所述各加工后的網(wǎng)頁數(shù)據(jù)記錄和/或所述各加工后的專業(yè)數(shù)據(jù)記錄作為第二搜索結果返回給用戶。
11.如權利要求10所述的系統(tǒng),其特征在于,所述搜索前臺服務器,還用于基于所述各加工后的網(wǎng)頁數(shù)據(jù)記錄和所述各加工后的專業(yè)數(shù)據(jù)記錄分別對應的記錄權值,采用設定排序分值算法分別確定出所述各加工后的網(wǎng)頁數(shù)據(jù)記錄和所述各加工后的專業(yè)數(shù)據(jù)記錄的排序分值;其中,每個加工后的專業(yè)數(shù)據(jù)記錄的記錄權值均大于每個加工后的網(wǎng)頁數(shù)據(jù)記錄的記錄權值;并將獲得的所述各加工后的網(wǎng)頁數(shù)據(jù)記錄和/或所述各加工后的專業(yè)數(shù)據(jù)記錄,按照各自的排序分值從高到底的順序返回給用戶。
12.如權利要求10所述的系統(tǒng),其特征在于,所述加工服務器,具體用于對若干個網(wǎng)頁數(shù)據(jù)記錄進行分類或聚類操作;和/或?qū)θ舾蓚€專業(yè)數(shù)據(jù)記錄進行分類或聚類操作。
全文摘要
本發(fā)明公開了一種數(shù)據(jù)搜索方法及系統(tǒng),包括采集網(wǎng)頁數(shù)據(jù)和專業(yè)數(shù)據(jù);并根據(jù)采集的網(wǎng)頁數(shù)據(jù)和專業(yè)數(shù)據(jù)分別建立網(wǎng)頁數(shù)據(jù)記錄庫和專業(yè)數(shù)據(jù)記錄庫,其中,網(wǎng)頁數(shù)據(jù)記錄庫中包括若干個網(wǎng)頁數(shù)據(jù)記錄,專業(yè)數(shù)據(jù)記錄庫中包括若干個專業(yè)數(shù)據(jù)記錄;并分別建立關鍵字與網(wǎng)頁數(shù)據(jù)記錄的第一索引和關鍵字與專業(yè)數(shù)據(jù)記錄的第二索引;并在接收到用戶的第一搜索請求后,按照第一搜索請求中攜帶的檢索關鍵字查詢建立的第一索引和第二索引,獲得與檢索關鍵字對應的各網(wǎng)頁數(shù)據(jù)記錄和各專業(yè)數(shù)據(jù)記錄以及將獲得的各網(wǎng)頁數(shù)據(jù)記錄和各專業(yè)數(shù)據(jù)記錄作為第一搜索結果返回給用戶。采用本發(fā)明實施例提供的方案,能夠為用戶提供更準確的信息搜索。
文檔編號G06F17/30GK102411584SQ201010291290
公開日2012年4月11日 申請日期2010年9月25日 優(yōu)先權日2010年9月25日
發(fā)明者孫宏偉, 孫少陵, 羅治國, 胡珉, 鄧超, 錢嶺, 韓金宇, 黃曉慶 申請人:中國移動通信集團公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
南宫市| 凤阳县| 鸡泽县| 朔州市| 延津县| 读书| 仙居县| 常山县| 都匀市| 密云县| 岳阳市| 岳普湖县| 温州市| 东海县| 桐庐县| 平湖市| 巴林左旗| 托克托县| 福建省| 淄博市| 曲麻莱县| 高青县| 古丈县| 临朐县| 辉县市| 桃园市| 依兰县| 江口县| 加查县| 东乡族自治县| 常山县| 铁岭市| 武宁县| 托克逊县| 罗定市| 龙陵县| 昌乐县| 印江| 临安市| 察隅县| 靖江市|