欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種生成文檔索引的方法和裝置以及一種搜索方法和裝置的制造方法_2

文檔序號:8395988閱讀:來源:國知局
需要記錄的相關(guān)信息時,才在所述第二索引表中進(jìn)行記錄。
[0067]圖3所示的裝置,將位置以及與位置相關(guān)的信息分離存儲,使得在索引中擴(kuò)展與位置相關(guān)的信息更加方便靈活,且只有實(shí)際存在的與位置相關(guān)的信息才占用存儲空間,避免了存儲資源的浪費(fèi)。
[0068]在本發(fā)明的一個實(shí)施例中,第二索引表生成單元320,適于在第二索引表中,以三元組的形式記錄與位置相關(guān)的信息;
[0069]其中,所述三元組由以下三元構(gòu)成:與位置相關(guān)的信息的開始位置,與位置相關(guān)的信息的長度;與位置相關(guān)的信息的類型。
[0070]三元組具體可表示為〈start,len, type〉。
[0071]Start表示與位置相關(guān)的信息的開始位置,如書名號的起始位置;
[0072]Ien表示與位置相關(guān)的信息的長度,如書名號的長度;
[0073]type表示與位置相關(guān)的信息的類型,如該相關(guān)的信息為書名號。
[0074]在本發(fā)明的一個實(shí)施例中,所述第一索引表生成單元310,適于將每個位置用16比特位來記錄;所述第二索引表生成單元320,適于將與位置相關(guān)的信息的開始位置用16比特位來記錄,將與位置相關(guān)的信息的長度用8比特位來記錄,適于與將位置相關(guān)的信息的類型用8比特位來記錄。
[0075]同時,只有當(dāng)文檔包括特征的與位置相關(guān)的信息時才在第二索引表中存儲,不存在浪費(fèi)。因此相對于傳統(tǒng)的實(shí)現(xiàn)方式,能夠節(jié)約至少40%的索引空間。并且與位置相關(guān)的信息在存儲上與位置分離,實(shí)際上使得位置相關(guān)信息的擴(kuò)展更加靈活方便。
[0076]圖4示出了根據(jù)本發(fā)明一個實(shí)施例的一種搜索裝置的結(jié)構(gòu)圖。如圖4所示,該搜索裝置400包括:
[0077]接收單元410,適于接收搜索請求方發(fā)來的搜索詞;
[0078]搜索單元420,,適于根據(jù)第一索引表找到搜索詞在文檔中的位置,以及根據(jù)第二索引表找到與搜索詞在文檔中的位置相關(guān)的信息;其中,第一索引表用于記錄詞以及該詞在文檔中的位置,第二索引表用于記錄位置以及與位置相關(guān)的信息;
[0079]發(fā)送單元430,適于基于所述搜索詞對應(yīng)的文檔中的位置和與位置相關(guān)的信息,將所述文檔作為搜索結(jié)果返回給搜索請求方。
[0080]圖4所示的裝置能夠給搜索請求方返回給基于置和與位置相關(guān)的信息的搜索結(jié)果,并且與位置相關(guān)的信息與位置分離存儲,位置相關(guān)信息的擴(kuò)展更加靈活,且大大節(jié)省了索引空間。
[0081]綜上所述,根據(jù)本發(fā)明的這種生成以文檔中的詞為索引的第一索引表,用于記錄詞以及該詞在文檔中的位置,生成以文檔中的位置為索引的第二索引表,用于記錄位置以及與位置相關(guān)的信息,其中,只有文檔中的一個位置具有需要記錄的與該位置相關(guān)信息時,才在所述第二索引表中進(jìn)行記錄的技術(shù)方案,將位置以及與位置相關(guān)的信息分離存儲,使得在索引中擴(kuò)展與位置相關(guān)的信息更加方便靈活,且只有實(shí)際存在的與位置相關(guān)的信息才占用存儲空間,避免了存儲資源的浪費(fèi)。
[0082]需要說明的是:
[0083]在此提供的算法和顯示不與任何特定計(jì)算機(jī)、虛擬裝置或者其它設(shè)備固有相關(guān)。各種通用裝置也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類裝置所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對任何特定編程語言。應(yīng)當(dāng)明白,可以利用各種編程語言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對特定語言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。
[0084]在此處所提供的說明書中,說明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對本說明書的理解。
[0085]類似地,應(yīng)當(dāng)理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在上面對本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實(shí)施例、圖、或者對其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實(shí)施例的所有特征。因此,遵循【具體實(shí)施方式】的權(quán)利要求書由此明確地并入該【具體實(shí)施方式】,其中每個權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。
[0086]本領(lǐng)域那些技術(shù)人員可以理解,可以對實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們設(shè)置在與該實(shí)施例不同的一個或多個設(shè)備中。可以把實(shí)施例中的模塊或單元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進(jìn)行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。
[0087]此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來使用。
[0088]本發(fā)明的各個部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個或者多個處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號處理器(DSP)來實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的生成文檔索引的裝置和搜索裝置中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。
[0089]應(yīng)該注意的是上述實(shí)施例對本發(fā)明進(jìn)行說明而不是對本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號之間的任何參考符號構(gòu)造成對權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個可以是通過同一個硬件項(xiàng)來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
【主權(quán)項(xiàng)】
1.一種生成文檔索引的方法,其中,該方法包括: 生成以文檔中的詞為索引的第一索引表,用于記錄詞以及該詞在文檔中的位置;生成以文檔中的位置為索引的第二索引表,用于記錄位置以及與位置相關(guān)的信息;其中,只有文檔中的一個位置具有需要記錄的與該位置相關(guān)信息時,才在所述第二索引表中進(jìn)行記錄。
2.如權(quán)利要求1所述的方法,其中,所述生成以文檔中的位置為索引的第二索引表,用于記錄位置以及與位置相關(guān)的信息包括: 在第二索引表中,以三元組的形式記錄與位置相關(guān)的信息; 所述三元組由以下三元構(gòu)成:與位置相關(guān)的信息的開始位置;與位置相關(guān)的信息的長度;與位置相關(guān)的信息的類型。
3.如權(quán)利要求2所述的方法,其中, 所述每個位置由16比特位來記錄; 所述與位置相關(guān)的信息的開始位置由16比特位來記錄; 所述與位置相關(guān)的信息的長度由8比特位來記錄; 所述與位置相關(guān)的信息的類型由8比特位來記錄。
4.一種搜索方法,其中,該方法包括: 接收搜索請求方發(fā)來的搜索詞; 根據(jù)第一索引表找到搜索詞在文檔中的位置;其中,第一索引表用于記錄詞以及該詞在文檔中的位置; 根據(jù)第二索引表找到與搜索詞在文檔中的位置相關(guān)的信息;其中,第二索引表用于記錄位置以及與位置相關(guān)的信息; 基于所述搜索詞對應(yīng)的文檔中的位置和與位置相關(guān)的信息,將所述文檔作為搜索結(jié)果返回給搜索請求方。
5.一種生成文檔索引的裝置,其中,該裝置包括: 第一索引表生成單元,適于生成以文檔中的詞為索引的第一索引表,用于記錄詞以及該詞在文檔中的位置; 第二索引表生成單元,適于生成以文檔中的位置為索引的第二索引表,用于記錄位置以及與位置相關(guān)的信息;其中,只有文檔中的一個位置具有需要記錄的相關(guān)信息時,才在所述第二索引表中進(jìn)行記錄。
6.如權(quán)利要求5所述的裝置,其中 第二索引表生成單元,適于在第二索引表中,以三元組的形式記錄與位置相關(guān)的信息; 其中,所述三元組由以下三元構(gòu)成:與位置相關(guān)的信息的開始位置,與位置相關(guān)的信息的長度;與位置相關(guān)的信息的類型。
7.如權(quán)利要求6所述的裝置,其中, 所述第一索引表生成單元,適于將每個位置用16比特位來記錄; 所述第二索引表生成單元,適于將與位置相關(guān)的信息的開始位置用16比特位來記錄,將與位置相關(guān)的信息的長度用8比特位來記錄,適于與將位置相關(guān)的信息的類型用8比特位來記錄。
8.一種搜索裝置,其中,該裝置包括: 接收單元,適于接收搜索請求方發(fā)來的搜索詞; 搜索單元,適于根據(jù)第一索引表找到搜索詞在文檔中的位置,以及根據(jù)第二索引表找到與搜索詞在文檔中的位置相關(guān)的信息;其中,第一索引表用于記錄詞以及該詞在文檔中的位置,第二索引表用于記錄位置以及與位置相關(guān)的信息; 發(fā)送單元,適于基于所述搜索詞對應(yīng)的文檔中的位置和與位置相關(guān)的信息,將所述文檔作為搜索結(jié)果返回給搜索請求方。
【專利摘要】本發(fā)明公開了一種生成文檔索引的方法和裝置以及一種搜索方法和裝置。所述方法包括:生成以文檔中的詞為索引的第一索引表,用于記錄詞以及該詞在文檔中的位置,生成以文檔中的位置為索引的第二索引表,用于記錄位置以及與位置相關(guān)的信息,其中,只有文檔中的一個位置具有需要記錄的與該位置相關(guān)信息時,才在所述第二索引表中進(jìn)行記錄。本發(fā)明的技術(shù)方案,將位置以及與位置相關(guān)的信息分離存儲,使得在索引中擴(kuò)展與位置相關(guān)的信息更加方便靈活,且只有實(shí)際存在的與位置相關(guān)的信息才占用存儲空間,避免了存儲資源的浪費(fèi)。
【IPC分類】G06F17-30
【公開號】CN104715068
【申請?zhí)枴緾N201510150540
【發(fā)明人】陳進(jìn)平, 董毅
【申請人】北京奇虎科技有限公司, 奇智軟件(北京)有限公司
【公開日】2015年6月17日
【申請日】2015年3月31日
當(dāng)前第2頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
越西县| 柏乡县| 龙泉市| 仁化县| 洛阳市| 贡山| 砀山县| 临江市| 封开县| 合江县| 湘阴县| 太保市| 富锦市| 厦门市| 抚州市| 腾冲县| 黑龙江省| 天全县| 揭西县| 淮滨县| 浑源县| 永修县| 勐海县| 平邑县| 耿马| 潞城市| 鸡泽县| 洛阳市| 米脂县| 孟村| 普兰县| 西乡县| 康乐县| 英山县| 青河县| 西林县| 石阡县| 那曲县| 威宁| 阜新市| 法库县|