欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種公式化數(shù)據(jù)的搜索方法及裝置的制作方法

文檔序號:6370004閱讀:150來源:國知局
專利名稱:一種公式化數(shù)據(jù)的搜索方法及裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及搜索引擎技術(shù),尤其涉及ー種公式化數(shù)據(jù)的搜索方法及裝置。
背景技術(shù)
隨著互聯(lián)網(wǎng)應(yīng)用的發(fā)展、以及各種類型的數(shù)字化內(nèi)容(文本、圖片、音頻和視頻等)以指數(shù)級的形式呈現(xiàn)出爆炸性的增長,如何根據(jù)用戶的輸入在海量信息中準(zhǔn)確地查找相關(guān)內(nèi)容,是ー個(gè)非?;A(chǔ)而又具有重大意義的技術(shù)挑戰(zhàn)。目前,以Google、百度等為代表的通用搜索引擎在一定程度上已經(jīng)較好地解決了這一難題。然而以通用搜索引擎為代表及其他基于傳統(tǒng)的文本檢索系統(tǒng)的軟件、網(wǎng)絡(luò)應(yīng)用 等,在針對各類數(shù)理化公式及其他符號(如五線譜、化學(xué)分子式等)的捜索上仍然具有很大的局限性,從而在理科教育、科研工程甚至其他方面無法滿足用戶的搜索需求?,F(xiàn)有技術(shù)中所常用的數(shù)學(xué)捜索系統(tǒng)主要有利用文本信息檢索系統(tǒng)對數(shù)學(xué)關(guān)鍵詞捜索和對數(shù)學(xué)公式等內(nèi)容進(jìn)行粗粒度捜索。其中利用文本信息檢索系統(tǒng)對數(shù)學(xué)關(guān)鍵詞搜索是一種基于數(shù)學(xué)術(shù)語元數(shù)據(jù)搜索,可以實(shí)現(xiàn)對數(shù)學(xué)內(nèi)容進(jìn)行粗粒度捜索,這種方法無需考慮數(shù)學(xué)捜索與通用搜索的區(qū)別。這種方法通??梢酝瑫r(shí)支持文本捜索和數(shù)學(xué)公式捜索。但是不支持更高級別的數(shù)學(xué)捜索,比如要捜索a2+c=2a,其中a可以是任意相同的表達(dá)式,這種查詢就不能執(zhí)行。這種方法最大的優(yōu)勢在于依賴ー種已存在的成熟技木,但是它沒有完全支持面向數(shù)學(xué)公式的查詢。另ー種相似的思想是依靠基于XML的XQuery搜索引擎。這兩種方法的優(yōu)勢在于都依靠ー種已存在的技術(shù),但是它們都沒有提供完全面向數(shù)學(xué)的捜索方法。對數(shù)學(xué)公式等內(nèi)容進(jìn)行細(xì)粒度捜索,對數(shù)學(xué)公式的整體及部分具有一定語法結(jié)構(gòu)和語義的子公式建立索引并進(jìn)行捜索,這種方法比文本信息檢索系統(tǒng)具有更強(qiáng)大的功能,并且更加高效。比如將模式匹配應(yīng)用到基礎(chǔ)編程語言中,在數(shù)據(jù)庫中捜索數(shù)學(xué)內(nèi)容并從中搜集到結(jié)構(gòu)化元數(shù)據(jù)以進(jìn)行有效檢索。具體而言,現(xiàn)有技術(shù)中所使用的兩種數(shù)學(xué)公式捜索方法的局限性主要表現(xiàn)在以下兩個(gè)方面I.輸入障礙對于ー些簡單的如數(shù)學(xué)公式y(tǒng)=3x+5之類的公式化數(shù)據(jù),用戶可以通過鍵盤直接
輸入;而對于諸如*這類結(jié)構(gòu)性并不算復(fù)雜的公式如何準(zhǔn)確進(jìn)行輸入,則缺乏統(tǒng)ー的標(biāo)準(zhǔn)。
具有一定數(shù)學(xué)和計(jì)算機(jī)語言知識背景的專業(yè)人士可能會(huì)輸入l/sqrt(x)、l/sqrt{x}或一種出版行業(yè)通用的編輯排版的LaTeX語言的標(biāo)準(zhǔn)表達(dá)式\frac {1} {\sqrt {x}},甚至不規(guī)則
的近似輸入I/ V X以V代替根號。但對于結(jié)構(gòu)更為復(fù)雜的微積分表達(dá)式,例如f VFdx則
令用戶捉襟見肘、根本無法輸入,即使近似輸入來表達(dá)積分區(qū)間也幾乎不可能。2.搜索結(jié)果的準(zhǔn)確度和相關(guān)性現(xiàn)有基于文本的搜索引擎在針對數(shù)理化公式的捜索方面僅限于基于關(guān)鍵詞和字符串的捜索,即只能確保統(tǒng)計(jì)意義上的大致正確。然而數(shù)理化公式和符號是ー類較為特殊的、具有結(jié)構(gòu)化特征的語言,其語義依賴于特定的公式結(jié)構(gòu)例如同樣含有“x+y”,但▽X + y和2 (x+y)這兩個(gè)公式的數(shù)學(xué)意義相去甚遠(yuǎn)。因此相關(guān)的搜索算法如果僅從純文本的角度進(jìn)行字面意義上的匹配和排序,則無法確保搜索結(jié)果數(shù)學(xué)意義上的正確性,從而導(dǎo)致捜索的準(zhǔn)確性和相關(guān)度下降,且精度不能達(dá)到一定標(biāo)準(zhǔn)、捜索算法過于模糊則失去使用價(jià)值。
中急需要ー種新的針對公式化數(shù)據(jù)的搜索方法及裝置。

發(fā)明內(nèi)容
為了克服現(xiàn)有技術(shù)中存在的缺陷,本發(fā)明提供ー種公式化數(shù)據(jù)的搜索方法及裝置,該搜索方法及裝置能使用戶方便地輸入復(fù)雜公式,且針對該公式的捜索準(zhǔn)確度和相關(guān)性均能有效提高。為了實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明公開ー種公式化數(shù)據(jù)搜索裝置,包括至少ー用戶端,該用戶端包括一公式輸入模塊,用于輸入公式并轉(zhuǎn)換為一文本化編碼;ー服務(wù)器,該服務(wù)器包括一捜索模塊,該搜索模塊至少包括一數(shù)據(jù)庫用于存儲與公式對應(yīng)的文本化編碼;該搜索模塊根據(jù)該文本化編碼查詢該數(shù)據(jù)庫并將查詢結(jié)果返回該用戶端。 更進(jìn)一歩地,該公式輸入模塊包括ー輸入界面模塊,用于提供一標(biāo)準(zhǔn)的或自定義的公式元件;ー處理模塊,用于接收由該公式元件所組成的公式并將其轉(zhuǎn)換為一文本化編碼。該公式元件包括但不限于以下的ー種或幾種數(shù)學(xué)公式符號、物理符號、化學(xué)符號、化學(xué)結(jié)構(gòu)式、化學(xué)反應(yīng)式、函數(shù)圖形、五線譜、棋譜。該公式元件包括一符號以及至少ー個(gè)輸入光標(biāo),該輸入光標(biāo)用于根據(jù)用戶需要輸入一字母或數(shù)字。該搜索裝置還包括ー網(wǎng)絡(luò),該網(wǎng)絡(luò)將該文本化編碼傳送至該服務(wù)器。該搜索模塊還包括一索引。該索引的規(guī)則為將公式劃分為運(yùn)算變量、運(yùn)算符以及其他結(jié)構(gòu)類別,該公式均為由該變量、運(yùn)算符、其他結(jié)構(gòu)類別的ー種、多種或其組合所組成的表達(dá)式。該文本化編碼為LaTeX語言或MathML語言或OpenMath語言或其他用戶自定義的文本化語言。該搜索模塊中還包括ー網(wǎng)絡(luò)爬蟲進(jìn)程,用于在網(wǎng)絡(luò)中查找與公式相關(guān)的網(wǎng)頁或文檔。本發(fā)明還同時(shí)公開ー種公式化數(shù)據(jù)的搜索方法,包括輸入一公式;將該公式轉(zhuǎn)換為一文本化語言;查詢數(shù)據(jù)庫中的公式;輸出ー查詢結(jié)果。更進(jìn)一歩地,該公式包括但不限于數(shù)學(xué)公式、物理公式、化學(xué)結(jié)構(gòu)式、化學(xué)反應(yīng)式、函數(shù)圖形、五線譜、棋譜。在輸入公式之前對該數(shù)據(jù)庫中的公式進(jìn)行索引。該索引的規(guī)則為將公式劃分為運(yùn)算變量、運(yùn)算符以及其他結(jié)構(gòu)類別,該公式均為由該變量、運(yùn)算符、其他結(jié)構(gòu)類別的ー種、多種或其組合所組成的表達(dá)式。輸入一公式的過程具體包括提供一標(biāo)準(zhǔn)的或自定義的公式元件,用戶根據(jù)需要選擇該公式元件以生成一公式。輸入一公式的過程具體包括提供一標(biāo)準(zhǔn)的或自定義的公式元件,該公式元件包括符號以及至少ー個(gè)輸入光標(biāo),用戶根據(jù)需要選擇該符號以及在輸入光標(biāo)處輸入一字母或數(shù)字,以生成一公式。該查詢數(shù)據(jù)庫中的公式具體包括在輸入公式之前對該數(shù)據(jù)庫中的公式進(jìn)行索引,將該輸入公式的文本化語言在索引中進(jìn)行查詢,與該數(shù)據(jù)庫的公式進(jìn)行相似性的比較和評分。該輸出ー查詢結(jié)果具體包括將查詢結(jié)果進(jìn)行排序后呈現(xiàn)給用戶。本發(fā)明還同時(shí)公開ー種公式化數(shù)據(jù)的搜索方法,包括對數(shù)據(jù)庫中的公式按規(guī)則建立索引;輸入中英文及公式;將該輸入公式轉(zhuǎn)換為一文本化語言;將該輸入公式的文本化語言在索引中進(jìn)行查詢,與該數(shù)據(jù)庫的公式進(jìn)行相似性的比較和評分以及將該中英文進(jìn)行文本查詢;根據(jù)該評分結(jié)果進(jìn)行排序后呈現(xiàn)給用戶。
更進(jìn)一歩地,該索引的規(guī)則為將公式劃分為運(yùn)算變量、運(yùn)算符以及其他結(jié)構(gòu)類別,該公式均為由該變量、運(yùn)算符、其他結(jié)構(gòu)類別的ー種、多種或其組合所組成的表達(dá)式。該輸入公式的步驟具體包括提供一標(biāo)準(zhǔn)或自定義的公式元件,用戶根據(jù)需要選擇該公式元件以生成一公式。在對數(shù)據(jù)庫中的公式按規(guī)則建立索引前,利用網(wǎng)絡(luò)爬蟲在網(wǎng)絡(luò)中查找與公式相關(guān)的網(wǎng)頁或文檔,并將與該公式相關(guān)的網(wǎng)頁或文檔保存至該數(shù)據(jù)庫中。與現(xiàn)有技術(shù)相比較,現(xiàn)有技術(shù)中所采用的數(shù)學(xué)搜索引擎幾乎都是采用文本輸入的查詢方式,即用戶必須在輸入框里直接輸入欲查詢的各類公式和符號的LaTeX或類似語言的文本化的編碼表達(dá)式。而這類語言具有一定的專業(yè)格式和語法規(guī)范,需要用戶具有一定程度的計(jì)算機(jī)和數(shù)學(xué)方面的知識背景,從而導(dǎo)致了較高的使用門檻。本發(fā)明能有效克服普通用戶對公式輸入的障礙,同時(shí)本發(fā)明所提供的捜索方法和裝置避免了用戶在輸入公式表達(dá)式時(shí)因不規(guī)范所造成的無法搜索的問題。再次,現(xiàn)有的捜索技術(shù)只能針對公式進(jìn)行粗粒度捜索,即滿足公式相關(guān)的關(guān)鍵詞或字符串匹配即認(rèn)為捜索完成,無法從整體的捜索算法設(shè)計(jì)上確保搜索的準(zhǔn)確度和相關(guān) 性。本發(fā)明利用基于規(guī)則的索引方式,將公式作為表達(dá)式來捜索,使公式在整體識別的基礎(chǔ)上進(jìn)行索引,則不用將其“肢解”為各個(gè)部分的子公式來分別進(jìn)行比較,這樣的匹配查詢具有全局的視野、不再容易陷入傳統(tǒng)文本檢索技術(shù)中的關(guān)鍵詞匹配的“一葉障目”的模式,從而搜索命中的準(zhǔn)確率更高、相關(guān)性更強(qiáng)。最后,本發(fā)明所提供捜索方法和捜索裝置,將公式轉(zhuǎn)換為文本化編碼后,無論原來是否是平面的公式(如方程組、矩陣等),都用線性文本方式進(jìn)行表示,其存儲、查詢和比較匹配的過程都是從左至右直線型的,實(shí)現(xiàn)異常簡單;而對于采用樹形結(jié)構(gòu)來表示的公式,其查詢、遍歷和比較匹配過程都相對繁瑣,導(dǎo)致程序?qū)崿F(xiàn)較為復(fù)雜。


關(guān)于本發(fā)明的優(yōu)點(diǎn)與精神可以通過以下的發(fā)明詳述及所附圖式得到進(jìn)ー步的了解。圖I是本發(fā)明所涉及的公式化數(shù)據(jù)搜索裝置的結(jié)構(gòu)示意圖之ー;圖2是本發(fā)明所涉及的公式化數(shù)據(jù)搜索裝置的結(jié)構(gòu)示意圖之ニ ;圖3是本發(fā)明所涉及的公式化數(shù)據(jù)搜索裝置的公式編輯器的使用界面示意圖;圖4是本發(fā)明所涉及的公式化數(shù)據(jù)搜索方法的流程圖之ー;圖5是本發(fā)明所涉及的公式化數(shù)據(jù)搜索方法的流程圖之ニ ;圖6是本發(fā)明所涉及的基于規(guī)則的索引方式的規(guī)則示意表。
具體實(shí)施例方式下面結(jié)合附圖詳細(xì)說明本發(fā)明的具體實(shí)施例。圖I本發(fā)明所涉及的公式化數(shù)據(jù)搜索裝置的結(jié)構(gòu)示意圖之一。由圖I中可見,該公式化數(shù)據(jù)搜索裝置主要為ー種基于網(wǎng)絡(luò)的捜索裝置,其中,多個(gè)用戶可以同時(shí)通過網(wǎng)絡(luò)110連接。其中用戶通過瀏覽器101輸入ー待查詢公式。在本發(fā)明所介紹的技術(shù)方案中,公式是指用一定的符號表示各個(gè)量之間的一定關(guān)系的式子,常見的公式包括但不限于數(shù)學(xué)公式,如
權(quán)利要求
1.ー種公式化數(shù)據(jù)搜索裝置,其特征在于,包括 至少ー用戶端,所述用戶端包括一公式輸入模塊,用于輸入公式并轉(zhuǎn)換為一文本化編碼; 一服務(wù)器,所述服務(wù)器包括一捜索模塊,該搜索模塊至少包括一數(shù)據(jù)庫用于存儲與公式對應(yīng)的文本化編碼; 所述搜索模塊根據(jù)所述文本化編碼查詢所述數(shù)據(jù)庫并將查詢結(jié)果返回所述用戶端。
2.如權(quán)利要求I所述的公式化數(shù)據(jù)搜索裝置,其特征在于,所述公式輸入模塊包括 ー輸入界面模塊,用于提供一標(biāo)準(zhǔn)的或自定義的公式元件; ー處理模塊,用于接收由所述公式元件所組成的公式并將其轉(zhuǎn)換為一文本化編碼。
3.如權(quán)利要求2所述的公式化數(shù)據(jù)搜索裝置,其特征在于,所述公式元件包括但不限于以下的ー種或幾種數(shù)學(xué)公式符號、物理符號、化學(xué)符號、化學(xué)結(jié)構(gòu)式、化學(xué)反應(yīng)式、五線譜、函數(shù)圖形、棋譜。
4.如權(quán)利要求2所述的公式化數(shù)據(jù)搜索裝置,其特征在干,所述公式元件包括一符號以及至少ー個(gè)輸入光標(biāo),所述輸入光標(biāo)用于根據(jù)用戶需要輸入一字母或數(shù)字。
5.如權(quán)利要求I所述的公式化數(shù)據(jù)搜索裝置,其特征在于,所述搜索裝置還包括ー網(wǎng)絡(luò),所述網(wǎng)絡(luò)將所述文本化編碼傳送至所述服務(wù)器。
6.如權(quán)利要求I所述的公式化數(shù)據(jù)搜索裝置,其特征在于,所述搜索模塊還包括一索引。
7.如權(quán)利要求6所述的公式化數(shù)據(jù)搜索裝置,其特征在干,所述索引的規(guī)則為將公式劃分為運(yùn)算變量、運(yùn)算符以及其他結(jié)構(gòu)類別,所述公式均為由所述變量、運(yùn)算符、其他結(jié)構(gòu)類別的ー種、多種或其組合所組成的表達(dá)式。
8.如權(quán)利要求I所述的公式化數(shù)據(jù)搜索裝置,其特征在于,所述文本化編碼為LaTeX語言或MathML語言或OpenMath語言或其他用戶自定義的文本化語言。
9.如權(quán)利要求I所述的公式化數(shù)據(jù)搜索裝置,其特征在于,所述搜索模塊中還包括一網(wǎng)絡(luò)爬蟲進(jìn)程,用于在網(wǎng)絡(luò)中查找與公式相關(guān)的網(wǎng)頁或文檔。
10.ー種公式化數(shù)據(jù)的搜索方法,其特征在于,包括 輸入一公式; 將所述公式轉(zhuǎn)換為一文本化語言; 查詢數(shù)據(jù)庫中的公式; 輸出ー查詢結(jié)果。
11.如權(quán)利要求10所述的公式化數(shù)據(jù)的搜索方法,其特征在于,所述公式包括但不限于數(shù)學(xué)公式、物理公式、化學(xué)結(jié)構(gòu)式、化學(xué)反應(yīng)式、函數(shù)圖形、五線譜、棋譜。
12.如權(quán)利要求10所述的公式化數(shù)據(jù)的搜索方法,其特征在于,在輸入公式之前對所述數(shù)據(jù)庫中的公式進(jìn)行索引。
13.如權(quán)利要求12所述的公式化數(shù)據(jù)的搜索方法,其特征在于,所述索引的規(guī)則為將公式劃分為運(yùn)算變量、運(yùn)算符以及其他結(jié)構(gòu)類別,所述公式均為由所述變量、運(yùn)算符、其他結(jié)構(gòu)類別的ー種、多種或其組合所組成的表達(dá)式。
14.如權(quán)利要求10所述的公式化數(shù)據(jù)的搜索方法,其特征在于,輸入一公式的過程具體包括提供一標(biāo)準(zhǔn)的或自定義的公式元件,用戶根據(jù)需要選擇所述公式元件以生成一公式。
15.如權(quán)利要求10所述的公式化數(shù)據(jù)的搜索方法,其特征在于,輸入一公式的過程具體包括提供一標(biāo)準(zhǔn)的或自定義的公式元件,所述公式元件包括符號以及至少ー個(gè)輸入光標(biāo),用戶根據(jù)需要選擇所述符號以及在輸入光標(biāo)處輸入一字母或數(shù)字,以生成一公式。
16.如權(quán)利要求10所述的公式化數(shù)據(jù)的搜索方法,其特征在于,所述查詢數(shù)據(jù)庫中的公式具體包括在輸入公式之前對所述數(shù)據(jù)庫中的公式進(jìn)行索引,將所述輸入公式的文本化語言在索引中進(jìn)行查詢,與所述數(shù)據(jù)庫的公式進(jìn)行相似性的比較和評分。
17.如權(quán)利要求10所述的公式化數(shù)據(jù)的搜索方法,其特征在于,所述輸出ー查詢結(jié)果具體包括將查詢結(jié)果進(jìn)行排序后呈現(xiàn)給用戶。
18.—種公式化數(shù)據(jù)的搜索方法,其特征在于,包括 對數(shù)據(jù)庫中的公式按規(guī)則建立索引; 輸入中英文及公式; 將所述輸入公式轉(zhuǎn)換為一文本化語言; 將所述輸入公式的文本化語言在索引中進(jìn)行查詢,與所述數(shù)據(jù)庫的公式進(jìn)行相似性的比較和評分以及將所述中英文進(jìn)行文本查詢; 根據(jù)所述評分結(jié)果進(jìn)行排序后呈現(xiàn)給用戶。
19.如權(quán)利要求18所述的公式化數(shù)據(jù)的搜索方法,其特征在于,所述索引的規(guī)則為將公式劃分為運(yùn)算變量、運(yùn)算符以及其他結(jié)構(gòu)類別,所述公式均為由所述變量、運(yùn)算符、其他結(jié)構(gòu)類別的ー種、多種或其組合所組成的表達(dá)式。如權(quán)利要求18所述的公式化數(shù)據(jù)的搜索方法,其特征在于,所述輸入公式的步驟具體包括提供一標(biāo)準(zhǔn)或自定義的公式元件,用戶根據(jù)需要選擇所述公式元件以生成一公式。
20.如權(quán)利要求18所述的公式化數(shù)據(jù)的搜索方法,其特征在于,在對數(shù)據(jù)庫中的公式按規(guī)則建立索引前,利用網(wǎng)絡(luò)爬蟲在網(wǎng)絡(luò)中查找與公式相關(guān)的網(wǎng)頁或文檔,并將與所述公式相關(guān)的網(wǎng)頁或文檔保存至所述數(shù)據(jù)庫中。
全文摘要
本發(fā)明公開一種公式化數(shù)據(jù)搜索裝置,包括至少一用戶端,該用戶端包括一公式輸入模塊,用于輸入公式并轉(zhuǎn)換為一文本化編碼;一服務(wù)器,該服務(wù)器包括一搜索模塊,該搜索模塊至少包括一數(shù)據(jù)庫用于存儲與公式對應(yīng)的文本化編碼;該搜索模塊根據(jù)該文本化編碼查詢該數(shù)據(jù)庫并將查詢結(jié)果返回該用戶端。
文檔編號G06F17/30GK102693303SQ20121015838
公開日2012年9月26日 申請日期2012年5月18日 優(yōu)先權(quán)日2012年5月18日
發(fā)明者侯秀峰, 張國晨, 徐飛 申請人:上海極值信息技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
西昌市| 泰州市| 万山特区| 长顺县| 缙云县| 南京市| 沈阳市| 沾化县| 临沧市| 延安市| 手游| 叙永县| 伊川县| 洛浦县| 镇江市| 鹤山市| 克拉玛依市| 耿马| 罗田县| 新津县| 万山特区| 定西市| 曲麻莱县| 海伦市| 盐山县| 景泰县| 榕江县| 区。| 肃南| 曲靖市| 富平县| 大邑县| 靖西县| 卢龙县| 安义县| 光泽县| 盖州市| 崇明县| 城固县| 双鸭山市| 襄垣县|