專利名稱::在個人手持學習終端上實現(xiàn)的針對試題的搜索與學習相結(jié)合的方法
技術(shù)領域:
:本發(fā)明涉及一種搜索及學習相結(jié)合的方法,特別是一種用于手持學習終端的針對試題的搜索及對與試題關聯(lián)的知識點對應的課件進行學習的搜學方法。
背景技術(shù):
:目前在互聯(lián)網(wǎng)絡出現(xiàn)了一些搜索網(wǎng)站,如百度、google等,這些搜索引擎能夠幫用戶找到一些有用的信息,但同時存在如下三方面的嚴重不足其一是其應用的多是橫向搜索技術(shù)(即通用搜索技術(shù)),搜索出來的信息量龐大,五花八門,不具有專業(yè)性,要在其中找到滿足需要的信息需要花費大量的時間;其二是不便于輸入理科公式,搜索不到包含公式的試題,更不能解題,其三是必須與互聯(lián)網(wǎng)絡保持即時通訊才能進行搜索,不具有隨時性、便攜性。通常在手持式學習終端上的搜索僅是在選定的詞典中進行詞條釋義的査詢,而不可以搜索試題及理科公式,這樣就大大限制了手持學習終端的使用范圍。
發(fā)明內(nèi)容針對上述提到的現(xiàn)有技術(shù)中手持學習終端沒有搜索試題功能及公式搜索功能的缺點,本發(fā)明提供一種新的用于手持學習終端的針對試題的搜索及對與試題關聯(lián)知識點對應的課件進行學習的搜學方法,其在手持學習終端的存儲器內(nèi)存儲壓縮后的試題庫,由輸入裝置輸入需搜索的內(nèi)容,微處理器將輸入內(nèi)容與存儲器內(nèi)試題庫中的試題內(nèi)容進行匹配,并將所有匹配成功的結(jié)果顯示在顯示裝置上,并可對與試題關聯(lián)的所有知識點對應的所有課件進行學習。本發(fā)明解決其技術(shù)問題采用的方案是一種在個人手持學習終端上實現(xiàn)的針對試題的搜索與學習相結(jié)合的方法,該方法包括-A、在電腦上將所有的試題分類建立試題庫壓縮包,并將試題庫壓縮包存儲于互聯(lián)網(wǎng)絡服務器或其它存儲介質(zhì)上;B、通過互聯(lián)網(wǎng)絡系統(tǒng)或其它存儲介質(zhì)將試題庫壓縮包存儲至手持學習終端;C、在手持學習終端的存儲器內(nèi)部存儲有"標準對照庫",其中包含英文標準對照庫、中文標準對照庫、無意義詞標準對照庫、標點符號標準對照庫、與其它語種相關的標準對照庫;D、在手持學習終端上選擇待搜索的試題庫壓縮包,設置搜索范圍;E、從手持學習終端的輸入裝置輸入要搜索的關鍵字;F、手持學習終端的微處理器識別輸入裝置輸入的所有關鍵字,并對輸入的關鍵字進行分詞處理a、搜索內(nèi)容是英文,以空格作為關鍵詞詞條的分隔標記;b、搜索內(nèi)容是中文,先以前兩個字作為第一個預關鍵詞,在"中文標準對照庫"內(nèi)搜索與之匹配的內(nèi)容,如果搜索到與之內(nèi)容和順序完全匹配的詞條,則在其后加上第三個字在中文標準對照庫內(nèi)再次匹配內(nèi)容,如果匹配成功,則繼續(xù)加入其后的字進行循環(huán)匹配直到匹配最大化構(gòu)成關鍵詞組,如果匹配不成功,則將前兩個字作為一個關鍵詞進行分隔標記,再將第三個字加入其后的一個字后循環(huán)匹配直到匹配最大化構(gòu)成關鍵詞組;如果沒有搜索到與前兩個字內(nèi)容和順序完全匹配的詞條,則在第一個字后作出分隔標記將其作為一個關鍵詞,再將第二個字加上其后的一個字在中文標準對照庫內(nèi)搜索與之匹配的詞條,如果加上后在中文標準對照庫內(nèi)能找到匹配的詞條,則再加入其后的第三個字進行循環(huán)匹配直到匹配最大化構(gòu)成關鍵詞組,如果加上后詞條不構(gòu)成關鍵詞,則采用上一次匹配成功的詞條作為關鍵詞,后面一個字則作為后面詞條的開始,依此方法將所有中文輸入內(nèi)容進行分詞;c、搜索內(nèi)容為公式,在表示公式的文本中按公式輸入的順序進行非跳躍性的最小化單元或包含若干個最小化單元組合的方法進行分詞;d、搜索內(nèi)容為其它語種的文本遵從以空格為分隔標記或與相關語種的標準對照庫中關鍵字相匹配取最大化詞條的規(guī)則;G、在手持學習終端的微處理器內(nèi)濾除輸入內(nèi)容中沒有實際意義的關鍵詞及標點;H、在手持學習終端的微處理器內(nèi)將輸入內(nèi)容中的大寫字母全部轉(zhuǎn)化為小寫;I、將動詞的各種時態(tài)包括過去式、過去分詞、現(xiàn)在進行時、第三人稱單數(shù)還原為原形,并將名詞的復數(shù)形式還原為單數(shù)原形;J、微處理器將輸入的關鍵詞與試題庫壓縮包內(nèi)的數(shù)據(jù)進行匹配,并通過顯示驅(qū)動裝置顯示匹配成功的試題內(nèi)容,a、顯示內(nèi)容為文本,將匹配成功的試題內(nèi)容顯示在顯示裝置上,并將關鍵詞高亮顯示;b、顯示內(nèi)容為公式,微處理器將該文本和數(shù)字類型的公式反向解析成對應的圖片,并將該公式對應的圖片顯示在顯示裝置上。本發(fā)明解決其技術(shù)問題采用的技術(shù)方案進一步還包括所述的試題庫壓縮包的試題內(nèi)容中文本部分采用通用的Huffman壓縮算法或<前綴長度,后綴>的壓縮算法建立,其中前綴長度用數(shù)字表示;試題庫壓縮包中公式采用MathML數(shù)學標記語言表示成文本和數(shù)字相結(jié)合的形式。所述的試題庫壓縮包中數(shù)字部分按照通用的Huffinan或<數(shù)值,數(shù)值標識>的壓縮算法建立,數(shù)值以原值或以當前數(shù)值與前一數(shù)值的差值的方法表示,數(shù)值標識用來區(qū)分數(shù)值的種類為原值還是差值。所述的試題庫壓縮包對應有唯一的包號(即包ID號),各個試題庫壓縮包包號對應存儲在手持學習終端上授權(quán)的存儲器內(nèi),包中包含試題內(nèi)容、與試題內(nèi)容關聯(lián)的知識點對應的各類用于用戶學習的學習課件、根據(jù)試題內(nèi)容建立的索引文件。所述的索引文件包括詞典文件、頻率文件、位置文件、Field域庫,其中詞典文件包括關鍵詞、指向頻率文件的指針、指向位置文件的指針。所述的Field域庫用于表達試題與其屬性的關聯(lián)關系,其屬性包含試題號即QID號、文章標題、指向試題內(nèi)容的地址、認知分類、難易程度、答案、解析、同類試題。所述的英文標準對照庫中,英文關鍵詞按照英文字母對應的ASCII碼順序進行排序,中文標準對照庫中,中文詞條按照國標內(nèi)碼進行排序;其它語種的標準對照庫中關鍵詞按照國際標準Unicode內(nèi)碼從小到大的原則進行排序。在微處理器將輸入的關鍵詞與試題庫壓縮包內(nèi)的數(shù)據(jù)進行匹配時,先將關鍵詞與索引文件中的"詞典文件"內(nèi)的關鍵詞進行匹配,再根據(jù)與匹配成功的關鍵詞關聯(lián)的指向頻率文件的指針和指向位置文件的指針找到對應的頻率文件和位置文件,再由頻率文件和位置文件確定輸入的關鍵詞在試題庫壓縮包中所屬的試題及所有位置。所述的搜索內(nèi)容為公式,則輸入完成后微處理器將其解析成文本和數(shù)字相結(jié)合類型的MathML數(shù)學標記語言進行搜索,并將搜索到的試題中所有包含此公式的文本和數(shù)字反向解析成圖片顯示給用戶。所述的匹配成功的試題按照A、相鄰關鍵詞在匹配成功的試題中位置相鄰則優(yōu)先顯示,如果沒有位置相鄰的關鍵詞,則B、關鍵詞在試題中被提及的頻率次數(shù)多的優(yōu)先顯示,如果關鍵詞在匹配成功的試題中被提及的頻率次數(shù)相同的,則C、按照第一個關鍵詞在匹配成功的試題中首次出現(xiàn)的字符位置的前后順序優(yōu)先顯示。針對有收藏價值的試題形成"錯題集數(shù)據(jù)庫文件"或"收藏夾數(shù)據(jù)庫文件",記錄用戶解錯的試題或有其它收藏意義的試題,兩者結(jié)構(gòu)相同包ID號、試題QID號、試題包名稱、收藏日期,其中試題包名稱中包含了文件的保存路徑??筛鶕?jù)知識點的難易程度進行分類搜索,從而得到精確的搜索結(jié)果。搜索成功的試題可做題、學習與試題關聯(lián)的知識點對應的課件、查看解析、査看答案、査看包含試題所屬年級/科目/難度/認知分類/對應知識點的屬性。本發(fā)明的有益效果是本專利技術(shù)在將PC標準的搜索弓I擎技術(shù)應用到個人手持設備的嵌入式領域的基礎上,引入了垂直搜索的概念。廠家將各行各業(yè)各領域的信息資料進行收集、加工后將其分類儲存至遠程服務器的試題數(shù)據(jù)庫或其它存儲介質(zhì);用戶從中選取滿足需要的試題庫壓縮包將其下載到手持設備后,可隨時、隨地從中搜索滿足條件的內(nèi)容。這種在特定的領域內(nèi)垂直搜索信息的方法,提高了搜索的準確性、全面性,為用戶節(jié)省了大量的搜索時間;同時按照國際標準MathML數(shù)學標記語言將理科公式以文本和數(shù)字形式表達后,能夠?qū)竭M行分詞處理,使得包含理科公式的試題能夠隨意搜索;通過與廠家試題數(shù)據(jù)庫的交互,保證了試題的更新性,另外,本專利是全球首次將PC搜索引擎技術(shù)應用到個人手持學習終端的技術(shù),為用戶提供更便利的服務。下面將結(jié)合附圖和具體實施方式對本發(fā)明做進一步說明。圖1為本發(fā)明中搜索內(nèi)容為中文的分詞程序流程圖。圖2為本發(fā)明中不含關鍵字輸入過程的試題搜索程序流程圖。圖3為本發(fā)明中采用MathML語言進行理科公式編輯的程序流程圖。圖4為本發(fā)明中包含關鍵字輸入過程的試題搜索程序流程圖。圖5為PC機上建立原始試題庫并將其加工成目標試題庫壓縮包的程序流程圖。圖6為本發(fā)明英文壓縮及解壓過程參考圖。圖7為本發(fā)明中文壓縮及解壓過程參考圖。圖8為本發(fā)明數(shù)值存儲形式參考圖。圖9為本發(fā)明一次還原即可得到原值的數(shù)值還原過程參考圖。圖10為本發(fā)明多次還原可得到原值的數(shù)值還原過程參考圖。具體實施例方式本實施例為本發(fā)明的優(yōu)選實施方式,其它凡其原理和基本實現(xiàn)方法與本實施例相同或近似的,均在本發(fā)明保護范圍之內(nèi)。本發(fā)明是一種將垂直搜索技術(shù)引入到嵌入式領域的手持學習終端中用來實現(xiàn)試題搜索的技術(shù)。用戶通過互聯(lián)網(wǎng)絡系統(tǒng)或其它存儲介質(zhì)等載體將包含海量試題信息的試題庫壓縮包下載到個人手持式設備作為搜索的目標庫(并可通過此類方式將個人手持設備上的試題包更新),然后在個人手持設備上輸入搜索條件,再一鍵啟動搜題搜索引擎,得到滿足條件的信息。本發(fā)明實現(xiàn)的過程分為下述兩個相互獨立而又關聯(lián)的部分1、PC機對相關標準對照庫及原始試題庫的加工處理過程,主要包含如下兩方面(1)、建立相關標準對照庫原始庫文件,并對其進行排序、壓縮的過程;(2)、參看附圖5,針對包含英文、中文、數(shù)字等各種語種的文本及圖片、圖像、動漫、聲音、音樂、多媒體學習課件和用國際標準數(shù)學標記語言MathML所表示的理科公式的試題內(nèi)容建成原始試題庫文件,并對其進行分詞、濾除無意義詞和標點符號、將所有大寫字母轉(zhuǎn)換為小寫、將動詞的各種時態(tài)包括過去式、過去分詞、現(xiàn)在進行時、第三人稱單數(shù)還原為原形,將名詞的復數(shù)形式還原為單數(shù)原形、排序、倒排、索引、壓縮后形成一個包含"試題內(nèi)容"、"與試題內(nèi)容關聯(lián)的知識點對應的各類用于用戶學習的學習課件"、"根據(jù)試題內(nèi)容建立的索引文件"的目標試題庫壓縮包。2、手持學習終端啟動搜索引擎對目標試題庫壓縮包解析、調(diào)用、顯示等處理。(一)、下面結(jié)合實例說明PC機對相關標準對照庫及原始試題庫的處理過程1、各類標準對照庫及原始試題庫中索引文件的關鍵詞排序處理(1)、英文的排序按照英文字母對應的ASCII碼進行相應的關鍵詞條的相關排序,每一個詞條對應-一個相應的內(nèi)碼地址,由此可知,前面若千部分內(nèi)容及順序都相同的詞條會以相鄰的地址按順序排序,經(jīng)排序后的關鍵詞條庫如下表所示排序后的關鍵詞條庫I<table>tableseeoriginaldocumentpage14</column></row><table>(2)、中文的排序按照國標內(nèi)碼對詞條進行排序,每一個詞條對應一個相應的內(nèi)碼地址,前面若干部分內(nèi)容及順序都相同的詞條會以相鄰的地址按照順序排序,如下表所示排序后的關鍵詞條庫'阿—阿拉一阿拉伯—阿拉伯語(3)、其它語種的關鍵詞排序處理按照國際標準Unicode內(nèi)碼從小到大的排序規(guī)則進行排序。2、PC機對原始試題庫倒排、建立索引文件、手持學習終端對試題庫的相關解析(1)、倒排-A、倒排過程將"試題號即QID號"與"其包含的所有關鍵詞"之間一對多的關系倒排為"試題包含的所有關鍵詞"與"關鍵詞所屬試題號"之間多對一的關系;B、倒排結(jié)構(gòu)由上述A可知,倒排結(jié)構(gòu)由"關鍵字"、"試題號"所組成(2)、索引A、針對原始試題庫內(nèi)容對應的所有關鍵詞進行分詞、濾除無意義詞和標點符號、將所有大寫轉(zhuǎn)換為小寫、將動詞的各種時態(tài)包括過去式、過去分詞、現(xiàn)在進行時、第三人稱單數(shù)還原為原形、將名詞的復數(shù)形式還原為單數(shù)原形、排序、倒排后建立索引文件。B、索引文件的結(jié)構(gòu)如下<table>tableseeoriginaldocumentpage15</column></row><table>a、詞典文件:a)、關鍵詞即原始試題庫中所有試題內(nèi)容經(jīng)分詞、濾除無意義詞及標點符號、統(tǒng)一大小寫、將動詞的各種時態(tài)還原為原形,將名詞的復數(shù)形式還原為單數(shù)原形后的關鍵詞;b)、指向頻率文件的指針關鍵詞指向所屬頻率文件的指針;C)、指向位置文件的指針關鍵詞指向所屬位置文件的指針;b、頻率文件關鍵詞在試題庫所屬的試題中出現(xiàn)的所有次數(shù);C、位置文件關鍵詞在試題庫所屬的試題中出現(xiàn)的字節(jié)位置;d、Field域庫用于表達試題與其屬性的關聯(lián)關系,其屬性包含試題號即QID號、文章標題、指向試題內(nèi)容的地址、認知分類、難易程度、答案、解析、同類試題,由此可見,一個關鍵詞對應著一個或多個Field域庫,由Field域庫所引出的關聯(lián)關系及益處如下a)、一道試題即一篇文章,而試題的標題即為其對應的知識點名稱,由于一道試題對應一個或多個知識點,故一道試題可能有一個或多個文章標題,即試題QID號與知識點名稱或者說是文章標題存在一對一或一對多的關系;b)、由于一道試題對應著一個或多個知識點,而一個知識點對應著一個或多個學習課件,從而可知一道試題亦對應著一個或多個學習課件。下表中表現(xiàn)試題號即QID號與知識點或文章標題域之間、知識點與對應的學習課件間的對應關系試題號<formula>formulaseeoriginaldocumentpage16</formula>c)、Field域庫建立起試題的各種關聯(lián)關系后,用戶對搜索成功的試題可做題、查看解析、查看答案、查看試題所屬年級、科目、難度、認知分類、對應知識點、査看上或下一道題等;d)、査看試題的屬性找到對應的知識點,將知識點的認知分類屬性與試題的難易程度相關聯(lián),便于用戶選擇知識點的難易程度進行分類搜索,從而得到更為精確的搜索結(jié)果;e)、由試題對應的知識點找到對應的學習課件,用戶通過學習課件進行學習,做到搜學相結(jié)合,提高了對試題及知識點的理解深度;f)、便于用戶收藏具有收藏價值或做錯題的試題,形成"我的收藏夾數(shù)據(jù)庫文件"或"錯題集數(shù)據(jù)庫文件",方便用戶下次對該題的操作,其中"我的收藏夾數(shù)據(jù)庫文件"或"錯題集數(shù)據(jù)庫文件"中所保存的試題數(shù)據(jù)結(jié)構(gòu)包含所屬包的ID號、試題QID號、試題包名稱、收藏日期,其中試題包名稱中包含了該試題的保存路徑。c、建立了上述索引結(jié)構(gòu)后,則顯然可以看出整個試題庫由"索引文件"、"試題內(nèi)容"、"學習課件"三個部分所組成,試題庫的結(jié)構(gòu)組成關系如下表所示索引文件詞典文件關鍵詞指向頻率文件的指針指向位置文件的指針頻率文件位置文件Field域庫試題內(nèi)容學習課件a、其中"索引文件"由詞典文件、頻率文件、位置文件、Field域庫所組成,其中詞典文件由關鍵詞、指向頻率文件的指針、指向位置文件的指針所構(gòu)成;b、其中"試題內(nèi)容"由中文、英文及其它語種的文本、標點、圖片、圖像、動漫、聲音、音樂、用國際標準語言MathML所表示的理科公式等組成;c、其中"學習課件"由圖片、圖像、聲音、音樂、動漫、文本等各種形式所組合而形成的多媒體課件。D、手持學習終端啟動搜索引擎,與試題庫中關鍵詞匹配的過程-a、將輸入的關鍵詞與索引文件中"詞典文件"內(nèi)的關鍵詞進行內(nèi)容和順序的匹配;b、根據(jù)"詞典文件"中匹配成功的關鍵詞對應的指向頻率文件的指針和指向位置文件的指針找到對應的頻率文件和位置文件;C、根據(jù)頻率文件和位置文件找到試題庫中關鍵詞所屬的所有試題和在試題中的位置;E、上述索引結(jié)構(gòu)用一個二維結(jié)構(gòu)圖舉例說明如下<table>tableseeoriginaldocumentpage18</column></row><table>關鍵詞l(己知)a、第一列即內(nèi)容為"關鍵詞1-3"表示的是詞典文件,而"文章A"、"文章B"、"文章C"、"文章D"所在列則表示頻率文件和位置文件,頻率文件用數(shù)字表示(如上表中的數(shù)字3、1、2),指所在行的關鍵詞在所在列的文章中出現(xiàn)的頻率次數(shù);位置文件用數(shù)字表示(如上表中<*>,其中*為1-3),指所在行的關鍵詞在所在列的文章中出現(xiàn)的位置,也即是關鍵詞字符在所屬試題中的位置,用字節(jié)數(shù)來表示;b、針對上表中的頻率文件及位置文件可以分析出,關鍵詞與所屬的所有試題號的對應關系如下<table>tableseeoriginaldocumentpage18</column></row><table>F、確立索引結(jié)構(gòu)、建立索引文件的益處在于-a、在試題庫壓縮包中建立索引文件犧牲了手持學習終端的空間,但輸入的關鍵詞只需與索引文件中的關鍵詞匹配即可,避免了將輸入關鍵詞與整個試題庫壓縮包中的海量信息進行字符串的順序匹配,從而節(jié)省了手持學習終端的處理時間,進而節(jié)省用戶的等待時間,提高了效率;b、舉例而言假設要査詢單詞"line",搜索引擎先對索引文件中的"詞典文件"內(nèi)的關鍵詞用二分法查找、找到匹配的該詞,讀出所屬的所有試題號,再由頻率文件和位置文件確定所有的搜索結(jié)果。"詞典文件"通常非常小,因而,整個過程的時間是毫秒級的,而如果是用普通的順序匹配算法,不建索引,而是對試題庫壓縮包內(nèi)所有文章的內(nèi)容進行字符串匹配,這個過程將會相當緩慢,當試題庫壓縮包信息量很大時,時間往往是無法忍受的。C、綜合上述可知,此種搜學相結(jié)合的方法形成了集"預習、學習、練習、復習、測試"于一體的有針對性的系統(tǒng)的學習方法;'、各類標準對照庫、索引文件及原始試題庫試題內(nèi)容的壓縮、手持學習終端對其相關解壓處理(1)、壓縮方法至少有如下三種A、第一種是針對所有語種的文本或數(shù)字所采用的通用的Huffman壓縮方法;B、第二種是針對所有語種的文本所采用的<前綴長度,后綴>的壓縮方法a、其中前綴長度用數(shù)字表示,使當前詞條與其上-條相鄰的詞條相關聯(lián),后綴則為相關語種的文本如字母或中文或其它語種的字符;b、解壓還原時手持學習機微處理器先找到當前詞條上一相鄰地址的詞條,再將上述相鄰詞條按照從左至右的順序取前綴長度所表示數(shù)值個數(shù)的字母或中文或其它語種的字符,依次逆序回找到前綴長度正確表示的所有字母或中文或其它語種的字符,最后將回找到的所有對象與后綴相組合則完成對詞條的解壓過程。C、英文的壓縮及解壓過程舉例如下所示如下表中"about"用此方法壓縮后表示為<3,ut〉,"hear"表示為〈2,ar>,解壓還原"about"的過程如附圖6中所示取<3,加>上一詞條即<2,0111>從左至右的前三個字母即為"2,o",其中的數(shù)字2表示詞條〈,out〉中的前綴,即還需要對<2,0111〉進行解壓得到其原形,而結(jié)合詞條〈2,out〉的前三個字母與<3,加>的后綴"ut",此時about解壓還原為"2,out",再按此法還原2為ab,此時將"ab"與"out相結(jié)合,"則about還原完全;同理,"hear"經(jīng)過一次還原后亦得到正確的還原結(jié)果。d、中文的壓縮及解壓過程舉例如附圖7中所示如"阿拉伯語"用此方法表示為<3,語〉,還原"阿拉伯語"的過程如附圖7中所示(同英文的解壓還原方法一致)。e、其它語種的壓縮及解壓均遵從上述英文或中文的壓縮、解壓方法;C、第三種是針對數(shù)字所采用的<數(shù)值,數(shù)值標識>的壓縮方法a、其中的數(shù)值以原值或當前值與上一個值的差值來表示,數(shù)值標識用以表示數(shù)值的種類是原值還是差值,如用0代表原值、l代表其為差值。b、數(shù)值用原值表示可防止手持學習終端解壓時間過長從而使得用戶等待的時間過長,故在某部分位置直接保存數(shù)字即原值,而不保存其與前一個數(shù)字的差值,故保存為原值時,不需要解壓還原,從而節(jié)省時間,達到時間、空間的合理均衡;c、差值的表示方法可以減小數(shù)字的長度,進而減少保存該數(shù)字需要的字節(jié)數(shù)。例如當前試題號是16389,不壓縮時要用3個字節(jié)保存,上一試題號是16382,壓縮后保存與16389的差值即7,則只用一個字節(jié)即可保存,第三個試題號如果是16390,則壓縮后保存為K即16390與16389的差值),從而達到節(jié)省空間的目的;d、差值的解壓還原過程類似于上述英文和中文的<前綴長度,后綴>的向上相鄰地址進行逆序順次回找累加法。下面舉例說明差值壓縮的存儲方法及手持學習終端對其的解壓過程a)、請參看附圖8,附圖8是一組原值的數(shù)字采用<數(shù)值,數(shù)值標識〉壓縮前后的對比附圖8中左側(cè)為數(shù)值壓縮前形式,右側(cè)為數(shù)值壓縮后形式以及壓縮說明。b)、附圖8中,"壓縮后"所在的列包含<數(shù)值,數(shù)值標識>,其中第一列數(shù)字代表原值或差值(如l、2、80、10、10、101),第二列包含0、l的數(shù)字即為數(shù)值標識,其中0表示原值,l表示差值。c)、數(shù)值"90"經(jīng)過一次還原即得到其原值,其還原過程如附圖9中所示圖中左側(cè)為數(shù)值壓縮前形式,中間一欄為壓縮后存儲形式,右側(cè)為還原結(jié)果,帶箭頭弧線為還原過程。d)、數(shù)值還可經(jīng)過多次還原得到原數(shù)值,本實施例中以兩次還原為例,請參看附圖IO,數(shù)值"100"經(jīng)過兩次還原即得到其原值,其還原過程如附圖10中所示圖中左側(cè)為數(shù)值壓縮前形式,第二欄為壓縮后存儲形式,第三欄為首次還原結(jié)果,第四欄為二次還原結(jié)果,帶箭頭弧線為還原過程,分別表示第一次還原過程和第二次還原過程。(2)、采用上述各壓縮方法的益處在于.A、縮小了原始試題庫的容量,從而節(jié)省了手持學習終端的存儲空間;B、使得手持學習終端在CPU的處理速度和存儲空間之間取得平衡。(二)、下面結(jié)合實例及手持學習終端啟動搜索引擎對目標試題庫壓縮包的解析、調(diào)用、顯示等處理過程1、參看附圖3、附圖4,在手持學習終端上輸入所有的關鍵詞,包括中文、英文等各語種的文本內(nèi)容的輸入、啟動公式編輯器輸入的采用MathML表示的文本和數(shù)字類型的理科公式,之后啟動搜索引擎-("、A、B、C、公式的輸入:D、E、(2)、(3)、A、手持學習終端確定每個特殊符號或公式框架對應的唯一編號及特定的、通用的MathML解析格式;用戶啟動某個公式編輯器,并按規(guī)則輸入數(shù)據(jù),手持學習終端生成對應的MathML標記;公式編輯器接收輸入的MathML標記,并根據(jù)用戶提供的標準的、完整的MathML標記將其反向解析,生成該標記所表示的圖片,展現(xiàn)給用'戶;用戶啟動其它公式編輯器按規(guī)則輸入其它的公式直至所有公式輸入完成,對應于公式的MathML標記生成的圖片全部展現(xiàn)給用戶;組合整個公式的MathML標記,對應輸出用于表達所有公式內(nèi)容的MathML文本和經(jīng)反向解析后的完整圖片,則公式的編輯完成;普通文本的輸入利用相關的輸入法輸入普通文本。理科公式采用MathML數(shù)學標記語言表示成文本和數(shù)字類型的的示例如下公式"V^+V=Y"MathML表示如下MathML=<></mrow></math>2、對所有關鍵詞進行分詞處理(1)、英文的分詞A、方法以空格為標記分隔一個關鍵詞;B、示例文章"TomlivesinGuangzhou,IliveinGuangzhoutoo"分詞后的結(jié)果為[Tom]、[lives]、[in]、[G畫gzhou]、[,][I]、[live]、[in〗、[too]。(2)、中文的分詞A、方法參看附圖1,本發(fā)明中對輸入的中文關鍵字分詞,先取前兩個關鍵字,與"中文標準對照庫"中的關鍵詞比較并在其中找到內(nèi)容和順序均完全匹配的詞則說明前兩個關鍵字至少可作為一個分詞或是一個分詞的某一部分,其后接著加入第三個關鍵字,將前三個字組成的關鍵詞與"中文標準對照庫"中的關鍵詞進行匹配,如果內(nèi)容和順序完全匹配則說明前三個關鍵字至少可作為一個分詞或是一個分詞的某一部分,則再繼續(xù)取下一個關鍵字,直到所取到的關鍵詞在"中文標準對照庫"中找不到內(nèi)容和順序均完全匹配的詞條,則說明去除最后一個關鍵字上一次內(nèi)容和順序成功匹配的詞條已是最大化的一個詞條,即可將上一次成功匹配的詞條作為一個分詞看待,再將未匹配成功的詞條中最后一個字與其后的一個關鍵字相結(jié)合與"中文標準對照庫"中的詞條進行匹配,如此反復循環(huán),直至所有的關鍵詞匹配完成,則完成所有中文關鍵詞的分詞處理。B、示例輸入關鍵字"諾亞舟實業(yè)公司成立于1999年",先取"諾亞"與"中文標準對照庫"中關鍵詞比較,并找到了包含"諾亞"的詞條,然后加入"舟"字即取"諾亞舟"三字與"中文標準對照庫"比較,在該庫中亦找到了"諾亞舟"一詞,則再加入"實"字即取"諾亞舟實"四字與"中文標準對照庫"進行比較,在該庫中找不到"諾亞舟實"這樣的詞,則說明"諾亞舟實"不能作為一個分詞處理,而去除最后一次加入的關鍵字"實"字后的"諾亞舟"即可為一個關鍵詞,再將"實"字與其后的"業(yè)"字組合成新的詞條,與"中文標準對照庫"比較,在該庫中找到了"實業(yè)"這個詞,如此類推下去,則上述關鍵字分詞結(jié)果為"諾亞舟/實業(yè)/公司誠立/于/1999年",則說明例中找到了"諾亞舟"、"實業(yè)"、"公司"、"成立"、"于"、"1999"這些關鍵詞。(3)、.公式的分詞:A、方法在表示公式的文本中按公式輸入的順序進行非跳躍性的最小化單元或包含若干個最小化單元組合的方法進行分詞;B、示例公式"X2+3XY+Y2=5"可分解為下表中38個分詞:<table>tableseeoriginaldocumentpage24</column></row><table><table>tableseeoriginaldocumentpage25</column></row><table>(4)、搜索內(nèi)容為其它語種的文本遵從以空格為分隔標記或與相關語種的標準對照庫中關鍵字相匹配取最大化詞條的規(guī)則。3、過濾關鍵詞中無實際意義之詞及標點符號(如英文中的"in、at"等,中文中的"的""是"等);4、統(tǒng)一關鍵詞內(nèi)容中的所有大小寫,將所有的大寫字母轉(zhuǎn)換成小寫;5、將動詞的各種時態(tài)包括過去式、過去分詞、現(xiàn)在進行時、第三人稱單數(shù)還原為原形,并將名詞的復數(shù)形式還原為單數(shù)原形;6、微處理器將輸入的關鍵詞與試題庫壓縮包內(nèi)的數(shù)據(jù)進行匹配(1)、將所有輸入的關鍵詞與索引文件中的"詞典文件"內(nèi)的關鍵詞進行內(nèi)容和順序的匹配,包括與索引文件中各語種的普通文本和采用MahtML數(shù)學標記語言所表示的理科公式的匹配;(2)、根據(jù)"詞典文件"中匹配成功的關鍵詞對應的指向頻率文件和位置文件的指針找到對應的頻率文件和位置文件;(3)、根據(jù)頻率文件和位置文件找到試題庫壓縮包中關鍵詞所屬的所有試題和在試題中的位置7、對所有匹配成功的搜索結(jié)果內(nèi)容按照相鄰關鍵詞在不同的試題中的位置是否相鄰、關鍵詞在試題中被提及的頻率次數(shù)的多少、第一個關鍵詞在試題中的位置的"優(yōu)先級顯示"的原則進行顯示排序(1)、首先,相鄰關鍵詞在匹配成功的試題中位置相鄰則優(yōu)先顯示。(2)、其次,相鄰關鍵詞在匹配成功的試題中位置不相鄰,則比較關鍵詞在試題中被提及的頻率次數(shù),頻率多的優(yōu)先顯示。(3)、最后,關鍵詞在匹配成功的試題中被提及的頻率次數(shù)相同的,則按照第一個關鍵詞在匹配成功的試題中首次出現(xiàn)的字符位置的前后順序優(yōu)先顯示8、根據(jù)上述顯示排序結(jié)果調(diào)用手持學習終端的顯示驅(qū)動設備顯示所有搜索結(jié)果(1)、顯示內(nèi)容為文本,將匹配成功的試題內(nèi)容顯示在顯示裝置上,并將關鍵詞高亮顯示;(2)、顯示內(nèi)容為公式,微處理器將試題庫壓縮包中采用MathML所表示的文本和數(shù)字類型的公式反向解析成對應的圖片,并將該公式對應的圖片顯示在顯示裝置上(三)、下面舉例具體說明本發(fā)明的操作過程。1、原始試題庫的建庫、排序、倒排、索引、壓縮-(1)、設有文章l(試題O和文章2(試題2)構(gòu)成一個原始試題庫文件A、文章1的內(nèi)容為TomlivesinGuangzhou,IliveinGuangzhoutoo.B、文章2的內(nèi)容為HeoncelivedinShanghai.(2)、對文章1和文章2的內(nèi)容進行關鍵詞分詞處理A、分詞目的由于搜索引擎是基于索引文件中的關鍵詞進行索引和査詢的,首先要取得這兩篇文章的關鍵詞,即為建索引文件提取關鍵詞;B、分詞方法文章內(nèi)容相當于一個字符串,先找出字符串中的所有單詞,即采用以空隔為標記的分詞方法,則文章1及文章2的關鍵詞為a、文章1的所有關鍵詞為[Tom][lives][in][Guangzhou][,][I][live][in][Guangzhou][too].b、文章2的所有關鍵詞為[He][once][lived][in][shanghai].(3)、參照"無意義詞標準對照庫"、"標點符號對照庫"濾除無意義的關鍵詞及標點符號、并參照"英文大小寫標準對照庫"統(tǒng)一大小寫,則文章1及文章2的關鍵詞為A、文章1的所有關鍵詞為[torn][lives][guangzhou][i][live][guangzhou]B、文章2的所有關鍵詞為[he][lived][shanghai].(4)、參照"動詞原形標準對照庫"將動詞的各種時態(tài)還原為原形,并參照"名詞單數(shù)標準對照庫"將名詞的復數(shù)形式還原為單數(shù)原形,則文章1及文章2的關鍵詞為A、文章1的所有關鍵詞為[torn][live][guangzhou][i][live][guangzhou]B、文章2的所有關鍵詞為[he][live][shanghai].(5)、倒排A、將上述文章1及文章2中"試題號"對"試題中所有關鍵詞"倒排成"試題中所有關鍵詞"對"擁有該關鍵詞的所有試題號";B、將試題中所有關鍵詞按照"前面若干部分內(nèi)容和順序都相同的詞條以相鄰的地址按順序排序"的排序規(guī)則進行排序;C、倒排結(jié)果如下表所示-<table>tableseeoriginaldocumentpage27</column></row><table>(6)、建立索引文件A、將文章1及文章2在倒排基礎上加上"出現(xiàn)頻率"和"出現(xiàn)位置"信息后,索引結(jié)構(gòu)變?yōu)?關鍵詞+試題號+[出現(xiàn)頻率]+出現(xiàn)位置",其中"試題號+[出現(xiàn)頻率]"即為頻率文件,"出現(xiàn)位置"即為位置文件,則包含上述文章1和文章2的試題庫壓縮包內(nèi)的索引文件如下表中所示<table>tableseeoriginaldocumentpage28</column></row><table>B、上表的索引結(jié)構(gòu)說明:a、第一列"關鍵詞"即為索引文件中的"詞典文件",詞典文件中包含了"關鍵詞"、"指向頻率文件的頻率指針"、"指向頻率文件的位置指針"、;b、第二列即"頻率文件",包含關鍵詞所屬的文章號及在該文章中出現(xiàn)的頻率次數(shù);c、第三列即"位置文件",包含了關鍵詞在所屬的文章中出現(xiàn)的位置。(7)、將索引文件及原始試題庫中的試題內(nèi)容進行壓縮;(8)、加入與試題相關聯(lián)的知識點對應的用于用戶學習的學習課件后即形成目標試題庫壓縮包,由上述可知,目標試題庫壓縮包中包含"試題內(nèi)容"、"與試題內(nèi)容關聯(lián)的知識點對應的各類用于用戶學習的學習課件"、"根據(jù)試題內(nèi)容建立的索引文件"三大部分;(9)、至此,PC機上將原始試題庫加工成目標試題庫壓縮包的過程完成。2、手持學習終端啟動搜索引擎、解析目標試題庫壓縮包、顯示搜索結(jié)果(1)、輸入所有關鍵字,如"HelivesinG麗gzhou,Shanghai";(2)、對關鍵字進行分詞處理后,得到六個關鍵詞[He][lives][in][Guangzhou][Shanghai];(3)、參照手持學習終端上的"無意義詞標準對照庫"、"標點符號對照庫"濾除無意義詞及標點符號后,得到四個關鍵詞[He][lives][Guangzhou][Shanghai]^(4)、參照手持學習終端上"英文大小寫標準對照庫"統(tǒng)一關鍵詞大小寫,將大寫統(tǒng)一改為小寫,得到四個關鍵詞[he]卩ives][guangzhou][shanghai];(5)、參照手持學習終端上的"動詞原形標準對照庫"將動詞的各種時態(tài)還原為原形,并參照"名詞單數(shù)標準對照庫"將名詞的復數(shù)形式還原為單數(shù)原形,得到四個關鍵詞[he][live][guangzhou][shanghai];(6)、用二分搜索法將關鍵詞與試題庫壓縮包的索引文件中詞典文件內(nèi)的關鍵詞相匹配,得到如下匹配結(jié)果關鍵詞頻率文件位置文件guangzhou1[2]3,6he2[1]1live1[2],2[1]2,5,2shanghai2[1]3(7)、根據(jù)上表中關鍵詞與索引文件的頻率文件和位置文件相匹配的結(jié)果找到試題庫壓縮包中對應的文章和內(nèi)容,即找到文章1和文章2;(8)、對匹配成功的文章內(nèi)容進行顯示排序A、按照相鄰關鍵詞在試題庫壓縮包中的位置相鄰所屬的文章優(yōu)先顯示的原貝l」,輸入的關鍵詞[he]與[live]相鄰,而文章2中上述兩關鍵詞亦相鄰,故文章2的內(nèi)容優(yōu)先于文章1的內(nèi)容顯示位置靠前;(9)、根據(jù)顯示排序的結(jié)果,手持學習終端驅(qū)動顯示驅(qū)動裝置顯示搜索結(jié)果;本發(fā)明可廣泛應用于各種手持學習終端中,如電子詞典、學習機等。權(quán)利要求1、一種在個人手持學習終端上實現(xiàn)的針對試題的搜索與學習相結(jié)合的方法,其特征是所述的該方法包括A、在電腦上將所有的試題分類建立試題庫壓縮包,并將試題庫壓縮包存儲于互聯(lián)網(wǎng)絡服務器或其它存儲介質(zhì)上;B、通過互聯(lián)網(wǎng)絡系統(tǒng)或其它存儲介質(zhì)將試題庫壓縮包存儲至手持學習終端;C、在手持學習終端的存儲器內(nèi)部存儲有“標準對照庫”,其中包含英文標準對照庫、中文標準對照庫、無意義詞標準對照庫、標點符號標準對照庫、與其它語種相關的標準對照庫;D、在手持學習終端上選擇待搜索的試題庫壓縮包,設置搜索范圍;E、從手持學習終端的輸入裝置輸入要搜索的關鍵字;F、手持學習終端的微處理器識別輸入裝置輸入的所有關鍵字,并對輸入的關鍵字進行分詞處理a、搜索內(nèi)容是英文,以空格作為關鍵詞詞條的分隔標記;b、搜索內(nèi)容是中文,先以前兩個字作為第一個預關鍵詞,在“中文標準對照庫”內(nèi)搜索與之匹配的詞條,如果搜索到與之內(nèi)容和順序完全匹配的詞條,則在其后加入第三個字在“中文標準對照庫”內(nèi)再次匹配內(nèi)容和順序,如果匹配成功,則繼續(xù)加入其后的字進行循環(huán)匹配直到匹配最大化構(gòu)成關鍵詞組,如果匹配不成功,則將前兩個字作為一個關鍵詞進行分隔標記,再將第三個字加入其后的一個字后循環(huán)匹配直到匹配最大化構(gòu)成關鍵詞組;如果沒有搜索到與前兩個字內(nèi)容和順序完全匹配的詞條,則在第一個字后作出分隔標記將其作為一個關鍵詞,再將第二個字加上其后的一個字在“中文標準對照庫”內(nèi)搜索與之匹配的詞條,如果加上后在“中文標準對照庫”內(nèi)能找到內(nèi)容和順序均匹配的詞條,則再加入其后的第三個字進行循環(huán)匹配直到匹配最大化構(gòu)成關鍵詞組,如果加上后詞條不構(gòu)成關鍵詞,則采用上一次匹配成功的詞條作為關鍵詞,后面一個字則作為后面詞條的開始,依此方法將所有中文輸入內(nèi)容進行分詞;c、搜索內(nèi)容為公式,在表示公式的文本中按公式輸入的順序進行非跳躍性的最小化單元或包含若干個最小化單元組合的方法進行分詞;d、搜索內(nèi)容為其它語種的文本遵從以空格為分隔標記或與相關語種的標準對照庫中關鍵字相匹配的最大化詞條為一個關鍵詞的規(guī)則;G、在手持學習終端的微處理器內(nèi)濾除輸入內(nèi)容中沒有實際意義的詞條及標點;H、在手持學習終端的微處理器內(nèi)將輸入內(nèi)容中的大寫字母全部轉(zhuǎn)換為小寫;I、將動詞的各種時態(tài)包括過去式、過去分詞、現(xiàn)在進行時、第三人稱單數(shù)還原為原形,并將名詞的復數(shù)形式還原為單數(shù)原形;J、微處理器將輸入的關鍵詞與試題庫壓縮包內(nèi)的數(shù)據(jù)進行匹配,并通過顯示驅(qū)動裝置顯示匹配成功的試題內(nèi)容,a、顯示內(nèi)容為文本,將匹配成功的試題內(nèi)容顯示在顯示裝置上,并將關鍵詞高亮顯示;b、顯示內(nèi)容為公式,微處理器將該文本和數(shù)字類型的公式反向解析成對應的圖片,并將該公式對應的圖片顯示在顯示裝置上。2、根據(jù)權(quán)利要求1所述的在個人手持學習終端上實現(xiàn)的針對試題的搜索與學習相結(jié)合的方法,其特征是所述的試題庫壓縮包的試題內(nèi)容中文本部分采用通用的Huffman算法或<前綴長度,后綴>的算法建立,其中前綴長度用數(shù)字表示;試題庫壓縮包中公式采用MathML數(shù)學標記語言表示成文本和數(shù)字相結(jié)合的形式。3、根據(jù)權(quán)利要求1所述的在個人手持學習終端上實現(xiàn)的針對試題的搜索與學習相結(jié)合的方法,其特征是所述的試題庫壓縮包中數(shù)字部分按照通用的Huffman或<數(shù)值,數(shù)值標識>的壓縮算法建立,數(shù)值以原值或以當前數(shù)值與前一數(shù)值的差值的方法表示,數(shù)值標識用來標示數(shù)值的種類為原值還是差值。4、根據(jù)權(quán)利要求1或2或3所述的在個人手持學習終端上實現(xiàn)的針對試題的搜索與學習相結(jié)合的方法,其特征是所述的試題庫壓縮包對應有唯一的包號(即包ID號),試題庫壓縮包存儲在手持學習終端上授權(quán)的存儲器內(nèi),包中包含試題內(nèi)容、與試題內(nèi)容關聯(lián)的知識點對應的各類用于用戶學習的學習課件、根據(jù)試題內(nèi)容建立的索引文件。5、根據(jù)權(quán)利要求4所述的在個人手持學習終端上實現(xiàn)的針對試題的搜索與學習相結(jié)合的方法,其特征是所述的索引文件包括詞典文件、頻率文件、位置文件、Field域庫,其中詞典文件包括關鍵詞、指向頻率文件的指針、指向位置文件的指針。6、根據(jù)權(quán)利要求5所述的在個人手持學習終端上實現(xiàn)針對試題的搜索與學習相結(jié)合的方法,其特征是所述的Field域庫用于表達試題與其屬性的關聯(lián)關系,其屬性包含試題號即QID號、文章標題、指向試題內(nèi)容的地址、認知分類、難易程度、答案、解析、同類試題。7、根據(jù)權(quán)利要求1或2或3所述的在個人手持學習終端上實現(xiàn)的針對試題的搜索與學習相結(jié)合的方法,其特征是所述的英文標準對照庫中,英文關鍵詞按照英文字母對應的國際標準ASCII碼順序進行排序,中文標準對照庫中,中文詞條按照國標內(nèi)碼進行排序,其它語種的標準對照庫中關鍵詞按照國際標準Unicode內(nèi)碼從小到大的原則進行排序。8、根據(jù)權(quán)利要求1或2或3或5所述的在個人手持學習終端上實現(xiàn)的針對試題的搜索一學習相結(jié)合的方法,其特征是在微處理器將輸入的關鍵詞與試題庫壓縮包內(nèi)的數(shù)據(jù)進行匹配時,先將關鍵詞與索引文件中的"詞典文件"內(nèi)的關鍵詞進行匹配,再根據(jù)與匹配成功的關鍵詞關聯(lián)的指向頻率文件的指針和指向位置文件的指針找到對應的頻率文件和位置文件,再由頻率文件和位置文件確定輸入的關鍵詞在試題庫壓縮包中所屬的試題及所有位置。9、根據(jù)權(quán)利要求1或2或3所述的在個人手持學習終端上實現(xiàn)的針對試題的搜索與學習相結(jié)合的方法,其特征是所述的搜索內(nèi)容為公式,則輸入完成后微處理器將其解析成文本和數(shù)字相結(jié)合類型的MathML數(shù)學標記語言進行搜索,并將搜索到的試題中所有包含此公式的文本和數(shù)字反向解析成圖片顯示給用戶。10、根據(jù)權(quán)利要求1或2或3所述的在個人手持學習終端上實現(xiàn)的針對試題的搜索與學習相結(jié)合的方法,其特征是所述的匹配成功的試題按照A、相鄰關鍵詞在匹配成功的試題中位置相鄰則優(yōu)先顯示,如果沒有位置相鄰的關鍵詞,則B、關鍵詞在試題中被提及的頻率次數(shù)多的優(yōu)先顯示,如果關鍵詞在匹配成功的試題中被提及的頻率次數(shù)相同的,則c、按照第一個關鍵詞在匹配成功的試題中首次出現(xiàn)的字符位置的前后順序優(yōu)先顯示。11、根據(jù)權(quán)利要求1或2或3所述的在個人手持學習終端上實現(xiàn)的針對試題的搜索與學習相結(jié)合的方法,其特征是針對有收藏價值的試題形成"錯題.集數(shù)據(jù)庫文件"或"收藏夾數(shù)據(jù)庫文件",記錄用戶解錯的試題或有其它收藏意義的試題,兩者結(jié)構(gòu)相同,其結(jié)構(gòu)為包ID號、試題QID號、試題包名稱、收藏日期,其中試題包名稱中包含有文件的保存路徑。12、根據(jù)權(quán)利要求6所述的在個人手持學習終端上實現(xiàn)的針對試題的搜索與學習相結(jié)合的方法,其特征是可根據(jù)知識點的難易程度進行分類搜索,從而得到精確的搜索結(jié)果。13、根據(jù)權(quán)利要求6所述的在個人手持學習終端上實現(xiàn)的針對試題的搜索與學習相結(jié)合的方法,其特征是搜索成功的試題可做題、學習與試題關聯(lián)的知識點對應的課件、查看解析、査看答案、査看包含試題所屬年級/科目/難度/認知分類/對應知識點的屬性。全文摘要本發(fā)明涉及一種搜索與學習相結(jié)合的方法,特別是一種用于手持學習終端的針對試題進行搜索及對與試題關聯(lián)的知識點對應的課件進行學習的搜學方法。本方法包括在手持學習終端的存儲器內(nèi)存儲壓縮后的試題庫,由輸入裝置輸入需搜索的內(nèi)容,微處理器將輸入內(nèi)容與存儲器內(nèi)試題庫中的試題內(nèi)容進行匹配,并將所有搜索匹配成功的結(jié)果顯示在顯示裝置上,并可對與試題關聯(lián)的所有知識點對應的所有課件進行學習。本發(fā)明可大大方便用戶在手持學習終端上解答、解析試題,并可通過其進行學習、復習、測試、考試等,從而形成了集“預習、學習、練習、復習、測試”于一體的有針對性的個人學習系統(tǒng)。文檔編號G06F17/30GK101187928SQ200710075749公開日2008年5月28日申請日期2007年8月14日優(yōu)先權(quán)日2007年8月14日發(fā)明者唐本國,王曉童申請人:新諾亞舟科技(深圳)有限公司