欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

多級數(shù)據(jù)存儲方法及裝置、多級數(shù)據(jù)結構、信息檢索方法

文檔序號:9646593閱讀:456來源:國知局
多級數(shù)據(jù)存儲方法及裝置、多級數(shù)據(jù)結構、信息檢索方法
【技術領域】
[0001]本發(fā)明涉及數(shù)據(jù)存儲技術,特別涉及一種多級數(shù)據(jù)存儲方法及裝置、多級數(shù)據(jù)結構、息檢索方法。
【背景技術】
[0002]知識庫,又稱為智能數(shù)據(jù)庫或人工智能數(shù)據(jù)庫。知識庫是知識工程中結構化、易操作、易利用、全面有組織的知識集群,是針對某一(或某些)領域問題求解的需要,采用某種(或若干)知識表示方式在計算機存儲器中存儲、組織、管理和使用的互相聯(lián)系的知識片集合。這些知識片包括與領域相關的理論知識、事實數(shù)據(jù),由專家經(jīng)驗得到的啟發(fā)式知識,如某領域內(nèi)有關的定義、定理和運算法則以及常識性知識等。
[0003]隨著針對知識庫的搜索引擎的應用,使得用戶通過搜索引擎在知識庫中準確而快速地檢索到需要的信息。但是實際使用中,不同用戶提出問題的角度不同或針對同一問題的問法不同,使得搜索引擎搜到的信息有限或者噪音較大,為了提高檢索的效率和準確性,與知識庫具有聯(lián)系的詞類庫得以建立,詞類庫將某些同一種類或同一性質(zhì)的詞進行不同詞級的管理和應用,進行搜索時,搜索引擎中輸入的關鍵字與詞類庫中的詞類名稱進行匹配,快速而準確的判斷知識庫中是否存在相關信息。
[0004]但是現(xiàn)有技術建立的詞類庫的數(shù)據(jù)存儲結構較為復雜,并且不能滿足搜索的需求,信息檢索的精度和效率有待提升。

【發(fā)明內(nèi)容】

[0005]本發(fā)明解決的冋題是怎樣提尚?目息檢索的精度和效率。
[0006]為解決上述問題,本發(fā)明提供一種多級數(shù)據(jù)存儲方法,采用單個數(shù)據(jù)分類結構存儲相互關聯(lián)的多級數(shù)據(jù);所述方法包括:
[0007]分別生成各級數(shù)據(jù)的數(shù)據(jù)標簽及分別記錄各數(shù)據(jù)標簽對應的關聯(lián)關系信息,并記錄底層數(shù)據(jù)標簽的語義內(nèi)容,所述關聯(lián)關系信息用于保存該數(shù)據(jù)及其所對應的上下級數(shù)據(jù)之間的關系;
[0008]判斷是否對各數(shù)據(jù)標簽記錄語義內(nèi)容;
[0009]如果是,則對對應的數(shù)據(jù)標簽記錄語義內(nèi)容。
[0010]可選的,判斷是否對各數(shù)據(jù)標簽記錄語義內(nèi)容的過程包括:判斷數(shù)據(jù)標簽是否為底層數(shù)據(jù)標簽,若該數(shù)據(jù)標簽不是底層數(shù)據(jù)標簽,則判斷該數(shù)據(jù)標簽是否為單獨詞,若該數(shù)據(jù)標簽為單獨詞,則進行對該數(shù)據(jù)標簽記錄語義內(nèi)容的步驟。
[0011]可選的,判斷數(shù)據(jù)標簽是否為單獨詞的過程包括:提供字典,所述字典中存儲有若干單獨詞;將數(shù)據(jù)標簽與字典進行匹配,若匹配,則該數(shù)據(jù)標簽為單獨詞。
[0012]可選的,所述多級數(shù)據(jù)存儲方法還包括:采用不同方式標記記錄有語義內(nèi)容的數(shù)據(jù)標簽以及未記錄有語義內(nèi)容的數(shù)據(jù)標簽。
[0013]可選的,所述語義內(nèi)容與對應的數(shù)據(jù)標簽存儲的位置相同。
[0014]可選的,所述語義內(nèi)容為表達對應的數(shù)據(jù)標簽的語義的詞語集合。
[0015]可選的,所述多級數(shù)據(jù)存儲方法還包括:當需要添加具有新的數(shù)據(jù)標簽的數(shù)據(jù)時,在所述數(shù)據(jù)分類結構中增加該數(shù)據(jù)的數(shù)據(jù)標簽,并對需要記錄語義內(nèi)容的數(shù)據(jù)標簽記錄語義內(nèi)容;更新所述數(shù)據(jù)對應的上下級數(shù)據(jù)的關聯(lián)關系信息。
[0016]可選的,所述多級數(shù)據(jù)存儲方法還包括:當需要刪除一數(shù)據(jù)標簽下的所有數(shù)據(jù)時,在所述數(shù)據(jù)分類結構中刪除該數(shù)據(jù)的數(shù)據(jù)標簽、語義內(nèi)容及關聯(lián)關系信息;更新所述數(shù)據(jù)對應的上下級數(shù)據(jù)的關聯(lián)關系信息。
[0017]本發(fā)明實施例還提供了一種由上述多級數(shù)據(jù)存儲方法形成詞類庫的方法,其中,所述數(shù)據(jù)標簽是詞類標簽;所述關聯(lián)關系信息中保存上下級詞類名稱之間的關系;語義內(nèi)容是表達所述詞類標簽語義的詞語集合。
[0018]本發(fā)明實施例還提供了一種信息檢索方法,所述方法包括:
[0019]從接收到的服務請求中確定關鍵詞;
[0020]在所述數(shù)據(jù)分類結構的語義內(nèi)容及關聯(lián)關系信息中檢索所述關鍵詞,以得到與所述關鍵詞對應的標準問;
[0021 ] 在服務數(shù)據(jù)庫中查詢與所述標準問匹配的服務內(nèi)容。
[0022]本發(fā)明還提供了一種多級數(shù)據(jù)結構,包括:多級數(shù)據(jù)標簽以及各數(shù)據(jù)標簽對應的關聯(lián)關系信息;至少部分數(shù)據(jù)標簽的語義內(nèi)容。
[0023]可選的,所述語義內(nèi)容與對應的數(shù)據(jù)標簽存在相同的位置。
[0024]可選的,具有語義內(nèi)容的數(shù)據(jù)標簽位于底層或者為單獨詞。
[0025]本發(fā)明還提供了一種多級數(shù)據(jù)存儲裝置,包括:
[0026]數(shù)據(jù)標簽生成單元,用于分別生成各級數(shù)據(jù)的數(shù)據(jù)標簽;
[0027]關聯(lián)關系信息記錄單元,用于記錄各數(shù)據(jù)標簽對應的關聯(lián)關系信息,所述關聯(lián)關系信息用于保存該數(shù)據(jù)及其所對應的上下級數(shù)據(jù)之間的關系;
[0028]判斷單元,用于判斷是否對各數(shù)據(jù)標簽記錄語義內(nèi)容;
[0029]語義內(nèi)容記錄單元,用于對需要記錄語義內(nèi)容的數(shù)據(jù)標簽記錄語義內(nèi)容。
[0030]可選的,所述判斷單元包括數(shù)據(jù)標簽層級判斷單元和單獨詞判斷單元,所述數(shù)據(jù)標簽層級判斷單元用于判斷數(shù)據(jù)標簽是否為底層數(shù)據(jù)標簽,所述單獨詞判斷單元用于在數(shù)據(jù)標簽不是底層數(shù)據(jù)標簽時,判斷該數(shù)據(jù)標簽是否為單獨詞。
[0031]與現(xiàn)有技術相比,本發(fā)明的技術方案具有以下優(yōu)點:
[0032]本發(fā)明的多級數(shù)據(jù)存儲方法,采用單個數(shù)據(jù)分類結構存儲相互關聯(lián)的多級數(shù)據(jù),在單個數(shù)據(jù)分類結構不僅生成數(shù)據(jù)標簽以及記錄數(shù)據(jù)的上下級關系關聯(lián)關系信息,并且本發(fā)明的存儲方法,除了對底層數(shù)據(jù)標簽記錄語義內(nèi)容外,對底層數(shù)據(jù)標簽之外的其他數(shù)據(jù)標簽也可以記錄語義內(nèi)容,改變了相互關聯(lián)的多級數(shù)據(jù)的存儲結構,使得存儲結構相對簡單,由于數(shù)據(jù)標簽記錄了語義內(nèi)容提高信息檢索的精度和效率;對底層數(shù)據(jù)標簽之外的數(shù)據(jù)標簽記錄語義內(nèi)容進行判斷,提升了數(shù)據(jù)存儲的選擇性。此外,由于相互關聯(lián)的所有數(shù)據(jù)信息都是記錄在了一個數(shù)據(jù)結構中,此時的數(shù)據(jù)標簽不會與其它的數(shù)據(jù)標簽發(fā)生沖突,因此數(shù)據(jù)標簽就具有了實際的語義。
[0033]進一步,采用不同方式標記記錄有語義內(nèi)容的數(shù)據(jù)標簽以及未記錄有語義內(nèi)容的數(shù)據(jù)標簽,在對多級數(shù)據(jù)進行搜索時,可以根據(jù)標記快速確定搜索范圍,提高搜索的準確性。
[0034]本發(fā)明形成詞類庫的方法,除了對底層詞類標簽記錄語義內(nèi)容外,對底層詞類標簽之外的其他詞類標簽也可以記錄語義內(nèi)容,提高信息檢索的精度和效率;對底層詞類標簽之外的詞類標簽記錄語義內(nèi)容進行判斷,提升了數(shù)據(jù)存儲的選擇性。
[0035]本發(fā)明的多級數(shù)據(jù)結構,除了對底層數(shù)據(jù)標簽記錄語義內(nèi)容外,對底層數(shù)據(jù)標簽之外的其他數(shù)據(jù)標簽也可以記錄語義內(nèi)容,提高信息檢索的精度和效率。
[0036]本發(fā)明的多級數(shù)據(jù)的存儲裝置,用于建立多級數(shù)據(jù),并可以對數(shù)據(jù)標簽記錄語義內(nèi)容。
[0037]本發(fā)明的信息檢索方法,對采用上述多級數(shù)據(jù)存儲方法存儲的多級數(shù)據(jù)進行檢索時,由于相關的多級數(shù)據(jù)都是放在一個多級數(shù)據(jù)結構中,因此只需對該多級數(shù)據(jù)結構進行檢索即可,從而大大縮小了檢索數(shù)據(jù)結構的數(shù)目,使得搜索過程更加簡單,最終提高了檢索的效率,提升了檢索的準確度。
【附圖說明】
[0038]圖1為本發(fā)明一實施例多級數(shù)據(jù)存儲方法的流程示意圖;
[0039]圖2為本發(fā)明一實施例多級數(shù)據(jù)存儲方法形成的多級數(shù)據(jù)結構的示意圖;
[0040]圖3為本發(fā)明一實施例采用多級數(shù)據(jù)存儲方法形成詞類庫的方法流程示意圖;
[0041]圖4為本發(fā)明一實施例詞類庫的結構示意圖;
[0042]圖5為本發(fā)明一實施例多級數(shù)據(jù)存儲裝置的結構示意圖;
[0043]圖6為本發(fā)明一實施例基于多級數(shù)據(jù)的信息檢索方法的流程示意圖。
【具體實施方式】
[0044]如【背景技術】所言,現(xiàn)有技術建立的詞類庫的數(shù)據(jù)存儲結構較為復雜,且不能滿足搜索的需求(比如存在某些關鍵字檢索不到相關信息)。研究發(fā)現(xiàn),詞類庫的結構為多級數(shù)據(jù)結構,如:包括父級詞類分類、位于父級詞類分類下的子級詞類分類、位于子級詞類分類下的孫級詞類分類。在一具體例子中,一詞類庫包括:父級詞類分類(/外企,表示數(shù)據(jù)標簽),父級詞類分類(/外企)下包括兩個并列的子級詞類分類(/外獨資企業(yè))和(/中外合資企業(yè)),子級詞類分類(/外獨資企業(yè))下包括若干孫級詞類分類(/日企)、(/德企),孫級詞類分類就是底層數(shù)據(jù),孫級詞類分類(/日企)記錄對應的語義內(nèi)容:日企、日資企業(yè),子級詞類名稱(/德企)記錄對應的內(nèi)容:德企、德資企業(yè),子級詞類分類(/中外合資企業(yè))下包括若干孫級詞類分類(/中日合資)、(/中美合資),孫級詞類分類(/中日合資)記錄對應的語義內(nèi)容:中日合資、中日合資企業(yè),孫級詞類分類(/中美合資)記錄對應的語義內(nèi)容:中美合資、中美合資企業(yè),在詞類庫結構中,孫級詞類名稱記錄的對應內(nèi)容具有實際的語義,父級詞類分類、子級詞類分類、孫級詞類分類僅作為標簽并不表示實際的語義,并且父級詞類分類、子級詞類分類和孫級詞類分類的名稱是不能重復的,在搜索引擎進行搜索時,只能對詞類庫中具有實際語義的內(nèi)容進行識別,而如果用戶如果采用“外企”、“外獨資企業(yè)”或“中外合
當前第1頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
北川| 呈贡县| 广西| 云阳县| 谷城县| 金湖县| 开原市| 同德县| 罗城| 华安县| 巴林左旗| 万宁市| 河南省| 友谊县| 承德市| 南和县| 上思县| 牙克石市| 喜德县| 太白县| 洛阳市| 栾城县| 潞城市| 邓州市| 佛冈县| 临洮县| 银川市| 宜宾市| 资兴市| 青海省| 张掖市| 泸溪县| 鲜城| 德清县| 曲沃县| 德江县| 玉屏| 太康县| 新余市| 肇东市| 冕宁县|