欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于語境的地名檢索方法及系統(tǒng)的制作方法

文檔序號:6575154閱讀:203來源:國知局
專利名稱:基于語境的地名檢索方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及地理信息檢索技術(shù)領(lǐng)域,尤其涉及一種基于語境的地名檢索方法及系 統(tǒng)。
背景技術(shù)
隨著信息技術(shù)的高速發(fā)展,人們獲取信息越來越方便。面對網(wǎng)絡(luò)中海量的信息源, 幫助用戶從中快速準(zhǔn)確的找到有用信息的信息檢索技術(shù)得到了長足發(fā)展。地理空間信息在 網(wǎng)絡(luò)信息中占據(jù)很大的比例,如果不能有效的對地理信息進行處理,必然會減低信息檢索 的準(zhǔn)確度,影響用戶的使用。地理信息檢索就是在傳統(tǒng)信息檢索的基礎(chǔ)上,充分利用文檔中 包含的與地理相關(guān)的信息,結(jié)合地理信息的特點和處理方式,幫助用戶更加有效的完成信 息檢索。地理信息檢索技術(shù)主要支持以下三方面的應(yīng)用地名檢索,例如北京、中關(guān)村等, 檢索返回地名的地理空間位置;類型檢索,例如山川、河流等,檢索返回指定類型的地理實 體;關(guān)系檢索,例如方向關(guān)系、距離關(guān)系等,檢索返回滿足條件的地理實體。地名是表達某一特定空間位置上自然或人文地理實體的專有名稱。一方面,日常 交流中人們表達和接受地理位置時多依賴地名進行,同時大量的社會經(jīng)濟數(shù)據(jù)乃至一些自 然觀測數(shù)據(jù)中的地理位置的表達也通過地名進行;另一方面,類型檢索、關(guān)系檢索往往需要 地名來參與表達查詢內(nèi)容。因此,地名檢索成為地理信息檢索中最為廣泛的應(yīng)用。然而,現(xiàn)有地名檢索的準(zhǔn)確度不高,很難滿足用戶的需求。這一不足主要有以下三 方面的原因1、現(xiàn)有地名檢索技術(shù)不能正確理解頁面內(nèi)容或查詢中地名所蘊含的地理空間語 義,不能有效的處理地名重名問題,出現(xiàn)查不準(zhǔn)或查不全的現(xiàn)象;2、現(xiàn)有地名檢索技術(shù)沒有考慮查詢檢索時用戶的查詢目的、用戶所處的地理位置 等個人偏好,檢索結(jié)果往往并不是用戶所需要的;3、現(xiàn)有地名檢索技術(shù)無法有效的處理文本信息,計算機尚不能理解地名的自然語 言表述形式,現(xiàn)有地名檢索主要采用的是全文檢索的方式,僅僅通過簡單的關(guān)鍵詞文本匹 配完成,檢索結(jié)果存在大量的冗余和錯誤。語境本是語言學(xué)中的一個術(shù)語。在語言學(xué)中,語境指具體語言形式出現(xiàn)的環(huán)境, 通常分為廣義的語境和狹義的語境廣義的語境是指社會文化語境,也就是語言形式賴以 生存的社會文化形態(tài),它涉及到人類生活的各個方面,從衣食住行、風(fēng)俗習(xí)慣到價值觀念等 等;狹義的語境是指語言形式出現(xiàn)的具體語境,又稱為情景,如上下文關(guān)系、角色、語體、語 調(diào)、語法、詞匯等等。對一個概念來說,同時存在著語境不相關(guān)的性質(zhì)和語境相關(guān)的性質(zhì)。語 境不相關(guān)的性質(zhì)形成了它的核心意義,而語境相關(guān)的性質(zhì)則反映了語義編碼的變化性。研 究表明,地名具有明顯的語境相關(guān)性,同一地名在不同的語境下表達的地理空間語義有所 不同。地名在一定的語境下能夠更加準(zhǔn)確的表達地理空間實體及其位置。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于語境的地名檢索方法及系統(tǒng),其能夠提高地名檢索準(zhǔn)確度,同時更好的滿足用戶需求,以克服現(xiàn)有技術(shù)的不足。為實現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案。本發(fā)明一種實施方式的基于語境的地名檢索方法,包括S1.根據(jù)語境,將待檢索 地名語句分為基于表達語境的檢索內(nèi)容部分以及基于查詢語境的檢索用戶特征部分,并輸 入;S2.處理所述檢索內(nèi)容部分,查詢檢索得到初始檢索結(jié)果及其匹配度;S3.處理所述檢 索用戶特征部分,調(diào)整所述初始檢索結(jié)果的匹配度,得到最終檢索結(jié)果及其匹配度。其中,所述表達語境表示地名的地理空間語義,以及約束地名的適用范圍;所述查 詢語境表示地名檢索行為發(fā)生時的檢索背景,以及用戶對檢索結(jié)果的期望。其中,所述檢索內(nèi)容部分包括以下三個內(nèi)容元素名稱為待檢索目標(biāo)對象的地 名;類型為所述目標(biāo)對象的類型;關(guān)系斷言由參照對象、以及所述目標(biāo)對象的與所述參 照對象的關(guān)系兩部分組成。其中,所述三個內(nèi)容元素獨立地,或通過邏輯和、邏輯或、邏輯否定的形式,構(gòu)成所 述檢索內(nèi)容部分。其中,所述檢索用戶特征部分包括以下兩個內(nèi)容元素查詢主題為檢索用戶所 關(guān)心的主題、領(lǐng)域;用戶位置為所述檢索用戶所處的地理空間位置。其中,所述匹配度為檢索結(jié)果與用戶對地名檢索的期望之間的匹配程度,其數(shù)值 在0 1之間。本發(fā)明的另一實施方式提供了一種基于語境的地名檢索系統(tǒng),該系統(tǒng)包括輸入 模塊,用于根據(jù)語境,將待檢索地名語句分為基于表達語境的檢索內(nèi)容部分以及基于查詢 語境的檢索用戶特征部分,并輸入;初始檢索模塊,用于處理所述檢索內(nèi)容部分,查詢檢索 得到初始檢索結(jié)果及其匹配度;最終檢索模塊,用于處理所述檢索用戶特征部分,調(diào)整所述 初始檢索結(jié)果的匹配度,得到最終檢索結(jié)果及其匹配度。其中,所述表達語境表示地名的地理空間語義,以及約束地名的適用范圍;所述查 詢語境表示地名檢索行為發(fā)生時的檢索背景,以及用戶對檢索結(jié)果的期望。其中,所述檢索內(nèi)容部分包括以下三個內(nèi)容元素名稱為待檢索目標(biāo)對象的地 名;類型為所述目標(biāo)對象的類型;關(guān)系斷言由參照對象、以及所述目標(biāo)對象的與所述參 照對象的關(guān)系兩部分組成。其中,所述三個內(nèi)容元素獨立地,或通過邏輯和、邏輯或、邏輯否定的形式,構(gòu)成所 述檢索內(nèi)容部分。其中,所述檢索用戶特征部分包括以下兩個內(nèi)容元素查詢主題為檢索用戶所 關(guān)心的主題、領(lǐng)域;用戶位置為所述檢索用戶所處的地理空間位置。其中,所述匹配度為檢索結(jié)果與用戶對地名檢索的期望之間的匹配程度,其數(shù)值 在0 1之間。本發(fā)明的地名檢索方法及系統(tǒng),提供了適用于地名檢索的語境的規(guī)范化定義,區(qū) 別了表達語境和查詢語境,使得地名檢索的內(nèi)容更加完整,地名表達更加準(zhǔn)確,消除了地名 的不確定性;使得地名檢索獲得更加符合用戶需求的檢索結(jié)果;形式化表達包含語境的地 名檢索語句,建立相應(yīng)的查詢處理策略,使得計算機能夠處理包含語境的地名檢索;對地名檢索結(jié)果的準(zhǔn)確度進行量化評價,可幫助用戶更有效地使用地名檢索結(jié)果。


圖1為依照本發(fā)明的一種實施方式的基于語境的地名檢索方法流程圖;圖2為依照本發(fā)明的一種實施方式的基于語境的地名檢索系統(tǒng)結(jié)構(gòu)示意圖。
具體實施方式
本發(fā)明提出的基于語境的地名檢索方法及系統(tǒng),結(jié)合附圖和實施例詳細(xì)說明如 下。如圖1所示,依照本發(fā)明一種實施方式的基于語境的地名檢索方法包括如下步 驟Si.根據(jù)語境,將包含語境的地名檢索語句形式化表達,即將待檢索地名語句分為 基于表達語境的檢索內(nèi)容部分以及基于查詢語境的檢索用戶特征部分,并輸入;S2.處理檢索內(nèi)容部分,查詢檢索得到初始檢索結(jié)果及其匹配度;S3.處理檢索用戶特征部分,調(diào)整初始檢索結(jié)果的匹配度,得到最終檢索結(jié)果及其 匹配度。本發(fā)明將地名檢索的語境區(qū)分為表達語境和查詢語境。表達語境包括(1)待檢索 目標(biāo)對象的類型以及(2)目標(biāo)對象與參照對象的關(guān)系兩部分,用于表示地名的地理空間語 義,以及約束地名的使用范圍;查詢語境包括(1)用戶查詢主題以及(2)用戶位置兩部分, 用于表示用戶地名檢索行為發(fā)生時的檢索背景,以及用戶對檢索結(jié)果的期望。兩者是同時 存在并相互獨立的,主要區(qū)別體現(xiàn)在以下三方面1、兩者封裝的語境對象不同。表達語境直接封裝地名,作用于一個地名概念,反映 了地名的語義相關(guān)的性質(zhì),作用于地名檢索的整個處理過程。查詢語境則封裝地名檢索語 句,作用于一次地名檢索行為,反映了地名檢索的用戶相關(guān)的性質(zhì),作用于地名檢索結(jié)果的 準(zhǔn)確度評價階段。2、兩者針對的技術(shù)問題不同。表達語境參與地名的地理空間語義的表達,能夠表 達同一地名在不同語境下的不同含義;約束地名的使用范圍,消除了地名的重名問題,目的 在于提高地名檢索的準(zhǔn)確度。查詢語境則不涉及地名的語義問題,而關(guān)注于使用地名檢索 的用戶,目的在于提供更符合用戶期望的個性化檢索結(jié)果。3、兩者對地名檢索結(jié)果的影響不同。表達語境能夠決定結(jié)果集的內(nèi)容以及結(jié)果對 應(yīng)檢索內(nèi)容本身的匹配度。查詢語境只能在包含了表達語境的地名檢索確定后的結(jié)果集內(nèi) 部對結(jié)果的匹配度進行調(diào)整,而并不能刪除某些結(jié)果。在步驟Sl中,通過分析待檢索內(nèi)容的組成結(jié)構(gòu),檢索內(nèi)容部分包括三個內(nèi)容元 素名稱(Name)為待檢索目標(biāo)對象的地名;類型(Type)為待檢索目標(biāo)對象的類型;關(guān)系斷言(Predicate):由參照對象、以及所述目標(biāo)對象的與所述參照對象的關(guān) 系兩部分組成。傳統(tǒng)地名檢索的地名關(guān)鍵詞映射為名稱,表達語境中的目標(biāo)對象的類型和 目標(biāo)對象與參照對象的關(guān)系分別映射為類型和關(guān)系斷言。同時,考慮到待檢索內(nèi)容的豐富性和靈活性,通過邏輯和(AND)、邏輯或(OR)和邏輯否定(NOT)三個邏輯元素用以表達以上 三個內(nèi)容元素的邏輯組合。內(nèi)容元素相互獨立,且具有原子性。即它們可以單獨使用以表 達簡單查詢,也可能借助邏輯元素以邏輯組合的方式表達任意的復(fù)雜查詢。檢索用戶特征部分包括兩個元素
查詢主題(Theme)為檢索用戶所關(guān)心的主題、領(lǐng)域;用戶位置(Location)為檢索用戶所處的地理空間位置。查詢語境中的用戶查詢主題和用戶為之分別映射為查詢主題和用戶位置。舉例來說,位于中關(guān)村的用戶查詢“北京市的人民醫(yī)院”,這一地名檢索可形式化 為
名稱__A^_
類型 醫(yī)院 檢索內(nèi)容部分 ---
^7ic1參照對象北京市關(guān)系斷言--
___目標(biāo)對象與參照對象關(guān)系 以內(nèi)
查詢主題無
檢索用戶特征部分--
_ 用戶位置I_中關(guān)村_步驟S2及步驟S3中檢索內(nèi)容部分以及檢索用戶特征部分的處理即表達語境和查 詢語境的處理,均涉及了地名在類型和空間位置兩方面的信息。因為表達語境與地名直接 相關(guān),而查詢語境則與地名檢索的用戶相關(guān),所以本發(fā)明中表達語境的處理優(yōu)先級高于查 詢語境的處理優(yōu)先級。對地名檢索形式化后的元素而言,優(yōu)先對檢索內(nèi)容部分進行處理。具 體為,首先對檢索內(nèi)容部分中的類型/關(guān)系斷言進行處理,如果對檢索內(nèi)容部分中的類型/ 關(guān)系斷言進行了處理,則不對檢索用戶特征部分中的查詢主題/用戶位置進行處理,用戶 位置/查詢主題的處理不受影響。步驟S4中,匹配度指最終檢索結(jié)果與用戶對地名檢索的期望之間的匹配程度,其 數(shù)值在0 1之間。匹配度數(shù)值越高則表示檢索結(jié)果越符合用戶的檢索期望。影響匹配度 的因素及相關(guān)處理策略如下1、地名類型的相似度。匹配度可表示相似類型與檢索的地名類型的相似程度,檢 索結(jié)果得到檢索地名類型的相似類型,以獲得更多的可能結(jié)果。例如位于中關(guān)村的用戶查 詢“北京市的人民醫(yī)院”這一地名檢索中的醫(yī)院類型可以擴展為私人診所、專科醫(yī)院、中醫(yī) 院等醫(yī)療機構(gòu),不同類型之間的相似程度由具體應(yīng)用的算法決定。2、模糊的空間關(guān)系。地名檢索中涉及到的空間關(guān)系往往是定性表達的,因而具有 模糊性,如方向關(guān)系或遠、近等距離關(guān)系。匹配度可表示將定性關(guān)系轉(zhuǎn)化為定量關(guān)系進行計 算得到結(jié)果對應(yīng)這種定性關(guān)系的隸屬度。例如可以將定性距離關(guān)系遠近轉(zhuǎn)化為“1公里以 內(nèi)”、“1公里-10公里之間”和“10公里以外”等一系列距離進行定量計算。檢索結(jié)果對應(yīng) 定性關(guān)系的隸屬度由具體應(yīng)用的算法決定。3、查詢語境。根據(jù)查詢語境記錄的檢索用戶的偏好在初始檢索結(jié)果的匹配度基礎(chǔ) 上進行調(diào)整,以使得符合用戶偏好的檢索結(jié)果獲得較高的匹配度。例如位于中關(guān)村的用戶查詢“北京市的人民醫(yī)院”這一地名檢索的結(jié)果中,離中關(guān)村近的檢索結(jié)果的匹配度要高于 離中關(guān)村相對較遠的檢索結(jié)果匹配度。其中,查詢主題引起的匹配度類似于地名類型的處 理,計算初始結(jié)果的類型與查詢主題的相似程度;用戶位置引起的匹配度根據(jù)初始結(jié)果位 置與用戶位置的遠近從近至遠降低。本實施方式中,匹配度的計算部分包括匹配度綜合和匹配度調(diào)整兩個算法1、匹配度綜合算法如下檢索內(nèi)容部分可能出現(xiàn)類型和關(guān)系斷言同時存在的情 況,計算初始檢索結(jié)果匹配度要綜合這兩方面的匹配度,采用“兩者相較取其小”的原則選 擇相對較低的匹配度 定義地名類型的相似度引起的匹配度為mdtype (0<md·彡1),模糊的空間關(guān)系引
起的匹配度為mdpredi。ate(0 < mdpredicate彡1),初始檢索結(jié)果的匹配度為HicUinal,則mdoriginal = min Ondtype, mdpredicate)2、匹配度調(diào)整算法如下根據(jù)查詢語境記錄的檢索用戶的偏好在初始檢索結(jié)果的 匹配度基礎(chǔ)上進行調(diào)整的算法要滿足、符合用戶偏好的檢索結(jié)果獲得較高的匹配度原則定義初始檢索結(jié)果的匹配度為md iginal(0 < mdoriginal彡1),查詢主題引起的匹配 度為 Hldtheme (0 < Hldtheme ( 1),用戶位置引起的匹配度為 Hldlocation (0 < Hldlocation ( 1),最終檢 索結(jié)果的匹配度為Hidfinal,定義系數(shù)0 < λ” λ2,λ3< 1且滿足條件λ1+λ2+λ3 = 1,則mdfinal = mdoriginalX (λ !+A2Xmdtheme+ λ 3Xmdlocation)匹配度計算過程涉及的具體算法以及參數(shù),根據(jù)地名檢索的應(yīng)用目的,應(yīng)用對象 不同而有所不同,具體算法以及參數(shù)的選擇不在本發(fā)明的權(quán)利范圍之內(nèi)。綜上所述,步驟S2中初始檢索結(jié)果的匹配度計算遵循匹配度綜合算法;步驟S3中 調(diào)整初始檢索結(jié)果的匹配度的計算遵循匹配度調(diào)整算法。如圖2所示,依照本發(fā)明的另一實施方式的基于語境的地名檢索系統(tǒng),該系統(tǒng)包 括輸入模塊,用于根據(jù)語境,將待檢索地名語句分為基于表達語境的檢索內(nèi)容部分以及基 于查詢語境的檢索用戶特征部分,并輸入;初始檢索模塊,用于處理檢索內(nèi)容部分,查詢檢 索得到初始檢索結(jié)果及其匹配度;最終檢索模塊,用于處理檢索用戶特征部分,調(diào)整初始檢 索結(jié)果的匹配度,得到最終檢索結(jié)果及其匹配度。以上實施方式僅用于說明本發(fā)明,而并非對本發(fā)明的限制,有關(guān)技術(shù)領(lǐng)域的普通 技術(shù)人員,在不脫離本發(fā)明的精神和范圍的情況下,還可以做出各種變化和變型,因此所有 等同的技術(shù)方案也屬于本發(fā)明的范疇,本發(fā)明的專利保護范圍應(yīng)由權(quán)利要求限定。
權(quán)利要求
一種基于語境的地名檢索方法,該方法包括步驟S1.根據(jù)語境,將待檢索地名語句分為基于表達語境的檢索內(nèi)容部分以及基于查詢語境的檢索用戶特征部分,并輸入;S2.處理所述檢索內(nèi)容部分,查詢檢索得到初始檢索結(jié)果及其匹配度;S3.處理所述檢索用戶特征部分,調(diào)整所述初始檢索結(jié)果的匹配度,得到最終檢索結(jié)果及其匹配度。
2.如權(quán)利要求1所述的基于語境的地名檢索方法,其特征在于,所述表達語境表示地 名的地理空間語義,以及約束地名的適用范圍;所述查詢語境表示地名檢索行為發(fā)生時的檢索背景,以及用戶對檢索結(jié)果的期望。
3.如權(quán)利要求1所述的基于語境的地名檢索方法,其特征在于,所述檢索內(nèi)容部分包 括以下三個內(nèi)容元素名稱為待檢索目標(biāo)對象的地名;類型為所述目標(biāo)對象的類型;關(guān)系斷言由參照對象、以及所述目標(biāo)對象的與所述參照對象的關(guān)系兩部分組成。
4.如權(quán)利要求3所述的基于語境的地名檢索方法,其特征在于,所述三個內(nèi)容元素獨 立地,或通過邏輯和、邏輯或、邏輯否定的形式,構(gòu)成所述檢索內(nèi)容部分。
5.如權(quán)利要求1所述的基于語境的地名檢索方法,其特征在于,所述檢索用戶特征部 分包括以下兩個內(nèi)容元素查詢主題為檢索用戶所關(guān)心的主題、領(lǐng)域;用戶位置為所述檢索用戶所處的地理空間位置。
6.如權(quán)利要求1所述的基于語境的地名檢索方法,其特征在于,所述匹配度為檢索結(jié) 果與用戶對地名檢索的期望之間的匹配程度,其數(shù)值在0 1之間。
7.一種基于語境的地名檢索系統(tǒng),該系統(tǒng)包括輸入模塊,用于根據(jù)語境,將待檢索地名語句分為基于表達語境的檢索內(nèi)容部分以及 基于查詢語境的檢索用戶特征部分,并輸入;初始檢索模塊,用于處理所述檢索內(nèi)容部分,查詢檢索得到初始檢索結(jié)果及其匹配度;最終檢索模塊,用于處理所述檢索用戶特征部分,調(diào)整所述初始檢索結(jié)果的匹配度,得 到最終檢索結(jié)果及其匹配度。
8.如權(quán)利要求7所述的基于語境的地名檢索系統(tǒng),其特征在于,所述表達語境表示地 名的地理空間語義,以及約束地名的適用范圍;所述查詢語境表示地名檢索行為發(fā)生時的檢索背景,以及用戶對檢索結(jié)果的期望。
9.如權(quán)利要求7所述的基于語境的地名檢索系統(tǒng),其特征在于,所述檢索內(nèi)容部分包 括以下三個內(nèi)容元素名稱為待檢索目標(biāo)對象的地名;類型為所述目標(biāo)對象的類型;關(guān)系斷言由參照對象、以及所述目標(biāo)對象的與所述參照對象的關(guān)系兩部分組成。
10.如權(quán)利要求9所述的基于語境的地名檢索系統(tǒng),其特征在于,所述三個內(nèi)容元素獨 立地,或通過邏輯和、邏輯或、邏輯否定的形式,構(gòu)成所述檢索內(nèi)容部分。
11.如權(quán)利要求7所述的基于語境的地名檢索系統(tǒng),其特征在于,所述檢索用戶特征部 分包括以下兩個內(nèi)容元素查詢主題為檢索用戶所關(guān)心的主題、領(lǐng)域; 用戶位置為所述檢索用戶所處的地理空間位置。
12.如權(quán)利要求7所述的基于語境的地名檢索系統(tǒng),其特征在于,所述匹配度為檢索結(jié) 果與用戶對地名檢索的期望之間的匹配程度,其數(shù)值在0 1之間。
全文摘要
本發(fā)明涉及一種基于語境的地名檢索方法及系統(tǒng),該方法包括步驟根據(jù)語境,將待檢索地名語句分為基于表達語境的檢索內(nèi)容部分以及基于查詢語境的檢索用戶特征部分,并輸入;處理所述檢索內(nèi)容部分,查詢檢索得到初始檢索結(jié)果及其匹配度;處理所述檢索用戶特征部分,調(diào)整所述初始檢索結(jié)果的匹配度,得到最終檢索結(jié)果及其匹配度。本發(fā)明的方法及系統(tǒng)通過語境提高地名檢索準(zhǔn)確度、更好的滿足用戶需求。
文檔編號G06F17/30GK101957819SQ20091008888
公開日2011年1月26日 申請日期2009年7月21日 優(yōu)先權(quán)日2009年7月21日
發(fā)明者劉瑜, 張毅, 李潤強, 袁一泓, 陳凱晨, 高勇 申請人:北京大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
西乡县| 满洲里市| 虎林市| 万州区| 博罗县| 龙江县| 西乡县| 新平| 长白| 长顺县| 博湖县| 邵武市| 淳化县| 平南县| 贵港市| 安阳市| 秦皇岛市| 井陉县| 耿马| 扎鲁特旗| 临湘市| 黄平县| 三都| 木兰县| 崇阳县| 凯里市| 甘泉县| 云南省| 濮阳市| 丹凤县| 普定县| 旬邑县| 双峰县| 鞍山市| 彭阳县| 营山县| 磐石市| 石棉县| 金平| 福建省| 宁远县|