欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

對文檔中的地理位置數(shù)據(jù)進行處理的方法和系統(tǒng)的制作方法

文檔序號:2648904閱讀:271來源:國知局
專利名稱:對文檔中的地理位置數(shù)據(jù)進行處理的方法和系統(tǒng)的制作方法
技術領域
本發(fā)明總體上涉及對數(shù)據(jù)進行處理的方法和系統(tǒng),特別的本發(fā)明涉及對文檔中的地理位置數(shù)據(jù)進行處理的方法和系統(tǒng)。
背景技術
地理位置數(shù)據(jù)在各個應用領域被廣為運用。圍繞地理位置數(shù)據(jù)已經(jīng)開發(fā)有多種應用產品向用戶提供服務。這些服務背后的一項基礎技術就是電子地圖技術。電子地圖是以數(shù)字方式存儲和查閱的地圖。電子地圖存儲信息的方法,一般使用向量式圖像存儲,地圖比例可放大、縮小或旋轉而不影響顯示效果,早期使用位圖式存儲,地圖比例不能放大或縮小,現(xiàn)代電子地圖軟件一般利用地理信息系統(tǒng)來儲存和傳送地圖數(shù)據(jù),也有其他的信息系統(tǒng)。在電子地圖上,人們可以檢索并瀏覽全世界各個地方。電子地圖服務包括地圖瀏覽、 地址搜索、地理位置周邊搜索、行車路線搜索、公交路線搜索、衛(wèi)星圖片瀏覽、風景圖片瀏覽以及定位與導航等。甚至有些網(wǎng)站還提供專門查找參觀、旅店、租房信息的電子地圖服務。 電子地圖目前已經(jīng)成為人們生活中不可缺少的一項重要應用技術。

發(fā)明內容
然而,本發(fā)明的發(fā)明人注意到現(xiàn)有的電子地圖服務存在一些特點首先現(xiàn)有的電子地圖服務往往是專門的地圖服務,沒有和用戶在網(wǎng)絡瀏覽中關注的信息結合起來,比如當用戶在瀏覽新聞時,新聞事件的發(fā)生地沒有能夠直接的展現(xiàn)在電子地圖中供用戶瀏覽; 其次現(xiàn)有的電子地圖服務無法自動的將兩個相關聯(lián)的地址呈現(xiàn)出來。本發(fā)明提出了一種對文檔中的地理位置數(shù)據(jù)進行處理的技術將文檔中的地理位置數(shù)據(jù)與電子地圖技術進行結合,開創(chuàng)了一種全新的信息瀏覽方式。利用本發(fā)明用戶可以容易的、直觀的、自動的在電子地圖上看到其所瀏覽的文檔中的地理位置數(shù)據(jù)及地理位置數(shù)據(jù)的相互關系。具體而言,本發(fā)明提供一種對文檔中的地理位置數(shù)據(jù)進行處理的方法,包括獲取所述文檔中的地理位置數(shù)據(jù);按照預定條件對所述地理位置數(shù)據(jù)進行分級以確定地理位置數(shù)據(jù)的相互關聯(lián)關系;在電子地圖上對所述地理位置數(shù)據(jù)的相互關聯(lián)關系進行標注;以及呈現(xiàn)經(jīng)標注后的電子地圖。本發(fā)明還提供一種對文檔中的地理位置數(shù)據(jù)進行處理的系統(tǒng),包括地理位置數(shù)據(jù)獲取裝置,用于獲取所述文檔中的地理位置數(shù)據(jù);關聯(lián)關系確定裝置,用于按照預定條件對所述地理位置數(shù)據(jù)進行分級以確定地理位置數(shù)據(jù)的相互關聯(lián)關系;標注裝置,用于在電子地圖上對所述地理位置數(shù)據(jù)的相互關聯(lián)關系進行標注;以及呈現(xiàn)裝置,用于呈現(xiàn)經(jīng)標注后的電子地圖。


本說明中所參考的附圖只用于示例本發(fā)明的典型實施例,不應該認為是對本發(fā)明范圍的限制。圖1示出了按照本發(fā)明的一種實施例對文檔中的地理位置數(shù)據(jù)進行處理的方法流程圖。圖2示出了按照本發(fā)明的另一種實施例對文檔中的地理位置數(shù)據(jù)進行處理的方法流程圖。圖3A示出了本發(fā)明的一個實施例中按照地理位置數(shù)據(jù)的重要程度進行分級的流程圖。圖;3B示出了本發(fā)明的一個實施例中按照地理位置數(shù)據(jù)所代表的事件的因果關系進行分級的流程圖。圖3C示出了本發(fā)明的一個實施例中按照地理位置數(shù)據(jù)所代表的事件的時間順序進行分級的流程圖。圖4A示出了本發(fā)明的一個實施例中一篇文檔的示意圖。圖4B示出了按照本發(fā)明的一種實施例對圖4A的地理位置數(shù)據(jù)進行處理后所呈現(xiàn)的電子地圖。圖4C示出了按照本發(fā)明的另一種實施例對圖4A的地理位置數(shù)據(jù)進行處理后所呈現(xiàn)的電子地圖。圖5示出了按照本發(fā)明的一個實施例將同一主題下的多篇文檔中的地理位置數(shù)據(jù)進行處理后所呈現(xiàn)的電子地圖。圖6示出了按照本發(fā)明的另一個實施例將不同主題下的多篇文檔中的地理位置數(shù)據(jù)進行處理后所呈現(xiàn)的電子地圖。圖7示出了按照本發(fā)明的一種實施例對文檔中的地理位置數(shù)據(jù)進行處理的系統(tǒng)框圖。圖8示出了按照本發(fā)明的另一種實施例對文檔中的地理位置數(shù)據(jù)進行處理的系統(tǒng)框圖。
具體實施例方式下列討論中,提供大量具體的細節(jié)以幫助徹底了解本發(fā)明。然而,很顯然對于本領域技術人員來說,即使沒有這些具體細節(jié),并不影響對本發(fā)明的理解。并且應該認識到,使用如下的任何具體術語僅僅是為了方便描述,因此,本發(fā)明不應當局限于只用在這樣的術語所表示和/或暗示的任何特定應用中。圖1示出了按照本發(fā)明的一種實施例對文檔中的地理位置數(shù)據(jù)進行處理的方法流程圖。首先在步驟101獲取所述文檔中的地理位置數(shù)據(jù)。所述文檔可以來自服務器上存儲的Blog、新聞等,也可以來自本地存儲的任何文件。所述地理位置數(shù)據(jù)可以是任何范圍的地理數(shù)據(jù),包括大到一個洲或者小到某條街的某座樓。該步驟的目的是為了將文檔中所包含的所有地理位置數(shù)據(jù)抽取出來。該步驟可以利用現(xiàn)有的命名實體識別(NER)技術。命名實體識別技術可以分辨出輸入的一篇或多篇文章中的人名、地名和組織名等。步驟101可以從輸入的一篇或多篇文檔中輸出所包含的地理位置數(shù)據(jù),包括洲、國家、地區(qū)、城市,甚至可以具體到街道、門牌號等。對于帶有多義性的名詞,如“華盛頓”,NER技術可以根據(jù)上下文判斷此處引用的“華盛頓”是人名還是地名。關于命名實體識別技術,可以參見AddressStandardization with Latent Semantic Association,作者 Honglei Guo, Huijia Zhu, Zhili Guo, XiaoXun Zhang and Zhong Su,發(fā)表于 KDD2009 (http://kdd09. crowdvine. com/talks/4934),以及 Domain Adaptation with Latent Semantic Association for Named Entity Recognition,作者 Honglei Guo Huijia Zhu Zhili Guo Xiaoxun Zhang Xian Wu and Zhong Su,NAACL2009 (http://portal, acm. org/citation. cfm ? id
=1620754.1620795)。在步驟103按照預定條件對所述地理位置數(shù)據(jù)進行分級以確定地理位置數(shù)據(jù)的相互關聯(lián)關系。對地理位置數(shù)據(jù)進行分級可以有助于進一步呈現(xiàn)地理位置數(shù)據(jù)的相互關系。其中所述預定條件進一步包括下面各項中的一項或多項按照所述地理位置數(shù)據(jù)的重要程度進行分級(比如將地理位置數(shù)據(jù)分成焦點地理位置和非焦點地理位置);按照所述地理位置數(shù)據(jù)所代表的事件的因果關系進行分級(比如將地理位置數(shù)據(jù)分成事件起因地理位置以及事件結果地理位置);或者按照所述地理位置數(shù)據(jù)所代表的事件的時間順序進行分級(比如將地理位置數(shù)據(jù)分成在先地理位置和在后地理位置)。當然所述分級并不限于上文列舉的兩層分級結構、而是可以有多層級聯(lián)分級結構。并且所述分級也不僅限于上述列舉三種分級方式,而是還可以包括其它需要的分級方式,也就是說分級方式可以根據(jù)用戶需要進行進一步擴展。并且上述分級方式可以單獨使用、也可以綜合使用。如果所述預定條件為按照所述地理位置數(shù)據(jù)的重要程度進行分級,則步驟103中的按照預定條件對所述地理位置數(shù)據(jù)進行分級以確定地理位置數(shù)據(jù)的相互關聯(lián)關系可以被進一步細化為圖3A中的步驟。參見圖3A,首先在步驟301A中獲取重要程度分級訓練數(shù)據(jù)。所述重要程度分級訓練數(shù)據(jù)可以是多篇文檔,按照本發(fā)明的一個實施例,用戶可以手工的對所述多篇文檔進行標注以確定焦點地理位置和非焦點地理位置。然后在步驟303A中按照下列各項中的一項或多項對所述經(jīng)過手工標注的訓練數(shù)據(jù)進行分析地理位置數(shù)據(jù)在文檔中的出現(xiàn)位置、地理位置數(shù)據(jù)在文檔中的出現(xiàn)次數(shù),從而自動的獲得成為焦點地理位置的地理位置數(shù)據(jù)特征。通常情況下,出現(xiàn)在文檔標題中的地理位置數(shù)據(jù)往往都代表了焦點地理位置。并且在大多數(shù)情況下,出現(xiàn)在文檔每段段首句中的地理位置數(shù)據(jù)也代表了焦點地理位置。當然,那些頻繁出現(xiàn)的地理位置數(shù)據(jù)往往也表示焦點地理位置??梢岳斫?,上述出現(xiàn)位置和出現(xiàn)次數(shù)既可以單獨用來確定成為焦點地理位置的地理位置數(shù)據(jù)特征,也可以結合用來確定成為焦點地理位置的地理位置數(shù)據(jù)特征。在步驟305A中按照分析結果確定地理位置數(shù)據(jù)的重要程度,比如按照焦點地理位置的地理位置數(shù)據(jù)特征就可以確定在新輸入的文檔中的某個地理位置數(shù)據(jù)是否是焦點地理位置。進一步、可以根據(jù)文檔的性質選擇不同的重要程度分級訓練數(shù)據(jù),從而獲得不同的焦點地理位置的地理位置數(shù)據(jù)特征。比如對于新聞類文檔而言,標題中出現(xiàn)的地理位置數(shù)據(jù)在99%以上都可能成為文檔中的焦點地理位置。而對于blog、散文等作品而言,標題中出現(xiàn)的地理位置數(shù)據(jù)成為焦點地理位置的可能性可能只占80%,因此還需要綜合考慮地理位置數(shù)據(jù)的出現(xiàn)次數(shù),從而全面判斷地理位置數(shù)據(jù)的重要程度。此外、在能夠通過手工或圖3A中的方法確定判斷地理位置數(shù)據(jù)的重要程度的特征(比如成為焦點地理位置的地理位置數(shù)據(jù)特征)的情況下,不必在每次獲得文檔的情況下都獲取訓練數(shù)據(jù)并且進行分析,而是可以直接利用已知的判斷地理位置數(shù)據(jù)的重要程度的特征(比如成為焦點地理位置的地理位置數(shù)據(jù)特征)對文檔中的地理位置數(shù)據(jù)的重要程度進行判斷,其中所述特征包括下列各項中的一項或多項地理位置數(shù)據(jù)在文檔中的出現(xiàn)位置、地理位置數(shù)據(jù)在文檔中的出現(xiàn)次數(shù)。回到圖1,如果所述預定條件為按照所述地理位置數(shù)據(jù)所代表的事件的因果關系進行分級,則步驟103按照預定條件對所述地理位置數(shù)據(jù)進行分級以確定地理位置數(shù)據(jù)的相互關聯(lián)關系可以進一步被細化為圖3B中的流程在步驟301B對所述地理位置數(shù)據(jù)出現(xiàn)的上下文按照語法結構進行分詞,所述上下文可以是包含所述地理位置數(shù)據(jù)的一段話、一個句子、多個短語或者一個短語等。本發(fā)明對分詞的方法和方式?jīng)]有任何限制?,F(xiàn)有技術中已經(jīng)提供了一些分詞方法,比如參見下面這個網(wǎng)站中就提供了對上下文進行分詞的一種方案:http //nip. Stanford, edu/software/lex-parser, shtml (The Stanford Parser :A statistical parser)。在步驟3(X3B根據(jù)所述分詞結果判斷所述上下文中是否包含表達地理位置數(shù)據(jù)所代表的事件的因果關系的詞語。比如對“希臘的債務危機波及(spilling into)其它歐洲國家,擾亂(roiling) 了美國和亞洲的經(jīng)濟市場”這樣一段上下文中,動詞 “波及”以及“擾亂”都可以被判斷為表達因果關系的詞語。在一種實施例中表達因果關系的詞語可以被限定為一系列特定的詞語或其同義詞,比如“導致”、“致使”等,在這一實施例中,可以比較確切的找到存在因果關系的兩個地理位置,但是這一實施例的不足是由于很難窮舉所有表達因果關系的詞語,因此步驟3(X3B中可能會遺漏一些事先沒有定義的同樣表達了因果關系的詞語。在另一種實施例中所有的動詞都可以被認為是表達因果關系的詞語,這樣可以避免上文中提到的遺漏現(xiàn)象,但是可能引入一些判斷中的噪聲。在實際應用中,可以根據(jù)不同的應用需求,選取不同的判斷策略。在步驟305B中按照所述判斷結果確定地理位置數(shù)據(jù)所代表的事件之間的因果關系,比如在上文中的例子中確定希臘與歐洲其它國家之間存在因果關系?;氐綀D1,如果所述預定條件為按照所述地理位置數(shù)據(jù)所代表的事件的時間順序進行分級,則步驟103中按照預定條件對所述地理位置數(shù)據(jù)進行分級以確定地理位置數(shù)據(jù)的相互關聯(lián)關系可以被進一步細化為圖3C中的流程在步驟301C中,對所述地理位置數(shù)據(jù)出現(xiàn)的上下文按照語法結構進行分詞。在步驟303C中,根據(jù)所述分詞結果判斷所述上下文中是否包含表達地理位置數(shù)據(jù)所代表的事件的時間順序的詞語。比如對于“今天李市長在海淀區(qū)進行參觀訪問,明天李市長還要去朝陽區(qū)進行視察”這段上下文而言,代表時間順序的詞語“今天”和“明天”將兩個地理位置數(shù)據(jù)“海淀區(qū)”和“朝陽區(qū)”關聯(lián)起來。在步驟 305C中按照所述判斷結果確定地理位置數(shù)據(jù)所代表的事件之間的時間順序。回到圖1,步驟103按照預定條件對所述地理位置數(shù)據(jù)進行分級以確定地理位置數(shù)據(jù)的相互關聯(lián)關系還可以進一步包括根據(jù)地理位置數(shù)據(jù)出現(xiàn)的上下文,過濾掉不需要被標注的地理位置數(shù)據(jù)。比如在新聞稿中,經(jīng)常會出現(xiàn)類似“北京電視臺記者報道”的信息, 通常情況下“北京電視臺”中的地理位置“北京”與所報道的新聞事件并沒有直接的關聯(lián)關系,因此可以根據(jù)地理位置數(shù)據(jù)出現(xiàn)的上下文中的特定詞語(比如“電視臺”等)過濾掉那些不需要被關注的地理位置數(shù)據(jù)。繼續(xù)圖1中的步驟,在步驟105中在電子地圖上對所述地理位置數(shù)據(jù)的相互關聯(lián)關系進行標注。在步驟107中呈現(xiàn)經(jīng)標注后的電子地圖。根據(jù)本發(fā)明的一個實施例對相互關聯(lián)關系進行標注的方式?jīng)]有限制,而是可以采用任何標注方式。根據(jù)本發(fā)明的又一個實施例可以使用連線將具有關聯(lián)關系的至少兩個地理位置數(shù)據(jù)相連(參見圖4B、圖5和圖
86),所述連線可以是直線、虛線、拋物線等,并且所述連線既可以以帶箭頭的連線表示也可以以不帶箭頭的連線表示。根據(jù)本發(fā)明的再一個實施例也可以使用等高線將具有關聯(lián)關系的至少兩個地理位置數(shù)據(jù)進行標注(參見圖4C)。根據(jù)本發(fā)明的還一個實施例,可以使用所述文檔中連接地理位置數(shù)據(jù)的動詞(比如上文中的動詞“波及”)標注所述地理位置數(shù)據(jù)的相互關聯(lián)關系。除此以外,還可以突出顯示具有相互關聯(lián)關系的至少兩個地理位置數(shù)據(jù),比如對于上文中的例子“今天李市長在海淀區(qū)進行參觀訪問,明天李市長還要去朝陽區(qū)進行視察”,可以在電子地圖上突出顯示“海淀區(qū)”和“朝陽區(qū)”從而表示二者之間的關聯(lián)關系,而無需使用明示的連線或者等高線。本發(fā)明對如何突出顯示具有相互關聯(lián)關系的至少兩個地理位置也沒有特別限定。當然,還可以采用其它的方式對地理位置數(shù)據(jù)的相互關聯(lián)關系進行標注。圖2示出了按照本發(fā)明的另一種實施例對文檔中的地理位置數(shù)據(jù)進行處理的方法流程圖。與圖1中的方法流程相比,圖2中的方法流程增加了三個步驟(用虛線框表示的203、207、211)從而使得地理位置數(shù)據(jù)的處理效果更加完善。首先在步驟201中獲取所述文檔的地理位置數(shù)據(jù),該步驟與圖1中的步驟101相應,其具體實現(xiàn)方式在此不再贅述。在步驟203對所獲取的地理位置數(shù)據(jù)進行消歧。消歧的內容可以是下列各項中的一種或多種(1)糾正從文檔中獲得的地理位置數(shù)據(jù)的錯誤表示方法,比如糾正錯誤的地理位置數(shù)據(jù)的拼寫或書寫,( 用統(tǒng)一的方式表達所述地理位置數(shù)據(jù),比如在文檔中,美國可能有多種表示方式,有“United Mates”,“American”,“USA”等,但是對應到電子地圖上, 應當用統(tǒng)一的方式進行表達,比如將各種關于美國的表達方式統(tǒng)一為“United States在步驟205中按照預定條件對所述地理位置數(shù)據(jù)進行分級以確定地理位置數(shù)據(jù)的相互關聯(lián)關系,該步驟與圖1中步驟103相應,其具體內容在此不再贅述。在步驟207對所述地理位置數(shù)據(jù)進行具體定位,從而用所述地理位置數(shù)據(jù)的細粒度表示代表所述地理位置數(shù)據(jù)。在以連線方法對地理位置數(shù)據(jù)的相互關聯(lián)關系進行標注的過程中,如果其中一個地理位置數(shù)據(jù)是一個相對較大的地理范圍(比如“中國”),那么在進行標注時可能存在難度。因此可以考慮用地理位置數(shù)據(jù)的細粒度表示代表所述地理位置數(shù)據(jù)(比如用“北京”這個地理位置代表“中國”這個地理位置數(shù)據(jù))。同樣,也可以按照文檔數(shù)據(jù)的性質來確定是否進行步驟207中的定位,比如對于政治新聞類的文檔則可以采用步驟207中的用地理位置數(shù)據(jù)的細粒度表示代表地理位置數(shù)據(jù)本身的方法,而對娛樂新聞類的文檔,則可以不執(zhí)行步驟207。同樣步驟207的執(zhí)行順序也存在多種實施方案,其即可以在步驟205后執(zhí)行,也可以在步驟205前執(zhí)行。在步驟209中,在電子地圖上對所述地理位置數(shù)據(jù)的相互關聯(lián)關系進行標注。步驟209的內容與圖1中步驟105的內容相應,在此不再贅述。在步驟211確定經(jīng)標注后的電子地圖的用于呈現(xiàn)的首選層次。本領域的普通技術人員理解,電子地圖中的地理位置數(shù)據(jù)按照地理數(shù)據(jù)的粒度是分層次的,比如5層、10層、 20層等。以5層數(shù)據(jù)為例,在第1層電子地圖中只能呈現(xiàn)出各大洲和國家,而在第2層電子地圖中可以呈現(xiàn)出各個國家的城市,在第3層電子地圖中可以呈現(xiàn)出各個城市的主要街道,依次類推。通過不斷的hom ^1和^)0111 Out動作,用戶可以查看不同層次下的電子地圖。為了在步驟213中更完善的呈現(xiàn)經(jīng)標注后的電子地圖。在步驟211中可以確定經(jīng)標注后的電子地圖的用于呈現(xiàn)的首選層次。確定首選層次的方式可以有很多種,比如確定焦點地理位置數(shù)據(jù)出現(xiàn)的層次為首選的顯示層次,或者確定大多數(shù)地理位置數(shù)據(jù)所在的層次為首選的顯示層次等。按照本發(fā)明的一個實施例,在確定了用于呈現(xiàn)的首選層次后,用戶仍然可以通過^)0111化和^)0111 Out的動作來查看不同粒度上的經(jīng)標注的電子地圖。比如在以細粒度呈現(xiàn)電子地圖時,呈現(xiàn)地理位置數(shù)據(jù)的相互關聯(lián)關系的連線可能指向多塞特郡(位于英格蘭西南英吉利海峽沿岸的一個郡),但是如果用戶Zoom Out為相對粗粒度的電子地圖時,所述呈現(xiàn)地理位置數(shù)據(jù)的相互關聯(lián)關系的連線則指向英格蘭。在不同的實施例中,可以選擇性的應用步驟203、207、211中的一種或多種,甚至可以選擇不采用步驟203、207、211中的任何一種。圖4A示出了本發(fā)明的一個實施例中一篇文檔的示意圖。該篇文檔介紹的是希臘債務危機對世界上其它國家和地區(qū)的影響,受影響的國家包括美國、德國、西班牙、葡萄牙、 英國、日本。圖4A中所示文檔可能是網(wǎng)絡上的一篇新聞報道,也可以是本地存儲的一篇文章。本發(fā)明可以對圖4A中這樣的文檔中的地理位置數(shù)據(jù)進行處理,最終呈現(xiàn)出經(jīng)標注后的電子地圖。圖4B示出了按照本發(fā)明的一種實施例對圖4A的地理位置數(shù)據(jù)進行處理后所呈現(xiàn)的電子地圖。圖中三角所示的地區(qū)是希臘,6條有箭頭的連線表示受希臘債務危機影響的6 個國家。下面以圖2中所示的實施例對獲得圖4B中電子地圖的過程進行示例性說明。在步驟201中首先獲取圖4A中文檔的所有地理位置數(shù)據(jù),包括、希臘、美國、德國、西班牙、葡萄牙、英國、日本。在步驟203對所獲取的地理位置數(shù)據(jù)進行消歧,包括將“United States", “U. S. ”和“American”等進行統(tǒng)一。在步驟205按照預定條件對所述地理位置數(shù)據(jù)進行分級以確定地理位置數(shù)據(jù)的相互關聯(lián)關系,在本實施例中可以按照地理位置數(shù)據(jù)所代表的事件的因果關系對地理位置數(shù)據(jù)進行分級,以確定地理位置數(shù)據(jù)的相互關聯(lián)關系,即希臘與其它各國之間的關聯(lián)關系。在步驟207對所述地理位置數(shù)據(jù)進行具體定位,比如以美國的首府“華盛頓”代表美國。為了能夠在有限的空間清晰的顯示帶有箭頭的連線,圖4B中有些箭頭所指的地點可能不是該國家的首府。在步驟209中在電子地圖上對所述地理位置數(shù)據(jù)及其相互關聯(lián)關系進行標注,即標注帶有箭頭的連線。在其它的實施例中也可以使用不帶箭頭的連線進行標注。在步驟211中確定經(jīng)標注后的電子地圖的用于呈現(xiàn)的首選層次, 比如選擇5層中的第3層作為首選層次。在步驟213中呈現(xiàn)經(jīng)標注后的電子地圖,如圖4B 所示。圖4C示出了按照本發(fā)明的另一種實施例對圖4A的地理位置數(shù)據(jù)進行處理后所呈現(xiàn)的電子地圖。與圖4B不同,圖4C中使用等高線、而不是連線的方式表示受希臘債務危機影響的國家。圖5示出了按照本發(fā)明的一個實施例將同一主題下的多篇文檔中的地理位置數(shù)據(jù)進行處理后所呈現(xiàn)的電子地圖。在圖5所示的實施例中,可以處理同一主題下的多篇文檔(包括來自CNN、Washingtonpost和Renews的新聞)中的地理位置數(shù)據(jù)并且在同一電子地圖進行展示。除了連線以外,圖5中的實施例還可以標注連接兩個地理位置數(shù)據(jù)的動詞,如用動詞“threatening”對連接希臘和美國的連線進行額外標注。圖6示出了按照本發(fā)明的另一個實施例將不同主題下的多篇文檔中的地理位置數(shù)據(jù)進行處理后所呈現(xiàn)的電子地圖。圖6中的兩篇文檔,一篇是關于希臘債務危機的,另一篇是關于冰島火山爆發(fā)的??梢允褂貌煌伾倪B線在同一電子地圖上呈現(xiàn)關于不同主題的地理位置數(shù)據(jù)的相互關聯(lián)關系。圖7示出了按照本發(fā)明的一種實施例對文檔中的地理位置數(shù)據(jù)進行處理的系統(tǒng)框圖。圖7中的系統(tǒng)包括地理位置數(shù)據(jù)獲取裝置、關聯(lián)關系確定裝置、標注裝置和呈現(xiàn)裝置。其中地理位置數(shù)據(jù)獲取裝置用于獲取所述文檔中的地理位置數(shù)據(jù)。關聯(lián)關系確定裝置用于按照預定條件對所述地理位置數(shù)據(jù)進行分級以確定地理位置數(shù)據(jù)的相互關聯(lián)關系。標注裝置用于在電子地圖上對所述地理位置數(shù)據(jù)的相互關聯(lián)關系進行標注。呈現(xiàn)裝置用于呈現(xiàn)經(jīng)標注后的電子地圖。其中關聯(lián)關系確定裝置所依據(jù)的預定條件包括下面各項中的一項或多項按照所述地理位置數(shù)據(jù)的重要程度進行分級;按照所述地理位置數(shù)據(jù)所代表的事件的因果關系進行分級;按照所述地理位置數(shù)據(jù)所代表的事件的時間順序進行分級。如果所述預定條件為按照所述地理位置數(shù)據(jù)的重要程度進行分級,則所述關聯(lián)關系確定裝置進一步包括重要程度特征確定裝置,用于確定判斷地理位置數(shù)據(jù)的重要程度的特征;以及重要程度判斷裝置,用于按照上述判斷地理位置數(shù)據(jù)的重要程度的特征對文檔中的地理位置數(shù)據(jù)的重要程度進行判斷,其中所述特征包括下列各項中的一項或多項 地理位置數(shù)據(jù)在文檔中的出現(xiàn)位置、地理位置數(shù)據(jù)在文檔中的出現(xiàn)次數(shù)。如果所述預定條件為按照所述地理位置數(shù)據(jù)所代表的事件的因果關系進行分級, 則所述關聯(lián)關系確定裝置進一步包括語法結構分析裝置、因果關系判斷裝置和因果關系確定裝置。其中語法結構分析裝置用于對所述地理位置數(shù)據(jù)出現(xiàn)的上下文按照語法結構進行分詞。因果關系判斷裝置用于根據(jù)所述分詞結果判斷所述上下文中是否包含表達地理位置數(shù)據(jù)所代表的事件的因果關系的詞語。因果關系確定裝置用于按照所述判斷結果確定地理位置數(shù)據(jù)所代表的事件之間的因果關系。如果所述預定條件為按照所述地理位置數(shù)據(jù)所代表的事件的時間順序進行分級, 則所述關聯(lián)關系確定裝置進一步包括語法結構分析裝置、時間順序判斷裝置以及時間順序確定裝置。其中語法結構分析裝置用于對所述地理位置數(shù)據(jù)出現(xiàn)的上下文按照語法結構進行分詞。時間順序判斷裝置用于根據(jù)所述分詞結果判斷所述上下文中是否包含表達地理位置數(shù)據(jù)所代表的事件的時間順序的詞語。時間順序確定裝置用于按照所述判斷結果確定地理位置數(shù)據(jù)所代表的事件之間的時間順序。按照本發(fā)明的一種實施例,所述關聯(lián)關系確定裝置還可以進一步包括一個過濾裝置。所述過濾裝置用于根據(jù)地理位置數(shù)據(jù)出現(xiàn)的上下文,過濾掉不需要被標注的地理位置數(shù)據(jù)。按照本發(fā)明的一種實施例,所述標注裝置進一步用于使用連線標注所述地理位置數(shù)據(jù)的相互關聯(lián)關系。按照本發(fā)明的另一種實施例,所述標注裝置進一步用于使用等高線標注所述地理位置數(shù)據(jù)的相互關聯(lián)關系。圖7中的各個裝置與圖1中的各個步驟對應,因此在介紹圖1中的方法時所描述的各種具體實施方式
在下文中不再做重復描述。圖8示出了按照本發(fā)明的另一種實施例對文檔中的地理位置數(shù)據(jù)進行處理的系統(tǒng)框圖。圖8中的系統(tǒng)包括地理位置數(shù)據(jù)獲取裝置、消歧裝置、關聯(lián)關系確定裝置、定位裝
1置、標注裝置、首選層次確定裝置以及呈現(xiàn)裝置。其中地理位置數(shù)據(jù)獲取裝置、關聯(lián)關系確定裝置、標注裝置以及呈現(xiàn)裝置與圖7中的各個裝置相同,對于其具體功能和實現(xiàn)方式在此不再重復描述。圖8中的系統(tǒng)比圖7中的系統(tǒng)多了三個裝置消歧裝置、定位裝置、呈現(xiàn)裝置。其中消歧裝置用于對所獲取的地理位置數(shù)據(jù)進行消歧,包括用統(tǒng)一的方式表達所述地理位置數(shù)據(jù)。定位裝置用于對所述地理位置數(shù)據(jù)進行具體定位,從而用所述地理位置數(shù)據(jù)的細粒度表示代表所述地理位置數(shù)據(jù)。首選層次確定裝置用于確定經(jīng)標注后的電子地圖的用于呈現(xiàn)的首選層次,從而使得所述呈現(xiàn)裝置進一步按照所述首選層次呈現(xiàn)經(jīng)標注后的電子地圖。圖8中的各個裝置與圖2中的各個步驟對應,因此在介紹圖2中的方法時所描述的各種具體實施方式
在下文中不再做重復描述。所屬技術領域的技術人員知道,本發(fā)明可以體現(xiàn)為系統(tǒng)、方法或計算機程序產品。 因此,本發(fā)明可以具體實現(xiàn)為以下形式,即,可以是完全的硬件、完全的軟件(包括固件、駐留軟件、微代碼等)、或者本文一般稱為“電路”、“模塊”或“系統(tǒng)”的軟件部分與硬件部分的組合。此外,本發(fā)明還可以采取體現(xiàn)在任何有形的表達介質(medium of expression)中的計算機程序產品的形式,該介質中包含計算機可用的程序碼??梢允褂靡粋€或多個計算機可用的或計算機可讀的介質的任何組合。計算機可用的或計算機可讀的介質例如可以是——但不限于——電的、磁的、光的、電磁的、紅外線的、或半導體的系統(tǒng)、裝置、器件或傳播介質。計算機可讀介質的更具體的例子(非窮舉的列表)包括以下有一個或多個導線的電連接、便攜式計算機磁盤、硬盤、隨機存取存儲器 (RAM)、只讀存儲器(ROM)、可擦式可編程只讀存儲器(EPR0M或閃存)、光纖、便攜式緊湊磁盤只讀存儲器(CD-ROM)、光存儲器件、諸如支持因特網(wǎng)或內部網(wǎng)的傳輸介質、或者磁存儲器件。注意計算機可用的或計算機可讀的介質甚至可以是上面印有程序的紙張或者其它合適的介質,這是因為,例如可以通過電掃描這種紙張或其它介質,以電子方式獲得程序,然后以適當?shù)姆绞郊右跃幾g、解釋或處理,并且必要的話在計算機存儲器中存儲。在本文件的語境中,計算機可用的或計算機可讀的介質可以是任何含有、存儲、傳達、傳播、或傳輸供指令執(zhí)行系統(tǒng)、裝置或器件使用的或與指令執(zhí)行系統(tǒng)、裝置或器件相聯(lián)系的程序的介質。計算機可用的介質可包括在基帶中或者作為載波一部分傳播的、由其體現(xiàn)計算機可用的程序碼的數(shù)據(jù)信號。計算機可用的程序碼可以用任何適當?shù)慕橘|傳輸,包括-但不限于-無線、電線、 光纜、RF等等。用于執(zhí)行本發(fā)明的操作的計算機程序碼,可以以一種或多種程序設計語言的任何組合來編寫,所述程序設計語言包括面向對象的程序設計語言-諸如JaVa、Smalltalk、C++ 之類,還包括常規(guī)的過程式程序設計語言-諸如” C”程序設計語言或類似的程序設計語言。程序碼可以完全地在用戶的計算上執(zhí)行、部分地在用戶的計算機上執(zhí)行、作為一個獨立的軟件包執(zhí)行、部分在用戶的計算機上部分在遠程計算機上執(zhí)行、或者完全在遠程計算機或服務器上執(zhí)行。在后一種情形中,遠程計算機可以通過任何種類的網(wǎng)絡——包括局域網(wǎng) (LAN)或廣域網(wǎng)(WAN)-連接到用戶的計算機,或者,可以(例如利用因特網(wǎng)服務提供商來通過因特網(wǎng))連接到外部計算機。以下參照按照本發(fā)明實施例的方法、裝置(系統(tǒng))和計算機程序產品的流程圖和/ 或框圖描述本發(fā)明。要明白的是,流程圖和/或框圖的每個方框以及流程圖和/或框圖中各方框的組合,都可以由計算機程序指令實現(xiàn)。這些計算機程序指令可以提供給通用計算機、專用計算機或其它可編程數(shù)據(jù)處理裝置的處理器,從而生產出一種機器,使得通過計算機或其它可編程數(shù)據(jù)處理裝置執(zhí)行的這些指令,產生實現(xiàn)流程圖和/或框圖中的方框中規(guī)定的功能/操作的裝置。也可以把這些計算機程序指令存儲在能指令計算機或其它可編程數(shù)據(jù)處理裝置以特定方式工作的計算機可讀介質中,這樣,存儲在計算機可讀介質中的指令產生一個包括實現(xiàn)流程圖和/或框圖中的方框中規(guī)定的功能/操作的指令裝置(instruction means) 的制造品。也可以把計算機程序指令加載到計算機或其它可編程數(shù)據(jù)處理裝置上,使得在計算機或其它可編程數(shù)據(jù)處理裝置上執(zhí)行一系列操作步驟,以產生計算機實現(xiàn)的過程,從而在計算機或其它可編程裝置上執(zhí)行的指令就提供實現(xiàn)流程圖和/或框圖中的方框中規(guī)定的功能/操作的過程。附圖中的流程圖和框圖,圖示了按照本發(fā)明各種實施例的系統(tǒng)、方法和計算機程序產品的可能實現(xiàn)的體系架構、功能和操作。在這點上,流程圖或框圖中的每個方框可以代表一個模塊、程序段、或代碼的一部分,所述模塊、程序段、或代碼的一部分包含一個或多個用于實現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應當注意,在有些作為替換的實現(xiàn)中,方框中所標注的功能也可以以不同于附圖中所標注的順序發(fā)生。例如,兩個接連地表示的方框實際上可以基本并行地執(zhí)行,它們有時也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來實現(xiàn),或者可以用專用硬件與計算機指令的組合來實現(xiàn)。本文中所用的術語,僅僅是為了描述特定的實施例,而不意圖限定本發(fā)明。本文中所用的單數(shù)形式的“一”和“該”,旨在也包括復數(shù)形式,除非上下文中明確地另外指出。還要知道,“包含”一詞在本說明書中使用時,說明存在所指出的特征、整體、步驟、操作、單元和/或組件,但是并不排除存在或增加一個或多個其它特征、整體、步驟、操作、單元和/或組件,以及/或者它們的組合。權利要求中的對應結構、材料、操作以及所有功能性限定的裝置(means)或步驟的等同替換,旨在包括任何用于與在權利要求中具體指出的其它單元相組合地執(zhí)行該功能的結構、材料或操作。所給出的對本發(fā)明的描述其目的在于示意和描述,并非是窮盡性的, 也并非是要把本發(fā)明限定到所表述的形式。對于所屬技術領域的普通技術人員來說,在不偏離本發(fā)明范圍和精神的情況下,顯然可以作出許多修改和變型。對實施例的選擇和說明, 是為了最好地解釋本發(fā)明的原理和實際應用,使所屬技術領域的普通技術人員能夠明了, 本發(fā)明可以有適合所要的特定用途的具有各種改變的各種實施方式。
權利要求
1.一種對文檔中的地理位置數(shù)據(jù)進行處理的方法,包括 獲取所述文檔中的地理位置數(shù)據(jù);按照預定條件對所述地理位置數(shù)據(jù)進行分級以確定地理位置數(shù)據(jù)的相互關聯(lián)關系; 在電子地圖上對所述地理位置數(shù)據(jù)的相互關聯(lián)關系進行標注;以及呈現(xiàn)經(jīng)標注后的電子地圖。
2.如權利要求1所述的方法,進一步包括對所獲取的地理位置數(shù)據(jù)進行消歧,包括用統(tǒng)一的方式表達所述地理位置數(shù)據(jù)。
3.如權利要求1所述的方法,其中所述預定條件進一步包括下面各項中的一項或多項按照所述地理位置數(shù)據(jù)的重要程度進行分級;按照所述地理位置數(shù)據(jù)所代表的事件的因果關系進行分級;按照所述地理位置數(shù)據(jù)所代表的事件的時間順序進行分級。
4.如權利要求3所述的方法,其中如果所述預定條件為按照所述地理位置數(shù)據(jù)的重要程度進行分級,則所述按照預定條件對所述地理位置數(shù)據(jù)進行分級以確定地理位置數(shù)據(jù)的相互關聯(lián)關系進一步包括 確定判斷地理位置數(shù)據(jù)的重要程度的特征;按照上述判斷地理位置數(shù)據(jù)的重要程度的特征對文檔中的地理位置數(shù)據(jù)的重要程度進行判斷,其中所述特征包括下列各項中的一項或多項地理位置數(shù)據(jù)在文檔中的出現(xiàn)位置、地理位置數(shù)據(jù)在文檔中的出現(xiàn)次數(shù)。
5.如權利要求3所述的方法,其中如果所述預定條件為按照所述地理位置數(shù)據(jù)所代表的事件的因果關系進行分級, 則所述按照預定條件對所述地理位置數(shù)據(jù)進行分級以確定地理位置數(shù)據(jù)的相互關聯(lián)關系進一步包括對所述地理位置數(shù)據(jù)出現(xiàn)的上下文按照語法結構進行分詞;根據(jù)所述分詞結果判斷所述上下文中是否包含表達地理位置數(shù)據(jù)所代表的事件的因果關系的詞語;以及按照所述判斷結果確定地理位置數(shù)據(jù)所代表的事件之間的因果關系。
6.如權利要求3所述的方法,其中如果所述預定條件為按照所述地理位置數(shù)據(jù)所代表的事件的時間順序進行分級, 則所述按照預定條件對所述地理位置數(shù)據(jù)進行分級以確定地理位置數(shù)據(jù)的相互關聯(lián)關系進一步包括對所述地理位置數(shù)據(jù)出現(xiàn)的上下文按照語法結構進行分詞;根據(jù)所述分詞結果判斷所述上下文中是否包含表達地理位置數(shù)據(jù)所代表的事件的時間順序的詞語;以及按照所述判斷結果確定地理位置數(shù)據(jù)所代表的事件之間的時間順序。
7.如權利要求1所述的方法,其中所述按照預定條件對所述地理位置數(shù)據(jù)進行分級以確定地理位置數(shù)據(jù)的相互關聯(lián)關系進一步包括根據(jù)地理位置數(shù)據(jù)出現(xiàn)的上下文,過濾掉不需要被標注的地理位置數(shù)據(jù)。
8.如權利要求1所述的方法,進一步包括對所述地理位置數(shù)據(jù)進行具體定位,從而用所述地理位置數(shù)據(jù)的細粒度表示代表所述地理位置數(shù)據(jù)。
9.如權利要求1所述的方法,進一步包括確定經(jīng)標注后的電子地圖的用于呈現(xiàn)的首選層次,并且所述呈現(xiàn)經(jīng)標注后的電子地圖進一步包括按照所述首選層次呈現(xiàn)經(jīng)標注后的電子地圖。
10.如權利要求1-9中任意一個所述的方法,所述在電子地圖上對所述地理位置數(shù)據(jù)及其相互關聯(lián)關系進行標注進一步包括使用下列各項中的一項或多項標注所述地理位置數(shù)據(jù)的相互關聯(lián)關系連線、等高線、 所述文檔中連接地理位置數(shù)據(jù)的動詞。
11.一種對文檔中的地理位置數(shù)據(jù)進行處理的系統(tǒng),包括地理位置數(shù)據(jù)獲取裝置,用于獲取所述文檔中的地理位置數(shù)據(jù); 關聯(lián)關系確定裝置,用于按照預定條件對所述地理位置數(shù)據(jù)進行分級以確定地理位置數(shù)據(jù)的相互關聯(lián)關系;標注裝置,用于在電子地圖上對所述地理位置數(shù)據(jù)的相互關聯(lián)關系進行標注;以及呈現(xiàn)裝置,用于呈現(xiàn)經(jīng)標注后的電子地圖。
12.如權利要求11所述的系統(tǒng),進一步包括消歧裝置,用于對所獲取的地理位置數(shù)據(jù)進行消歧,包括用統(tǒng)一的方式表達所述地理位置數(shù)據(jù)。
13.如權利要求11所述的系統(tǒng),其中所述預定條件進一步包括下面各項中的一項或多項按照所述地理位置數(shù)據(jù)的重要程度進行分級; 按照所述地理位置數(shù)據(jù)所代表的事件的因果關系進行分級; 按照所述地理位置數(shù)據(jù)所代表的事件的時間順序進行分級。
14.如權利要求13所述的系統(tǒng),其中如果所述預定條件為按照所述地理位置數(shù)據(jù)的重要程度進行分級,則所述關聯(lián)關系確定裝置進一步包括重要程度特征確定裝置,用于確定判斷地理位置數(shù)據(jù)的重要程度的特征;以及重要程度判斷裝置,用于按照上述判斷地理位置數(shù)據(jù)的重要程度的特征對文檔中的地理位置數(shù)據(jù)的重要程度進行判斷,其中所述特征包括下列各項中的一項或多項地理位置數(shù)據(jù)在文檔中的出現(xiàn)位置、地理位置數(shù)據(jù)在文檔中的出現(xiàn)次數(shù)。
15.如權利要求13所述的系統(tǒng),其中如果所述預定條件為按照所述地理位置數(shù)據(jù)所代表的事件的因果關系進行分級, 則所述關聯(lián)關系確定裝置進一步包括語法結構分析裝置,用于對所述地理位置數(shù)據(jù)出現(xiàn)的上下文按照語法結構進行分詞; 因果關系判斷裝置,用于根據(jù)所述分詞結果判斷所述上下文中是否包含表達地理位置數(shù)據(jù)所代表的事件的因果關系的詞語;以及因果關系確定裝置,用于按照所述判斷結果確定地理位置數(shù)據(jù)所代表的事件之間的因果關系。
16.如權利要求13所述的系統(tǒng),其中如果所述預定條件為按照所述地理位置數(shù)據(jù)所代表的事件的時間順序進行分級, 則所述關聯(lián)關系確定裝置進一步包括語法結構分析裝置,用于對所述地理位置數(shù)據(jù)出現(xiàn)的上下文按照語法結構進行分詞; 時間順序判斷裝置,用于根據(jù)所述分詞結果判斷所述上下文中是否包含表達地理位置數(shù)據(jù)所代表的事件的時間順序的詞語;以及時間順序確定裝置,用于按照所述判斷結果確定地理位置數(shù)據(jù)所代表的事件之間的時間順序。
17.如權利要求11所述的系統(tǒng),其中所述關聯(lián)關系確定裝置進一步包括過濾裝置,用于根據(jù)地理位置數(shù)據(jù)出現(xiàn)的上下文,過濾掉不需要被標注的地理位置數(shù)據(jù)。
18.如權利要求11所述的系統(tǒng),進一步包括定位裝置,用于對所述地理位置數(shù)據(jù)進行具體定位,從而用所述地理位置數(shù)據(jù)的細粒度表示代表所述地理位置數(shù)據(jù)。
19.如權利要求12所述的系統(tǒng),進一步包括首選層次確定裝置,確定經(jīng)標注后的電子地圖的用于呈現(xiàn)的首選層次,并且所述呈現(xiàn)裝置進一步按照所述首選層次呈現(xiàn)經(jīng)標注后的電子地圖。
20.如權利要求11-19中任意一個所述的系統(tǒng),所述標注裝置進一步用于使用下列各項中的一項或多項標注所述地理位置數(shù)據(jù)的相互關聯(lián)關系連線、等高線、所述文檔中連接地理位置數(shù)據(jù)的動詞。
全文摘要
本發(fā)明提出了一種對文檔中的地理位置數(shù)據(jù)進行處理的技術將文檔中的地理位置數(shù)據(jù)與電子地圖技術進行結合,開創(chuàng)了一種全新的信息瀏覽方式。利用本發(fā)明用戶可以容易的、直觀的、自動的在電子地圖上看到其所瀏覽的文檔中的地理位置數(shù)據(jù)及地理位置數(shù)據(jù)的相互關系。具體而言,本發(fā)明提供一種對文檔中的地理位置數(shù)據(jù)進行處理的方法,包括獲取所述文檔中的地理位置數(shù)據(jù);按照預定條件對所述地理位置數(shù)據(jù)進行分級以確定地理位置數(shù)據(jù)的相互關聯(lián)關系;在電子地圖上對所述地理位置數(shù)據(jù)的相互關聯(lián)關系進行標注;以及呈現(xiàn)經(jīng)標注后的電子地圖。此外,本發(fā)明還提供一種對文檔中的地理位置數(shù)據(jù)進行處理的系統(tǒng)。
文檔編號G09B29/00GK102456046SQ20101052640
公開日2012年5月16日 申請日期2010年10月25日 優(yōu)先權日2010年10月25日
發(fā)明者吳賢, 蘇中, 費奔, 陳健, 馬瑞 申請人:國際商業(yè)機器公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
五指山市| 四平市| 德钦县| 喜德县| 玉林市| 营山县| 舞阳县| 神池县| 桐庐县| 玛多县| 合肥市| 利川市| 江西省| 尚义县| 郁南县| 东兴市| 平舆县| 九江县| 康保县| 修文县| 铁岭市| 东莞市| 屯门区| 蓝山县| 顺义区| 溧水县| 新蔡县| 隆回县| 瑞昌市| 东光县| 和政县| 克拉玛依市| 赤壁市| 莆田市| 徐州市| 沙洋县| 探索| 东港市| 郸城县| 黔江区| 永胜县|