欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

確定組織在不同語言中的名稱的方法和系統(tǒng)的制作方法

文檔序號:6469928閱讀:150來源:國知局

專利名稱::確定組織在不同語言中的名稱的方法和系統(tǒng)的制作方法
技術領域
:本發(fā)明一般涉及組織名稱的確定,尤其涉及根據(jù)組織在源語言中的名稱來確定其在目標語言中的名稱。
背景技術
:為了增強國際影響力,很多組織具有多種語言的名稱,其中一個組織在不同語言中的名稱相互之間具有某種相似性。例如,中文名稱"思科,,和"谷歌"分別源自其英文名稱"Cisco,,和"Google"的發(fā)音,而英文名稱"SinoOceanLand,,和"ChinaMobile"分別是其中文名稱"遠洋地產(chǎn)"和"中國移動"的字義翻譯。組織名稱的確定對于信息提取和檢索非常重要,尤其是對于商業(yè)智能應用和搜索引擎而言。在知道某組織在一種語言中的名稱的情況下,為了從萬維網(wǎng)上收集關于該組織的各種語言的信息,需要根據(jù)該組織在這種語言中的名稱確定該組織在其他語言中的名稱,從而檢索搜索引擎和獲得搜索結果。但是,組織名稱的確定非常難。首先,一個組織在不同語言中的名稱之間的相似性可以是多種多樣的,諸如可以是意思,發(fā)音等等,因此機器很難對一組織在不同語言中的名稱之間所具有的相似性進行預測,進而對組織名稱進行準確的確定。其次,組織名稱的確定要求非常高的準確性,因為其將被發(fā)送用于進一步的處理。在現(xiàn)有技術中,已經(jīng)存在三種確定組織名稱的方法1.直接映射方法,在該方法中,維持一個表格,該表格存儲組織在不同語言中的名稱之間的映射關系。但是,組織的數(shù)量不斷地增加,并且語言映射的組合非常多,因此,維持這樣的映射表格很困難并且成本很高。2.基于機器翻譯的方法,其對名稱進行切詞,從而得到較小的詞單元,然后借助于字典分別翻譯所得到的每個詞單元,最后通過機器學習技術將每個詞單元的翻譯結果組合在一起。但是,這種方法不適用于根據(jù)發(fā)音或以其他非字義的形式所生成的名稱。而且,即使對于由意思相似性所生成的名稱,這樣的直接翻譯也不可能得到準確的名稱。而且,以上兩種方法要求大量的手動工作。3.基于網(wǎng)絡搜索的方法,其直接將組織在源語言中的名稱輸入到搜索引擎進行查詢,然后從搜索結果中所出現(xiàn)的英文短語中選擇該組織的英文名稱。但是,有時候在搜索結果中只有很少的英文內(nèi)容。而且,并沒有關于如何挑選準確英文名稱的準則,且可能同時僅選擇了某種噪聲。因此,需要一種確定組織名稱的方法和裝置來更有效、更準確地確定目標語言中的組織名稱,從而克服現(xiàn)有技術中的缺陷。
發(fā)明內(nèi)容本發(fā)明利用組織的網(wǎng)址URL(統(tǒng)一資源定位符)信息來根據(jù)組織在源語言(例如非英語語言)中的名稱確定該組織在目標語言(例如英語)的名稱??蛇x地,通過本發(fā)明,還可以以目標語言中的名稱為媒介來進一步確定組織在另一目標語言中的名稱。在現(xiàn)有技術中,已知可以以多種方式獲取組織的網(wǎng)址URL,例如可以借助于搜索引擎、其他外部數(shù)據(jù)源等。特別地,在當前的搜索引擎領域中,各種搜索引擎都通過各種方法盡量使自己的搜索結果更準確。例如,Google用其所開發(fā)的基于網(wǎng)絡鏈接構造的PageRank方法來確定網(wǎng)絡上頁面的重要性,并在搜索結果列表中根據(jù)頁面的重要性對搜索結果進行排序。通常,對于組織名稱作為查詢項的搜索,搜索引擎認為該組織的主頁的重要性最高,并將該組織的主頁列在搜索結果列表中的第一個搜索結果或前幾個搜索結果中。因此借助于搜索引擎可以很容易地獲得鏈接到該組織的主頁的該組織的網(wǎng)址URL。組織網(wǎng)址URL通常由該組織的名稱的完整表達或縮寫(例如英文首字母縮寫)構成,即其能夠比較準確地反映組織名稱的特征,因此本發(fā)明所提供的基于組織網(wǎng)址URL的組織名稱確定方法和裝置能夠更有效、更準確地從一種語言中的組織名稱確定另外一種語言中的組織名稱。根據(jù)本發(fā)明的一個方面,提供了一種根據(jù)源語言中的名稱確定目標語言中的名稱的方法,包括網(wǎng)址URL獲取步驟,基于至少一個組織在源語言中的名稱,獲取所述至少一個組織的網(wǎng)址URL,其中網(wǎng)址URL由目標語言中的字符串構成;查詢項生成步驟,從網(wǎng)址URL的核心部分中提取目標語言中的詞,并與所述至少一個組織在源語言中的名稱形成組合查詢項;查詢項搜索步驟,借助于搜索引擎,獲取組合查詢項的搜索結果列表;組織名稱確定步驟,從搜索結果列表中所列出的搜索結果中提取目標語言中的短語,并選擇其中至少一個短語作為所述至少一個組織在目標語言中的名稱。根據(jù)本發(fā)明的另一方面,提供了一種根據(jù)源語言中的名稱確定目標語言中的名稱的設備,包括網(wǎng)址URL獲取裝置,用于基于至少一個組織在源語言中的名稱,獲取所述至少一個組織的網(wǎng)址URL,其中網(wǎng)址URL由目標語言中的字符串構成;查詢項生成裝置,用于從網(wǎng)址URL的核心部分中提取目標語言中的詞,并與所迷至少一個組織在源語言中的名稱形成組合查詢項;查詢項搜索裝置,用于借助于搜索引擎,獲取組合查詢項的搜索結果列表;組織名稱確定裝置,用于從搜索結果列表中所列出的搜索結果中提取目標語言中的短語,并選擇其中至少一個短語作為所述至少一個組織在目標語言中的名稱。根據(jù)本發(fā)明的再一方面,提供了一種網(wǎng)絡瀏覽器,包括查詢項輸入裝置,用于接收至少一個組織在源語言中的名稱作為查詢項;根據(jù)本發(fā)明的根據(jù)源語言中的名稱確定目標語言中的名稱的設備,用于基于所接收的組織名稱,確定所述至少一個組織在目標語言中的名稱;搜索結果獲取裝置,用于借助于搜索引擎,獲取搜索結果列表,其中搜索結果列表至少包括與所確定的所述至少一個組織在目標語言中的名稱相關的搜索結果。9根據(jù)本發(fā)明的還一方面,提供了一種搜索引擎系統(tǒng),包括查詢項接收裝置,用于接收至少一個組織在源語言中的名稱作為查詢項;根據(jù)本發(fā)明的根據(jù)源語言中的名稱確定目標語言中的名稱的設備,用于基于所接收的組織名稱,確定所述至少一個組織在目標語言中的名稱;搜索結果提供裝置,用于提供搜索結果列表,其中搜索結果列表至少包括與所確定的所述至少一個組織在目標語言中的名稱相關的搜索結果。為了更好地理解本發(fā)明的實施例以及本發(fā)明的其它實施例,下面結合附圖對這些實施例加以描述,其中在附圖中,相同的附圖標記自始至終表示相應的部分。圖1示意性地示出了根據(jù)本發(fā)明的組織名稱確定方法的一個實施例的流程圖2示意性地示出了根據(jù)圖1所示組織名稱確定方法中步驟S104的一種實施方式的流程圖3示意性地示出了根據(jù)本發(fā)明的組織名稱確定設備的一個實施例的框圖4示意性地示出了根據(jù)圖3所示組織名稱確定設備中組織名稱選擇裝置的一個實施方式的框圖5以"遠洋地產(chǎn)"作為源語言中的組織名稱為例示出了根據(jù)本發(fā)明的組織名稱確定方法的工作過程;圖6示例性地示出了圖5所示例子中搜索結果列表的一部分。具體實施例方式現(xiàn)在詳細介紹例示在附圖中的實施例。在如下的詳細描述中,給出了許多具體細節(jié),以便全面理解本發(fā)明。但是,對于本領域的普通技術人員來說,顯而易見的是,不用這些具體細節(jié)也可以實施本發(fā)明。在其它情況下,不詳細描述眾所周知的方法、過程、部件、電路和網(wǎng)絡,以便不會不必要地使這些實施例的方方面面不突出。在本說明書中,術語"URL,,是指統(tǒng)一資源定位符,它是表示可經(jīng)由互聯(lián)網(wǎng)獲得的資源的簡要字符串。當前,URL主要是由英文字符串構成的,但是URL也可以由非英文的字符串構成(例如由中文、法文、德文字符串構成的URL)??梢韵氲剑瑢τ谝粋€組織的主頁,可以有多個網(wǎng)址URL鏈接到該主頁,其中這些網(wǎng)址URL可以分別由不同語言的字符串構成。至于網(wǎng)址URL所使用的語言,例如可以通過對構成網(wǎng)址URL的字符串中的字符(例如中文字)進行分析而確定該網(wǎng)址URL由什么語言的字符串構成。也可以想到,可以通過對構成網(wǎng)址URL的字符串中的詞進行分析來確定網(wǎng)址URL的語言。當然,也可以通過參考網(wǎng)址URL中標識地址的地理位置的部分(例如".中國"、".uk,,等)來確定構成網(wǎng)址URL由什么語言的字符串構成。本領域技術人員可以想到,在對一個組織在一種語言中的名稱執(zhí)行搜索之后,搜索引擎可以將鏈接到該組織的主頁的由不同語言字符串構成的所有網(wǎng)址URL列在搜索結果列表的最前端。在本說明書中,術語"字符,,是指一種語言中的最小文字單位,例如英文中的字母(諸如"o"、"c,,等)、中文中的字(諸如"地"、"產(chǎn)"等)。而術語"詞,,是指由一種語言中的最小文字單位所構成的有意義的詞,例如英文中的單詞(諸如"ocean,,、"land,,等)、中文中的詞語(諸如"地產(chǎn),,等)。術語"短語"是指一種語言中的詞和/或字符的某個組合,例如英文中幾個單詞和/或字母的組合(諸如"sino-oceanlandholdingslimited")、中文中幾個詞語和/或字的組合(諸如"遠洋地產(chǎn),,)。在本說明書中,術語"源語言"是指這樣一種語言,即根據(jù)該語言中的組織名稱來確定另一語言中的組織名稱。而術語"目標語言"是指所要確定的組織名稱所處于的那"另一"語言。組織網(wǎng)址的URL通常是一種語言(例如英文)中完整的或縮寫的組織名稱。本發(fā)明利用URL信息,通過以下方式來根據(jù)源語言中的名稱確定目標語言中的名稱。首先,根據(jù)至少一個組織在源語言中的名稱,獲得該至少一個組織的網(wǎng)址URL,其中所述網(wǎng)址URL由目的語言的字符串構成;然后,從所獲得的網(wǎng)址URL的核心部分中提取目標語言中的詞,并與該至少一個組織在源語言中的名稱形成組合查詢項;借助于搜索引擎對組合查詢項執(zhí)行搜索,以獲取該組合查詢項的搜索結果列表;最后從搜索結果列表中所列出的搜索結果中提取目標語言中的短語,并選擇其中至少一個短語作為該至少一個組織在目標語言中的名稱。如上所述,組織的網(wǎng)址URL通常比較準確地反映組織名稱的特征,因此在確定組織名稱的過程中利用其網(wǎng)址URL能夠提高組織名稱確定的準確性和有效性。圖1示出了根據(jù)本發(fā)明的組織名稱確定方法的一個實施例的流程圖。如圖1所示,在步驟S101中,根據(jù)至少一個組織在源語言中的名稱,獲取該至少一個組織的網(wǎng)址URL,其中所獲得的網(wǎng)址URL由目的語言的字符串構成。例如,可以通過借助于搜索引擎(例如Google或者百度)對組織在源語言中的名稱執(zhí)行搜索而獲得該組織的網(wǎng)址URL,但這不是必需的。本領域技術人員應當理解,可以通過其他任何方式來根據(jù)組織名稱獲取該組織的網(wǎng)址URL,而不背離本發(fā)明的精神和范圍。例如可選地,可以從其他外部數(shù)據(jù)源(例如組織名稱與其網(wǎng)址URL的映射表格等)獲取組織的網(wǎng)址URL。隨后,在步驟S102中,從所獲得的網(wǎng)址URL的核心部分中提取目標語言中的詞,并與該至少一個組織在源語言中的名稱形成組合查詢項。可選地,可以基于目標語言字典而提取目標語言中的詞。例如以一個英文(目標語言)網(wǎng)址URL的核心部分為"sinooceanland,,的組織名稱"遠洋地產(chǎn),,為例,在步驟S102中,例如參考英文字典而從網(wǎng)址URL核心部分中提取出英文詞"ocean"和"land",并將所提取出的這兩個英文詞與中文(源語言)組織名稱"遠洋地產(chǎn)"組合在一起形成組合查詢項,例如"oceanland遠洋地產(chǎn)"。當然,本領域技術人員也可以想到,對于多于一個的組織名稱,可以將這些組織的網(wǎng)址URL核心部分中所提取的目標語言中的詞與這些組織名稱組合一12起形成組合查詢項??蛇x地,如果在步驟S102中,沒有從該至少一個組織中某個或某些組織的網(wǎng)址URL的核心部分中提取出目標語言中的詞,即這個或這些組織的網(wǎng)址URL的核心部分中不包含目標語言中的詞,則步驟S102將這個或這些組織的網(wǎng)址URL的整個核心部分組合到組合查詢項中。例如,對于一個英文(目標語言)網(wǎng)址URL的核心部分是"ICBC"(即其英文名稱的首字母縮寫)的組織名稱"中國工商銀行",由于網(wǎng)址URL的核心部分"ICBC,,中不包含任何英文詞,因此步驟S102不能從網(wǎng)址URL核心部分中提取出任何英文詞。于是,步驟S102直接將網(wǎng)址URL的核心部分"ICBC,,組合到組合查詢項中,即直接將網(wǎng)址URL的核心部分"ICBC,,與其中文(源語言)組織名稱"中國工商銀行"組合在一起形成組合查詢項。當然,本領域技術人員可以想到,對于多于一個的組織,如果這些組織中一部分的網(wǎng)址URL核心部分中包含目標語言中的詞,而這些組織中其他組織的網(wǎng)址URL核心部分中不包含目標語言中的詞,則步驟S102將包含目標語言中的詞的那些組織網(wǎng)址URL核心部分中所包含的目標語言中的詞、不包含目標語言中的詞的那些組織網(wǎng)址URL的核心部分以及這些(多于一個的)組織在源語言中的名稱組合在一起形成組合查詢項。在本發(fā)明中,網(wǎng)址URL的核心部分例如可以是通過從網(wǎng)址URL中濾除前綴(例如英文URL中的"http:〃www")和后綴(例如英文URL中的".com"、",net,,等)而獲得的。在步驟S102中形成組合查詢項之后,根據(jù)本發(fā)明的方法前進到步驟S103。在步驟S103中,借助于搜索引擎,對步驟S102中所生成的組合查詢項執(zhí)行搜索,從而得到一個搜索結果列表,在搜索結果列表中列出了搜索結果。例如,在搜索結果列表中列出了搜索結果的標題及摘錄,并且通過點擊搜索結果列表中的某個搜索結果(例如該搜索結果的標題或摘錄),可以鏈接到該搜索結果的頁面。可選地,在本發(fā)明中,通過模糊匹配來執(zhí)行搜索,因為嚴格匹配搜索(例如在搜索引擎Google中,為輸入的查詢項的至少一部分加上引號)可能導13致大量有用搜索結果被濾除。隨后,在步驟S104中,從步驟S103所獲得的搜索結果列表中所列出的搜索結果中提取目標語言中的短語,并從所提取的短語中選擇至少一個作為該至少一個組織在目標語言中的名稱。例如,可以從搜索結果列表中所列出的搜索結果的標題及摘錄中提取目標語言中的短語。可選地,也可以經(jīng)由搜索結果列表(例如通過點擊搜索結果列表中某個搜索結果的標題或摘錄)鏈接到搜索結果的頁面,并從搜索結果的頁面中提取目標語言中的短語。圖2示意性地示出了根據(jù)圖1所示實施例中步驟S104的一種實施方式的流程圖。如圖2所示,圖1中所示方法中步驟S104可以包括侯選名稱提取步驟S2010和組織名稱選擇步驟S2020。候選名稱提取步驟S2010從搜索結果列表中所列出的搜索結果(例如搜索結果的標題及摘錄或搜索結果的頁面)中提取目標語言中的名稱,作為候選名稱。可選地,步驟S2010包括計數(shù)步驟S2011和提取步驟S2012,其中計數(shù)步驟S2011對搜索結果(例如搜索結果的標題及摘錄或搜索結果的頁面)中所出現(xiàn)的目標語言中的每個短語的出現(xiàn)次數(shù)進行計數(shù),而提取步驟S2012從搜索結果中提取出現(xiàn)次數(shù)高于一預定閾值的短語,作為侯選名稱。有利地,在步驟S2010中,只從搜索結果列表中所列出的前N個搜索結果中提取目標語言中的短語,但這不是必需的??蛇x地,N的設定一般在100到1000之間。組織名稱選擇步驟S2020利用網(wǎng)址URL的核心部分對步驟S2010中所提取的侯選名稱進行校驗,并將通過校驗的侯選名稱選擇作為組織在目標語言中的名稱。但是,本領域技術人員應當理解,在步驟S2020中也可以使用任何其他適當?shù)姆椒?例如現(xiàn)有技術中公知的方法)來從所提取的短語(候選名稱)中選擇組織名稱,而不背離本發(fā)明的精神和范圍。由于在本發(fā)明中,在步驟S102中確定搜索的查詢項時參考了組織的網(wǎng)址URL,因此與現(xiàn)有技術相比,本發(fā)明中步驟S103所得到的搜索結果已經(jīng)比現(xiàn)有技術中的更有效和更準確,因此即使以與現(xiàn)有技術中相同的選擇標準來從搜索結果列表中選擇短語,對組織名稱的確定也比現(xiàn)有技術更有效和更準確。在圖2所示的實施方式中,步驟S2020包括利用網(wǎng)址URL的核心部分對步驟S2010中所提取的侯選名稱進行校驗的校驗步驟S2021和將通過校驗的侯選名稱選擇作為組織在目標語言中的名稱的組織名稱確定步驟S2022。在校驗步驟S2021中,可以為在步驟S2010中所提取出的每個侯選名稱計算置信度,以表征該侯選名稱與一網(wǎng)址URL核心部分的匹配程度,并對于一組織,將置信度最高的至少一個侯選名稱確定為通過了校驗。本領域技術人員可以想到,對于多于一個組織的情況,可以針對每個組織的網(wǎng)址URL的核心部分,為每個侯選名稱計算置信度,并且對于每個組織,將置信度最高的至少一個侯選名稱確定為通過了校驗。例如,在校驗步驟S2021中,如果組織的網(wǎng)址URL的核心部分中包含目標語言中的詞,則可以根據(jù)組織的網(wǎng)址URL核心部分中所包含的詞以及由這些詞分隔開的字段在侯選名稱中的出現(xiàn)情況,來計算置信度;而如果組織的網(wǎng)址URL的核心部分中不包含目標語言中的詞,則可以根據(jù)組織的網(wǎng)址URL核心部分所包含的字符在侯選名稱中的出現(xiàn)情況,來計算置信度。有利地,在校驗步驟S2021中,可以通過包含校驗2021a來為每個侯選名稱計算包含校驗值,即通過根據(jù)組織網(wǎng)址URL核心部分中所包含的目標語言中的詞及由這些詞分隔開的字段(對于網(wǎng)址URL核心部分中包含目標語言中的詞的情況)或組織網(wǎng)址URL核心部分中所包含的字符(對于網(wǎng)址URL核心部分不包含目標語言中的詞的情況)在某侯選名稱中的包含情況對該侯選名稱與組織網(wǎng)址URL核心部分的匹配程度進行度量或打分;并將所計算的包含校驗值作為置信度。在本發(fā)明中,例如可以利用信息檢索和文本挖掘(textmining)中經(jīng)常4吏用的詞頻-反文檔頻率(TF-IDF:TermFrequency-InverseDocumentFrequency)加權來執(zhí)行包含校驗2021。如本領域技術人15員所理解的那樣,詞頻(TF)是指某個詞在一文檔中出現(xiàn)的頻率,而反文檔頻率(IDF)是指所有文檔的數(shù)量除以這些文檔中包含某個詞的那些文檔的數(shù)量所得到的商。即對于詞頻TF,下式成立其中TFi表示文檔j中詞i的詞頻,Nij是文檔j中詞i的出現(xiàn)次數(shù),而對于反文檔頻率IDF,下式成立,=1_^r其中IDFi是詞ti的反文檔頻率,D是所有文檔的數(shù)量,而|{《|/,£《.}|是包含詞ti的文檔的數(shù)量。在TF-IDF加權中,使用矢量來{>^,>^,.^"}表示文檔d,其中N是詞的數(shù)量,且w,^表示詞i在文檔d中的出現(xiàn)情況,其中w,d=r尸'*/d尸,。在本發(fā)明中,侯選名稱相當于TF-IDF中的文檔,網(wǎng)址URL核心部分和侯選名稱中所包含的詞和字段或者字符相當于TF-IDF中的詞。例如,對于網(wǎng)址URL的核心部分"sinooceanland,,(包含目標語言中的詞"ocean"、"land,,和字段"sino")以及侯選名稱"SinoOceanLandHoldingsLimited"和"ChinaAoyuanPropertyGroup",所有文檔的數(shù)量是2,而所要考慮的詞和字段包括"Sino"、"Ocean"、"Land,,、"Holdings","Limited"、"China"、"Aoyuan"、"Property"和"Group"。對于這兩個侯選名稱可以得到下表<table>tableseeoriginaldocumentpage16</column></row><table>于是,得到侯選名稱"SinoOceanLandHoldingsLimited"的矢量(1/5*2/1,1/5*2/1,1/5*2/1,1/5*2/1,1/5*2/1,0*2/1,0*2/1,0*2/1,0*2/1),即(0.4,0.4,0.4,0.4,0.4,0,0,0,0),同樣得到侯選名稱"ChinaAoyuanPropertyGroup,,的矢量(0,0,0,0,0,0.5,0.5,0.5,0.5)。另外,根據(jù)網(wǎng)址URL核心部分對這些詞和字段(或者字符)的包含情況,得到基準矢量。在本例中,因為網(wǎng)址URL核心部分中只包含字段"Sino"以及詞"Ocean,,和"Land"(所以矢量中與這些字段或詞對應的數(shù)字為1),而不包含其他詞"Holdings","Limited","China","Aoyuan","Property","Group"(所以矢量中與這些詞對應的數(shù)字為0),因此基準矢量是(l,l,l,O,O,O,O,O,O)。然后通過將每個侯選名稱的矢量與該基準矢量進行點積而得到相應侯選名稱的相似性值。例如,對于上面的例子,侯選名稱"SinoOceanLandHoldingsLimited"的相似性值是1.2,而侯選名稱"ChinaAoyuanPropertyGroup,,的相似性值是0??蛇x地,為了簡化計算,可以在計算相似性值時只考慮TF,而忽略IDF,即在獲取侯選名稱的矢量時直接使用TF,而不將TF與IDF相乘。對于上面的例子,通過這種簡化的計算得到侯選名稱"SinoOceanLandHoldingsLimited,,的相似性值是0.6,而侯選名稱"ChinaAoyuanPropertyGroup,,的相似性值是0。在本發(fā)明中,可以將所計算的相似性值確定為包含校驗值。但是,可選地,也可以通過對所計算的相似性值進行歸一化處理,而將歸一化后的相似性值作為包含校驗值。這里所述的歸一化處理是指將某個侯選名稱的相似性值除以該侯選名稱的矢量的模與基準矢量的模的乘積。可選地,除了執(zhí)行包含校驗2021a之外,在校驗步驟S2021中還可以附加地執(zhí)行順序校驗2021b,為每個侯選名稱計算順序校驗值,即根據(jù)組織網(wǎng)址URL中所包含的這些詞和字段或這些字符在網(wǎng)址URL核心部分中的排列順序和這些詞和字段或這些字符出現(xiàn)在某侯選名稱中時的排列順序,對該侯選名稱與組織網(wǎng)址URL核心部分的匹配程度進行度量或打分。在本發(fā)明中,例如可以利用最長公共子序列(LCS:LongestCommonSubsequence)算法來執(zhí)行順序校驗2021b。例如,對于網(wǎng)址URL的核心部分"sinooceanland,,(包含目標語言中的詞"ocean"、"land,,和字段"sino"),侯選名稱"SinoOceanLandHoldingsLimited,,與網(wǎng)址URL核心部分"sinooceanland,,的最長公共子序列是"SinoOceanLand",該最長>^共子序列的長度為3,即該公共子序列包含網(wǎng)址URL核心部分中所包含的詞或字段中的3個;而侯選名稱"AoYuanLandandSinoOcean,,與網(wǎng)址URL核心部分"sinooceanland"的最長公共子序列是"SinoOcean",該7>共子序列的長度為2,即該公共子序列包含網(wǎng)址URL核心部分中所包含的詞或字段中的2個。通過將為每個侯選名稱所確定的最長公共子序列的長度除以網(wǎng)址URL核心部分中所包含的詞或字段的數(shù)量,而得到順序校驗值。例如,在前面的例子中,網(wǎng)址URL核心部分"sinooceanland"包含詞"ocean"、"land"和字段"sino",即其所包含的詞或字段的數(shù)量(其長度)為3,于是侯選名稱"SinoOceanLandHoldingsLimited"的順序校驗值為3/3,而侯選名稱"AoYuanLandandSinoOcean,,的順序校驗值為2/3。上面以網(wǎng)址URL核心部分中包含目標語言中的詞為例解釋了包含校驗2021a和順序校驗2021b,但是本領域4支術人員應該理解,上面所述的包含校驗順序校驗也可以應用與不包含目標語言中的詞的網(wǎng)址URL核心部分。例如,對于每個侯選名稱(短語),可以通過從該侯選名稱(短語)的每個詞或字段中提取首字符(例如英文中的首字母)來組合形成一個字符序列,然后利用前面所提到的TF-IDF和最長公共子序列算法來相對于網(wǎng)址URL核心部分所包含的字符為該侯選名稱計算包含校驗值和順序校驗值。但是,從每個詞或字段中提取首字符不是必需的,本領域技術人員也可以想到通過其他方式從一侯選名稱中提取字符以形成一字符序列,例如也可以從該侯選名稱的某詞或字段中提取非首字符的字符或者提取不止一個字符。在附加地執(zhí)行順序校驗2021b的情況下,校驗步驟S2021通過結合包含校驗值和順序校驗值而確定置信度。例如,對于某個侯選名稱,18可以通過將為該侯選名稱所確定的包含校驗值和順序校驗值加權相加而得到該侯選名稱的置信度。在圖2中所示的組織名稱確定步驟S2022中,將通過校驗的侯選名稱選擇作為組織在目標語言中的名稱??蛇x地,組織名稱確定步驟S2022只將置信度高于一預定閾值的侯選名稱選擇作為組織在目標語言中的名稱?,F(xiàn)在返回到圖1,在一種實施方式中,在步驟S104中,對于網(wǎng)址URL的核心部分中包含目標語言中的詞的情況,選擇包含網(wǎng)址URL核心部分中所包含的所有詞和由這些詞分隔開的所有字段、并且這些詞和字段在侯選名稱中的排列順序與在網(wǎng)址URL核心部分中的排列順序相同的侯選名稱作為組織在目標語言中的名稱;而對于網(wǎng)址URL的核心部分中不包含目標語言中的詞的情況,選擇包含網(wǎng)址URL核心部分中所包含的所有字符、并且這些字符在侯選名稱中的排列順序與在網(wǎng)址URL核心部分中的排列順序相同的侯選名稱作為組織在目標語言中的名稱。可選地,如果在步驟S104中,所提取的目標語言中的短語(即侯選名稱)中沒有任何一個被選擇為組織名稱,例如因為所有侯選名稱都不滿足包含網(wǎng)址URL的核心部分中所包含的所有詞和字段或所有字符且這些詞和字段或這些字符的排列順序與網(wǎng)址URL中的相同這樣的要求,或者因為所有侯選名稱的置信度都低于預定閾值,則根據(jù)本發(fā)明的方法可選地還包括以下步驟確定源語言中與組織名稱相關的前綴或后綴,例如對于前面所提到的"思科",相關的后綴可以是"公司,,;而對于組織名稱"清華",其相關的后綴可以是"大學"。與組織名稱相關的前綴的例子例如可以包括與位置信息相關的詞語,例如"中國"、"北京,,等等。與組織名稱相關的后綴的例子例如可以包括"公司"、"大學"、"醫(yī)院"、"實業(yè),,等等。并且,在步驟S102中,將在以上步驟中所確定的前綴或后綴在目標語言中的翻譯組合到所形成的組合查詢項中。然后重復后續(xù)的步驟S103和S104。以下參考圖3描述根據(jù)本發(fā)明的組織名稱確定設備的一個實施19例。圖3示出了根據(jù)本發(fā)明的組織名稱確定設備的一個實施例的框圖。如圖3所示,根據(jù)本發(fā)明的組織名稱確定設備3000主要包括用于獲取組織網(wǎng)址URL的網(wǎng)址URL獲取裝置3010、用于生成組合查詢項的查詢項生成裝置3020、用于借助于搜索引擎執(zhí)行搜索的查詢項搜索裝置3030、和用于從搜索結果列表中確定組織在目標語言中的名稱的組織名稱確定裝置3040。根據(jù)本發(fā)明,至少一個組織在源語言中的名稱被提供給網(wǎng)址URL獲取裝置3010,并且網(wǎng)址URL獲取裝置3010根據(jù)組織在源語言中的名稱,獲取該至少一個組織的網(wǎng)址URL,并將所獲得的網(wǎng)址URL提供給查詢項生成裝置3020,其中所獲得的網(wǎng)址URL由目標語言中的字符串構成。例如,網(wǎng)址URL獲取裝置3010可以借助于搜索引擎而獲得組織的網(wǎng)址URL。本領域技術人員也可以想到,可以借助于其他方式(例如通過其他外部數(shù)據(jù)源)來獲取組織的網(wǎng)址URL。查詢項生成裝置3020從網(wǎng)址URL獲取裝置2010接收所獲得的網(wǎng)址URL,從網(wǎng)址URL的核心部分中提取目標語言中的詞,并將其與該至少一個組織在源語言中的名稱形成組合查詢項??蛇x地,查詢項生成裝置3020基于目標語言字典而從網(wǎng)址URL核心部分中提取目標語言中的詞。在本發(fā)明中,查詢項生成裝置3020通過從網(wǎng)址URL中濾除前綴(例如英文URL中的"http:〃www,,)和后綴(例如英文URL中的".com"、".net,,等)而確定網(wǎng)址URL的核心部分??蛇x地,如果從該至少一個組織中某個或某些組織的網(wǎng)址URL的核心部分中沒有提取出目標語言中的詞,即這個或這些組織的網(wǎng)址URL的核心部分中不包含目標語言中的詞,則查詢項生成裝置3020將這個或這些組織的網(wǎng)址URL的整個核心部分組合到組合查詢項。查詢項生成裝置3020將所生成的組合查詢項提供給查詢項搜索裝置3030,查詢項搜索裝置3030借助于搜索引擎,對所接收的組合查詢項進行搜索,從而獲得該組合查詢項的搜索結果列表。在所獲得的搜索結果列表中列出了該查詢項的搜索結果。組織名稱確定裝置3040從查詢項搜索裝置3030所獲得的搜索結果列表中所列出的搜索結果中提取目標語言中的短語,并從所提取的短語中選擇至少一個作為組織在目標語言中的名稱。例如,如圖3所示,組織名稱確定裝置3040可以包括侯選名稱提取裝置3041和組織名稱選擇裝置3042。其中侯選名稱提取裝置3041從查詢項搜索裝置3030所獲得的搜索結果列表中所列出的搜索結果中提取目標語言中的短語,作為侯選名稱,并將所提取的侯選名稱提供給組織名稱選擇裝置3042;而組織名稱選擇裝置3042利用網(wǎng)址URL的核心部分對侯選名稱進行校驗,并將通過校驗的侯選名稱選擇作為組織在目標語言中的名稱??蛇x地,侯選名稱提取裝置3041可以包括計數(shù)器3041-1和提取裝置3041-2,其中計數(shù)器3041-1對搜索結果中所出現(xiàn)的目標語言中的每個短語的出現(xiàn)次數(shù)進行計數(shù),而提取裝置3041-2則基于計數(shù)器3041-1的計數(shù)結果,從搜索結果中提取出現(xiàn)次數(shù)高于一預定閾值的目標語言中的短語作為侯選名稱。有利地,侯選名稱提取裝置3041-1只從搜索結果列表中所列出的前N個搜索結果中提取目標語言中的短語??蛇x地,N在100到1000之間。圖4示意性地示出了圖3所示設備的組織名稱選擇裝置3042的一種實施方式的流程圖。如上所述,組織名稱選擇裝置3042利用網(wǎng)址URL的核心部分對侯選名稱提取裝置3041所提取的侯選名稱進行校驗,并將通過校驗的侯選名稱選擇作為組織在目標語言中的名稱。如圖4所示,組織名稱選擇裝置3042可以包括校驗裝置4010和確定裝置4020,其中校驗裝置4010利用網(wǎng)址URL的核心部分對侯選名稱進行校驗,而確定裝置4020將通過校驗的侯選名稱選擇為組織在目標語言中的名稱??蛇x地,校驗裝置4010為每個侯選名稱計算置信度,以表征該侯選名稱與一網(wǎng)址URL核心部分的匹配程度,并對于每個組織,將置信度最高的至少一個侯選名稱確定為通過了校驗。例如,如果組織的網(wǎng)址URL的核心部分包含目標語言中的詞,則校驗裝置4010可以根據(jù)組織的網(wǎng)址URL的核心部分中所包含的詞21和由這些詞分隔開的字段在侯選中的出現(xiàn)情況來計算置信度;相反,如果組織的網(wǎng)址URL的核心部分中不包含目標語言中的詞,則校驗裝置4010可以根據(jù)組織的網(wǎng)址URL的核心部分所包含的字符在侯選名稱中的出現(xiàn)情況來計算置信度。有利地,校驗裝置4010包括包含校驗器4011,用于為每個侯選名稱計算包含校驗值,并將所計算的包含校驗值作為置信度。如上所述,包含校驗器4011可以利用TF-IDF加權中的TF來執(zhí)行包含校驗。可選地,除了包含校驗器4011之外,校驗裝置4010還可以包括順序校驗器4012,用于為每個侯選名稱計算順序校驗器。并且,在這種情況下,校驗裝置4010通過結合包含校驗器4011和順序校驗器4012的校驗結果而確定置信度。如上所述,順序校驗器4012可以利用LCS算法來執(zhí)行順序校驗。圖4所示的確定裝置4020將通過校驗的侯選名稱選擇為組織在目標語言中的名稱??蛇x地,確定裝置4020只將置信度高于一預定閾值的侯選名稱選擇作為組織在目標語言中的名稱?,F(xiàn)在返回到圖3,現(xiàn)在返回到圖3,在一種實施方式中,如果網(wǎng)址URL的核心部分中包含目標語言中的詞,則組織名稱確定裝置3040選擇包含網(wǎng)址URL核心部分中所包含的所有詞和由這些詞分隔開的所有字段、并且這些詞和字段的排列順序與網(wǎng)址URL核心部分中的排列順序相同的后選名稱作為組織在目標語言中的名稱;如果網(wǎng)址URL的核心部分中不包含目標語言中的詞,則組織名稱確定裝置3040選擇包含網(wǎng)址URL核心部分中所包含的所有字符、并且這些字符的排列順序與網(wǎng)址URL核心部分中的排列順序相同的侯選名稱作為組織在目標語言中的名稱。才艮據(jù)本發(fā)明的組織名稱確定設備3000可選地還可以包括前后綴確定裝置。其中如果組織名稱選擇裝置3042沒有從侯選名稱提取裝置3041所提取的侯選名稱中選擇任何一個侯選名稱作為組織名稱,例如因為所有侯選名稱都不滿足包含網(wǎng)址URL的核心部分中所包含比S與網(wǎng)址URL中的相同這樣的要求,或者因為所有侯選名稱的置信度都低于預定閾值,則前后綴確定裝置確定源語言中與組織名稱相關的前綴或后綴。在這種情況下,查詢項生成裝置3020將前后綴確定裝置所確定的前綴或后綴在目標語言中的翻譯組合到所形成的組合查詢項中。例如,在一種實施方式中,前后綴確定裝置通過嘗試來實現(xiàn)前后綴的添加,例如,對于"思科",查詢項生成裝置3020可以先添加后綴"公司"在目標語言中的翻譯,如果這樣能確定有效的目標組織名稱,則不再繼續(xù)。而對于"清華",查詢項生成裝置3020也可以先添加后綴"公司,,在目標語言中的翻譯,但這時候依然無法確定有效的目標組織名稱,于是繼續(xù)通過添加"大學"在目標語言中的翻譯來進行進一步的嘗試,這時候,一般就可以確定有效的目標組織名稱了。前后綴確定裝置可以這樣一直嘗試,直到可用的前后綴都被嘗試。當然,本領域沖支術人員也可以想到,查詢項生成裝置3020可以在形成組合查詢項時將所有可能的后綴(可選地,也可以包括前綴)在目標語言中的翻譯組合到所形成的組合查詢項中。在以下描述中,以英文URL(即源語言為非英文,而目標語言為英文)為例對具體實施方式進行詳細地介紹。但是,本領域技術人員顯然可以理解,通過使用非英文的URL來代替英文URL,可以利用本發(fā)明確定組織在非英文語言中的名稱。圖5以組織中文名稱"遠洋地產(chǎn),,為例子示出了根據(jù)本發(fā)明的組織名稱確定方法的工作流程。如圖5所示,首先,組織的中文名稱"遠洋地產(chǎn),,被輸入,根據(jù)所接收的組織中文名稱"遠洋地產(chǎn)",(例如如果借助于搜索引擎,則可以取搜索結果中的第一項)獲取該組織的英文網(wǎng)址URL,即"http〃www.sinooceanland.com.cn"。然后,從網(wǎng)址URL的核心部分"sinooceanland"中提取出英文詞"ocean"和"land"(同時得到字段"sino"),然后將英文詞"ocean"和"land"與中文名稱"遠洋地產(chǎn),,相結合,例如形成組合查詢項"oceanland遠洋地產(chǎn)"或者"遠洋地產(chǎn)oceanland"。隨后,借助于搜索引擎對該組合查詢項執(zhí)行搜索,從而獲得相應的搜索結果列表,例如如圖6所示。從搜索結果列表中所列出的搜索結果的標題和摘錄中提取出英文短語"Sino國OceanLandHoldingsLimited"和"ChinaAoyuanPropertyGroup,,(例如通過對標題和摘錄中所出現(xiàn)的所有英文短語的出現(xiàn)次數(shù)進行計數(shù)并提取出現(xiàn)次數(shù)高于一預定閾值的英文短語),作為侯選名稱。最后,選擇侯選名稱中的一個作為英文組織名稱,例如利用網(wǎng)址URL對這些侯選名稱進行校驗,并選擇英文短語"Sino-OceanLandHoldingsLimited"作為"遠洋地產(chǎn)"的英文名稱,因為在這兩個侯選名稱中,英文短語"Sino-OceanLandHoldingsLimited"包含網(wǎng)址URL的核心部分所包含的所有英文詞"ocean,,和"land"和字段"sino"并且它們的排列順序與網(wǎng)址URL中的排列順序相同。圖6示出了圖5所示實施例的搜索結果列表的一部分的示意性示圖。圖6示出了例如通過Google對查詢項"oceanland遠洋地產(chǎn)"執(zhí)行搜索所得到的搜索結果列表的一部分。如上所述,根據(jù)本發(fā)明的組織名稱確定方法和設備通過分析組織的網(wǎng)址URL來確定查詢項,然后利用所確定的查詢項進行搜索并確定組織名稱。由于組織的網(wǎng)址URL通常反映了組織名稱的特征,因此根據(jù)本發(fā)明的方法和設備能夠更有效、更準確地獲取搜索結果,從而提高了組織名稱確定的準確度??蛇x地,根據(jù)本發(fā)明的方法和設備在從搜索結果中確定組織名稱時進一步使用組織的網(wǎng)址URL來對侯選名稱進行校準,從而進一步地提高了組織名稱確定的有效性和準確性。根據(jù)本發(fā)明的組織名稱確定設備可以應用于各種領域、例如搜索引擎領域中。為此,根據(jù)本發(fā)明,還提供了一種搜索引擎系統(tǒng),其包括根據(jù)本發(fā)明的組織名稱確定設備。此外,與現(xiàn)有技術的搜索引擎系統(tǒng)相同,根據(jù)本發(fā)明的搜索引擎系統(tǒng)還具有用于接收查詢項的查詢項接收裝置和用于提供搜索結果列表的搜索結果提供裝置。根據(jù)本發(fā)明的搜索引擎系統(tǒng)可以根據(jù)作為查詢項所接收的至少一個組織在源語言中的名稱自動確定該至少一個組織在目標語言中的名稱,并提供相24應的搜索結果列表,該搜索結果列表至少包括與所確定的目標語言中的組織名稱相關的搜索結果。例如,根據(jù)本發(fā)明的搜索引擎系統(tǒng)可以響應于接收到源語言中的組織名稱"遠洋地產(chǎn),,作為查詢項,返回所有有關該組織在目標語言中的名稱"Sino-OceanLandHoldingsLimited,,的搜索結果,或者可以同時還返回所有有關源語言中的組織名稱"遠洋地產(chǎn)"的搜索結果。在一種可選實施方式中,搜索引擎還可以包括可由用戶來控制以確定是否返回源語言或目標語言相關內(nèi)容的裝置。根據(jù)本發(fā)明,還提供了一種網(wǎng)絡瀏覽器,其包括根據(jù)本發(fā)明的組織名稱確定設備。此外,與現(xiàn)有技術的網(wǎng)絡瀏覽器相同,根據(jù)本發(fā)明的網(wǎng)絡瀏覽器還包括用于接收查詢項的查詢項輸入裝置和用于借助于搜索引擎獲取搜索結果的搜索結果獲取裝置。根據(jù)本發(fā)明的網(wǎng)絡瀏覽器可以根據(jù)作為查詢項所接收的至少一個組織在源語言中的名稱確定該至少一個組織在目標語言中的名稱,并借助于搜索引擎而獲取至少包括與所確定的目標語言中的名稱相關的搜索結果。例如,根據(jù)本發(fā)明的網(wǎng)絡瀏覽器可以響應于接收到源語言中的組織名稱"遠洋地產(chǎn)"作為查詢項,返回所有有關該組織在目標語言中的名稱"Sino-OceanLandHoldingsLimited,,的搜索結果,或者可以同時還返回所有有關源語言中的組織名稱"遠洋地產(chǎn)"的搜索結果。在一種可選實施方式中,根據(jù)本發(fā)明的網(wǎng)絡瀏覽器還可以包括可由用戶來選擇以確定是否返回源語言或目標語言相關內(nèi)容的裝置。前面為了說明的目的,參照特定實施例對本發(fā)明作了描述。但是,以按照上述教導作:許多修改^改變。選擇和描述這些實施例i為;最佳地說明本發(fā)明的原理和它的實際應用,從而使本領域的普通技術人員能夠最佳地利用本發(fā)明和使各種修改適合設想的特定使用的各種實施例。2權利要求1.一種根據(jù)源語言中的名稱確定目標語言中的名稱的方法,包括網(wǎng)址URL獲取步驟,基于至少一個組織在源語言中的名稱,獲取所述至少一個組織的網(wǎng)址URL,其中所述網(wǎng)址URL由目標語言中的字符串構成;查詢項生成步驟,從所述網(wǎng)址URL的核心部分中提取目標語言中的詞,并與所述至少一個組織在源語言中的名稱形成組合查詢項;查詢項搜索步驟,借助于搜索引擎,獲取所述組合查詢項的搜索結果列表;組織名稱確定步驟,從搜索結果列表中所列出的搜索結果中提取目標語言中的短語,并選擇其中至少一個短語作為所述至少一個組織在目標語言中的名稱。2.根據(jù)權利要求1所迷的方法,其中所述查詢項生成步驟在沒有從所述至少一個組織中某組織的網(wǎng)址URL的核心部分中提取出目標語言中的詞的情況下,將該組織的網(wǎng)址URL的核心部分組合到所述組合查詢項中。3.根據(jù)權利要求2所述的方法,其中所述組織名稱確定步驟包括侯選名稱提取步驟,從搜索結果列表中所列出的搜索結果中提取目標語言中的短語,作為侯選名稱;組織名稱選擇步驟,利用所述網(wǎng)址URL的核心部分對所述侯選名稱進行校驗,并將通過校驗的侯選名稱選擇作為所述至少一個組織在目標語言中的名稱。4.根據(jù)權利要求3所述的方法,其中所述組織名稱選擇步驟中的校驗包括針對每個所述侯選名稱,根據(jù)所述網(wǎng)址URL的核心部分所包含的詞和由這些詞分隔開的字段在所述侯選名稱中的出現(xiàn)情況,或根據(jù)所述網(wǎng)址URL的核心部分所包含的字符在所述侯選名稱中的出現(xiàn)情況,來計算置信度;以及將置信度最高的至少一個侯選名稱確定為是通過校驗的候選名稱。5.根據(jù)權利要求4所述的方法,其中所述計算置信度還基于所述詞和字段或所述字符在所述網(wǎng)址URL的核心部分中的排列順序及這些詞和字段或這些字符出現(xiàn)在所述侯選名稱中時的排列順序。6.根據(jù)權利要求5所述的方法,其中只有置信度高于預定闊值的候選名稱才被選擇作為所述組織在目標語言中的名稱。7.根據(jù)權利要求3所述的方法,其中所述侯選名稱提取步驟包括對搜索結果中所出現(xiàn)的目標語言中的每個短語的出現(xiàn)次數(shù)進行計數(shù);和從搜索結果中提取出現(xiàn)次數(shù)高于一預定閾值的目標語言中的短語,作為侯選名稱。8.—種根據(jù)源語言中的名稱確定目標語言中的名稱的設備,包括網(wǎng)址URL獲取裝置,用于基于至少一個組織在源語言中的名稱,獲取所述至少一個組織的網(wǎng)址URL,其中所述網(wǎng)址URL由目標語言中的字符串構成;查詢項生成裝置,用于從所述網(wǎng)址URL的核心部分中提取目標語言中的詞,并與所述至少一個組織在源語言中的名稱形成組合查詢項;查詢項搜索裝置,用于借助于搜索引擎,獲取所述組合查詢項的搜索結果列表;組織名稱確定裝置,用于從搜索結果列表中所列出的搜索結果中提取目標語言中的短語,并選擇其中至少一個短語作為所述至少一個組織在目標語言中的名稱。9.根據(jù)權利要求8所述的設備,其中所述查詢項生成裝置被配置為在沒有從所述至少一個組織中某組織的網(wǎng)址URL的核心部分中提取出目標語言中的詞的情況下,將該組織的網(wǎng)址URL的核心部分組合到所述組合查詢項中。10.根據(jù)權利要求9所述的設備,其中所述組織名稱確定裝置包括侯選名稱提取裝置,用于從搜索結果列表中所列出的搜索結果中提取目標語言中的短語,作為侯選名稱;組織名稱選擇裝置,用于利用所述網(wǎng)址URL的核心部分對所述侯選名稱進行校驗,并將通過校驗的侯選名稱選擇作為所述至少一個組織在目標語言中的名稱。11.根據(jù)權利要求10所述的設備,其中所述組織名稱選擇裝置中的校驗包括針對每個所述侯選名稱,根據(jù)所述網(wǎng)址URL的核心部分所包含的詞和由這些詞分隔開的字段在所述侯選名稱中的出現(xiàn)情況,或根據(jù)所述網(wǎng)址URL的核心部分所包含的字符在所述侯選名稱中的出現(xiàn)情況,來計算置信度;以及將置信度最高的至少一個侯選名稱確定為是通過校驗的侯選名稱。12.根據(jù)權利要求11所述的設備,其中所述計算置信度還基于所迷詞和字段或所述字符在所述網(wǎng)址URL的核心部分中的排列順序及這些詞和字段或這些字符出現(xiàn)在所述侯選名稱中時的排列順序。13.根據(jù)權利要求12所述的設備,其中只有置信度高于預定閾值的侯選名稱才被選擇作為所述組織在目標語言中的名稱。14.根據(jù)權利要求10所述的設備,其中所述侯選名稱提取裝置包括用于對搜索結果中所出現(xiàn)的目標語言中的每個短語的出現(xiàn)次數(shù)進行計數(shù)的裝置;和用于從搜索結果中提取出現(xiàn)次數(shù)高于一預定閾值的目標語言中的短語,作為侯選名稱的裝置。15.—種網(wǎng)絡瀏覽器,包括查詢項輸入裝置,用于接收至少一個組織在源語言中的名稱作為查詢項;根據(jù)權利要求8至14中任一項所述的根據(jù)源語言中的名稱確定目標語言中的名稱的設備,用于基于所接收的組織名稱,確定所述至少一個組織在目標語言中的名稱;搜索結果獲取裝置,用于借助于搜索引擎,獲取搜索結果列表,其中所述搜索結果列表至少包括與所確定的所述至少一個組織在目標語言中的名稱相關的搜索結果。16.—種搜索引擎系統(tǒng),包括查詢項接收裝置,用于接收至少一個組織在源語言中的名稱作為查詢項;根據(jù)權利要求8至14中任一項所述的根據(jù)源語言中的名稱確定目標語言中的名稱的設備,用于基于所接收的組織名稱,確定所述至少一個組織在目標語言中的名稱;搜索結果提供裝置,用于提供搜索結果列表,其中所述搜索結果列表至少包括與所確定的所述至少一個組織在目標語言中的名稱相關的搜索結果。全文摘要本發(fā)明提供了一種組織名稱確定方法和裝置。根據(jù)本發(fā)明,基于至少一個組織在源語言中的名稱,獲取組織的網(wǎng)址URL,其中所獲得的網(wǎng)址URL由目標語言中的字符串構成;從網(wǎng)址URL的核心部分中提取目標語言中的詞,并與組織在源語言中的名稱形成組合查詢項;借助于搜索引擎,獲取組合查詢項的搜索結果列表;從搜索結果中提取目標語言中的短語,并選擇其中至少一個短語作為組織在目標語言中的名稱。文檔編號G06F17/30GK101661480SQ200810212468公開日2010年3月3日申請日期2008年8月29日優(yōu)先權日2008年8月29日發(fā)明者賢吳,俐張,中蘇,郭宏蕾申請人:國際商業(yè)機器公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
武川县| 都江堰市| 宜宾市| 准格尔旗| 茶陵县| 江山市| 万山特区| 麻栗坡县| 黎川县| 尼木县| 旌德县| 吐鲁番市| 铅山县| 天镇县| 黎平县| 崇仁县| 平陆县| 怀安县| 大竹县| 南和县| 个旧市| 甘孜县| 阿拉善盟| 错那县| 麟游县| 定兴县| 西昌市| 合川市| 曲松县| 阳高县| 淮安市| 建水县| 曲阳县| 庆云县| 德令哈市| 淮北市| 明水县| 长顺县| 托克托县| 元朗区| 晴隆县|