翻譯譯文的提供方法、裝置和系統(tǒng)的制作方法
【專利摘要】本發(fā)明提出一種翻譯譯文的提供方法、裝置和系統(tǒng),其中,該方法包括:接收客戶端發(fā)送的翻譯請求,并獲取客戶端的當前位置信息,其中,翻譯請求包括待翻譯內(nèi)容和目標語言類型;根據(jù)目標語言類型獲取與目標語言類型對應(yīng)的地圖數(shù)據(jù)和預(yù)設(shè)互信息集合;根據(jù)當前位置信息、地圖數(shù)據(jù)和預(yù)設(shè)互信息集合獲取待翻譯內(nèi)容的位置特征;根據(jù)位置特征和預(yù)設(shè)翻譯模型獲取待翻譯內(nèi)容的翻譯譯文,并將翻譯譯文發(fā)送至客戶端。本發(fā)明實施例的翻譯譯文的提供方法使獲取的翻譯譯文能夠滿足用戶在特定位置上的翻譯需求,并且翻譯結(jié)果更符合用戶預(yù)期。特別是對于一詞多譯的情況,能夠快速準確的為用戶提供翻譯結(jié)果,極大的改善了用戶的翻譯體驗。
【專利說明】翻譯譯文的提供方法、裝置和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及機器翻譯領(lǐng)域,特別涉及一種翻譯譯文的提供方法、裝置和系統(tǒng)。
【背景技術(shù)】
[0002]隨著機器翻譯技術(shù)的不斷發(fā)展,用戶可隨時通過在線翻譯在多種語言對之間進行翻譯。特別是隨著移動終端制造技術(shù)的發(fā)展,移動終端上的在線翻譯應(yīng)用程序也日益豐富,這使得用戶隨時隨地都可以進行翻譯。例如用戶出國旅游時,可隨時通過鍵盤輸入、語音輸入、拍照加OCR識別等輸入方式將看到的路標、招牌、菜單、景點介紹等等輸入到在線翻譯應(yīng)用程序中進行翻譯。
[0003]目前機器翻譯在譯文選擇時主要考慮兩方面的因素,即翻譯概率和語言模型概率。其中,翻譯概率是基于一個大規(guī)模的源語言到目標語言的平行語料庫,經(jīng)過詞對齊和短語抽取之后訓(xùn)練得到的,體現(xiàn)的是一個源語言短語翻譯到一個目標語言短語的可能性;語言模型概率是基于目標語言的大規(guī)模單語語料庫統(tǒng)計得到的目標語言詞序列的出現(xiàn)概率。因而,目前機器翻譯中源語言短語的候選翻譯的選擇取決于短語本身以及該短語所處在的上下文句子。但是,存在源語言中的一個短語對應(yīng)目標語言中的多個譯文的情況,現(xiàn)有的機器翻譯系統(tǒng)無法從多個譯文中為用戶篩選出更符合用戶當前需求的譯文。
【發(fā)明內(nèi)容】
[0004]本發(fā)明旨在至少在一定程度上解決上述技術(shù)問題。
[0005]為此,本發(fā)明的第一個目的在于提出一種翻譯譯文的提供方法,該方法能夠滿足用戶在特定位置上的翻譯需求,快速準確的為用戶提供翻譯結(jié)果,極大的改善了用戶的翻譯體驗。
[0006]為達上述目的,根據(jù)本發(fā)明第一方面實施例提出了一種翻譯譯文的提供方法,包括:接收客戶端發(fā)送的翻譯請求,并獲取所述客戶端的當前位置信息,其中,所述翻譯請求包括待翻譯內(nèi)容和目標語言類型;根據(jù)所述目標語言類型獲取與所述目標語言類型對應(yīng)的地圖數(shù)據(jù)和預(yù)設(shè)互信息集合;根據(jù)所述當前位置信息、所述地圖數(shù)據(jù)和所述預(yù)設(shè)互信息集合獲取所述待翻譯內(nèi)容的位置特征;根據(jù)所述位置特征和預(yù)設(shè)翻譯模型獲取所述待翻譯內(nèi)容的翻譯譯文,并將所述翻譯譯文發(fā)送至所述客戶端。
[0007]本發(fā)明實施例的翻譯譯文的提供方法,通過獲取發(fā)送翻譯請求的客戶端的當前位置信息,并獲取與該當前位置信息相關(guān)的翻譯譯文,從而使獲取的翻譯譯文能夠滿足用戶在特定位置上的翻譯需求,并且翻譯結(jié)果更符合用戶預(yù)期。特別是對于一詞多譯的情況,能夠快速準確的為用戶提供翻譯結(jié)果,極大的改善了用戶的翻譯體驗。
[0008]本發(fā)明第二方面實施例提供了一種翻譯譯文的提供裝置,包括:接收模塊,用于接收客戶端發(fā)送的翻譯請求,其中,所述翻譯請求包括待翻譯內(nèi)容和目標語言類型;第一獲取模塊,用于獲取所述客戶端的當前位置信息;第二獲取模塊,用于根據(jù)所述目標語言類型獲取與所述目標語言類型對應(yīng)的地圖數(shù)據(jù)和預(yù)設(shè)互信息集合;第三獲取模塊,用于根據(jù)所述當前位置信息、所述地圖數(shù)據(jù)和所述預(yù)設(shè)互信息集合獲取所述待翻譯內(nèi)容的位置特征;提供模塊,用于根據(jù)所述位置特征和預(yù)設(shè)翻譯模型獲取所述待翻譯內(nèi)容的翻譯譯文,并將所述翻譯譯文發(fā)送至所述客戶端。
[0009]本發(fā)明實施例的翻譯譯文的提供裝置,通過獲取發(fā)送翻譯請求的客戶端的當前位置信息,并獲取與該當前位置信息相關(guān)的翻譯譯文,從而使獲取的翻譯譯文能夠滿足用戶在特定位置上的翻譯需求,并且翻譯結(jié)果更符合用戶預(yù)期。特別是對于一詞多譯的情況,能夠快速準確的為用戶提供翻譯結(jié)果,極大的改善了用戶的翻譯體驗。
[0010]本發(fā)明第三方面實施例提供了一種翻譯譯文的提供系統(tǒng),包括:本發(fā)明第二方面實施例所述的翻譯譯文的提供裝置;以及客戶端。
[0011]本發(fā)明實施例的翻譯譯文的提供系統(tǒng),通過獲取發(fā)送翻譯請求的客戶端的當前位置信息,并獲取與該當前位置信息相關(guān)的翻譯譯文,從而使獲取的翻譯譯文能夠滿足用戶在特定位置上的翻譯需求,并且翻譯結(jié)果更符合用戶預(yù)期。特別是對于一詞多譯的情況,能夠快速準確的為用戶提供翻譯結(jié)果,極大的改善了用戶的翻譯體驗。
[0012]本發(fā)明的附加方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到。
【專利附圖】
【附圖說明】
[0013]本發(fā)明的上述和/或附加的方面和優(yōu)點從結(jié)合下面附圖對實施例的描述中將變得明顯和容易理解,其中:
[0014]圖1為根據(jù)本發(fā)明一個實施例的翻譯譯文的提供方法的流程圖;
[0015]圖2為根據(jù)本發(fā)明一個具體實施例的翻譯譯文的提供方法的流程圖;
[0016]圖3為根據(jù)本發(fā)明一個實施例的建立預(yù)算互信息集合的方法的流程圖;
[0017]圖4為根據(jù)本發(fā)明一個實施例的獲取每個地標詞匯的位置得分的方法的流程圖;
[0018]圖5為根據(jù)本發(fā)明一個實施例的獲取待翻譯內(nèi)容的位置特征的方法的流程圖;
[0019]圖6為根據(jù)本發(fā)明一個實施例的翻譯譯文的提供裝置的結(jié)構(gòu)示意圖;
[0020]圖7為根據(jù)本發(fā)明一個具體實施例的翻譯譯文的提供裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0021]下面詳細描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。
[0022]在本發(fā)明的描述中,需要理解的是,術(shù)語“中心”、“縱向”、“橫向”、“上”、“下”、“前”、“后”、“左”、“右”、“豎直”、“水平”、“頂”、“底”、“內(nèi)”、“外”等指示的方位或位置關(guān)系為基于附圖所示的方位或位置關(guān)系,僅是為了便于描述本發(fā)明和簡化描述,而不是指示或暗示所指的裝置或元件必須具有特定的方位、以特定的方位構(gòu)造和操作,因此不能理解為對本發(fā)明的限制。此外,術(shù)語“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對重要性。
[0023]在本發(fā)明的描述中,需要說明的是,除非另有明確的規(guī)定和限定,術(shù)語“安裝”、“相連”、“連接”應(yīng)做廣義理解,例如,可以是固定連接,也可以是可拆卸連接,或一體地連接;可以是機械連接,也可以是電連接;可以是直接相連,也可以通過中間媒介間接相連,可以是兩個元件內(nèi)部的連通。對于本領(lǐng)域的普通技術(shù)人員而言,可以具體情況理解上述術(shù)語在本發(fā)明中的具體含義。
[0024]在現(xiàn)有的機器翻譯技術(shù)中,源語言語句的候選翻譯的選擇只取決于源語言語句中短語本身以及短語所處在的上下文句子,當源語言語句含的短語的譯文較多時,獲得的該源語言語句的譯文更多,這就需要用戶根據(jù)需要在眾多譯文中選擇,或者翻譯系統(tǒng)自動為用戶提供使用率較高的譯文,但卻不一定是用戶所需要的。而當為用戶提供翻譯譯文時,如果根據(jù)用戶發(fā)出翻譯請求時所處的地理位置提供翻譯譯文,則會使翻譯譯文更加準確。例如:當一個不懂英文的中國游客在翻譯系統(tǒng)中輸入“park”這個多義詞時,他要找的中文翻譯到底是什么便與他彼時彼刻正處于的位置有關(guān)。若此時他處于公園、動物園、旅游景點等的門口,則park很可能是“公園”的意思;但倘若他的旁邊是商務(wù)區(qū)、辦公區(qū)、馬路等,則park便很可能是“停車場”的意思。為此,本發(fā)明提出了一種翻譯譯文的提供方法、裝置和系統(tǒng)。下面參考附圖描述根據(jù)本發(fā)明實施例的翻譯譯文的提供方法、裝置和系統(tǒng)。
[0025]一種翻譯譯文的提供方法,包括以下步驟:接收客戶端發(fā)送的翻譯請求,并獲取客戶端的當前位置信息,其中,翻譯請求包括待翻譯內(nèi)容和目標語言類型;根據(jù)目標語言類型獲取與目標語言類型對應(yīng)的地圖數(shù)據(jù)和預(yù)設(shè)互信息集合;根據(jù)當前位置信息、地圖數(shù)據(jù)和預(yù)設(shè)互信息集合獲取待翻譯內(nèi)容的位置特征;根據(jù)位置特征和預(yù)設(shè)翻譯模型獲取待翻譯內(nèi)容的翻譯譯文,并將翻譯譯文發(fā)送至客戶端。
[0026]圖1為根據(jù)本發(fā)明一個實施例的翻譯譯文的提供方法的流程圖。如圖1所示,該翻譯譯文的提供方法包括以下步驟。
[0027]S101,接收客戶端發(fā)送的翻譯請求,并獲取客戶端的當前位置信息,其中,翻譯請求包括待翻譯內(nèi)容和目標語言類型。
[0028]在本發(fā)明的實施例中,客戶端優(yōu)選為移動終端,例如,IOS操作系統(tǒng)(10S是由蘋果公司開發(fā)的手持設(shè)備操作系統(tǒng))、安卓操作系統(tǒng)(Android系統(tǒng)是一種基于Linux的自由及開放源代碼的操作系統(tǒng))、Windows Phone操作系統(tǒng)(Windows Phone是微軟公司發(fā)布的一款手機操作系統(tǒng))的移動終端,當然也適用于個人計算機以及其他智能移動終端,本發(fā)明對此不作限定。應(yīng)當理解,在本發(fā)明的實施例中,移動終端可以是手機、平板電腦、個人數(shù)字助理、電子書以及智能穿戴式設(shè)備等具有各種操作系統(tǒng)的硬件設(shè)備。待翻譯內(nèi)容為用戶不熟悉或不理解的語言類型的語句,目標語言類型為用戶根據(jù)需要選擇的能夠理解的語言類型中的一個或多個。其中,客戶端的當前位置信息可通過GPS(Global Positioning System,全球定位系統(tǒng))來獲取。
[0029]S102,根據(jù)目標語言類型獲取與目標語言類型對應(yīng)的地圖數(shù)據(jù)和預(yù)設(shè)互信息集
口 ο
[0030]在本發(fā)明的一個實施例中,地圖數(shù)據(jù)為各種地圖應(yīng)用軟件提供的包括道路、建筑、商鋪、景點等地標信息的地圖數(shù)據(jù)。與目標語言類型對應(yīng)的地圖數(shù)據(jù)可由地圖應(yīng)用程序直接提供,如果地圖應(yīng)用程序無法提供目標語言類型的地圖數(shù)據(jù),則可根據(jù)現(xiàn)有的翻譯系將地圖應(yīng)用程序可提供的一種語言類型的地圖數(shù)據(jù)翻譯為目標語言數(shù)據(jù)。預(yù)設(shè)互信息集合為預(yù)先建立的包括任意地標信息中的詞匯之間共同出現(xiàn)的互信息的集合。具體地,可根據(jù)各個語言類型的地圖數(shù)據(jù)中距離小于預(yù)設(shè)閾值的兩個地標信息建立相應(yīng)的地圖數(shù)據(jù)中每兩個地標詞匯之間的互信息,其中,每個語言類型對應(yīng)一個預(yù)設(shè)信息集合。互信息是指兩個事件集合之間的相關(guān)性的信息度量,因此,預(yù)設(shè)互信息集合中的每個互信息可表示與該互信息相應(yīng)的兩個詞在地圖數(shù)據(jù)中的關(guān)聯(lián)緊密度。
[0031]S103,根據(jù)當前位置信息、地圖數(shù)據(jù)和預(yù)設(shè)互信息集合獲取待翻譯內(nèi)容的位置特征。
[0032]在本發(fā)明的實施例中,待翻譯內(nèi)容的位置特征為與待翻譯內(nèi)容的當前位置信息相關(guān)的特征。
[0033]S104,根據(jù)位置特征和預(yù)設(shè)翻譯模型獲取待翻譯內(nèi)容的翻譯譯文,并將翻譯譯文發(fā)送至客戶端。
[0034]相關(guān)技術(shù)中,主要根據(jù)翻譯概率、語言模型概率以及調(diào)序模型分值等多種特征構(gòu)成的對數(shù)線性模型。在本發(fā)明的一個實施例中,可在離線階段將位置特征作為一個新的特征,與上述翻譯概率、語言模型概率以及調(diào)序模型分值等多種特征一起訓(xùn)練預(yù)設(shè)翻譯模型,舉例來說,該預(yù)設(shè)翻譯模型可為對數(shù)線性模型。從而,在線翻譯時,可將獲取的位置特征代入該預(yù)設(shè)翻譯模型,即可獲取與翻譯請求客戶端所在的當前位置信息相符的翻譯譯文。
[0035]本發(fā)明實施例的翻譯譯文的提供方法,通過獲取發(fā)送翻譯請求的客戶端的當前位置信息,并獲取與該當前位置信息相關(guān)的翻譯譯文,從而使獲取的翻譯譯文能夠滿足用戶在特定位置上的翻譯需求,并且翻譯結(jié)果更符合用戶預(yù)期。特別是對于一詞多譯的情況,能夠快速準確的為用戶提供翻譯結(jié)果,極大的改善了用戶的翻譯體驗。
[0036]圖2為根據(jù)本發(fā)明一個具體實施例的翻譯譯文的提供方法的流程圖。如圖2所示,在本實施例中,可通過步驟S203-S206根據(jù)所述當前位置信息、所述地圖數(shù)據(jù)和所述預(yù)設(shè)互信息集合獲取所述待翻譯內(nèi)容的位置特征,使得獲取的待翻譯內(nèi)容的位置特征更加準確,從而可為用戶提供更加滿足其需求的翻譯譯文。具體地,該訓(xùn)練翻譯模型的方法包括以下步驟。
[0037]S201,接收客戶端發(fā)送的翻譯請求,并獲取客戶端的當前位置信息,其中,翻譯請求包括待翻譯內(nèi)容和目標語言類型。
[0038]在本發(fā)明的實施例中,客戶端優(yōu)選為移動終端,例如,IOS操作系統(tǒng)(10S是由蘋果公司開發(fā)的手持設(shè)備操作系統(tǒng))、安卓操作系統(tǒng)(Android系統(tǒng)是一種基于Linux的自由及開放源代碼的操作系統(tǒng))、Windows Phone操作系統(tǒng)(Windows Phone是微軟公司發(fā)布的一款手機操作系統(tǒng))的移動終端,當然也適用于個人計算機以及其他智能移動終端,本發(fā)明對此不作限定。應(yīng)當理解,在本發(fā)明的實施例中,移動終端可以是手機、平板電腦、個人數(shù)字助理、電子書以及智能穿戴式設(shè)備等具有各種操作系統(tǒng)的硬件設(shè)備。待翻譯內(nèi)容為用戶不熟悉或不理解的語言類型的語句,目標語言類型為用戶根據(jù)需要選擇的能夠理解的語言類型中的一個或多個。其中,客戶端的當前位置信息可通過GPS(Global Positioning System,全球定位系統(tǒng))來獲取。
[0039]S202,根據(jù)目標語言類型獲取與目標語言類型對應(yīng)的地圖數(shù)據(jù)和預(yù)設(shè)互信息集
入
口 ο
[0040]在本發(fā)明的一個實施例中,地圖數(shù)據(jù)為各種地圖應(yīng)用軟件提供的包括道路、建筑、商鋪、景點等地標信息的地圖數(shù)據(jù)。與目標語言類型對應(yīng)的地圖數(shù)據(jù)可由地圖應(yīng)用程序直接提供,如果地圖應(yīng)用程序無法提供目標語言類型的地圖數(shù)據(jù),則可根據(jù)現(xiàn)有的翻譯系將地圖應(yīng)用程序可提供的一種語言類型的地圖數(shù)據(jù)翻譯為目標語言數(shù)據(jù)。
[0041]在本發(fā)明的一個實施例中,預(yù)設(shè)互信息集合為預(yù)先建立的包括任意地標信息中的詞匯之間共同出現(xiàn)的互信息的集合。圖3為根據(jù)本發(fā)明一個實施例的建立預(yù)算互信息集合的方法的流程圖。如圖3所示,在本發(fā)明的一個實施例中,預(yù)設(shè)互信息集合可通過以下步驟
建立:
[0042]S301,獲取第一語言的地圖數(shù)據(jù)。
[0043]其中,第一語言可為現(xiàn)有語言中的任意一種。
[0044]S302,根據(jù)第一語言的地圖數(shù)據(jù)獲取地圖上任意距離小于預(yù)設(shè)閾值的兩個地標信息,以獲取多對地標信息。
[0045]其中,預(yù)設(shè)閾值可為根據(jù)多次試驗獲得的閾值。地圖上的地標信息為標識地理位置的信息,如道路、建筑、商鋪、景點等。
[0046]S303,根據(jù)多對地標信息獲取多個第一語言地標詞匯。
[0047]其中,第一語言地標詞匯為通過對上述多對地標信息進行分詞得到的單詞或短語。
[0048]S304,分別獲取每個第一語言地標詞匯的出現(xiàn)概率,并獲取任意兩個第一語言地標詞匯之間的共現(xiàn)概率。
[0049]在本發(fā)明的實施例中,可首先獲取每個第一語言地標詞匯在獲取到的多個第一語言地標詞匯中的出現(xiàn)的次數(shù),然后用該次數(shù)除以多個第一語言地標詞匯的總數(shù)以獲取每個第一語言地標詞匯的出現(xiàn)概率。對于第一語言地標詞匯W1和《2,如果W1與W2分別為一對距離小于預(yù)設(shè)閾值的地標信息中每個地標信息中的一個單詞或詞組(例如,對于一對地標信息P1和P2,W1是地標信息P1中的單詞,W2是地標信息中的單詞P2),則記W1和W2共現(xiàn)一次。按照此方法,可獲取^和《2在獲取到的第一語言地標詞匯中的共現(xiàn)次數(shù)。從而,根據(jù)W1和W2的共現(xiàn)次數(shù)可計算W1和W2的共現(xiàn)概率。
[0050]S305,根據(jù)每個第一語言地標詞匯的出現(xiàn)概率和任意兩個第一語言地標詞匯之間的共現(xiàn)概率獲取任意兩個第一語言地標詞匯之間的互信息,以建立第一語言的預(yù)設(shè)互信息集合
[0051]具體地,在本發(fā)明的一個實施例中,可通過以下公式獲取任意兩個第一語言地標詞匯W1和W2之間的互信息,以表示與W1和W2在地圖數(shù)據(jù)中的關(guān)聯(lián)緊密度:
[0052]
【權(quán)利要求】
1.一種翻譯譯文的提供方法,其特征在于,包括: 接收客戶端發(fā)送的翻譯請求,并獲取所述客戶端的當前位置信息,其中,所述翻譯請求包括待翻譯內(nèi)容和目標語言類型; 根據(jù)所述目標語言類型獲取與所述目標語言類型對應(yīng)的地圖數(shù)據(jù)和預(yù)設(shè)互信息集合; 根據(jù)所述當前位置信息、所述地圖數(shù)據(jù)和所述預(yù)設(shè)互信息集合獲取所述待翻譯內(nèi)容的位置特征; 根據(jù)所述位置特征和預(yù)設(shè)翻譯模型獲取所述待翻譯內(nèi)容的翻譯譯文,并將所述翻譯譯文發(fā)送至所述客戶端。
2.如權(quán)利要求1所述的翻譯譯文的提供方法,其特征在于,所述根據(jù)所述當前位置信息、所述地圖數(shù)據(jù)和所述預(yù)設(shè)互信息集合獲取所述待翻譯內(nèi)容的位置特征具體包括: 根據(jù)所述當前位置信息和所述地圖數(shù)據(jù)獲取與所述當前位置信息距離小于預(yù)設(shè)閾值的多個地標信息,并分別記錄所述多個地標信息與所述當前位置信息的距離; 對所述多個地標信息進行分詞以獲取M個地標詞匯,其中,M為正整數(shù); 根據(jù)所述多個地標信息和所述多個地標信息與所述當前位置信息的距離分別獲取所述M個地標詞匯 的位置得分; 根據(jù)所述M個地標詞匯的位置得分和所述互信息集合獲取所述待翻譯內(nèi)容的位置特征。
3.如權(quán)利要求2所述的翻譯譯文的提供方法,其特征在于,所述根據(jù)所述多個地標信息和所述多個地標信息與所述當前位置信息的距離分別獲取所述M個地標詞匯的位置得分,具體包括: 對于每個地標詞匯w,從所述M個地標信息中獲取包括所述地標詞匯w的K個地標信息,其中,K為正整數(shù); 獲取所述K個地標信息到所述當前位置信息的平均距離; 根據(jù)所述地標詞匯w在所述K個地標信息中的出現(xiàn)次數(shù)和所述平均距離通過以下公式獲取所述地標詞匯w的位置得分:
4.如權(quán)利要求2所述的翻譯譯文的提供方法,其特征在于,所述根據(jù)所述M個地標詞匯的位置得分和所述互信息集合獲取所述待翻譯內(nèi)容的位置特征,具體包括:獲取所述待翻譯內(nèi)容中的至少一個短語,并獲取所述至少一個短語中每個短語對應(yīng)的多個候選翻譯短語,其中,每個所述候選翻譯短語中包括N個目標語言詞匯,N為正整數(shù);根據(jù)所述預(yù)設(shè)互信息集合分別獲取所述M個地標詞匯和所述N個目標語言詞匯中每個地標詞匯與每個目標語言詞匯之間的互信息; 根據(jù)所述每個地標詞匯與每個目標語言詞匯之間的互信息與每個地標詞匯的位置得分獲取相應(yīng)的候選翻譯短語基于位置的特征分值; 根據(jù)每個候選翻譯短語基于位置的特征分值獲取所述待翻譯內(nèi)容的位置特征。
5.如權(quán)利要求4所述的翻譯譯文的提供方法,其特征在于,通過以下公式獲取每個候選翻譯短語Pt基于位置的特征分值:
6.如權(quán)利要求1-5任一項所述的翻譯譯文的提供方法,其特征在于,所述預(yù)設(shè)互信息集合通過以下步驟建立: 獲取第一語言的地圖數(shù)據(jù); 根據(jù)所述第一語言的地圖數(shù)據(jù)獲取地圖上任意距離小于預(yù)設(shè)閾值的兩個地標信息,以獲取多對地標信息; 根據(jù)所述多對地標信息獲取多個第一語言地標詞匯; 分別獲取每個第一語言地標詞匯的出現(xiàn)概率,并獲取任意兩個第一語言地標詞匯之間的共現(xiàn)概率; 根據(jù)所述每個第一語言地標詞匯的出現(xiàn)概率和所述任意兩個第一語言地標詞匯之間的共現(xiàn)概率獲取所述任意兩個第一語言地標詞匯之間的互信息,以建立第一語言的預(yù)設(shè)互信息集合。
7.如權(quán)利要求6所述的翻譯譯文的提供方法,其特征在于,通過以下公式獲取所述任意兩個第一語言地標詞匯之間的互信息:
8.一種翻譯譯文的提供裝置,其特征在于,包括: 接收模塊,用于接收客戶端發(fā)送的翻譯請求,其中,所述翻譯請求包括待翻譯內(nèi)容和目標語言類型; 第一獲取模塊,用于獲取所述客戶端的當前位置信息; 第二獲取模塊,用于根據(jù)所述目標語言類型獲取與所述目標語言類型對應(yīng)的地圖數(shù)據(jù)和預(yù)設(shè)互信息集合; 第三獲取模塊,用于根據(jù)所述當前位置信息、所述地圖數(shù)據(jù)和所述預(yù)設(shè)互信息集合獲取所述待翻譯內(nèi)容的位置特征; 提供模塊,用于根據(jù)所述位置特征和預(yù)設(shè)翻譯模型獲取所述待翻譯內(nèi)容的翻譯譯文,并將所述翻譯譯文發(fā)送至所述客戶端。
9.如權(quán)利要求8所述的翻譯譯文的提供裝置,其特征在于,所述第二獲取模塊具體包括: 記錄子模塊,用于根據(jù)所述當前位置信息和所述地圖數(shù)據(jù)獲取與所述當前位置信息距離小于預(yù)設(shè)閾值的多個地標信息,并分別記錄所述多個地標信息與所述當前位置信息的距離; 第一獲取子模塊,用于對所述多個地標信息進行分詞以獲取M個地標詞匯,其中,M為正整數(shù); 第二獲取子模塊,用于根據(jù)所述多個地標信息和所述多個地標信息與所述當前位置信息的距離分別獲取所述M個地標詞匯的位置得分; 第三獲取子模塊,用于根據(jù)所述M個地標詞匯的位置得分和所述互信息集合獲取所述待翻譯內(nèi)容的位置特征。
10.如權(quán)利要求9所述的翻譯譯文的提供裝置,其特征在于,所述第二獲取子模塊具體包括: 第一獲取單元,用于對于每個地標詞匯《,從所述M個地標信息中獲取包括所述地標詞匯w的K個地標信息,其中,K為正整數(shù); 第二獲取單元,用于獲取所述K個地標信息到所述當前位置信息的平均距離; 第三獲取單元,用于根據(jù)所述地標詞匯w在所述K個地標信息中的出現(xiàn)次數(shù)和所述平均距離通過以下公式獲取所述地標詞匯w的位置得分:
11.如權(quán)利要求9所述的翻譯譯文的提供裝置,其特征在于,所述第三獲取子模塊具體包括: 第四獲取單元,用于獲取所述待翻譯內(nèi)容中的至少一個短語,并獲取所述至少一個短語中每個短語對應(yīng)的多個候選翻譯短語,其中,每個所述候選翻譯短語中包括N個目標語言詞匯,N為正整數(shù); 第五獲取單元,用于根據(jù)所述預(yù)設(shè)互信息集合分別獲取所述M個地標詞匯和所述N個目標語言詞匯中每個地標詞匯與每個目標語言詞匯之間的互信息; 第六獲取單元,用于根據(jù)所述每個地標詞匯與每個目標語言詞匯之間的互信息與每個地標詞匯的位置得分獲取相應(yīng)的候選翻譯短語基于位置的特征分值; 第七獲取單元,用于根據(jù)每個候選翻譯短語基于位置的特征分值獲取所述待翻譯內(nèi)容的位置特征。
12.如權(quán)利要求11所述的翻譯譯文的提供裝置,其特征在于,所述第六獲取單元通過以下公式獲取每個候選翻譯短語Pt基于位置的特征分值:
13.如權(quán)利要求8-12任一項所述的翻譯譯文的提供裝置,其特征在于,還包括: 建立模塊,用于建立所述預(yù)設(shè)互信息集合,其中,所述建立模塊具體包括: 第四獲取子模塊,用于獲取第一語言的地圖數(shù)據(jù); 第五獲取子模塊,用于根據(jù)所述第一語言的地圖數(shù)據(jù)獲取地圖上任意距離小于預(yù)設(shè)閾值的兩個地標信息,以獲取多對地標信息; 第六獲取子模塊,用于根據(jù)所述多對地標信息獲取多個第一語言地標詞匯; 第七獲取子模塊,用于分別獲取每個第一語言地標詞匯的出現(xiàn)概率,并獲取任意兩個第一語言地標詞匯之間的共現(xiàn)概率; 建立子模塊,用于根據(jù)所述每個第一語言地標詞匯的出現(xiàn)概率和所述任意兩個第一語言地標詞匯之間的共現(xiàn)概率獲取所述任意兩個第一語言地標詞匯之間的互信息,以建立第一語言的預(yù)設(shè)互信息集合。
14.如權(quán)利要求13所述的翻譯譯文的提供裝置,其特征在于,所述建立子模塊通過以下公式獲取所述任意兩個第一語言地標詞匯之間的互信息:
15.一種翻譯譯文的提供系統(tǒng),其特征在于,包括: 如權(quán)利要求8-14任一項所述的翻譯譯文的提供裝置;以及 客戶端。
【文檔編號】G06F17/27GK103699528SQ201310746678
【公開日】2014年4月2日 申請日期:2013年12月30日 優(yōu)先權(quán)日:2013年12月30日
【發(fā)明者】王海峰, 趙世奇, 吳華 申請人:北京百度網(wǎng)訊科技有限公司