專利名稱:進行多語種口述詞語實時翻譯的實時翻譯裝置與方法
技術(shù)領(lǐng)域:
本發(fā)明涉及提供多語種“口述詞語”交流、會話與/或?qū)υ挕h以及對公眾講話系統(tǒng)的實時翻譯裝置。本發(fā)明特別涉及旅游、商務(wù)或?qū)I(yè)翻譯的多語種會話翻譯裝置,但是不限于這些用途。
背景技術(shù):
毋庸置疑,人類具有的最大能力是能用長期進化演變而成的復(fù)雜語言進行交流。但是,這也成了人類面臨的最大障礙。即使近來在商貿(mào)領(lǐng)域以及其他許多涉及世界不同國家人民交流的領(lǐng)域中,人們頻繁地使用著“全球化”這個字眼,實現(xiàn)全球化的主要“障礙”還是語言障礙。語言障礙限制了使用許多不同語言之一進行交流的人們相互交流與一對一交流的能力。
在許多場合需要用翻譯,這些場合包括●在語言不同的異國他鄉(xiāng),旅游者在問路、購物或類似裝置最基本場合拼命想讓人聽懂自己的意思。
●商人與使用其不會講的語言的國家的潛在客戶或商業(yè)同事通電話。
●演講者想在會議上或通過廣播對講不同語言的聽眾發(fā)表講話,與之進行交流。
但是,翻譯裝置的創(chuàng)造必然聯(lián)系到典型的口語翻譯的基本結(jié)構(gòu),或要用自然語言處理系統(tǒng)來處理講話者發(fā)出的語音,用模擬-數(shù)字轉(zhuǎn)換器將其轉(zhuǎn)換成數(shù)字形式。對該信號進行處理,抽出各種特征,如各不同頻率的語音強度以及強度的隨時變化。這些特征作為語音識別系統(tǒng)的輸入,該系統(tǒng)通常采用隱馬爾可夫模型(HMM)技術(shù)來識別最可能生成該語音信號的詞語序列。語音識別器輸出最有可能的詞語序列,作為自然語言處理系統(tǒng)的輸入。當(dāng)自然語言處理系統(tǒng)需要生成發(fā)音時,它將句子送至將詞語轉(zhuǎn)換為語音序列并確定語調(diào)類型的模塊,并將信息送至語音合成系統(tǒng),由其生成語音輸出。
大多數(shù)翻譯裝置看到口語翻譯的難度,就口語轉(zhuǎn)換成書面語言,再用一套翻譯的規(guī)則與范疇對書面語言進行詳細分析。
自然語言處理系統(tǒng)應(yīng)用了大量的語言結(jié)構(gòu)知識,包括詞語是什幺,詞語如何結(jié)合成句子,詞語的意思是什幺,詞語的意思對整句的意思起何作用。但是,如不考慮人類智慧的另一方面——即他們的普遍知識與表達能力,則語言學(xué)的知識就不全靠得住。例如,在回答問題或參與談話時,人不僅要知道所用語言的結(jié)構(gòu),而且要知道普通常識以及談話的場景。
與自然語言處理有關(guān)的不同形式的知識包括語音與音系知識、詞法知識、句法知識、語意知識以及語用知識。語音與音系知識是關(guān)于單詞與語音的聯(lián)系以及如何發(fā)音的。詞法知識是關(guān)于單詞是如何由稱為詞素的基本單位構(gòu)成的。詞素是語言的最基本單位,例如friendly這個詞是從名詞friend與后綴“-ly”的意思派生出來的,將名詞變成了形容詞。
句法知識是關(guān)于如何將詞語結(jié)合起來構(gòu)成正確的句子,確定每個單詞在句子中的結(jié)構(gòu)作用,以及什幺短語是什幺其他短語的構(gòu)成部分的。典型的語言句法結(jié)構(gòu)基于無上下文語法的概念,即從什幺短語從屬什幺短語這樣的方式闡述句子結(jié)構(gòu)的。這種句法信息往往用樹形結(jié)構(gòu)表示。
語意知識是關(guān)于詞語的意思以及這些意思如何結(jié)合起來構(gòu)成句子的意思的。這是研究獨立于上下文的意思的——即不考慮句子使用的上下文時的句子意思。句子獨立于上下文的意思的表示方式被稱為其邏輯形式。
邏輯形式將單詞可能有的含義代碼化,確定單詞與短語之間的語意關(guān)系。
自然語言處理系統(tǒng)還包括將一種表達方式變換成另一種表達方式的翻譯處理。例如,將一個句子變換成句法結(jié)構(gòu)與邏輯形式的處理叫解析,是用一個叫解析器的元件進行的。解析器使用單詞、詞義,即詞典,一套定義合法結(jié)構(gòu)的規(guī)則,即語法來確定輸入句子的句法結(jié)構(gòu)以及邏輯形式。從形式上來說,語言的無上下文語法是一個包括終結(jié)詞匯、非終結(jié)詞匯、一套有限的生成規(guī)則以及一切生成物的開始符的四元組。非終結(jié)詞匯與終結(jié)詞匯是不相交的。一套終結(jié)符號被稱為語言的詞匯。語用知識關(guān)心的是如何在不同場合使用句子,以及使用如何影響句子的解釋。
但是,典型的自然語言處理只取得了有限的成功,因為其處理器只在窄小的框架內(nèi)工作。自然語言處理器接受輸入的句子,按詞匯學(xué),將句子劃分成的單詞,按句法學(xué),確定單詞的類型,按語意學(xué)理解單詞的含義,按語用學(xué)確定要產(chǎn)生成的反應(yīng),生成概反應(yīng)。
自然語言處理器要使用許多類型的知識,要存貯不同知識結(jié)構(gòu)的不同類型的知識,將其分門別類組織起來。典型的自然語言處理器要用非常復(fù)雜的機器。典型的自然語言處理器所用的知識與容量必須降低其復(fù)雜性,才能使得自然語言處理器能操作,能應(yīng)用,因為自然語言處理器必須做到能對輸入的句子作出比較正確的反應(yīng)。
自然語言處理器以前所用方法已經(jīng)發(fā)現(xiàn)有許多問題,涉及典型口語翻譯系統(tǒng)的許多組件。在口語翻譯系統(tǒng)方面,以前有一種方法是將分析句子的句法規(guī)則與轉(zhuǎn)換句型或轉(zhuǎn)換規(guī)則結(jié)合起來。其結(jié)果是句法規(guī)則與轉(zhuǎn)換規(guī)則變得相互依賴,系統(tǒng)變得不標(biāo)準(zhǔn)化,很難擴充或應(yīng)用于新的翻譯領(lǐng)域。
在授予索尼公司的第6,266,642號美國專利中,提出了一種口語翻譯的方法與便攜式裝置。但是它要求對至少一種源語言的至少一種源表達采取識別步驟,要識別至少一種源表達的步驟包括對至少一個講話輸入進行操作,生成中間源語言數(shù)據(jù)結(jié)構(gòu),用一個模型從中間源語言數(shù)據(jù)結(jié)構(gòu)生成至少一種源識別假設(shè),從至少一種源識別假設(shè)確定最佳源識別假設(shè),從最佳源識別假設(shè)生成至少一種源表達。很清楚,這要進行詳細的計算機分析,不是便攜式或會話翻譯裝置拿來就可用的。
第6,278,968號美國專利也詳細說明了一種大型的計算機翻譯裝置。該發(fā)明涉及將一種語言翻成另一種語言。更具體地說,該發(fā)明涉及為至少是部分依據(jù)使用者選擇要進行翻譯的特定話題提供語言翻譯。因此,該翻譯裝置能力有限,不能提供真正的會話翻譯。
所以,很少有翻譯裝置從物理硬件與通訊信道著手來提供便攜式會話實時翻譯裝置。
應(yīng)當(dāng)注意到第6,266,642號美國專利聲稱提供了一種便攜式裝置,該發(fā)明的實施例有一個便攜式裝置能進行口語翻譯。其中有個實施例是一臺手提電腦,另一個實施例是手機。便攜式實施例可以是自足式的或非自足式的。自足式便攜式實施例包括接收自然口語輸入,進行翻譯以及輸出翻好的自然口語的硬件與軟件。
非自足式的實施例包括接收自然口語輸入,將輸入數(shù)字化以及通過各種通訊方法將數(shù)字化的輸入傳送至進行翻譯的遠程硬件與軟件用的硬件與軟件,遠程的硬件與軟件生成對對用戶講的自然口語。
但是,這種翻譯裝置的結(jié)構(gòu)只允許單向通訊,因此不是適合于雙向會話的便攜式翻譯裝置。
發(fā)明內(nèi)容
本發(fā)明的目的是為不同語言間的口述詞語障礙提供一種電子解決方案。
廣義地說,本發(fā)明提供一種多語種會話翻譯裝置,該裝置有用一個或多個聲卡與軟件操作的兩個聲道,對第一個人用一種口述詞語講的話進行翻譯,并讓用第二種口述詞語的第二個人在其講話被翻譯與被第一個人收聽的同時或基本同時所收聽到,使得兩人能在正常時間聽懂不同口述詞語的正常會話。
該翻譯裝置可以是便攜式的或手持的,有內(nèi)裝或附加耳機或類似裝置。
該系統(tǒng)的其他型號可附加于電話系統(tǒng)或個人講話系統(tǒng)或類似裝置。
本發(fā)明的實時翻譯裝置包括(a)語音接收器;(b)語音文字轉(zhuǎn)換器;(c)接收第一語言并翻譯成第二選擇語言的文字至文字口語轉(zhuǎn)換器;(d)將翻好的第二選擇語言轉(zhuǎn)換成語音輸出的文字語音轉(zhuǎn)換器;以及(e)發(fā)出語音輸出的揚聲器。
本發(fā)明的一種形式的實時翻譯裝置包括(a)至少一個語音接收器;(b)至少一個語音文字轉(zhuǎn)換器;(c)至少一個接收第一選擇語言文字并翻譯成第二選擇語言文字與/或接收第二選擇語言文字并翻譯成第一選擇語言文字的文字至文字口語轉(zhuǎn)換器;(d)至少一個將翻好的第一與/或第二選擇語言轉(zhuǎn)換成語音輸出的文字語音轉(zhuǎn)換器;以及(e)至少一個發(fā)出語音輸出的揚聲器。
實時翻譯裝置可以包括由兩個獨立的帶軟件的電子聲音發(fā)生器形成的兩個聲道,這樣可在翻成第二選擇語言的文字被帶軟件的第二獨立電子聲音發(fā)生器轉(zhuǎn)換成語音的同時,將正在接收的第一語言的第一語音轉(zhuǎn)換成文字。獨立電子聲音發(fā)生器可以是兩塊個人電腦聲卡或類似裝置,或是一塊個人電腦聲卡的兩個有獨立軟件控制的左右信道。
本發(fā)明的特別優(yōu)選的實施例的便攜式實時翻譯裝置包括(a)接收第一與第二選擇語音的第一與第二語音接收器;(b)第一與第二語音文字轉(zhuǎn)換器;(c)至少一個接收第一選擇語言文字并翻譯成第二選擇語言文字與/或接收第二選擇語言文字并翻譯成第一選擇語言文字的文字至文字口語轉(zhuǎn)換器;(d)至少一個將翻好的第一與第二選擇語言轉(zhuǎn)換成第一與第二語音輸出的文字語音轉(zhuǎn)換器;以及(e)第一與第二發(fā)出語音輸出的揚聲器。
在進行第一與第二會話的語音與文字相互轉(zhuǎn)換與/或文字至文字口語翻譯的過程中,會有一個“反應(yīng)時間”,這個時間要讓接收語音和發(fā)出翻好的語音之間的時間滯后在合理的會話時間內(nèi)。這個時間可以小于1秒,最多不超過2秒。為了更好地模仿會話,語音的翻譯與發(fā)出是用基本上與輸入語音的語音片段一致的語音片段進行的,形成一個連續(xù)的有間隔語音片段流來模仿會話??偟恼f來,這樣的語音片段是一個句子或句子的一部分。
還有,在處理過程中可能會有“重疊”,接收、翻譯第一語言的第一語音與發(fā)出翻好的語音與接收第二語言的第二語音以及翻譯與發(fā)出第二翻好的語音會同時或顯然同時進行。這可用獨立處理路徑,包括獨立個人電腦聲卡或類似裝置或一張聲卡的獨立信道或類似裝置,或用開關(guān)系統(tǒng)按保持同時合理實時處理兩條路徑的速率來開關(guān)兩條處理路徑。
本發(fā)明還提供了一種提供實時語音翻譯的方法。該方法包括的步驟為(a)提供接收第一與第二選擇語音的第一與第二語音接收器;(b)提供分別與第一與第二語音接收器相連接的第一與第二發(fā)出語音輸出的語音揚聲器;(c)將上述第一與第二語音接收器來的上述第一與第二選擇語音轉(zhuǎn)換成文字(d)提供從上述第一語音接收器接收第一選擇語言文字并翻譯成第二選擇語言文字與/或接收第二選擇語言文字并翻譯成第一選擇語言文字的文字至文字口語轉(zhuǎn)換器;(e)提供將翻好的第一與第二選擇語言轉(zhuǎn)換成第一與第二語音輸出的語音轉(zhuǎn)換器;以及(f)發(fā)出上述翻好、轉(zhuǎn)換好的第一與第二語音輸出。
語音到文字的轉(zhuǎn)換與/或文字翻譯與/或文字到語音的轉(zhuǎn)換存在著平行處理。兩塊聲卡或一塊聲卡上兩個獨立工作的信道可提供第一與第二語音接收器與第一與第二揚聲器。語音到文字的轉(zhuǎn)換與/或文字翻譯與/或文字到語音的轉(zhuǎn)換處理是由中央處理器(CUP)或類似裝置與聲卡的軟件控制進行的。平行處理可由中央處理器(CUP),平行處理技術(shù)來進行,但是主要是通過軟件控制的開關(guān)技術(shù)進行平行處理。因此,兩條路徑總是在兩個方向為提供會話進行工作。
軟件要克服后裝的聲卡一般會在正常工作的單聲卡工作環(huán)境中喧賓奪主的困難。軟件可解決這種問題,解決兩塊聲卡在軟件控制的小于1秒與最多2秒的語音片段到中央處理器(CUP)的兆赫速度間進行開關(guān)平行操作的非同尋常的平行操作。
本發(fā)明提供了一種實用的解決方案,可以(1)通過面對面或通過電話線或類似裝置在兩種不同語言之間進行轉(zhuǎn)換,使得想進行會話交流的兩個人或兩組人能會話與/或(較直接,即時,當(dāng)場)對話;(2)讓報告人用聽眾聽起來困難的語言對聽眾講話;(3)讓聽眾作出反應(yīng),發(fā)表評論或向報告人提問。
本發(fā)明的翻譯裝置主要應(yīng)用于三種場合1.兩種不同語言的人對人會話與/或?qū)υ?,無論在何種情況下,均可使兩個使用不同語言的講話者面對面地會話或?qū)υ?交流方式)。
2.兩種不同語言的人對人或團體對團體通過電話線(或類似工具)的會話與/或?qū)υ?,無論在何種情況下,均可使兩個使用不同語言的講話者進行遠程會話或?qū)υ?交流方式)。
3.在講課、開會或?qū)娭v話系統(tǒng)中,一個人對許多人講話,從一種語言轉(zhuǎn)換為另一種語言,無論在何種情況下,均能使講話者與聽眾間用兩種不同語言進行一對多交流。
本發(fā)明為上述情況提供了一種具創(chuàng)造性與實用性的解決方案,該方案能用語言A進行交流(講)并能立即、即時、“當(dāng)場”用語言B聽懂(聽)。反過來也能用語言B交流(回答),用語言A聽懂(聽)。在前兩種場合,可以進行兩種語言的實時會話/對話。在第三種場合,可以用一種語言“講話”或“告訴”來進行交流,但用另一種語言聽懂(聽),并接收聽眾的評論或提問或類似裝置反應(yīng)。
該系統(tǒng)作為教學(xué)工具也特別有用,因為它可以提供變化的輸入與實時翻譯。另外,還可以用鍵盤輸入提供實時文字翻譯。
為了使發(fā)明更容易被理解,下面將參照附圖對實施例教學(xué)說明,附圖中,圖1是本發(fā)明第一實施例的實時翻譯裝置流程圖;圖2是圖1的實時翻譯裝置的示意圖;圖3是本發(fā)明的實時翻譯裝置第一用途的示意圖;圖4是是本發(fā)明的實時翻譯裝置第二用途的示意圖;圖4A是本發(fā)明的實時翻譯裝置用作電話公司或通訊服務(wù)提供商的服務(wù)器的另一種用途的示意圖;圖5是本發(fā)明的實時翻譯裝置第三用途的示意圖。
具體實施例方式
在附圖中,特別是圖1與2中,表示了本發(fā)明的一個實時翻譯裝置(11),它具有語音接收器或麥克風(fēng)(101),語音文字轉(zhuǎn)換器(102),接收第一語言并將其翻譯成第二選擇語言的文字到文字口語翻譯裝置(103),將翻好的第二選擇語言轉(zhuǎn)換成語音輸出的文字語音轉(zhuǎn)換器(105)以及發(fā)出語音輸出的語音發(fā)生器或揚聲器(211)。
另外,還表示了本發(fā)明的實時翻譯裝置(11)還具有第二語音接收器或麥克風(fēng)(201),語音文字轉(zhuǎn)換器(202),接收第二語言并將其翻譯成第一選擇語言的文字到文字口語翻譯裝置(203),將翻好的第一選擇語言轉(zhuǎn)換成語音輸出的文字語音轉(zhuǎn)換器(105)以及發(fā)出語音輸出的語音發(fā)生器或揚聲器(111)。
語音到文字的轉(zhuǎn)換與/或文字翻譯與/或文字到語音的轉(zhuǎn)換存在著平行處理。兩塊聲卡(151,152)或一塊聲卡(151)上兩個獨立工作的信道(151A,151B)可提供第一與第二語音接收器(101,201)與第一與第二揚聲器(111,211)。語音到文字的轉(zhuǎn)換與/或文字翻譯與/或文字到語音的轉(zhuǎn)換處理是由中央處理器(CUP)或類似裝置與聲卡(151,152)的軟件控制進行的。平行處理可由中央處理器(CUP),平行處理技術(shù)來進行,或通過軟件控制的開關(guān)技術(shù)進行處理。
實時翻譯裝置(11)包括由兩個獨立的帶軟件的電子聲音發(fā)生器形成的兩個聲道,這樣可在翻成第二選擇語言的文字被帶軟件的第二獨立電子聲音發(fā)生器轉(zhuǎn)換成語音的同時,將正在接收的第一語言的第一語音轉(zhuǎn)換成文字。獨立電子聲音發(fā)生器可以是兩塊個人電腦聲卡(151,152)或類似裝置,或是一塊個人電腦聲卡(151)的兩個有獨立軟件控制的獨立左右信道(151A,151B)。
在進行第一與第二會話的語音與文字相互轉(zhuǎn)換與/或文字至文字口語翻譯的過程中,會有一個“反應(yīng)時間”,這個時間要讓接收語音和發(fā)出翻好的語音之間的時間滯后在合理的會話時間內(nèi)。這個時間可以小于1秒,最多不超過2秒。為了更好地模仿會話,語音的翻譯與發(fā)出是用基本上與輸入語音的語音片段一致的語音片段進行的,形成一個連續(xù)的有間隔語音片段流來模仿會話??偟恼f來,這樣的語音片段是一個句子或句子的一部分。
還有,在處理過程中可能會有“重疊”,接收、翻譯第一語言的第一語音與發(fā)出翻好的語音與接收第二語言的第二語音以及翻譯與發(fā)出第二翻好的語音會同時或顯然同時進行。這可用獨立處理路徑,包括獨立個人電腦聲卡或類似裝置或一張聲卡的獨立信道或類似裝置,或用開關(guān)系統(tǒng)按保持同時合理實時處理兩條路徑的速率來開關(guān)兩條處理路徑。
本發(fā)明的實質(zhì)是使兩種不同語言能進行會話/對話,不管用什么語言進行會話/對話,本發(fā)明均能進行。會話能在下列語言間進行英語、朝鮮語、法語、簡體漢語、繁體漢語、意大利語、德語、西班牙語與日語。
本發(fā)明的技術(shù)方法包括3個基本步驟1.通過例如麥克風(fēng)或類似裝置輸入信道(例如輸入源-1)或通過電話線接收口述單詞與/或句子,將其轉(zhuǎn)換成文字。
2.將文字從一種語言翻譯成另一種語言。
3.通過例如耳機的揚聲器、電話或類似裝置輸出信道(輸出源2)將翻好的文字再轉(zhuǎn)換成語音輸出。
步驟-1通過輸入源接收口述單詞或句子當(dāng)對著麥克風(fēng)(101)講詞語時,麥克風(fēng)工作并接收詞語作為輸入。
通過麥克風(fēng)(101)接收用語言A講的詞語并轉(zhuǎn)換成文字。
在實時翻譯裝置(150)內(nèi)將語言A的詞語(文字形式)翻譯成語言B(也是文字形式)。實時翻譯裝置開關(guān)(104)開到揚聲器(211),語言B的文字被轉(zhuǎn)換成語音并通過揚聲器(211)“講出”。
通過麥克風(fēng)(201)接收用語言B回答的詞語或任何詞語,并將其轉(zhuǎn)換成文字。語言B的詞語(文字形式)在實時翻譯裝置(150)內(nèi)翻譯成語言A)也是文字形式)。實時翻譯裝置(150)開到揚聲器(111),語言A的詞語構(gòu)成的文字被轉(zhuǎn)換成語音并通過揚聲器(111)“講出”。上述一切都是立即、即時、“當(dāng)場”發(fā)生的,實現(xiàn)了兩種不同語言間的實時會話/對話。
實時翻譯裝置軟件(160)根據(jù)兩個語音輸入源(101,201)中的一個的輸入啟動,通過例如麥克風(fēng)或類似裝置輸入信道或通過電話線接收人-1用語言A講的口述單詞與/或句子的輸入源。
如下面將要詳細說明的硬件結(jié)構(gòu)所示,本發(fā)明是依靠軟件控制的兩塊聲卡工作的,或通過軟件利用一塊聲卡(151)的“左右”信道(151A,151B)操作系統(tǒng)特點工作的。
但是,優(yōu)選實施例采用兩塊聲卡加軟件的方法。用這兩種方法的任何一種,實時翻譯裝置的發(fā)明都是從下列語音輸入裝置接收口述詞語的。
(1)從(耳機的或單獨的)麥克風(fēng)。
(2)從電話線。
(3)從會議或公共廣播/講話系統(tǒng)。
口述單詞或句子被轉(zhuǎn)換成文字供翻譯。優(yōu)選實施例采用專為開發(fā)語音識別應(yīng)用技術(shù)而銷售的國際商業(yè)機器公司的(IBMTM)軟件包的語音識別(VIA VOICE)軟件包。
但是,也可以用任何類似的語音識別軟件,這種軟件市售的有好幾種,還可以自寫類似軟件。無論用何種軟件,實時翻譯裝置軟件(160)都是一樣的。
步驟-2翻譯文字在步驟-1接收并轉(zhuǎn)換成文字的單詞/句子輸入源被從一種語言翻譯成另一種語言。優(yōu)選實施例為此采用的軟件包也是IBM的“書面語言翻譯”軟件包。該軟件包是IBMTM專為開發(fā)語音識別應(yīng)用技術(shù)而上市銷售的。但是,也可以用任何類似的語音識別軟件,這種軟件市售的有好幾種,還可以自寫類似軟件。但是,無論用何種軟件,用實時翻譯裝置軟件(160)的整個實時翻譯裝置(150)都是一樣的。
步驟-3播出被轉(zhuǎn)換的文字最后的步驟是文字到語音。實時翻譯裝置(150)完成文字翻譯后,最后一步是將其又轉(zhuǎn)換成語音并用翻好的語言的詞語“播出”該文字。
優(yōu)選實施例為此采用的軟件包是微軟公司的語音引擎(TTS)軟件包。該軟件包是微軟專為開發(fā)文字到語音應(yīng)用技術(shù)而上市銷售的。但是,也可以用任何類似的語音識別軟件,這種軟件市售的有好幾種,還可以自寫類似軟件。但是,無論用何種軟件,用實時翻譯裝置軟件(160)的整個實時翻譯裝置(150)都是一樣的。
圖3所示的是通過會話/對話的人對人交流。當(dāng)人-1與人-2談話時,實時翻譯裝置硬件(151、152、153)(為使用實時翻譯裝置軟件(160)設(shè)計的便攜式硬件)運行實時翻譯裝置軟件(160)。
麥克風(fēng)/揚聲器(通過耳機或類似裝置)連接聲卡-1。另一個麥克風(fēng)/揚聲器(獨立或也通過耳機)連接聲卡-2。聲卡-1與相應(yīng)的麥克風(fēng)與揚聲器由人-1使用。聲卡-2與相應(yīng)的麥克風(fēng)與揚聲器供人-2使用。
人-1對連接聲卡1的麥克風(fēng)講語言A的單詞(句子),由實時翻譯裝置軟件(160)控制的輸入麥克風(fēng)(101)接收,并轉(zhuǎn)換成文字。
實時翻譯裝置軟件(160)控制麥克風(fēng)(101)的輸入。
實時翻譯裝置軟件(160)與其控制的軟件將語言A的文字翻譯成語言B的文字。
實時翻譯裝置軟件(160)在實時翻譯裝置(150)內(nèi)部開啟對聲卡-2的控制。前面由實時翻譯裝置(150)翻譯成語言B的文字被轉(zhuǎn)換成語音,并被“大聲播出”,讓人-2通過連接到聲卡-2的揚聲器聽到。
當(dāng)人-2回答人-1或與其講話時,情況正相反聲卡-2與相應(yīng)的麥克風(fēng)與揚聲器供人-2使用。
人-2對著連接聲卡-2的麥克風(fēng)進行回答(或講話)。用語言B講的詞語由實時翻譯裝置軟件(160)控制的輸入麥克風(fēng)(201)接收,并轉(zhuǎn)換成文字。
實時翻譯裝置軟件(160)控制麥克風(fēng)(201)的輸入。
實時翻譯裝置軟件(160)與其控制的軟件將語言B的文字翻譯成語言A的文字。
實時翻譯裝置軟件(160)在實時翻譯裝置(150)內(nèi)部開啟對聲卡-1的控制。前面由實時翻譯裝置(150)翻譯成語言A的文字被轉(zhuǎn)換成語音,并被“大聲播出”,讓人-1通過連接到聲卡-1的揚聲器聽到。
這就使得分別講A、B兩種語言的人1與2可進行雙向交流。個人都用各自的語言講話,從對方聽到的是自己所用的語言。似乎沒有語言差別的樣子。通過便攜式實時翻譯裝置(150)便可面對面地進行一對一的實時會話。
在圖4所示的另一個人對人電話通訊實施例中,采用了電話系統(tǒng)或語音通訊系統(tǒng)。人-1與人-2通過電話或類似通訊方法談話實時翻譯裝置硬件(151、152、153)(為使用實時翻譯裝置軟件(160)設(shè)計的便攜式硬件)運行實時翻譯裝置軟件(160)。麥克風(fēng)/揚聲器(通過耳機或類似裝置)連接聲卡-1。
聲卡-2與普通的工業(yè)標(biāo)準(zhǔn)語音調(diào)制解調(diào)器相連接,語音調(diào)制解調(diào)器的輸出與普通的標(biāo)準(zhǔn)電話插頭相連接。在人-2處不需要專門的連接設(shè)備,就用普通電話作為另一個麥克風(fēng)/揚聲器。因此,聲卡-1與相應(yīng)的麥克風(fēng)與揚聲器由人-1使用,聲卡-2與相應(yīng)的(電話)麥克風(fēng)與揚聲器由人-2使用。
電話撥號由人-1用語音調(diào)制解調(diào)器進行,電話接通后人-1對連接聲卡1的麥克風(fēng)講語言A的單詞(句子),由實時翻譯裝置軟件(160)控制的輸入麥克風(fēng)(101)接收,并轉(zhuǎn)換成文字。
實時翻譯裝置軟件(160)控制麥克風(fēng)(101)的輸入。
實時翻譯裝置軟件(160)與其控制的軟件將語言A的文字翻譯成語言B的文字。
實時翻譯裝置軟件(160)在實時翻譯裝置(150)內(nèi)部開啟對聲卡-1的控制。
翻譯成語言B的詞語被轉(zhuǎn)換成語音,并被通過與聲卡-2相連接的電話線“大聲播出”,讓人-2通過普通電話耳機的揚聲器聽到。電話語音脈沖/音頻會話由語音調(diào)制解調(diào)器進行,是其普通功能的一部分。
人-2用同樣的電話或類似通訊方法進行回答或與人-1談話人-2在電話線(或類似電訊設(shè)備)的一端用語言B所作的回答或講的其他話象平常一樣由電話線進行傳輸,輸入聲卡-2。
實時翻譯裝置軟件(160)控制麥克風(fēng)(201)的輸入。
實時翻譯裝置軟件(160)與其控制的軟件將語言B的文字翻譯成語言A的文字。
實時翻譯裝置軟件(160)在實時翻譯裝置(150)內(nèi)部開啟對聲卡-1的控制。
被實時翻譯裝置(150)翻譯成語言A的詞語被送至聲卡-1,轉(zhuǎn)換成語音,并被通過與聲卡-1相連接的揚聲器(耳機或類似裝置)“大聲播出”,讓人-1聽到。
這就使得分別講A、B兩種語言的人1與2可通過普通標(biāo)準(zhǔn)電話線路進行雙向交流。個人都用各自的語言講話,從對方聽到的是自己所用的語言。似乎沒有語言差別的樣子。通過便攜式實時翻譯裝置(150)或(如下所述)將其連接到電話上)通過電話便可面對面地進行一對一的實時會話。采用普通標(biāo)準(zhǔn)語音調(diào)制解調(diào)器連接實時翻譯裝置硬件(151、152、153)(并軟件)為用標(biāo)準(zhǔn)電話脈沖/音頻進行語音會話提供了一種簡單的解決方案。另外。在不同國家應(yīng)用時,可方便有效地使用各國電訊局批準(zhǔn)語音調(diào)制解調(diào)器,不必用必須得到各國批準(zhǔn)的專門的轉(zhuǎn)換器。
與面對面的情況一樣,在用電話時,在另一端的人-2不需要實時翻譯裝置(150)或任何專用設(shè)備,因為人-1的實時翻譯裝置完成了全部的工作。
前面圖4所示的人對人電話通訊實施例的有一種另外形式,該變化的形式如圖4A所示,表示了人對人電話通訊的另一種使用方式。
如圖4A所示,使用了電話系統(tǒng)或語音通訊系統(tǒng)。
但是,與前面不同的是軟件與硬件有所改變,兩塊聲卡的方法用于電訊公司或電訊服務(wù)供應(yīng)商的系統(tǒng)中的計算機服務(wù)器(PC)上,通過許可進行工作,不再用外部的語音調(diào)制解調(diào)器。
人-1與人-2通過電話公司或電訊服務(wù)供應(yīng)商提供的電話或類似通訊方法談話實時翻譯裝置硬件(151、152、153)(為使用實時翻譯裝置軟件(160)設(shè)計的便攜式硬件)運行實時翻譯裝置軟件(160)。打電話的人(人-1)的電話耳機或麥克風(fēng)/揚聲器(通過耳機或類似裝置)連接在電話公司或服務(wù)供應(yīng)商的服務(wù)器上的聲卡-1。
聲卡-2也連接在電話公司或服務(wù)供應(yīng)商的服務(wù)器上,并向外連接到電話網(wǎng)絡(luò),當(dāng)接通人2打的電話時,便可進行人對人的電話會話。
由人-1用電話公司或服務(wù)供應(yīng)商提供的專門用于該專門服務(wù)的專門號碼撥號,將電話連接到(實時翻譯裝置軟件(160)所在的)服務(wù)器。
然后,人-1按電話公司或服務(wù)供應(yīng)商的語音指示撥通接聽人的電話號碼。
然后接聽人被連接到實時翻譯裝置軟件(160)所在的同一服務(wù)器上,連接到了聲卡-2。
人-1對電話公司或服務(wù)供應(yīng)商的聲卡-1所附的麥克風(fēng)講話,語言A的詞語由控制輸入麥克風(fēng)/電話(101)的實時翻譯裝置軟件(160)接收,并轉(zhuǎn)換成文字。
電話公司或服務(wù)供應(yīng)商服務(wù)器的實時翻譯裝置軟件(160)控制麥克風(fēng)/電話(101)來的輸入。
電話公司或服務(wù)供應(yīng)商服務(wù)器的實時翻譯裝置軟件(160)與其控制的軟件將語言A的文字翻譯成語言B的文字。
電話公司或服務(wù)供應(yīng)商服務(wù)器的實時翻譯裝置軟件(160)在實時翻譯裝置(150)內(nèi)部開啟對聲卡-2的控制。
被翻譯成語言B的詞語被轉(zhuǎn)換成語音,并被通過與電話公司或服務(wù)供應(yīng)商服務(wù)器上聲卡-2連接的電話線“大聲播出”,讓人-2通過普通電話耳機聽到電話聲音。
人-2用同樣的電話或類似通訊方法進行回答或與人-1談話人-2在電話線(或類似電訊設(shè)備)的一端用語言B所作的回答或講的其他話象平常一樣由電話線進行傳輸,輸入電話公司或服務(wù)供應(yīng)商服務(wù)器上的聲卡-2。
實時翻譯裝置軟件(160)控制麥克風(fēng)(201)來的輸入。
實時翻譯裝置軟件(160)與其控制的軟件將語言B的文字翻譯成語言A的文字。
實時翻譯裝置軟件(160)在實時翻譯裝置(150)內(nèi)部開啟對聲卡-1的控制,被實時翻譯裝置(150)翻譯成語言A的詞語被送至聲卡-1,轉(zhuǎn)換成語音,并被通過與聲卡-1相連接的揚聲器(耳機或類似裝置)“大聲播出”,讓人-1聽到。
這就使得分別講A、B兩種語言的人1與2可通過作為電話公司或服務(wù)供應(yīng)商服務(wù)器許可操作的普通標(biāo)準(zhǔn)電話線路進行雙向交流。個人都用各自的語言講話,從對方聽到的是自己所用的語言。似乎沒有語言差別的樣子。通過電話公司或服務(wù)供應(yīng)商提供的實時翻譯裝置(150),利用電話便可面對面地進行一對一的實時會話。
在如圖4A所示的人對人電話通訊的例子中,如果一個法國人通過電話與日本人會話,首先由作為人-1的人,比如法國人撥通人-2,比如日本人的電話。人-1講法語,人-2講日語。通過連接到實時翻譯裝置,人1講法語,實時翻譯裝置直接對人2講日語。用日語進行的回答由實時翻譯裝置進行翻譯,用法語回答人1。這樣,雖然雙方都不懂對方的語音,但可以即時進行交流。
在圖5所示的一個人對許多人,即講話人對聽眾或公眾講話場合的另一個實施例中,人-1與(以人-2為代表的)許多人談話。實時翻譯裝置硬件(151、152、153)(為使用實時翻譯裝置軟件(160)設(shè)計的便攜式硬件)運行實時翻譯裝置軟件(160)。麥克風(fēng)/揚聲器(通過耳機或類似裝置)連接聲卡-1。
如聽眾需要擴音器或其他任何揚聲器/廣播系統(tǒng),將聲卡-2連接到另一個麥克風(fēng)/揚聲器上(獨立的或通過耳機)。聲卡-1與相應(yīng)的麥克風(fēng)與揚聲器由人-1(在本實施例中為講師/演講者)使用。
聲卡-2與相應(yīng)的麥克風(fēng)與揚聲器供人-2,即該場合下的聽眾使用。
人-1對連接聲卡1的麥克風(fēng)講語言A的詞語(句子),由實時翻譯裝置軟件(160)控制的輸入麥克風(fēng)(101)接收,并轉(zhuǎn)換成文字。
實時翻譯裝置軟件(160)控制麥克風(fēng)(101)的輸入。
實時翻譯裝置軟件(160)與其控制的軟件將語言A的文字翻譯成語言B的文字。
實時翻譯裝置軟件(160)在實時翻譯裝置(150)內(nèi)部開啟對聲卡-2的控制。前面由實時翻譯裝置(150)翻譯成語言B的文字被轉(zhuǎn)換成語音,并被“大聲播出”,讓聽眾(人-2)通過連接到聲卡-2的揚聲器聽到。
因此可以看到本發(fā)明包括了可提供兩種不同語言之間的方便雙向即時會話/對話的實時翻譯裝置軟件(160)與硬件。(通過便攜式實時翻譯裝置(150))便可面對面地會話。
通過標(biāo)準(zhǔn)電話或通訊工具進行會話。
進行一對多對話,如演講者對聽眾的場合。
在一對多講話的場合,如無線電、電視廣播與廣播講話。
通過會議系統(tǒng)進行一對多對話。
實時翻譯裝置(150)對結(jié)構(gòu)的特殊要求就是增加兩塊聲卡。通過編碼利用單一聲卡的“左右”信道也能取得同樣的效果,但是原型采用了兩塊聲卡的方法。
本發(fā)明的實施例可以做成便攜式的,做得越小越好,以便于由人攜帶。實時翻譯裝置軟件(160)有效地打破了語言障礙。無論是英譯漢還是德譯日,不會講某種語言,不能與聽不懂你講話、只會說不同語言的人對話的障礙被實時翻譯裝置(150)永遠打破了。實時翻譯裝置(150)是旅行者與旅游者的伙伴與朋友,使他們獲得了完全的自由。使用者可以自由自在地周游列國,讓別人立即“當(dāng)場”聽懂自己講話,根本無需學(xué)會任何外語。實時翻譯裝置(150)為商人提供了有效的通訊工具。本發(fā)明還提供了方便的電話通訊的商業(yè)工具,不需要進行耗時耗錢的昂貴且無用的練習(xí)。可與客戶、供應(yīng)商、潛在的商業(yè)伙伴直接談話,沒有語言障礙以及隨之而來的問題/煩惱。
實時翻譯裝置(150)為需要用不同語言進行的公共通訊,教學(xué),為需要處理講不同語言的人民事務(wù)的政府部門提供了有效的工具。
本發(fā)明還提供了兩種軟件。第一種軟件的配置如下實時翻譯裝置軟件裝在個人電腦上,在屏幕上進行顯示,引導(dǎo)用戶。
麥克風(fēng)由軟件控制,通過麥克風(fēng)或鍵盤輸入接收用戶講話輸入。
實時翻譯裝置軟件將把輸入從語言A轉(zhuǎn)換成語言B,通過個人電腦的揚聲器實時、基本上是立即進行回答。
因此可以看到該軟件也是學(xué)習(xí)外語的有用工具/輔助教具。
該軟件還能使使用者聽懂用語言B回答的詞語,使得使用者學(xué)到該語言的相應(yīng)詞語,正確的發(fā)音以及恰當(dāng)?shù)闹v話方式。
與任何其他要先錄音與先輸入詞語的類似工具相比,這是一個突出的優(yōu)點。這使得用戶可通過“自由”講與聽來學(xué)習(xí)他想學(xué)的語言。這樣,學(xué)習(xí)過程就變得非常容易,也更切合實際。
第二種軟件除了上述的之外,還有一個使用實時翻譯裝置相同功能的平行應(yīng)用屏幕。這使得用戶可用語言B練習(xí)發(fā)音與講話,并將其實時、基本上是立即翻回語言A。用戶因此可以學(xué)會正確的發(fā)音,因為只有發(fā)音基本正確時翻回到語言A才會說出原來的詞語。
權(quán)利要求
1.一種實時翻譯裝置,包括(a)語音接收器;(b)語音文字轉(zhuǎn)換器;(c)接收第一語言并翻譯成第二選擇語言的文字至文字口語轉(zhuǎn)換器;(d)將翻好的第二選擇語言轉(zhuǎn)換成語音輸出的文字語音轉(zhuǎn)換器;以及(e)發(fā)出語音輸出的揚聲器;其特征是該實時翻譯裝置作為一種多語種會話翻譯裝置,有用一個或多個聲卡與軟件操作的兩個聲道,對第一個人用一種口述詞語講的話進行翻譯,并讓用第二種口述詞語的第二個人在其講話被翻譯與被第一個人收聽的同時或基本同時所收聽到,使得兩人能在正常時間聽懂不同口述詞語的正常會話。
2.根據(jù)權(quán)利要求1所述的翻譯裝置,其特征是翻譯裝置是便攜式的或手提式的或是一個耳機或類似裝置。
3.根據(jù)權(quán)利要求1所述的翻譯裝置,其特征是能裝在電話系統(tǒng)或個人講話系統(tǒng)或類似裝置上。
4.一種實時翻譯裝置;包括(a)至少一個語音接收器;(b)至少一個語音文字轉(zhuǎn)換器;(c)至少一個接收第一選擇語言文字并翻譯成第二選擇語言文字與/或接收第二選擇語言文字并翻譯成第一選擇語言文字的文字至文字口語轉(zhuǎn)換器;(d)至少一個將翻好的第一與/或第二選擇語言轉(zhuǎn)換成語音輸出的文字語音轉(zhuǎn)換器;以及(e)至少一個發(fā)出語音輸出的揚聲器。
5.根據(jù)權(quán)利要求4所述的翻譯裝置,其特征是該實時翻譯裝置包括由兩個獨立的帶軟件的電子聲音發(fā)生器形成的兩個聲道,這樣可在翻成第二選擇語言的文字被帶軟件的第二獨立電子聲音發(fā)生器轉(zhuǎn)換成語音的同時,將正在接收的第一語言的第一語音轉(zhuǎn)換成文字。
6.根據(jù)權(quán)利要求4所述的翻譯裝置,其特征是獨立電子聲音發(fā)生器是兩塊個人電腦聲卡或類似裝置,或是一塊個人電腦聲卡的兩個有獨立軟件控制的左右信道。
7.一種便攜式實時翻譯裝置,包括(a)接收第一與第二選擇語音的第一與第二語音接收器;(b)第一與第二語音文字轉(zhuǎn)換器;(c)至少一個接收第一選擇語言文字并翻譯成第二選擇語言文字與/或接收第二選擇語言文字并翻譯成第一選擇語言文字的文字至文字口語轉(zhuǎn)換器;(d)至少一個將翻好的第一與第二選擇語言轉(zhuǎn)換成第一與第二語音輸出的文字語音轉(zhuǎn)換器;以及(e)第一與第二發(fā)出語音輸出的揚聲器。
8.根據(jù)權(quán)利要求7所述的翻譯裝置,其特征是具有一種結(jié)構(gòu),能處理語音到文字或文字到語音的第一與第二轉(zhuǎn)換與/或文字到文字語音翻譯過程中的“重疊”,使得接收語音與發(fā)出翻好的語音之間的時間滯后在合理的會話時間內(nèi),使這個時間小于1秒,最多不超過2秒。
9.根據(jù)權(quán)利要求8所述的翻譯裝置,其特征是該結(jié)構(gòu)能使語音的翻譯與發(fā)出用基本上與輸入語音的語音片段一致的語音片段進行,形成一個連續(xù)的有間隔語音片段流,來模仿會話,最好這樣的語音片段是一個句子或句子的一部分。
10.根據(jù)權(quán)利要求7所述的有兩個聲道的翻譯裝置,其特征是有“重疊”處理,使得接收、翻譯第一語言的第一語音與發(fā)出翻好的語音與接收第二語言的第二語音以及翻譯與發(fā)出第二翻好的語音由獨立處理路徑同時或顯然同時進行。
11.根據(jù)權(quán)利要求10所述的翻譯裝置,其特征是兩個聲道包括獨立個人電腦聲卡或類似裝置或一張聲卡的獨立信道或類似裝置。
12.根據(jù)權(quán)利要求10所述的有兩個聲道的翻譯裝置,其特征是兩個聲道包括以保持同時合理實時處理兩條路徑的速率來開關(guān)兩條處理路徑的開關(guān)系統(tǒng)。
13.一種提供實時語音翻譯的方法,該方法包括的步驟是(a)提供接收第一與第二選擇語音的第一與第二語音接收器;(b)提供分別與第一與第二語音接收器相連接的第一與第二發(fā)出語音輸出的語音揚聲器;(c)將上述第一與第二語音接收器來的上述第一與第二選擇語音轉(zhuǎn)換成文字;(d)提供從上述第一語音接收器接收第一選擇語言文字并翻譯成第二選擇語言文字與/或接收第二選擇語言文字并翻譯成第一選擇語言文字的文字至文字口語轉(zhuǎn)換器;(e)提供將翻好的第一與第二選擇語言轉(zhuǎn)換成第一與第二語音輸出的語音轉(zhuǎn)換器;以及(f)發(fā)出上述翻好、轉(zhuǎn)換好的第一與第二語音輸出。
14.根據(jù)權(quán)利要求13所述的翻譯方法,其特征是兩塊聲卡或一塊聲卡上兩個獨立工作的信道提供第一與第二語音接收器與第一與第二揚聲器。
15.根據(jù)權(quán)利要求13所述的翻譯方法,其特征是語音到文字的轉(zhuǎn)換與/或文字翻譯與/或文字到語音的轉(zhuǎn)換處理是由中央處理器(CPU)或類似裝置與聲卡的軟件控制進行的,平行處理最好由中央處理器(CPU)平行處理技術(shù)或通過軟件控制的開關(guān)技術(shù)進行。
16.根據(jù)權(quán)利要求13所述的翻譯方法,其特征是語音到文字轉(zhuǎn)換與/或文字翻譯與/或文字到語音轉(zhuǎn)換是2秒左右的語音片段到中央處理器(CPU)的兆赫速度間進行開關(guān)來處理的。
17.一種實時翻譯裝置,包括(a)從至少一個語音接收器接收語音的翻譯裝置輸入裝置;(b)至少一個語音文字轉(zhuǎn)換器;(c)至少一個接收第一選擇語言文字并翻譯成第二選擇語言文字與/或接收第二選擇語言文字并翻譯成第一選擇語言文字的文字至文字口語轉(zhuǎn)換器;(d)至少一個將翻好的第一與/或第二選擇語言轉(zhuǎn)換成第一與第二語音輸出的文字語音轉(zhuǎn)換器;以及(e)至少能向一個發(fā)出語音輸出的語音發(fā)生器輸送語音輸出的翻譯裝置輸出裝置。
18.根據(jù)權(quán)利要求17所述的翻譯裝置,其特征是實時翻譯裝置包括語音到文字轉(zhuǎn)換與/或文字翻譯與/或文字到語音轉(zhuǎn)換的平行處理。
19.根據(jù)權(quán)利要求17所述的翻譯裝置,其特征是該實時翻譯裝置包括處理裝置與兩個電子聲音發(fā)生器形成的兩個聲道,這樣可在翻成第二選擇語言的文字被第二聲音發(fā)生器轉(zhuǎn)換成語音的同時,由第一聲音發(fā)生器將正在接收的第一語言的第一語音轉(zhuǎn)換成文字。
20.根據(jù)權(quán)利要求17所述的翻譯裝置,其特征是獨立電子聲音發(fā)生器是兩塊個人電腦聲卡或類似裝置,或是一塊個人電腦聲卡或類似裝置的兩個有獨立軟件控制的左右信道,語音到文字的轉(zhuǎn)換與/或文字翻譯與/或文字到語音的轉(zhuǎn)換存在著平行處理,語音到文字轉(zhuǎn)換與/或文字翻譯與/或文字到語音轉(zhuǎn)換是在2秒左右的語音片段到中央處理器(CPU)的兆赫速度間進行開關(guān)處理的。
21.一種實時翻譯裝置,包括(a)第一翻譯裝置輸入裝置,能(i)從至少一個語音接收器接收語音,供至少一個語音文字轉(zhuǎn)換器接收,或(ii)接收鍵盤輸入;(b)至少一個從翻譯裝置輸入裝置接收第一選擇語言文字并翻譯成第二選擇語言文字的文字至文字口語轉(zhuǎn)換器;(c)至少一個將翻好的第一與/或第二選擇語言轉(zhuǎn)換成第一與第二語音輸出的文字語音轉(zhuǎn)換器以及一個翻譯裝置輸出裝置,能至少將語音輸出送至語音發(fā)生器,發(fā)出語音輸出,或顯示于屏幕;(d)第二翻譯裝置輸入裝置,能(i)從至少一個語音接收器接收語音,供至少一個語音文字轉(zhuǎn)換器接收,或(ii)接收鍵盤輸入;(e)至少一個接收第二選擇語言文字并翻譯成第一選擇語言文字的文字至文字口語轉(zhuǎn)換器;(f)至少一個將翻好的第二選擇語言轉(zhuǎn)換成第一語音輸出的文字語音轉(zhuǎn)換器以及一個翻譯裝置輸出裝置,能至少將語音輸出送至語音發(fā)生器,發(fā)出語音輸出,或顯示于屏幕。
22.根據(jù)權(quán)利要求21所述的翻譯裝置,其特征是實時翻譯裝置包括語音到文字轉(zhuǎn)換與/或文字翻譯與/或文字到語音轉(zhuǎn)換的平行處理。
23.根據(jù)權(quán)利要求22所述的翻譯裝置,其特征是該實時翻譯裝置包括處理裝置與兩個電子聲音發(fā)生器,形成兩個聲道,這樣可在翻成第二選擇語言的文字被第二電子聲音發(fā)生器轉(zhuǎn)換成語音的同時,由第一電子聲音發(fā)生器將正在接收的第一語言的第一語音轉(zhuǎn)換成文字。
24.根據(jù)權(quán)利要求23所述的翻譯裝置,其特征是獨立電子聲音發(fā)生器是兩塊個人電腦聲卡或類似裝置,或是一塊個人電腦聲卡或類似裝置的兩個有獨立軟件控制的左右信道,語音到文字的轉(zhuǎn)換與/或文字翻譯與/或文字到語音的轉(zhuǎn)換存在著平行處理,語音到文字轉(zhuǎn)換與/或文字翻譯與/或文字到語音轉(zhuǎn)換是在2秒左右的語音片段到中央處理器(CPU)的兆赫速度間進行開關(guān)處理的。
25.上述參照
的實時翻譯裝置。
26.上述參照
的提供語音實時翻譯的方法。
全文摘要
一種實時翻譯裝置(11),它具有語音接收器或麥克風(fēng)(101),語音文字轉(zhuǎn)換器(102),接收第一語言并將其翻譯成第二選擇語言的文字到文字口語翻譯裝置(103),將翻好的第二選擇語言轉(zhuǎn)換成語音輸出的文字語音轉(zhuǎn)換器(105)以及發(fā)出語音輸出的語音發(fā)生器或揚聲器(211)。還具有第二語音接收器或麥克風(fēng)(201),語音文字轉(zhuǎn)換器(202),接收第二語言并將其翻譯成第一選擇語言的文字到文字口語翻譯裝置(203),將翻好的第一選擇語言轉(zhuǎn)換成語音輸出的文字語音轉(zhuǎn)換器(105)以及發(fā)出語音輸出的語音發(fā)生器或揚聲器(111)。語音到文字的轉(zhuǎn)換與/或文字翻譯與/或文字到語音的轉(zhuǎn)換存在著平行處理。兩塊聲卡(151,152)或一塊聲卡(151)上兩個獨立工作的信道(151A,151B)可提供第一與第二語音接收器(101,201)與第一與第二揚聲器(111,211)。平行處理可由中央處理器(cpu),平行處理技術(shù)來進行,或通過軟件控制的開關(guān)技術(shù)進行處理。
文檔編號G10L15/00GK1602483SQ02824832
公開日2005年3月30日 申請日期2002年12月17日 優(yōu)先權(quán)日2001年12月17日
發(fā)明者內(nèi)維尼·加雅拉特尼 申請人:內(nèi)維尼·加雅拉特尼