欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

字轉(zhuǎn)音的使用者界面系統(tǒng)及修改方法

文檔序號:6558402閱讀:230來源:國知局
專利名稱:字轉(zhuǎn)音的使用者界面系統(tǒng)及修改方法
技術(shù)領(lǐng)域
本發(fā)明指一種字轉(zhuǎn)音的使用者界面系統(tǒng)及修改方法,特別是應(yīng)用于語音辨識技術(shù)的一種字轉(zhuǎn)音的使用者界面系統(tǒng)及修改方法。
背景技術(shù)
在非特定語者(speaker-independent)語音辨識領(lǐng)域(例如Hmm-based speechrecognition)之中,辨識詞匯(recognition vocabulary)常常是通過文字(text)轉(zhuǎn)換成音標(biāo)(phonetic symbol)的形式所構(gòu)成;而且,每個音標(biāo)都有其相對應(yīng)的聲學(xué)模型(acoustic model)。對于每一個辨識語(word)來說,其組成音標(biāo)的相應(yīng)聲學(xué)模型系串連成一個辨識語模塊(word model),然后供辨識引擎進(jìn)行比對之用。
但由于一字(word)多音、或是辭典里的發(fā)音不正確、或是新詞(new words)的出現(xiàn),此時便需要靠發(fā)音規(guī)則來產(chǎn)生其音標(biāo),但有時該發(fā)音規(guī)則又不足以囊括或適用于這些新詞時,便常常造成此一字轉(zhuǎn)音(text-to-phone)的過程中極易出現(xiàn)誤差。舉例來說,中文詞的”單身”其正確發(fā)音應(yīng)為<d a n sh ax n>,但有可能被誤轉(zhuǎn)為<sha n sh ax n>;另外,英文字“record”作為名詞時發(fā)音為<’r eh k r d>,作為動詞時發(fā)音則變?yōu)?amp;lt;r ih‘k or d>,這種情形下便有可能選錯;再者,專有名詞(商標(biāo))“BenQ”在辭典里面雖然找不到,但根據(jù)發(fā)音規(guī)則它應(yīng)該念成<b eh n k>,可是大家卻都將該詞讀成<b eh n k y uw>,諸如此類的錯誤林林總總而不勝枚舉。
由于這種錯誤會增加語音辨識上的錯誤率,因此現(xiàn)行非特定語者的語音辨識系統(tǒng)對于字轉(zhuǎn)音錯誤的處理上,光靠有限的發(fā)音辭典和發(fā)音規(guī)則是很難滿足人類生活中所不斷出產(chǎn)的變化萬千的詞匯。因此,實(shí)際所使用的系統(tǒng)上常常會提供一個圖形化使用界面(Graphical User Interface,GUI),讓使用者自行來修改這些音標(biāo)或詞匯,然而,過去的GUI設(shè)計由于是將所有語匯及其標(biāo)音同時列出,并未再提供任何得以判斷該標(biāo)音的正確性的根據(jù),導(dǎo)致使用者在進(jìn)行修改操作時必須把所有的語匯一個一個地從頭到尾檢查一次,才能驗(yàn)證完它們的發(fā)音;但當(dāng)詞匯量較大(數(shù)百個以上)時,這種地毯式的搜索就顯得耗時、不夠人性化以及欠缺實(shí)用性了。

發(fā)明內(nèi)容本發(fā)明的構(gòu)想為提出一種字轉(zhuǎn)音的使用者界面系統(tǒng)及修改方法,提供一離線(off-line)式的修改界面及方法以利后續(xù)語音辨識的進(jìn)行。
根據(jù)本發(fā)明一第一構(gòu)想,提出一種字轉(zhuǎn)音的使用者界面系統(tǒng)及修改方法,該字轉(zhuǎn)音的使用者界面系統(tǒng)至少包括一語匯欄、一發(fā)音欄、一類型欄以及一信心分?jǐn)?shù)欄。該語匯欄系用以呈現(xiàn)以字母構(gòu)成的至少一語匯;該發(fā)音欄系用以呈現(xiàn)對應(yīng)于每一該語匯的至少一母發(fā)音模塊,每一該母發(fā)音模塊包括多個發(fā)音音標(biāo);該類型欄系用以呈現(xiàn)對應(yīng)于每一該母發(fā)音模塊的一來源;該信心分?jǐn)?shù)欄系用以呈現(xiàn)對應(yīng)于每一該母發(fā)音模塊的一信心分?jǐn)?shù)(confidence score),通過該信心分?jǐn)?shù)提供使用者修改該語匯所對應(yīng)的該母發(fā)音模塊的依據(jù),以便后續(xù)語音辨識的進(jìn)行。
根據(jù)本發(fā)明一第二構(gòu)想,提出一種字轉(zhuǎn)音的使用者界面系統(tǒng)的修改方法,該字轉(zhuǎn)音的使用者界面系統(tǒng)如上所述,該修改方法包括利用一輸入界面選定該語匯的部份字母;呈現(xiàn)對應(yīng)于所選定的所述這些字母的至少一子發(fā)音模塊,其中每一該子發(fā)音模塊包括多個發(fā)音音標(biāo),且每一該子發(fā)音模塊決定部份該母發(fā)音模塊;以及利用該輸入界面于所述這些子發(fā)音模塊的中選定一子發(fā)音模塊,以修改部份該母發(fā)音模塊,以便于其后進(jìn)行語音辨識時、提供所述這些語匯一正確的聲學(xué)模型。
根據(jù)本發(fā)明一第三構(gòu)想,提出一種字轉(zhuǎn)音的使用者界面系統(tǒng)的修改方法,該字轉(zhuǎn)音的使用者界面系統(tǒng)如上所述,該修改方法包括利用一輸入界面例如鼠標(biāo)選定欲修改的語匯(word),再對該使用者界面系統(tǒng)輸入一對應(yīng)于該語匯的語音;然后系統(tǒng)啟動一語音辨識程序,以尋找對應(yīng)于該語匯的至少一可能的母發(fā)音模塊,然后呈現(xiàn)所述這些母發(fā)音模塊,使用者便可利用鼠標(biāo)等界面自有限個該發(fā)音模塊中選取其中的一,便于后續(xù)語音辨識的進(jìn)行。
較佳者,其中所述這些語匯為系選自中文語匯及英文語匯其中的一。
較佳者,其中該來源包括一常用詞庫、一發(fā)音辭典以及一發(fā)音規(guī)則。
較佳者,其中該字轉(zhuǎn)音的使用者界面系統(tǒng)更包括一標(biāo)示欄,用以標(biāo)示并提供是否選用該母發(fā)音模塊。
較佳者,其中每一該信心分?jǐn)?shù)、以及對應(yīng)于每一該信心分?jǐn)?shù)的該語匯、該母發(fā)音模塊和該來源皆具有相同的一顯示顏色。
較佳者,其中該字轉(zhuǎn)音的使用者界面系統(tǒng)更包括一顯示顏色設(shè)定界面,用以修改對應(yīng)于每一該信心分?jǐn)?shù)的該顯示顏色。
較佳者,其中該字轉(zhuǎn)音的使用者界面系統(tǒng)更包括一發(fā)音音標(biāo)選單,用以呈現(xiàn)對應(yīng)于每一該語匯的部份字母的至少一子發(fā)音模塊,其中每一該子發(fā)音模塊包括多個發(fā)音音標(biāo),且每一該子發(fā)音模塊決定部份該母發(fā)音模塊。
較佳者,其中該字轉(zhuǎn)音的使用者界面系統(tǒng)系通過一輸入界面決定及修改對應(yīng)于所述這些部份字母的該子發(fā)音模塊。
較佳者,其中該輸入界面包括一鍵盤、一鼠標(biāo)、一觸控板、一觸控筆以及一語音輸入裝置。
本發(fā)明得通過下列圖式及詳細(xì)說明,俾得更深入的了解
圖1為本發(fā)明所提字轉(zhuǎn)音的使用者界面系統(tǒng)一較佳實(shí)施例的界面示意圖;圖2為本發(fā)明所提字轉(zhuǎn)音的使用者界面系統(tǒng)的顯示顏色設(shè)定界面的示意圖;圖3為本發(fā)明所提字轉(zhuǎn)音的使用者界面系統(tǒng)的修改方法一較佳實(shí)施例的界面示意圖;以及圖4為本發(fā)明所提字轉(zhuǎn)音的使用者界面系統(tǒng)的修改方法一較佳實(shí)施例的流程圖。
具體實(shí)施方式請參閱圖1,其為本發(fā)明所提字轉(zhuǎn)音(text-to-phone)的使用者界面系統(tǒng)一較佳實(shí)施例的界面示意圖,該字轉(zhuǎn)音的使用者界面系統(tǒng)系應(yīng)用于語音辨識,該字轉(zhuǎn)音的使用者界面系統(tǒng)的界面1至少包括一語匯欄10、一發(fā)音欄11、一類型欄12以及一信心分?jǐn)?shù)欄13。
在圖1中,該語匯欄10系用以呈現(xiàn)以字母構(gòu)成的至少一語匯,該發(fā)音欄11系用以呈現(xiàn)對應(yīng)于每一該語匯的至少一母發(fā)音模塊,且每一該母發(fā)音模塊包括多個發(fā)音音標(biāo),該類型欄12系用以呈現(xiàn)對應(yīng)于每一該母發(fā)音模塊的一來源,而該信心分?jǐn)?shù)欄13系用以呈現(xiàn)對應(yīng)于每一該母發(fā)音模塊的一信心分?jǐn)?shù)(confidence score),以提供使用者修改該語匯所對應(yīng)的該母發(fā)音模塊的依據(jù)。
需要特別注意的是,本發(fā)明所述以字母構(gòu)成的所述這些語匯可以是中文語匯、英文語匯或是其他種文字的語匯,只要是可以通過字母構(gòu)成其讀音的文字,盡皆適用于本發(fā)明的修改方法。然而,為了方便敘述,以下的實(shí)施例系以英文語匯(如”resume”、”benQ”)來做說明,但其并無法限制本發(fā)明對于中文語匯(如”好吃”-----<hao chih>)...等其他種文字的適用性。
以圖1中的實(shí)際語匯作為例子來幫助理解。在圖1中,第八列的語匯”resume”系為以英文字母構(gòu)成的一語匯,其相對應(yīng)的發(fā)音欄11的內(nèi)具有兩個母發(fā)音模塊<r iyz uw m>及<r eh z ax m ey>以供選擇,類型欄12顯示這兩個母發(fā)音模塊<r iy z uwm>及<r eh z ax m ey>的來源皆為辭典,而其所對應(yīng)的兩個信心分?jǐn)?shù)欄13中的信心分?jǐn)?shù)60及40分別代表母發(fā)音模塊<r iy z uw m>及<r eh z ax m ey>的常用度。
在圖1中,每個語匯相應(yīng)的發(fā)音也許是從常用詞庫中取得、也許從發(fā)音辭典中取得......等等。
本發(fā)明的第一個技術(shù)特征在于為傳統(tǒng)的字轉(zhuǎn)音的使用者界面系統(tǒng)提供一信心分?jǐn)?shù)欄以減少逐一判定及修改字轉(zhuǎn)音錯誤的窘?jīng)r。以語匯‘computer’為例,其發(fā)音可以在發(fā)音詞典里被找到,而且該語匯僅有此一發(fā)音,故信心分?jǐn)?shù)是100分;又例如圖中第十四列的語匯“www”是在我們預(yù)先搜集的常用詞庫里找到,發(fā)現(xiàn)它有<tr ih pax l d ah b ax l y uw>和<d ah b ax l y uw d ah b ax l y uw d ah b ax l y uw>兩種不同的發(fā)音(母發(fā)音模塊),但是根據(jù)判斷大約60%的人采取前者而發(fā)音的較多,僅40%的人采取后者而發(fā)音,故訂定兩者的信心分?jǐn)?shù)分別為60分及40分。由于字轉(zhuǎn)音的使用者界面系統(tǒng)多了此一功能,便能夠通過該信心分?jǐn)?shù)提供使用者修改該語匯所對應(yīng)的該母發(fā)音模塊的依據(jù),更可以大幅減少前面所提傳統(tǒng)的GUI設(shè)計并未提供判斷的根據(jù)所造成在進(jìn)行修改操作時需把所有的語匯一個一個地從頭到尾檢查一次以驗(yàn)證其發(fā)音的時間浪費(fèi),再者,亦可以輕松處理當(dāng)詞匯量較大時的情況。
在圖1的界面1,更可以包括一標(biāo)示欄14,其系用以標(biāo)示通過該信心分?jǐn)?shù)所決定的該語匯所對應(yīng)的該母發(fā)音模塊;舉例來說,由于母發(fā)音模塊<r iy z uw m>的信心分?jǐn)?shù)60大于母發(fā)音模塊<r eh z ax m ey>的信心分?jǐn)?shù)40,因此勾選母發(fā)音模塊<riy z uw m>所對應(yīng)的標(biāo)示欄14,代表此時將語匯”resume”的字轉(zhuǎn)音發(fā)音訂為<r iy zuw m>。
此外,界面1中較大信心分?jǐn)?shù)列與較小信心分?jǐn)?shù)列的先后順序是可以自由調(diào)整的,使用者可以依照使用時的習(xí)慣將較大信心分?jǐn)?shù)列設(shè)定在較小信心分?jǐn)?shù)列的前或的后,以便于觀察或修改。
值得一提的是,在圖1中,根據(jù)不同的信心分?jǐn)?shù),還可以將每一該信心分?jǐn)?shù)、以及對應(yīng)于每一該信心分?jǐn)?shù)的該語匯、該母發(fā)音模塊和該來源設(shè)定成為皆具有相同的一顯示顏色;也就是說,在圖1中,不同信心分?jǐn)?shù)的列具有不同的顯示顏色,此舉更加使得在進(jìn)行修改操作時的順利度。以實(shí)際的例子來看,母發(fā)音模塊<r eh z axm ey>所屬列的所有顯示文字的顏色與母發(fā)音模塊<r iy z uw m>所屬列的所有顯示文字的顏色并不相同,以增添鑒別度。
此外,界面1中的設(shè)定按鈕15關(guān)聯(lián)到顯示顏色設(shè)定界面2,如圖2所示,由圖中可看出,通過信心分?jǐn)?shù)的適當(dāng)定義可以修改對應(yīng)于每一該信心分?jǐn)?shù)的該顯示顏色。
本發(fā)明另一附加功能是,整個界面1亦可以依據(jù)使用者喜好而根據(jù)該語匯欄10、該發(fā)音欄11、該類型欄12或是該信心分?jǐn)?shù)欄13來進(jìn)行排序,使得整個字轉(zhuǎn)音修改界面更為人性化。
本發(fā)明的第二個技術(shù)特征在于,提供一種字轉(zhuǎn)音的使用者界面系統(tǒng)的修改方法,更特定而言的,系提供可應(yīng)用于前述字轉(zhuǎn)音的使用者界面系統(tǒng)的一種修改界面。請參閱圖3,其為本發(fā)明所提字轉(zhuǎn)音的使用者界面系統(tǒng)的修改方法一較佳實(shí)施例的界面示意圖,其系以圖1的單一列為制作根據(jù)。
在圖3的單一列3中,當(dāng)使用如鍵盤、鼠標(biāo)、觸控板或是觸控筆...等的類的輸入界面選定一語匯30的部份英文字母時,即會隨著此一選定而出現(xiàn)一發(fā)音音標(biāo)選單36,該發(fā)音音標(biāo)選單36包括了對應(yīng)于該語匯30的該選定的部份英文字母的多個子發(fā)音模塊36x;其中每一該子發(fā)音模塊皆包括多個發(fā)音音標(biāo),而每一該子發(fā)音模塊決定部份該母發(fā)音模塊31。接著,通過所述這些輸入界面選定其中一種子發(fā)音模塊36x,便可以順利地改變該母發(fā)音模塊31,以便于其后進(jìn)行語音辨識時、提供所述這些語匯一個比較正確的聲學(xué)模型(acoustic model)。
以實(shí)際的例子來看,當(dāng)使用所述這些輸入界面將圖3中的語匯”benQ”中的”ben”部份選定成為反白時,便會出現(xiàn)與”ben”相對應(yīng)的多個子發(fā)音模塊361~364,此時若再利用所述這些輸入界面選定其中的子發(fā)音模塊363,便可以將圖3中原來的母發(fā)音模塊<b eh n>改變?yōu)?amp;lt;b ay n>。
本發(fā)明的第三個技術(shù)特征在于,提供一種字轉(zhuǎn)音的使用者界面系統(tǒng)的修改方法,更特定而言之,系提供可應(yīng)用于前述字轉(zhuǎn)音的使用者界面系統(tǒng)的一種修改界面。與前一個利用輸入界面以手動方式進(jìn)行的修改方法不太相同的是,以下所述的另一種修改方法主要系利用語音以自動方式進(jìn)行修改。
同樣以前述的語匯”benQ”為例進(jìn)行說明。
操作流程如下,首先,先以諸如瀏覽鍵、鼠標(biāo)、觸筆...等使用者界面選擇欲修改的語匯”benQ”,接著使用者便利用語音方式對著麥克風(fēng)說出”benQ”的發(fā)音,此時,系統(tǒng)便會對該語音進(jìn)行一額外的語音辨識,由于已經(jīng)選定了欲修改的語匯(此實(shí)施例為”benQ”),因此其可能的發(fā)音就可以被限縮,逐字母來看(1)”b”的發(fā)音可以是”b”;(2)”e”的發(fā)音可以是”eh”、”ae”、”iy”、”ih”、”ay”或不發(fā)音;(3)”n”的發(fā)音可以是”n”、”ng”;以及(4)”Q”的發(fā)音可以是”k”、”kyuw”。
是故,”benQ”這個字的發(fā)音便被限縮到下述一較窄的辨識范圍1.<b eh n k>
2.<b ae n k>
3.<b iy n k>
4.<b ih n k>
5.<b ay n k>
6.<b n k>
7.<b eh ng k>
8.<b ae ng k>
9.<b iy ng k>
10.<b ih ng k>
11.<b ay ng k>
12.<b ng k>
13.<b eh n k y uw>
14.<b ae n k y uw>
15.<b iy n k y uw>
16.<b ih n k y uw>
17.<b ay n k y uw>
18.<b n k y uw>
19.<b eh ng k y uw>
20.<b ae ng k y uw>
21.<b iy ng k y uw>
22.<b ih ng k y uw>
23.<b ay ng k y uw>
24.<b ng k y uw>
系統(tǒng)是從上述24個母發(fā)音模塊所構(gòu)成的一較窄范圍中選取其中的一作為辨識出的音標(biāo)結(jié)果,再將其顯示于發(fā)音欄中,接著便將類型欄的內(nèi)容更改為”語音校正”即可。
此種利用語音自動辨識方式進(jìn)行修改的技術(shù)特征的優(yōu)點(diǎn)在于,,利用有限數(shù)目的(如本實(shí)施例中的24個)母發(fā)音模塊進(jìn)行一詞匯(lexicon)產(chǎn)生程序所得到的詞匯(lexicon)、或是利用語言模型(language model)的形式,可以限制(constrain)語音辨識時所產(chǎn)生辨識的結(jié)果為僅屬于上列的多種發(fā)音的一,故能得到較正確的發(fā)音;相對于習(xí)用技術(shù)中毫無限制的辨識選所述來說,本發(fā)明方法的優(yōu)點(diǎn)為可使得語音辨識的結(jié)果更為精準(zhǔn),而不會平白無故地冒出太離譜的結(jié)果。
此一技術(shù)特征的另一優(yōu)點(diǎn)在于如此便不需要用鍵盤直接輸入音標(biāo)符號以進(jìn)行修改,這對于一般不知如何編輯音標(biāo)的人來說是極為方便的創(chuàng)舉,特別是在小螢?zāi)坏氖殖盅b置上的利用更能顯現(xiàn)其獨(dú)特的處。
圖4為對應(yīng)圖3的操控的流程圖,由于步驟與前面所述大致相同,惟圖4的多了將所述這些輸入界面于所選定的反白區(qū)停留一段時間t以起動該發(fā)音音標(biāo)選單36的第二步驟(第二欄),但此步驟系屬熟習(xí)本所述技術(shù)者所能輕易完成的,故于此處不再詳加贅述。
最后,若是針對圖4的字轉(zhuǎn)音的使用者界面系統(tǒng)的修改方法進(jìn)行改善,還可以將其中須使用如鍵盤、鼠標(biāo)、觸控板或是觸控筆...等之類輸入界面的輸入方式提升為使用語音輸入判別的方式;以前面所述”benQ”的例子說明,使用者界面系統(tǒng)針對所念出來的語音”ben”自動加以辨識且根據(jù)辭典或發(fā)音規(guī)則...等選取一種子發(fā)音模塊36x以定義出母發(fā)音模塊31。這種作法相較于圖4的修改方法的進(jìn)步的處在于,更進(jìn)一步地省卻了使用者花時間選取子發(fā)音模塊36x的時間,對于效率的提升有極大助益。
綜上所述,本發(fā)明所提出字轉(zhuǎn)音的使用者界面系統(tǒng),系于讓字轉(zhuǎn)音過程可能產(chǎn)生的錯誤(或信心分?jǐn)?shù))通過不同的顏色的圖形化使用界面(GUI)呈現(xiàn)出來,使得潛在的錯誤能一目了然,并提供以字轉(zhuǎn)音的信心分?jǐn)?shù)(confidence score)為標(biāo)的排序的功能,使信心分?jǐn)?shù)較差的語匯能集中顯示于最前端,讓使用者不必頻頻卷動卷軸(Scroll Bar)就能一覽無遺這些可能需要修改的語匯或音標(biāo),而能夠更為方便地將心力集中在修改這些詞匯或標(biāo)音上,使得后續(xù)進(jìn)行語音辨識時能夠獲得更為精準(zhǔn)的辨識結(jié)果;而本發(fā)明所提出字轉(zhuǎn)音的使用者界面的修改方法,則系允許使用者通過各種輸入界面呈現(xiàn)有限數(shù)目的可能的發(fā)音模塊供選取;或是語音的方式,以此有限數(shù)目的可能的發(fā)音模塊縮限辨識詞匯(lexicon)、因而產(chǎn)生較具正確性的語匯發(fā)音,便于后續(xù)語音辨識的進(jìn)行。是故,本發(fā)明不但可大幅提升了字轉(zhuǎn)音過程中呈現(xiàn)界面與修改界面的操控速度與使用便利性,實(shí)為一不可多得的發(fā)明創(chuàng)見。
本發(fā)明得由熟悉本技藝的人士任施匠思而為諸般修飾,然皆不脫如附申請專利范圍所欲保護(hù)者。
權(quán)利要求
1.一種字轉(zhuǎn)音(text-to-phone)的使用者界面系統(tǒng),系應(yīng)用于語音辨識,該字轉(zhuǎn)音的使用者界面系統(tǒng)包括一語匯欄,用以呈現(xiàn)以字母構(gòu)成的至少一語匯;一發(fā)音欄,用以呈現(xiàn)對應(yīng)于每一該語匯的至少一母發(fā)音模塊,每一該母發(fā)音模塊包括多個發(fā)音音標(biāo);一類型欄,用以呈現(xiàn)對應(yīng)于每一該母發(fā)音模塊的一來源;以及一信心分?jǐn)?shù)欄,用以呈現(xiàn)對應(yīng)于每一該母發(fā)音模塊的一信心分?jǐn)?shù)(confidence score),通過該信心分?jǐn)?shù)提供使用者修改該語匯所對應(yīng)的該母發(fā)音模塊的依據(jù),以便后續(xù)語音辨識的進(jìn)行。
2.根據(jù)權(quán)利要求1所述的字轉(zhuǎn)音的使用者界面系統(tǒng),其特征在于所述這些語匯為選自中文語匯及英文語匯其中之一;及/或該來源包括一常用詞庫、一發(fā)音辭典、語音校正、以及一發(fā)音規(guī)則。
3.根據(jù)權(quán)利要求1所述的字轉(zhuǎn)音的使用者界面系統(tǒng),其特征在于,更包括一標(biāo)示欄,用以標(biāo)示并提供是否選用該母發(fā)音模塊。
4.根據(jù)權(quán)利要求1所述的字轉(zhuǎn)音的使用者界面系統(tǒng),其特征在于每一該信心分?jǐn)?shù)、以及對應(yīng)于每一該信心分?jǐn)?shù)的該語匯、該母發(fā)音模塊和該來源皆具有相同的一顯示顏色;及該使用者界面系統(tǒng)更包括一顯示顏色設(shè)定界面,用以修改對應(yīng)于每一該信心分?jǐn)?shù)的該顯示顏色。
5.根據(jù)權(quán)利要求1所述的字轉(zhuǎn)音的使用者界面系統(tǒng),其特征在于,更包括一發(fā)音音標(biāo)選單,用以呈現(xiàn)對應(yīng)于每一該語匯的部份字母的至少一子發(fā)音模塊,其中每一該子發(fā)音模塊包括多個發(fā)音音標(biāo),且每一該子發(fā)音模塊決定部份該母發(fā)音模塊,其中該使用者界面系統(tǒng)通過一輸入界面決定及修改對應(yīng)于所述這些部份字母的該子發(fā)音模塊,而該輸入界面包括一鍵盤、一鼠標(biāo)、一觸控板、一觸控筆以及一語音輸入裝置。
6.一種字轉(zhuǎn)音的使用者界面系統(tǒng)的修改方法,該字轉(zhuǎn)音的使用者界面系統(tǒng)至少包括一語匯欄、一發(fā)音欄及一信心分?jǐn)?shù)欄,該語匯欄系用以呈現(xiàn)以字母構(gòu)成的至少一語匯,該發(fā)音欄系用以呈現(xiàn)對應(yīng)于每一該語匯的至少一母發(fā)音模塊,且每一該母發(fā)音模塊包括多個發(fā)音音標(biāo),而該信心分?jǐn)?shù)欄系用以呈現(xiàn)對應(yīng)于每一該母發(fā)音模塊的一信心分?jǐn)?shù),該修改方法包括步驟如下利用一輸入界面選定該語匯的部份字母;呈現(xiàn)對應(yīng)于所選定的所述這些字母的至少一子發(fā)音模塊,其中每一該子發(fā)音模塊包括多個發(fā)音音標(biāo),且每一該子發(fā)音模塊決定部份該母發(fā)音模塊;以及利用該輸入界面于所述這些子發(fā)音模塊的中選定一子發(fā)音模塊,以修改部份該母發(fā)音模塊,以便于其后進(jìn)行語音辨識時、提供所述這些語匯一正確的聲學(xué)模型。
7.根據(jù)權(quán)利要求6所述的字轉(zhuǎn)音的使用者界面系統(tǒng)的修改方法,其特征在于該字轉(zhuǎn)音的使用者界面系統(tǒng)更包括一類型欄,用以呈現(xiàn)對應(yīng)于每一該母發(fā)音模塊的一來源;該字轉(zhuǎn)音的使用者界面系統(tǒng)中每一該信心分?jǐn)?shù)、以及對應(yīng)于每一該信心分?jǐn)?shù)的該語匯、該母發(fā)音模塊和該來源皆具有相同的一顯示顏色;及該字轉(zhuǎn)音的使用者界面系統(tǒng)更包括一顯示顏色設(shè)定欄,利用該輸入界面可于該顯示顏色設(shè)定欄內(nèi)修改對應(yīng)于每一該信心分?jǐn)?shù)的該顯示顏色。
8.根據(jù)權(quán)利要求6所述的字轉(zhuǎn)音的使用者界面系統(tǒng)的修改方法,其特征在于,該字轉(zhuǎn)音的使用者界面系統(tǒng)更包括一標(biāo)示欄,利用該輸入界面可于該標(biāo)示欄內(nèi)標(biāo)示并提供是否選用該母發(fā)音模塊。
9.一種字轉(zhuǎn)音的使用者界面系統(tǒng)的修改方法,該字轉(zhuǎn)音的使用者界面系統(tǒng)至少包括一語匯欄、一發(fā)音欄及一信心分?jǐn)?shù)欄,該語匯欄系用以呈現(xiàn)以字母構(gòu)成的至少一語匯,該發(fā)音欄系用以呈現(xiàn)對應(yīng)于每一該語匯的至少一母發(fā)音模塊,且每一該母發(fā)音模塊包括多個發(fā)音音標(biāo),而該信心分?jǐn)?shù)欄系用以呈現(xiàn)對應(yīng)于每一該母發(fā)音模塊的一信心分?jǐn)?shù),該修改方法包括步驟如下利用一輸入界面選定該語匯;對該使用者界面系統(tǒng)輸入一對應(yīng)于該語匯的一語音;啟動一語音辨識程序,以上述所選定語匯相應(yīng)的有限個可能發(fā)音為辨識詞匯(lexicon)進(jìn)行語音辨認(rèn)以尋找對應(yīng)于該語匯的至少一母發(fā)音模塊,并呈現(xiàn)所述這些母發(fā)音模塊;以及利用該輸入界面自有限個該母發(fā)音模塊中選取其中的一,便于后續(xù)語音辨識的進(jìn)行。
10.根據(jù)權(quán)利要求9所述的字轉(zhuǎn)音的使用者界面系統(tǒng)的修改方法,其特征在于,該辨識詞匯(lexicon)是通過選定該語匯所組成的英文字母的可能發(fā)音組合而成;或是通過選定該語匯所組成的中文字的可能的破音字組合而成。
全文摘要
本發(fā)明系指一種字轉(zhuǎn)音的使用者界面系統(tǒng)及修改方法,該字轉(zhuǎn)音的使用者界面系統(tǒng)至少包括一語匯欄、一發(fā)音欄、一類型欄以及一信心分?jǐn)?shù)欄。該語匯欄系用以呈現(xiàn)以字母構(gòu)成的至少一語匯;該發(fā)音欄系用以呈現(xiàn)對應(yīng)于每一該語匯的至少一母發(fā)音模塊,每一該母發(fā)音模塊包括多個發(fā)音音標(biāo);該類型欄系用以呈現(xiàn)對應(yīng)于每一該母發(fā)音模塊的一來源;該信心分?jǐn)?shù)欄系用以呈現(xiàn)對應(yīng)于每一該母發(fā)音模塊的一信心分?jǐn)?shù)(confidence score),通過該信心分?jǐn)?shù)提供使用者修改該語匯所對應(yīng)的該母發(fā)音模塊的依據(jù),以便后續(xù)語音辨識的進(jìn)行。
文檔編號G06F9/44GK101064105SQ20061007766
公開日2007年10月31日 申請日期2006年4月25日 優(yōu)先權(quán)日2006年4月25日
發(fā)明者黃良聲, 許天明, 洪健洲, 葉耿宏, 王閔鴻, 沈家麟 申請人:臺達(dá)電子工業(yè)股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
南京市| 镇康县| 新邵县| 东安县| 灵石县| 乌什县| 东丰县| 潼关县| 虹口区| 五莲县| 石门县| 城口县| 安新县| 西宁市| 岚皋县| 扬州市| 刚察县| 林西县| 凤台县| 万源市| 吉木萨尔县| 建始县| 页游| 长宁区| 洮南市| 大同县| 溧阳市| 扶绥县| 麦盖提县| 拉萨市| 延吉市| 逊克县| 中西区| 沂水县| 万山特区| 海林市| 海林市| 扎兰屯市| 新河县| 清河县| 加查县|