一種基于中文語(yǔ)音信息訓(xùn)練英文語(yǔ)音模型的方法與設(shè)備的制作方法
【專利摘要】本發(fā)明的目的是提供一種用于基于中文語(yǔ)音信息訓(xùn)練英文語(yǔ)音模型的方法與設(shè)備;獲取用戶通過(guò)語(yǔ)音采集裝置輸入的語(yǔ)音數(shù)據(jù);判斷該語(yǔ)音數(shù)據(jù)是否為英文語(yǔ)音數(shù)據(jù);當(dāng)該語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),根據(jù)中文語(yǔ)音信息,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與該英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的發(fā)音信息;根據(jù)該發(fā)音信息,確定該英文語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的英文數(shù)據(jù),以建立或更新英文語(yǔ)音模型。與現(xiàn)有技術(shù)相比,本發(fā)明在原有中文聲學(xué)模型基礎(chǔ)上,利用相似的中文語(yǔ)音信息,對(duì)英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與該英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的發(fā)音信息,實(shí)現(xiàn)對(duì)英文語(yǔ)音模型的建立或更新,有效地控制了英文語(yǔ)音模型的規(guī)模。
【專利說(shuō)明】一種基于中文語(yǔ)音信息訓(xùn)練英文語(yǔ)音模型的方法與設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及自然語(yǔ)言處理【技術(shù)領(lǐng)域】,尤其涉及一種用于基于中文語(yǔ)音信息訓(xùn)練英文語(yǔ)音模型的技術(shù)。
【背景技術(shù)】
[0002]現(xiàn)有的訓(xùn)練英文語(yǔ)音模型的方式一般利用現(xiàn)有的英語(yǔ)語(yǔ)音數(shù)據(jù)庫(kù),包括語(yǔ)音數(shù)據(jù)及其標(biāo)注,在發(fā)音單元集合中加入英文發(fā)音單元,利用英語(yǔ)數(shù)據(jù)進(jìn)行訓(xùn)練?,F(xiàn)有技術(shù)的問(wèn)題在于,采用該種方式訓(xùn)練英文語(yǔ)音模型需要一定規(guī)模的英語(yǔ)語(yǔ)音數(shù)據(jù),且難以對(duì)加入模型中的英語(yǔ)詞的規(guī)模進(jìn)行控制。
[0003]因此,如何克服上述困難,在控制規(guī)模的同時(shí),實(shí)現(xiàn)對(duì)英文語(yǔ)音模型的訓(xùn)練,成為本領(lǐng)域技術(shù)人員亟需解決的問(wèn)題之一。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的是提供一種用于基于中文語(yǔ)音信息訓(xùn)練英文語(yǔ)音模型的方法與設(shè)備。
[0005]根據(jù)本發(fā)明的一個(gè)方面,提供了一種用于基于中文語(yǔ)音信息訓(xùn)練英文語(yǔ)音模型的方法,其中,該方法包括以下步驟:
[0006]a獲取用戶通過(guò)語(yǔ)音采集裝置輸入的語(yǔ)音數(shù)據(jù);
[0007]b判斷所述語(yǔ)音數(shù)據(jù)是否為英文語(yǔ)音數(shù)據(jù);
[0008]c當(dāng)所述語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),根據(jù)中文語(yǔ)音信息,對(duì)所述英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與所述英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的發(fā)音信息;
[0009]d根據(jù)所述發(fā)音信息,確定所述英文語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的英文數(shù)據(jù),以建立或更新英文語(yǔ)音模型,其中,所述發(fā)音信息與所述英文數(shù)據(jù)通過(guò)所述中文語(yǔ)音信息相映射。
[0010]根據(jù)本發(fā)明的另一方面,還提供了一種用于基于中文語(yǔ)音信息訓(xùn)練英文語(yǔ)音模型的模型訓(xùn)練設(shè)備,其中,該設(shè)備包括:
[0011]語(yǔ)音獲取裝置,用于獲取用戶通過(guò)語(yǔ)音采集裝置輸入的語(yǔ)音數(shù)據(jù);
[0012]英文判斷裝置,用于判斷所述語(yǔ)音數(shù)據(jù)是否為英文語(yǔ)音數(shù)據(jù);
[0013]語(yǔ)音識(shí)別裝置,用于當(dāng)所述語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),根據(jù)中文語(yǔ)音信息,對(duì)所述英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與所述英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的發(fā)音信息;
[0014]模型訓(xùn)練裝置,用于根據(jù)所述發(fā)音信息,確定所述英文語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的英文數(shù)據(jù),以建立或更新英文語(yǔ)音模型,其中,所述發(fā)音信息與所述英文數(shù)據(jù)通過(guò)所述中文語(yǔ)音信息相映射。
[0015]與現(xiàn)有技術(shù)相比,本發(fā)明在原有中文聲學(xué)模型基礎(chǔ)上,利用相似的中文語(yǔ)音信息,對(duì)英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與該英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的發(fā)音信息,實(shí)現(xiàn)對(duì)英文語(yǔ)音模型的建立或更新,有效地控制了英文語(yǔ)音模型的規(guī)模;進(jìn)一步地,本發(fā)明還可與語(yǔ)音識(shí)別相結(jié)合,支持用戶以按字母及按單詞兩種方式輸入英文語(yǔ)音序列,提升了用戶的使用體驗(yàn)。
【專利附圖】
【附圖說(shuō)明】
[0016]通過(guò)閱讀參照以下附圖所作的對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:
[0017]圖1示出根據(jù)本發(fā)明一個(gè)方面的用于基于中文語(yǔ)音信息訓(xùn)練英文語(yǔ)音模型的設(shè)備不意圖;
[0018]圖2示出根據(jù)本發(fā)明一個(gè)優(yōu)選實(shí)施例的用于基于中文語(yǔ)音信息訓(xùn)練英文語(yǔ)音模型的設(shè)備示意圖;
[0019]圖3示出根據(jù)本發(fā)明另一個(gè)方面的用于基于中文語(yǔ)音信息訓(xùn)練英文語(yǔ)音模型的方法流程圖;
[0020]圖4示出根據(jù)本發(fā)明一個(gè)優(yōu)選實(shí)施例的用于基于中文語(yǔ)音信息訓(xùn)練英文語(yǔ)音模型的方法流程圖。
[0021 ] 附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。
【具體實(shí)施方式】
[0022]下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述。
[0023]圖1示出根據(jù)本發(fā)明一個(gè)方面的用于基于中文語(yǔ)音信息訓(xùn)練英文語(yǔ)音模型的設(shè)備示意圖。模型訓(xùn)練設(shè)備1包括語(yǔ)音獲取裝置101、英文判斷裝置102、語(yǔ)音識(shí)別裝置103和模型訓(xùn)練裝置104。
[0024]其中,語(yǔ)音獲取裝置101獲取用戶通過(guò)語(yǔ)音采集裝置輸入的語(yǔ)音數(shù)據(jù)。具體地,用戶或大量用戶通過(guò)與語(yǔ)音采集裝置的交互,輸入了語(yǔ)音數(shù)據(jù),語(yǔ)音獲取裝置101通過(guò)調(diào)用該語(yǔ)音采集裝置所提供的應(yīng)用程序接口(API),獲取該用戶或大量用戶輸入的語(yǔ)音數(shù)據(jù);或者,用戶或大量用戶通過(guò)與語(yǔ)音采集裝置的交互,輸入了語(yǔ)音數(shù)據(jù),并將該語(yǔ)音數(shù)據(jù)存入語(yǔ)音數(shù)據(jù)庫(kù)中,語(yǔ)音獲取裝置101通過(guò)調(diào)用該語(yǔ)音數(shù)據(jù)庫(kù)所提供的應(yīng)用程序接口(API),從該語(yǔ)音數(shù)據(jù)庫(kù)中獲取用戶或大量用戶輸入的語(yǔ)音數(shù)據(jù)。
[0025]本領(lǐng)域技術(shù)人員應(yīng)能理解上述獲取語(yǔ)音數(shù)據(jù)的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取語(yǔ)音數(shù)據(jù)的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。
[0026]英文判斷裝置102判斷所述語(yǔ)音數(shù)據(jù)是否為英文語(yǔ)音數(shù)據(jù)。具體地,英文判斷裝置102根據(jù)語(yǔ)音獲取裝置101所獲取的用戶通過(guò)語(yǔ)音采集裝置輸入的語(yǔ)音數(shù)據(jù),例如通過(guò)聲學(xué)模型匹配等方式,判斷該語(yǔ)音數(shù)據(jù)是否為英文語(yǔ)音數(shù)據(jù)。
[0027]本領(lǐng)域技術(shù)人員應(yīng)能理解上述判斷英文語(yǔ)音數(shù)據(jù)的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的判斷英文語(yǔ)音數(shù)據(jù)的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。
[0028]語(yǔ)音識(shí)別裝置103當(dāng)所述語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),根據(jù)中文語(yǔ)音信息,對(duì)所述英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與所述英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的發(fā)音信息。具體地,當(dāng)英文判斷裝置102判斷該語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),語(yǔ)音識(shí)別裝置103根據(jù)中文語(yǔ)音信息,如中文聲韻母信息,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,例如,當(dāng)英文判斷裝置判斷該語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù)時(shí),語(yǔ)音識(shí)別裝置103采用所有可能的中文聲韻母信息去識(shí)別該英文語(yǔ)音數(shù)據(jù),以確定該英文語(yǔ)音數(shù)據(jù)的發(fā)音信息。
[0029]例如,用戶通過(guò)與語(yǔ)音采集裝置的交互,輸入了語(yǔ)音數(shù)據(jù)單詞“iphone”,語(yǔ)音獲取裝置101通過(guò)調(diào)用該語(yǔ)音采集裝置所提供的應(yīng)用程序接口(API),獲取了該語(yǔ)音數(shù)據(jù)“iphone”;隨后,英文判斷裝置102采用聲學(xué)模型匹配的方式,判斷該語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù);隨后,語(yǔ)音識(shí)別裝置103采用所有可能的中文聲韻母信息,對(duì)該英文語(yǔ)音數(shù)據(jù)“iphone”進(jìn)行強(qiáng)制對(duì)齊,確定該英文語(yǔ)音數(shù)據(jù)“iphone”的發(fā)音信息為“aa ai4 f engl”。在此,aa、ai4、f、engl等即為中文聲韻母信息,其中的數(shù)字表示該韻母信息所對(duì)應(yīng)的聲調(diào)。本領(lǐng)域技術(shù)人員應(yīng)能理解,在此,中文聲韻母信息及聲調(diào)的表示僅為示例,而不應(yīng)對(duì)本發(fā)明產(chǎn)生任何限制。
[0030]優(yōu)選地,語(yǔ)音識(shí)別裝置103還可以根據(jù)單詞模型所對(duì)應(yīng)的中文語(yǔ)音信息、或字母模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與該英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的單詞發(fā)音信息、或字母發(fā)音信息。例如,對(duì)于“iphone”,若用戶輸入語(yǔ)音采集裝置的為按單詞讀的“iphone”,則語(yǔ)音識(shí)別裝置103確定其對(duì)應(yīng)的采用中文語(yǔ)音信息表示的發(fā)音信息為“aa ai4 f engl” ;若用戶輸入語(yǔ)音采集裝置的為按字母讀的“iphone”,即,“1、p、h、ο、n、e”,則語(yǔ)音識(shí)別裝置103確定其對(duì)應(yīng)的采用中文語(yǔ)音信息表示的發(fā)音信息為“aa ai4 p i4ei2 ch oo oul ee enl ii i4,,。
[0031]本領(lǐng)域技術(shù)人員應(yīng)能理解上述識(shí)別發(fā)音信息的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的識(shí)別發(fā)音信息的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。
[0032]模型訓(xùn)練裝置104根據(jù)所述發(fā)音信息,確定所述英文語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的英文數(shù)據(jù),以建立或更新英文語(yǔ)音模型,其中,所述發(fā)音信息與所述英文數(shù)據(jù)通過(guò)所述中文語(yǔ)音信息相映射。具體地,模型訓(xùn)練裝置104根據(jù)該語(yǔ)音識(shí)別裝置103所識(shí)別獲得的發(fā)音信息,確定該英文語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的英文數(shù)據(jù),如根據(jù)發(fā)音信息“aa ai4 f engl”,確定該發(fā)音信息對(duì)應(yīng)的英文數(shù)據(jù)為“iphone”,再將該發(fā)音信息與該英文數(shù)據(jù)的映射關(guān)系存入英文語(yǔ)音模型,以實(shí)現(xiàn)對(duì)該英文語(yǔ)音模型的建立或更新,其中,該發(fā)音信息與該英文數(shù)據(jù)通過(guò)該中文語(yǔ)音信息相映射。
[0033]在此,英文數(shù)據(jù)為一具體的英文單詞,如“iphone”等,而英文語(yǔ)音數(shù)據(jù)為該具體的英文單詞所對(duì)應(yīng)的語(yǔ)音數(shù)據(jù),如“iphone”所對(duì)應(yīng)的語(yǔ)音數(shù)據(jù),通過(guò)語(yǔ)音獲取裝置101所獲取。
[0034]本領(lǐng)域技術(shù)人員應(yīng)能理解上述建立或更新英文語(yǔ)音模型的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的建立或更新英文語(yǔ)音模型的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。
[0035]在此,本發(fā)明在原有中文聲學(xué)模型基礎(chǔ)上,利用相似的中文語(yǔ)音信息,對(duì)英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與該英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的發(fā)音信息,實(shí)現(xiàn)對(duì)英文語(yǔ)音模型的建立或更新,有效地控制了英文語(yǔ)音模型的規(guī)模。
[0036]優(yōu)選地,模型訓(xùn)練設(shè)備1的各個(gè)裝置之間是持續(xù)不斷工作的。具體地,語(yǔ)音獲取裝置101獲取用戶通過(guò)語(yǔ)音采集裝置輸入的語(yǔ)音數(shù)據(jù);英文判斷裝置102判斷所述語(yǔ)音數(shù)據(jù)是否為英文語(yǔ)音數(shù)據(jù);語(yǔ)音識(shí)別裝置103當(dāng)所述語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),根據(jù)中文語(yǔ)音信息,對(duì)所述英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與所述英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的發(fā)音信息;模型訓(xùn)練裝置104根據(jù)所述發(fā)音信息,確定所述英文語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的英文數(shù)據(jù),以建立或更新英文語(yǔ)音模型,其中,所述發(fā)音信息與所述英文數(shù)據(jù)通過(guò)所述中文語(yǔ)音信息相映射。在此,本領(lǐng)域技術(shù)人員應(yīng)理解“持續(xù)”是指模型訓(xùn)練設(shè)備1的各裝置分別不斷地進(jìn)行語(yǔ)音數(shù)據(jù)的獲取、英文語(yǔ)音數(shù)據(jù)的判斷、英文語(yǔ)音數(shù)據(jù)的識(shí)別處理及英文語(yǔ)音模型的建立或更新,直至該模型訓(xùn)練設(shè)備1在較長(zhǎng)時(shí)間內(nèi)停止獲取語(yǔ)音數(shù)據(jù)。
[0037]優(yōu)選地,語(yǔ)音識(shí)別裝置103當(dāng)所述語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),根據(jù)單詞模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)所述英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與所述英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的單詞發(fā)音信息。具體地,當(dāng)該英文判斷裝置102判斷語(yǔ)音獲取裝置101所獲取的語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),語(yǔ)音識(shí)別裝置103采用單詞模型所對(duì)應(yīng)的中文語(yǔ)音信息,如“aaai4 f engl”等,對(duì)所述英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,如強(qiáng)制對(duì)齊處理,采用所有可能的中文聲韻母信息,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行強(qiáng)制對(duì)齊,以獲得與所述英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的單詞發(fā)音信息。
[0038]在此,該單詞模型中存儲(chǔ)有大量單詞所對(duì)應(yīng)的中文語(yǔ)音信息,該單詞模型可以位于模型訓(xùn)練設(shè)備1中,或者位于與該模型訓(xùn)練設(shè)備1通過(guò)網(wǎng)絡(luò)相連接的第三方設(shè)備中。
[0039]優(yōu)選地,語(yǔ)音識(shí)別裝置103當(dāng)所述語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),根據(jù)字母模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)所述英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與所述英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的字母發(fā)音信息。具體地,當(dāng)該英文判斷裝置102判斷語(yǔ)音獲取裝置101所獲取的語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),語(yǔ)音識(shí)別裝置103根據(jù)字母模型所對(duì)應(yīng)的中文語(yǔ)音信息,如二十六個(gè)英文字母所對(duì)應(yīng)的中文語(yǔ)音信息,如字母“a”對(duì)應(yīng)的中文語(yǔ)音信息“aa eil”、字母“b”對(duì)應(yīng)的中文語(yǔ)音信息“b i4”、字母“c”對(duì)應(yīng)的中文語(yǔ)音信息“s ei4”等,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與該英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的字母發(fā)音信息。
[0040]優(yōu)選地,語(yǔ)音識(shí)別裝置103對(duì)于英文判斷裝置102判斷為英文語(yǔ)音數(shù)據(jù)為語(yǔ)音數(shù)據(jù),優(yōu)先采用單詞模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,當(dāng)該語(yǔ)音識(shí)別裝置103采用單詞模型無(wú)法識(shí)別出該英文語(yǔ)音數(shù)據(jù)的發(fā)音信息時(shí),再采用字母模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與該英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的字母發(fā)音信息。相似地,該語(yǔ)音識(shí)別裝置103也可以優(yōu)先采用字母模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,當(dāng)該語(yǔ)音識(shí)別裝置103采用字母模型無(wú)法識(shí)別出該英文語(yǔ)音數(shù)據(jù)的發(fā)音信息時(shí),再采用單詞模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與該英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的單詞發(fā)音信息。在此,優(yōu)先采用單詞模型還是優(yōu)先采用字母模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,可以是該模型訓(xùn)練設(shè)備1預(yù)先設(shè)定的,也可以應(yīng)事件而進(jìn)行調(diào)整。
[0041]例如,對(duì)于語(yǔ)音獲取裝置101所獲取的語(yǔ)音數(shù)據(jù)“iphone”,英文判斷裝置102判斷該語(yǔ)音數(shù)據(jù)“iphone”為英文語(yǔ)音數(shù)據(jù),語(yǔ)音識(shí)別裝置103優(yōu)先采用單詞模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,但無(wú)法識(shí)別出該英文語(yǔ)音數(shù)據(jù)的發(fā)音信息;隨后,該語(yǔ)音獲取裝置101再采用字母模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,獲得與該英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的字母發(fā)音信息“aa ai4 p i4 ei2ch oo oul ee enl ii i4”,則可知該語(yǔ)音獲取裝置101所獲取的語(yǔ)音數(shù)據(jù)為按字母讀的“iphone”,即,“1、p、h、ο、η、e”。[0042]更優(yōu)選地,語(yǔ)音識(shí)別裝置103分別采用單詞模型所對(duì)應(yīng)的中文語(yǔ)音信息、字母模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,并分別對(duì)語(yǔ)音識(shí)別處理所獲得的結(jié)果進(jìn)行打分,確定打分較高的發(fā)音信息為該英文語(yǔ)音數(shù)據(jù)的發(fā)音信息。
[0043]在此,由于用戶在輸入英文單詞時(shí)有時(shí)按單詞讀有時(shí)按字母讀,本發(fā)明對(duì)每個(gè)需要識(shí)別的英文單詞,利用相似的單詞模型對(duì)應(yīng)的中文語(yǔ)音信息、字母模型對(duì)應(yīng)的中文語(yǔ)音信息,確定其對(duì)應(yīng)的發(fā)音信息,提升了語(yǔ)音識(shí)別的準(zhǔn)確性。
[0044]在一優(yōu)選實(shí)施例中,該模型訓(xùn)練設(shè)備1還包括模型更新裝置(未示出)。該模型更新裝置統(tǒng)計(jì)所述英文數(shù)據(jù)所對(duì)應(yīng)的英文語(yǔ)音數(shù)據(jù)在所述語(yǔ)音數(shù)據(jù)中的出現(xiàn)次數(shù);根據(jù)所述出現(xiàn)次數(shù),并結(jié)合所述語(yǔ)音數(shù)據(jù)的數(shù)量信息,確定所述英文數(shù)據(jù)的概率值;根據(jù)所述概率值,更新所述英文語(yǔ)音模型。具體地,當(dāng)大量用戶通過(guò)語(yǔ)音采集裝置輸入語(yǔ)音數(shù)據(jù),其中,多個(gè)用戶所輸入的英文語(yǔ)音數(shù)據(jù)為相同的英文語(yǔ)音數(shù)據(jù),語(yǔ)音獲取裝置101獲取該大量用戶輸入的大量語(yǔ)音數(shù)據(jù);英文判斷裝置102判斷該大量語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù);隨后,語(yǔ)音識(shí)別裝置103根據(jù)中文語(yǔ)音信息,對(duì)該大量英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與該大量英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的發(fā)音信息,在此,由于該多個(gè)用戶輸入的為相同的英文語(yǔ)音數(shù)據(jù),因此,該語(yǔ)音識(shí)別裝置103所獲得的關(guān)于該多個(gè)用戶輸入的英文語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的發(fā)音信息相同或相似;接著,模型訓(xùn)練裝置104根據(jù)該多個(gè)相同或相似的發(fā)音信息,確定該多個(gè)英文語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的相同的英文數(shù)據(jù);模型更新裝置統(tǒng)計(jì)該相同的英文數(shù)據(jù)所對(duì)應(yīng)的英文語(yǔ)音數(shù)據(jù)在該語(yǔ)音數(shù)據(jù)中的出現(xiàn)次數(shù);接著,該模型更新裝置再根據(jù)該英文語(yǔ)音數(shù)據(jù)的出現(xiàn)次數(shù),并結(jié)合該語(yǔ)音數(shù)據(jù)的數(shù)量信息,確定該英文數(shù)據(jù)的概率值,如將該出現(xiàn)次數(shù)除以該大量語(yǔ)音數(shù)據(jù)的數(shù)量信息,獲得該英文數(shù)據(jù)的概率值;該模型更新裝置再將該英文數(shù)據(jù)及其對(duì)應(yīng)的概率值存入該英文語(yǔ)音模型中,以實(shí)現(xiàn)對(duì)該英文語(yǔ)音模型的更新。
[0045]優(yōu)選地,該模型訓(xùn)練設(shè)備1還包括數(shù)據(jù)提取裝置(未示出)和單元訓(xùn)練裝置(未示出)。該數(shù)據(jù)提取裝置當(dāng)所述出現(xiàn)次數(shù)大于預(yù)定數(shù)量閾值,自所述英文語(yǔ)音模型中提取所述英文數(shù)據(jù)與所述英文語(yǔ)音數(shù)據(jù);該單元訓(xùn)練裝置根據(jù)所述英文數(shù)據(jù)與所述英文語(yǔ)音數(shù)據(jù)的映射關(guān)系,建立或更新與所述英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的英文語(yǔ)音單元。具體地,該模型訓(xùn)練設(shè)備1可以設(shè)置一個(gè)預(yù)定數(shù)量閾值,該預(yù)定數(shù)量閾值用來(lái)判斷英文數(shù)據(jù)所對(duì)應(yīng)的英文語(yǔ)音數(shù)據(jù)在該語(yǔ)音數(shù)據(jù)中的出現(xiàn)次數(shù)是否超過(guò)該值,當(dāng)該出現(xiàn)次數(shù)大于該預(yù)定數(shù)量閾值時(shí),數(shù)據(jù)提取裝置自該英文語(yǔ)音模型中提取該英文數(shù)據(jù)與該英文語(yǔ)音數(shù)據(jù);該單元訓(xùn)練裝置根據(jù)該英文數(shù)據(jù)與該英文語(yǔ)音數(shù)據(jù)的映射關(guān)系,為該英文語(yǔ)音數(shù)據(jù)新建一個(gè)英文語(yǔ)音單元,以實(shí)現(xiàn)對(duì)該英文語(yǔ)音單元的建立或更新。
[0046]更優(yōu)選地,該單元訓(xùn)練裝置根據(jù)所述英文數(shù)據(jù)與所述英文語(yǔ)音數(shù)據(jù)的映射關(guān)系,采用插值計(jì)算方法,建立或更新所述英文語(yǔ)音單元。具體地,該單元訓(xùn)練裝置根據(jù)該英文數(shù)據(jù)與該英文語(yǔ)音數(shù)據(jù)的映射關(guān)系,為該英文數(shù)據(jù)新建一英文語(yǔ)音單元,再例如通過(guò)將該中文發(fā)音信息所對(duì)應(yīng)的中文語(yǔ)音單元的模型參數(shù)復(fù)制給該英文語(yǔ)音單元,然后在英文數(shù)據(jù)上對(duì)齊,得到統(tǒng)計(jì)量,再與該復(fù)制所獲得的參數(shù)進(jìn)行插值計(jì)算,以實(shí)現(xiàn)對(duì)該英文語(yǔ)音單元的建立或更新。在此,所述中文語(yǔ)音單元包括為每個(gè)中文發(fā)音信息,如中文聲母或韻母信息所建立的發(fā)音單元,如“s”、“ei4”等中文聲韻母信息所對(duì)應(yīng)的中文語(yǔ)音單元。
[0047]更優(yōu)選地,該模型訓(xùn)練設(shè)備1還包括單元更新裝置(未示出)。該單元更新裝置根據(jù)所述英文語(yǔ)音數(shù)據(jù)及與該英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的發(fā)音信息,更新所述英文語(yǔ)音單元。具體地,在單元訓(xùn)練裝置為英文數(shù)據(jù)新建一英文語(yǔ)音單元之后,單元更新裝置不斷地根據(jù)用戶輸入的英文語(yǔ)音數(shù)據(jù),及由語(yǔ)音識(shí)別裝置103識(shí)別所獲得的與該英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的發(fā)音信息,訓(xùn)練該英文語(yǔ)音單元。
[0048]在此,本發(fā)明對(duì)出現(xiàn)此處大于預(yù)定閾值的英文語(yǔ)音數(shù)據(jù),為該英文語(yǔ)音數(shù)據(jù)及英文數(shù)據(jù)新建英文語(yǔ)音單元,并對(duì)該英文語(yǔ)音單元不斷地進(jìn)行訓(xùn)練,以進(jìn)一步提升該英文語(yǔ)音數(shù)據(jù)的發(fā)音信息的準(zhǔn)確性。
[0049]圖2示出根據(jù)本發(fā)明一個(gè)優(yōu)選實(shí)施例的用于基于中文語(yǔ)音信息訓(xùn)練英文語(yǔ)音模型的設(shè)備示意圖。該模型訓(xùn)練設(shè)備1還包括序列獲取裝置205、序列確定裝置206和信息提供裝置207。以下參照?qǐng)D2對(duì)該優(yōu)選實(shí)施例進(jìn)行詳細(xì)描述:具體地,語(yǔ)音獲取裝置201獲取用戶通過(guò)語(yǔ)音采集裝置輸入的語(yǔ)音數(shù)據(jù);英文判斷裝置202判斷所述語(yǔ)音數(shù)據(jù)是否為英文語(yǔ)音數(shù)據(jù);語(yǔ)音識(shí)別裝置203當(dāng)所述語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),根據(jù)中文語(yǔ)音信息,對(duì)所述英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與所述英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的發(fā)音信息;模型訓(xùn)練裝置204根據(jù)所述發(fā)音信息,確定所述英文語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的英文數(shù)據(jù),以建立或更新英文語(yǔ)音模型,其中,所述發(fā)音信息與所述英文數(shù)據(jù)通過(guò)所述中文語(yǔ)音信息相映射;序列獲取裝置205獲取所述用戶為目標(biāo)應(yīng)用輸入的單詞語(yǔ)音序列;序列確定裝置206根據(jù)所述英文語(yǔ)音模型,確定與所述單詞語(yǔ)音序列相對(duì)應(yīng)的英文字符序列;信息提供裝置207將與所述英文字符序列相對(duì)應(yīng)的信息提供給所述用戶。其中,語(yǔ)音獲取裝置201、英文判斷裝置202、語(yǔ)音識(shí)別裝置203和模型訓(xùn)練裝置204與圖1所示對(duì)應(yīng)裝置相同或相似,故此處不再贅述,并通過(guò)引用的方式包含于此。
[0050]其中,序列獲取裝置205獲取所述用戶為目標(biāo)應(yīng)用輸入的單詞語(yǔ)音序列。具體地,用戶例如通過(guò)與用戶設(shè)備的語(yǔ)音采集裝置的交互,在目標(biāo)應(yīng)用中輸入單詞語(yǔ)音序列,序列獲取裝置205例如通過(guò)調(diào)用該用戶設(shè)備所提供的應(yīng)用程序接口(API)等方式,獲取該用戶為目標(biāo)應(yīng)用所輸入的單詞語(yǔ)音序列。
[0051]序列確定裝置206根據(jù)所述英文語(yǔ)音模型,確定與所述單詞語(yǔ)音序列相對(duì)應(yīng)的英文字符序列。具體地,序列確定裝置206根據(jù)該序列獲取裝置205所獲取的單詞語(yǔ)音序列,通過(guò)語(yǔ)音識(shí)別處理,確定該單詞語(yǔ)音序列的發(fā)音信息,進(jìn)而,根據(jù)該發(fā)音信息,在該英文語(yǔ)音模型中進(jìn)行匹配查詢,確定與該單詞語(yǔ)音序列相對(duì)應(yīng)的英文字符序列。例如,用戶通過(guò)與用戶設(shè)備的語(yǔ)音采集裝置的交互,輸入了單詞語(yǔ)音序列“iphone”,序列獲取裝置205例如通過(guò)調(diào)用該用戶設(shè)備所提供的應(yīng)用程序接口(API)等方式,獲取了該用戶輸入的單詞語(yǔ)音序列“iphone”;隨后,序列確定裝置206根據(jù)該單詞語(yǔ)音序列“iphone”,通過(guò)語(yǔ)音識(shí)別處理,確定該單詞語(yǔ)音序列的發(fā)音信息“aa ai4 f engl”,進(jìn)而,根據(jù)該發(fā)音信息,在該英文語(yǔ)音模型中進(jìn)行匹配查詢,確定與該單詞語(yǔ)音序列相對(duì)應(yīng)的英文字符序列“iphone”。
[0052]信息提供裝置207將與所述英文字符序列相對(duì)應(yīng)的信息提供給所述用戶。例如,當(dāng)該目標(biāo)應(yīng)用為語(yǔ)音輸入應(yīng)用,該信息提供裝置207通過(guò)調(diào)用諸如JSP、ASP或PHP等動(dòng)態(tài)網(wǎng)頁(yè)技術(shù),將該英文字符序列作為語(yǔ)音輸入候選詞條提供給該用戶;當(dāng)該目標(biāo)應(yīng)用為語(yǔ)音搜索應(yīng)用;該信息提供裝置207通過(guò)調(diào)用諸如JSP、ASP或PHP等動(dòng)態(tài)網(wǎng)頁(yè)技術(shù),將根據(jù)該英文字符序列搜索獲得的一個(gè)或多個(gè)搜索結(jié)果提供給該用戶。
[0053]優(yōu)選地,該目標(biāo)應(yīng)用為語(yǔ)音輸入應(yīng)用;其中,該信息提供裝置207將所述英文字符序列作為語(yǔ)音輸入候選詞條提供給所述用戶。例如,當(dāng)該目標(biāo)應(yīng)用為語(yǔ)音輸入應(yīng)用,用戶通過(guò)與用戶設(shè)備的語(yǔ)音采集裝置的交互,在語(yǔ)音輸入應(yīng)用中輸入了單詞語(yǔ)音序列“iphone”,序列獲取裝置205例如通過(guò)調(diào)用該用戶設(shè)備所提供的應(yīng)用程序接口(API)等方式,獲取了該用戶輸入的單詞語(yǔ)音序列“iphone”;隨后,序列確定裝置206根據(jù)該單詞語(yǔ)音序列“iphone”,通過(guò)語(yǔ)音識(shí)別處理,確定該單詞語(yǔ)音序列的發(fā)音信息“aa ai4 f engl”,進(jìn)而,根據(jù)該發(fā)音信息,在該英文語(yǔ)音模型中進(jìn)行匹配查詢,確定與該單詞語(yǔ)音序列相對(duì)應(yīng)的英文字符序列“iphone” ;進(jìn)而,信息提供裝置207通過(guò)調(diào)用諸如JSP、ASP或PHP等動(dòng)態(tài)網(wǎng)頁(yè)技術(shù),將該英文字符序列“iphone”作為語(yǔ)音輸入候選詞條提供給該用戶,以供該用戶選擇輸入。
[0054]優(yōu)選地,該目標(biāo)應(yīng)用為語(yǔ)音搜索應(yīng)用;其中,該模型訓(xùn)練設(shè)備1還包括搜索獲取裝置(未示出)。該搜索獲取裝置將所述英文字符序列作為所述用戶的查詢序列,獲取與所述查詢序列相對(duì)應(yīng)的一個(gè)或多個(gè)搜索結(jié)果;其中,該信息提供裝置207將所述一個(gè)或多個(gè)搜索結(jié)果提供給所述用戶。具體地,當(dāng)該目標(biāo)應(yīng)用為語(yǔ)音搜索應(yīng)用,序列確定裝置206根據(jù)該英文語(yǔ)音模型,確定與該單詞語(yǔ)音序列相對(duì)應(yīng)的英文字符序列;搜索獲取裝置根據(jù)該序列確定裝置206所確定的英文字符序列,將該英文字符序列作為該用戶的查詢序列,進(jìn)行匹配查詢,獲取與該查詢序列相對(duì)應(yīng)的一個(gè)或多個(gè)搜索結(jié)果;隨后,信息提供裝置207通過(guò)調(diào)用諸如JSP、ASP或PHP等動(dòng)態(tài)網(wǎng)頁(yè)技術(shù),將該一個(gè)或多個(gè)搜索結(jié)果提供給該用戶。
[0055]例如,當(dāng)該目標(biāo)應(yīng)用為語(yǔ)音搜索應(yīng)用,用戶通過(guò)與用戶設(shè)備的語(yǔ)音采集裝置的交互,在語(yǔ)音輸入應(yīng)用中輸入了單詞語(yǔ)音序列“iphone”,序列獲取裝置205例如通過(guò)調(diào)用該用戶設(shè)備所提供的應(yīng)用程序接口(API)等方式,獲取了該用戶輸入的單詞語(yǔ)音序列“iphone”;隨后,序列確定裝置206根據(jù)該單詞語(yǔ)音序列“iphone”,通過(guò)語(yǔ)音識(shí)別處理,確定該單詞語(yǔ)音序列的發(fā)音信息“aa ai4 f engl”,進(jìn)而,根據(jù)該發(fā)音信息,在該英文語(yǔ)音模型中進(jìn)行匹配查詢,確定與該單詞語(yǔ)音序列相對(duì)應(yīng)的英文字符序列“ iphone”;進(jìn)而,搜索獲取裝置根據(jù)該序列確定裝置206所確定的英文字符序列,將該英文字符序列“iphone”作為該用戶的查詢序列,進(jìn)行匹配查詢,獲取與該查詢序列相對(duì)應(yīng)的一個(gè)或多個(gè)搜索結(jié)果;隨后,信息提供裝置207通過(guò)調(diào)用諸如JSP、ASP或PHP等動(dòng)態(tài)網(wǎng)頁(yè)技術(shù),將與該英文字符序列“iphone”相對(duì)應(yīng)的一個(gè)或多個(gè)搜索結(jié)果提供給該用戶,供該用戶瀏覽。
[0056]更優(yōu)選地,序列獲取裝置205獲取所述用戶為目標(biāo)應(yīng)用輸入的字母語(yǔ)音序列;其中,所述序列確定裝置206根據(jù)所述英文語(yǔ)音模型,確定與所述字母語(yǔ)音序列相對(duì)應(yīng)的英文字符序列。具體地,用戶例如通過(guò)與用戶設(shè)備的語(yǔ)音采集裝置的交互,在目標(biāo)應(yīng)用中輸入字母語(yǔ)音序列,序列獲取裝置205例如通過(guò)調(diào)用該用戶設(shè)備所提供的應(yīng)用程序接口(API)等方式,獲取該用戶為目標(biāo)應(yīng)用所輸入的字母語(yǔ)音序列;隨后,序列確定裝置206根據(jù)該序列獲取裝置205所獲取的字母語(yǔ)音序列,通過(guò)語(yǔ)音識(shí)別處理,確定該字母語(yǔ)音序列的發(fā)音信息,進(jìn)而,根據(jù)該發(fā)音信息,在該英文語(yǔ)音模型中進(jìn)行匹配查詢,確定與該字母語(yǔ)音序列相對(duì)應(yīng)的英文字符序列。例如,用戶通過(guò)與用戶設(shè)備的語(yǔ)音采集裝置的交互,輸入了字母語(yǔ)音序列“1、p、h、o、n、e”,序列獲取裝置205例如通過(guò)調(diào)用該用戶設(shè)備所提供的應(yīng)用程序接口(API)等方式,獲取了該用戶輸入的字母語(yǔ)音序列“1、p、h、o、n、e”;隨后,序列確定裝置206根據(jù)該字母語(yǔ)音序列“1、p、h、o、n、e”,通過(guò)語(yǔ)音識(shí)別處理,確定該字母語(yǔ)音序列的發(fā)音信息“aa ai4 p i4 ei2 ch oo oul ee enl ii i4”,進(jìn)而,根據(jù)該發(fā)音信息,在該英文語(yǔ)音模型中進(jìn)行匹配查詢,確定與該字母語(yǔ)音序列相對(duì)應(yīng)的英文字符序列“iphone”。[0057]相似地,信息提供裝置207將與該英文字符序列相對(duì)應(yīng)的信息提供給所述用戶。接上例,當(dāng)該目標(biāo)應(yīng)用為語(yǔ)音輸入應(yīng)用,該信息提供裝置207通過(guò)調(diào)用諸如JSP、ASP或PHP等動(dòng)態(tài)網(wǎng)頁(yè)技術(shù),將該英文字符序列“iphone”作為語(yǔ)音輸入候選詞條提供給該用戶,以供該用戶選擇輸入;當(dāng)該目標(biāo)應(yīng)用為語(yǔ)音搜索應(yīng)用;搜索獲取裝置根據(jù)該序列確定裝置206所確定的英文字符序列,將該英文字符序列“iphone”作為該用戶的查詢序列,進(jìn)行匹配查詢,獲取與該查詢序列相對(duì)應(yīng)的一個(gè)或多個(gè)搜索結(jié)果;隨后,信息提供裝置207通過(guò)調(diào)用諸如JSP、ASP或PHP等動(dòng)態(tài)網(wǎng)頁(yè)技術(shù),將與該英文字符序列“iphone”相對(duì)應(yīng)的一個(gè)或多個(gè)搜索結(jié)果提供給該用戶,供該用戶瀏覽。
[0058]在此,本發(fā)明還可與語(yǔ)音識(shí)別相結(jié)合,支持用戶以按字母及按單詞兩種方式輸入英文語(yǔ)音序列,提升了用戶的使用體驗(yàn)。
[0059]圖3示出根據(jù)本發(fā)明另一個(gè)方面的用于基于中文語(yǔ)音信息訓(xùn)練英文語(yǔ)音模型的方法流程圖。
[0060]在步驟S301中,模型訓(xùn)練設(shè)備1獲取用戶通過(guò)語(yǔ)音采集裝置輸入的語(yǔ)音數(shù)據(jù)。具體地,用戶或大量用戶通過(guò)與語(yǔ)音采集裝置的交互,輸入了語(yǔ)音數(shù)據(jù),在步驟S301中,模型訓(xùn)練設(shè)備1通過(guò)調(diào)用該語(yǔ)音采集裝置所提供的應(yīng)用程序接口(API),獲取該用戶或大量用戶輸入的語(yǔ)音數(shù)據(jù);或者,用戶或大量用戶通過(guò)與語(yǔ)音采集裝置的交互,輸入了語(yǔ)音數(shù)據(jù),并將該語(yǔ)音數(shù)據(jù)存入語(yǔ)音數(shù)據(jù)庫(kù)中,在步驟S301中,模型訓(xùn)練設(shè)備1通過(guò)調(diào)用該語(yǔ)音數(shù)據(jù)庫(kù)所提供的應(yīng)用程序接口(API),從該語(yǔ)音數(shù)據(jù)庫(kù)中獲取用戶或大量用戶輸入的語(yǔ)音數(shù)據(jù)。
[0061]本領(lǐng)域技術(shù)人員應(yīng)能理解上述獲取語(yǔ)音數(shù)據(jù)的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取語(yǔ)音數(shù)據(jù)的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。
[0062]在步驟S302中,模型訓(xùn)練設(shè)備1判斷所述語(yǔ)音數(shù)據(jù)是否為英文語(yǔ)音數(shù)據(jù)。具體地,在步驟S302中,模型訓(xùn)練設(shè)備1根據(jù)在步驟S301中所獲取的用戶通過(guò)語(yǔ)音采集裝置輸入的語(yǔ)音數(shù)據(jù),例如通過(guò)聲學(xué)模型匹配等方式,判斷該語(yǔ)音數(shù)據(jù)是否為英文語(yǔ)音數(shù)據(jù)。
[0063]本領(lǐng)域技術(shù)人員應(yīng)能理解上述判斷英文語(yǔ)音數(shù)據(jù)的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的判斷英文語(yǔ)音數(shù)據(jù)的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。
[0064]在步驟S303中,模型訓(xùn)練設(shè)備1當(dāng)所述語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),根據(jù)中文語(yǔ)音信息,對(duì)所述英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與所述英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的發(fā)音信息。具體地,當(dāng)在步驟S302中,模型訓(xùn)練設(shè)備1判斷該語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),在步驟S303中,模型訓(xùn)練設(shè)備1根據(jù)中文語(yǔ)音信息,如中文聲韻母信息,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,例如,當(dāng)在步驟S302中,模型訓(xùn)練設(shè)備1判斷該語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù)時(shí),在步驟S303中,模型訓(xùn)練設(shè)備1采用所有可能的中文聲韻母信息去識(shí)別該英文語(yǔ)音數(shù)據(jù),以確定該英文語(yǔ)音數(shù)據(jù)的發(fā)音信息。
[0065]例如,用戶通過(guò)與語(yǔ)音采集裝置的交互,輸入了語(yǔ)音數(shù)據(jù)單詞“iphone”,在步驟S301中,模型訓(xùn)練設(shè)備1通過(guò)調(diào)用該語(yǔ)音采集裝置所提供的應(yīng)用程序接口(API),獲取了該語(yǔ)音數(shù)據(jù)“iphone”;隨后,在步驟S302中,模型訓(xùn)練設(shè)備1采用聲學(xué)模型匹配的方式,判斷該語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù);隨后,在步驟S303中,模型訓(xùn)練設(shè)備1采用所有可能的中文聲韻母信息,對(duì)該英文語(yǔ)音數(shù)據(jù)“iphone”進(jìn)行強(qiáng)制對(duì)齊,確定該英文語(yǔ)音數(shù)據(jù)“iphone”的發(fā)音信息為“aa ai4f engl”。在此,aa、ai4、f、engl等即為中文聲韻母信息,其中的數(shù)字表示該韻母信息所對(duì)應(yīng)的聲調(diào)。本領(lǐng)域技術(shù)人員應(yīng)能理解,在此,中文聲韻母信息及聲調(diào)的表示僅為示例,而不應(yīng)對(duì)本發(fā)明產(chǎn)生任何限制。
[0066]優(yōu)選地,在步驟S303中,模型訓(xùn)練設(shè)備1還可以根據(jù)單詞模型所對(duì)應(yīng)的中文語(yǔ)音信息、或字母模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與該英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的單詞發(fā)音信息、或字母發(fā)音信息。例如,對(duì)于“iphone”,若用戶輸入語(yǔ)音采集裝置的為按單詞讀的“iphone”,則在步驟S303中,模型訓(xùn)練設(shè)備1確定其對(duì)應(yīng)的采用中文語(yǔ)音信息表示的發(fā)音信息為“aa ai4 fengl”;若用戶輸入語(yǔ)音采集裝置的為按字母讀的“iphone”,即,“1、p、h、ο、n、e”,則在步驟S303中,模型訓(xùn)練設(shè)備1確定其對(duì)應(yīng)的采用中文語(yǔ)音信息表示的發(fā)音信息為“aa ai4 pi4 ei2 ch oo oul ee enl iii4”。
[0067]本領(lǐng)域技術(shù)人員應(yīng)能理解上述識(shí)別發(fā)音信息的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的識(shí)別發(fā)音信息的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。
[0068]在步驟S304中,模型訓(xùn)練設(shè)備1根據(jù)所述發(fā)音信息,確定所述英文語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的英文數(shù)據(jù),以建立或更新英文語(yǔ)音模型,其中,所述發(fā)音信息與所述英文數(shù)據(jù)通過(guò)所述中文語(yǔ)音信息相映射。具體地,在步驟S304中,模型訓(xùn)練設(shè)備1根據(jù)在步驟S303中所識(shí)別獲得的發(fā)音信息,確定該英文語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的英文數(shù)據(jù),如根據(jù)發(fā)音信息“aa ai4 fengl”,確定該發(fā)音信息對(duì)應(yīng)的英文數(shù)據(jù)為“iphone”,再將該發(fā)音信息與該英文數(shù)據(jù)的映射關(guān)系存入英文語(yǔ)音模型,以實(shí)現(xiàn)對(duì)該英文語(yǔ)音模型的建立或更新,其中,該發(fā)音信息與該英文數(shù)據(jù)通過(guò)該中文語(yǔ)音信息相映射。
[0069]在此,英文數(shù)據(jù)為一具體的英文單詞,如“iphone”等,而英文語(yǔ)音數(shù)據(jù)為該具體的英文單詞所對(duì)應(yīng)的語(yǔ)音數(shù)據(jù),如“iphone”所對(duì)應(yīng)的語(yǔ)音數(shù)據(jù),通過(guò)語(yǔ)音獲取裝置101所獲取。
[0070]本領(lǐng)域技術(shù)人員應(yīng)能理解上述建立或更新英文語(yǔ)音模型的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的建立或更新英文語(yǔ)音模型的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。
[0071]在此,本發(fā)明在原有中文聲學(xué)模型基礎(chǔ)上,利用相似的中文語(yǔ)音信息,對(duì)英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與該英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的發(fā)音信息,實(shí)現(xiàn)對(duì)英文語(yǔ)音模型的建立或更新,有效地控制了英文語(yǔ)音模型的規(guī)模。
[0072]優(yōu)選地,模型訓(xùn)練設(shè)備1的各個(gè)步驟之間是持續(xù)不斷工作的。具體地,在步驟S301中,模型訓(xùn)練設(shè)備1獲取用戶通過(guò)語(yǔ)音采集裝置輸入的語(yǔ)音數(shù)據(jù);在步驟S302中,模型訓(xùn)練設(shè)備1判斷所述語(yǔ)音數(shù)據(jù)是否為英文語(yǔ)音數(shù)據(jù);在步驟S303中,模型訓(xùn)練設(shè)備1當(dāng)所述語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),根據(jù)中文語(yǔ)音信息,對(duì)所述英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與所述英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的發(fā)音信息;在步驟S304中,模型訓(xùn)練設(shè)備1根據(jù)所述發(fā)音信息,確定所述英文語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的英文數(shù)據(jù),以建立或更新英文語(yǔ)音模型,其中,所述發(fā)音信息與所述英文數(shù)據(jù)通過(guò)所述中文語(yǔ)音信息相映射。在此,本領(lǐng)域技術(shù)人員應(yīng)理解“持續(xù)”是指模型訓(xùn)練設(shè)備1的各步驟分別不斷地進(jìn)行語(yǔ)音數(shù)據(jù)的獲取、英文語(yǔ)音數(shù)據(jù)的判斷、英文語(yǔ)音數(shù)據(jù)的識(shí)別處理及英文語(yǔ)音模型的建立或更新,直至該模型訓(xùn)練設(shè)備1在較長(zhǎng)時(shí)間內(nèi)停止獲取語(yǔ)音數(shù)據(jù)。[0073]優(yōu)選地,在步驟S303中,模型訓(xùn)練設(shè)備1當(dāng)所述語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),根據(jù)單詞模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)所述英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與所述英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的單詞發(fā)音信息。具體地,當(dāng)在步驟S302中,模型訓(xùn)練設(shè)備1判斷在步驟S301中所獲取的語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),在步驟S303中,模型訓(xùn)練設(shè)備1采用單詞模型所對(duì)應(yīng)的中文語(yǔ)音信息,如“aa ai4 f engl”等,對(duì)所述英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,如強(qiáng)制對(duì)齊處理,采用所有可能的中文聲韻母信息,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行強(qiáng)制對(duì)齊,以獲得與所述英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的單詞發(fā)音信息。
[0074]在此,該單詞模型中存儲(chǔ)有大量單詞所對(duì)應(yīng)的中文語(yǔ)音信息,該單詞模型可以位于模型訓(xùn)練設(shè)備1中,或者位于與該模型訓(xùn)練設(shè)備1通過(guò)網(wǎng)絡(luò)相連接的第三方設(shè)備中。
[0075]優(yōu)選地,在步驟S303中,模型訓(xùn)練設(shè)備1當(dāng)所述語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),根據(jù)字母模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)所述英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與所述英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的字母發(fā)音信息。具體地,當(dāng)在步驟S302中,模型訓(xùn)練設(shè)備1判斷在步驟S301中所獲取的語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),在步驟S303中,模型訓(xùn)練設(shè)備1根據(jù)字母模型所對(duì)應(yīng)的中文語(yǔ)音信息,如二十六個(gè)英文字母所對(duì)應(yīng)的中文語(yǔ)音信息,如字母“a”對(duì)應(yīng)的中文語(yǔ)音信息“aa eil”、字母“b”對(duì)應(yīng)的中文語(yǔ)音信息“b i4”、字母“c”對(duì)應(yīng)的中文語(yǔ)音信息“s ei4”等,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與該英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的字母發(fā)音信息。
[0076]優(yōu)選地,在步驟S303中,模型訓(xùn)練設(shè)備1對(duì)于在步驟S302中判斷為英文語(yǔ)音數(shù)據(jù)為語(yǔ)音數(shù)據(jù),優(yōu)先采用單詞模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,當(dāng)在步驟S303中,模型訓(xùn)練設(shè)備1采用單詞模型無(wú)法識(shí)別出該英文語(yǔ)音數(shù)據(jù)的發(fā)音信息時(shí),再采用字母模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與該英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的字母發(fā)音信息。相似地,在步驟S303中,模型訓(xùn)練設(shè)備1也可以優(yōu)先采用字母模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,當(dāng)在步驟S303中,模型訓(xùn)練設(shè)備1采用字母模型無(wú)法識(shí)別出該英文語(yǔ)音數(shù)據(jù)的發(fā)音信息時(shí),再采用單詞模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與該英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的單詞發(fā)音信息。在此,優(yōu)先采用單詞模型還是優(yōu)先采用字母模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,可以是該模型訓(xùn)練設(shè)備1預(yù)先設(shè)定的,也可以應(yīng)事件而進(jìn)行調(diào)整。
[0077]例如,對(duì)于在步驟S301中,模型訓(xùn)練設(shè)備1所獲取的語(yǔ)音數(shù)據(jù)“iphone”,在步驟S302中,模型訓(xùn)練設(shè)備1判斷該語(yǔ)音數(shù)據(jù)“iphone”為英文語(yǔ)音數(shù)據(jù),在步驟S303中,模型訓(xùn)練設(shè)備1優(yōu)先采用單詞模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,但無(wú)法識(shí)別出該英文語(yǔ)音數(shù)據(jù)的發(fā)音信息;隨后,在步驟S301中,模型訓(xùn)練設(shè)備1再采用字母模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,獲得與該英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的字母發(fā)音信息“aa ai4 p i4 ei2 ch oo oul ee enl ii i4”,則可知在步驟S301中所獲取的語(yǔ)音數(shù)據(jù)為按字母讀的“iphone”,即,“1、p、h、ο、n、e”。
[0078]更優(yōu)選地,在步驟S303中,模型訓(xùn)練設(shè)備1分別采用單詞模型所對(duì)應(yīng)的中文語(yǔ)音信息、字母模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)該英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,并分別對(duì)語(yǔ)音識(shí)別處理所獲得的結(jié)果進(jìn)行打分,確定打分較高的發(fā)音信息為該英文語(yǔ)音數(shù)據(jù)的發(fā)音信肩、Ο[0079]在此,由于用戶在輸入英文單詞時(shí)有時(shí)按單詞讀有時(shí)按字母讀,本發(fā)明對(duì)每個(gè)需要識(shí)別的英文單詞,利用相似的單詞模型對(duì)應(yīng)的中文語(yǔ)音信息、字母模型對(duì)應(yīng)的中文語(yǔ)音信息,確定其對(duì)應(yīng)的發(fā)音信息,提升了語(yǔ)音識(shí)別的準(zhǔn)確性。
[0080]在一優(yōu)選實(shí)施例中,該方法還包括步驟S308(未示出)。在步驟S308中,模型訓(xùn)練設(shè)備1統(tǒng)計(jì)所述英文數(shù)據(jù)所對(duì)應(yīng)的英文語(yǔ)音數(shù)據(jù)在所述語(yǔ)音數(shù)據(jù)中的出現(xiàn)次數(shù);根據(jù)所述出現(xiàn)次數(shù),并結(jié)合所述語(yǔ)音數(shù)據(jù)的數(shù)量信息,確定所述英文數(shù)據(jù)的概率值;根據(jù)所述概率值,更新所述英文語(yǔ)音模型。具體地,當(dāng)大量用戶通過(guò)語(yǔ)音采集裝置輸入語(yǔ)音數(shù)據(jù),其中,多個(gè)用戶所輸入的英文語(yǔ)音數(shù)據(jù)為相同的英文語(yǔ)音數(shù)據(jù),在步驟S301中,模型訓(xùn)練設(shè)備1獲取該大量用戶輸入的大量語(yǔ)音數(shù)據(jù);在步驟S302中,模型訓(xùn)練設(shè)備1判斷該大量語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù);隨后,在步驟S303中,模型訓(xùn)練設(shè)備1根據(jù)中文語(yǔ)音信息,對(duì)該大量英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與該大量英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的發(fā)音信息,在此,由于該多個(gè)用戶輸入的為相同的英文語(yǔ)音數(shù)據(jù),因此,在步驟S303中,模型訓(xùn)練設(shè)備1所獲得的關(guān)于該多個(gè)用戶輸入的英文語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的發(fā)音信息相同或相似;接著,在步驟S304中,模型訓(xùn)練設(shè)備1根據(jù)該多個(gè)相同或相似的發(fā)音信息,確定該多個(gè)英文語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的相同的英文數(shù)據(jù);在步驟S308中,模型訓(xùn)練設(shè)備1統(tǒng)計(jì)該相同的英文數(shù)據(jù)所對(duì)應(yīng)的英文語(yǔ)音數(shù)據(jù)在該語(yǔ)音數(shù)據(jù)中的出現(xiàn)次數(shù);接著,在步驟S308中,模型訓(xùn)練設(shè)備1再根據(jù)該英文語(yǔ)音數(shù)據(jù)的出現(xiàn)次數(shù),并結(jié)合該語(yǔ)音數(shù)據(jù)的數(shù)量信息,確定該英文數(shù)據(jù)的概率值,如將該出現(xiàn)次數(shù)除以該大量語(yǔ)音數(shù)據(jù)的數(shù)量信息,獲得該英文數(shù)據(jù)的概率值;該在步驟S308中,模型訓(xùn)練設(shè)備1再將該英文數(shù)據(jù)及其對(duì)應(yīng)的概率值存入該英文語(yǔ)音模型中,以實(shí)現(xiàn)對(duì)該英文語(yǔ)音模型的更新。
[0081]優(yōu)選地,該方法還包括步驟S309(未示出)和步驟S310(未示出)。在步驟S309中,當(dāng)所述出現(xiàn)次數(shù)大于預(yù)定數(shù)量閾值,模型訓(xùn)練設(shè)備1自所述英文語(yǔ)音模型中提取所述英文數(shù)據(jù)與所述英文語(yǔ)音數(shù)據(jù);在步驟S310中,模型訓(xùn)練設(shè)備1根據(jù)所述英文數(shù)據(jù)與所述英文語(yǔ)音數(shù)據(jù)的映射關(guān)系,建立或更新與所述英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的英文語(yǔ)音單元。具體地,該模型訓(xùn)練設(shè)備1可以設(shè)置一個(gè)預(yù)定數(shù)量閾值,該預(yù)定數(shù)量閾值用來(lái)判斷英文數(shù)據(jù)所對(duì)應(yīng)的英文語(yǔ)音數(shù)據(jù)在該語(yǔ)音數(shù)據(jù)中的出現(xiàn)次數(shù)是否超過(guò)該值,當(dāng)該出現(xiàn)次數(shù)大于該預(yù)定數(shù)量閾值時(shí),在步驟S309中,模型訓(xùn)練設(shè)備1自該英文語(yǔ)音模型中提取該英文數(shù)據(jù)與該英文語(yǔ)音數(shù)據(jù);在步驟S310中,模型訓(xùn)練設(shè)備1根據(jù)該英文數(shù)據(jù)與該英文語(yǔ)音數(shù)據(jù)的映射關(guān)系,為該英文語(yǔ)音數(shù)據(jù)新建一個(gè)英文語(yǔ)音單元,以實(shí)現(xiàn)對(duì)該英文語(yǔ)音單元的建立或更新。
[0082]更優(yōu)選地,在步驟S310中,模型訓(xùn)練設(shè)備1根據(jù)所述英文數(shù)據(jù)與所述英文語(yǔ)音數(shù)據(jù)的映射關(guān)系,采用插值計(jì)算方法,建立或更新所述英文語(yǔ)音單元。具體地,在步驟S310中,模型訓(xùn)練設(shè)備1根據(jù)該英文數(shù)據(jù)與該英文語(yǔ)音數(shù)據(jù)的映射關(guān)系,為該英文數(shù)據(jù)新建一英文語(yǔ)音單元,再例如通過(guò)將該中文發(fā)音信息所對(duì)應(yīng)的中文語(yǔ)音單元的模型參數(shù)復(fù)制給該英文語(yǔ)音單元,然后在英文數(shù)據(jù)上對(duì)齊,得到統(tǒng)計(jì)量,再與該復(fù)制所獲得的參數(shù)進(jìn)行插值計(jì)算,以實(shí)現(xiàn)對(duì)該英文語(yǔ)音單元的建立或更新。在此,所述中文語(yǔ)音單元包括為每個(gè)中文發(fā)音信息,如中文聲母或韻母信息所建立的發(fā)音單元,如“s”、“ei4”等中文聲韻母信息所對(duì)應(yīng)的中文語(yǔ)音單元。
[0083]更優(yōu)選地,該方法還包括步驟S311 (未示出)。在步驟S311中,模型訓(xùn)練設(shè)備1根據(jù)所述英文語(yǔ)音數(shù)據(jù)及與該英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的發(fā)音信息,更新所述英文語(yǔ)音單元。具體地,在步驟S310中,模型訓(xùn)練設(shè)備1為英文數(shù)據(jù)新建一英文語(yǔ)音單元之后,在步驟S311中,模型訓(xùn)練設(shè)備1不斷地根據(jù)用戶輸入的英文語(yǔ)音數(shù)據(jù),及由在步驟S303中識(shí)別所獲得的與該英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的發(fā)音信息,訓(xùn)練該英文語(yǔ)音單元。
[0084]在此,本發(fā)明對(duì)出現(xiàn)此處大于預(yù)定閾值的英文語(yǔ)音數(shù)據(jù),為該英文語(yǔ)音數(shù)據(jù)及英文數(shù)據(jù)新建英文語(yǔ)音單元,并對(duì)該英文語(yǔ)音單元不斷地進(jìn)行訓(xùn)練,以進(jìn)一步提升該英文語(yǔ)音數(shù)據(jù)的發(fā)音信息的準(zhǔn)確性。
[0085]圖4示出根據(jù)本發(fā)明一個(gè)優(yōu)選實(shí)施例的用于基于中文語(yǔ)音信息訓(xùn)練英文語(yǔ)音模型的方法流程圖。以下參照?qǐng)D4對(duì)該優(yōu)選實(shí)施例進(jìn)行詳細(xì)描述:具體地,在步驟S401中,模型訓(xùn)練設(shè)備1獲取用戶通過(guò)語(yǔ)音采集裝置輸入的語(yǔ)音數(shù)據(jù);在步驟S402中,模型訓(xùn)練設(shè)備1判斷所述語(yǔ)音數(shù)據(jù)是否為英文語(yǔ)音數(shù)據(jù);在步驟S403中,模型訓(xùn)練設(shè)備1當(dāng)所述語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),根據(jù)中文語(yǔ)音信息,對(duì)所述英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與所述英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的發(fā)音信息;在步驟S404中,模型訓(xùn)練設(shè)備1根據(jù)所述發(fā)音信息,確定所述英文語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的英文數(shù)據(jù),以建立或更新英文語(yǔ)音模型,其中,所述發(fā)音信息與所述英文數(shù)據(jù)通過(guò)所述中文語(yǔ)音信息相映射;在步驟S405中,模型訓(xùn)練設(shè)備1獲取所述用戶為目標(biāo)應(yīng)用輸入的單詞語(yǔ)音序列;在步驟S406中,模型訓(xùn)練設(shè)備1根據(jù)所述英文語(yǔ)音模型,確定與所述單詞語(yǔ)音序列相對(duì)應(yīng)的英文字符序列;在步驟S407中,模型訓(xùn)練設(shè)備1將與所述英文字符序列相對(duì)應(yīng)的信息提供給所述用戶。其中,步驟S401-S404與圖3所示對(duì)應(yīng)步驟相同或相似,故此處不再贅述,并通過(guò)引用的方式包含于此。
[0086]在步驟S405中,模型訓(xùn)練設(shè)備1獲取所述用戶為目標(biāo)應(yīng)用輸入的單詞語(yǔ)音序列。具體地,用戶例如通過(guò)與用戶設(shè)備的語(yǔ)音采集裝置的交互,在目標(biāo)應(yīng)用中輸入單詞語(yǔ)音序列,在步驟S405中,模型訓(xùn)練設(shè)備1例如通過(guò)調(diào)用該用戶設(shè)備所提供的應(yīng)用程序接口(API)等方式,獲取該用戶為目標(biāo)應(yīng)用所輸入的單詞語(yǔ)音序列。
[0087]在步驟S406中,模型訓(xùn)練設(shè)備1根據(jù)所述英文語(yǔ)音模型,確定與所述單詞語(yǔ)音序列相對(duì)應(yīng)的英文字符序列。具體地,在步驟S406中,模型訓(xùn)練設(shè)備1根據(jù)在步驟S405中所獲取的單詞語(yǔ)音序列,通過(guò)語(yǔ)音識(shí)別處理,確定該單詞語(yǔ)音序列的發(fā)音信息,進(jìn)而,根據(jù)該發(fā)音信息,在該英文語(yǔ)音模型中進(jìn)行匹配查詢,確定與該單詞語(yǔ)音序列相對(duì)應(yīng)的英文字符序列。例如,用戶通過(guò)與用戶設(shè)備的語(yǔ)音采集裝置的交互,輸入了單詞語(yǔ)音序列“iphone”,在步驟S405中,模型訓(xùn)練設(shè)備1例如通過(guò)調(diào)用該用戶設(shè)備所提供的應(yīng)用程序接口(API)等方式,獲取了該用戶輸入的單詞語(yǔ)音序列“iphone”;隨后,在步驟S406中,模型訓(xùn)練設(shè)備1根據(jù)該單詞語(yǔ)音序列“iphone”,通過(guò)語(yǔ)音識(shí)別處理,確定該單詞語(yǔ)音序列的發(fā)音信息“aaai4 f engl”,進(jìn)而,根據(jù)該發(fā)音信息,在該英文語(yǔ)音模型中進(jìn)行匹配查詢,確定與該單詞語(yǔ)音序列相對(duì)應(yīng)的英文字符序列“iphone”。
[0088]在步驟S407中,模型訓(xùn)練設(shè)備1將與所述英文字符序列相對(duì)應(yīng)的信息提供給所述用戶。例如,當(dāng)該目標(biāo)應(yīng)用為語(yǔ)音輸入應(yīng)用,在步驟S407中,模型訓(xùn)練設(shè)備1通過(guò)調(diào)用諸如JSP、ASP或PHP等動(dòng)態(tài)網(wǎng)頁(yè)技術(shù),將該英文字符序列作為語(yǔ)音輸入候選詞條提供給該用戶;當(dāng)該目標(biāo)應(yīng)用為語(yǔ)音搜索應(yīng)用;在步驟S407中,模型訓(xùn)練設(shè)備1通過(guò)調(diào)用諸如JSP、ASP或PHP等動(dòng)態(tài)網(wǎng)頁(yè)技術(shù),將根據(jù)該英文字符序列搜索獲得的一個(gè)或多個(gè)搜索結(jié)果提供給該用戶。
[0089]優(yōu)選地,該目標(biāo)應(yīng)用為語(yǔ)音輸入應(yīng)用;其中,在步驟S407中,模型訓(xùn)練設(shè)備1將所述英文字符序列作為語(yǔ)音輸入候選詞條提供給所述用戶。例如,當(dāng)該目標(biāo)應(yīng)用為語(yǔ)音輸入應(yīng)用,用戶通過(guò)與用戶設(shè)備的語(yǔ)音采集裝置的交互,在語(yǔ)音輸入應(yīng)用中輸入了單詞語(yǔ)音序列“iphone”,在步驟S405中,模型訓(xùn)練設(shè)備1例如通過(guò)調(diào)用該用戶設(shè)備所提供的應(yīng)用程序接口(API)等方式,獲取了該用戶輸入的單詞語(yǔ)音序列“iphone”;隨后,在步驟S406中,模型訓(xùn)練設(shè)備1根據(jù)該單詞語(yǔ)音序列“iphone”,通過(guò)語(yǔ)音識(shí)別處理,確定該單詞語(yǔ)音序列的發(fā)音信息“aa ai4 f engl”,進(jìn)而,根據(jù)該發(fā)音信息,在該英文語(yǔ)音模型中進(jìn)行匹配查詢,確定與該單詞語(yǔ)音序列相對(duì)應(yīng)的英文字符序列“ iphone” ;進(jìn)而,在步驟S407中,模型訓(xùn)練設(shè)備1通過(guò)調(diào)用諸如JSP、ASP或PHP等動(dòng)態(tài)網(wǎng)頁(yè)技術(shù),將該英文字符序列“iphone”作為語(yǔ)音輸入候選詞條提供給該用戶,以供該用戶選擇輸入。
[0090]優(yōu)選地,該目標(biāo)應(yīng)用為語(yǔ)音搜索應(yīng)用;其中,該方法還包括步驟S412 (未示出)。在步驟S412中,模型訓(xùn)練設(shè)備1將所述英文字符序列作為所述用戶的查詢序列,獲取與所述查詢序列相對(duì)應(yīng)的一個(gè)或多個(gè)搜索結(jié)果;其中,在步驟S407中,模型訓(xùn)練設(shè)備1將所述一個(gè)或多個(gè)搜索結(jié)果提供給所述用戶。具體地,當(dāng)該目標(biāo)應(yīng)用為語(yǔ)音搜索應(yīng)用,在步驟S406中,模型訓(xùn)練設(shè)備1根據(jù)該英文語(yǔ)音模型,確定與該單詞語(yǔ)音序列相對(duì)應(yīng)的英文字符序列;在步驟S412中,模型訓(xùn)練設(shè)備1根據(jù)在步驟S406中所確定的英文字符序列,將該英文字符序列作為該用戶的查詢序列,進(jìn)行匹配查詢,獲取與該查詢序列相對(duì)應(yīng)的一個(gè)或多個(gè)搜索結(jié)果;隨后,在步驟S407中,模型訓(xùn)練設(shè)備1通過(guò)調(diào)用諸如JSP、ASP或PHP等動(dòng)態(tài)網(wǎng)頁(yè)技術(shù),將該一個(gè)或多個(gè)搜索結(jié)果提供給該用戶。
[0091]例如,當(dāng)該目標(biāo)應(yīng)用為語(yǔ)音搜索應(yīng)用,用戶通過(guò)與用戶設(shè)備的語(yǔ)音采集裝置的交互,在語(yǔ)音輸入應(yīng)用中輸入了單詞語(yǔ)音序列“iphone”,在步驟S405中,模型訓(xùn)練設(shè)備1例如通過(guò)調(diào)用該用戶設(shè)備所提供的應(yīng)用程序接口(API)等方式,獲取了該用戶輸入的單詞語(yǔ)音序列“iphone”;隨后,在步驟S406中,模型訓(xùn)練設(shè)備1根據(jù)該單詞語(yǔ)音序列“ iphone”,通過(guò)語(yǔ)音識(shí)別處理,確定該單詞語(yǔ)音序列的發(fā)音信息“aa ai4 f engl”,進(jìn)而,根據(jù)該發(fā)音信息,在該英文語(yǔ)音模型中進(jìn)行匹配查詢,確定與該單詞語(yǔ)音序列相對(duì)應(yīng)的英文字符序列“iphone” ;進(jìn)而,在步驟S412中,模型訓(xùn)練設(shè)備1根據(jù)在步驟S406中所確定的英文字符序列,將該英文字符序列“iphone”作為該用戶的查詢序列,進(jìn)行匹配查詢,獲取與該查詢序列相對(duì)應(yīng)的一個(gè)或多個(gè)搜索結(jié)果;隨后,在步驟S407中,模型訓(xùn)練設(shè)備1通過(guò)調(diào)用諸如JSP、ASP或PHP等動(dòng)態(tài)網(wǎng)頁(yè)技術(shù),將與該英文字符序列“iphone”相對(duì)應(yīng)的一個(gè)或多個(gè)搜索結(jié)果提供給該用戶,供該用戶瀏覽。
[0092]更優(yōu)選地,在步驟S405中,模型訓(xùn)練設(shè)備1獲取所述用戶為目標(biāo)應(yīng)用輸入的字母語(yǔ)音序列;其中,在步驟S406中,模型訓(xùn)練設(shè)備1根據(jù)所述英文語(yǔ)音模型,確定與所述字母語(yǔ)音序列相對(duì)應(yīng)的英文字符序列。具體地,用戶例如通過(guò)與用戶設(shè)備的語(yǔ)音采集裝置的交互,在目標(biāo)應(yīng)用中輸入字母語(yǔ)音序列,在步驟S405中,模型訓(xùn)練設(shè)備1例如通過(guò)調(diào)用該用戶設(shè)備所提供的應(yīng)用程序接口(API)等方式,獲取該用戶為目標(biāo)應(yīng)用所輸入的字母語(yǔ)音序列;隨后,在步驟S406中,模型訓(xùn)練設(shè)備1根據(jù)在步驟S405中所獲取的字母語(yǔ)音序列,通過(guò)語(yǔ)音識(shí)別處理,確定該字母語(yǔ)音序列的發(fā)音信息,進(jìn)而,根據(jù)該發(fā)音信息,在該英文語(yǔ)音模型中進(jìn)行匹配查詢,確定與該字母語(yǔ)音序列相對(duì)應(yīng)的英文字符序列。例如,用戶通過(guò)與用戶設(shè)備的語(yǔ)音采集裝置的交互,輸入了字母語(yǔ)音序列“1、P、h、ο、n、e”,在步驟S405中,模型訓(xùn)練設(shè)備1例如通過(guò)調(diào)用該用戶設(shè)備所提供的應(yīng)用程序接口(API)等方式,獲取了該用戶輸入的字母語(yǔ)音序列“1、P、h、0、n、e” ;隨后,在步驟S406中,模型訓(xùn)練設(shè)備1根據(jù)該字母語(yǔ)音序列“1、P、h、o、n、e”,通過(guò)語(yǔ)音識(shí)別處理,確定該字母語(yǔ)音序列的發(fā)音信息“aa ai4 pi4 ei2 ch oo oul ee enl ii i4”,進(jìn)而,根據(jù)該發(fā)音信息,在該英文語(yǔ)音模型中進(jìn)行匹配查詢,確定與該字母語(yǔ)音序列相對(duì)應(yīng)的英文字符序列“iphone”。
[0093]相似地,在步驟S407中,模型訓(xùn)練設(shè)備1將與該英文字符序列相對(duì)應(yīng)的信息提供給所述用戶。接上例,當(dāng)該目標(biāo)應(yīng)用為語(yǔ)音輸入應(yīng)用,在步驟S407中,模型訓(xùn)練設(shè)備1通過(guò)調(diào)用諸如JSP、ASP或PHP等動(dòng)態(tài)網(wǎng)頁(yè)技術(shù),將該英文字符序列“iphone”作為語(yǔ)音輸入候選詞條提供給該用戶,以供該用戶選擇輸入;當(dāng)該目標(biāo)應(yīng)用為語(yǔ)音搜索應(yīng)用;在步驟S412中,模型訓(xùn)練設(shè)備1根據(jù)在步驟S406中所確定的英文字符序列,將該英文字符序列“iphone”作為該用戶的查詢序列,進(jìn)行匹配查詢,獲取與該查詢序列相對(duì)應(yīng)的一個(gè)或多個(gè)搜索結(jié)果;隨后,在步驟S407中,模型訓(xùn)練設(shè)備1通過(guò)調(diào)用諸如JSP、ASP或PHP等動(dòng)態(tài)網(wǎng)頁(yè)技術(shù),將與該英文字符序列“iphone”相對(duì)應(yīng)的一個(gè)或多個(gè)搜索結(jié)果提供給該用戶,供該用戶瀏覽。
[0094]在此,本發(fā)明還可與語(yǔ)音識(shí)別相結(jié)合,支持用戶以按字母及按單詞兩種方式輸入英文語(yǔ)音序列,提升了用戶的使用體驗(yàn)
[0095]本發(fā)明的軟件程序可以通過(guò)處理器執(zhí)行以實(shí)現(xiàn)上文所述步驟或功能。同樣地,本發(fā)明的軟件程序(包括相關(guān)的數(shù)據(jù)結(jié)構(gòu))可以被存儲(chǔ)到計(jì)算機(jī)可讀記錄介質(zhì)中,例如,RAM存儲(chǔ)器,磁或光驅(qū)動(dòng)器或軟磁盤(pán)及類似設(shè)備。另外,本發(fā)明的一些步驟或功能可采用硬件來(lái)實(shí)現(xiàn),例如,作為與處理器配合從而執(zhí)行各個(gè)功能或步驟的電路。
[0096]另外,本發(fā)明的一部分可被應(yīng)用為計(jì)算機(jī)程序產(chǎn)品,例如計(jì)算機(jī)程序指令,當(dāng)其被計(jì)算機(jī)執(zhí)行時(shí),通過(guò)該計(jì)算機(jī)的操作,可以調(diào)用或提供根據(jù)本發(fā)明的方法和/或技術(shù)方案。而調(diào)用本發(fā)明的方法的程序指令,可能被存儲(chǔ)在固定的或可移動(dòng)的記錄介質(zhì)中,和/或通過(guò)廣播或其他信號(hào)承載媒體中的數(shù)據(jù)流而被傳輸,和/或被存儲(chǔ)在根據(jù)所述程序指令運(yùn)行的計(jì)算機(jī)設(shè)備的工作存儲(chǔ)器中。在此,根據(jù)本發(fā)明的一個(gè)實(shí)施例包括一個(gè)裝置,該裝置包括用于存儲(chǔ)計(jì)算機(jī)程序指令的存儲(chǔ)器和用于執(zhí)行程序指令的處理器,其中,當(dāng)該計(jì)算機(jī)程序指令被該處理器執(zhí)行時(shí),觸發(fā)該裝置運(yùn)行基于前述根據(jù)本發(fā)明的多個(gè)實(shí)施例的方法和/或技術(shù)方案。
[0097]對(duì)于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實(shí)施例的細(xì)節(jié),而且在不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實(shí)現(xiàn)本發(fā)明。因此,無(wú)論從哪一點(diǎn)來(lái)看,均應(yīng)將實(shí)施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán)利要求而不是上述說(shuō)明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化涵括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所涉及的權(quán)利要求。此夕卜,顯然“包括” 一詞不排除其他單元或步驟,單數(shù)不排除復(fù)數(shù)。裝置權(quán)利要求中陳述的多個(gè)單元或裝置也可以由一個(gè)單元或裝置通過(guò)軟件或者硬件來(lái)實(shí)現(xiàn)。第一,第二等詞語(yǔ)用來(lái)表示名稱,而并不表示任何特定的順序。
【權(quán)利要求】
1.一種用于基于中文語(yǔ)音信息訓(xùn)練英文語(yǔ)音模型的方法,其中,該方法包括以下步驟:a獲取用戶通過(guò)語(yǔ)音采集裝置輸入的語(yǔ)音數(shù)據(jù);b判斷所述語(yǔ)音數(shù)據(jù)是否為英文語(yǔ)音數(shù)據(jù);c當(dāng)所述語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),根據(jù)中文語(yǔ)音信息,對(duì)所述英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與所述英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的發(fā)音信息;d根據(jù)所述發(fā)音信息,確定所述英文語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的英文數(shù)據(jù),以建立或更新英文語(yǔ)音模型,其中,所述發(fā)音信息與所述英文數(shù)據(jù)通過(guò)所述中文語(yǔ)音信息相映射。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述步驟c包括:-當(dāng)所述語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),根據(jù)單詞模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)所述英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與所述英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的單詞發(fā)音信息。
3.根據(jù)權(quán)利要求1所述的方法,其中,所述步驟c包括:-當(dāng)所述語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),根據(jù)字母模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)所述英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與所述英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的字母發(fā)音信息。
4.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法,其中,該方法還包括:-統(tǒng)計(jì)所述英文數(shù)據(jù)所對(duì)應(yīng)的英文語(yǔ)音數(shù)據(jù)在所述語(yǔ)音數(shù)據(jù)中的出現(xiàn)次數(shù);-根據(jù)所述出現(xiàn)次數(shù),并結(jié)合所述語(yǔ)音數(shù)據(jù)的數(shù)量信息,確定所述英文數(shù)據(jù)的概率值;-根據(jù)所述概率值,更新所述英文語(yǔ)音模型。
5.根據(jù)權(quán)利要求4所述的方法,其中,該方法還包括:-當(dāng)所述出現(xiàn)次數(shù)大于預(yù)定數(shù)量閾值,自所述英文語(yǔ)音模型中提取所述英文數(shù)據(jù)與所述英文語(yǔ)音數(shù)據(jù);r根據(jù)所述英文數(shù)據(jù)與所述英文語(yǔ)音數(shù)據(jù)的映射關(guān)系,建立或更新與所述英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的英文語(yǔ)音單元。
6.根據(jù)權(quán)利要求5所述的方法,其中,所述步驟r包括:-根據(jù)所述英文數(shù)據(jù)與所述英文語(yǔ)音數(shù)據(jù)的映射關(guān)系,采用插值計(jì)算方法,建立或更新所述英文語(yǔ)音單元。
7.根據(jù)權(quán)利要求5或6所述的方法,其中,該方法還包括:-根據(jù)所述英文語(yǔ)音數(shù)據(jù)及與該英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的發(fā)音信息,更新所述英文語(yǔ)音單元。
8.根據(jù)權(quán)利要求1至7中任一項(xiàng)所述的方法,其中,該方法還包括:X獲取所述用戶為目標(biāo)應(yīng)用輸入的單詞語(yǔ)音序列;y根據(jù)所述英文語(yǔ)音模型,確定與所述單詞語(yǔ)音序列相對(duì)應(yīng)的英文字符序列;Z將與所述英文字符序列相對(duì)應(yīng)的信息提供給所述用戶。
9.根據(jù)權(quán)利要求8所述的方法,其中,所述目標(biāo)應(yīng)用為語(yǔ)音輸入應(yīng)用;其中,所述步驟z包括:-將所述英文字符序列作為語(yǔ)音輸入候選詞條提供給所述用戶。
10.根據(jù)權(quán)利要求8所述的方法,其中,所述目標(biāo)應(yīng)用為語(yǔ)音搜索應(yīng)用;其中,該方法還包括:-將所述英文字符序列作為所述用戶的查詢序列,獲取與所述查詢序列相對(duì)應(yīng)的一個(gè)或多個(gè)搜索結(jié)果;其中,所述步驟Z包括:-將所述一個(gè)或多個(gè)搜索結(jié)果提供給所述用戶。
11.根據(jù)權(quán)利要求8至10中任一項(xiàng)所述的方法,其中,所述步驟X包括:-獲取所述用戶為目標(biāo)應(yīng)用輸入的字母語(yǔ)音序列;其中,所述步驟y包括:-根據(jù)所述英文語(yǔ)音模型,確定與所述字母語(yǔ)音序列相對(duì)應(yīng)的英文字符序列。
12.一種用于基于中文語(yǔ)音信息訓(xùn)練英文語(yǔ)音模型的模型訓(xùn)練設(shè)備,其中,該設(shè)備包括:語(yǔ)音獲取裝置,用于獲取用戶通過(guò)語(yǔ)音采集裝置輸入的語(yǔ)音數(shù)據(jù);英文判斷裝置,用于判斷所述語(yǔ)音數(shù)據(jù)是否為英文語(yǔ)音數(shù)據(jù);語(yǔ)音識(shí)別裝置,用于當(dāng)所述語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),根據(jù)中文語(yǔ)音信息,對(duì)所述英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與所述英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的發(fā)音信息;模型訓(xùn)練裝置,用于根 據(jù)所述發(fā)音信息,確定所述英文語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的英文數(shù)據(jù),以建立或更新英文語(yǔ)音模型,其中,所述發(fā)音信息與所述英文數(shù)據(jù)通過(guò)所述中文語(yǔ)音信息相映射。
13.根據(jù)權(quán)利要求12所述的模型訓(xùn)練設(shè)備,其中,所述語(yǔ)音識(shí)別裝置用于:-當(dāng)所述語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),根據(jù)單詞模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)所述英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與所述英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的單詞發(fā)音信息。
14.根據(jù)權(quán)利要求12所述的模型訓(xùn)練設(shè)備,其中,所述語(yǔ)音識(shí)別裝置用于:-當(dāng)所述語(yǔ)音數(shù)據(jù)為英文語(yǔ)音數(shù)據(jù),根據(jù)字母模型所對(duì)應(yīng)的中文語(yǔ)音信息,對(duì)所述英文語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別處理,以獲得與所述英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的字母發(fā)音信息。
15.根據(jù)權(quán)利要求12至14中任一項(xiàng)所述的模型訓(xùn)練設(shè)備,其中,該設(shè)備還包括模型更新裝置,用于:-統(tǒng)計(jì)所述英文數(shù)據(jù)所對(duì)應(yīng)的英文語(yǔ)音數(shù)據(jù)在所述語(yǔ)音數(shù)據(jù)中的出現(xiàn)次數(shù);-根據(jù)所述出現(xiàn)次數(shù),并結(jié)合所述語(yǔ)音數(shù)據(jù)的數(shù)量信息,確定所述英文數(shù)據(jù)的概率值;-根據(jù)所述概率值,更新所述英文語(yǔ)音模型。
16.根據(jù)權(quán)利要求15所述的模型訓(xùn)練設(shè)備,其中,該設(shè)備還包括:數(shù)據(jù)提取裝置,用于當(dāng)所述出現(xiàn)次數(shù)大于預(yù)定數(shù)量閾值,自所述英文語(yǔ)音模型中提取所述英文數(shù)據(jù)與所述英文語(yǔ)音數(shù)據(jù);單元訓(xùn)練裝置,用于根據(jù)所述英文數(shù)據(jù)與所述英文語(yǔ)音數(shù)據(jù)的映射關(guān)系,建立或更新與所述英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的英文語(yǔ)音單元。
17.根據(jù)權(quán)利要求16所述的模型訓(xùn)練設(shè)備,其中,所述單元訓(xùn)練裝置用于:-根據(jù)所述英文數(shù)據(jù)與所述英文語(yǔ)音數(shù)據(jù)的映射關(guān)系,采用插值計(jì)算方法,建立或更新所述英文語(yǔ)音單元。
18.根據(jù)權(quán)利要求16或17所述的模型訓(xùn)練設(shè)備,其中,該設(shè)備還包括單元更新裝置,用于:-根據(jù)所述英文語(yǔ)音數(shù)據(jù)及與該英文語(yǔ)音數(shù)據(jù)相對(duì)應(yīng)的發(fā)音信息,更新所述英文語(yǔ)音單元。
19.根據(jù)權(quán)利要求12至18中任一項(xiàng)所述的模型訓(xùn)練設(shè)備,其中,該設(shè)備還包括:序列獲取裝置,用于獲取所述用戶為目標(biāo)應(yīng)用輸入的單詞語(yǔ)音序列;序列確定裝置,用于根據(jù)所述英文語(yǔ)音模型,確定與所述單詞語(yǔ)音序列相對(duì)應(yīng)的英文字符序列;信息提供裝置,用于將與所述英文字符序列相對(duì)應(yīng)的信息提供給所述用戶。
20.根據(jù)權(quán)利要求19所述的模型訓(xùn)練設(shè)備,其中,所述目標(biāo)應(yīng)用為語(yǔ)音輸入應(yīng)用;其中,所述信息提供裝置用于:-將所述英文字符序列作為語(yǔ)音輸入候選詞條提供給所述用戶。
21.根據(jù)權(quán)利要求19所述的模型訓(xùn)練設(shè)備,其中,所述目標(biāo)應(yīng)用為語(yǔ)音搜索應(yīng)用;其中,該設(shè)備還包括:搜索獲取裝置,用于將所述英文字符序列作為所述用戶的查詢序列,獲取與所述查詢序列相對(duì)應(yīng)的一個(gè)或多個(gè)搜索結(jié)果;其中,所述信息提供裝置用于:-將所述一個(gè)或多個(gè)搜索結(jié)果提供給所述用戶。
22.根據(jù)權(quán)利要求19至21中任一項(xiàng)所述的模型訓(xùn)練設(shè)備,其中,所述序列獲取裝置用于:-獲取所述用戶為目標(biāo)應(yīng)用輸入的字母語(yǔ)音序列;其中,所述序列確定裝置用于:-根據(jù)所述英文語(yǔ)音模型,確定與所述字母語(yǔ)音序列相對(duì)應(yīng)的英文字符序列。
【文檔編號(hào)】G10L15/06GK103632668SQ201210299700
【公開(kāi)日】2014年3月12日 申請(qǐng)日期:2012年8月21日 優(yōu)先權(quán)日:2012年8月21日
【發(fā)明者】蘇丹, 萬(wàn)廣魯 申請(qǐng)人:北京百度網(wǎng)訊科技有限公司