專(zhuān)利名稱(chēng):一種交互式語(yǔ)音回復(fù)系統(tǒng)及其檢測(cè)音質(zhì)的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種檢測(cè)音質(zhì)的系統(tǒng)及其方法,特別是指一種交互式語(yǔ)音回復(fù)系統(tǒng)及其利用該系統(tǒng)檢測(cè)音質(zhì)的方法。
背景技術(shù):
隨著電子科技的發(fā)展,語(yǔ)音處理系統(tǒng)已在通訊裝置上提供各式各樣的語(yǔ)音服務(wù),所謂的語(yǔ)音服務(wù)指的是以電話號(hào)碼搭配交互式語(yǔ)音回復(fù)(Interactive Voice Response,IVR)系統(tǒng)來(lái)為撥入的使用者進(jìn)行各項(xiàng)服務(wù)的處理及查詢(xún),例如航空公司的飛航信息或訂位、股票喊價(jià)系統(tǒng)、購(gòu)物、賬目查詢(xún)等。
已知的語(yǔ)音服務(wù)系統(tǒng)請(qǐng)參見(jiàn)圖1,當(dāng)使用者110以行動(dòng)通訊裝置121撥打有提供交互式語(yǔ)音回復(fù)系統(tǒng)140的電話號(hào)碼時(shí),行動(dòng)通訊裝置121會(huì)通過(guò)電磁波與電話服務(wù)中心130建立電信鏈接,并將使用者110的通訊引導(dǎo)到交互式語(yǔ)音回復(fù)系統(tǒng)140,隨之,使用者再按壓行動(dòng)通訊裝置110上一個(gè)按鍵或多個(gè)按鍵與交互式語(yǔ)音回復(fù)系統(tǒng)140進(jìn)行語(yǔ)音應(yīng)答、識(shí)別、接續(xù)、轉(zhuǎn)移等活動(dòng),以達(dá)成使用者110所需求的服務(wù)。所以,交互式語(yǔ)音回復(fù)系統(tǒng)能夠達(dá)到實(shí)時(shí)服務(wù)及節(jié)省使用者的各種開(kāi)銷(xiāo)。由于行動(dòng)通訊裝置非常普及,以上述行動(dòng)通訊裝置為例,當(dāng)然,使用者110同樣可以使用一般的固定電話122來(lái)與電話服務(wù)中心130建立電信鏈接,進(jìn)而得到所需求的服務(wù)。
另外,隨著電子產(chǎn)品提供的娛樂(lè)功能越來(lái)越多,使得人們?cè)谏钪邢硎茉絹?lái)越多樣化的娛樂(lè)活動(dòng),例如唱歌,不過(guò),雖然人們喜歡唱歌,但是,大多數(shù)的人對(duì)歌曲高低音掌握不準(zhǔn),總是會(huì)有該高音的時(shí)候唱不上高音,該低音的時(shí)候唱不上低音,甚至整首歌沒(méi)有幾個(gè)音是正確的,無(wú)法唱出正確的音高,也就是音質(zhì)不準(zhǔn),因此要如何改善自己唱歌的質(zhì)量,使自己唱出正確的高音和低音,已表現(xiàn)出歌唱的實(shí)力是上述人們的經(jīng)常困擾的問(wèn)題。所以,如何能在非常普及的通訊裝置上提供一種能夠增加使用者音質(zhì)的準(zhǔn)確度的功能,成為業(yè)內(nèi)人士一件具有挑戰(zhàn)性的工作。
發(fā)明內(nèi)容
鑒于現(xiàn)有技術(shù)存在的上述問(wèn)題,本發(fā)明的目的在于,提供一種交互式語(yǔ)音回復(fù)系統(tǒng)及其利用該系統(tǒng)檢測(cè)音質(zhì)的方法,通過(guò)交互式語(yǔ)音回復(fù)系統(tǒng)播放聲音數(shù)據(jù),讓使用者重復(fù)聲音數(shù)據(jù),進(jìn)而判斷使用者重復(fù)聲音數(shù)據(jù)而發(fā)出的音高與聲音數(shù)據(jù)的音高是否相同,并響應(yīng)使用者判斷結(jié)果,讓使用者得知自己的音質(zhì)是否準(zhǔn)確,以解決現(xiàn)有技術(shù)所存在的問(wèn)題,達(dá)到讓使用者可以正確的唱出音高的功能。
為了實(shí)現(xiàn)上述任務(wù),本發(fā)明采取如下的技術(shù)解決方案一種交互式語(yǔ)音回復(fù)系統(tǒng),其特征在于,該系統(tǒng)包括一通訊模塊,用于建立與使用者之間的通訊,使得使用者發(fā)出的聲音與交互式語(yǔ)音回復(fù)系統(tǒng)所產(chǎn)生的語(yǔ)音傳至對(duì)方;一播放模塊,用于在通訊模塊建立與使用者之間的通訊后由儲(chǔ)存模塊讀出一組聲音數(shù)據(jù),并且通過(guò)通訊模塊將聲音數(shù)據(jù)播放給使用者收聽(tīng);一接收模塊,用于接收在使用者聽(tīng)到播放模塊所播放的聲音數(shù)據(jù)后重復(fù)聽(tīng)到的聲音數(shù)據(jù)所發(fā)出的語(yǔ)音數(shù)據(jù),并將接收到的語(yǔ)音數(shù)據(jù)存入儲(chǔ)存模塊;一儲(chǔ)存模塊,用于儲(chǔ)存播放模塊播放的聲音數(shù)據(jù)與接收模塊所接收到的語(yǔ)音數(shù)據(jù);一判斷模塊,用于由儲(chǔ)存模塊讀取播放模塊播放的聲音數(shù)據(jù),及讀取由接收模塊接收的語(yǔ)音數(shù)據(jù),并判斷播放模塊播放的聲音數(shù)據(jù)與接收模塊接收的語(yǔ)音數(shù)據(jù)是否有相同的音高,在判斷結(jié)束之后產(chǎn)生判斷結(jié)果給響應(yīng)模塊;一檢測(cè)模塊,用于檢測(cè)與使用者建立通訊時(shí),背景所產(chǎn)生的噪聲的強(qiáng)度,當(dāng)使用者與交互式語(yǔ)音回復(fù)系統(tǒng)建立通訊之后,過(guò)濾使用者所發(fā)出的語(yǔ)音數(shù)據(jù)中的噪聲;一響應(yīng)模塊,用于接收判斷模塊產(chǎn)生的判斷結(jié)果,并把判斷結(jié)果通過(guò)通訊模塊傳遞給使用者;一提示模塊,用于提示使用者進(jìn)行輸入的行為;通訊模塊分別與播放模塊、接收模塊、提示模塊和響應(yīng)模塊連通,接收模塊分別與儲(chǔ)存模塊和檢測(cè)模塊相連,儲(chǔ)存模塊分別與判斷模塊、播放模塊相連,判斷模塊與響應(yīng)模塊相連。
上述利用交互式語(yǔ)音回復(fù)系統(tǒng)檢測(cè)音質(zhì)的方法,其特征在于,包括下列步驟使用者撥號(hào)至交互式語(yǔ)音回復(fù)系統(tǒng),交互式語(yǔ)音回復(fù)系統(tǒng)播放聲音數(shù)據(jù),接收由使用者重復(fù)聲音數(shù)據(jù)所發(fā)出的語(yǔ)音數(shù)據(jù)并儲(chǔ)存,判斷語(yǔ)音數(shù)據(jù)與聲音數(shù)據(jù)是否相同,并產(chǎn)生判斷結(jié)果、交互式語(yǔ)音回復(fù)系統(tǒng)響應(yīng)使用者判斷結(jié)果。
圖1是已知的語(yǔ)音服務(wù)系統(tǒng)示意圖。
圖2是本發(fā)明的交互式語(yǔ)音回復(fù)系統(tǒng)架構(gòu)圖。
圖3是本發(fā)明的利用交互式語(yǔ)音回復(fù)系統(tǒng)檢測(cè)音質(zhì)的方法流程圖。圖中的標(biāo)號(hào)分別表示110、使用者,121、行動(dòng)通訊裝置,122、電話,130、電話服務(wù)中心,140、交互式語(yǔ)音回復(fù)系統(tǒng),210、通訊模塊,220、播放模塊,230、接收模塊,240、儲(chǔ)存模塊,250、判斷模塊,260、響應(yīng)模塊,270、提示模塊,280、檢測(cè)模塊。
以下結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說(shuō)明,以下給出的內(nèi)容足以使熟悉本領(lǐng)域的技術(shù)人員理解本發(fā)明的優(yōu)點(diǎn)并實(shí)施。
具體實(shí)施例方式
參見(jiàn)圖2,該圖給出的是本發(fā)明的交互式語(yǔ)音回復(fù)系統(tǒng)架構(gòu)圖,如圖所示,該系統(tǒng)包括通訊模塊210、播放模塊220、接收模塊230、儲(chǔ)存模塊240、判斷模塊250、響應(yīng)模塊260、提示模塊270,其中通訊模塊210負(fù)責(zé)建立與使用者之間的通訊,使得使用者發(fā)出的聲音與交互式語(yǔ)音回復(fù)系統(tǒng)所產(chǎn)生的語(yǔ)音可傳至對(duì)方;播放模塊220負(fù)責(zé)在通訊模塊210建立與使用者之間的通訊后由儲(chǔ)存模塊240讀出一組聲音數(shù)據(jù),并且通過(guò)通訊模塊210將聲音數(shù)據(jù)播放給使用者收聽(tīng);接收模塊230負(fù)責(zé)接收在使用者聽(tīng)到播放模塊220所播放的聲音數(shù)據(jù)后重復(fù)聽(tīng)到的聲音數(shù)據(jù)所發(fā)出的語(yǔ)音數(shù)據(jù),并將接收到的語(yǔ)音數(shù)據(jù)存入儲(chǔ)存模塊240;儲(chǔ)存模塊240負(fù)責(zé)儲(chǔ)存播放模塊220播放的聲音數(shù)據(jù)與接收模塊230所接收到的語(yǔ)音數(shù)據(jù);判斷模塊250負(fù)責(zé)由儲(chǔ)存模塊240讀取播放模塊220播放的聲音數(shù)據(jù),及讀取由接收模塊230接收的語(yǔ)音數(shù)據(jù),并判斷播放模塊220播放的聲音數(shù)據(jù)與接收模塊230接收的語(yǔ)音數(shù)據(jù)是否有相同的音高,在判斷結(jié)束之后產(chǎn)生判斷結(jié)果給響應(yīng)模塊260;響應(yīng)模塊260負(fù)責(zé)接收判斷模塊產(chǎn)生的判斷結(jié)果,并把判斷結(jié)果通過(guò)通訊模塊210傳遞給使用者;提示模塊270負(fù)責(zé)提示使用者進(jìn)行輸入的行為。
接著以一個(gè)實(shí)施例與來(lái)解釋利用本發(fā)明的交互式語(yǔ)音回復(fù)系統(tǒng)檢測(cè)音質(zhì)的方法,請(qǐng)參照?qǐng)D3,該圖是本發(fā)明利用交互式語(yǔ)音回復(fù)檢測(cè)音質(zhì)系統(tǒng)的方法流程圖。當(dāng)使用者欲使用本發(fā)明的系統(tǒng)檢測(cè)自己的音質(zhì)時(shí),首先要撥電話至交互式語(yǔ)音回復(fù)系統(tǒng),與系統(tǒng)的通訊模塊210建立通訊(步驟310),接著提示模塊270會(huì)播放要出題嘍!在聽(tīng)到聲音后,緊接著會(huì)發(fā)出一嘟聲,并提示“請(qǐng)?jiān)卩铰曋蟀l(fā)出你的聲音”的語(yǔ)音,提示使用者發(fā)出聲音至交互式語(yǔ)音回復(fù)系統(tǒng),接著播放模塊220會(huì)選出一個(gè)聲音數(shù)據(jù),例如以隨機(jī)方式選出(C3),但選出聲音數(shù)據(jù)方式并不以隨機(jī)方式為限,選出的聲音數(shù)據(jù)也不以(C3)為限,于是播放模塊220便會(huì)由儲(chǔ)存模塊240讀出(C3)的聲音數(shù)據(jù),并經(jīng)通訊模塊210至使用者的話筒中發(fā)出(C3)的聲音(步驟340),使用者在聽(tīng)到嘟聲后,可以發(fā)出自認(rèn)為與(C3)相同音高的語(yǔ)音數(shù)據(jù),將語(yǔ)音數(shù)據(jù)輸入到交互式語(yǔ)音回復(fù)系統(tǒng),于是使用者發(fā)出的語(yǔ)音數(shù)據(jù)會(huì)被傳送至接收模塊230,接收模塊230會(huì)把接收到的語(yǔ)音數(shù)據(jù)錄制為數(shù)字?jǐn)?shù)據(jù)的格式,并儲(chǔ)存到儲(chǔ)存模塊240中(步驟350),接著判斷模塊250會(huì)讀出播放模塊220先前播放的聲音數(shù)據(jù),即(C3)與使用者發(fā)出的語(yǔ)音數(shù)據(jù),并判斷使用者發(fā)出的語(yǔ)音數(shù)據(jù)與(C3)的音高是否相同(步驟360),如使用者發(fā)出的語(yǔ)音數(shù)據(jù)為(A2),判斷模塊250會(huì)判斷出與語(yǔ)音數(shù)據(jù)與聲音數(shù)據(jù)的(C3)不同,因此響應(yīng)模塊260播放錯(cuò)誤音效給使用者,使得使用者得知先前所發(fā)出的音高不正確,即自己的音質(zhì)需要加強(qiáng);若使用者所發(fā)出的語(yǔ)音數(shù)據(jù)也是(C3),則響應(yīng)模塊260會(huì)播放正確音效給使用者,使用者即可得知自己先前所發(fā)出的音高是正確的。這樣,利用本發(fā)明的系統(tǒng)可以讓使用者得知自己的音質(zhì)是否準(zhǔn)確,解決無(wú)法唱出正確音高的問(wèn)題。
而系統(tǒng)的響應(yīng)模塊260播放的音高給使用者為響應(yīng)使用者所發(fā)出的音高是否正確,只是本發(fā)明的實(shí)現(xiàn)方式的其中之一,并不以播放音高為限。
在上述的檢測(cè)過(guò)程中,在使用者與交互式語(yǔ)音回復(fù)系統(tǒng)建立通訊(步驟310)之后,交互式語(yǔ)音回復(fù)系統(tǒng)會(huì)先播放歡迎語(yǔ)音,并由提示模塊270播放讓使用者選擇音域類(lèi)別的提示語(yǔ),如“請(qǐng)輸入你的聲音,男聲請(qǐng)按1,女聲或童聲請(qǐng)按2,回主選單請(qǐng)按9,結(jié)束請(qǐng)按0”,提示使用者輸入音域類(lèi)別,使得播放模塊220在播放聲音數(shù)據(jù)(步驟340)時(shí),會(huì)配合使用者的音域類(lèi)別選出比較適合使用者哼唱的聲音數(shù)據(jù)。
此外,在步驟340中,播放的聲音數(shù)據(jù)并不只限于單音,播放模塊220也可以播放連音,例如(D3 E2 F2 A3 C3)的五連音、(C3 F2 D3)的三連音等,連音中的每個(gè)音高都可以是隨機(jī)產(chǎn)生的,如此在判斷使用者的語(yǔ)音數(shù)據(jù)與播放的聲音數(shù)據(jù)的步驟360時(shí),就會(huì)比較連續(xù)的音高是否完全正確。
而為了增加檢測(cè)音質(zhì)的準(zhǔn)確度,本發(fā)明的系統(tǒng)還有負(fù)責(zé)檢測(cè)與使用者建立通訊時(shí),背景所產(chǎn)生的噪聲的強(qiáng)度的檢測(cè)模塊280,在使用者與交互式語(yǔ)音回復(fù)系統(tǒng)建立通訊(步驟310)之后,檢測(cè)模塊280就會(huì)檢測(cè)通訊中的噪聲的強(qiáng)度,并提供判斷模塊250在步驟360中可以過(guò)濾使用者所發(fā)出的語(yǔ)音數(shù)據(jù)中的噪聲,使判斷模塊250不會(huì)因?yàn)樵肼暤母蓴_而誤判。
另外,本發(fā)明也可以提供沒(méi)有提示模塊270的語(yǔ)音互動(dòng)回復(fù)系統(tǒng),也就在使用者建立通訊(步驟310)之后,直接播放(C3)的聲音資料,如此可以減少熟悉本發(fā)明的使用者在與本發(fā)明的系統(tǒng)互動(dòng)時(shí),聽(tīng)取的提示語(yǔ)的時(shí)間。
本發(fā)明為了增加與使用者互動(dòng)的效果,也可以設(shè)計(jì)成闖關(guān)的游戲方式,例如,每進(jìn)行一次游戲需要聽(tīng)取聲音數(shù)據(jù)五次,并哼唱與聲音數(shù)據(jù)相同的音高的語(yǔ)音數(shù)據(jù)五次,也就是重復(fù)步驟340到步驟370五次,每次游戲結(jié)束之后,例如當(dāng)使用者五次全部都正確時(shí),響應(yīng)模塊260可以響應(yīng)使用者(如“音質(zhì)準(zhǔn)確度100%!音質(zhì)這么好,可以考慮當(dāng)歌手”)的響應(yīng),激勵(lì)使用者再次進(jìn)行游戲,而提示模塊270還可以播放“闖下一關(guān)請(qǐng)按1,闖同一關(guān)請(qǐng)按2,回主選單請(qǐng)按9,結(jié)束請(qǐng)按0”的提示語(yǔ)讓使用者可以不斷的進(jìn)行游戲。
本發(fā)明的系統(tǒng)可實(shí)現(xiàn)于硬件、軟件或硬件與軟件之組合中,亦可在計(jì)算機(jī)系統(tǒng)中以集中方式實(shí)現(xiàn)或以不同組件散布于若干互連的計(jì)算機(jī)系統(tǒng)的分散方式實(shí)現(xiàn)。
雖然本發(fā)明以上述較佳的實(shí)施例對(duì)本發(fā)明做出了詳細(xì)的描述,并非用上述實(shí)施例限定本發(fā)明。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)意識(shí)到在不脫離本發(fā)明技術(shù)方案所給出的技術(shù)特征和范圍的情況下,對(duì)技術(shù)特征所作的增加、或以本領(lǐng)域一些同樣內(nèi)容的替換,均應(yīng)屬本發(fā)明的保護(hù)范圍。
權(quán)利要求
1.一種交互式語(yǔ)音回復(fù)系統(tǒng),其特征在于,該系統(tǒng)包括一通訊模塊,用于建立與使用者之間的通訊,使得使用者發(fā)出的聲音與交互式語(yǔ)音回復(fù)系統(tǒng)所產(chǎn)生的語(yǔ)音傳至對(duì)方;一播放模塊,用于在通訊模塊建立與使用者之間的通訊后由儲(chǔ)存模塊讀出一組聲音數(shù)據(jù),并且通過(guò)通訊模塊將聲音數(shù)據(jù)播放給使用者收聽(tīng);一接收模塊,用于接收在使用者聽(tīng)到播放模塊所播放的聲音數(shù)據(jù)后重復(fù)聽(tīng)到的聲音數(shù)據(jù)所發(fā)出的語(yǔ)音數(shù)據(jù),并將接收到的語(yǔ)音數(shù)據(jù)存入儲(chǔ)存模塊;一儲(chǔ)存模塊,用于儲(chǔ)存播放模塊播放的聲音數(shù)據(jù)與接收模塊所接收到的語(yǔ)音數(shù)據(jù);一判斷模塊,用于由儲(chǔ)存模塊讀取播放模塊播放的聲音數(shù)據(jù),及讀取由接收模塊接收的語(yǔ)音數(shù)據(jù),并判斷播放模塊播放的聲音數(shù)據(jù)與接收模塊接收的語(yǔ)音數(shù)據(jù)是否有相同的音高,在判斷結(jié)束之后產(chǎn)生判斷結(jié)果給響應(yīng)模塊;一檢測(cè)模塊,用于檢測(cè)與使用者建立通訊時(shí),背景所產(chǎn)生的噪聲的強(qiáng)度,當(dāng)使用者與交互式語(yǔ)音回復(fù)系統(tǒng)建立通訊之后,過(guò)濾使用者所發(fā)出的語(yǔ)音數(shù)據(jù)中的噪聲;一響應(yīng)模塊,用于接收判斷模塊產(chǎn)生的判斷結(jié)果,并把判斷結(jié)果通過(guò)通訊模塊傳遞給使用者;一提示模塊,用于提示使用者進(jìn)行輸入的行為;通訊模塊分別與播放模塊、接收模塊、提示模塊和響應(yīng)模塊連通,接收模塊分別與儲(chǔ)存模塊和檢測(cè)模塊相連,儲(chǔ)存模塊分別與判斷模塊、播放模塊相連,判斷模塊與響應(yīng)模塊相連。
2.權(quán)利要求1所述的交互式語(yǔ)音回復(fù)系統(tǒng)檢測(cè)音質(zhì)的方法,其特征在于,使用者撥號(hào)至交互式語(yǔ)音回復(fù)系統(tǒng),交互式語(yǔ)音回復(fù)系統(tǒng)播放聲音數(shù)據(jù),接收由使用者重復(fù)聲音數(shù)據(jù)所發(fā)出的語(yǔ)音數(shù)據(jù)并儲(chǔ)存,交互式語(yǔ)音回復(fù)系統(tǒng)判斷語(yǔ)音數(shù)據(jù)與聲音數(shù)據(jù)是否相同,并產(chǎn)生判斷結(jié)果,響應(yīng)使用者判斷結(jié)果。
全文摘要
本發(fā)明公開(kāi)了一種交互式語(yǔ)音回復(fù)(Interactive Voice Response,IVR)系統(tǒng)及其利用該系統(tǒng)檢測(cè)音質(zhì)的方法,由使用者撥號(hào)到交互式語(yǔ)音回復(fù)系統(tǒng),接著交互式語(yǔ)音回復(fù)系統(tǒng)會(huì)播放聲音數(shù)據(jù),使用者重復(fù)所聽(tīng)到的聲音數(shù)據(jù),交互式語(yǔ)音回復(fù)系統(tǒng)在接收到由使用者發(fā)出的語(yǔ)音數(shù)據(jù)后,會(huì)儲(chǔ)存語(yǔ)音數(shù)據(jù)并判斷接收到的語(yǔ)音數(shù)據(jù)是否與使用者聽(tīng)到的聲音數(shù)據(jù)相同,并響應(yīng)使用者判斷后的判斷結(jié)果。
文檔編號(hào)H04M3/42GK101068275SQ20071001802
公開(kāi)日2007年11月7日 申請(qǐng)日期2007年6月8日 優(yōu)先權(quán)日2007年6月8日
發(fā)明者林華真, 陳淮琰 申請(qǐng)人:無(wú)敵科技(西安)有限公司