欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

語(yǔ)音辨識(shí)方法及系統(tǒng)的制作方法

文檔序號(hào):2821273閱讀:251來(lái)源:國(guó)知局
專利名稱:語(yǔ)音辨識(shí)方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種語(yǔ)音辨識(shí)方法及系統(tǒng),尤其是指一種可確認(rèn)或更正辨識(shí)結(jié)果的語(yǔ)音辨識(shí)方法及系統(tǒng)。
(2)背景技術(shù)語(yǔ)音辨識(shí)的結(jié)果常常包含部分的錯(cuò)誤,處理這些錯(cuò)誤的方法,除了重新輸入外,往往是一個(gè)一個(gè)地采用語(yǔ)音辨識(shí)的方法來(lái)進(jìn)行確認(rèn),如此一來(lái),除了花費(fèi)大量的時(shí)間于確認(rèn)及更正的對(duì)話過(guò)程外,以不能保證正確的語(yǔ)音辨識(shí)來(lái)進(jìn)行確認(rèn),更是容易造成其他的錯(cuò)誤,而導(dǎo)致對(duì)話過(guò)程的發(fā)散。
請(qǐng)參閱圖1,其系習(xí)知語(yǔ)音辨識(shí)方法的流程圖。
步驟11,首先,系統(tǒng)對(duì)使用者進(jìn)行提問(wèn)。
步驟12,而使用者在接收系統(tǒng)提問(wèn)后即進(jìn)行語(yǔ)音輸入。
步驟13,接著,系統(tǒng)會(huì)對(duì)使用者所輸入的語(yǔ)音進(jìn)行辨識(shí)。
步驟14,判斷辨識(shí)結(jié)果是否正確,當(dāng)辨識(shí)結(jié)果不正確時(shí),則跳回步驟12,以重新進(jìn)行語(yǔ)音輸入。
步驟15,當(dāng)辨識(shí)結(jié)果正確時(shí),系統(tǒng)會(huì)將該辨識(shí)結(jié)果作為已知值,并將已知值儲(chǔ)存于一儲(chǔ)存裝置中,例如一暫存器。
步驟16,最后,系統(tǒng)會(huì)判定已知值是否充足,當(dāng)已知值充足時(shí),結(jié)束該流程;而當(dāng)已知值不充足時(shí),則跳回步驟11,以重新進(jìn)行系統(tǒng)提問(wèn)。
圖1系為現(xiàn)行的語(yǔ)音辨識(shí)方法的流程,然而,其又分為有顯示介面與無(wú)顯示介面兩種。
沒(méi)有顯示介面時(shí),在系統(tǒng)提問(wèn)(步驟11)時(shí),乃是由系統(tǒng)利用語(yǔ)音的方式來(lái)提問(wèn),除了可能因?yàn)槭褂谜呗?tīng)錯(cuò)而造成錯(cuò)誤外,語(yǔ)音提問(wèn)所需的時(shí)間是超過(guò)使用顯示介面的。此外,在判斷辨識(shí)結(jié)果是否正確時(shí),同樣沒(méi)有顯示的介面,除了上述問(wèn)題外,如果系統(tǒng)容許使用者同時(shí)輸入一個(gè)以上的值,而在辨識(shí)時(shí)發(fā)生部分結(jié)果誤判的情況,使用者除了以全部重講一次的方法進(jìn)行更正之外,只能以語(yǔ)音指定的方法來(lái)進(jìn)行修改,例如,《歌名不是愛(ài)像大海,而是愛(ài)如潮水》。這兩個(gè)方法除了耗時(shí)之外,尚不能保證一定正確,因此往往造成對(duì)話的發(fā)散,使得整個(gè)對(duì)話無(wú)法完成。
有顯示介面時(shí),在顯示介面的幫助下,系統(tǒng)不再只能依靠語(yǔ)音介面,因此可以避免語(yǔ)音介面的延遲和不準(zhǔn)確性。但是在語(yǔ)音辨識(shí)發(fā)生錯(cuò)誤時(shí),使用者雖然能夠清楚的分辨出錯(cuò)誤所在,但是仍然只能依靠語(yǔ)音辨識(shí)的介面來(lái)進(jìn)行更正,此缺點(diǎn)和沒(méi)有顯示介面的語(yǔ)音辨識(shí)系統(tǒng)是完全相同的。
此外,先進(jìn)的電子影音資料儲(chǔ)存及播放裝置日新月異,儲(chǔ)存的資料或觀看收聽(tīng)的節(jié)目越來(lái)越多,因而查詢檢索的使用越來(lái)越困難。
目前常見(jiàn)的裝置上的資料或節(jié)目檢索搜尋方法,以按鍵式的選單檢索方式為主,包含直接在裝置上用按鍵輸入,或是利用遙控器上的按鍵輸入。例如,錄音機(jī)或電視機(jī)的功能控制,或是選臺(tái)控制。由于受限于按鍵的數(shù)目有限,常常需要階層選單式的屏幕顯示介面作為輔助,選單的復(fù)雜階層也常令使用者感到步驟繁瑣冗長(zhǎng),不夠有效率。
越來(lái)越小且越來(lái)越聰明的電子消費(fèi)裝置,如雨后春筍的速度冒出頭來(lái)。一臺(tái)個(gè)人數(shù)位助理(Personal Digital Assistant,PDA)可以紀(jì)錄許多個(gè)人的資料,例如名片電話地址、個(gè)人行事簡(jiǎn)歷、個(gè)人記事本、MP3個(gè)人收錄音樂(lè)、收音機(jī)選臺(tái)等等。功能指令越來(lái)越多,但是裝置上的按鍵數(shù)目因?yàn)轶w積小而有所限制,而且屏幕很小,可能越來(lái)越不夠顯示所有的功能指令于一頁(yè)屏幕上,更別提繁多指令帶給消費(fèi)者記憶背頌上的困難。所以使用語(yǔ)音作為自然的輸入介面,就帶給人們普遍的期待。
然而,使用語(yǔ)音辨識(shí)做為輸入介面的系統(tǒng),雖然較為自然,但是辨識(shí)錯(cuò)誤的情況仍較頻繁,造成錯(cuò)誤的輸入更令使用者感到不習(xí)慣,而更正錯(cuò)誤的方法也可能沒(méi)有好的效率,因而令消費(fèi)者卻步。所以設(shè)計(jì)更簡(jiǎn)單方便、好用、易更正的先進(jìn)智慧型語(yǔ)音理解互動(dòng)式搜尋系統(tǒng),刻不容緩。
(3)發(fā)明內(nèi)容申請(qǐng)人有鑒于現(xiàn)有技術(shù)的缺點(diǎn),提出一種語(yǔ)音辨識(shí)方法及系統(tǒng),用以改善上述現(xiàn)有技術(shù)存在的缺點(diǎn)。
本發(fā)明的主要目的在于提供一種語(yǔ)音辨識(shí)方法及系統(tǒng),系采用一顯示裝置來(lái)顯示辨識(shí)的結(jié)果,并配合一鎖定裝置來(lái)進(jìn)行確認(rèn)動(dòng)作,以取代現(xiàn)有技術(shù)使用語(yǔ)音對(duì)話來(lái)進(jìn)行確認(rèn)的方法。
本發(fā)明的另一目的在于提供一種語(yǔ)音辨識(shí)方法及系統(tǒng),系使用小部分的屏幕來(lái)作為語(yǔ)言理解的溝通介面,并配合一小型鍵盤(pán)來(lái)進(jìn)行確認(rèn)/更正動(dòng)作,以取代現(xiàn)有技術(shù)使用語(yǔ)音對(duì)話來(lái)進(jìn)行確認(rèn)的方法。
本發(fā)明的目的是這樣實(shí)現(xiàn)的,本發(fā)明提供一種語(yǔ)音辨識(shí)的方法,其步驟包含(a)接收一使用者的語(yǔ)音,并進(jìn)行該語(yǔ)音的辨識(shí),以產(chǎn)生復(fù)數(shù)個(gè)辨識(shí)結(jié)果;(b)顯示上述復(fù)數(shù)個(gè)辨識(shí)結(jié)果,以供該使用者鎖定上述復(fù)數(shù)個(gè)辨識(shí)結(jié)果中的正確值;(c)判斷該正確值是否充足;(d)當(dāng)該正確值不充足時(shí),將該正確值儲(chǔ)存為已知值,縮小辨識(shí)范圍并重復(fù)步驟(a)至步驟(c);以及(e)當(dāng)該正確值充足時(shí),根據(jù)該正確值來(lái)搜尋一資料。
如所述的語(yǔ)音辨識(shí)的方法,上述復(fù)數(shù)個(gè)辨識(shí)結(jié)果系顯示于一顯示裝置上。
如所述的語(yǔ)音辨識(shí)的方法,上述顯示裝置為一觸摸式屏幕(touchscreen)。
如所述的語(yǔ)音辨識(shí)的方法,步驟(b)中,該使用者是經(jīng)由一鎖定裝置來(lái)鎖定上述復(fù)數(shù)個(gè)辨識(shí)結(jié)果中之正確值。如所述的語(yǔ)音辨識(shí)的方法,上述鎖定裝置為一按鍵、或觸摸式屏幕、或一遙控器。
如所述的語(yǔ)音辨識(shí)的方法,上述已知值儲(chǔ)存于一儲(chǔ)存裝置。
如所述的語(yǔ)音辨識(shí)的方法,上述儲(chǔ)存裝置為一暫存器。
如所述的語(yǔ)音辨識(shí)的方法,步驟(e)中,當(dāng)上述正確值充足時(shí),是根據(jù)該正確值來(lái)搜尋一資料庫(kù),以找出該資料。
如所述的語(yǔ)音辨識(shí)的方法,上述資料庫(kù)為一記憶體(memory)、或一快閃磁盤(pán)(flash disk)、或一硬盤(pán)(hard disk)、或一遠(yuǎn)端伺服器(server)。
如所述的語(yǔ)音辨識(shí)的方法,還包含在部分正確值已知的狀態(tài)下,重新進(jìn)行語(yǔ)音辨識(shí)之前該使用者所輸入的該語(yǔ)音的步驟。
本發(fā)明的目的是這樣實(shí)現(xiàn)的,本發(fā)明另提供一種語(yǔ)音辨識(shí)的方法,其步驟包含(a)于一顯示裝置上顯示復(fù)數(shù)個(gè)欄位,其中每一欄位是對(duì)應(yīng)于一類別;(b)使用者根據(jù)復(fù)數(shù)個(gè)類別而輸入一語(yǔ)音;(c)辨識(shí)該輸入的語(yǔ)音,以產(chǎn)生復(fù)數(shù)個(gè)辨識(shí)結(jié)果;(d)顯示這些復(fù)數(shù)個(gè)辨識(shí)結(jié)果于其對(duì)應(yīng)的欄位,以供該使用者經(jīng)由一鎖定裝置來(lái)鎖定復(fù)數(shù)個(gè)辨識(shí)結(jié)果中的正確值;(e)判斷該正確值是否充足;(f)當(dāng)該正確值不充足時(shí),將該正確值儲(chǔ)存為已知值,縮小辨識(shí)范圍并重復(fù)步驟(b)至步驟(e);以及(g)當(dāng)該正確值充足時(shí),根據(jù)該正確值來(lái)搜尋一資料。
如所述的語(yǔ)音辨識(shí)的方法,還包含在部分正確值已知的狀態(tài)下,重新辨識(shí)之前該使用者所輸入的該語(yǔ)音的步驟。
如所述的語(yǔ)音辨識(shí)的方法,還包含在上述復(fù)數(shù)個(gè)欄位尚未全部填滿前,徑行搜尋該未填滿資料的步驟。
本發(fā)明的目的是這樣實(shí)現(xiàn)的,本發(fā)明又提供一種語(yǔ)音辨識(shí)系統(tǒng),其包含一語(yǔ)音輸入裝置,用以接收一使用者的一語(yǔ)音;一語(yǔ)音辨識(shí)裝置,連結(jié)于該語(yǔ)音輸入裝置,用以辨識(shí)該語(yǔ)音,以產(chǎn)生復(fù)數(shù)個(gè)辨識(shí)結(jié)果;一顯示裝置,連結(jié)于該語(yǔ)音辨識(shí)裝置,用以顯示上述復(fù)數(shù)個(gè)辨識(shí)結(jié)果;一鎖定裝置,連結(jié)于該顯示裝置,用以供該使用者鎖定上述復(fù)數(shù)個(gè)辨識(shí)結(jié)果中的正確值;一儲(chǔ)存裝置,連結(jié)于鎖定裝置,用以將該正確值儲(chǔ)存為已知值;以及一資料庫(kù),連結(jié)于鎖定裝置,用以存放一資料,以供系統(tǒng)根據(jù)該正確值來(lái)搜尋該資料。
如所述的語(yǔ)音辨識(shí)系統(tǒng),該顯示裝置為一觸摸式屏幕。
如所述的語(yǔ)音辨識(shí)系統(tǒng),該鎖定裝置為一按鍵、或觸摸式屏幕、或一遙控器。
如所述的語(yǔ)音辨識(shí)系統(tǒng),該儲(chǔ)存裝置為一暫存器。
如所述的語(yǔ)音辨識(shí)系統(tǒng),所述的正確值不充足時(shí),經(jīng)由該儲(chǔ)存裝置將該正確值儲(chǔ)存為已知值。
如所述的語(yǔ)音辨識(shí)系統(tǒng),該資料庫(kù)系為一記憶體、或一快閃磁盤(pán)、或一硬盤(pán)、或一遠(yuǎn)端伺服器。
如所述的語(yǔ)音辨識(shí)系統(tǒng),所述的正確值充足時(shí),根據(jù)該正確值來(lái)搜尋該資料庫(kù),以找出資料。
本發(fā)明的目的是這樣實(shí)現(xiàn)的,本發(fā)明再提供一種語(yǔ)音辨識(shí)的方法,其步驟包含(a)接收一使用者的語(yǔ)音,并進(jìn)行該語(yǔ)音的辨識(shí),以產(chǎn)生復(fù)數(shù)個(gè)辨識(shí)結(jié)果;(b)顯示上述復(fù)數(shù)個(gè)辨識(shí)結(jié)果其中之一,以供該使用者進(jìn)行確認(rèn)/更正;(c)重復(fù)步驟(b),直到該使用者完成所有辨識(shí)結(jié)果的確認(rèn)/更正;以及(d)根據(jù)該確認(rèn)/更正后的辨識(shí)結(jié)果來(lái)搜尋一資料。
如所述的語(yǔ)音辨識(shí)的方法,上述復(fù)數(shù)個(gè)辨識(shí)結(jié)果系逐一顯示于一顯示裝置的一特定區(qū)域。
如所述的語(yǔ)音辨識(shí)的方法,上述復(fù)數(shù)個(gè)辨識(shí)結(jié)果系依照類別-內(nèi)容值的格式來(lái)顯示。
如所述的語(yǔ)音辨識(shí)的方法,其中步驟(b)中,該使用者系經(jīng)由一控制裝置來(lái)逐一確認(rèn)/更正該類別-內(nèi)容值。
如所述的語(yǔ)音辨識(shí)的方法,該控制裝置系為一小型鍵盤(pán)、或一遙控器、或一個(gè)人數(shù)位助理(personal digital assistant)。
如所述的語(yǔ)音辨識(shí)的方法,該小型鍵盤(pán)包含一錄音/播音鍵、一接受鍵、一拒絕鍵、一類別更正鍵、及一內(nèi)容值更正鍵。
如所述的語(yǔ)音辨識(shí)的方法,還包含于任一類別-內(nèi)容值的確認(rèn)/更正完成后,即根據(jù)該確認(rèn)/更正后的類別-內(nèi)容值來(lái)搜尋該資料的步驟。
如所述的語(yǔ)音辨識(shí)的方法,還包含判斷其他尚未完成確認(rèn)/更正的類別-內(nèi)容值是否還要繼續(xù)進(jìn)行確認(rèn)/更正的步驟。
本發(fā)明的目的是這樣實(shí)現(xiàn)的,本發(fā)明再提供一種語(yǔ)音辨識(shí)系統(tǒng),其包含一輸入裝置,用以接收一使用者的一語(yǔ)音;一語(yǔ)音辨識(shí)理解器,連結(jié)于該輸入裝置,用以因應(yīng)該語(yǔ)音而產(chǎn)生復(fù)數(shù)個(gè)辨識(shí)結(jié)果;一互動(dòng)式語(yǔ)義確認(rèn)/更正軟件元件,連結(jié)于該語(yǔ)音辨識(shí)理解器,用以確認(rèn)/更正該等辨識(shí)結(jié)果;一顯示裝置,連結(jié)于該互動(dòng)式語(yǔ)義確認(rèn)/更正軟件元件,用以逐一顯示上述復(fù)數(shù)個(gè)辨識(shí)結(jié)果于其上的一特定區(qū)域;一控制裝置,連結(jié)于該互動(dòng)式語(yǔ)義確認(rèn)/更正軟件元件,用以供該使用者進(jìn)行該等辨識(shí)結(jié)果的確認(rèn)/更正;以及一搜尋軟件元件,連結(jié)于該互動(dòng)式語(yǔ)義確認(rèn)/更正軟件元件,用以根據(jù)該確認(rèn)/更正后的辨識(shí)結(jié)果來(lái)搜尋一資料。
如所述的語(yǔ)音辨識(shí)系統(tǒng),和包含一儲(chǔ)存/接收裝置,用以存放資料。
如所述的語(yǔ)音辨識(shí)系統(tǒng),該資料為數(shù)位資料或影音節(jié)目。
如所述的語(yǔ)音辨識(shí)系統(tǒng),該輸入裝置為一麥克風(fēng)。
如所述的語(yǔ)音辨識(shí)系統(tǒng),該語(yǔ)音辨識(shí)理解器包含一語(yǔ)音辨識(shí)器及一語(yǔ)言理解器。
如所述的語(yǔ)音辨識(shí)系統(tǒng),該語(yǔ)音辨識(shí)器系根據(jù)一語(yǔ)匯來(lái)進(jìn)行語(yǔ)音辨識(shí)。
如所述的語(yǔ)音辨識(shí)系統(tǒng),該語(yǔ)言理解器系根據(jù)一文法來(lái)進(jìn)行語(yǔ)言理解。
如所述的語(yǔ)音辨識(shí)系統(tǒng),復(fù)數(shù)個(gè)辨識(shí)結(jié)果為類別-內(nèi)容值對(duì)。
如所述的語(yǔ)音辨識(shí)系統(tǒng),該控制裝置系為一小型鍵盤(pán)、或一遙控器、或一個(gè)人數(shù)位助理。
如所述的語(yǔ)音辨識(shí)系統(tǒng),該小型鍵盤(pán)包含一錄音/播音鍵、一接受鍵、一拒絕鍵、一類別更正鍵、及一內(nèi)容值更正鍵。
本發(fā)明的目的是這樣實(shí)現(xiàn)的,本發(fā)明再提供一種語(yǔ)音辨識(shí)的方法,其步驟包含(a)接收一使用者的語(yǔ)音,并進(jìn)行該語(yǔ)音的辨識(shí),以產(chǎn)生復(fù)數(shù)個(gè)辨識(shí)結(jié)果;(b)顯示上述復(fù)數(shù)個(gè)辨識(shí)結(jié)果,以供該使用者進(jìn)行確認(rèn)/更正;(c)根據(jù)該確認(rèn)/更正后的辨識(shí)結(jié)果來(lái)搜尋一資料。
如所述的語(yǔ)音辨識(shí)的方法,上述復(fù)數(shù)個(gè)辨識(shí)結(jié)果是同時(shí)顯示。
如所述的語(yǔ)音辨識(shí)的方法,上述復(fù)數(shù)個(gè)辨識(shí)結(jié)果是逐一顯示。
如所述的語(yǔ)音辨識(shí)的方法,在步驟(b)中,是經(jīng)由該使用者重新輸入的語(yǔ)音來(lái)進(jìn)行更正。
如所述的語(yǔ)音辨識(shí)的方法,在步驟(b)中,是經(jīng)由一控制裝置來(lái)進(jìn)行更正。
本發(fā)明的效果本發(fā)明的語(yǔ)音辨識(shí)方法及系統(tǒng)的互動(dòng)語(yǔ)音理解元件提供了主要的人機(jī)介面功能,能夠快速有效的達(dá)成大量資訊的檢索。適合應(yīng)用的范圍包括屏幕較小的裝置,例如小型的數(shù)位影音儲(chǔ)存及播放裝置,如MP3播放器,智慧型行動(dòng)電話(Smart Phone)等等。也可以應(yīng)用在具有大型屏幕的裝置上,其特殊的處為只使用屏幕的一小部分區(qū)域來(lái)作為語(yǔ)音理解的溝通介面,而不會(huì)影響到節(jié)目的觀看,例如電視機(jī)的控制,節(jié)目選擇,或影音品質(zhì)調(diào)整等等;或是錄影機(jī)的控制,如錄影時(shí)間設(shè)定,預(yù)錄節(jié)目的播放等等。
綜上所述,本發(fā)明能有效改善現(xiàn)有技術(shù)的缺點(diǎn),具有產(chǎn)業(yè)價(jià)值。
為進(jìn)一步說(shuō)明本發(fā)明的上述目的、結(jié)構(gòu)特點(diǎn)和效果,以下將結(jié)合附圖對(duì)本發(fā)明進(jìn)行詳細(xì)的描述。
(4)


圖1其是現(xiàn)有技術(shù)的語(yǔ)音辨識(shí)方法的流程圖。
圖2其是本發(fā)明一實(shí)施例的語(yǔ)音辨識(shí)系統(tǒng)的架構(gòu)圖。
圖3其是本發(fā)明一實(shí)施例的語(yǔ)音辨識(shí)方法的流程圖。
圖4其是本發(fā)明一實(shí)施例的語(yǔ)音辨識(shí)系統(tǒng)應(yīng)用于一手持隨身裝置的示意圖。
圖5其是本發(fā)明另一實(shí)施例的語(yǔ)音辨識(shí)系統(tǒng)的架構(gòu)圖。
圖6其是本發(fā)明另一實(shí)施例的小型鍵盤(pán)的按鍵功能示意圖。
圖7其是本發(fā)明另一實(shí)施例的語(yǔ)音辨識(shí)系統(tǒng)應(yīng)用于一MP3隨身聽(tīng)的示意圖。
圖8其是本發(fā)明另一實(shí)施例的語(yǔ)音辨識(shí)系統(tǒng)應(yīng)用于一電視機(jī)的示意圖。
附圖中主要元件的符號(hào)說(shuō)明15儲(chǔ)存裝置21語(yǔ)音輸入裝置22語(yǔ)音辨識(shí)裝置23顯示裝置24鎖定裝置25儲(chǔ)存裝置26資料庫(kù) 41手持隨身裝置51儲(chǔ)存接收裝置53輸入裝置54語(yǔ)音辨識(shí)器 55語(yǔ)言理解器56互動(dòng)式語(yǔ)義確認(rèn)/更正軟件元件57搜尋軟件元件58顯示裝置59小型鍵盤(pán)(5)具體實(shí)施方式
下面,參見(jiàn)附圖,對(duì)本發(fā)明的語(yǔ)音辨識(shí)方法及系統(tǒng)的實(shí)施方式進(jìn)行詳細(xì)說(shuō)明。
請(qǐng)參閱圖2,其是本發(fā)明一實(shí)施例的語(yǔ)音辨識(shí)系統(tǒng)的架構(gòu)圖。該語(yǔ)音辨識(shí)系統(tǒng)包含一語(yǔ)音輸入裝置21、一語(yǔ)音辨識(shí)裝置22,連結(jié)于語(yǔ)音輸入裝置21、一顯示裝置23,連結(jié)于語(yǔ)音辨識(shí)裝置22、一鎖定裝置24,連結(jié)于顯示裝置23、一儲(chǔ)存裝置25,連結(jié)于鎖定裝置24、及一資料庫(kù)26,連結(jié)于鎖定裝置24。其中,該語(yǔ)音輸入裝置21是用以接收一使用者的一語(yǔ)音。該語(yǔ)音辨識(shí)裝置22是用以辨識(shí)輸入裝置21輸出的該語(yǔ)音,以產(chǎn)生復(fù)數(shù)個(gè)辨識(shí)結(jié)果。該顯示裝置23是用以顯示該語(yǔ)音辨識(shí)裝置22的復(fù)數(shù)個(gè)辨識(shí)結(jié)果。該鎖定裝置24是用以供該使用者鎖定顯示裝置23顯示的復(fù)數(shù)個(gè)辨識(shí)結(jié)果中的正確值。該儲(chǔ)存裝置25是在鎖定裝置24中鎖定的該正確值不充足時(shí),將該正確值儲(chǔ)存為已知值。而該資料庫(kù)26系用以存放一資料,以供系統(tǒng)中鎖定裝置24中鎖定的該正確值充足時(shí),根據(jù)該正確值來(lái)搜尋該資料。
上述的鎖定裝置24可為一按鍵、或一觸摸式屏幕、或一遙控器,而當(dāng)該鎖定裝置24為一觸摸式屏幕時(shí),該觸摸式屏幕可同時(shí)作為該顯示裝置23來(lái)使用;該儲(chǔ)存裝置25為一暫存器;該資料庫(kù)26可為一記憶體、或一快閃磁盤(pán)、或一硬盤(pán)、或一遠(yuǎn)端伺服器;任何資料均可使用上述系統(tǒng)來(lái)進(jìn)行搜尋,如飛機(jī)時(shí)刻、股票資訊等等。
請(qǐng)同時(shí)參閱圖2與圖3,圖3系為本發(fā)明一實(shí)施例的語(yǔ)音辨識(shí)方法的流程圖。
步驟31,使用者在看到該顯示裝置上所提示的復(fù)數(shù)個(gè)欄位后,即可輸入語(yǔ)音。
步驟32,接著,系統(tǒng)會(huì)進(jìn)行語(yǔ)音辨識(shí),產(chǎn)生復(fù)數(shù)個(gè)辨識(shí)結(jié)果。
步驟33,將辨識(shí)后的結(jié)果顯示于對(duì)應(yīng)的欄位,顯示裝置輸出復(fù)數(shù)個(gè)辨識(shí)結(jié)果,此時(shí)使用者可依此進(jìn)行挑選,并經(jīng)由該鎖定裝置24來(lái)鎖定復(fù)數(shù)個(gè)辨識(shí)結(jié)果中的正確值。
步驟34,在正確值鎖定后,系統(tǒng)會(huì)判斷正確值是否充足,當(dāng)正確值不充足時(shí),系統(tǒng)會(huì)經(jīng)由該儲(chǔ)存裝置25將正確值儲(chǔ)存為已知值,并回到步驟31,如此直到獲得足夠的資料為止;而當(dāng)正確值充足時(shí),便可完成對(duì)話流程,此時(shí)系統(tǒng)會(huì)根據(jù)正確值來(lái)搜尋該資料庫(kù)26,以找出該資料。
此外,圖3中還表示,在部分正確值已知的狀態(tài)下,重新進(jìn)行語(yǔ)音辨識(shí)之前,使用者所輸入的該語(yǔ)音的步驟。
圖4系為本發(fā)明的語(yǔ)音辨識(shí)系統(tǒng)應(yīng)用于一手持隨身裝置41的示意圖,其中該手持隨身裝置為一歌曲搜尋裝置。如圖4所示,顯示裝置23中顯示《歌手》這個(gè)類別的值為《孫燕姿》,《歌名》這個(gè)類別的值為《天黑黑,而《專輯》這個(gè)類別的欄位為空白,代表其值為未知,在鎖定裝置24中需要使用者的語(yǔ)音輸入來(lái)填滿這個(gè)欄位,以進(jìn)行搜尋。
上述的語(yǔ)音辨識(shí)方法及系統(tǒng)具有下列優(yōu)點(diǎn)1.采用《類別-內(nèi)容值(Attribute-Value)》的方式,將辨識(shí)后的結(jié)果顯示于該顯示裝置23上,因此使用者只需一眼就可看出有哪些欄位還是空的,亦即,不需要系統(tǒng)提問(wèn),使用者便能知道接下來(lái)該提供哪些資訊。
2.采用《已知值鎖定》的方法來(lái)去除辨識(shí)錯(cuò)誤的結(jié)果。在使用者進(jìn)行語(yǔ)音輸入后,系統(tǒng)便會(huì)將辨識(shí)結(jié)果顯示于對(duì)應(yīng)的欄位,此時(shí)使用者可以采用保留正確答案,或是刪除錯(cuò)誤答案的方法來(lái)篩選正確的結(jié)果。之后,被保留下來(lái)的正確值將進(jìn)入《鎖定》的狀態(tài),其值將被視為《已知值》而不會(huì)改變,使用者接下來(lái)的輸入僅能改變未被鎖定的部分。因此,已經(jīng)鎖定的類別不會(huì)被改變,故系統(tǒng)可依此縮小辨識(shí)的范圍,除了提高辨識(shí)率外,也可以減少辨識(shí)所需的時(shí)間。
3.使用者可以自然語(yǔ)言方式一次輸入一個(gè)以上的類別。
4.在部分類別已知的狀態(tài)下,系統(tǒng)可以依此縮小辨識(shí)的范圍。
5.系統(tǒng)可以在部分類別已知的狀態(tài)下,重新辨識(shí)之前使用者所輸入的語(yǔ)音。
6.系統(tǒng)可在類別尚未全部填滿前,進(jìn)行搜尋。
請(qǐng)參閱圖5,其是本發(fā)明另一實(shí)施例的語(yǔ)音辨識(shí)系統(tǒng)的架構(gòu)圖。該語(yǔ)音辨識(shí)系統(tǒng)包含一數(shù)位資料和影音節(jié)目的儲(chǔ)存/接收裝置51(例如MP 3播放器、收音機(jī)、和電視機(jī)),一互動(dòng)式智慧型語(yǔ)音辨識(shí)理解單元(以下簡(jiǎn)稱“互動(dòng)語(yǔ)音理解單元”),及一搜尋軟件元件57。該互動(dòng)語(yǔ)音理解單元包含一輸入裝置53(例如麥克風(fēng)),一可顯示字元的顯示裝置58(例如屏幕),一小型鍵盤(pán)59,一語(yǔ)音辨識(shí)器54(連接于輸入裝置53),一語(yǔ)言理解器55(連接于語(yǔ)音辨識(shí)器54),及一互動(dòng)式語(yǔ)義確認(rèn)/更正軟件元件56(連接于語(yǔ)言理解器55、小型鍵盤(pán)59,并與顯示裝置58連接)。
其中,該輸入裝置53系用以接收一使用者的一語(yǔ)音。該語(yǔ)音辨識(shí)器54是根據(jù)一語(yǔ)匯來(lái)對(duì)該輸入裝置53的輸出進(jìn)行語(yǔ)音辨識(shí),而該語(yǔ)言理解器55是根據(jù)一文法來(lái)對(duì)語(yǔ)音辨識(shí)器54的輸出進(jìn)行語(yǔ)言理解,以產(chǎn)生復(fù)數(shù)個(gè)辨識(shí)結(jié)果。該互動(dòng)式語(yǔ)義確認(rèn)/更正軟件元件56是用以確認(rèn)/更正該該語(yǔ)言理解器55的辨識(shí)結(jié)果。該顯示裝置58是用以逐一顯示該互動(dòng)式語(yǔ)義確認(rèn)/更正軟件元件56的辨識(shí)結(jié)果于其上的一特定區(qū)域。該小型鍵盤(pán)59是用以供該使用者進(jìn)行該確認(rèn)/更正該該語(yǔ)言理解器55的辨識(shí)結(jié)果的確認(rèn)/更正的控制裝置,其亦可以一遙控器或一個(gè)人數(shù)位助理來(lái)替代。而該搜尋軟件元件57是用以根據(jù)該確認(rèn)/更正該該語(yǔ)言理解器55的確認(rèn)/更正后的辨識(shí)結(jié)果來(lái)搜尋該儲(chǔ)存/接收裝置51,以找出對(duì)應(yīng)的數(shù)位資料或影音節(jié)目。
數(shù)位資料和影音節(jié)目的儲(chǔ)存/接收裝置51中,被儲(chǔ)存或可供接收的數(shù)位資料和影音節(jié)目,其供做檢索的名稱,須依其類別或性質(zhì)事先分門(mén)別類。例如張惠妹的歌曲“Bad boy″”被歸類為“歌曲”類別,其“演唱者”類別的內(nèi)容值為“張惠妹”。又一例節(jié)目“華視晚間新聞”是它的“節(jié)目名稱”類別的內(nèi)容值,它的“節(jié)目類別”類別的內(nèi)容值是“新聞節(jié)目”,它的“電臺(tái)”類別的內(nèi)容值是“華視”,它的“撥出時(shí)間”類別的內(nèi)容值是“PM7-8”。
檢索時(shí)自然的使用日常語(yǔ)句提出搜尋,例如“轉(zhuǎn)華視晚間新聞”,或是“張惠妹的Bad boy”,而不用僵硬的使用階層式的選單指令,例如先說(shuō)“電視”,再說(shuō)“新聞節(jié)目”,最后才能說(shuō)出節(jié)目名稱是“華視晚間新聞”。
依類別或性質(zhì)分門(mén)別類的檢索項(xiàng)目,經(jīng)過(guò)資料處理52后所對(duì)應(yīng)產(chǎn)生的語(yǔ)匯和文法,會(huì)作為語(yǔ)音辨識(shí)和語(yǔ)言理解的根據(jù)。此外,該語(yǔ)音辨識(shí)器54和該語(yǔ)言理解器55可以合成單一元件。
該互動(dòng)語(yǔ)音理解單元接收了使用者的語(yǔ)音后,會(huì)經(jīng)由該語(yǔ)音辨識(shí)器54和該語(yǔ)言理解器55,將語(yǔ)音理解出成對(duì)的“類別-內(nèi)容值”對(duì)(attribute-value pair),雖然使用者并不一定說(shuō)出類別。例如,使用者說(shuō)出“張惠妹的Bad boy”,但并未說(shuō)出“歌手”兩字,但是該顯示裝置會(huì)顯示出“歌手-張惠妹”這樣的“類別-內(nèi)容值”對(duì)。同一句話可以產(chǎn)生多個(gè)類別-內(nèi)容值對(duì)。最后通過(guò)該互動(dòng)式語(yǔ)義確認(rèn)/更正軟件元件56來(lái)完成錯(cuò)誤的更正,或是正確語(yǔ)義的確認(rèn)。該互動(dòng)方法詳述如下。
1.本實(shí)施例的方法系專為一次一個(gè)“類別-內(nèi)容值”對(duì)的確認(rèn)或更正所設(shè)計(jì)。第一,是為了能夠顯示“類別-內(nèi)容值”對(duì)在該顯示裝置58上,或是在不影響節(jié)目觀看功能下,只占用該顯示裝置58的一特定區(qū)域來(lái)顯示“類別-內(nèi)容值”對(duì)。第二,是為了只使用一包含五個(gè)按鍵的小型鍵盤(pán)59,就可以進(jìn)行簡(jiǎn)易的互動(dòng)式確認(rèn)/更正步驟。
2.一次顯示一個(gè)“類別-內(nèi)容值”對(duì)在該顯示裝置58上,且提供一包含五個(gè)按鍵的小型鍵盤(pán)59與使用者所錄的語(yǔ)音進(jìn)行互動(dòng)。
3.請(qǐng)參閱圖6,其是本發(fā)明的小型鍵盤(pán)59的按鍵功能示意圖。該五個(gè)按鍵分別代表以下五個(gè)主要功能錄/播音鍵、接受鍵、拒絕鍵、類別更正鍵、及內(nèi)容值更正鍵。
錄/播音鍵輕按錄/播音鍵為播放“類別-內(nèi)容值”對(duì)所對(duì)應(yīng)的使用者聲音段落。重(久)按錄/播音鍵為重新錄音,以重新依次進(jìn)行“類別-內(nèi)容值”對(duì)的確認(rèn)或更正步驟。
接受鍵輕按接受鍵為接受“類別-內(nèi)容值”對(duì),并進(jìn)行下一個(gè)動(dòng)作。如果還有尚未完成確認(rèn)或更正的“類別-內(nèi)容值”對(duì)時(shí),下一個(gè)動(dòng)作就是顯示出下一個(gè)未完成確認(rèn)或更正的“類別-內(nèi)容值”對(duì),并進(jìn)行互動(dòng)。
拒絕鍵輕按拒絕鍵為拒絕“類別-內(nèi)容值”對(duì),并進(jìn)行下一個(gè)動(dòng)作。如果還有尚未完成確認(rèn)或更正的“類別-內(nèi)容值”對(duì)時(shí),下一個(gè)動(dòng)作就是顯示出下一個(gè)未完成確認(rèn)或更正的“類別-內(nèi)容值”對(duì),并進(jìn)行互動(dòng)。
類別更正鍵輕按類別更正鍵為更正選取另一個(gè)Top-N候選的“類別-內(nèi)容值”對(duì)中的“類別”。重(久)按類別更正鍵為重新錄音及辨識(shí)另一個(gè)可能的“類別-內(nèi)容值”對(duì)中的“類別”。
內(nèi)容值更正鍵輕按內(nèi)容值更正鍵為更正選取另一個(gè)Top-N候選的“類別-內(nèi)容值”對(duì)中的“內(nèi)容值”。重(久)按內(nèi)容值更正鍵為重新錄音及辨識(shí)另一個(gè)可能的“類別-內(nèi)容值”對(duì)中的“內(nèi)容值”。
4.如果有多個(gè)“類別-內(nèi)容值”對(duì),顯示的順序由系統(tǒng)經(jīng)由智慧判斷而決定,并非依照說(shuō)話的順序而決定。決定的方法,主要考量對(duì)使用者的便利,例如互動(dòng)的親切自然度要高,按鍵的總次數(shù)要少等等。
5.任一個(gè)“類別-內(nèi)容值”對(duì)的確認(rèn)或更正完成的后,都可以進(jìn)行搜尋的動(dòng)作,并智慧的判斷其他尚未完成確認(rèn)或更正的“類別-內(nèi)容值”對(duì)是否還要繼繼進(jìn)行確認(rèn)或更正,或是直接將搜尋的結(jié)果(數(shù)量或各個(gè)項(xiàng)目)顯示于該顯示裝置58,以供使用者直接查閱。
請(qǐng)同時(shí)參閱圖6及圖7,圖7是為本發(fā)明另一較佳實(shí)施例的語(yǔ)音辨識(shí)系統(tǒng)應(yīng)用于一MP3隨身聽(tīng)的示意圖。首先,使用者說(shuō)出《張信哲的愛(ài)如潮水》后,系統(tǒng)開(kāi)始進(jìn)行語(yǔ)音辨識(shí)。接著,該顯示裝置58上出現(xiàn)《歌手/張信哲》這樣的《類別/內(nèi)容值》對(duì),此時(shí)使用者按接受鍵。在按下接受鍵后,該顯示裝置58上出現(xiàn)《歌曲/愛(ài)已成風(fēng)》這樣的《類別/內(nèi)容值》對(duì),此時(shí)使用者使用《內(nèi)容值更正鍵》來(lái)進(jìn)行更正。最后,該顯示裝置58上出現(xiàn)《歌曲/愛(ài)如潮水》這樣的《類別/內(nèi)容值》對(duì),在使用者按下接受鍵后,系統(tǒng)即會(huì)根據(jù)確認(rèn)/更正后的辨識(shí)結(jié)果來(lái)搜尋該儲(chǔ)存/接收裝置51,以找出《愛(ài)如潮水》的歌曲檔案。
本實(shí)施例的互動(dòng)語(yǔ)音理解元件提供了主要的人機(jī)介面功能,能夠快速有效的達(dá)成大量資訊的檢索。適合應(yīng)用的范圍包括屏幕較小的裝置,例如小型的數(shù)位影音儲(chǔ)存及播放裝置,如MP3播放器,智慧型移動(dòng)電話(Smart Phone)等等。也可以應(yīng)用在具有大型屏幕的裝置上,其特殊的處為只使用屏幕的一小部分區(qū)域來(lái)作為語(yǔ)音理解的溝通介面,而不會(huì)影響到節(jié)目的觀看,例如電視機(jī)的控制,節(jié)目選擇,或影音品質(zhì)調(diào)整等等;或是錄影機(jī)的控制,如錄影時(shí)間設(shè)定,預(yù)錄節(jié)目的播放等等,如圖8所示。
缺點(diǎn)本技術(shù)領(lǐng)域中的普通技術(shù)人員應(yīng)當(dāng)認(rèn)識(shí)到,以上的實(shí)施例僅是用來(lái)說(shuō)明本發(fā)明,而并非用作為對(duì)本發(fā)明的限定,只要在本發(fā)明的實(shí)質(zhì)精神范圍內(nèi),對(duì)以上所述實(shí)施例的變化、變型都將落在本發(fā)明權(quán)利要求書(shū)的范圍內(nèi)。
權(quán)利要求
1.一種語(yǔ)音辨識(shí)的方法,其特征在于包含下列步驟(a)接收一使用者的語(yǔ)音,并進(jìn)行該語(yǔ)音的辨識(shí),以產(chǎn)生復(fù)數(shù)個(gè)辨識(shí)結(jié)果;(b)顯示上述產(chǎn)生的復(fù)數(shù)個(gè)辨識(shí)結(jié)果,以供使用者鎖定所述的復(fù)數(shù)個(gè)辨識(shí)結(jié)果中的正確值;(c)判斷所述的正確值是否充足;(d)當(dāng)所述的正確值不充足時(shí),將所述的正確值儲(chǔ)存為已知值,縮小辨識(shí)范圍并重復(fù)步驟(a)至步驟(c);以及(e)當(dāng)所述的正確值充足時(shí),根據(jù)所述的正確值來(lái)搜尋一資料。
2.如權(quán)利要求1所述的語(yǔ)音辨識(shí)的方法,其特征在于所述的復(fù)數(shù)個(gè)辨識(shí)結(jié)果是顯示于一顯示裝置上;及/或所述的顯示裝置為一觸摸式屏幕。
3.如權(quán)利要求1所述的語(yǔ)音辨識(shí)的方法,其特征在于所述的步驟(b)中,使用者是經(jīng)由一鎖定裝置來(lái)鎖定所述的復(fù)數(shù)個(gè)辨識(shí)結(jié)果中的正確值;及/或所述的鎖定裝置是為一按鍵、或觸摸式屏幕、或一遙控器。
4.如權(quán)利要求1所述的語(yǔ)音辨識(shí)的方法,其特征在于所述的已知值是儲(chǔ)存于一儲(chǔ)存裝置;及/或所述的一儲(chǔ)存裝置是為一暫存器。
5.如權(quán)利要求1所述的語(yǔ)音辨識(shí)的方法,其特征在于所述的步驟(e)中,當(dāng)所述的正確值充足時(shí),是根據(jù)所述的正確值來(lái)搜尋一資料庫(kù);及/或所述的資料庫(kù)是為一記憶體、或一快閃磁盤(pán)、或一硬盤(pán)、或一遠(yuǎn)端伺服器。
6.如權(quán)利要求1所述的語(yǔ)音辨識(shí)的方法,其特征在于還包含在部分正確值已知的狀態(tài)下,重新進(jìn)行語(yǔ)音辨識(shí)之前所述的使用者所輸入的該語(yǔ)音的步驟。
7.一種語(yǔ)音辨識(shí)的方法,其特征在于包含以下步驟(a)于一顯示裝置上顯示復(fù)數(shù)個(gè)欄位,其中每一欄位是對(duì)應(yīng)于一類別;(b)使用者根據(jù)所述的復(fù)數(shù)個(gè)類別而輸入一語(yǔ)音;(c)辨識(shí)上述輸入的語(yǔ)音,以產(chǎn)生復(fù)數(shù)個(gè)辨識(shí)結(jié)果;(d)顯示所述的復(fù)數(shù)個(gè)辨識(shí)結(jié)果于其對(duì)應(yīng)的欄位,以供使用者經(jīng)由一鎖定裝置來(lái)鎖定所述的復(fù)數(shù)個(gè)辨識(shí)結(jié)果中的正確值;(e)判斷所述的正確值是否充足;(f)當(dāng)所述的正確值不充足時(shí),將所述的正確值儲(chǔ)存為已知值,縮小辨識(shí)范圍并重復(fù)步驟(b)至步驟(e);以及(g)當(dāng)所述的正確值充足時(shí),根據(jù)所述的正確值來(lái)搜尋一資料。
8.如權(quán)利要求7所述的語(yǔ)音辨識(shí)的方法,其特征在于還包含在部分正確值已知的狀態(tài)下,重新辨識(shí)之前所述的使用者所輸入的語(yǔ)音的步驟;及/或在所述的復(fù)數(shù)個(gè)欄位尚未全部填滿前,徑行搜尋未填滿的資料的步驟。
9.一種語(yǔ)音辨識(shí)系統(tǒng),其特征在于包含一語(yǔ)音輸入裝置,用以接收一使用者的一語(yǔ)音;一語(yǔ)音辨識(shí)裝置,連結(jié)于所述的語(yǔ)音輸入裝置,用以辨識(shí)所述的語(yǔ)音,以產(chǎn)生復(fù)數(shù)個(gè)辨識(shí)結(jié)果;一顯示裝置,連結(jié)于所述的語(yǔ)音辨識(shí)裝置,用以顯示所述的復(fù)數(shù)個(gè)辨識(shí)結(jié)果;一鎖定裝置,連結(jié)于所述的顯示裝置,用以供使用者鎖定所述的辨識(shí)結(jié)果中的正確值;一儲(chǔ)存裝置,連結(jié)于鎖定裝置24,用以將所述的正確值儲(chǔ)存為已知值;以及一資料庫(kù),連結(jié)于鎖定裝置24,用以存放一資料,以供系統(tǒng)根據(jù)所述的正確值來(lái)搜尋資料。
10.一種語(yǔ)音辨識(shí)的方法,其特征在于包含以下步驟(a)接收一使用者的語(yǔ)音,并進(jìn)行所述的語(yǔ)音的辨識(shí),以產(chǎn)生復(fù)數(shù)個(gè)辨識(shí)結(jié)果;(b)顯示該上述復(fù)數(shù)個(gè)辨識(shí)結(jié)果其中之一,以供使用者進(jìn)行確認(rèn)/更正;(c)重復(fù)步驟(b),直到該使用者完成所有辨識(shí)結(jié)果的確認(rèn)/更正;以及(d)根據(jù)所述的確認(rèn)/更正后的辨識(shí)結(jié)果來(lái)搜尋一資料。
11.如權(quán)利要求10所述的語(yǔ)音辨識(shí)的方法,其特征在于所述的復(fù)數(shù)個(gè)辨識(shí)結(jié)果是逐一顯示于一顯示裝置的一特定區(qū)域。
12.如權(quán)利要求10所述的語(yǔ)音辨識(shí)的方法,其特征在于所述的復(fù)數(shù)個(gè)辨識(shí)結(jié)果是依照類別-內(nèi)容值的格式來(lái)顯示;在所述的步驟(b)中,所述的使用者是經(jīng)由一控制裝置來(lái)逐一確認(rèn)/更正所述的類別-內(nèi)容值;所述的控制裝置系為一小型鍵盤(pán)、或一遙控器、或一個(gè)人數(shù)位助理,其中該小型鍵盤(pán)包含一錄音/播音鍵、一接受鍵、一拒絕鍵、一類別更正鍵、及一內(nèi)容值更正鍵;及/或所述的語(yǔ)音辨識(shí)的方法還包含于任一類別-內(nèi)容值的確認(rèn)/更正完成后,即根據(jù)所述的確認(rèn)/更正后的類別-內(nèi)容值來(lái)搜尋資料的步驟。
13.如權(quán)利要求10項(xiàng)所述的語(yǔ)音辨識(shí)的方法,其特征在于還包含判斷其他尚未完成確認(rèn)/更正的類別-內(nèi)容值是否還要繼續(xù)進(jìn)行確認(rèn)/更正的步驟。
14.一種語(yǔ)音辨識(shí)系統(tǒng),其特征在于包含一輸入裝置,用以接收一使用者的一語(yǔ)音;一語(yǔ)音辨識(shí)理解器,連結(jié)于所述的輸入裝置,用以因應(yīng)所述的語(yǔ)音而產(chǎn)生復(fù)數(shù)個(gè)辨識(shí)結(jié)果;一互動(dòng)式語(yǔ)義確認(rèn)/更正軟件元件,連結(jié)于所述的語(yǔ)音辨識(shí)理解器,用以確認(rèn)/更正該等辨識(shí)結(jié)果;一顯示裝置,連結(jié)于所述的互動(dòng)式語(yǔ)義確認(rèn)/更正軟件元件,用以逐一顯示該等辨識(shí)結(jié)果于其上的一特定區(qū)域;一控制裝置,連結(jié)于所述的互動(dòng)式語(yǔ)義確認(rèn)/更正軟件元件,用以供使用者進(jìn)行所述的復(fù)數(shù)個(gè)辨識(shí)結(jié)果辨識(shí)結(jié)果的確認(rèn)/更正;以及一搜尋軟件元件,連結(jié)于所述的互動(dòng)式語(yǔ)義確認(rèn)/更正軟件元件,用以根據(jù)確認(rèn)/更正后的辨識(shí)結(jié)果來(lái)搜尋一資料。
15.如權(quán)利要求14所述的語(yǔ)音辨識(shí)系統(tǒng),其特征在于還包含一儲(chǔ)存/接收裝置,用以存放資料;及/或所述的資料為數(shù)位資料或影音節(jié)目。
16.如權(quán)利要求14所述的語(yǔ)音辨識(shí)系統(tǒng),其特征在于所述的輸入裝置為一麥克風(fēng);所述的復(fù)數(shù)個(gè)辨識(shí)結(jié)果為類別-內(nèi)容值對(duì);
17.如權(quán)利要求14所述的語(yǔ)音辨識(shí)系統(tǒng),其特征在于所述的語(yǔ)音辨識(shí)理解器包含一語(yǔ)音辨識(shí)器及一語(yǔ)言理解器,其中所述的語(yǔ)音辨識(shí)器系根據(jù)一語(yǔ)匯來(lái)進(jìn)行語(yǔ)音辨識(shí);及/或所述的語(yǔ)言理解器系根據(jù)一文法來(lái)進(jìn)行語(yǔ)言理解。
18.一種語(yǔ)音辨識(shí)的方法,其特征在于包含以下步驟(a)接收一使用者的語(yǔ)音,并進(jìn)行所述的語(yǔ)音的辨識(shí),以產(chǎn)生復(fù)數(shù)個(gè)辨識(shí)結(jié)果;(b)顯示所述的復(fù)數(shù)個(gè)辨識(shí)結(jié)果,以供使用者進(jìn)行確認(rèn)/更正;(c)根據(jù)所述的確認(rèn)/更正后的辨識(shí)結(jié)果來(lái)搜尋一資料。
19.如權(quán)利要求18所述的語(yǔ)音辨識(shí)的方法,其特征在于所述的復(fù)數(shù)個(gè)辨識(shí)結(jié)果是同時(shí)顯示或逐一顯示。
20.如權(quán)利要求18所述的語(yǔ)音辨識(shí)的方法,其特征在于在步驟(b)中,是經(jīng)由使用者重新輸入的語(yǔ)音來(lái)進(jìn)行更正或是經(jīng)由一控制裝置來(lái)進(jìn)行更正。
全文摘要
本發(fā)明系為一種語(yǔ)音辨識(shí)方法及系統(tǒng),包括(a)接收一使用者的語(yǔ)音,并進(jìn)行該語(yǔ)音的辨識(shí),以產(chǎn)生復(fù)數(shù)個(gè)辨識(shí)結(jié)果;(b)顯示上述產(chǎn)生的復(fù)數(shù)個(gè)辨識(shí)結(jié)果,以供使用者鎖定所述的復(fù)數(shù)個(gè)辨識(shí)結(jié)果中的正確值;(c)判斷所述的正確值是否充足;(d)當(dāng)所述的正確值不充足時(shí),將所述的正確值儲(chǔ)存為已知值,縮小辨識(shí)范圍并重復(fù)步驟(a)至步驟(c);(e)當(dāng)所述的正確值充足時(shí),根據(jù)所述的正確值來(lái)搜尋一資料。本發(fā)明的語(yǔ)音辨識(shí)方法及系統(tǒng)的互動(dòng)語(yǔ)音理解元件提供了主要的人機(jī)介面功能,能夠快速有效的達(dá)成大量資訊的檢索。適合應(yīng)用的范圍包括屏幕較小的裝置,例如小型的數(shù)位影音儲(chǔ)存及播放裝置,如MP3播放器,智慧型行動(dòng)電話等。
文檔編號(hào)G10L15/28GK1825431SQ20051005256
公開(kāi)日2006年8月30日 申請(qǐng)日期2005年2月23日 優(yōu)先權(quán)日2005年2月23日
發(fā)明者蔡錦和, 王瑞璋 申請(qǐng)人:臺(tái)達(dá)電子工業(yè)股份有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
中超| 永宁县| 宁化县| 甘南县| 慈利县| 南木林县| 如皋市| 永清县| 榆社县| 会泽县| 永川市| 上林县| 无为县| 湘潭市| 易门县| 玉田县| 云龙县| 西林县| 寿阳县| 大埔区| 温泉县| 调兵山市| 金坛市| 长宁县| 舒兰市| 吉木萨尔县| 台东县| 深水埗区| 鄂托克前旗| 饶河县| 新沂市| 哈密市| 广灵县| 游戏| 远安县| 云阳县| 盐山县| 宣武区| 石门县| 尖扎县| 威远县|