專利名稱:用于將口授轉(zhuǎn)錄到文本文件中并對該文本進(jìn)行修訂的方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及這樣一種用于轉(zhuǎn)錄口授的方法,在該方法中將口授文件轉(zhuǎn)換成文本文件。
本發(fā)明還涉及這樣一種轉(zhuǎn)錄系統(tǒng),該轉(zhuǎn)錄系統(tǒng)利用用于將口授文件轉(zhuǎn)換成文本文件的裝置來轉(zhuǎn)錄口授。
通過轉(zhuǎn)錄服務(wù)而將已以各種方式所記錄的口授轉(zhuǎn)換或者轉(zhuǎn)錄成文本文件。通常,自動語言識別系統(tǒng)用于轉(zhuǎn)錄口授。因?yàn)橐赃@種方式所獲得的文本總是包含某一比率的錯誤或者不當(dāng)?shù)奈谋酒?,因此在轉(zhuǎn)換之后必須對所轉(zhuǎn)錄的口授進(jìn)行檢查,并且校正包含在文本文件中的錯誤。通常,由播放口授文件并且與此并行的檢查文本文件的校正操作人員通過對文本文件與口授文件進(jìn)行比較來負(fù)責(zé)該校正。如果校正操作人員拾取到有錯誤的或者不當(dāng)?shù)霓D(zhuǎn)錄或者文本片段,那么有錯誤的或者不當(dāng)?shù)奈谋酒伪惶鎿Q為不同的文本片段。該校正工作是極端耗時的,因此相當(dāng)大的增加了轉(zhuǎn)錄成本。因?yàn)闊o誤差轉(zhuǎn)錄實(shí)際上是從不會實(shí)現(xiàn)的,因此不能省去隨后的校正。因此,其一個目的就是在轉(zhuǎn)錄之后進(jìn)行盡可能快的且有效的校正工作。
在US 5712957專利文獻(xiàn)中,公開了一種用于對已轉(zhuǎn)錄的口授進(jìn)行校正的方法,在該方法中提供了已轉(zhuǎn)錄文本以及即就是備選文本片段這樣的可能假設(shè)并且按照兩種不同的方式對其進(jìn)行評估。通過這兩者評估的組合來提供轉(zhuǎn)錄結(jié)果。盡管該方法降低了轉(zhuǎn)錄文本中的誤差概率,但是仍必需由校正操作人員進(jìn)行隨后耗時的檢查。
US 6064961專利文獻(xiàn)公開了這樣一種用于將所轉(zhuǎn)錄的文本示出在窗中以進(jìn)行檢查的方法,在該方法中當(dāng)前正在檢查中的文本段總是出現(xiàn)在窗中所定義的且所集中的位置上。這便于對所轉(zhuǎn)錄的文本進(jìn)行校對,這最好也只不過使其略微的加快。
本發(fā)明的一個目的就是通過改進(jìn)耗時的校正法而使用于轉(zhuǎn)錄口授的方法加速,以便盡可能快的將即就是精加工文本這樣的轉(zhuǎn)錄結(jié)果傳送給口授作者。同時還可降低轉(zhuǎn)錄的成本。
本發(fā)明的另一個目的在于創(chuàng)建一種用于轉(zhuǎn)錄口授的轉(zhuǎn)錄系統(tǒng),該轉(zhuǎn)錄系統(tǒng)使轉(zhuǎn)錄盡可能的最快且最有效,以便盡可能快速的且無差錯的使口授作者得到精加工的文本。
通過這樣一種方法而實(shí)現(xiàn)了本發(fā)明的目的,即在該方法中產(chǎn)生了與其可靠性有關(guān)的所轉(zhuǎn)換或者所轉(zhuǎn)錄文本片段信息并且為相關(guān)的文本片段產(chǎn)生了一置信值,并且只有在其置信值低于置信界限的文本片段的情況下,即存在其被識別為可能是有錯誤的文本片段的情況下,才將文本文件與口授文件進(jìn)行比較。由于盡可能的為所轉(zhuǎn)錄的文本片段確定置信值這樣有利的附帶條件,因此當(dāng)校正所錄制的文本時利用該方法可節(jié)省相當(dāng)大的時間。當(dāng)應(yīng)用根據(jù)本發(fā)明的方法時,經(jīng)驗(yàn)表明校正操作人員只需聽到10%-20%的口授。
另外的好處是被識別為可能是有錯誤的文本片段被標(biāo)記。這例如可通過在成問題的文本片段下劃線或者通過彩色標(biāo)記以使其加亮來實(shí)現(xiàn)的。
最好是利用語音識別設(shè)備自動將口授文件轉(zhuǎn)換成文本文件。
根據(jù)本發(fā)明的進(jìn)一步特征,提供了在校正過程期間在對文本文件與口授文件進(jìn)行比較時可根據(jù)相關(guān)轉(zhuǎn)錄文本片段的置信值來改變口授的播放速度。在這里,相關(guān)性根據(jù)被識別為可能是有錯誤的文本片段的標(biāo)記而可以是多階段的。例如,在其被識別為很可能是有錯誤的文本片段情況下,播放速度相當(dāng)大的降低了,然而在其被識別為不太可能是有錯誤的文本片段情況下,口授的播放速度增至所規(guī)定的最大值。例如,播放速度可以在正常的50%和200%之間變化。
如果可有利的設(shè)置置信界限,那么可使效率進(jìn)一步增加。
為了改進(jìn)最終結(jié)果,可利用已增加的置信界限來重復(fù)對文本文件和口授文件進(jìn)行比較,以便只識別其具有高錯誤概率的文本片段,并且只對這些錯誤進(jìn)行校正。盡管由于第二比較過程而使轉(zhuǎn)錄的總時間增加了,但是這對某些應(yīng)用或者乃至所規(guī)定的應(yīng)用都是非常有利的。
本發(fā)明的目的還可通過這樣一種用于轉(zhuǎn)錄口授的轉(zhuǎn)錄系統(tǒng)來實(shí)現(xiàn),該轉(zhuǎn)錄系統(tǒng)包括用于將口授文件轉(zhuǎn)換成其具有文本片段的文本文件的轉(zhuǎn)換裝置,包括用于對文本文件和口授文件進(jìn)行比較的文件比較裝置,包括用于為每個所轉(zhuǎn)換的文本片段產(chǎn)生一置信值的置信值產(chǎn)生裝置,并且還包括用于對置信值和置信界限進(jìn)行比較的比較裝置,在該轉(zhuǎn)錄系統(tǒng)中文件比較裝置僅在其置信值低于置信界限的文本片段的情況下對文本文件和口授文件進(jìn)行比較,也就是說文件比較裝置在存在其被識別為可能是有錯誤的文本片段的情況下進(jìn)行比較。
因此,有利的提供了用于對其被識別為可能是有錯誤的文本片段進(jìn)行標(biāo)記的標(biāo)記裝置。該標(biāo)記在轉(zhuǎn)錄的過程中可以作為被分配給所識別文本片段的置信值的函數(shù)。標(biāo)記例如可用于加亮其置信值低于置信界限的其被識別為可能是有錯誤的文本片段。
以語音識別設(shè)備形式的用于將口授文件轉(zhuǎn)換成文本文件的裝置是有利的。
對于本發(fā)明的一個實(shí)施例而言,提供了這樣一種設(shè)備,該設(shè)備改變口授文件的播放速度作為被識別為可能是有錯誤的文本片段的函數(shù)。播放速度的改變可以在兩個固定值之間或者若干個值之間進(jìn)行作為對特定轉(zhuǎn)錄文本片段的置信值和置信界限的比較結(jié)果的函數(shù)。
還有利的提供了用于輸入置信界限并且從而改變置信界限的這樣一個裝置,利用該裝置還可使特定文本片段的置信值與特定要求相匹配或者根據(jù)校正操作人員的經(jīng)驗(yàn)而使其相匹配。此外,可提供與所改變的置信界限相一致的校正。
為了使口授的作者便于最后的校正,還提供了這樣一個裝置,該裝置用于對這樣一種轉(zhuǎn)錄文本中的其被識別為可能是有錯誤的文本片段進(jìn)行加權(quán),該轉(zhuǎn)錄文件即就是其內(nèi)存在有可能錯誤或者不一致性??谑诘淖髡咭部墒褂眠@些裝置以進(jìn)行最后的校正以便向校正操作人員指出即使是在校正之后哪個文本片段仍然是有錯誤的,其結(jié)果是,將對轉(zhuǎn)錄處理來說是很重要的信息集聚在一起。
另外參考附圖中所示出的實(shí)施例對本發(fā)明進(jìn)行詳細(xì)的描述,然而,本發(fā)明并不局限于此。
圖1給出了傳統(tǒng)的轉(zhuǎn)錄系統(tǒng)的方框圖;圖2給出了利用其被識別為可能是有錯誤的文本片段來對文本文件進(jìn)行校正之后的流程圖;圖3給出了用于對所轉(zhuǎn)錄的文本進(jìn)行校正的傳統(tǒng)方法的流程圖;圖4給出了根據(jù)本發(fā)明的用于對所轉(zhuǎn)錄的文本進(jìn)行校正的方法的兩種變型;圖5示意性的給出了在根據(jù)本發(fā)明的方法中用于改變置信界限的方法;圖6給出了根據(jù)發(fā)明的轉(zhuǎn)錄系統(tǒng)的一部分的方框圖。
圖1示意性的給出了轉(zhuǎn)錄系統(tǒng)T的方框圖,作者A利用該轉(zhuǎn)錄系統(tǒng)可創(chuàng)建其存儲在口授設(shè)備1或者個人計算機(jī)2或者便攜式計算機(jī)3中的一口授。作者A還可口授到電話4中,此后將該口授例如存儲在中央計算機(jī)中。口授設(shè)備1提供了其包含有數(shù)字語音信號的口授文件5。這種其包含有數(shù)字語音信號的文件的合適格式例如是一WAV文件。同樣地,通過電話4所尋址的個人計算機(jī)2或者便攜式計算機(jī)3或者中央計算機(jī)提供了其包含有數(shù)字語音信號的相應(yīng)口授文件5。通常將口授文件5或者語音信號6送到語音識別設(shè)備7,在該語音識別設(shè)備7中將口授文件5或者語言信號6自動轉(zhuǎn)換成文本文件8。為了識別語音,語音識別設(shè)備7訪問這樣的信息數(shù)據(jù)庫9,即該信息數(shù)據(jù)庫中包含有其可被識別的多個可能的字。因此,應(yīng)當(dāng)考慮例如特定應(yīng)用范圍(例如醫(yī)藥領(lǐng)域)的語言分布圖以及句法。當(dāng)然,文本文件8包含若干有錯誤的或者不當(dāng)?shù)奈谋酒?,隨后必須對這些文本片段進(jìn)行校正。其結(jié)果是,將文本文件8傳送到為此目的所提供的文件比較裝置,在下面還將該文件比較裝置稱為校正設(shè)備。在校正設(shè)備10中,對文本文件8和口授文件5進(jìn)行比較,這通常是由校正操作人員來完成的,借此來播放或者再現(xiàn)作者A的聲信號,并且對文本文件8和屏幕上或者另一個顯示設(shè)備上所示出的文本文件8的文本進(jìn)行比較。該校正處理當(dāng)然需要異常大量的時間,并且占用了總處理時間的一大部分。經(jīng)常重復(fù)該校正處理至少一次。
圖3給出了用于對所轉(zhuǎn)錄文本進(jìn)行校正的傳統(tǒng)程序流程的流程圖400??谑谖募?的一部分語音信號6之上有文本文件8的五個文本片段W(n-3)、W(n-2)、W(n-1)、W(n)、以及W(n+1)。根據(jù)流程圖400的塊408,試圖開始語音信號6或者口授文件5,并且啟動播放口授文件5或者語音信號6以及例如在屏幕上同時顯示文本文件8。根據(jù)塊409,為了幫助校正操作人員進(jìn)行定位,根據(jù)語音信號6中的位置而沿著文本文件8的文本來移動光標(biāo)或者類似物,或者通過相關(guān)文本片段W(n)并且最多是通過先前文本片段W(n+1)以及隨后文本片段W(n-1)的對應(yīng)標(biāo)記而給出了文本中的當(dāng)前位置。根據(jù)塊410,例如通過在文本片段下劃線或者通過改變文本片段的顏色而使當(dāng)前文本片段加亮。校正操作人員讀取所顯示的文本文件8的文本并且同時聽取語音信號6,并且按照他的判斷來校正其是有錯誤的或者不當(dāng)?shù)奈谋酒?。例如通過用已校正的文本或者多個合適文本或者部分文本來覆蓋其被標(biāo)記為有錯誤的文本片段W(n)來進(jìn)行該校正。
繼校正處理之后,將校正文本11傳送到用于質(zhì)量控制的設(shè)備12。通常還由用于對口授文件5和已校正文本11進(jìn)行比較的操作人員來負(fù)責(zé)該質(zhì)量控制階段。最后,根據(jù)圖1中的塊14,將所檢查的文本文件13發(fā)送給作者A以細(xì)讀。這例如是由通過電子郵件來發(fā)送已校正的且已檢查過的文本文件13而完成的。一旦作者A檢查了文本,他將帶有這種意思的一消息發(fā)送到轉(zhuǎn)錄位置,因此例如通過發(fā)出清單而結(jié)束該轉(zhuǎn)錄。
根據(jù)塊14,在這種轉(zhuǎn)錄處理過程中很重要的是使記錄作者A的口授與接收到作者A所精加工的文本之間的時間間隔最小。在自動語言識別系統(tǒng)中,校正及任何質(zhì)量控制占用了大部分的時間間隔。因此主要的目的是減少時間間隔并且從而相當(dāng)大的縮短了整個轉(zhuǎn)錄處理,并且其結(jié)果是,使轉(zhuǎn)錄成本很低。
圖6給出了轉(zhuǎn)錄系統(tǒng)T的對于本發(fā)明很重要的這部分的方框圖。將口授文件5傳送到語音識別設(shè)備7并將其轉(zhuǎn)換成文本文件8,如結(jié)合圖1所描述的。語音識別設(shè)備7安裝有置信值產(chǎn)生裝置25,該置信值產(chǎn)生裝置用于為所轉(zhuǎn)換的文本片段W(n)產(chǎn)生一置信值。產(chǎn)生這種置信值是為本領(lǐng)域普通技術(shù)人員所熟知,并且例如按照A.Wendemuth,G.Rose,J.G.A.DaltingAdvances in ConfidenceMeasures for Large Vocabulary;Int.Conf.on Acoustic Speechand Signal Processing 1999來進(jìn)行處理。
參考該文件,其所公開的被認(rèn)為是也包含在這里。置信值產(chǎn)生裝置25所提供的置信值可以在零(0)至一千(1000)的置信值范圍內(nèi),由此一千(1000)置信值是指可以99.99%的可靠性來正確的識別或者轉(zhuǎn)錄文本片段W(n)。這里還提到了同樣可由諸如從零(0)至一百(100)這樣的不同范圍來表示置信值。
將所生成的文本文件8從語音識別設(shè)備7發(fā)送至下游校正設(shè)備10,該校正設(shè)備10用于顯示文本文件8并播放口授文件5,并且識別且標(biāo)記可能有錯誤的文本片段W(n)。校正設(shè)備10與顯示設(shè)備20以及輸入裝置19相連,該顯示設(shè)備20用于顯示文本文件8,該輸入裝置還用于手動的改變置信值。校正裝置10安裝有加權(quán)裝置21,提供該加權(quán)裝置并且其用于人工的對文本文件8的文本片段W(n)進(jìn)行加權(quán)。校正裝置10還配備有一設(shè)備22,該設(shè)備用于改變文本文件8的文本片段W(n)的播放速度。同時校正裝置10還包含有標(biāo)記裝置23和比較裝置24,該標(biāo)記裝置用于標(biāo)記文本片段W(n),比較裝置24用于對置信值和置信界限進(jìn)行比較。
圖2給出了根據(jù)本發(fā)明的在轉(zhuǎn)錄系統(tǒng)T的校正設(shè)備10中所運(yùn)行的處理的流程圖300。根據(jù)塊301,打開例如WAV文件的口授文件,并且根據(jù)塊302,在諸如屏幕這樣的顯示設(shè)備20中再現(xiàn)置信值或者置信信息。在標(biāo)記裝置23中根據(jù)圖6來表示置信信息或者來標(biāo)記文本片段,并且這是以各種方式來實(shí)現(xiàn)的,例如通過改變屏幕上所顯示的文本顏色、即通過根據(jù)相關(guān)的置信值而使文本片段W(n)著色、或者通過根據(jù)相關(guān)的置信值而使文本片段W(n)的背景著色。在這里,例如可根據(jù)這樣的線性顏色配置文件來確定文本片段W(n)的顏色顯示,即紅色表示最小的置信值、綠色表示最大的置信值。應(yīng)當(dāng)注意的是對文本片段W(n)進(jìn)行標(biāo)記還可間接的進(jìn)行,因?yàn)榕c所標(biāo)記的文本片段W(n)相比所有其他文本片段的顏色表示改變了。根據(jù)塊303,由用戶或者校正操作人員來選擇置信界限CG,并且根據(jù)塊304,檢查文本的可能錯誤。置信界限CG例如可以是最大置信值范圍的80%或者90%。因此,對于每個文本片段W(n)而言,在塊305進(jìn)行置信值差值C(n)是小于、等于、或者大于置信界限CG這樣的查詢。如果置信界限CG大,那么此后根據(jù)塊306,不對所選擇的可能有錯誤的文本片段W(n)進(jìn)行標(biāo)記。如果置信界限CG小于或者等于,那么對可能有錯誤的相應(yīng)文本片段W(n)進(jìn)行標(biāo)記。利用根據(jù)流程圖300所識別的文本文件8中的錯誤,可對所轉(zhuǎn)錄的文本或者文本文件8進(jìn)行更加迅速的校正。在校正過程中當(dāng)對文本文件8和口授文件5進(jìn)行比較時,按照這樣一種方式來進(jìn)行校正,即僅跳過其被識別為可能是有錯誤的文本片段,并且必須由校正操作人員來對其被識別為可能是有錯誤的文本片段進(jìn)行校正。以這種方法可節(jié)省大量的時間,因?yàn)樾U僮魅藛T不必聽取整個口授文件5。以這樣一種方法來進(jìn)行校正,即作為被識別為可能是有錯誤的文本片段的函數(shù)來改變口授或者口授文件5的播放速度,由此在其未被標(biāo)記為可能是有錯誤的文本片段的情況下可將播放速度例如增加到其兩倍,然而當(dāng)播放可能有錯誤的文本片段時會降低播放速度。
圖4給出了根據(jù)本發(fā)明的方法的兩種變型的流程圖500A和500B。再次示例性的給出了位于語音信號6之上的連續(xù)6個文本片段W(n-3)至W(n+2)的序列。在所示出的例子中,如陰影線所示的,即就是W(n-2)、W(n-1)、以及W(n+1)這三個正文片段被識別為可能是有錯誤的并且因此對其進(jìn)行標(biāo)記。
根據(jù)流程圖500A,根據(jù)塊511,打開與口授文件5相并行的文本文件8或者語音信號6并且對其進(jìn)行播放,并且根據(jù)塊512,顯示設(shè)備20示出了所轉(zhuǎn)錄的文本,該顯示設(shè)備20可以是一監(jiān)控器。根據(jù)塊513,在播放語言信號6或者口授文件5的過程中跳過其被分類為未有錯誤的那些文本片段,并且用于對從那兒到下一個連續(xù)的其被標(biāo)記為未有錯誤的正文片段進(jìn)行播放,因此出現(xiàn)跳躍以開始其被標(biāo)記為有錯誤的下一個文本片段W(n)。根據(jù)塊514,檢查是否已經(jīng)到達(dá)口授文件5或者文本文件8的結(jié)尾,由此如果該問題的確定結(jié)果是否定,那么繼續(xù)進(jìn)行到塊513,并且如果結(jié)果是肯定的,那么結(jié)束該流程。
根據(jù)流程圖500B,首先,根據(jù)塊520,啟動語音信號6或者口授文件5,同時接著此而啟動相關(guān)的文本文件8,并且根據(jù)塊521,開始播放語言信號6或者口授文件5。根據(jù)塊522,檢查是否已經(jīng)到達(dá)文本文件8或者口授文件5的結(jié)尾,由此,在肯定結(jié)果的情況下,結(jié)束該流程。否則,在塊522的檢查是否定結(jié)果的情況下,在塊523檢查正文片段W(n)是否已經(jīng)被標(biāo)記為有錯誤的,由此,在肯定結(jié)果的情況下,流程繼續(xù)到塊524,或者否則,跳過塊525。根據(jù)兩個塊524和塊525來改變播放語音信號6以及顯示文本文件8的播放速度。例如根據(jù)塊525,其被標(biāo)記為未有錯誤的正文片段W(n-3)、W(n)、以及W(n+2)的播放速度是正常播放速度的兩倍,并且根據(jù)塊524,將其被識別為可能有是錯誤的并且因此被標(biāo)記的文字片段W(n-2)、W(n-1)、以及W(n+1)的播放速度選為正常播放速度的一半。
圖5示例性的給出了利用其來人工的改變置信值的方法。再次以六個連續(xù)文本片段W(n-3)至W(n+2)的形成示出了文本文件8的一部分,并且在分布圖5中草擬了所自動產(chǎn)生的置信值的分布圖。根據(jù)分布圖15,文本片段W(n-2)、W(n)、以及W(n+2)具有比剩余的文本片段更低的置信值。如果校正操作人員現(xiàn)在根據(jù)分布圖16而人工的分配置信值,那么可對置信值分布圖進(jìn)行校正。例如,在播放文本文件8的過程中,校正操作人員可利用諸如鍵盤這樣的輸入裝置19來記錄文本片段W(n-2)和W(n)以及W(n+2)可能是有錯誤的。根據(jù)分布圖17,通過使自動所確定的置信值分布圖15和人工的置信值分配16組合在一起,產(chǎn)生了最終的置信值分布圖,并且其結(jié)果是只將文本片段W(n)分類成可能是有錯誤的。通過有經(jīng)驗(yàn)的校正操作人員的分配,可實(shí)現(xiàn)使其被識別為或者被分類為可能有錯誤的文本片段的數(shù)目極大的降低,這節(jié)省了隨后校正的時間。
根據(jù)本發(fā)明的用于轉(zhuǎn)錄口授的方法或者系統(tǒng)用于轉(zhuǎn)錄文本的傳統(tǒng)校正以及轉(zhuǎn)錄文本的質(zhì)量控制過程中。與傳統(tǒng)的必須傾聽整個口授的傳統(tǒng)校正法相比,經(jīng)驗(yàn)表明可使校正時間節(jié)省最多90%。
權(quán)利要求
1.一種用于轉(zhuǎn)錄口授的方法,在該方法中將口授文件(5)轉(zhuǎn)換成其具有文本片段(W(n))的文本文件(8),并且在該方法中對文本文件(8)與口授文件(5)進(jìn)行比較,在該方法中在轉(zhuǎn)換為轉(zhuǎn)換文本片段(8)的過程中產(chǎn)生了各個置信值,并且在該方法中只有在其置信值低于置信界限(CG)的那些文本片段(W(n))的情況下,即存在可能是有錯誤的文本片段(W(n))的情況下,才對文本文件(8)和口授文件(5)進(jìn)行比較。
2.根據(jù)權(quán)利要求1的方法,其中對其置信值低于置信界限(CG)的那些被識別為可能是有錯誤的文本片段(W(n))進(jìn)行標(biāo)記。
3.根據(jù)權(quán)利要求1的方法,其中利用語音識別設(shè)備(7)自動將口授文件(5)轉(zhuǎn)換成文本文件(8)。
4.根據(jù)權(quán)利要求1的方法,其中其置信值低于置信界限(CG)的那些被識別為可能是有錯誤的文本片段(W(n))具有加權(quán)因子。
5.根據(jù)權(quán)利要求1的方法,其中在對文本文件(8)和口授文件(5)進(jìn)行比較的過程中改變口授文件(5)的播放速度作為相關(guān)文本片段(W(n))的置信值的函數(shù)。
6.根據(jù)權(quán)利要求1的方法,其中置信界限(CG)是可調(diào)節(jié)的。
7.根據(jù)權(quán)利要求1的方法,其中隨著置信界限(CG)的增加而重復(fù)對文本文件(8)和口授文件(5)進(jìn)行比較。
8.一種用于轉(zhuǎn)錄口授的轉(zhuǎn)錄系統(tǒng)(T),該轉(zhuǎn)錄系統(tǒng)包括用于將口授文件(5)轉(zhuǎn)換成其具有文本片段(W(n))的文本文件的轉(zhuǎn)換裝置(7)、包括用于對文本文件(8)和口授文件(5)進(jìn)行比較的文件比較裝置(10)、包括用于為每個所轉(zhuǎn)換的文本片段(W(n))產(chǎn)生一置信值的置信值產(chǎn)生裝置(25)、并且還包括用于對置信值和置信界限(CG)進(jìn)行比較的比較裝置(24),在該轉(zhuǎn)錄系統(tǒng)中文件比較裝置(10)僅在其置信值低于置信界限(CG)的那些文本片段(W(n))的情況下,也就是說文件比較裝置在存在被識別為可能是有錯誤的文本片段的情況下對文本文件(8)和口授文件(5)進(jìn)行比較。
9.根據(jù)權(quán)利要求8的專利系統(tǒng)(T),其中還提供了標(biāo)記裝置(23)以用于對其置信值低于置信界限(CG)的那些其被識別為可能是有錯誤的文本片段(W(n))進(jìn)行標(biāo)記。
10.根據(jù)權(quán)利要求8的專利系統(tǒng)(T),其中用于將口授文件(5)轉(zhuǎn)換成文本文件(8)的轉(zhuǎn)換裝置(7)是以語音識別設(shè)備的形式。
11.根據(jù)權(quán)利要求8的專利系統(tǒng)(T),其中提供了用于對文本文件(8)的文本片段(W(n))進(jìn)行加權(quán)的裝置(21)。
12.根據(jù)權(quán)利要求8的專利系統(tǒng)(T),其中提供了這樣一種設(shè)備(22),該設(shè)備在對文本文件(8)和口授文件(5)進(jìn)行比較的過程中改變口授文件(5)的播放速度作為對相關(guān)文本片段(W(n))的置信值和置信界限(CG)的比較結(jié)果的函數(shù)。
13.根據(jù)權(quán)利要求8的專利系統(tǒng)(T),其中提供了用于輸入置信界限(CG)的裝置(19)。
全文摘要
該發(fā)明涉及一種用于轉(zhuǎn)錄口授的方法及轉(zhuǎn)錄系統(tǒng)(T),在該方法和系統(tǒng)中將口授文件(5)轉(zhuǎn)換成文本文件(8),并且隨后對文本文件(8)和口授文件(5)進(jìn)行比較。為了提高隨后的校正速度,在轉(zhuǎn)錄口授文件(5)過程中為文本文件(8)的所轉(zhuǎn)錄文本片段產(chǎn)生一置信值,并且只有在其文本片段的置信值低于置信界限的情況下,也就是說存在其被識別為可能是有錯誤的文本片段的情況下,對文本文件(8)和口授文件(5)進(jìn)行比較。
文檔編號G06F3/16GK1578976SQ02821769
公開日2005年2月9日 申請日期2002年10月24日 優(yōu)先權(quán)日2001年10月31日
發(fā)明者K·弗里龐-安薩 申請人:皇家飛利浦電子股份有限公司