欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于聽(tīng)者和說(shuō)者的講話風(fēng)格比較估計(jì)聽(tīng)者理解說(shuō)者的能力的制作方法

文檔序號(hào):7713633閱讀:294來(lái)源:國(guó)知局
專利名稱:基于聽(tīng)者和說(shuō)者的講話風(fēng)格比較估計(jì)聽(tīng)者理解說(shuō)者的能力的制作方法
技術(shù)領(lǐng)域
一個(gè)示例性方面涉及對(duì)通信的改進(jìn)。更具體地,一個(gè)示例性方面涉及輔助在諸如會(huì)議電話之類的通信環(huán)境中的各方之間的可理解性(imderstandability)。
背景技術(shù)
即使兩個(gè)人使用相同的語(yǔ)言講話,并且精通該語(yǔ)言的詞匯和語(yǔ)法,然而他們說(shuō)話方式之間的差異,例如,口音、發(fā)音準(zhǔn)確度、韻律、語(yǔ)音、語(yǔ)調(diào)、節(jié)奏、聲調(diào),協(xié)同發(fā)音、音節(jié)重讀,音節(jié)持續(xù)時(shí)間等等的差異,可以影響他們理解對(duì)方講話的容易度。雖然這些差異可發(fā)生在作為使用同一語(yǔ)言的母語(yǔ)講話者的人們當(dāng)中,但是,當(dāng)由于一個(gè)談話者習(xí)慣的是聽(tīng)者所習(xí)慣的語(yǔ)言以外的語(yǔ)言而使得該談話者的講話模式受到了影響時(shí),這種問(wèn)題可能尤其明
Mo

發(fā)明內(nèi)容
發(fā)生該情況的一個(gè)很有意思的場(chǎng)景是在離岸聯(lián)絡(luò)中心(off-shore contact center)0當(dāng)具有不同說(shuō)話方式的人們之間面對(duì)面地進(jìn)行交談時(shí),講話者可以觀察聽(tīng)者并且接收到非口頭的關(guān)于他們是否被理解的反饋。察覺(jué)到聽(tīng)者有困難時(shí)講話者可以調(diào)整他或她的說(shuō)話方式,并且然后從接下來(lái)的非口頭反饋中感覺(jué)這(一種或多種)調(diào)整是否有幫助。重點(diǎn)在于,在面對(duì)面的交談中,有一個(gè)持續(xù)的反饋和調(diào)整循環(huán)。如同各種各樣的其它領(lǐng)域中的系統(tǒng)一樣,可以預(yù)期到持續(xù)的反饋和調(diào)整循環(huán)的缺少會(huì)引起“漂移(drift),,一在這種情況下,講話者越來(lái)越遠(yuǎn)地偏離了聽(tīng)者最容易懂的講話風(fēng)格。被認(rèn)為可能導(dǎo)致這種漂移的因素包括講話者的情感狀態(tài),對(duì)迅速表達(dá)觀點(diǎn)的期望,以及講話者是否做出了刻意努力去以聽(tīng)者-友好的方式說(shuō)話。這里討論的實(shí)施例所解決的一個(gè)問(wèn)題是存在于僅語(yǔ)音的電話交談中的唯一反饋機(jī)制是來(lái)自聽(tīng)者的口頭反饋一由于它打斷了交談的流暢并被一些人認(rèn)為是粗魯?shù)?,因此這個(gè)選擇很少被使用??捎眉夹g(shù)涉及基于計(jì)算機(jī)的系統(tǒng),其中該系統(tǒng)“聆聽(tīng)”正在學(xué)習(xí)說(shuō)外語(yǔ)的人并且向他們提供關(guān)于該學(xué)生發(fā)音錯(cuò)誤的反饋。類似的系統(tǒng)被喪失聽(tīng)力的人所使用,給予他們關(guān)于如何提高他們的講話的可理解性的指導(dǎo)。在這里討論的實(shí)施例和幫助學(xué)生的自動(dòng)化技術(shù)之間的根本區(qū)別是,用于學(xué)生的幫助軟件將學(xué)生的講話與描述了完美發(fā)音的模板做比較。通過(guò)比較,實(shí)施例分析電話中的一個(gè)或多個(gè)通話方的說(shuō)話風(fēng)格,并且基于他或她的說(shuō)話風(fēng)格與聽(tīng)者的說(shuō)話風(fēng)格的不同程度來(lái)提供反饋給講話者。例如,對(duì)于一個(gè)從書(shū)本上學(xué)習(xí)法語(yǔ)的美國(guó)人來(lái)說(shuō)去理解一個(gè)說(shuō)著完美法語(yǔ)的人是很困難的,但是去理解一個(gè)以類似于聽(tīng)者說(shuō)法語(yǔ)的速度(即,非常慢),帶有和所述聽(tīng)者相似的夸張美國(guó)人風(fēng)格的口音說(shuō)出來(lái)的法語(yǔ)是相對(duì)簡(jiǎn)單的。另一有意思的場(chǎng)景是在空中交通控制領(lǐng)域。更具體地,世界上所有控制員都被要求說(shuō)英語(yǔ)。這明顯呈現(xiàn)出一種潛在的危險(xiǎn)情況并且提供了另一種環(huán)境,在這種環(huán)境中,這里所討論的技術(shù)可能是有用的。在這個(gè)場(chǎng)景中,中國(guó)人向德國(guó)人講英語(yǔ)的想法并不那么牽強(qiáng)。因此,一個(gè)示例性方面涉及一種自動(dòng)通訊系統(tǒng)附件,該附件“聆聽(tīng)” 一個(gè)或多個(gè)參與者的說(shuō)話風(fēng)格,標(biāo)識(shí)表示他們的風(fēng)格的差異的具體特性,特別是口音,但也包括發(fā)音準(zhǔn)確性,語(yǔ)速,語(yǔ)調(diào),節(jié)奏,聲調(diào),協(xié)同發(fā)音,音節(jié)重讀,音節(jié)持續(xù)時(shí)間,語(yǔ)法,詞匯(或者有限的詞匯的識(shí)別)以及習(xí)語(yǔ)(idiom)中的一者或多者,并且例如利用對(duì)可能影響特定聽(tīng)者的可理解性的獨(dú)立可測(cè)量講話分量進(jìn)行適當(dāng)加權(quán)并且然后組合成指示所估計(jì)出的聽(tīng)者可理解所說(shuō)內(nèi)容的容易度的單個(gè)整體評(píng)分的數(shù)學(xué)模型,并且基于該評(píng)分向講話者呈現(xiàn)實(shí)時(shí)反饋。此外,該系統(tǒng)可以為講話者提供關(guān)于如何提高可理解性的建議。根據(jù)另一個(gè)示例性實(shí)施例,一種分析可以被執(zhí)行來(lái)判斷信號(hào)的減弱是否也可能導(dǎo)致可懂性問(wèn)題,例如分組丟失,延遲時(shí)間,噪聲,等等。此外,交談動(dòng)態(tài)也可被分析,例如聽(tīng)者是否正說(shuō)“你可以再說(shuō)一遍么”或者,相反,表現(xiàn)出完全沉浸在交談中,這兩者都給出了聽(tīng)者理解講話者的能力的暗示。在語(yǔ)音識(shí)別技術(shù)中,隱式馬可夫模型(HMM)被用來(lái)分析樣本,并且在這之后執(zhí)行統(tǒng)計(jì)分析。此外,該模型被用作與模板進(jìn)行比較的一種匹配處理。通常地,隱式馬可夫模型是輸出符號(hào)或數(shù)量序列的統(tǒng)計(jì)模型。通過(guò)HMM建模的講話信號(hào)可以被看作是分段平穩(wěn) (stationary)信號(hào)或短期平穩(wěn)信號(hào)。這就是說(shuō),可以假設(shè)在例如10毫秒范圍的短時(shí)間內(nèi), 語(yǔ)音可以被近似成平穩(wěn)過(guò)程。因此對(duì)于許多隨機(jī)過(guò)程,語(yǔ)音可被認(rèn)為是馬可夫模型。HMM的另一個(gè)優(yōu)點(diǎn)是它們可以自動(dòng)被訓(xùn)練并且使用時(shí)是簡(jiǎn)單的并在計(jì)算上是可行的。在語(yǔ)音識(shí)別時(shí),HMM可以輸出一 N維實(shí)數(shù)值向量序列,每χ毫秒輸出其中一個(gè)。這些向量可以由倒譜系數(shù)(c印stral coefficient)組成,這些倒譜系數(shù)是通過(guò)對(duì)語(yǔ)音進(jìn)行短時(shí)窗的傅里葉變換并且使用余弦變換對(duì)頻譜進(jìn)行去相關(guān),然后挑選第一(最重要的)系數(shù)而得到的。(美爾頻率倒譜(MFC)是聲音的短期功率譜的表示,其是基于非線性美爾頻率范圍上的對(duì)數(shù)功率譜的線性余弦變換的一美爾頻率倒譜系數(shù)(MFCC)是總體地構(gòu)成MFC的系數(shù)。 MFCC通常被用作語(yǔ)音識(shí)別系統(tǒng),例如可以自動(dòng)識(shí)別對(duì)電話講出的數(shù)字的系統(tǒng)中的特征。在任務(wù)是從聲音來(lái)識(shí)別人的講話者識(shí)別中它們也是普遍的。)HMM將趨向于在每個(gè)狀態(tài)中具有一個(gè)統(tǒng)計(jì)分布,其中該統(tǒng)計(jì)分布是將對(duì)每一個(gè)所觀察向量給出似然性的對(duì)角協(xié)變高斯分布(diagonal covariant gaussians)的混合。每個(gè)詞,或者對(duì)更通用的語(yǔ)音識(shí)別系統(tǒng)而言,每個(gè)音節(jié),都將具有不同的輸出分布;用于詞或音節(jié)序列的隱式馬可夫模型是通過(guò)連接用于分離的詞或音節(jié)的各個(gè)已訓(xùn)練的隱式馬可夫模型而得到的。在這里描述的方面的一個(gè)潛在假設(shè)是,如果口音被確定是相同的或非常相似的, 那么兩個(gè)說(shuō)著口音很重的英語(yǔ)的人理解對(duì)方是沒(méi)有問(wèn)題的。另一方面,如果系統(tǒng)確定說(shuō)話風(fēng)格顯著不同,例如,如果一個(gè)人說(shuō)著帶有印度口音的英語(yǔ)而另一個(gè)人說(shuō)著帶有西班牙口音的英語(yǔ),則系統(tǒng)將向講話者提供關(guān)于所估計(jì)出的聽(tīng)者對(duì)他或她的語(yǔ)音的“可理解性”的實(shí)時(shí)反饋。一個(gè)重要方面是提供實(shí)時(shí)反饋和使得該反饋實(shí)質(zhì)上持續(xù)的能力。重申上面討論的任何問(wèn)題,可以預(yù)期到持續(xù)的反饋和調(diào)整循環(huán)的缺失會(huì)導(dǎo)致講話者越來(lái)越遠(yuǎn)地偏離了聽(tīng)者最容易懂的講話風(fēng)格。在簡(jiǎn)單的實(shí)現(xiàn)方式中,給講話者的反饋可以是持續(xù)被更新的“可理解性”評(píng)分,其可以表現(xiàn)為例如電話的字母數(shù)字顯示裝置上的數(shù)字或滑塊(sliding bar)或可理解度的其它標(biāo)記。在更復(fù)雜的實(shí)現(xiàn)方式中,利用標(biāo)準(zhǔn)的字母數(shù)字顯示裝置和/或圖形用戶界面,系統(tǒng)將會(huì)提出講話者可以執(zhí)行的具體動(dòng)作,例如“減慢速度”或者“強(qiáng)調(diào)以h開(kāi)頭的單詞中的 “h””。一種替代實(shí)現(xiàn)方式可以提供非視覺(jué)形式的反饋,例如通過(guò)只能被正在說(shuō)話的人聽(tīng)到的“耳語(yǔ)”機(jī)構(gòu)。如果與用戶的電話端點(diǎn)相關(guān)聯(lián)的顯示器可以呈現(xiàn)可頻繁刷新的復(fù)雜圖像,那么更加復(fù)雜的反饋機(jī)制就變得切實(shí)可行。例如,不是將反饋限制在信號(hào)的一維可理解性評(píng)分,這類顯示器可以通過(guò)多維視圖來(lái)補(bǔ)充可理解性評(píng)分,其中組成整體可理解性的獨(dú)立可測(cè)量分量被單獨(dú)地顯示出來(lái)。例如,反饋可以通過(guò)柱狀圖被提供,其中與獨(dú)立因素有關(guān)的評(píng)分在伸長(zhǎng)和縮短的分離的條柱中被指示出。講話者可以觀察這些單獨(dú)的條柱,嘗試對(duì)他們的講話做出特定于因素的調(diào)整,并且接著觀察這些調(diào)整是否是有益的。記住,一些因素比其它因素對(duì)講話的可理解性具有更大的影響,并且還注意,可以期望因素的重要性取決于講話者/收聽(tīng)者失配的性質(zhì)進(jìn)行改變,這種顯示器的一個(gè)示例性實(shí)施例將指示出哪些因素應(yīng)該被講話者優(yōu)先地或較優(yōu)先地考慮。另一示例性實(shí)施例包括特定于人口的模板,當(dāng)收聽(tīng)者的說(shuō)話風(fēng)格不能被取樣時(shí), 該模板能夠用作用于講話者/收聽(tīng)者比較的基礎(chǔ)。可使用該方法的一個(gè)例子是,通用的“德國(guó)收聽(tīng)者”模板可被用作針對(duì)正用英語(yǔ)向德國(guó)聽(tīng)眾發(fā)言的中國(guó)講話者的一種輔助。類似地, 比較不必必須實(shí)時(shí)地執(zhí)行,而是可以基于與講話者有關(guān)的簡(jiǎn)檔,該簡(jiǎn)檔是從該講話者已經(jīng)進(jìn)行的一個(gè)或多個(gè)先前談話得出的。根據(jù)另一個(gè)示例性實(shí)施例,并且在上述的識(shí)別出說(shuō)話風(fēng)格可基于講話者的活躍度、講話者所說(shuō)的內(nèi)容等等而變化的實(shí)現(xiàn)方式上進(jìn)行擴(kuò)展,多個(gè)簡(jiǎn)檔可被與用戶相關(guān)聯(lián),其中每個(gè)簡(jiǎn)檔被聯(lián)系到一種具體風(fēng)格。例如,如果講話者正對(duì)朋友說(shuō)話,則開(kāi)始點(diǎn)可以是基于聽(tīng)者、上下文以及談話內(nèi)容中的一者或多者的簡(jiǎn)檔,其中該朋友可以通過(guò)聯(lián)系方式或呼叫方ID信息來(lái)被確定。例如,如果參與者A正在呼叫參與者B,并且正在討論喜歡的愛(ài)好,則與參與者A和B都有關(guān)的簡(jiǎn)檔可以被檢索到,其中這些簡(jiǎn)檔是特定于正討論的愛(ài)好的。歷史簡(jiǎn)檔信息可以被作為用于基于一個(gè)或多個(gè)先前談話來(lái)提供反饋的基準(zhǔn)。以類似的方式, 如果參與者A正與參與者B和C討論與工作有關(guān)的具體涉及到特定項(xiàng)目的項(xiàng),則在通話開(kāi)始時(shí),講話者可以被提醒關(guān)于哪些可理解性問(wèn)題已在一次或多次先前談話中存在,從而給另兩個(gè)參與者提供更即時(shí)的理解方面的幫助。因此,一個(gè)示例性方面涉及分析例如電話通話中的一方或多方的講話風(fēng)格,并且向所有講話者提供基于他們的講話與收聽(tīng)者的講話的不同程度的、可執(zhí)行的持續(xù)的實(shí)時(shí)反饋。其它方面涉及利用談話動(dòng)態(tài)來(lái)輔助向講話者提供關(guān)于他們的講話的可理解性的反饋。另外的方面涉及利用信道特性作為輸入并且分析講話者的可理解性。其它方面涉及以視覺(jué)的、非視覺(jué)的和/或口頭形式中的一者或多者向講話者提供有關(guān)他們的講話的可理解性的實(shí)時(shí)反饋。其它方面涉及當(dāng)不能直接對(duì)聽(tīng)者的講話風(fēng)格進(jìn)行取樣時(shí),利用特定于人口的模板來(lái)作為講話者/聽(tīng)者比較的基礎(chǔ)。
其它方面涉及利用特定于人口的模板來(lái)在一個(gè)國(guó)籍的講話者正向另一國(guó)籍的聽(tīng)者發(fā)言的場(chǎng)合中提供幫助。其它方面涉及檢測(cè)講話風(fēng)格的差別,例如口音、發(fā)音準(zhǔn)確度、語(yǔ)速、語(yǔ)調(diào)、節(jié)奏、聲調(diào)、協(xié)同發(fā)音、音節(jié)重讀以及音節(jié)持續(xù)時(shí)間,并且提供對(duì)參與談話的一方或多方的相互可理解性的指示。將從這里包含的內(nèi)容中清楚這些和其它的優(yōu)點(diǎn)。上述的實(shí)施例和配置既不是全部的也不是詳盡的。如將會(huì)理解的,本發(fā)明的其它實(shí)施例可以單獨(dú)地或聯(lián)合地利用上述的或接下來(lái)將要詳述的特征中的一個(gè)或多個(gè)。正如這里所使用的,“至少一個(gè)”、“一個(gè)或多個(gè)”以及“和/或”是在運(yùn)用時(shí)既連接又分離的開(kāi)放式表達(dá)。例如,如下表達(dá)“A、B和C中的至少一個(gè)”、“A、B或C中的至少一個(gè)”、 “A、B和C中的一個(gè)或多個(gè)”、“A、B或C中的一個(gè)或多個(gè)”以及“A、B禾Π /或C”中的每一種的意思是A單獨(dú)的、B單獨(dú)的、C單獨(dú)的、A和B —起、A和C 一起、B和C 一起或者A、B和C一起。


本發(fā)明的示例實(shí)施方式將參考以下附圖進(jìn)行詳細(xì)描述,其中圖1圖示出了示例性通信環(huán)境;圖2是圖示出用來(lái)增強(qiáng)兩個(gè)參與者之間的可理解性的示例性方法的流程圖;以及圖3是圖示出用來(lái)增強(qiáng)若干個(gè)參與者之間的可理解性的示例性方法的流程圖。
具體實(shí)施例方式下面將結(jié)合示例性通信系統(tǒng)來(lái)圖示說(shuō)明一些實(shí)施例。雖然在具有諸如(一個(gè)或多個(gè))交換機(jī)、(一個(gè)或多個(gè))服務(wù)器和/或(一個(gè)或多個(gè))數(shù)據(jù)庫(kù)的系統(tǒng)中使用是很合適的,但是實(shí)施例并不局限于用于任何特殊類型的通信系統(tǒng)或系統(tǒng)部件的配置。本領(lǐng)域的技術(shù)人員將會(huì)認(rèn)識(shí)到,所公開(kāi)的技術(shù)可以用在希望提供增強(qiáng)的另一方對(duì)一方的可理解性的任何通信應(yīng)用中。首先參考圖1,將根據(jù)至少一些實(shí)施例來(lái)描述示例性通信環(huán)境1。該通信系統(tǒng)包括一通信網(wǎng)絡(luò),該通信網(wǎng)絡(luò)可選地將多個(gè)通信設(shè)備例如連接到會(huì)議橋接器。在一個(gè)實(shí)施例中,通信系統(tǒng)可以包括交換機(jī),該交換機(jī)可以包括專用小交換機(jī) (PBX)系統(tǒng)或者能夠提供電話服務(wù)給與該交換機(jī)相關(guān)聯(lián)的一個(gè)或多個(gè)諸如企業(yè)之類的實(shí)體的任何類似類型的交換系統(tǒng)。交換機(jī)可以是多個(gè)已知交換系統(tǒng)中的一個(gè),其中多個(gè)已知交換系統(tǒng)包括但并不局限于專用自動(dòng)小交換機(jī)(PABX)、計(jì)算機(jī)化小交換機(jī)(CBX)、數(shù)字小交換機(jī)(DBX),或者集成小交換機(jī)(IBX)。交換機(jī)也可以包括交換結(jié)構(gòu),該交換結(jié)構(gòu)提供諸如與會(huì)議橋接器相關(guān)聯(lián)的通信設(shè)備之類的多個(gè)端點(diǎn)、服務(wù)器和數(shù)據(jù)庫(kù)的連接。該交換結(jié)構(gòu)可以提供將來(lái)電和/或去電引導(dǎo)至各個(gè)端點(diǎn)的功能并且還提供端點(diǎn)之間的會(huì)議功能。在另一實(shí)施例中,例如上述的空中交通場(chǎng)景中,端點(diǎn)可能是無(wú)線電或類似的通信設(shè)備并且通信網(wǎng)是無(wú)線/有線網(wǎng)絡(luò)。在該場(chǎng)景中,這里公開(kāi)的技術(shù)可在機(jī)場(chǎng)信號(hào)樓等地方實(shí)現(xiàn)。通常,這里公開(kāi)的技術(shù)可以位于用于服務(wù)一個(gè)或多個(gè)端點(diǎn)的任何合適的地方。與參與者相關(guān)聯(lián)的通信設(shè)備可以是分組交換式的或電路交換式的,并且可以包括,例如,如Avaya公司的4600系列IP電話 之類的IP硬電話,如Avaya公司的IP軟電話 之類的IP軟電話,個(gè)人數(shù)字助理或PDA,個(gè)人電腦或者PC,筆記本電腦,基于分組的H. 320 視頻電話以及會(huì)議單元,基于分組的語(yǔ)音消息傳輸和響應(yīng)單元,基于分組的傳統(tǒng)計(jì)算機(jī)電話附屬物,和傳統(tǒng)的有線或無(wú)線電話。圖1圖示出了示例性通信環(huán)境。該通信環(huán)境1包括可理解性增強(qiáng)系統(tǒng)100,具有可選的反饋設(shè)備210的端點(diǎn)A 200和具有可選的反饋設(shè)備310的端點(diǎn)B 300,它們通過(guò)一個(gè)或多個(gè)網(wǎng)絡(luò)10和鏈路5相互連接。可理解性增強(qiáng)系統(tǒng)100包括分析模塊110、簡(jiǎn)檔模塊120、 控制器130、存儲(chǔ)器140、存儲(chǔ)裝置150、建模模塊160、反饋模塊170、關(guān)鍵詞模塊180、參與度(engagement)模塊190,以及信號(hào)質(zhì)量模塊195??衫斫庑栽鰪?qiáng)系統(tǒng)100還包括建議數(shù)據(jù)庫(kù)或貯藏庫(kù)105。如所討論的,示例性實(shí)施例貫涉及增強(qiáng)各方之間的通信可理解性。為了促進(jìn)該好處,一個(gè)示例性實(shí)施例利用與端點(diǎn)相關(guān)聯(lián)的一個(gè)或多個(gè)反饋設(shè)備來(lái)向與端點(diǎn)相關(guān)聯(lián)的人提供一個(gè)或多個(gè)可聽(tīng)見(jiàn)的,視頻的,或多媒體的反饋,如后面將討論的。具體地,并且在操作中,諸如與端點(diǎn)A 200相關(guān)聯(lián)的參與者A以及與端點(diǎn)B 300相關(guān)聯(lián)的參與者B之類的人建立起通信會(huì)話。這些端點(diǎn)可以是任何類型的通信設(shè)備,例如電話,智能電話、具有多媒體能力的端點(diǎn)、揚(yáng)聲器電話、蜂窩電話,或者一般地,允許通過(guò)一個(gè)或多個(gè)網(wǎng)絡(luò)10和鏈路5通信的任何類型的通信設(shè)備。例如,可以通過(guò)公共交換電話網(wǎng)絡(luò)、 分組交換電話網(wǎng)絡(luò)、通過(guò)V0IP,利用SIP來(lái)進(jìn)行通信,或者通常地通過(guò)任何類型的通信協(xié)議或形態(tài)來(lái)進(jìn)行通信。為了有助于增強(qiáng)可理解性,并且在通信會(huì)話開(kāi)始之后或者與之相當(dāng)時(shí),與簡(jiǎn)檔模塊120協(xié)作的分析模塊110開(kāi)始監(jiān)聽(tīng)參與者A的講話。此外,分析模塊110開(kāi)始監(jiān)聽(tīng)參與者B的講話。如將會(huì)理解的,在通信會(huì)話開(kāi)始時(shí),幾乎沒(méi)有數(shù)據(jù)可用來(lái)幫助提供關(guān)于其它方對(duì)講話者的可理解性的反饋。因此,根據(jù)一個(gè)示例性實(shí)施例,并且與簡(jiǎn)檔模型120,控制器130,存儲(chǔ)器140,以及存儲(chǔ)裝置150進(jìn)行協(xié)作,可以檢索到個(gè)人簡(jiǎn)檔和模板中的一個(gè)或多個(gè),其具有例如關(guān)于講話者的講話特性的歷史信息。這些歷史示例可以基于例如一個(gè)或多個(gè)先前的談話,可以包括該特定講話者的講話特性的總結(jié),并且可選地可以是更具體的,例如基于情景和/或交談的。例如,分析模塊110可以識(shí)別出通信會(huì)話是在已經(jīng)有過(guò)先前的(一次或多次)交談的兩方之間。在這一次或多次先前的交談期間,可理解性信息在簡(jiǎn)檔模型120的幫助下可以被遵從(comply)并被存儲(chǔ)。因此,當(dāng)兩方再次開(kāi)始通信會(huì)話時(shí),該先前的歷史信息可以被檢索回并被利用來(lái),正如以下所討論的,為多方中的一者或多者提供反饋。根據(jù)一個(gè)示例性實(shí)施例,并且在通信會(huì)話開(kāi)始時(shí),參與者可以被提供具有提高了該聽(tīng)者的可理解性的、與先前講話特性的改變有關(guān)的方向的歷史信息的大綱。這種類型的歷史信息在通信會(huì)話開(kāi)始時(shí)減少用于提高可理解性所花費(fèi)的時(shí)間可以是非常有用的。替代地,或者另外地,特定于人口(population-specific)的模板可以被引入用于參與者的一個(gè)或多個(gè)。例如,當(dāng)不能夠?qū)β?tīng)者的講話風(fēng)格進(jìn)行取樣時(shí),該特定于人口的模板可以被用作用于講話者/聽(tīng)者比照的初始基礎(chǔ)。作為可以采用這樣的方法的一個(gè)示例, 一般性的“德國(guó)聽(tīng)者”模板可被用來(lái)幫助正用英語(yǔ)向德國(guó)聽(tīng)眾發(fā)言的中國(guó)講話者。以類似方式,這些特定于人口的模板可被用來(lái)通過(guò)提供關(guān)于哪些類型的講話特性通常會(huì)提高兩個(gè)國(guó)籍的人之間的可理解性的初始指南,來(lái)進(jìn)一步增強(qiáng)初始可理解性。例如, 如果一個(gè)具有紐約口音的以英語(yǔ)為母語(yǔ)的講話者正在對(duì)一個(gè)以日語(yǔ)為母語(yǔ)的聽(tīng)者說(shuō)話,對(duì)該紐約講話者的初始指導(dǎo)可以是放慢速度,使用更短的句子,以及減少使用地道的英語(yǔ)。通常,模板可以是基于講話者/聽(tīng)者比照的任意組合而產(chǎn)生的,并且這被利用來(lái)可選地補(bǔ)充由分析模塊110所獲得的實(shí)際樣本。對(duì)一個(gè)或多個(gè)參與者的講話的持續(xù)監(jiān)聽(tīng),以及可選擇地對(duì)每一個(gè)參與者,分析模塊110與控制器130、存儲(chǔ)器140和存儲(chǔ)裝置150協(xié)作來(lái)標(biāo)識(shí)表示風(fēng)格的差異的一個(gè)或多個(gè)特性,風(fēng)格例如是口音、發(fā)音準(zhǔn)確度、語(yǔ)速、語(yǔ)調(diào)、節(jié)奏、聲調(diào)、協(xié)同發(fā)音、音節(jié)重讀、音節(jié)持續(xù)時(shí)間、母語(yǔ)信息,等等??梢葬槍?duì)通信會(huì)話的任何部分或者全部來(lái)實(shí)時(shí)地監(jiān)聽(tīng)這些特性,并且可以進(jìn)一步地被用來(lái)更新與一個(gè)參與者或者參與者的組合有關(guān)的簡(jiǎn)檔,如上面在模板被存儲(chǔ)用于各方之間的通信會(huì)話時(shí)所提及的。建模模塊160然后通過(guò)對(duì)可以影響可理解性的一個(gè)或多個(gè)獨(dú)立可測(cè)量的講話分量進(jìn)行加權(quán)并將它們組合成單個(gè)整體評(píng)分來(lái)利用這些分量,該單個(gè)整體評(píng)分指示出所估計(jì)出的其它參與者可理解所說(shuō)內(nèi)容的容易度。該評(píng)分可以被用作反饋模塊170確定并向講話者呈現(xiàn)反饋的基礎(chǔ),該反饋具有關(guān)于如何提高聽(tīng)者的可理解性的一個(gè)或多個(gè)建議。更具體地,反饋模塊170然后解釋該可理解性評(píng)分,如所討論的,該可理解性評(píng)分著眼于人之間的差異,當(dāng)與建議數(shù)據(jù)庫(kù)105核對(duì)時(shí)可關(guān)聯(lián)到應(yīng)當(dāng)增強(qiáng)可理解性的建議。在反饋模塊170的協(xié)作下,該建議可被提供給諸如反饋設(shè)備210或反饋設(shè)備310之類的反饋設(shè)備。根據(jù)第二示例性實(shí)施例,可理解性增強(qiáng)系統(tǒng)100被擴(kuò)展為包括具有多個(gè)參與者的情形,并且進(jìn)一步包括對(duì)信號(hào)衰減(degradation)、交談參與度因素中的一個(gè)或多個(gè)的動(dòng)態(tài)監(jiān)聽(tīng)和評(píng)估,以及對(duì)通信會(huì)話的動(dòng)態(tài)更新。更具體地,并且類似于上面討論的實(shí)施例,每個(gè)參與者的講話都被監(jiān)聽(tīng)以標(biāo)識(shí)一個(gè)或多個(gè)講話特性。替代地或者另外地,可以檢索該參與者的簡(jiǎn)檔。此外,替代地或者另外地,可以檢索參與者的特定組合的簡(jiǎn)檔。如將理解地,如果有多個(gè)參與者,則當(dāng)基于多個(gè)不同收聽(tīng)者的建議彼此矛盾時(shí),可能難以者向講話者提供建議。因此,根據(jù)一個(gè)示例性實(shí)施例,例如可以基于針對(duì)多個(gè)收聽(tīng)者的建議的加權(quán)平均來(lái)修改給講話者的反饋。根據(jù)另一個(gè)實(shí)施例,反饋設(shè)備也可用于收集關(guān)于(一個(gè)或多個(gè))參與者的信息。例如,如果講話者正對(duì)一端點(diǎn)處的聽(tīng)眾講話,則該端點(diǎn)處的聽(tīng)眾可以使用反饋設(shè)備來(lái)向可理解性增強(qiáng)系統(tǒng)100提供諸如“我們是母語(yǔ)為漢語(yǔ)的講話者,想要聽(tīng)英語(yǔ)?!敝惖男畔?。以類似的方式,對(duì)于通過(guò)監(jiān)聽(tīng)參與者講話得到的信息以及講話特性,該信息還可以被用于與可理解性評(píng)分相組合來(lái)輔助反饋模塊170以及向講話者給出一個(gè)或多個(gè)建議。對(duì)每一個(gè)參與者,該分析模塊110然后標(biāo)識(shí)表示風(fēng)格上的差異的一個(gè)或多個(gè)特性,風(fēng)格例如是口音,發(fā)音準(zhǔn)確度,語(yǔ)速,語(yǔ)調(diào),節(jié)奏,聲調(diào),協(xié)同發(fā)音,音節(jié)重讀,音節(jié)持續(xù)時(shí)間,母語(yǔ)信息,等等。此外,并且在信號(hào)質(zhì)量模塊195的協(xié)作下,進(jìn)行關(guān)于信號(hào)衰減是否存在于通信體系結(jié)構(gòu)的任何一個(gè)或多個(gè)分支中的評(píng)估。另外,關(guān)鍵詞模塊180監(jiān)視各方之間缺乏理解的指示符。例如,關(guān)鍵詞模塊180被編程來(lái)尋找這樣的指示符,例如“對(duì)不起,你可以再說(shuō)一遍么”,“什么? ”,“請(qǐng)重復(fù)你剛才所說(shuō)的”,“你可以說(shuō)得大聲點(diǎn)么”,等等。一般地,關(guān)鍵詞模塊180可以通過(guò)任何數(shù)量的關(guān)鍵詞被編程,這些關(guān)鍵詞通常指示收聽(tīng)方的理解的缺乏。作為另一個(gè)例子,關(guān)鍵詞模塊180可以監(jiān)視諸如“嗯哼? ”之類的發(fā)聲或類似發(fā)聲的發(fā)生,這些發(fā)聲通常也趨向于指示缺乏理解或者收聽(tīng)者沒(méi)有聽(tīng)見(jiàn)講話者的能力。上述指示符的一個(gè)或多個(gè)接著被建模模塊160用來(lái)確定指示所評(píng)估出的一個(gè)或多個(gè)其它參與者可以理解所說(shuō)內(nèi)容的容易度的評(píng)分。該評(píng)分然后被反饋模塊170用來(lái)與建議模塊105協(xié)作地確定可選地具有關(guān)于如何提高可理解性的建議的反饋并呈現(xiàn)給正講話的參與者。這些建議可以經(jīng)由反饋設(shè)備以聽(tīng)覺(jué)方式、圖形方式、作為評(píng)分、以多媒體方式,或者一般地利用任意的(一種或多種)通信類型而被提供。此外,反饋可以通過(guò)圖形用戶界面,耳語(yǔ)通道,顯示器(未示出)等而被提供。例如,并且取決于反饋設(shè)備的類型,反饋建議的復(fù)雜度可以是不同的。例如,在簡(jiǎn)單的基于文本的反饋設(shè)備中,諸如放慢速度、更大聲地說(shuō)等的指示可被用來(lái)輔助收聽(tīng)方的可理解性。一個(gè)特定于語(yǔ)言的示例可以是,如果講完美法語(yǔ)的某人在對(duì)從書(shū)本上學(xué)習(xí)法語(yǔ)的以英語(yǔ)為母語(yǔ)的人說(shuō)話時(shí)被系統(tǒng)指示“對(duì)無(wú)聲字母發(fā)音”。,,在更復(fù)雜的圖形用戶界面類型的環(huán)境中,除了建議以外,額外信息可以可選地被提供給各個(gè)端點(diǎn)中一個(gè)或多個(gè)端點(diǎn)處的(一個(gè)或多個(gè))參與者,其中該信息不僅包括建議,還包括關(guān)于端點(diǎn)的一般信息。例如,如參與者是如何參與交談的,參與者是否輸入了諸如母語(yǔ)之類的任何信息,等等的信息可以被顯示出來(lái)。此外,系統(tǒng)可以被擴(kuò)展為使得關(guān)鍵詞模塊180不僅聆聽(tīng)可以指示理解的缺乏的關(guān)鍵詞或發(fā)聲,而且在與反饋設(shè)備的協(xié)作下,該關(guān)鍵詞模塊180可以監(jiān)視參與者是否輸入了指示缺乏可理解性的信息。例如,當(dāng)反饋設(shè)備(210,310)被擴(kuò)展為包括輸入能力時(shí),其可被編程以使得當(dāng)選擇特定輸入時(shí),諸如說(shuō)大聲點(diǎn)、放慢速度、我聽(tīng)不見(jiàn)你等的輸入可類似地被用來(lái)輔助建模模塊160并且與反饋模塊170協(xié)作地確定向講話者提供何種反饋。圖2圖示出了可理解性增強(qiáng)系統(tǒng)的操作的示例性方法。具體地,控制開(kāi)始于步驟 S200并且繼續(xù)到步驟S210。在步驟S210處,參與者A的講話被監(jiān)聽(tīng)和/或檢索。正如所討論的,例如,當(dāng)所監(jiān)聽(tīng)的講話數(shù)據(jù)不足以提供建議時(shí),參與者A的講話簡(jiǎn)檔可以從存儲(chǔ)位置被檢索回并且將該簡(jiǎn)檔利用來(lái)例如輔助提供更多的即時(shí)建議。接下來(lái),在步驟S220處, 并且以類似的方式,參與者B的講話被監(jiān)聽(tīng)和/或檢索。然后,在步驟S230處,特定于人口的模版可以可選地被輸入。接著,控制繼續(xù)到步驟S240。在步驟240處,并且對(duì)于每個(gè)參與者,表示風(fēng)格上的差異的一個(gè)或多個(gè)特征被標(biāo)識(shí)出,風(fēng)格例如是口音,發(fā)音準(zhǔn)確度,語(yǔ)速,語(yǔ)調(diào),節(jié)奏,聲調(diào),協(xié)同發(fā)音,音節(jié)重讀,音節(jié)持續(xù)時(shí)間,母語(yǔ)信息,語(yǔ)法,詞匯,習(xí)語(yǔ),等等。然后在步驟S250處,一個(gè)或多個(gè)獨(dú)立可測(cè)量的講話分量通過(guò)被加權(quán)并被組合成單個(gè)整體評(píng)分而被利用,該單個(gè)整體評(píng)分指示出所估計(jì)出的其它參與者可理解所說(shuō)內(nèi)容的容易度??刂平又^續(xù)到步驟S260。在步驟S260處,具有關(guān)于如何提高可理解性的一個(gè)或多個(gè)建議的反饋被確定并被呈現(xiàn)給正在講話的參與者。控制接著繼續(xù)到步驟S270,在其中此控制序列結(jié)束。圖3概述了可理解性增強(qiáng)系統(tǒng)的操作的另一示例性實(shí)施例。具體地,控制開(kāi)始于步驟S300并且繼續(xù)到步驟S305。在步驟S305處,參與者A的講話被監(jiān)聽(tīng)和/或例如從簡(jiǎn)檔檢索回。接著,在步驟S310處,參與者B的講話被監(jiān)聽(tīng)和/或/或從簡(jiǎn)檔中檢索回。接著,在步驟S315處,一個(gè)或多個(gè)另外的參與者的講話可以類似方式被監(jiān)聽(tīng)和/或檢索。對(duì)于每一個(gè)另外的參與者的講話,監(jiān)聽(tīng)和/或檢索可以基于個(gè)人來(lái)進(jìn)行,或者,例如,可以基于一定數(shù)目的參與者而被組合以形成加權(quán)平均??刂平又^續(xù)到步驟S320。
在步驟S320處,并且對(duì)于每一個(gè)參與者,或者例如,對(duì)于這些參與者的加權(quán)平均, 如上面所討論的表示風(fēng)格上的差異的一個(gè)或多個(gè)特性被標(biāo)識(shí)。接著,在步驟S325處,進(jìn)行關(guān)于在通信體系結(jié)構(gòu)的任何一個(gè)或多個(gè)分支上是否存在信號(hào)衰減的評(píng)估。該信號(hào)衰減信息還可以通過(guò)建模技術(shù)被利用來(lái)將如下情形考慮在內(nèi)可理解性不是基于講話者的講話特性,而是由于差的通信鏈路引起的。這在如下情形下可以是尤其重要的其中,通信信道狀況在通信會(huì)話的進(jìn)行期間隨著噪聲水平逐漸變高并且隨后下降而變化。明顯地,在這種情形下,建議講話者改變他們的講話模式或者特性對(duì)收聽(tīng)者理解他們的能力幾乎沒(méi)有什么作用。作為可選的另外一個(gè)實(shí)施例,該信息可以被用來(lái)例如告訴講話者中斷他們的講話直到噪聲降低到可接受的水平??刂平又^續(xù)到步驟S330。在步驟S330中,在整個(gè)通信會(huì)話期間,缺乏理解的指示符可以可選擇地額外地被監(jiān)聽(tīng)。例如,指示符可以是關(guān)鍵詞、發(fā)聲,或者一般地指示(一個(gè)或多個(gè))收聽(tīng)者對(duì)講話者所說(shuō)內(nèi)容的理解有困難的任何指示符。此外,在步驟S335中,額外的因素可以被進(jìn)一步地考慮,例如談話中的收聽(tīng)者的參與程度。例如,該系統(tǒng)可以被編程來(lái)識(shí)別是否存在活躍的談話,在該談話中多個(gè)參與者正快速地交換觀點(diǎn),可能在參與者之間具有高的互相理解程度。 替代地,如果講話者沒(méi)有從一個(gè)或多個(gè)收聽(tīng)者那里獲得任何反饋,則這種參與度的缺乏也可以用作指示符,該指示符指示了可能由于講話者的講話特性、通信信道衰落問(wèn)題、基于音量問(wèn)題導(dǎo)致的不能聽(tīng)見(jiàn)講話者等等而使得收聽(tīng)者缺乏理解。控制接著繼續(xù)到步驟S340。在步驟S340處,并且除了上述的被監(jiān)聽(tīng)特性以外,影響可理解性的講話分量被評(píng)估并且指示其他參與者中的一個(gè)或多個(gè)能夠理解所說(shuō)內(nèi)容的所估計(jì)出的容易度的評(píng)分被確定。接著,在步驟S345中,信號(hào)衰減信息、參與度信息和指示符信息中的一個(gè)或多個(gè)以及該評(píng)分被用來(lái)確定可選地具有關(guān)于如何提高可理解性的一個(gè)或多個(gè)建議的反饋并將反饋呈現(xiàn)給講話者。如同先前的實(shí)施例,這一個(gè)或多個(gè)建議可以通過(guò)一個(gè)或多個(gè)反饋設(shè)備,如在圖形用戶界面,耳語(yǔ)通道等中,以圖形方式,聽(tīng)覺(jué)方式等來(lái)提供。控制接著繼續(xù)到步驟S350, 在步驟S350中結(jié)束該控制流程。各個(gè)實(shí)施例包括基本上如這里(包括各個(gè)實(shí)施例,子組合和它的子集)所圖示并描述的部件、方法、處理、系統(tǒng)和/或裝置。本領(lǐng)域的技術(shù)人員在理解本公開(kāi)后將明白如何作出和使用本發(fā)明。在各個(gè)實(shí)施例中,本發(fā)明包括在缺少未在此處或其各個(gè)實(shí)施例中示出和/或記載的各項(xiàng)的情況下,包括缺少可能已在先前的設(shè)備或處理中例如用于提高性能、 實(shí)現(xiàn)容易度和/或降低實(shí)施成本的各項(xiàng)的情況下,來(lái)提供設(shè)備和處理。前面的討論以說(shuō)明和描述為目的而被給出。前面并不旨在將本發(fā)明局限于這里所公開(kāi)的一種或多種形式。在前述的具體實(shí)施方式
中,例如,為了精簡(jiǎn)本公開(kāi),本發(fā)明的各個(gè)特點(diǎn)在一個(gè)或多個(gè)實(shí)施例中被組合在一起。這種公開(kāi)方法不應(yīng)被理解成反映了要求保護(hù)的發(fā)明需要比明確記載在每個(gè)權(quán)利要求中的特征更多的特征的意圖。而是,正如下面的權(quán)利要求所反映的,發(fā)明點(diǎn)在于少于前面公開(kāi)的單個(gè)實(shí)施例中的所有特征。因此,下面的權(quán)利要求由此被并入此具體實(shí)施方式
中,其中每個(gè)權(quán)利要求作為分離的優(yōu)選實(shí)施方式而獨(dú)立存在。此外,雖然本發(fā)明的描述已經(jīng)包括了對(duì)一個(gè)或多個(gè)實(shí)施例以及某些變形和修改的描述,但是其它的變形和修改也落在本公開(kāi)的范圍內(nèi),例如,在理解了本公開(kāi)后,可落入本領(lǐng)域技術(shù)人員的技術(shù)和知識(shí)中。希望在準(zhǔn)許的范圍內(nèi)獲得包括要求保護(hù)的實(shí)施例的替代實(shí)施例的權(quán)利,替代實(shí)施例包括可替換的、可互換的和/或等同的結(jié)構(gòu)、功能、范圍或步驟, 而不論這些可替換的、可互換的和/或等同的結(jié)構(gòu)、功能、范圍或步驟是否在本發(fā)明中被公開(kāi),并且并不希望向公眾貢獻(xiàn)任何可專利的主題。雖然上述的流程圖已經(jīng)結(jié)合特定的事件序列進(jìn)行了討論,然而應(yīng)當(dāng)理解,可以在本質(zhì)上不影響本發(fā)明的操作的情況下對(duì)該序列進(jìn)行改變。此外,并不需要出現(xiàn)如示例性實(shí)施例中所記載的那樣的精確事件序列。這里所給出的示例性技術(shù)并不局限于以特定方式描述的實(shí)施例,而是還可以被用于其它的示例性實(shí)施例,并且每個(gè)所描述的特征都可以分別地單獨(dú)要求保護(hù)。這里描述的系統(tǒng)、方法和協(xié)議還可以在除了或者替代所描述的通信設(shè)備以外的如下裝置上來(lái)實(shí)現(xiàn)專用計(jì)算機(jī)、編程微處理器或微控制器和(一個(gè)或多個(gè))外圍集成電路元件、ASIC或其它集成電路、數(shù)字信號(hào)處理器、諸如分立元件電路之類的硬連線電路或邏輯電路、諸如PLD、PLA、FPGA、PAL之類的可編程邏輯器件、諸如電話機(jī)之類的通信設(shè)備、任何類似裝置,等等。一般地,能夠?qū)崿F(xiàn)狀態(tài)機(jī),其進(jìn)而能夠?qū)崿F(xiàn)這里所述的方法的任何設(shè)備可以用來(lái)實(shí)現(xiàn)這里公開(kāi)的各種通信方法、協(xié)議和技術(shù)。此外,可以用利用對(duì)象的軟件或面向?qū)ο蟮能浖_(kāi)發(fā)環(huán)境來(lái)容易地實(shí)現(xiàn)所公開(kāi)的方法,這些軟件和開(kāi)發(fā)環(huán)境提供了可在各種計(jì)算機(jī)或工作站平臺(tái)上使用的可移植源代碼。 替代地,可以用使用標(biāo)準(zhǔn)邏輯電路或VLSI設(shè)計(jì)的硬件來(lái)部分地或全部地實(shí)現(xiàn)所公開(kāi)的系統(tǒng)。是用硬件還是軟件來(lái)實(shí)現(xiàn)根據(jù)本發(fā)明的系統(tǒng)取決于系統(tǒng)的速度和/或效率要求、具體的功能,以及所利用的具體軟件或硬件系統(tǒng)或微處理器或微計(jì)算機(jī)系統(tǒng)??蓱?yīng)用領(lǐng)域的技術(shù)人員可以根據(jù)這里提供的功能描述并利用計(jì)算機(jī)和通信領(lǐng)域的一般基本知識(shí),利用任何已知的或以后開(kāi)發(fā)出的系統(tǒng)或結(jié)構(gòu)、設(shè)備和/或軟件,來(lái)以硬件和/或軟件容易地實(shí)現(xiàn)這里說(shuō)明的通信系統(tǒng)、方法和協(xié)議。此外,可以用被存儲(chǔ)在非易失性存儲(chǔ)介質(zhì)中,并且在與控制器和存儲(chǔ)器協(xié)同操作的經(jīng)編程通用計(jì)算機(jī)、專用計(jì)算機(jī)、微處理器等上運(yùn)行的軟件來(lái)容易地實(shí)現(xiàn)所公開(kāi)的方法。 在這些情況中,本發(fā)明的系統(tǒng)和方法可以被實(shí)現(xiàn)為被嵌入在個(gè)人計(jì)算機(jī)上的程序(例如小應(yīng)用程序(applet)、JAVA 或CGI腳本)、駐留在服務(wù)器或計(jì)算機(jī)工作站上資源、被嵌入在專用通信系統(tǒng)或系統(tǒng)組件等中的例程等等。還可以通過(guò)將系統(tǒng)和/或方法物理地結(jié)合到軟件和/或硬件系統(tǒng)(例如通信設(shè)備或系統(tǒng)的硬件和軟件系統(tǒng))中來(lái)實(shí)現(xiàn)本系統(tǒng)。因此,根據(jù)本發(fā)明,顯然已提供了用于增強(qiáng)通信可理解性的系統(tǒng),裝置和方法。雖然已結(jié)合多個(gè)實(shí)施例描述了本發(fā)明,但是很明顯,許多替換方式、修改和變形對(duì)可應(yīng)用領(lǐng)域的普通技術(shù)人員而言是顯而易見(jiàn)的。因此,希望包括在本公開(kāi)的精神和范圍內(nèi)的所有這樣的替換方式、修改、等同物和變形。
權(quán)利要求
1.一種用于增強(qiáng)通信可理解性的方法,包括 監(jiān)聽(tīng)和/或從簡(jiǎn)檔中檢索與第一參與者有關(guān)的特性; 監(jiān)聽(tīng)和/或從簡(jiǎn)檔中檢索與第二參與者有關(guān)的特性; 標(biāo)識(shí)表示參與者之間的風(fēng)格差異的特性;并且利用可能影響可理解性的一個(gè)或多個(gè)獨(dú)立可測(cè)的講話分量來(lái)提供對(duì)所估計(jì)出的、收聽(tīng)方可以理解講話方的容易度的指示。
2.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括對(duì)表示參與者之間的風(fēng)格差異的特性進(jìn)行加權(quán)并將它們組合成評(píng)分,并且將該評(píng)分提供給講話方。
3.根據(jù)權(quán)利要求1所述的方法,其中,所述風(fēng)格差異是口音、發(fā)音準(zhǔn)確性、語(yǔ)速、語(yǔ)調(diào)、 節(jié)奏、聲調(diào)、協(xié)同發(fā)音、音節(jié)重讀、音節(jié)持續(xù)時(shí)間、母語(yǔ)信息、語(yǔ)法、詞匯和習(xí)語(yǔ)中的一者或多者ο
4.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括 評(píng)估一個(gè)或多個(gè)參與度指示符;評(píng)估通信體系結(jié)構(gòu)的一個(gè)或多個(gè)分支上是否存在信號(hào)衰減; 監(jiān)聽(tīng)或者從簡(jiǎn)檔中檢索與另外的參與者有關(guān)的特性;并且確定并呈現(xiàn)與如何提高可理解性有關(guān)的一個(gè)或多個(gè)建議,其中所述一個(gè)或多個(gè)建議通過(guò)耳語(yǔ)通道、圖形用戶界面、顯示器和聽(tīng)覺(jué)中的一者或多者被提供。
5.一種或多種用于實(shí)現(xiàn)權(quán)利要求1所述功能的裝置,或者一種存儲(chǔ)了指令的非易失性計(jì)算機(jī)可讀信息存儲(chǔ)介質(zhì),如果所述指令被處理器運(yùn)行,則使得權(quán)利要求1所述的方法被執(zhí)行。
6.一種用于增強(qiáng)通信可理解性的系統(tǒng),包括分析模塊,所述分析模塊監(jiān)聽(tīng)和/或從簡(jiǎn)檔中檢索與第一參與者有關(guān)的特性,并且還監(jiān)聽(tīng)和/或從簡(jiǎn)檔中檢索與第二參與者有關(guān)的特性;建模模塊,所述建模模塊標(biāo)識(shí)表示參與者之間的風(fēng)格差異的特性;以及反饋模塊,所述反饋模塊利用可能影響可理解性的一個(gè)或多個(gè)獨(dú)立可測(cè)的講話分量來(lái)提供對(duì)所估計(jì)出的、收聽(tīng)方可以理解講話方的容易度的指示。
7.根據(jù)權(quán)利要求6所述的系統(tǒng),進(jìn)一步包括處理器,該處理器對(duì)表示參與者之間的風(fēng)格差異的特性進(jìn)行加權(quán),將它們組合成評(píng)分;以及反饋模塊,該反饋模塊將該評(píng)分提供給所述講話方,其中,所述風(fēng)格差異是口音、發(fā)音準(zhǔn)確性、語(yǔ)速、語(yǔ)調(diào)、節(jié)奏、聲調(diào)、協(xié)同發(fā)音、音節(jié)重讀、音節(jié)持續(xù)時(shí)間、母語(yǔ)信息、語(yǔ)法、詞匯和習(xí)語(yǔ)中的一者或多者。
8.根據(jù)權(quán)利要求6所述的系統(tǒng),進(jìn)一步包括參與度模塊,該參與度模塊評(píng)估一個(gè)或多個(gè)參與度指示符;以及信號(hào)質(zhì)量模塊,該信號(hào)質(zhì)量模塊評(píng)估在通信體系結(jié)構(gòu)的一個(gè)或多個(gè)分支上是否存在信號(hào)衰減,其中,所述分析模塊還監(jiān)聽(tīng)或者從簡(jiǎn)檔中檢索與另外的參與者有關(guān)的特性。
9.根據(jù)權(quán)利要求6所述的系統(tǒng),其中,關(guān)于如何提高可理解性的一個(gè)或多個(gè)建議被提{共。
10.根據(jù)權(quán)利要求6所述的系統(tǒng),其中,所述一個(gè)或多個(gè)建議通過(guò)耳語(yǔ)通道、圖形用戶界面、顯示器和聽(tīng)覺(jué)中的一者或多者被提供。
全文摘要
本發(fā)明涉及基于聽(tīng)者和說(shuō)者的講話風(fēng)格比較估計(jì)聽(tīng)者理解說(shuō)者的能力。描述了一種自動(dòng)通訊系統(tǒng)附件,該附件“聆聽(tīng)”一個(gè)或多個(gè)參與者的說(shuō)話風(fēng)格,標(biāo)識(shí)表示他們的風(fēng)格的差異的具體特性,特別是口音,但也包括發(fā)音準(zhǔn)確性,語(yǔ)速,語(yǔ)調(diào),節(jié)奏,聲調(diào),協(xié)同發(fā)音,音節(jié)重讀和音節(jié)持續(xù)時(shí)間中的一者或多者,并且例如利用對(duì)可能影響特定聽(tīng)者的可理解性的獨(dú)立可測(cè)量講話分量進(jìn)行適當(dāng)加權(quán)并且然后組合成指示所估計(jì)出的聽(tīng)者可理解所說(shuō)內(nèi)容的容易度的單個(gè)整體評(píng)分的數(shù)學(xué)模型,并且基于該評(píng)分向講話者呈現(xiàn)實(shí)時(shí)反饋。此外,該系統(tǒng)可以為講話者提供關(guān)于如何提高可理解性的建議。
文檔編號(hào)H04M3/56GK102254556SQ20111018421
公開(kāi)日2011年11月23日 申請(qǐng)日期2011年5月17日 優(yōu)先權(quán)日2010年5月17日
發(fā)明者保羅·若勒·麥克里斯 申請(qǐng)人:阿瓦雅公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
安顺市| 印江| 江西省| 紫阳县| 保亭| 拉孜县| 彭阳县| 太仓市| 色达县| 金坛市| 申扎县| 巴彦县| 闸北区| 阿克陶县| 乌审旗| 泾阳县| 太仓市| 西宁市| 临颍县| 陵川县| 青川县| 达日县| 五原县| 太保市| 台南市| 治多县| 积石山| 鹿泉市| 怀安县| 武义县| 城市| 利津县| 句容市| 通山县| 永寿县| 塔城市| 陵水| 西林县| 临沂市| 桂东县| 景德镇市|