專(zhuān)利名稱(chēng):控制系統(tǒng)的方法和信號(hào)處理系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及控制系統(tǒng)的方法,包括通過(guò)用戶環(huán)境中的輸入設(shè)備獲得代表由用戶傳輸?shù)男畔⒌闹辽僖粋€(gè)信號(hào)。本發(fā)明還涉及信號(hào)處理系統(tǒng),包括到用戶環(huán)境中的至少一個(gè)輸入設(shè)備的接口。本發(fā)明還涉及計(jì)算機(jī)程序。
背景技術(shù):
Brdiczka, 0.等人于 2005 年 10 月 4-6 日發(fā)表于 Proc. ICMI 的 “Automatic detection of interaction groups,,公開(kāi)了一禾中基于會(huì)話話輪轉(zhuǎn)換(conversational turn-taking)在各組內(nèi)部(inside)被同步的假設(shè),檢測(cè)交互組配置的方法。檢測(cè)器基于構(gòu)建在會(huì)話假設(shè)上的隱馬爾可夫模型(HMM)。檢測(cè)器的輸入是包含哪個(gè)個(gè)體在說(shuō)話或沒(méi)在說(shuō)話的信息的語(yǔ)音(speech)活動(dòng)向量。組內(nèi)語(yǔ)音貢獻(xiàn)(contribution)的同步使得能夠由建立在會(huì)話假設(shè)上的HMM檢測(cè)可能的組配置。已知系統(tǒng)的一個(gè)問(wèn)題是它不適合用于控制設(shè)備的操作。對(duì)組配置中的變化的檢測(cè)發(fā)生在事后,并且這樣的檢測(cè)僅限于用作控制策略所基于的輸入。它主要的用途是更新用戶的聯(lián)系人列表。
發(fā)明內(nèi)容
希望提供上述類(lèi)型的方法、系統(tǒng)和計(jì)算機(jī)程序,它們適合于以對(duì)于用戶來(lái)說(shuō)不顯眼并且適合于用戶活動(dòng)的方式來(lái)控制設(shè)備。這通過(guò)根據(jù)本發(fā)明的方法得以實(shí)現(xiàn),該方法包括
-通過(guò)用戶環(huán)境中的輸入設(shè)備獲得表示由用戶傳輸?shù)男畔⒌闹辽僖粋€(gè)信號(hào),其中來(lái)自第一源的信號(hào)在所述環(huán)境中以可感知的形式可獲得;
-至少估計(jì)預(yù)期來(lái)自所述第一源的信息和來(lái)自用戶的信息之間的轉(zhuǎn)換發(fā)生的時(shí)間點(diǎn);和
-相對(duì)于所預(yù)測(cè)的時(shí)間定時(shí)(timing)系統(tǒng)的功能的執(zhí)行。該方法允許在用戶環(huán)境中的系統(tǒng)提供適合于用戶和系統(tǒng)間交互的不同階段的功能性。特別地,某些功能可以在用戶正為類(lèi)似會(huì)話的交互做貢獻(xiàn)時(shí)執(zhí)行,而某些功能可以在這樣的貢獻(xiàn)階段之間的間隔中執(zhí)行。因?yàn)閺脑吹接脩艉蛷挠脩舻皆吹男畔⒘髦g的轉(zhuǎn)換發(fā)生得相對(duì)頻繁,所以該方法更適用于系統(tǒng)功能性的連續(xù)控制。因?yàn)檗D(zhuǎn)換被估計(jì),所以它適用于在類(lèi)似會(huì)話的交互期間控制系統(tǒng),而不限于在這樣的交互已停止后執(zhí)行。因?yàn)樵摲椒◤挠脩魧?duì)來(lái)自第一源的信息的響應(yīng)而非明確的用戶輸入取得它的提示(cue),所以它是不顯眼的。注意到功能的定時(shí)涉及下列至少一個(gè)該功能是否得以完全執(zhí)行或該功能何時(shí)以某些設(shè)置來(lái)執(zhí)行。在后一種情況中,“定時(shí)”涉及不同設(shè)置之間的轉(zhuǎn)換?!獋€(gè)實(shí)施例包括從第一源獲得信號(hào),并且通過(guò)在會(huì)話話輪轉(zhuǎn)換模型的基礎(chǔ)上相對(duì)于彼此分析來(lái)自用戶的信息流和攜帶在來(lái)自第一源的信號(hào)中的信息流來(lái)執(zhí)行估計(jì)。類(lèi)似會(huì)話的交互以可預(yù)測(cè)的方式構(gòu)造,其基本上包括在信息流之間同步的交替活動(dòng)和靜默的時(shí)段。通過(guò)在會(huì)話話輪轉(zhuǎn)換模型的基礎(chǔ)上相對(duì)于彼此分析來(lái)自用戶的信息流和攜帶在來(lái)自第一源的信號(hào)中的信息流,系統(tǒng)的功能執(zhí)行的開(kāi)始也可以被同步。這可以在過(guò)去的交互的相對(duì)較短間隔的基礎(chǔ)上完成。在一個(gè)實(shí)施例中,其中來(lái)自至少一個(gè)輸入設(shè)備和來(lái)自第一源的信號(hào)至少包括音頻成分,該方法包括相對(duì)于彼此隨時(shí)間分析音頻信息流。與例如視頻信息相比,高于特定閾值音量的音頻信息將相應(yīng)于源對(duì)會(huì)話的貢獻(xiàn)而突發(fā)到來(lái)。這使得確定在兩個(gè)或更多個(gè)音頻信號(hào)的源之間的類(lèi)似會(huì)話的交互的存在相對(duì)容易。不需要語(yǔ)音識(shí)別,而在視頻信息的基礎(chǔ)上確定類(lèi)似會(huì)話的交互通常需要圖像分析來(lái)檢測(cè)類(lèi)似會(huì)話的交互。應(yīng)注意,視聽(tīng)信號(hào)的分析在該實(shí)施例中未被排除。與文本消息相比, 音頻信息更經(jīng)得起(amenable)分析以檢測(cè)相應(yīng)于會(huì)話話輪轉(zhuǎn)換的類(lèi)型的交互。文本消息通常也需要至少分析主題標(biāo)目以確定它們是否與特定的討論(例如在電子論壇上主辦的討論)有關(guān)。通常僅在向這樣的論壇貼帖的短暫流(temporal flow)的基礎(chǔ)上檢測(cè)會(huì)話是困難的。在本實(shí)施例的變型中,信息流的分析包括向表示由用戶傳輸?shù)男畔⒌闹辽僖粋€(gè)信號(hào)應(yīng)用話音(voice)活動(dòng)算法。一個(gè)效果是用于確定的后續(xù)分析可能簡(jiǎn)單得多。該后續(xù)分析可以基于針對(duì)多個(gè) 連續(xù)時(shí)間間隔的每一個(gè)指示該間隔是否包含來(lái)自交互中特定參與者的對(duì)類(lèi)似會(huì)話的交互的貢獻(xiàn)的數(shù)據(jù),或者指示包含的可能性(likelihood)的數(shù)據(jù)。在一個(gè)實(shí)施例中,來(lái)自第一源的信號(hào)通過(guò)至少一個(gè)電信網(wǎng)絡(luò)從具有到電信系統(tǒng)的開(kāi)放連接的遠(yuǎn)程電信終端獲得,該電信系統(tǒng)包括到用戶環(huán)境中的至少輸入設(shè)備的接口。將該方法應(yīng)用于通信的居間(mediated)形式是相對(duì)容易的。特別地,已清楚來(lái)自第一源的信號(hào)攜帶來(lái)自不同于輸入設(shè)備環(huán)境中的用戶的另一方或多方的信息。因此,不那么需要將單個(gè)信號(hào)分割成攜帶源自各個(gè)不同用戶的信息的多個(gè)部分。這減少了使該方法足以響應(yīng)系統(tǒng)的實(shí)時(shí)或近乎實(shí)時(shí)的控制所需的努力。另一個(gè)優(yōu)點(diǎn)是,在這樣的電信系統(tǒng)中,所有交互都是類(lèi)似會(huì)話的類(lèi)型。在當(dāng)前未使用的開(kāi)放連接的情況下,僅需要將它們與噪聲區(qū)分。在一個(gè)實(shí)施例中,其中電信系統(tǒng)與許多輸入設(shè)備接口以獲得表示由用戶傳輸?shù)男畔⒌男盘?hào),并且與許多再生設(shè)備接口以以可感知的形式再生(r印roduce)來(lái)自第一源的信號(hào),使得該系統(tǒng)相對(duì)于估計(jì)的時(shí)間定時(shí)用于定位用戶的功能的執(zhí)行。一個(gè)效果是允許用戶四處移動(dòng),而不需要永久地跟蹤該用戶。只有當(dāng)預(yù)期該用戶使用電話系統(tǒng)通信時(shí),他的位置才將被確定,因?yàn)橛谑强梢灶A(yù)期他或她接近輸入設(shè)備之一。 因此,定位方法可僅依賴(lài)于輸入設(shè)備,且不需要是無(wú)處不在的。在該實(shí)施例的一個(gè)變型中,在估計(jì)用戶傳輸信息的間隔期間至少部分地在來(lái)自輸入設(shè)備的信號(hào)的基礎(chǔ)上使得該用戶被定位。該變型可主要或僅基于輸入設(shè)備的已知位置。例如,在音頻信息的情況下,來(lái)自多個(gè)輸入設(shè)備的信號(hào)的相對(duì)強(qiáng)度可以被確定。因?yàn)檫@是在預(yù)期信息由一個(gè)特定用戶傳輸?shù)拈g隔期間完成的,所以該方法更精確(或者相反地,它可以不那么復(fù)雜且可產(chǎn)生與更復(fù)雜的定位方法相同精確度的結(jié)果)。在其他間隔期間,可能僅存在背景噪聲,或者可以真正地存在攜帶由相同環(huán)境中其他用戶傳輸?shù)男畔⒌男盘?hào)。
該方法的一個(gè)實(shí)施例包括延遲在用戶環(huán)境中的設(shè)備上再現(xiàn)(rendering)輸出的功能,直到相對(duì)于估計(jì)的時(shí)間確定的時(shí)間為止。因此,在多媒體環(huán)境中,用戶不被與他或她參加的類(lèi)似會(huì)話的交互不相關(guān)的其他類(lèi)型的信息干擾。這樣的中斷被定時(shí)以在最適當(dāng)?shù)臅r(shí)刻發(fā)生。例如,電子郵件已到達(dá)的指示可以被延遲,直到用戶已停止說(shuō)話為止,更精確地,直到預(yù)期該用戶已停止說(shuō)話為止。該方法的一個(gè)實(shí)施例包括僅當(dāng)在預(yù)期轉(zhuǎn)換發(fā)生的時(shí)間點(diǎn)之后的間隔內(nèi)沒(méi)有從第一源和用戶中的至少一個(gè)傳輸信息時(shí),才使得系統(tǒng)在相對(duì)于估計(jì)的時(shí)間確定的時(shí)間處執(zhí)行功能。因此,該方法快速地檢測(cè)類(lèi)似會(huì)話的交互的結(jié)束,并且然后可以繼續(xù)使用戶環(huán)境中的系統(tǒng)執(zhí)行延遲的功能。這增加了用戶使用系統(tǒng)的效力。該方法的一個(gè)實(shí)施例包括在至少估計(jì)預(yù)期來(lái)自第一源的信息和來(lái)自用戶的信息之間的轉(zhuǎn)換發(fā)生的時(shí)間點(diǎn)之前,
- 使用用于檢測(cè)相應(yīng)于輸入設(shè)備環(huán)境中的用戶和第一源之間會(huì)話話輪轉(zhuǎn)換的類(lèi)型的交互的至少一個(gè)標(biāo)準(zhǔn),隨時(shí)間分析來(lái)自第一源的信號(hào)中攜帶的信息流和來(lái)自輸入設(shè)備之一的信號(hào)中攜帶的至少一個(gè)信息流。該實(shí)施例尤其可被用來(lái)區(qū)分每個(gè)首先被檢測(cè)到的多個(gè)類(lèi)似會(huì)話的交互。隨后,這些交互的單獨(dú)每一個(gè)的結(jié)構(gòu)可被分析以定時(shí)系統(tǒng)功能的執(zhí)行。特別地,與定位相同環(huán)境中的多個(gè)用戶中的每一個(gè)的定位方法相結(jié)合,該方法單獨(dú)地響應(yīng)于每個(gè)用戶,并且增加單個(gè)用戶在他們共享的環(huán)境中(例如家庭或辦公室)可以使用該系統(tǒng)或這些系統(tǒng)的效力。根據(jù)另一個(gè)方面,根據(jù)本發(fā)明的信號(hào)處理系統(tǒng)包括
-到用戶環(huán)境中至少一個(gè)輸入設(shè)備的接口,在用戶環(huán)境中來(lái)自第一源的信號(hào)以可感知的形式可獲得,該接口用于獲得表示由用戶傳輸?shù)男畔⒌闹辽僖粋€(gè)信號(hào);和
-處理裝置,用于至少估計(jì)預(yù)期來(lái)自所述第一源的信息和來(lái)自用戶的信息之間的轉(zhuǎn)換發(fā)生的時(shí)間點(diǎn),
其中所述信號(hào)處理系統(tǒng)被設(shè)置為相對(duì)于估計(jì)的時(shí)間定時(shí)系統(tǒng)功能的執(zhí)行。在一個(gè)實(shí)施例中,信號(hào)處理系統(tǒng)被配置為執(zhí)行根據(jù)本發(fā)明的方法。根據(jù)另一個(gè)方面,根據(jù)本發(fā)明的計(jì)算機(jī)程序包括當(dāng)合并在機(jī)器可讀介質(zhì)中時(shí)能夠使得具有信息處理能力的系統(tǒng)執(zhí)行根據(jù)本發(fā)明的方法的指令集。
將參考附圖進(jìn)一步詳細(xì)地說(shuō)明本發(fā)明,在附圖中
圖1示意性地圖示了包括兩個(gè)遠(yuǎn)程終端的通信網(wǎng)絡(luò)中的環(huán)境(ambient)電話系統(tǒng); 圖2示意性地圖示了環(huán)境電話系統(tǒng)中單個(gè)電話設(shè)備的功能組件; 圖3示意性地圖示了環(huán)境電話系統(tǒng)中主電話或代理電話的功能組件; 圖4示意性地圖示了在表示來(lái)自處于活動(dòng)的(active)會(huì)話中的兩個(gè)用戶的語(yǔ)音信號(hào)的兩個(gè)信道中的語(yǔ)音活動(dòng);
圖5是流程圖,圖示了控制在用戶和遠(yuǎn)程電信終端的用戶之間傳輸?shù)男畔⒌幕A(chǔ)上使用環(huán)境電話系統(tǒng)定位用戶的方法的執(zhí)行的方法;以及
圖6是流程圖,圖示了控制在用戶和具有音頻用戶接口的數(shù)據(jù)處理系統(tǒng)之間傳輸?shù)男畔⒌幕A(chǔ)上使用環(huán)境電話系統(tǒng)定位用戶的方法的執(zhí)行的方法。
具體實(shí)施例方式以實(shí)例的方式,在圖1中示出連接到電信網(wǎng)絡(luò)3的兩個(gè)遠(yuǎn)程終端1、2。具有3個(gè)空間5-7的建筑物4形成了具有到網(wǎng)絡(luò)3的至少一個(gè)連接的本地環(huán)境。網(wǎng)絡(luò)3是廣域網(wǎng),并且例如可包括蜂窩電話網(wǎng)絡(luò)、POTS網(wǎng)絡(luò)或?qū)拵Щヂ?lián)網(wǎng)。通信可通過(guò)直接連接進(jìn)行,但優(yōu)選地基于數(shù)據(jù)分組。在下文中,將假設(shè)通信是基于話音的且具有可選的視頻圖像,例如視頻會(huì)議應(yīng)用就是這樣的情況。相同的原理也在個(gè)體間的信息通信的其他方法中找到應(yīng)用,包括文本消息傳遞、在公告板上張貼消息等。在那些其他實(shí)例中, 如在該實(shí)例中一樣,基于相應(yīng)于各個(gè)終端的用戶之間會(huì)話話輪轉(zhuǎn)換的類(lèi)型的交互模型隨時(shí)間分析從遠(yuǎn)程終端(一個(gè)或多個(gè))1、2和從建筑物4中的真實(shí)或虛擬本地終端傳輸?shù)男畔ⅰ?被確定在進(jìn)行中的類(lèi)似會(huì)話的交互的結(jié)構(gòu)被用來(lái)控制系統(tǒng)功能的執(zhí)行,并且可選地控制建筑物4中其他設(shè)備的功能的執(zhí)行。關(guān)于所檢測(cè)的會(huì)話結(jié)構(gòu)的信息還被環(huán)境電話系統(tǒng)用于控制音頻再現(xiàn)和捕獲。網(wǎng)絡(luò)連接日益基于其中不計(jì)通話分鐘的統(tǒng)一收費(fèi)訂購(gòu)模型。因此,普遍具有非常長(zhǎng)的通話,或具有不再或開(kāi)放或關(guān)閉而是以許多不同方式部分地開(kāi)放的通話。因此,將有許多情況,其中存在向若干遠(yuǎn)程終端1、2開(kāi)放的連接,而沒(méi)有用戶用來(lái)傳輸信息的連接。例如,用戶可登錄到對(duì)等覆蓋網(wǎng)絡(luò),甚至無(wú)需接近他的計(jì)算機(jī)。在圖示的實(shí)施例中,環(huán)境電話系統(tǒng)由各個(gè)聯(lián)網(wǎng)的、優(yōu)選地使用無(wú)線網(wǎng)絡(luò)連接的電話單元構(gòu)成。然而,在此略述的原理同樣應(yīng)用于在其中多個(gè)麥克風(fēng)和擴(kuò)音器連接到相同電話系統(tǒng)的系統(tǒng),例如家庭對(duì)講機(jī)系統(tǒng)或有線電話系統(tǒng)。在此略述的方法由在該實(shí)例中的環(huán)境電話系統(tǒng)實(shí)現(xiàn),從而區(qū)分呼叫者和用戶,呼叫者用來(lái)指代遠(yuǎn)程終端1、2的用戶,用戶用來(lái)指代建筑物4內(nèi)的個(gè)體。主電話單元8包括到電信網(wǎng)絡(luò)3的接口,并在圖3中單獨(dú)地圖示。在圖示的實(shí)例中,存在到因特網(wǎng)、普通老式電話系統(tǒng)和到蜂窩電話網(wǎng)絡(luò)的接口 9-11。在可替代的實(shí)施例中可使用較少和其他類(lèi)型的接口。在其他單獨(dú)電話單元12、13通過(guò)主電話單元8與遠(yuǎn)程終端 1、2通信的意義下,主電話單元8也可以被認(rèn)為是代理電話單元。單獨(dú)電話單元12中的第一個(gè)在圖2中詳細(xì)地圖示,其他的是相同的。主電話單元8包括圖1中圖示的環(huán)境電話系統(tǒng)中的單獨(dú)電話單元。每個(gè)單獨(dú)電話單元12、13和主電話單元8與至少一個(gè)麥克風(fēng)14-16和至少一個(gè)揚(yáng)聲器17-19接口。在圖示的實(shí)施例中,第二單獨(dú)電話單元13和主電話單元8中所包括的單獨(dú)電話單元還與各自的照相機(jī)20、21和顯示設(shè)備22、23接口。輸出信號(hào)可從第二單獨(dú)電話單元13提供至外部照明設(shè)備M和娛樂(lè)設(shè)備25,例如收音機(jī)或電視機(jī)。這些連接的一個(gè)或多個(gè)也可通過(guò)無(wú)線網(wǎng)絡(luò)或者用于家庭自動(dòng)化的一些網(wǎng)絡(luò)來(lái)完成。參考圖2,為到由單獨(dú)電話單元12操作的遠(yuǎn)程呼叫者的每個(gè)連接提供單獨(dú)的呼叫者單元沈。接口 27包括解碼器和輸入緩沖器。在圖示的實(shí)例中,接口 27包括RTP (實(shí)時(shí)分組協(xié)議)套接字接口(socket interface),該套接接口包括G. 722解碼器和輸入緩沖器。 它從IP (因特網(wǎng)協(xié)議)套接字(未示出)接收RTP數(shù)據(jù)。再現(xiàn)單元觀使經(jīng)解碼的音頻數(shù)據(jù)能夠由揚(yáng)聲器17再現(xiàn)。它至少部分地在控制單元29的控制下操作,控制單元29還實(shí)現(xiàn)幾何模型,并且反過(guò)來(lái)從主電話單元8接收例如依照SIP (會(huì)話發(fā)起協(xié)議)協(xié)議并通過(guò)IP分組作為T(mén)CP (傳輸控制協(xié)議)攜帶的、消息形式的控制信號(hào)。延遲線30被提供用于向輸入信號(hào)處理單元31提供參考信號(hào)。參考信號(hào)使輸入信號(hào)處理單元31能夠執(zhí)行聲學(xué)回聲消除(acoustic echo cancellati on)。輸入信號(hào)處理單元 31還執(zhí)行自動(dòng)增益控制,并可執(zhí)行其他信號(hào)處理功能以提供攜帶來(lái)自用戶的音頻信息的信號(hào)。輸入信號(hào)處理單元31還從控制單元29接收控制信號(hào)。輸入信號(hào)處理單元向G. 722解碼器和輸出RTP套接字32以及向語(yǔ)音活動(dòng)檢測(cè)(SAD)系統(tǒng)33提供攜帶音頻信息的信號(hào)。典型的SAD系統(tǒng)33使用從短音頻片段計(jì)算多個(gè)特性特征并使用這些來(lái)確定聲音片段是否是語(yǔ)音、非語(yǔ)音或靜默的算法。可以實(shí)現(xiàn)任何類(lèi)型的語(yǔ)音活動(dòng)檢測(cè)(也稱(chēng)為話音活動(dòng)檢測(cè))算法。在以下文獻(xiàn)中給出了實(shí)例
Bhou-Gazale, S.禾口 Assaleh, K. , "A robust endpoint detection of speech for noisy environments with application to automatic speech recognition,,, Proc. ICASSP 2002,Orlando, Florida, 2002 年 5 月;
Davis, Α.等,"Statistical voice activity detection using low/variance spectrum estimation and an adaptive threshold", IEEE Trans, on audio, speech and language processing, 14(2), 2006 年,412—424 頁(yè);禾口
Huang, L.禾口 Yang, C. , "A novel approach to robust speech detection in car environments", IEEE Int. Conf. on Acoustics, Speech and Signal Processing, 3(5-9), 2000 年,1751-1754 頁(yè)。注意到SAD系統(tǒng)33的功能性還可以?xún)H在主電話單元8中實(shí)現(xiàn),主電話單元8接收經(jīng)由G. 722解碼器和輸出RTP套接字32提供的信號(hào)。該功能性還可以作為在輸入信號(hào)處理單元31中實(shí)現(xiàn)的語(yǔ)音增強(qiáng)算法和回聲消除的部分而實(shí)現(xiàn)。語(yǔ)音活動(dòng)檢測(cè)的輸出通常是二進(jìn)制值。例如,它也可以是置信度值(confidence value).預(yù)定持續(xù)時(shí)間間隔的語(yǔ)音活動(dòng)檢測(cè)的結(jié)果通過(guò)建筑物4中的網(wǎng)絡(luò)被發(fā)送至主電話單元8。參考圖3,主電話單元8為連接對(duì)其開(kāi)放的每個(gè)外部呼叫者(在該情況下相應(yīng)于遠(yuǎn)程終端1、2)創(chuàng)建呼叫實(shí)例34。呼叫實(shí)例34使用語(yǔ)音增強(qiáng)功能35來(lái)提供攜帶被傳輸至單獨(dú)電話單元12、13中的一個(gè)或多個(gè)的音頻信息的信號(hào)。該信號(hào)也經(jīng)受語(yǔ)音活動(dòng)檢測(cè)36。在特別是輸出到揚(yáng)聲器17-19中的一個(gè)或多個(gè)之前,語(yǔ)音增強(qiáng)功能35的輸出和攜帶音頻信息并與呼叫實(shí)例34相關(guān)聯(lián)的其他信號(hào)均被提交給剩余的AEC 37。會(huì)話活動(dòng)檢測(cè)單元38接收來(lái)自第一單獨(dú)電話單元12中的SAD系統(tǒng)33和其他單獨(dú)電話單元中的類(lèi)似系統(tǒng)這兩者的輸出、以及來(lái)自應(yīng)用到從呼叫實(shí)例34與其相關(guān)聯(lián)的遠(yuǎn)程終端1、2傳輸?shù)男畔⒌恼Z(yǔ)音活動(dòng)檢測(cè)功能36的輸出。會(huì)話活動(dòng)檢測(cè)單元38的輸出是代表在使用關(guān)聯(lián)遠(yuǎn)程終端1、2的呼叫者和包括一個(gè)或多個(gè)單獨(dú)電話單元12、13的環(huán)境中的本地用戶之間存在類(lèi)似會(huì)話的交互的時(shí)間概率的值。如將解釋的那樣,這些輸出被提供給主控制單元39以用于控制環(huán)境電話系統(tǒng)自身或其外部的設(shè)備,例如娛樂(lè)設(shè)備25或外部照明設(shè)備24等。參考圖4,會(huì)話話輪轉(zhuǎn)換的模型得以圖示。該模型被用來(lái)控制環(huán)境電話系統(tǒng),并且可選地控制其他設(shè)備。圖4示出兩個(gè)音頻信息流40、41,一個(gè)來(lái)自遠(yuǎn)程終端1、2之一,另一個(gè)來(lái)自單獨(dú)電話單元12、13之一或主電話單元8的用戶。后一個(gè)流41實(shí)際上可通過(guò)使用例如在W02007/086042中描述的分割技術(shù),來(lái)將音頻信號(hào)分割為與向電話單元8、12、13之一提供音頻信息的若干用戶之一相關(guān)聯(lián)的片段而獲得。流40、41包括如由SAD系統(tǒng)33和 SAD功能36確定的靜默時(shí)段42、43和語(yǔ)音時(shí)段44、45。參考圖5,環(huán)境電話系統(tǒng)功能性的控制包括檢測(cè)正在進(jìn)行的會(huì)話的步驟46。在圖示的實(shí)施例中,該檢測(cè)包括使用用于檢測(cè)相應(yīng)于建筑物4中用戶和所關(guān)注的遠(yuǎn)程終端1、2 的用戶之間的會(huì)話話輪轉(zhuǎn)換的類(lèi)型的交互的至少一個(gè)標(biāo)準(zhǔn),來(lái)分析來(lái)自遠(yuǎn)程終端1、2之一的信號(hào)中攜帶的音頻信息流和到電話單元8、12、13之一的音頻輸入信號(hào)中的音頻信息流。 在可替代的實(shí)施例中,該步驟46可由在在前的用戶輸入(例如以建立到遠(yuǎn)程終端1、2的連接)的基礎(chǔ)上確定會(huì)話存在的步驟來(lái)代替。也就是說(shuō)基于用戶已請(qǐng)求建立連接的事實(shí)和/ 或基于這樣的連接當(dāng)前事實(shí)上是開(kāi)放的事實(shí),假設(shè)會(huì)話的存在。然而,在其中連接可在延長(zhǎng)的時(shí)間期間開(kāi)放而不處于有效(active)使用的系統(tǒng)中,檢測(cè)會(huì)話的步驟46增加了資源使用效率。相應(yīng)于會(huì)話話輪轉(zhuǎn)換的交互的類(lèi)型的檢測(cè)基于許多原理
1.在會(huì)話中,對(duì)于會(huì)話的大多數(shù),在任一時(shí)間只有一個(gè)說(shuō)話者(talker)是活動(dòng)的;
2.說(shuō)話者輪流發(fā)言,使得活動(dòng)/靜默說(shuō)話者的信道交替;
3.在兩個(gè)信道中連續(xù)的靜默意味著在參與者之間沒(méi)有活動(dòng)的會(huì)話話輪轉(zhuǎn)換;
4.在一個(gè)信道中的非交替語(yǔ)音活動(dòng)意味著在信道間沒(méi)有會(huì)話活動(dòng),但是例如在由相同遠(yuǎn)程終端1、2選出的兩個(gè)呼叫者之間存在會(huì)話。5.如果在語(yǔ)音時(shí)段44、45和靜默時(shí)段42、43之間的話輪轉(zhuǎn)換沒(méi)在信道之間同步, 則在正在討論的信道之間沒(méi)有會(huì)話話輪轉(zhuǎn)換。這就是為什么要相對(duì)于彼此地隨時(shí)間分析流 40,41的原因。用于檢測(cè)會(huì)話話輪轉(zhuǎn)換的可能算法如下
令η是音頻幀索引,pi (η)是信道1中的幀η包含如由SAD系統(tǒng)33或SAD功能36確定的語(yǔ)音的可能性。在一個(gè)簡(jiǎn)單的示例中,Pl (η)的值可以為0 (無(wú)語(yǔ)音)或1 (語(yǔ)音)。有 4個(gè)初始化為零的狀態(tài)變量,Presencel、Presence2、Conflict、Silence。還有另外的3個(gè)如下被初始化的狀態(tài)變量 gl = 0.9 ; g2 = 0. 99 ;和 g3 = 0.995。該算法以偽代碼運(yùn)行如下
1.確定信道1和2中當(dāng)前幀η的VAD狀態(tài),并估計(jì)
if pl(n)>0 AND p2 (η) ==0,
Presencel := gl氺Presencel+(l_gl);
Presence2 := g2*Presence2;
Conflict := g2*Conflict;
Silence := g3*Silence;
end
if p2 (n) >0 AND pl(n) ==0,
9Presence2 = gl氺Presence2+(l_gl); Presencel = g2* Presencel; Conflict := g2*Conflict; Silence := g3*Silence; end
if p2 (n) >0 AND pl(n)>0, Presencel := g2氺 Presencel+(l_g2); Presence2 := g2氺Presence2+(l_g2); Conflict := gl*Conflict+(l-gl); Silence := g3*Silence; end
if p2 (n)==0 AND pi (n)==0, Presencel := g3* Presencel; Presence2 := g3*Presence2; Conflict := g3*ConfIict; Silence := g3氺Silence+(l_g3); end
Conversation (n)=Presencel+Presence2-ConfIict-Silence; 2.n:=n+l 到步驟 1.
當(dāng)Conversation (η)的當(dāng)前值超過(guò)某個(gè)閾值時(shí),會(huì)話得以檢測(cè)。因此,該算法隨著時(shí)間估計(jì)信息,因?yàn)樗窍蚝罂吹?backward-looking),狀態(tài)變量保證Conversation的當(dāng)前值基于在前的音頻幀的估計(jì)。同時(shí),因?yàn)樗沁B續(xù)發(fā)展的對(duì)會(huì)話是否存在的確定,所以它適合作為用于控制設(shè)備的輸出信號(hào)的基礎(chǔ)。以上略述的基本方法可以各種方式得以增強(qiáng),這尤其取決于可獲得的計(jì)算資源。 例如,除了狀態(tài)變量I^resencel、Presence2, Conflict、Silence之外或作為它們的可替代物,可以使用在較長(zhǎng)觀察時(shí)段(若干音頻幀)上計(jì)算的狀態(tài)變量。這些狀態(tài)變量包括在兩個(gè)或多個(gè)信號(hào)中語(yǔ)音活動(dòng)檢測(cè)值的若干分鐘上計(jì)算的相互關(guān)系或相互信息度量。在自然會(huì)話中,接聽(tīng)的參與者通常以簡(jiǎn)短言語(yǔ)(“是”、“好”、“真的?”、“嗯”等)的形式向說(shuō)話者提供反饋。這通常被稱(chēng)為反向信道(backcharmel)語(yǔ)音活動(dòng)?;谶@些言語(yǔ)是簡(jiǎn)短的(< Is)并且由相當(dāng)長(zhǎng)的靜默分隔開(kāi)的事實(shí),在來(lái)自遠(yuǎn)程終端1、2之一和來(lái)自單獨(dú)電話單元12、13之一或主電話單元8的用戶的音頻信息流40、41內(nèi)可分離地檢測(cè)所述反饋。反向信道活動(dòng)檢測(cè)可被用作附加的狀態(tài)變量,或者它可被用來(lái)修改例如狀態(tài)變量Conflict, 因?yàn)閮H當(dāng)重疊的語(yǔ)音活動(dòng)的時(shí)間片段不表示來(lái)自其他說(shuō)話者的反向信道活動(dòng)時(shí)才檢測(cè)到?jīng)_突。從話輪轉(zhuǎn)換的時(shí)間精細(xì)結(jié)構(gòu)(temporal fine-structure)可導(dǎo)出另一個(gè)特征。例如,在第二音頻信息流41中的語(yǔ)音活動(dòng)時(shí)段45的結(jié)束和第一音頻信息流40中語(yǔ)音活動(dòng)后繼時(shí)段44的開(kāi)始之間的時(shí)間點(diǎn)之間的時(shí)間差(反之亦然)可用作會(huì)話話輪轉(zhuǎn)換的質(zhì)量的度量。在類(lèi)似會(huì)話的交互情況下,隨著若干發(fā)言者改變測(cè)量的該時(shí)間差與非會(huì)話交互相比具有稍微正的均值和低的方差。在后一種情況中,時(shí)間差具有均值零和大的方差。
為了提高檢測(cè)發(fā)言者變化的精確性,可使用音頻信息內(nèi)容的分析來(lái)擴(kuò)充語(yǔ)音活動(dòng)檢測(cè)。特別地,對(duì)于音頻信息流40、41,可分析音調(diào)(pitch)。在許多語(yǔ)言中,在口頭言語(yǔ)結(jié)束前的上升音調(diào)指示對(duì)另一個(gè)說(shuō)話者的問(wèn)題。如果這后面是另一個(gè)說(shuō)話者的語(yǔ)音活動(dòng),可能在小的暫停之后,則這種類(lèi)型的變化可被標(biāo)記為問(wèn)題-回答結(jié)構(gòu),該結(jié)構(gòu)可表征為用于檢測(cè)類(lèi)似會(huì)話的交互的會(huì)話模型中的特征(狀態(tài)變量)。注意到以上詳細(xì)描述的算法基于使用一階積分器(first-order integrator)確定的許多狀態(tài)變量的動(dòng)態(tài)時(shí)間進(jìn)展。各種不同的線性和非線性過(guò)濾和積分算法可被用作可
替代方案。
替代使用特征的線性組合來(lái)形成表示會(huì)話活動(dòng)可能性的特征Conversation,會(huì)話的檢測(cè)可基于不是線性檢測(cè)(或回歸)模型的其他模型,包括基于判別分析、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)的各種類(lèi)型的數(shù)據(jù)分類(lèi)方法。代替二進(jìn)制變量,特征Conversation還可以是具有范圍在0和1之間的值的連續(xù)
可能性變量。最終,替代使用用于時(shí)間進(jìn)展(gl、g2、g3)的固定參數(shù)和檢測(cè)邏輯(步驟2),可以使用單獨(dú)的技術(shù)來(lái)最優(yōu)化用于不同用戶和呼叫者或不同環(huán)境(context)的參數(shù)。例如,可以針對(duì)每對(duì)系統(tǒng)的會(huì)話伙伴或每個(gè)本地用戶和識(shí)別的規(guī)則的遠(yuǎn)程呼叫者單獨(dú)地調(diào)諧會(huì)話檢測(cè)器。類(lèi)似地,取決于傳輸正被分析的音頻信息的信號(hào)是否來(lái)自第一或第二單獨(dú)電話單元12、13或來(lái)自主電話單元8,參數(shù)和/或檢測(cè)邏輯可不同。會(huì)話檢測(cè)和分析的方法通常十分難以實(shí)時(shí)地實(shí)現(xiàn)。然而,在諸如電信系統(tǒng)之類(lèi)的居間環(huán)境中,它們的實(shí)現(xiàn)方式變得在較低計(jì)算成本下是可行的,因?yàn)橐呀?jīng)清楚每個(gè)音頻信息流來(lái)自哪里。這與在安裝了麥克風(fēng)的房間中的人群中進(jìn)行會(huì)話檢測(cè)的系統(tǒng)形成了相反, 因?yàn)槟抢锼新曇舳急徊东@,并且必須首先被歸因于房間中不同的人。在涉及例如建筑物4的本地環(huán)境中的用戶1和使用例如第一遠(yuǎn)程終端1的呼叫者的會(huì)話的檢測(cè)之后,環(huán)境電話系統(tǒng)在會(huì)話話輪轉(zhuǎn)換模型的基礎(chǔ)上相對(duì)于彼此分析例如歸因于用戶1的第一信息流40和例如歸因于遠(yuǎn)程呼叫者的第二音頻信息流41,從而預(yù)測(cè)預(yù)期在來(lái)自本地用戶的信號(hào)中從靜默時(shí)段42到語(yǔ)音時(shí)段44的轉(zhuǎn)換何時(shí)發(fā)生(步驟47)。該分析可僅基于話音活動(dòng)檢測(cè)以定位語(yǔ)音時(shí)段44、45和靜默時(shí)段42、43。它可通過(guò)分析音頻信息流 40、41的至少部分的內(nèi)容而得以擴(kuò)充。特別地,遠(yuǎn)程呼叫者話音中在靜默時(shí)段之前的上升音調(diào)的檢測(cè)、疑問(wèn)從句的指示物可被用作來(lái)自本地用戶的語(yǔ)音時(shí)段45即將跟隨的指示物。基本上此時(shí),或不久以后,但是至少在并且僅在預(yù)期來(lái)自用戶1的語(yǔ)音的時(shí)段44 內(nèi),使得若干系統(tǒng)功能得以執(zhí)行。在一個(gè)示范性的步驟48中,該步驟是可選的,用戶1的狀態(tài)例如通過(guò)網(wǎng)絡(luò)3被傳輸?shù)狡渌到y(tǒng)。這可以幫助避免中斷。在視頻會(huì)議實(shí)施例中,該通知可被用來(lái)在顯示設(shè)備 22上和在遠(yuǎn)程呼叫者的顯示設(shè)備上加亮下一個(gè)發(fā)言者。如果用戶1位于第二單獨(dú)電話單元13所在的空間6中,則照明設(shè)備24被控制(步驟49)以增加照明等級(jí)。同樣地,這在視頻會(huì)議應(yīng)用中將是有用的。也可能例如增加麥克風(fēng)14-16的靈敏度,降低說(shuō)話者17-19的音量和/或采取類(lèi)似的措施以提高傳送到遠(yuǎn)程呼叫者的聲音的質(zhì)量。這樣的措施也使回聲消除更容易執(zhí)行。在任何情況下,預(yù)測(cè)的轉(zhuǎn)換選擇性地被用來(lái)激活(步驟50)優(yōu)選地基于音頻的定位方法。也就是說(shuō),在預(yù)期音頻信息從本地用戶傳輸?shù)拈g隔期間至少部分地在來(lái)自麥克風(fēng) 14-16的信號(hào)的基礎(chǔ)上使那個(gè)用戶被定位。特別地,該特定用戶貢獻(xiàn)的預(yù)期的開(kāi)始不同于另一個(gè)本地用戶對(duì)相同或不同類(lèi)似會(huì)話的交互的貢獻(xiàn)的開(kāi)始。這有助于增加定位方法的精確度。區(qū)分來(lái)自本地用戶的下一個(gè)貢獻(xiàn)和來(lái)自遠(yuǎn)程呼叫者的貢獻(xiàn)的開(kāi)始意味著,在處理來(lái)自麥克風(fēng)14-16的輸入信號(hào)以移除背景噪聲的過(guò)程中不必花費(fèi)太多的努力。 原則上任何已知類(lèi)型的基于音頻的定位都可以得以執(zhí)行。在一個(gè)簡(jiǎn)單的實(shí)施例中,用戶可與接收最強(qiáng)麥克風(fēng)信號(hào)的電話單元8、12、13相關(guān)聯(lián)。在另一個(gè)實(shí)施例中,可使用三角測(cè)量來(lái)提供更準(zhǔn)確的定位。附帶地,注意到用戶位置的跟蹤不需要排他地由基于音頻的方法組成。在圖5的方法中,如果在緊跟預(yù)期到來(lái)自用戶的語(yǔ)音時(shí)段44的轉(zhuǎn)換發(fā)生的時(shí)間點(diǎn)的間隔內(nèi)沒(méi)有信息從用戶1傳輸,則使一個(gè)或多個(gè)其他系統(tǒng)功能得以執(zhí)行(步驟51)。特別地,該時(shí)間點(diǎn)被取為中斷用戶的適宜點(diǎn)。某些動(dòng)作的實(shí)行因此延遲至這樣的時(shí)間點(diǎn)。在該步驟51中觸發(fā)的動(dòng)作的實(shí)例包括將已請(qǐng)求參加電話會(huì)議的另一個(gè)呼叫者引入正在進(jìn)行的會(huì)話或再現(xiàn)與會(huì)話完全不相關(guān)的消息或其他輸出。例如,該系統(tǒng)可使數(shù)據(jù)處理系統(tǒng)延遲提供已通過(guò)另一個(gè)通信設(shè)備(未在圖1中示出)接收呼叫、文本消息、電子郵件或圖像的指示。 作為另一個(gè)實(shí)例,來(lái)自包括電話單元8、12、13的建筑物4中的設(shè)備的錯(cuò)誤消息或注意消息可被延遲,直到該步驟51被觸發(fā)為止。在圖示的實(shí)施例中,環(huán)境電話系統(tǒng)還至少預(yù)測(cè)(步驟52)預(yù)期到來(lái)自遠(yuǎn)程呼叫者的語(yǔ)音時(shí)段45的轉(zhuǎn)換發(fā)生的時(shí)間點(diǎn)。然后它在類(lèi)似于相同名字3的在前步驟48的步驟中例如通過(guò)網(wǎng)絡(luò)3將本地用戶狀態(tài)的變化傳輸(步驟53)到其他系統(tǒng)。如果用戶位于第二單獨(dú)電話單元13所在的空間6中,則照明設(shè)備24受到控制(步驟54)以降低照明等級(jí)。該步驟54通常表示控制環(huán)境電話系統(tǒng)外部的設(shè)備的類(lèi)似步驟的所有方式,其中使這樣的外部設(shè)備功能執(zhí)行的調(diào)適(adaptation)在相對(duì)于從居間會(huì)話中的一個(gè)參與者到另一個(gè)參與者的貢獻(xiàn)間的轉(zhuǎn)換的預(yù)測(cè)時(shí)間來(lái)確定的時(shí)間處開(kāi)始。此外,如果在緊跟預(yù)期到來(lái)自遠(yuǎn)程呼叫者的語(yǔ)音時(shí)段44的轉(zhuǎn)換發(fā)生的時(shí)間點(diǎn)的間隔內(nèi)沒(méi)有信息從外部呼叫者傳輸,則使一個(gè)或多個(gè)另外的系統(tǒng)功能得以執(zhí)行(步驟55)。圖5給出了電信系統(tǒng)中類(lèi)似會(huì)話的交互的一個(gè)實(shí)例,其中該交互實(shí)際上在兩個(gè)或更多人之間進(jìn)行。相同的原理可應(yīng)用于任意分布式語(yǔ)音接口系統(tǒng),例如那些在家庭支撐和舒適應(yīng)用、老人看護(hù)應(yīng)用和口語(yǔ)對(duì)話系統(tǒng)中使用的分布式語(yǔ)音接口系統(tǒng)。在該情況下,至少一個(gè)信息流來(lái)自于非人的源。因此,在電話單元8、12、13設(shè)有分布式語(yǔ)音接口系統(tǒng)和用于控制建筑物4中的諸如娛樂(lè)設(shè)備25之類(lèi)的設(shè)備的裝置的場(chǎng)合,可執(zhí)行如圖6中所示的方法。在第一步驟56中,分析從用戶到系統(tǒng)和從系統(tǒng)到用戶的信息流以確定類(lèi)似會(huì)話的交互是否正在發(fā)生。該系統(tǒng)提供輸出(步驟57),例如邀請(qǐng)用戶提供口頭輸入的形式的可聽(tīng)輸出。然后做關(guān)于用戶可能何時(shí)開(kāi)始提供口頭輸入的預(yù)測(cè)(步驟58)。在相對(duì)于該預(yù)測(cè)的時(shí)間點(diǎn)確定的時(shí)間點(diǎn)(例如確切相同的時(shí)間點(diǎn)或者某個(gè)稍微靠后的時(shí)間點(diǎn)),基于音頻的定位方法的執(zhí)行得以啟動(dòng)(步驟59)。此外,觸發(fā)該系統(tǒng)(步驟60)以?xún)H向在相對(duì)于在在前的步驟58中預(yù)測(cè)的時(shí)間點(diǎn)確定的間隔內(nèi)接收的音頻信息應(yīng)用自動(dòng)語(yǔ)音識(shí)別。一個(gè)效果是該系統(tǒng)不需要分析由麥克風(fēng)14-16拾取的所有聲音輸入。因此,系統(tǒng)的功能的執(zhí)行在相對(duì)于在類(lèi)似會(huì)話的交互的結(jié)構(gòu)的知識(shí)的基礎(chǔ)上預(yù)測(cè)的時(shí)間點(diǎn)確定的時(shí)間處啟動(dòng)。特別地,在分布式語(yǔ)音換能器的系統(tǒng)中定位用戶的精確度得以提尚。應(yīng)注意上述實(shí)施例說(shuō)明而不是限制了本發(fā)明,并且本領(lǐng)域技術(shù)人員將能夠設(shè)計(jì)許多替換實(shí)施例,而不脫離附加權(quán)利要求的范圍。在權(quán)利要求中,放置在括號(hào)之間的任何附圖標(biāo)記不應(yīng)當(dāng)被解釋為限制權(quán)利要求。詞“包括”不排除除在權(quán)利要求中列出的那些元件或步驟以外的元件或步驟的存在。元件前的詞“一”或“一個(gè)”不排除多個(gè)這樣的元件的存在。在互不相同的從屬權(quán)利要求中敘述某些措施這一起碼事實(shí)并不表示這些措施的組合不能有益地使用。盡管將用戶和單個(gè)遠(yuǎn)程呼叫者或本地?cái)?shù)據(jù)處理系統(tǒng)之間的類(lèi)似會(huì)話的交互用作實(shí)例,但在此略述的方法在涉及三個(gè)或更多參與者之間的話輪轉(zhuǎn)換的會(huì)話中同樣有用。模式檢測(cè)可用來(lái)預(yù)測(cè)在該交互中這三者中的哪個(gè)將跟隨這三者中的另一個(gè)。可替代地,只有預(yù)期到另一發(fā)言者的轉(zhuǎn)換發(fā)生的時(shí)間點(diǎn)可得以預(yù)測(cè)。于是取決于其他條件的滿足,例如檢測(cè)到的下一個(gè)話音活動(dòng)必須是本地的或者前一個(gè)發(fā)言者必須不是本地用戶,可以在相對(duì)于所預(yù)測(cè)的時(shí)間確定的時(shí)間處進(jìn)行功能的執(zhí)行。在實(shí)例中,功能執(zhí)行的啟動(dòng)相應(yīng)于功能執(zhí)行的觸發(fā)。它還可以相應(yīng)于例如利用不同加權(quán)的基于音頻的定位方法的執(zhí)行的啟動(dòng)。在該情況下,使用符合預(yù)期語(yǔ)音間隔的音頻幀確定的位置被給予比使用其他音頻幀確定的位置更多的權(quán)重。因此,可修改圖5的方法, 使得連續(xù)地執(zhí)行定位用戶的步驟50,但是所估計(jì)的位置取決于它們是使用在來(lái)自本地用戶的語(yǔ)音時(shí)段45或靜默時(shí)段43期間獲得的音頻信息估計(jì)的可能性而加權(quán)。
權(quán)利要求
1.控制系統(tǒng)的方法,包括-通過(guò)用戶環(huán)境中的輸入設(shè)備(14-16)獲得代表由用戶傳輸?shù)男畔⒌闹辽僖粋€(gè)信號(hào), 其中來(lái)自第一源(1,2)的信號(hào)在該環(huán)境中以可感知的形式可獲得;-至少估計(jì)預(yù)期在來(lái)自所述第一源(1,2)的信息和來(lái)自所述用戶的信息之間的轉(zhuǎn)換發(fā)生的時(shí)間點(diǎn);和-相對(duì)于估計(jì)的時(shí)間定時(shí)所述系統(tǒng)功能的執(zhí)行。
2.根據(jù)權(quán)利要求1的方法,包括-從所述第一源(1,2)獲得信號(hào),和-通過(guò)在會(huì)話話輪轉(zhuǎn)換模型的基礎(chǔ)上相對(duì)于彼此分析來(lái)自所述用戶的信息流和來(lái)自所述第一源(1,2)的信號(hào)中攜帶的信息流來(lái)執(zhí)行所述估計(jì)。
3.根據(jù)權(quán)利要求1的方法,其中-來(lái)自所述至少一個(gè)輸入設(shè)備和來(lái)自所述第一源(1,2)的信號(hào)至少包括音頻成分,并且其中所述方法包括相對(duì)于彼此隨著時(shí)間分析音頻信息流。
4.根據(jù)權(quán)利要求2的方法,其中信息流的分析包括對(duì)代表由用戶傳輸?shù)男畔⒌乃鲋辽僖粋€(gè)信號(hào)應(yīng)用話音活動(dòng)算法。
5.根據(jù)權(quán)利要求1的方法,其中來(lái)自所述第一源(1,2)的信號(hào)通過(guò)至少一個(gè)電信網(wǎng)絡(luò)(3)從具有到電信系統(tǒng)(8,12,13)的開(kāi)放連接的遠(yuǎn)程電信終端獲得,所述電信系統(tǒng) (8,12,13)包括到所述用戶環(huán)境中至少所述輸入設(shè)備(14-16)的接口(31)。
6.根據(jù)權(quán)利要求5的方法,其中所述電信系統(tǒng)與許多輸入設(shè)備(14-16)接口以獲得表示由所述用戶傳輸?shù)男畔⒌男盘?hào),并且與許多再生設(shè)備(17-19)接口以以可感知的形式再生來(lái)自所述第一源(1,2)的所述信號(hào),其中使該系統(tǒng)相對(duì)于所估計(jì)的時(shí)間定時(shí)用于定位用戶的功能的執(zhí)行。
7.根據(jù)權(quán)利要求6的方法,其中在估計(jì)用戶傳輸信息的間隔期間至少部分地在來(lái)自輸入設(shè)備(14-16)的信號(hào)的基礎(chǔ)上使得所述用戶被定位。
8.根據(jù)權(quán)利要求1的方法,包括延遲在所述用戶環(huán)境中的設(shè)備(25)上再現(xiàn)輸出的功能直到相對(duì)于所估計(jì)的時(shí)間確定的時(shí)間為止。
9.根據(jù)權(quán)利要求1的方法,包括僅當(dāng)在緊跟預(yù)期所述轉(zhuǎn)換發(fā)生的時(shí)間點(diǎn)的間隔內(nèi)沒(méi)有信息從所述第一源(1,2)和所述用戶之一傳輸時(shí),才使所述系統(tǒng)在相對(duì)于估計(jì)的時(shí)間確定的時(shí)間執(zhí)行功能。
10.根據(jù)權(quán)利要求1的方法,包括,-在至少估計(jì)預(yù)期來(lái)自所述第一源(1,2)的信息和來(lái)自所述用戶的信息之間的轉(zhuǎn)換發(fā)生的時(shí)間點(diǎn)之前,-使用用于檢測(cè)相應(yīng)于在所述輸入設(shè)備(14-16)的環(huán)境中的用戶和所述第一源 (1,2)之間的會(huì)話話輪轉(zhuǎn)換的類(lèi)型的交互的至少一個(gè)標(biāo)準(zhǔn),隨時(shí)間分析來(lái)自所述第一源 (1,2)的信號(hào)中攜帶的信息流和來(lái)自所述輸入設(shè)備(14-16)之一的信號(hào)中攜帶的至少一個(gè) 信息流。
11.信號(hào)處理系統(tǒng),包括-到用戶環(huán)境中至少一個(gè)輸入設(shè)備(14-16)的接口(31),其中來(lái)自第一源(1,2)的信號(hào)以可感知的形式可獲得,所述接口(31)用于獲得表示由所述用戶傳輸?shù)男畔⒌闹辽僖粋€(gè)信號(hào);和- 處理裝置(8),用于至少估計(jì)預(yù)期來(lái)自所述第一源(1,2)的信息和來(lái)自所述用戶的信息之間的轉(zhuǎn)換發(fā)生的時(shí)間點(diǎn),其中所述信號(hào)處理系統(tǒng)被設(shè)置為相對(duì)于估計(jì)的時(shí)間定時(shí)系統(tǒng)功能的執(zhí)行。
12.根據(jù)權(quán)利要求11的信號(hào)處理系統(tǒng),被配置為執(zhí)行根據(jù)權(quán)利要求1-10中任意一項(xiàng)的方法。
13.計(jì)算機(jī)程序,包括當(dāng)合并在機(jī)器可讀介質(zhì)中時(shí)能夠使具有信息處理能力的系統(tǒng)執(zhí)行根據(jù)權(quán)利要求1-10中任意一項(xiàng)的方法的指令集。
全文摘要
控制系統(tǒng)的方法包括通過(guò)用戶環(huán)境中的輸入設(shè)備(14-16)獲得表示由用戶傳輸?shù)男畔⒌闹辽僖粋€(gè)信號(hào),其中來(lái)自第一源(1,2)的信號(hào)在該環(huán)境中以可感知的形式可獲得;至少估計(jì)預(yù)期在來(lái)自所述第一源(1,2)的信息和來(lái)自所述用戶的信息之間的轉(zhuǎn)換發(fā)生的時(shí)間點(diǎn);以及相對(duì)于所估計(jì)的時(shí)間定時(shí)所述系統(tǒng)功能的執(zhí)行。
文檔編號(hào)H04L29/06GK102160359SQ200980136673
公開(kāi)日2011年8月17日 申請(qǐng)日期2009年9月11日 優(yōu)先權(quán)日2008年9月18日
發(fā)明者A·S·哈馬 申請(qǐng)人:皇家飛利浦電子股份有限公司