本文中論述的實施方式涉及一種話語狀態(tài)確定裝置。
背景技術(shù):
作為一種用于估計在語音呼叫中每個講話者的情緒狀態(tài)的技術(shù),已知下述一種技術(shù):通過使用講話者的反饋語反饋的數(shù)量來確定講話者(對方講話者)是否處于生氣狀態(tài)(作為示例,參見專利文獻1)。
作為一種用于檢測在語音呼叫期間講話者(對方講話者)的情緒狀態(tài)的技術(shù),已知下述一種技術(shù):通過使用反饋語話語的間隔等來檢測講話者是否處于興奮狀態(tài)(作為示例,參見專利文獻2)。
此外,作為一種用于根據(jù)語音信號檢測反饋語反饋的技術(shù),已知下述一種技術(shù):將語音信號的話語區(qū)間與反饋語反饋字典中登記的反饋語數(shù)據(jù)進行比較,并且將話語區(qū)間中的與反饋語數(shù)據(jù)匹配的區(qū)間檢測作為反饋語區(qū)間(作為示例,參見專利文獻3)。
此外,作為一種用于記錄通過語音呼叫等在兩個人之間進行的對話并且在對話結(jié)束之后再現(xiàn)所記錄的對話(語音呼叫)的數(shù)據(jù)的技術(shù),已知下述一種技術(shù):根據(jù)講話者的語速來改變再現(xiàn)速度(作為示例,參見專利文獻4)。
此外,已知元音可以用作講話者的語音的特征量(作為示例,參見非專利文獻1)。
專利文獻1:日本公開特許公報No.2010-175684
專利文獻2:日本公開特許公報No.2007-286097
專利文獻3:日本公開特許公報No.2013-225003
專利文獻4:日本公開特許公報No.2013-200423
非專利文獻1:“Onsei(voice)1”,[在線],[于2015年8月29日搜索],互聯(lián)網(wǎng)<URL:http://media.sys.wakayama-u.ac.jp/kawahara-lab/LOCAL/diss/diss7/S3_6.htm>
技術(shù)實現(xiàn)要素:
一方面,本發(fā)明的目的在于提高基于給出反饋語反饋的方式確定講話者的情緒狀態(tài)的準確度。
根據(jù)實施方式的一方面,話語狀態(tài)確定裝置包括平均反饋語頻率估計單元、反饋語頻率計算單元以及確定單元。
平均反饋語頻率估計單元基于第一講話者的語音信號和第二講話者的語音信號來估計平均反饋語頻率,該平均反饋語頻率表示在從第二講話者的語音信號的語音開始時間至預(yù)定時間的時間段中第二講話者的反饋語頻率。反饋語頻率計算單元基于第一講話者的語音信號和第二講話者的語音信號來計算每單位時間中第二講話者的反饋語頻率。確定單元基于在平均反饋語頻率估計單元中估計的平均反饋語頻率和在反饋語頻率計算單元中計算的反饋語頻率來確定第二講話者的滿意度。
附圖說明
圖1是示出了根據(jù)實施方式1的語音呼叫系統(tǒng)的配置的圖;
圖2是示出了根據(jù)實施方式1的話語狀態(tài)確定裝置的功能配置的圖;
圖3是對話語狀態(tài)確定裝置中的語音信號的處理單位進行說明的圖;
圖4是提供了由根據(jù)實施方式1的話語狀態(tài)確定裝置執(zhí)行的處理的細節(jié)的流程圖;
圖5是提供了根據(jù)實施方式1的平均反饋語頻率估計處理的細節(jié)的流程圖;
圖6是示出了根據(jù)實施方式2的語音呼叫系統(tǒng)的配置的圖;
圖7是示出了根據(jù)實施方式2的話語狀態(tài)確定裝置的功能配置的圖;
圖8是提供了存儲在存儲單元中的語句的示例的圖;
圖9是提供了由根據(jù)實施方式2的話語狀態(tài)確定裝置執(zhí)行的處理的細節(jié)的流程圖;
圖10是提供了根據(jù)實施方式2的平均反饋語頻率估計處理的細節(jié)的流程圖;
圖11是示出了根據(jù)實施方式3的語音呼叫系統(tǒng)的配置的圖;
圖12是示出了根據(jù)實施方式3的服務(wù)器的功能配置的圖;
圖13是對話語狀態(tài)確定裝置中的語音信號的處理單位進行說明的圖;
圖14是提供了存儲在存儲單元中的語句的示例的圖;
圖15是示出了根據(jù)實施方式3的再現(xiàn)裝置的功能配置的圖;
圖16是提供了由根據(jù)實施方式3的話語狀態(tài)確定裝置執(zhí)行的處理的細節(jié)的流程圖;
圖17是提供了根據(jù)實施方式3的平均反饋語頻率估計處理的細節(jié)的流程圖;
圖18是示出了根據(jù)實施方式4的記錄裝置的配置的圖;
圖19是示出了根據(jù)實施方式4的話語狀態(tài)確定裝置的功能配置的圖;
圖20是提供了反饋語強度確定信息的示例的圖;
圖21是提供了語速和平均反饋語頻率的對應(yīng)表的示例的圖;
圖22是提供了由根據(jù)實施方式4的話語狀態(tài)確定裝置執(zhí)行的處理的細節(jié)的流程圖;
圖23是示出了根據(jù)實施方式5的記錄系統(tǒng)的功能配置的圖;
圖24是示出了根據(jù)實施方式5的話語狀態(tài)確定裝置的功能配置的圖;
圖25是提供了平均反饋語頻率的對應(yīng)表的示例的圖;
圖26是提供了由根據(jù)實施方式5的話語狀態(tài)確定裝置執(zhí)行的處理的細節(jié)的流程圖;以及
圖27是示出了計算機的硬件結(jié)構(gòu)的圖。
具體實施方式
將參照附圖來對本發(fā)明的優(yōu)選實施方式進行說明。
對講話者是否處于生氣狀態(tài)或處于不滿意狀態(tài)的估計(確定)使用了講話者的情緒狀態(tài)與給出反饋語反饋的方式之間的關(guān)系。更具體地,與講話者處于正常狀態(tài)時相比,當講話者生氣或不滿意時,反饋語反饋的次數(shù)較少。因此,可以作為示例基于反饋語反饋的次數(shù)和預(yù)先準備的特定閾值來確定對方講話者的情緒狀態(tài)。
然而,由于反饋語反饋的數(shù)量和間隔的個體變化,所以難以基于特定閾值確定講話者的情緒狀態(tài)。例如,在天生不太頻繁地給出反饋語反饋的確定目標講話者的情況下,雖然講話者比處于其正常狀態(tài)更頻繁地給出反饋語反饋,但是反饋語反饋的次數(shù)仍可能少于閾值,在這種情況下,可能確定講話者處于生氣狀態(tài)。在另一示例中,在天生頻繁地給出反饋語反饋的講話者的情況下,雖然講話者處于生氣狀態(tài)并且反饋語反饋的次數(shù)少于其正常狀態(tài),卻可能確定講話者處于正常狀態(tài)。在以下描述中,可以將反饋語反饋簡稱為“反饋語”。
<實施方式1>
圖1是示出了根據(jù)實施方式1的語音呼叫系統(tǒng)的配置的圖。如圖1中所示,根據(jù)本實施方式的語音呼叫系統(tǒng)100包括第一話機2、第二話機3、互聯(lián)網(wǎng)協(xié)議(IP)網(wǎng)絡(luò)4以及顯示裝置6。
第一話機2包括麥克風201、語音呼叫處理器202、接收器(揚聲器)203、顯示單元204以及話語狀態(tài)確定裝置5。第一話機2的話語狀態(tài)確定裝置5與顯示裝置6連接。注意,第一話機2的數(shù)量并不限于僅一個,而是可以包括多個話機。
第二話機3是可以經(jīng)由IP網(wǎng)絡(luò)4與第一話機2連接的話機。第二話機3包括麥克風301、語音呼叫處理器302以及接收器(揚聲器)303。
在該語音呼叫系統(tǒng)100中,使用第一話機2和第二話機3的語音呼叫通過經(jīng)由IP網(wǎng)絡(luò)4根據(jù)會話發(fā)起協(xié)議(SIP)在第一話機2與第二話機3之間進行呼叫連接來實現(xiàn)。
第一話機2在語音呼叫處理器202中將由麥克風201收集的第一講話者的語音信號轉(zhuǎn)換成用于傳輸?shù)男盘柌⑶覍⒔?jīng)轉(zhuǎn)換的信號傳送至第二話機3。第一話機2還在語音呼叫處理器202中將從第二話機3接收到的信號轉(zhuǎn)換成可以從接收器203輸出的語音信號,并且將經(jīng)轉(zhuǎn)換的信號輸出至接收器203。
第二話機3在語音呼叫處理器302中將由麥克風301收集的第二講話者(第一講話者的對方講話者)的語音信號轉(zhuǎn)換成用于傳輸?shù)男盘?,并且將?jīng)轉(zhuǎn)換的信號傳送至第一話機2。第二話機3還在語音呼叫處理器302中將從第一話機2接收到的信號轉(zhuǎn)換成可以從接收器303輸出的語音信號,并且將經(jīng)轉(zhuǎn)換的信號輸出至接收器303。
第一話機2中的語音呼叫處理器202和第二話機3中的語音呼叫處理器302分別包括編碼器、解碼器和收發(fā)器單元,但是圖1中省略了這些單元。編碼器將麥克風201或麥克風301收集的語音信號(模擬信號)轉(zhuǎn)換成數(shù)字信號。解碼器將從對方話機接收到的數(shù)字信號轉(zhuǎn)換成語音信號(模擬信號)。收發(fā)器單元根據(jù)實時傳輸協(xié)議(RTP)將數(shù)字信號打包進行傳輸,同時從所接收到的包解碼數(shù)字信號。
如上所述,根據(jù)本實施方式的語音呼叫系統(tǒng)100中的第一話機2包括話語狀態(tài)確定裝置5和顯示單元204。此外,第一話機2中的話語狀態(tài)確定裝置5與顯示裝置6連接。顯示裝置6由與使用第一話機2的第一講話者不同的另一人使用,另一人可以是例如監(jiān)視第一講話者的應(yīng)答的監(jiān)視者。
話語狀態(tài)確定裝置5基于第一講話者的語音信號和第二講話者的語音信號來確定第二講話者的話語狀態(tài)是否滿足滿意狀態(tài)(即,第二講話者的滿意度)。在第二講話者的話語狀態(tài)不滿足滿意狀態(tài)時,話語狀態(tài)確定裝置5還通過顯示單元204或顯示裝置6來警告第一講話者。顯示單元204顯示話語狀態(tài)確定裝置5的確定結(jié)果(第二講話者的滿意度)和警告等。此外,與第一話機2(話語狀態(tài)確定裝置5)連接的顯示裝置6向第一講話者顯示話語狀態(tài)確定裝置5發(fā)出的警告。
圖2是示出了根據(jù)實施方式1的話語狀態(tài)確定裝置的功能配置的圖。如圖2中所示,根據(jù)本實施方式的話語狀態(tài)確定裝置5包括:語音區(qū)間檢測單元501、反饋語區(qū)間檢測單元502、反饋語頻率計算單元503、平均反饋語頻率估計單元504、確定單元505以及警告輸出單元506。
語音區(qū)間檢測單元501檢測在第一講話者的語音信號中的語音區(qū)間。語音區(qū)間檢測單元501從第一講話者的語音信號中檢測下述區(qū)間作為語音區(qū)間:在所述區(qū)間中,根據(jù)語音信號獲得的功率為特定閾值TH或高于特定閾值TH。
反饋語區(qū)間檢測單元502檢測在第二講話者的語音信號中的反饋語區(qū)間。反饋語區(qū)間檢測單元502對第二講話者的語音信號進行形態(tài)分析,并且檢測與在反饋語字典中登記的任意反饋語數(shù)據(jù)匹配的區(qū)間作為反饋語區(qū)間,圖2中未示出反饋語字典。反饋語字典以文本數(shù)據(jù)的形式登記頻繁地用作反饋語反饋的感嘆詞,如“哦”、“我明白了”、“嗯”和“哇”。
反饋語頻率計算單元503計算第一講話者的每說話時長內(nèi)第二講話者的反饋語反饋的次數(shù)作為第二講話者的反饋語頻率。反饋語頻率計算單元503將特定時間單位設(shè)定為一幀,并且基于根據(jù)一幀內(nèi)的第一講話者的語音區(qū)間計算的說話時長和根據(jù)第二講話者的反饋語區(qū)間計算的反饋語反饋的次數(shù)來計算反饋語頻率。
平均反饋語頻率估計單元504基于第一講話者和第二講話者的語音信號來估計第二講話者的平均反饋語頻率。根據(jù)本實施方式的平均反饋語頻率估計單元504計算在下述時間段中反饋語頻率的平均值作為第二講話者的平均反饋語頻率的估計值:在所述時間段中,從第二講話者的語音信號的語音開始時間起過去了指定數(shù)量的幀。
確定單元505基于在反饋語頻率計算單元503中計算的反饋語頻率和在平均反饋語頻率估計單元504中計算(估計)的平均反饋語頻率來確定第二講話者的滿意度,換言之,第二講話者是否滿意。
當在確定單元505中連續(xù)地確定第二講話者不滿意(即,處于不滿意狀態(tài))指定次數(shù)或更多次時,警告輸出單元506使第一話機2的顯示單元204和與話語狀態(tài)確定裝置5連接的顯示裝置6顯示警告。
圖3是對話語狀態(tài)確定裝置中的語音信號的處理單位進行說明的圖。
在話語狀態(tài)確定裝置5中檢測語音區(qū)間和檢測反饋語區(qū)間時,例如如圖3中所示,執(zhí)行對語音信號中的每個樣本n的處理、每段時間t1內(nèi)的區(qū)間處理以及每段時間t2內(nèi)的幀處理。在圖3中,s1(n)是第一講話者的語音信號中的第n個樣本的幅值。圖3中的L-1和L表示區(qū)間號,以及作為示例,與一個區(qū)間對應(yīng)的時間t1是20毫秒。此外,圖3中的m-1和m是幀號,以及作為示例,與一幀對應(yīng)的時間t2為30秒。
語音區(qū)間檢測單元501使用第一講話者的語音信號中的每個樣本的幅值s1(n)并且通過使用以下公式(1)來計算區(qū)間L內(nèi)的語音信號的功率p1(L)。
在公式(1)中,N是區(qū)間L內(nèi)的樣本的數(shù)量。
接下來,語音區(qū)間檢測單元501將功率p1(L)與預(yù)定閾值TH進行比較并且將功率p1(L)≥TH的區(qū)間L檢測作為語音區(qū)間。語音區(qū)間檢測單元501輸出由以下公式(2)提供的u1(L)作為檢測結(jié)果。
反饋語區(qū)間檢測單元502通過使用第二講話者的語音信號中的每個樣本的幅值s2(n)進行形態(tài)分析來提取話語區(qū)間。接下來,反饋語區(qū)間檢測單元502將所提取出的話語區(qū)間與在反饋語字典中登記的反饋語數(shù)據(jù)進行比較并且將該話語區(qū)間中的與反饋語數(shù)據(jù)匹配的區(qū)間檢測作為話語區(qū)間。反饋語區(qū)間檢測單元502輸出由以下公式(3)提供的u2(L)作為檢測結(jié)果。
基于第m幀內(nèi)的語音區(qū)間的檢測結(jié)果和反饋語區(qū)間的檢測結(jié)果,反饋語頻率計算單元503計算由以下公式(4)提供的反饋語頻率IA(m)。
在公式(4)中,startj和endj分別是語音區(qū)間中的檢測結(jié)果u1(L)是1的區(qū)間的開始時間和結(jié)束時間。換言之,startj是針對每個樣本的檢測結(jié)果u1(n)從0升到1的時間點,以及endj是針對每個樣本的檢測結(jié)果u1(n)從1降到0的時間點。在公式(4)中,cntA(m)是反饋語區(qū)間中的檢測結(jié)果u2(L)是1的區(qū)間的數(shù)量。換言之,cntA(m)是針對每個樣本的檢測結(jié)果u2(n)從0升到1的次數(shù)。
平均反饋語頻率估計單元504通過使用在從第二講話者的語音開始時間起指定幀數(shù)F1中的反饋語頻率IA(m)來計算由以下公式(5)提供的每時間單位(一幀)的反饋語頻率的平均值JA作為平均反饋語頻率。
確定單元505基于以下公式(6)中提供的判別式來輸出確定結(jié)果v(m)。
在公式(6)中,v(m)=1指示線路另一端的人滿意,以及v(m)=0指示線路另一端的人不滿意。此外,公式(6)中的β表示修正系數(shù)(例如,β=0.7)。
警告輸出單元506獲得確定單元505的確定結(jié)果v(m)并且在兩個或更多個連續(xù)的幀中獲得結(jié)果v(m)=0時輸出警告信號。警告輸出單元506輸出由以下公式(7)提供的第二確定結(jié)果e(m)作為警告信號的示例。
圖4是提供了由根據(jù)實施方式1的話語狀態(tài)確定裝置執(zhí)行的處理的細節(jié)的流程圖。
在第一話機2與第二話機3之間的呼叫連接被連接從而語音呼叫變得可用時,根據(jù)本實施方式的話語狀態(tài)確定裝置5執(zhí)行圖4中所示的處理。
話語狀態(tài)確定裝置5開始監(jiān)測第一講話者與第二講話者之間的語音信號(步驟S100)。步驟S100由設(shè)置在話語狀態(tài)確定裝置5中的監(jiān)測單元(未示出)來執(zhí)行。監(jiān)測單元監(jiān)測從麥克風201傳送至語音呼叫處理器202的第一講話者的語音信號以及從語音呼叫處理器202傳送至接收器203的第二講話者的語音信號。監(jiān)測單元將第一講話者的語音信號輸出至語音區(qū)間檢測單元501和平均反饋語頻率估計單元504,并且還將第二講話者的語音信號輸出至反饋語區(qū)間檢測單元502和平均反饋語頻率估計單元504。
接下來,話語狀態(tài)確定裝置5執(zhí)行平均反饋語頻率估計處理(步驟S101)。步驟S101由平均反饋語頻率估計單元504來執(zhí)行。作為示例,平均反饋語頻率估計單元504通過使用公式(1)至公式(4)來計算從第二講話者的語音信號的語音開始時間起兩幀(60秒)中的反饋語頻率IA(m)。此后,平均反饋語頻率估計單元504將通過使用公式(5)計算的每一幀的反饋語頻率的平均值JA作為平均反饋語頻率輸出至確定單元505。
在計算出平均反饋語頻率JA之后,話語狀態(tài)確定裝置5執(zhí)行用于從第一講話者的語音信號檢測語音區(qū)間的處理(步驟S102)和用于從第二講話者的語音信號檢測反饋語區(qū)間的處理(步驟S103)。步驟S102由語音區(qū)間檢測單元501來執(zhí)行。語音區(qū)間檢測單元501通過使用公式(1)和公式(2)來計算第一講話者的語音信號中的語音區(qū)間的檢測結(jié)果u1(L)。語音區(qū)間檢測單元501將語音區(qū)間的檢測結(jié)果u1(L)輸出至反饋語頻率計算單元503。另一方面,步驟S103由反饋語區(qū)間檢測單元502來執(zhí)行。反饋語區(qū)間檢測單元502在通過上述形態(tài)分析等檢測到反饋語區(qū)間之后,通過使用公式(3)來計算反饋語區(qū)間的檢測結(jié)果u2(L)。反饋語區(qū)間檢測單元502將反饋語區(qū)間的檢測結(jié)果u2(L)輸出至反饋語頻率計算單元503。
注意,在圖4的流程圖中,在步驟S102之后執(zhí)行步驟S103,但是該順序并不受限制。因此,可以在步驟S102之前執(zhí)行步驟S103。此外,可以并行地執(zhí)行步驟S102和步驟S103。
接下來,話語狀態(tài)確定裝置5基于第一講話者的語音區(qū)間和第二講話者的反饋語區(qū)間來計算第二講話者的反饋語頻率(步驟S104)。步驟S104由反饋語頻率計算單元503來執(zhí)行。反饋語頻率計算單元503通過使用公式(4)來計算第m幀中第二講話者的反饋語頻率IA(m)。反饋語頻率計算單元503將所計算的反饋語頻率IA(m)輸出至確定單元505。
話語狀態(tài)確定裝置5基于第二講話者的平均反饋語頻率JA和反饋語頻率IA(m)來確定第二講話者的滿意度,并且將確定結(jié)果輸出至顯示單元和警告輸出單元(步驟S105)。步驟S105由確定單元505來執(zhí)行。確定單元505通過使用公式(6)來計算確定結(jié)果v(m)并且將確定結(jié)果v(m)輸出至顯示單元204和警告輸出單元506。
話語狀態(tài)確定裝置5判定在確定單元505中是否連續(xù)地確定第二講話者不滿意(確定不滿意)(步驟S106)。步驟S106由警告輸出單元506來執(zhí)行。警告輸出單元506存儲第m-1幀中的確定結(jié)果v(m-1)的值并且基于v(m)和v(m-1)來計算由公式(7)提供的第二確定結(jié)果e(m)。當e(m)=1時,警告輸出單元506判定在確定單元505中連續(xù)地確定不滿意。
當在確定單元505中連續(xù)地確定不滿意時(步驟S106:是),警告輸出單元506向顯示單元204和顯示裝置6輸出警告信號(步驟S107)。另一方面,當在確定單元505中并非連續(xù)地確定不滿意時(步驟S106:否),警告輸出單元506跳過步驟S107中的處理。
此后,話語狀態(tài)確定裝置5決定是否繼續(xù)處理(步驟S108)。當繼續(xù)處理時(步驟S108:是),話語狀態(tài)確定裝置5重復(fù)步驟S102和后續(xù)步驟中的處理。當不繼續(xù)處理時(步驟S108:否),話語狀態(tài)確定裝置5結(jié)束對第一講話者和第二講話者的語音信號的監(jiān)測并且結(jié)束處理。
注意,在話語狀態(tài)確定裝置5執(zhí)行上述處理時,第一話機2的顯示單元204和顯示裝置6顯示第二講話者的滿意度和其他事情。在開始語音呼叫時,第一話機2的顯示單元204和顯示裝置6顯示第二講話者沒有感覺到不滿意,并且此后提供了根據(jù)確定單元505的確定結(jié)果v(m)的顯示。當從警告輸出單元506輸出警告信號時,第一話機2的顯示單元204和顯示裝置6將與第二講話者的滿意度相關(guān)的顯示切換成根據(jù)警告信號的顯示。
圖5是提供了根據(jù)實施方式1的平均反饋語頻率估計處理的細節(jié)的流程圖。
根據(jù)本實施方式的話語狀態(tài)確定裝置5的平均反饋語頻率估計單元504在上述平均反饋語頻率估計處理(步驟S101)中執(zhí)行圖5中所示的處理。
平均反饋語頻率估計單元504執(zhí)行用于從第一講話者的語音信號檢測語音區(qū)間的處理(步驟S101a)和用于從第二講話者的語音信號檢測反饋語區(qū)間的處理(步驟S101b)。在步驟S101a中的處理中,平均反饋語頻率估計單元504通過使用公式(1)和公式(2)來計算在第一講話者的語音信號中的語音區(qū)間的檢測結(jié)果u1(L)。在步驟S101b的處理中,平均反饋語頻率估計單元504在通過上述形態(tài)分析等檢測到反饋語區(qū)間之后,通過使用公式(3)來計算反饋語區(qū)間的檢測結(jié)果u2(L)。
注意,在圖5的流程圖中,在步驟S101a之后執(zhí)行步驟S101b,但是該順序并不受限制。因此,可以首先執(zhí)行步驟S101b或者可以并行地執(zhí)行步驟S101a和步驟S101b。
接下來,平均反饋語頻率估計單元504基于第一講話者的語音區(qū)間和第二講話者的反饋語區(qū)間來計算第二講話者的反饋語頻率IA(m)(步驟S101c)。在步驟S101c的處理中,平均反饋語頻率估計單元504通過使用公式(4)來計算第m幀中第二講話者的反饋語頻率IA(m)。
此后,平均反饋語頻率估計單元504檢查是否計算了從第二講話者的語音開始時間起指定幀數(shù)F1中的反饋語頻率(步驟S101d)。當未計算指定幀數(shù)(例如,F(xiàn)1=2)中的反饋語頻率時(步驟S101d:否),平均反饋語頻率估計單元504重復(fù)步驟S101a至S101c中的處理。當計算了指定幀數(shù)中的反饋語頻率時(步驟S101d:是),平均反饋語頻率估計單元504根據(jù)指定幀數(shù)中的反饋語頻率來計算第二講話者的反饋語頻率的平均值JA(步驟S101e)。在步驟S101e的處理中,平均反饋語頻率估計單元504通過使用公式(5)來計算每一幀的反饋語頻率的平均值JA。在計算出反饋語頻率的平均值JA之后,平均反饋語頻率估計單元504將反饋語頻率的平均值JA作為平均反饋語頻率輸出至確定單元505,并且結(jié)束平均反饋語頻率估計處理。
如上所述,實施方式1計算在從第二講話者的語音開始時間起指定幀數(shù)(例如,60秒)中的語音信號中的反饋語頻率的平均值JA作為平均反饋語頻率,并且基于該平均反饋語頻率來確定第二講話者是否滿意。在從語音開始時間起(即在緊接語音呼叫開始之后)的指定幀數(shù)期間,第二講話者被估計處于正常狀態(tài)。因此,在從語音開始時間起的指定幀數(shù)期間的第二講話者的反饋語頻率可以被認為是正常狀態(tài)下的第二講話者的反饋語頻率。因此,根據(jù)實施方式1,能夠在考慮對于第二講話者而言唯一的平均反饋語頻率的情況下確定第二講話者是否滿意,因此還能夠提高基于給出反饋語反饋的方式確定講話者的情緒狀態(tài)的準確度。
注意,根據(jù)本實施方式的話語狀態(tài)確定裝置5不僅可以應(yīng)用于如圖1中所示的使用IP網(wǎng)絡(luò)4的語音呼叫系統(tǒng)100,還可以應(yīng)用于使用其他電話網(wǎng)絡(luò)的其他語音呼叫系統(tǒng)。
此外,圖2中所示的話語狀態(tài)確定裝置5中的平均反饋語頻率估計單元504通過監(jiān)測第一講話者和第二講話者的語音信號來計算平均反饋語頻率。然而,該計算并不受限制,而是作為示例,平均反饋語頻率估計單元504可以根據(jù)語音區(qū)間檢測單元501的檢測結(jié)果u1(L)和反饋語檢測單元502的檢測結(jié)果u2(L)的輸入來計算反饋語頻率的平均值JA。此外,作為示例,平均反饋語頻率估計單元504可以通過獲得反饋語頻率計算單元503針對從第二講話者的語音開始時間起指定幀數(shù)的計算結(jié)果IA(m)來計算反饋語頻率的平均值JA。
<實施方式2>
圖6是示出了根據(jù)實施方式2的語音呼叫系統(tǒng)的配置的圖。如圖6中所示,根據(jù)本實施方式的語音呼叫系統(tǒng)110包括第一話機2、第二話機3、IP網(wǎng)絡(luò)4、分路器8以及應(yīng)答評估裝置9。
第一話機2包括麥克風201、語音呼叫處理器202以及接收器203。注意,第一話機2的數(shù)量并不限于僅一個,而是可以具有多個話機。第二話機3是可以經(jīng)由IP網(wǎng)絡(luò)4與第一話機2連接的話機。第二話機3包括麥克風301、語音呼叫處理器302以及接收器303。
分路器8對從第一話機2的語音呼叫處理器202傳送至第二話機3的第一講話者的語音信號和從第二話機3傳送至第一話機2的語音呼叫處理器202的第二講話者的語音信號進行分路,并且將經(jīng)分路的信號輸入至應(yīng)答評估裝置9。分路器8被設(shè)置在第一話機2與IP網(wǎng)絡(luò)4之間的傳輸路徑上。
應(yīng)答評估裝置9是通過使用話語狀態(tài)確定裝置5來確定第二講話者(第一講話者的對方講話者)的滿意度的裝置。應(yīng)答評估裝置9包括接收器單元901、解碼器902、顯示單元903以及話語狀態(tài)確定裝置5。
接收器單元901接收由分路器8分路的第一講話者和第二講話者的語音信號。解碼器902將所接收到的第一講話者和第二講話者的語音信號解碼成模擬信號。話語狀態(tài)確定裝置5基于經(jīng)解碼的第一講話者和第二講話者的語音信號來確定第二講話者的話語狀態(tài),即,第二講話者是否滿意。顯示單元903顯示話語狀態(tài)確定裝置5的確定結(jié)果等。
在該語音呼叫系統(tǒng)110中,與根據(jù)實施方式1的語音呼叫系統(tǒng)100類似,通過根據(jù)SIP在第一話機2與第二話機3之間進行呼叫連接來實現(xiàn)使用話機2和話機3的語音呼叫。
圖7是示出了根據(jù)實施方式2的話語狀態(tài)確定裝置的功能配置的圖。如圖7中所示,根據(jù)本實施方式的話語狀態(tài)確定裝置5包括:語音區(qū)間檢測單元511、反饋語區(qū)間檢測單元512、反饋語頻率計算單元513、平均反饋語頻率估計單元514、確定單元515、語句輸出單元516以及存儲單元517。
語音區(qū)間檢測單元511檢測在第一講話者的語音信號中的語音區(qū)間。與根據(jù)實施方式1的話語狀態(tài)確定裝置5的語音區(qū)間檢測單元501類似,語音區(qū)間檢測單元511從第一講話者的語音信號中檢測下述區(qū)間作為語音區(qū)間:在所述區(qū)間中,根據(jù)語音信號獲得的功率為特定閾值TH或高于特定閾值TH。
反饋語區(qū)間檢測單元512檢測在第二講話者的語音信號中的反饋語區(qū)間。與根據(jù)實施方式1的話語狀態(tài)確定裝置5的反饋語區(qū)間檢測單元502類似,反饋語區(qū)間檢測單元512對第二講話者的語音信號進行形態(tài)分析,并且檢測與登記在反饋語字典中的任意反饋語數(shù)據(jù)匹配的區(qū)間作為反饋語區(qū)間。
反饋語頻率計算單元513計算第一講話者的每說話時長內(nèi)的第二講話者的反饋語反饋的次數(shù),作為第二講話者的反饋語頻率。反饋語頻率計算單元513將特定時間單位設(shè)定為一幀,并且基于根據(jù)一幀內(nèi)的第一講話者的語音區(qū)間計算的說話時長和根據(jù)第二講話者的反饋語區(qū)間計算的反饋語反饋的次數(shù)來計算反饋語頻率。注意,根據(jù)本實施方式的話語狀態(tài)確定裝置5中的反饋語頻率計算單元513通過使用第m幀內(nèi)的語音區(qū)間的檢測結(jié)果和反饋語區(qū)間的檢測結(jié)果來計算由以下公式(8)提供的反饋語頻率IB(m)。
在公式(8)中,與公式(4)類似,startj和endj分別是語音區(qū)間中的檢測結(jié)果u1(L)為1的區(qū)間的開始時間和結(jié)束時間。換言之,開始時間startj是針對每個樣本的檢測結(jié)果u1(n)從0升到1的時間點,以及結(jié)束時間endj是針對每個樣本的檢測結(jié)果u1(n)從1降到0的時間點。在公式(8)中,cntB(m)是根據(jù)在第m幀內(nèi)的第一講話者的語音區(qū)間中、在開始時間startj和結(jié)束時間endj之間檢測到的第二講話者的反饋語區(qū)間的數(shù)量而計算的反饋語反饋的次數(shù)。
平均反饋語頻率估計單元514估計第二講話者的平均反饋語頻率。注意,根據(jù)本實施方式的平均反饋語頻率估計單元514計算由以下公式(9)的更新等式提供的反饋語頻率的平均值JB,作為第二講話者的平均反饋語頻率的估計值。
JB(m)=ε·JB(m-1)+(1-ε)·IB(m) (9)
在公式(9)中,ε表示更新系數(shù)并且可以是0<ε<1的任意值(例如,ε=0.9)。此外,給定JB(0)=0.1。
確定單元515基于在反饋語頻率計算單元513中計算的反饋語頻率IB(m)和在平均反饋語頻率估計單元514中計算(估計)的平均反饋語頻率JB(m)來確定第二講話者的滿意度,即第二講話者是否滿意。確定單元515基于在以下公式(10)中提供的判別式來輸出確定結(jié)果v(m)。
語句輸出單元516從存儲單元517讀出與確定單元515中的滿意度的確定結(jié)果v(m)對應(yīng)的語句,并且使顯示單元903顯示該語句。
圖8是提供了存儲在存儲單元中的語句的示例的圖。
如公式(10)中所提供的那樣,根據(jù)本實施方式的滿意度的確定結(jié)果v(m)是兩個值0和1中的任一個。因此,如圖8所示,存儲單元517存儲兩類語句w(m),包括當v(m)=0時顯示的語句和當v(m)=1時顯示的語句。此外,在公式(10)中的判別式中,當?shù)诙v話者滿意時,確定結(jié)果為1,即v(m)=1。因此,如圖8中所示,當v(m)=0時,報告第二講話者感覺不滿意的語句被顯示,而當v(m)=1時,報告第二講話者滿意的語句被顯示。
圖9是提供了由根據(jù)實施方式2的話語狀態(tài)確定裝置執(zhí)行的處理的細節(jié)的流程圖。
在第一話機2與第二話機3之間的呼叫連接被連接并且語音呼叫變得可用時,根據(jù)本實施方式的話語狀態(tài)確定裝置5執(zhí)行圖9中所示的處理。
話語狀態(tài)確定裝置5開始獲取第一講話者和第二講話者的語音信號(步驟S200)。步驟S200由設(shè)置在話語狀態(tài)確定裝置5中的獲取單元(未示出)來執(zhí)行。獲取單元獲取從分路器8輸入至話語狀態(tài)確定裝置5的第一講話者的語音信號和第二講話者的語音信號。獲取單元將第一講話者的語音信號輸出至語音區(qū)間檢測單元511和平均反饋語頻率估計單元514,并且還將第二講話者的語音信號輸出至反饋語區(qū)間檢測單元512和平均反饋語頻率估計單元514。
接下來,話語狀態(tài)確定裝置5執(zhí)行平均反饋語頻率估計處理(步驟S201)。步驟S201由平均反饋語頻率估計單元514來執(zhí)行。作為示例,平均反饋語頻率估計單元514通過使用公式(1)至公式(3)和公式(8)來計算第二講話者的語音信號的反饋語頻率IB(m)。此后,平均反饋語頻率估計單元514通過使用公式(9)來計算反饋語頻率的平均值JB(m),并且將所計算的反饋語頻率的平均值JB(m)作為平均反饋語頻率輸出至確定單元515。
在計算出平均反饋語頻率JB(m)之后,話語狀態(tài)確定裝置5執(zhí)行用于從第一講話者的語音信號檢測語音區(qū)間的處理(步驟S202)以及用于從第二講話者的語音信號檢測反饋語區(qū)間的處理(步驟S203)。步驟S202由語音區(qū)間檢測單元511來執(zhí)行。語音區(qū)間檢測單元511通過使用公式(1)和公式(2)來計算第一講話者的語音信號中的語音區(qū)間的檢測結(jié)果u1(L)。語音區(qū)間檢測單元511將語音區(qū)間的檢測結(jié)果u1(L)輸出至反饋語頻率計算單元513。另一方面,步驟S203由反饋語區(qū)間檢測單元512來執(zhí)行。反饋語區(qū)間檢測單元512在通過上述形態(tài)分析等檢測到反饋語區(qū)間之后,通過使用公式(3)來計算反饋語區(qū)間的檢測結(jié)果u2(L)。反饋語區(qū)間檢測單元512將反饋語區(qū)間的檢測結(jié)果u2(L)輸出至反饋語頻率計算單元513。
當步驟S202和步驟S203中的處理結(jié)束時,話語狀態(tài)確定裝置5接下來基于第一講話者的語音區(qū)間和第二講話者的反饋語區(qū)間來計算第二講話者的反饋語頻率(步驟S204)。步驟S204由反饋語頻率計算單元513來執(zhí)行。反饋語頻率計算單元513通過使用公式(8)來計算第m幀中第二講話者的反饋語頻率IB(m)。
注意,在圖9中的流程圖中,步驟S201中計算平均反饋語頻率之后是步驟S202至S204中計算反饋語頻率,但是該順序并不受限制??梢栽诓襟ES201之前執(zhí)行步驟S202至步驟S204。替選地,可以并行地執(zhí)行步驟S201中的處理和步驟S202至S204中的處理。此外,對于步驟S202和S203中的處理,可以首先執(zhí)行步驟S203中的處理,或者可以并行地執(zhí)行步驟S202和S203中的處理。
當步驟S201至S204中的處理結(jié)束時,話語狀態(tài)確定裝置5基于第二講話者的平均反饋語頻率JB(m)和反饋語頻率IB(m)來確定第二講話者的滿意度,并且將確定結(jié)果輸出至顯示單元和語句輸出單元(步驟S205)。步驟S205由確定單元515來執(zhí)行。確定單元515通過使用公式(10)來計算確定結(jié)果v(m),并且將確定結(jié)果v(m)輸出至顯示單元903和語句輸出單元516。
話語狀態(tài)確定裝置5提取與確定結(jié)果v(m)對應(yīng)的語句并且使顯示單元903顯示該語句(步驟S206)。步驟S206由語句輸出單元516來執(zhí)行。語句輸出單元516通過參考存儲在存儲單元517中的語句表(參見圖8)來提取與確定結(jié)果v(m)對應(yīng)的語句w(m),將所提取的語句w(m)輸出至顯示單元903,并且使顯示單元903顯示該語句。
此后,話語狀態(tài)確定裝置5決定是否繼續(xù)處理(步驟S207)。當繼續(xù)處理時(步驟S207:是),話語狀態(tài)確定裝置5重復(fù)步驟S201和后續(xù)步驟中的處理。當不繼續(xù)處理時(步驟S207:否),話語狀態(tài)確定裝置5結(jié)束對第一講話者和第二講話者的語音信號的獲取并且結(jié)束處理。
圖10是提供了根據(jù)實施方式2的平均反饋語頻率估計處理的細節(jié)的流程圖。
根據(jù)本實施方式的話語狀態(tài)確定裝置5的平均反饋語頻率估計單元514在上述平均反饋語頻率估計處理(步驟S201)中執(zhí)行圖10中所示的處理。
平均反饋語頻率估計單元514執(zhí)行用于從第一講話者的語音信號檢測語音區(qū)間的處理(步驟S201a)和用于從第二講話者的語音信號檢測反饋語區(qū)間的處理(步驟S201b)。在步驟S201a的處理中,平均反饋語頻率估計單元514通過使用公式(1)和公式(2)來計算第一講話者的語音信號中的語音區(qū)間的檢測結(jié)果u1(L)。在步驟S201b的處理中,平均反饋語頻率估計單元514在通過上述形態(tài)分析等檢測到反饋語區(qū)間之后,通過使用公式(3)來計算反饋語區(qū)間的檢測結(jié)果u2(L)。
注意,在圖10的流程圖中,在步驟S201a之后執(zhí)行步驟S201b,但是該順序并不受限制。因此,可以在步驟S201a之前執(zhí)行步驟S201b。此外,可以并行地執(zhí)行步驟S201a和步驟S201b。
在步驟S201a和S201b中的處理結(jié)束之后,接下來,平均反饋語頻率估計單元514基于第一講話者的語音區(qū)間和第二講話者的反饋語區(qū)間來計算第二講話者的反饋語頻率IB(m)(步驟S201c)。在步驟S201c的處理中,平均反饋語頻率估計單元514通過使用公式(8)來計算第m幀中第二講話者的反饋語頻率IB(m)。
接下來,平均反饋語頻率估計單元514通過使用當前幀的反饋語頻率IB(m)和當前幀之前的幀中的第二講話者的反饋語頻率的平均值JB(m-1)來計算當前幀中的第二講話者的反饋語頻率的平均值JB(m)(步驟S201d)。在步驟S201d的處理中,平均反饋語頻率估計單元514通過使用公式(9)來計算當前幀(第m幀)中的平均反饋語頻率JB(m)。
此后,平均反饋語頻率估計單元514將在步驟S201d中計算的反饋語頻率的平均值JB(m)作為平均反饋語頻率輸出至確定單元515并且存儲反饋語頻率的平均值JB(m)(步驟S201e),以及平均反饋語頻率估計單元514結(jié)束平均反饋語頻率估計處理。
如上所述,同樣在實施方式2中,基于根據(jù)第二講話者的語音信號計算的平均反饋語頻率JB(m)和反饋語頻率IB(m)來確定第二講話者的滿意度。因此,與實施方式1類似,能夠在考慮對于第二講話者而言唯一的平均反饋語頻率的情況下確定第二講話者是否滿意,因此還能夠提高基于給出反饋語反饋的方式確定講話者的情緒狀態(tài)的準確度。
注意,根據(jù)本實施方式的話語狀態(tài)確定裝置5不僅可以應(yīng)用于如圖6中所示的使用IP網(wǎng)絡(luò)4的語音呼叫系統(tǒng)110,還可以應(yīng)用于使用其他電話網(wǎng)絡(luò)的其他語音呼叫系統(tǒng)。此外,語音呼叫系統(tǒng)110可以使用分配器代替分路器8。
此外,圖7中所示的話語狀態(tài)確定裝置5中的平均反饋語頻率估計單元514通過獲取由解碼器902解碼的第一講話者和第二講話者的語音信號來計算平均反饋語頻率JB(m)。然而,該計算并不受限制,而是作為示例,平均反饋語頻率估計單元514可以根據(jù)語音區(qū)間檢測單元511的檢測結(jié)果u1(L)和反饋語區(qū)間檢測單元512的檢測結(jié)果u2(L)的輸入來計算反饋語頻率的平均值JB(m)。此外,作為示例,平均反饋語頻率估計單元514可以通過獲得在反饋語頻率計算單元513中計算的反饋語頻率IB(m)來計算反饋語頻率的平均值JB(m)。
此外,根據(jù)本實施方式的話語狀態(tài)確定裝置5基于通過使用公式(1)至公式(3)和公式(8)計算的反饋語頻率IB(m)和通過使用反饋語頻率IB(m)計算的平均反饋語頻率JB(m)來確定第二講話者的滿意度。然而,圖6中所示的應(yīng)答評估裝置9中的話語狀態(tài)確定裝置5的配置可以與例如實施方式1中說明的話語狀態(tài)確定裝置5的配置(參見圖2)相同。
<實施方式3>
圖11是示出了根據(jù)實施方式3的語音呼叫系統(tǒng)的配置的圖。如圖11中所示,根據(jù)本實施方式的語音呼叫系統(tǒng)120包括第一話機2、第二話機3、IP網(wǎng)絡(luò)4、分路器8、服務(wù)器10以及再現(xiàn)裝置11。
第一話機2包括麥克風201、語音呼叫處理器202以及接收器203。第二話機3是可以經(jīng)由IP網(wǎng)絡(luò)4與第一話機2連接的話機。第二話機3包括麥克風301、語音呼叫處理器302以及接收器303。
分路器8對從第一話機2的語音呼叫處理器202傳送至第二話機3的第一講話者的語音信號和從第二話機3傳送至第一話機2的語音呼叫處理器202的第二講話者的語音信號進行分路,并且將經(jīng)分路的信號輸入至服務(wù)器10。分路器8被設(shè)置在第一話機2與IP網(wǎng)絡(luò)4之間的傳輸路徑上。
服務(wù)器10是下述裝置:所述裝置將經(jīng)由分路器8輸入的第一講話者和第二講話者的語音信號做成語音文件,存儲該文件,以及在必要時確定第二講話者(第一講話者的對方講話者)的滿意度。服務(wù)器10包括語音處理器單元1001、存儲單元1002以及話語狀態(tài)確定裝置5。語音處理器單元1001執(zhí)行根據(jù)第一講話者和第二講話者的語音信號生成語音文件的處理。存儲單元1002存儲所生成的第一講話者和第二講話者的語音文件。話語狀態(tài)確定裝置5通過讀出第一講話者和第二講話者的語音文件來確定第二講話者的滿意度。
再現(xiàn)裝置11是下述裝置:所述裝置用于讀出并再現(xiàn)服務(wù)器10的存儲單元1002中存儲的第一講話者和第二講話者的語音文件,以及用于顯示話語狀態(tài)確定裝置5的確定結(jié)果。
圖12是示出了根據(jù)實施方式3的服務(wù)器的功能配置的圖。
如圖12中所示,根據(jù)本實施方式的服務(wù)器10的語音處理器單元1001包括接收器單元1001a、解碼器1001b以及語音文件化處理器單元1001c。
接收器單元1001a接收由分路器8分路的第一講話者和第二講話者的語音信號。解碼器1001b將所接收到的第一講話者和第二講話者的語音信號解碼成模擬信號。語音文件化處理器單元1001c分別生成在解碼器1001b中解碼的第一講話者和第二講話者的語音信號的電子文件(語音文件),將每個語音文件相關(guān)聯(lián),以及將文件存儲在存儲單元1002中。
存儲單元1002針對每個語音呼叫存儲彼此相關(guān)聯(lián)的第一講話者和第二講話者的語音文件。響應(yīng)于來自再現(xiàn)裝置11的讀取請求,存儲在存儲單元1002中的語音文件被傳送至再現(xiàn)裝置11。在以下描述中,可以將第一講話者和第二講話者的語音文件稱為語音信號。
話語狀態(tài)確定裝置5讀出存儲在存儲單元1002中的第一講話者和第二講話者的語音文件,確定第二講話者的話語狀態(tài)即第二講話者是否滿意,以及將確定結(jié)果輸出至再現(xiàn)裝置11。如圖12B中所示,根據(jù)本實施方式的話語狀態(tài)確定裝置5包括語音區(qū)間檢測單元521、反饋語區(qū)間檢測單元522、反饋語頻率計算單元523、平均反饋語頻率估計單元524以及確定單元525。話語狀態(tài)確定裝置5還包括整體滿意度計算單元526、語句輸出單元527以及存儲單元528。
語音區(qū)間檢測單元521檢測第一講話者的語音信號中的語音區(qū)間。與根據(jù)實施方式1的話語狀態(tài)確定裝置5的語音區(qū)間檢測單元501類似,語音區(qū)間檢測單元521從第一講話者的語音信號中檢測下述區(qū)間作為語音區(qū)間:在所述區(qū)間中,根據(jù)語音信號獲得的功率為特定閾值TH或高于特定閾值TH。
反饋語區(qū)間檢測單元522檢測第二講話者的語音信號中的反饋語區(qū)間。與根據(jù)實施方式1的話語狀態(tài)確定裝置5的反饋語區(qū)間檢測單元502類似,反饋語區(qū)間檢測單元522對第二講話者的語音信號進行形態(tài)分析,并且檢測與登記在反饋語字典中的任意反饋語數(shù)據(jù)匹配的區(qū)間作為反饋語區(qū)間。
反饋語頻率計算單元523計算第一講話者的每說話時長內(nèi)的第二講話者的反饋語反饋的次數(shù)作為第二講話者的反饋語頻率。反饋語頻率計算單元523將特定時間單位設(shè)定成一幀,并且基于根據(jù)一幀內(nèi)第一講話者的語音區(qū)間計算的說話時長和根據(jù)第二講話者的反饋語區(qū)間計算的反饋語反饋的次數(shù)來計算反饋語頻率。注意,根據(jù)本實施方式的話語狀態(tài)確定裝置5中的反饋語頻率計算單元523通過使用第m幀內(nèi)的語音區(qū)間的檢測結(jié)果和反饋語區(qū)間的檢測結(jié)果來計算由以下公式(11)提供的反饋語頻率IC(m)。
在公式(11)中,與公式(4)類似,startj和endj分別是語音區(qū)間中的檢測結(jié)果u1(L)是1的區(qū)間的開始時間和結(jié)束時間。換言之,開始時間startj是針對每個樣本的檢測結(jié)果u1(n)從0升到1的時間點,以及結(jié)束時間endj是針對每個樣本的檢測結(jié)果u1(n)從1降到0的時間點。此外,cntC(m)是在第m幀中在第一講話者的語音區(qū)間的開始時間startj與結(jié)束時間endj之間的時間段中以及緊接在結(jié)束時間endj之后的特定時間段t內(nèi)的時間段中的第二講話者的反饋語反饋的次數(shù)。反饋語反饋的次數(shù)cntC(m)是根據(jù)在以上時間段中反饋語區(qū)間的檢測結(jié)果u2(n)從0升到1的次數(shù)來計算的。
平均反饋語頻率估計單元524估計第二講話者的平均反饋語頻率。根據(jù)本實施方式的平均反饋語頻率估計單元524計算由以下公式(12)提供的反饋語頻率的平均值JC作為第二講話者的平均反饋語頻率的估計值。
在公式(12)中,M是第二講話者的語音信號中的最后一幀(結(jié)束時間)的幀號。換言之,平均反饋語頻率JC是以幀為單位的從第二講話者的語音開始時間至結(jié)束時間的反饋語頻率的平均值。
確定單元525基于在反饋語頻率計算單元523中計算的反饋語頻率IC(m)和在平均反饋語頻率估計單元524中計算(估計)的平均反饋語頻率JC來確定第二講話者的滿意度,即第二講話者是否滿意。確定單元525基于由以下公式(13)提供的判別式來輸出確定結(jié)果v(m)。
在公式(13)中,β1和β2中的每一個是修正系數(shù),以及給定β1=0.2以及β2=1.5。
整體滿意度計算單元526計算在第一講話者與第二講話者之間的語音呼叫中第二講話者的整體滿意度V。整體滿意度計算單元526通過使用以下公式(14)來計算整體滿意度V。
在公式(14)中,c0、c1和c2分別是v(m)=0的幀數(shù)、v(m)=1的幀數(shù)以及v(m)=2的幀數(shù)。
語句存儲單元527從存儲單元528中讀出與整體滿意度計算單元526中計算的整體滿意度V對應(yīng)的語句,并且將該語句輸出至再現(xiàn)裝置11。
圖13是對根據(jù)本實施方式的話語狀態(tài)確定裝置5中的語音信號的處理單位進行說明的圖。
當在根據(jù)本實施方式的話語狀態(tài)確定裝置5中執(zhí)行對語音區(qū)間的檢測和對反饋語區(qū)間的檢測時,例如,如圖13中所示,執(zhí)行針對語音信號的每個樣本n的處理、每段時間t1內(nèi)的區(qū)間處理以及每段時間t2內(nèi)的幀處理。注意,每段時間t2內(nèi)的幀處理是交疊的處理,以及每個幀的開始時間被延遲時間t3(例如,10秒)。在圖13中,s1(n)表示在第一講話者的語音信號中的第n個樣本的幅值。此外,在圖13中,L-1和L均表示區(qū)間號,作為示例,與一個區(qū)間對應(yīng)的時間t1為20毫秒。此外,在圖13中,m-1和m均表示幀號,作為示例,與一幀對應(yīng)的時間t2為30秒。
圖14是提供了存儲在存儲單元中的語句的示例的圖。
如上所述,根據(jù)本實施方式的話語狀態(tài)確定裝置5中的語句輸出單元527從存儲單元528讀出與整體滿意度V對應(yīng)的語句,并且將該語句輸出至再現(xiàn)裝置11。整體滿意度V是通過使用公式(14)計算的值,并且是從0至100的任意值。通過使用公式(14)計算的整體滿意度V還是隨著c2的值(即v(m)=2的幀數(shù))變大而變大的值。因此,隨著第二講話者的滿意度越高,整體滿意度V取越接近100的較大值。因此,在整體滿意度V較低時,從存儲在存儲單元528中的語句中讀出指示第二講話者感覺不滿意的語句,而在整體滿意度V較高時,從存儲在存儲單元528中的語句中讀出指示第二講話者滿意的語句。在存儲單元528中,作為示例,如圖14中所示,存儲了與整體滿意度V的級別對應(yīng)的五類語句w(m)。
圖15是示出了根據(jù)實施方式3的再現(xiàn)裝置的功能配置的圖。如圖15中所示,根據(jù)本實施方式的再現(xiàn)裝置11包括操作單元1101、數(shù)據(jù)獲取單元1102、語音再現(xiàn)單元1103、揚聲器1104以及顯示單元1105。
操作單元1101是再現(xiàn)裝置11的操作者操作的輸入裝置如鍵盤裝置和鼠標裝置,并且用于選擇要再現(xiàn)的語音呼叫記錄的操作和其他操作。
數(shù)據(jù)獲取單元1102獲取與通過操作單元1101的操作選擇的語音呼叫記錄對應(yīng)的第一講話者和第二講話者的語音文件,以及還獲取與所獲取到的語音文件有關(guān)的、與話語狀態(tài)確定裝置5中的滿意度或整體滿意度的確定結(jié)果對應(yīng)的語句等。數(shù)據(jù)獲取單元1102從服務(wù)器10的存儲單元1002獲取第一講話者和第二講話者的語音文件。數(shù)據(jù)獲取單元1102還從話語狀態(tài)確定裝置5的確定單元525、整體滿意度計算單元526以及語句輸出單元527獲取確定結(jié)果等。
語音再現(xiàn)單元1103執(zhí)行用于將在數(shù)據(jù)獲取單元1102中獲取的第一講話者和第二講話者的語音文件(電子文件)轉(zhuǎn)換成可以從揚聲器1104輸出的模擬信號的處理。
顯示單元1105顯示與在數(shù)據(jù)獲取單元1102中獲取的滿意度或整體滿意度V的確定結(jié)果對應(yīng)的語句。
圖16是提供由根據(jù)實施方式3的話語狀態(tài)確定裝置執(zhí)行的處理的細節(jié)的流程圖。
作為示例,在服務(wù)器10從再現(xiàn)裝置11的數(shù)據(jù)獲取單元1102接收到對語音文件的傳輸請求時,根據(jù)本實施方式的話語狀態(tài)確定裝置5執(zhí)行圖16中提供的處理。
話語狀態(tài)確定裝置5從服務(wù)器10的存儲單元1002讀出第一講話者和第二講話者的語音文件(步驟S300)。步驟S300由設(shè)置在話語狀態(tài)確定裝置5中的獲取單元(未示出)來執(zhí)行。獲取單元獲取與再現(xiàn)裝置11請求的語音呼叫記錄對應(yīng)的第一講話者和第二講話者的語音文件。獲取單元將第一講話者的語音文件輸出至語音區(qū)間檢測單元521和平均反饋語頻率估計單元524,并且將第二講話者的語音文件輸出至反饋語區(qū)間檢測單元522和平均反饋語頻率估計單元524。
接下來,話語狀態(tài)確定裝置5執(zhí)行平均反饋語頻率估計處理(步驟S301)。步驟S301由平均反饋語頻率估計單元524來執(zhí)行。作為示例,平均反饋語頻率估計單元524通過使用公式(1)至公式(3)和公式(11)來計算第二講話者的反饋語頻率IC(m)。此后,平均反饋語頻率估計單元524通過使用公式(12)計算反饋語頻率的平均值JC,并且將所計算的反饋語頻率的平均值JC作為平均反饋語頻率輸出至確定單元525。
在計算出平均反饋語頻率JC之后,話語狀態(tài)確定裝置5執(zhí)行用于從第一講話者的語音信號檢測語音區(qū)間的處理(步驟S302)以及用于從第二講話者的語音信號檢測反饋語區(qū)間的處理(步驟S303)。步驟S302由語音區(qū)間檢測單元521來執(zhí)行。語音區(qū)間檢測單元521通過使用公式(1)和公式(2)來計算在第一講話者的語音信號中的語音區(qū)間的檢測結(jié)果u1(L)。語音區(qū)間檢測單元521將語音區(qū)間的檢測結(jié)果u1(L)輸出至反饋語頻率計算單元523。另一方面,步驟S303由反饋語區(qū)間檢測單元522來執(zhí)行。反饋語區(qū)間檢測單元522在通過上述形態(tài)分析等檢測到反饋語區(qū)間之后,通過使用公式(3)來計算反饋語區(qū)間的檢測結(jié)果u2(L)。反饋語區(qū)間檢測單元522將反饋語區(qū)間的檢測結(jié)果u2(L)輸出至反饋語頻率計算單元523。
注意,在圖16的流程圖中,在步驟S302之后執(zhí)行步驟S303,但是該順序并不受限制。因此,可以在步驟S302之前執(zhí)行步驟S303。此外,可以并行地執(zhí)行步驟S302和步驟S303。
當步驟S302和S303中的處理結(jié)束時,接下來,話語狀態(tài)確定裝置5基于第一講話者的語音區(qū)間和第二講話者的反饋語區(qū)間來計算第二講話者的反饋語頻率(步驟S304)。步驟S304由反饋語頻率計算單元523來執(zhí)行。反饋語頻率計算單元523通過使用公式(11)來計算第m幀中第二講話者的反饋語頻率IC(m)。
接下來,話語狀態(tài)確定裝置5基于第二講話者的平均反饋語頻率JC和反饋語頻率IC(m)來確定幀m中第二講話者的滿意度并且將確定結(jié)果輸出至再現(xiàn)裝置11(步驟S305)。步驟S305由確定單元525來執(zhí)行。確定單元525通過使用公式(13)來計算確定結(jié)果v(m),并且將確定結(jié)果v(m)輸出至再現(xiàn)裝置11和整體滿意度計算單元526。
話語狀態(tài)確定裝置5通過使用每個幀中的滿意度的確定結(jié)果v(m)的值來計算整體滿意度V,并且將整體滿意度V輸出至再現(xiàn)裝置11和語句輸出單元527(步驟S306)。步驟S306由整體滿意度計算單元526來執(zhí)行。整體滿意度計算單元526通過使用公式(14)來計算第二講話者的整體滿意度V。
話語狀態(tài)確定裝置5從存儲單元528讀出與整體滿意度V對應(yīng)的語句w(m)并且將該語句輸出至再現(xiàn)裝置11(步驟S307)。步驟S307由語句輸出單元527來執(zhí)行。語句輸出單元527通過參考存儲在存儲單元528中的語句表(參見圖13)來提取與整體滿意度V對應(yīng)的語句w(m),并且將所提取出的語句w(m)輸出至再現(xiàn)裝置11。
此后,話語狀態(tài)確定裝置5決定是否繼續(xù)處理(步驟S308)。在繼續(xù)處理時(步驟S308:是),話語狀態(tài)確定裝置5重復(fù)步驟S302和后續(xù)步驟中的處理。當不繼續(xù)處理時(步驟S308:否),話語狀態(tài)確定裝置5結(jié)束處理。
圖17是提供了根據(jù)實施方式3的平均反饋語頻率估計處理的細節(jié)的流程圖。
根據(jù)本實施方式的話語狀態(tài)確定裝置5的平均反饋語頻率估計單元524在上述平均反饋語頻率估計處理(步驟S301)中執(zhí)行圖17中所示的處理。
平均反饋語頻率估計單元524執(zhí)行用于從第一講話者的語音信號檢測語音區(qū)間的處理(步驟S301a)以及用于從第二講話者的語音信號檢測反饋語區(qū)間的處理(步驟S301b)。在步驟S301a中的處理中,平均反饋語頻率估計單元524通過使用公式(1)和公式(2)來計算第一講話者的語音信號中的語音區(qū)間的檢測結(jié)果u1(L)。在步驟S301b中的處理中,平均反饋語頻率估計單元524在通過上述形態(tài)分析等檢測到反饋語區(qū)間之后,通過使用公式(3)計算反饋語區(qū)間的檢測結(jié)果u2(L)。
注意,在圖17的流程圖中,在步驟S301a之后執(zhí)行步驟S301b,但是該順序并不受限制。因此,可以在步驟S301a之前執(zhí)行步驟S301b。此外,可以并行地執(zhí)行步驟S301a和步驟S301b。
接下來,平均反饋語頻率估計單元524基于第一講話者的語音區(qū)間和第二講話者的反饋語區(qū)間來計算第二講話者的反饋語頻率IC(m)(步驟S301c)。在步驟S301c的處理中,平均反饋語頻率估計單元524通過使用公式(11)來計算第m幀中第二講話者的反饋語頻率IC(m)。
接下來,平均反饋語頻率估計單元524檢查是否計算出從第二講話者的語音開始時間至結(jié)束時間的反饋語頻率(步驟S301d)。當未計算出從語音開始時間至結(jié)束時間的反饋語頻率時(步驟S301d:否),平均反饋語頻率估計單元524重復(fù)步驟S301a至S301c中的處理。當計算出從語音開始時間至結(jié)束時間的反饋語頻率時(步驟S301d:是),接下來,平均反饋語頻率估計單元524根據(jù)從語音開始時間至結(jié)束時間的反饋語頻率來計算第二講話者的反饋語頻率的平均值JC(步驟S301e)。在步驟S301e的處理中,平均反饋語頻率估計單元524通過使用公式(12)來計算反饋語頻率的平均值JC。在計算出反饋語頻率的平均值JC之后,平均反饋語頻率估計單元524將所計算出的反饋語頻率的平均值JC作為平均反饋語頻率輸出至確定單元525,并且結(jié)束平均反饋語頻率估計處理。
如上所述,同樣在實施方式3中,基于根據(jù)第二講話者的語音信號計算的平均反饋語頻率JC和反饋語頻率IC(m)來確定第二講話者的滿意度。因此,與實施方式1類似,能夠在考慮對于第二講話者而言唯一的平均反饋語頻率的情況下確定第二講話者是否滿意,因此還能夠提高基于給出反饋語反饋的方式確定講話者的情緒狀態(tài)的準確度。
另外,在實施方式3中,因為通過使用第一話機2和第二話機3進行的第一講話者和第二講話者的語音呼叫被作為語音文件(電子文件)存儲在服務(wù)器10的存儲單元1002中,所以可以在語音呼叫結(jié)束之后再現(xiàn)和收聽該語音文件。在實施方式3中,在語音文件再現(xiàn)期間計算第二講話者的整體滿意度V,并且將與整體滿意度V對應(yīng)的語句輸出至再現(xiàn)裝置11。因此,在語音呼叫結(jié)束之后觀看語音文件時,除了每幀(區(qū)間)中第二講話者的滿意度以外,還能夠在再現(xiàn)裝置11的顯示單元1105中檢查語音呼叫的整體滿意度和與整體滿意度對應(yīng)的語句。
注意,在本實施方式中作為示例提供的語音呼叫系統(tǒng)中的服務(wù)器10可以安裝在任意地方,并不限于安裝了第一話機2的設(shè)施,并且服務(wù)器10可以經(jīng)由通信網(wǎng)絡(luò)如因特網(wǎng)連接至第一話機2或再現(xiàn)裝置11。
<實施方式4>
圖18是示出了根據(jù)實施方式4的記錄裝置的配置的圖。如圖18中所示,根據(jù)本實施方式的記錄裝置12包括第一模擬-數(shù)字(AD)轉(zhuǎn)換器單元1201、第二AD轉(zhuǎn)換器單元1202、語音文件化處理器單元1203、操作單元1204、顯示單元1205、存儲裝置1206以及話語狀態(tài)確定裝置5。
第一AD轉(zhuǎn)換器單元1201將由第一麥克風13A收集的語音信號從模擬信號轉(zhuǎn)換成數(shù)字信號。第二AD轉(zhuǎn)換器單元1202將由第二麥克風13B收集的語音信號從模擬信號轉(zhuǎn)換成數(shù)字信號。在以下描述中,第一麥克風13A收集的語音信號是第一講話者的語音信號,以及第二麥克風13B收集的語音信號是第二講話者的語音信號。
語音文件化處理器單元1203生成由第一AD轉(zhuǎn)換器單元1201轉(zhuǎn)換的第一講話者的語音信號和由第二AD轉(zhuǎn)換器單元1202轉(zhuǎn)換的第二講話者的語音信號的電子文件(語音文件),將這些語音文件彼此相關(guān)聯(lián),以及將文件存儲在存儲單元1206中。
話語狀態(tài)確定裝置5通過使用例如由第一AD轉(zhuǎn)換器1201轉(zhuǎn)換的第一講話者的語音信號和由第二AD轉(zhuǎn)換器1202轉(zhuǎn)換的第二講話者的語音信號來確定第二講話者的話語狀態(tài)(滿意度)。話語狀態(tài)確定裝置5還將確定結(jié)果與由語音文件化處理器單元1203生成的語音文件相關(guān)聯(lián)并且將確定結(jié)果存儲在存儲裝置1206中。
操作單元1204是用于操作記錄裝置12的按鈕式開關(guān)等。例如,當記錄裝置12的操作者通過操作操作單元1204開始記錄時,指定處理的開始命令從操作單元1204被輸入至語音文件化處理器單元1203和話語狀態(tài)確定裝置5中的每一個。
顯示單元1205顯示話語狀態(tài)確定裝置5的確定結(jié)果(第二講話者的滿意度)等。
存儲裝置1206是用于存儲第一講話者和第二講話者的語音文件、第二講話者的滿意度等的裝置。注意,存儲裝置1206可以由諸如存儲卡的便攜式記錄介質(zhì)和記錄介質(zhì)驅(qū)動單元構(gòu)成,記錄介質(zhì)驅(qū)動單元可以從記錄介質(zhì)讀取數(shù)據(jù)以及可以在記錄介質(zhì)中寫入數(shù)據(jù)。
圖19是示出了根據(jù)實施方式4的話語狀態(tài)確定裝置的功能配置的圖。如圖19中所示,根據(jù)本實施方式的話語狀態(tài)確定裝置5包括:語音區(qū)間檢測單元531、反饋語區(qū)間檢測單元532、特征量計算單元533、反饋語頻率計算單元534、第一存儲單元535、平均反饋語頻率估計單元536以及第二存儲單元537。話語狀態(tài)確定裝置5還包括確定單元538和應(yīng)答分數(shù)輸出單元539。
語音區(qū)間檢測單元531檢測第一講話者的語音信號(由第一麥克風13A收集的講話者的語音信號)中的語音區(qū)間。與根據(jù)實施方式1的話語狀態(tài)確定裝置5的語音區(qū)間檢測單元501類似,語音區(qū)間檢測單元531從第一講話者的語音信號中檢測下述區(qū)間作為語音區(qū)間:在所述區(qū)間中,根據(jù)語音信號獲得的功率為特定閾值TH或高于特定閾值TH。
反饋語區(qū)間檢測單元532檢測第二講話者的語音信號(由第二麥克風13B收集的講話者的語音信號)中的反饋語區(qū)間。與根據(jù)實施方式1的話語狀態(tài)確定裝置5的反饋語區(qū)間檢測單元502類似,反饋語區(qū)間檢測單元532對第二講話者的語音信號進行形態(tài)分析,并且檢測與反饋語字典中登記的任意反饋語數(shù)據(jù)匹配的區(qū)間作為反饋語區(qū)間。
特征量計算單元533基于第二講話者的語音信號和由反饋語區(qū)間檢測單元532檢測到的反饋語區(qū)間來計算元音類型h(L)和音調(diào)偏移量df(L)。例如通過在非專利文獻1中描述的方法來計算元音類型h(L)。例如通過以下公式(15)來計算音調(diào)偏移量df(L)。
df(L)=f(L)-f(L-1) (15)
在公式(15)中,f(L)是區(qū)間L內(nèi)的音調(diào),并且可以通過已知的方法(如通過區(qū)間的自相關(guān)或倒譜分析進行的音調(diào)檢測)來計算。
反饋語頻率計算單元534基于元音類型h(L)和音調(diào)偏移量df(L)將反饋語反饋分成兩種情況,即,肯定和否定,并且計算由以下公式(16)提供的反饋語頻率ID(m)。
在公式(16)中,startj和endj分別是實施方式1中說明的第一講話者的語音區(qū)間的開始時間和結(jié)束時間。在公式(16)中,cnt0(m)和cnt1(m)分別是通過使用處于肯定狀態(tài)的反饋語區(qū)間計算的反饋語反饋的次數(shù)和通過使用處于否定狀態(tài)的反饋語區(qū)間計算的反饋語反饋的次數(shù)。此外,在公式(16)中,μ0和μ1是加權(quán)系數(shù),并且給定μ0=0.8以及μ1=1.2。注意,通過參考存儲在第一存儲單元535中的反饋語強度確定信息來將反饋語反饋分類成肯定或否定。
平均反饋語頻率估計單元536估計第二講話者的平均反饋語頻率。根據(jù)本實施方式的平均反饋語頻率估計單元536計算與在從第二講話者的語音開始時間起過去指定幀數(shù)的時間段中的語速r對應(yīng)的值JD作為第二講話者的平均反饋語頻率的估計值。語速r是通過已知的方法(例如,專利文獻4中描述的方法)計算的。在計算出語速r之后,平均反饋語頻率估計單元536通過參考存儲在第二存儲單元537中的語速r和平均反饋語頻率JD的對應(yīng)表來計算第二講話者的平均反饋語頻率JD。平均反饋語頻率估計單元536在第二講話者的講話者信息info2(n)每次改變時計算平均反饋語頻率JD。作為示例,講話者信息info2(n)從操作單元1204輸入。
確定單元538基于在反饋語頻率計算單元534中計算的反饋語頻率ID(m)和在平均反饋語頻率估計單元536中計算(估計)的平均反饋語頻率JD來確定第二講話者的滿意度,即第二講話者是否滿意。確定單元538基于以下公式(17)中提供的判別式來輸出確定結(jié)果v(m)。
在公式(17)中,β1和β2是修正系數(shù),并且作為示例,提供了β1=0.2以及β2=1.5。
應(yīng)答分數(shù)輸出單元539通過使用以下公式(18)來計算每幀中的應(yīng)答分數(shù)v'(m)。
應(yīng)答分數(shù)輸出單元539將所計算的應(yīng)答分數(shù)v'(m)輸出至顯示單元1205,并且使存儲裝置1206與在語音文件化處理器單元1203中生成的語音文件相關(guān)聯(lián)地存儲應(yīng)答分數(shù)。
圖20是提供了反饋語強度確定信息的示例的圖。反饋語頻率計算單元534參考的反饋語強度確定信息是以下信息:在所述信息中,基于元音類型和音調(diào)偏移量的組合將反饋語反饋分類成肯定或否定。例如,在區(qū)間L中元音類型h(L)為“/a/”的情況下,當音調(diào)偏移量df(L)為0或更大(升高的音調(diào))時,將反饋語反饋確定為肯定,而當音調(diào)偏移量df(L)小于0(降低的音調(diào))時,將反饋語反饋確定為否定。
圖21是提供了語速與平均反饋語頻率的對應(yīng)表的示例的圖。
盡管實施方式1至實施方式3基于反饋語頻率來計算平均反饋語頻率,但是本實施方式如上所述基于語速r來計算平均反饋語頻率JD。
與低語速的講話者相比,高語速的講話者(即,講話快的人)往往具有較短的反饋語反饋的間隔,因此更頻繁地作出反饋語反饋。出于該原因,如在圖21中提供的對應(yīng)表中那樣,平均反饋語頻率JD與語速r成比例地變大,例如,可以計算(估計)出趨勢與實施方式1至3類似的平均反饋語頻率JD。
圖22是提供了由根據(jù)實施方式4的話語狀態(tài)確定裝置執(zhí)行的處理的細節(jié)的流程圖。
在操作者操作記錄裝置12的操作單元1204以使得記錄裝置12開始記錄處理時,根據(jù)本實施方式的話語狀態(tài)確定裝置5執(zhí)行圖22中提供的處理。
話語狀態(tài)確定裝置5開始監(jiān)測第一講話者和第二講話者的語音信號(步驟S400)。步驟S400由設(shè)置在話語狀態(tài)確定裝置5中的監(jiān)測單元(未示出)來執(zhí)行。監(jiān)測單元監(jiān)測分別從第一AD轉(zhuǎn)換器1201和第二AD轉(zhuǎn)換器1202傳送至語音文件化處理器單元1203的第一講話者的語音信號和第二講話者的語音信號。監(jiān)測單元將第一講話者的語音信號輸出至語音區(qū)間檢測單元531和平均反饋語頻率估計單元536。監(jiān)測單元還將第二講話者的語音信號輸出至反饋語區(qū)間檢測單元532、特征量計算單元533以及平均反饋語頻率估計單元536。
話語狀態(tài)確定裝置5接下來執(zhí)行平均反饋語頻率估計處理(步驟S401)。步驟S401由平均反饋語頻率估計單元536來執(zhí)行。作為示例,平均反饋語頻率估計單元536基于從第二講話者的語音開始時間起兩幀(60秒)內(nèi)的語音信號來計算第二講話者的語速r。語速r通過任意已知的計算方法(例如,專利文獻4中描述的方法)來計算。此后,平均反饋語頻率估計單元536參考存儲在第二存儲單元537中的對應(yīng)表,并且將與語速r對應(yīng)的平均反饋語頻率JD作為第二講話者的平均反饋語頻率輸出至確定單元538。
在計算出平均反饋語頻率JD之后,話語狀態(tài)確定裝置5接下來執(zhí)行用于從第一講話者的語音文件檢測語音區(qū)間的處理(步驟S402)和用于從第二講話者的語音文件檢測反饋語區(qū)間的處理(步驟S403)。步驟S402由語音區(qū)間檢測單元531來執(zhí)行。語音區(qū)間檢測單元531通過使用公式(1)和公式(2)來計算第一講話者的語音信號中的語音區(qū)間的檢測結(jié)果u1(L),并且將語音區(qū)間的檢測結(jié)果u1(L)輸出至反饋語頻率計算單元534。步驟S403由反饋語區(qū)間檢測單元532來執(zhí)行。反饋語區(qū)間檢測單元532在通過上述形態(tài)分析等檢測到反饋語區(qū)間之后,通過使用公式(3)來計算反饋語區(qū)間的檢測結(jié)果u2(L),并且將反饋語區(qū)間的檢測結(jié)果u2(L)輸出至反饋語頻率計算單元534。
在檢測到反饋語區(qū)間之后,話語狀態(tài)確定裝置5接下來計算第二講話者的語音文件中的反饋語區(qū)間的特征量(步驟S404)。步驟S404由特征量計算單元533來執(zhí)行。特征量計算單元533計算元音類型h(L)和音調(diào)偏移量df(L)作為反饋語區(qū)間的特征量。元音類型h(L)通過任意已知的計算方法(例如,在非專利文獻1中描述的方法)、通過使用反饋語區(qū)間檢測單元532的反饋語區(qū)間的檢測結(jié)果u2(L)來計算。音調(diào)偏移量df(L)通過使用公式(15)來計算。特征量計算單元533將所計算的特征量即元音類型h(L)和音調(diào)偏移量df(L)輸出至反饋語頻率計算單元534。
注意,在圖22的流程圖中,在步驟S402之后執(zhí)行步驟S403和步驟S404,但是該順序并不受限制。因此,可以首先執(zhí)行步驟S403和步驟S404中的處理。替選地,可以并行地執(zhí)行步驟S402中的處理以及步驟S403和步驟S404中的處理。
在步驟S402至S404中的處理之后,接下來,話語狀態(tài)確定裝置5基于第一講話者的語音區(qū)間以及第二講話者的反饋語區(qū)間和特征量來計算第二講話者的反饋語頻率(步驟S405)。步驟S405由反饋語頻率計算單元534來執(zhí)行。在步驟S405中,反饋語頻率計算單元534基于第一存儲單元535中的反饋語強度確定信息和在步驟S404中計算的特征量,獲得肯定反饋語反饋的次數(shù)cnt0(m)和否定反饋語反饋的次數(shù)cnt1(m)。此后,反饋語頻率計算單元534通過使用公式(16)來計算第m幀中第二講話者的反饋語頻率ID(m),并且將反饋語頻率ID(m)輸出至確定單元538。
接下來,話語狀態(tài)確定裝置5基于第二講話者的平均反饋語頻率JD和反饋語頻率ID(m)來確定第二講話者的滿意度(步驟S406)。步驟S406由確定單元538來執(zhí)行。確定單元538通過使用公式(17)來計算確定結(jié)果v(m)。確定單元538將確定結(jié)果v(m)作為第二講話者的滿意度輸出至應(yīng)答分數(shù)輸出單元539。
接下來,話語狀態(tài)確定裝置5基于第二講話者的滿意度的確定結(jié)果來計算第一講話者的應(yīng)答分數(shù)并且輸出所計算的應(yīng)答分數(shù)(步驟S407)。步驟S407由應(yīng)答分數(shù)輸出單元539來執(zhí)行。應(yīng)答分數(shù)輸出單元539通過使用確定單元538的確定結(jié)果v(m)和公式(18)來計算應(yīng)答分數(shù)v'(m)。應(yīng)答分數(shù)輸出單元539使顯示單元1205顯示所計算的應(yīng)答分數(shù)v'(m),并且還使存儲裝置1206存儲應(yīng)答分數(shù)。
在輸出應(yīng)答分數(shù)v'(m)之后,話語狀態(tài)確定裝置5確定是否繼續(xù)處理(步驟S408)。當不繼續(xù)處理時(步驟S408:否),話語狀態(tài)確定裝置5結(jié)束對第一講話者和第二講話者的語音信號的監(jiān)測并且結(jié)束處理。
另一方面,當繼續(xù)處理時(步驟S408:是),話語狀態(tài)確定裝置5接下來檢查第二講話者的講話者信息是否發(fā)生改變(步驟S409)。當講話者信息info2(n)未發(fā)生改變時(步驟S409:否),話語狀態(tài)確定裝置5重復(fù)步驟S402和后續(xù)步驟中的處理。當講話者信息info2(n)發(fā)生改變時(步驟S409:是),話語狀態(tài)確定裝置5將處理返回至步驟S401,針對改變后的第二講話者計算平均反饋語頻率JD,以及執(zhí)行步驟S402和后續(xù)步驟中的處理。
如上所述,在實施方式4中,可以通過基于根據(jù)第二講話者的語音信號計算的平均反饋語頻率JD和反饋語頻率ID(m)計算第一講話者的應(yīng)答分數(shù)v'(m)來間接地獲得第二講話者的滿意度。
此外,因為在實施方式4中,根據(jù)第二講話者的語速r來計算平均反饋語頻率JD,所以即使在第二講話者例如是天生不頻繁地給出反饋語反饋的講話者的情況下,也可以適當?shù)赜嬎愠銎骄答佌Z頻率。
此外,在實施方式4中,根據(jù)在特征量計算單元533中計算的元音類型h(L)和音調(diào)偏移量df(L)將反饋語反饋分類成肯定反饋語反饋和否定反饋語反饋,并且基于分類來計算反饋語頻率ID(m)。出于該原因,即使一幀中的反饋語反饋的次數(shù)相同,實施方式4中的反饋語頻率ID(m)也響應(yīng)于肯定反饋語反饋的次數(shù)而改變其值。因此,即使在第二講話者是天生不頻繁地給出反饋語反饋的講話者的情況下,也能夠基于反饋語反饋為肯定還是否定來確定第二講話者是否滿意。
注意,根據(jù)本實施方式的話語狀態(tài)確定裝置5不僅可以用于圖18中所示的記錄裝置12,還可以用于在實施方式1至3中作為示例提供的語音呼叫系統(tǒng)。此外,記錄裝置12中的存儲裝置1206可以由諸如存儲卡的便攜式記錄介質(zhì)以及記錄介質(zhì)驅(qū)動單元構(gòu)成,記錄介質(zhì)驅(qū)動單元可以從便攜式記錄介質(zhì)讀取數(shù)據(jù)并且可以在便攜式記錄介質(zhì)中寫入數(shù)據(jù)。
<實施方式5>
圖23是示出了根據(jù)實施方式5的記錄系統(tǒng)的功能配置的圖。如圖23中所示,根據(jù)本實施方式的記錄系統(tǒng)14包括:第一麥克風13A、第二麥克風13B、記錄裝置15以及服務(wù)器16。作為示例,記錄裝置15和服務(wù)器16經(jīng)由諸如因特網(wǎng)的通信網(wǎng)絡(luò)連接。
記錄裝置15包括:第一AD轉(zhuǎn)換器單元1501、第二AD轉(zhuǎn)換器單元1502、語音文件化處理器單元1503、操作單元1504以及顯示單元1505。
第一AD轉(zhuǎn)換器單元1501將第一麥克風13A收集的語音信號從模擬信號轉(zhuǎn)換成數(shù)字信號。第二AD轉(zhuǎn)換器單元1502將第二麥克風13B收集的語音信號從模擬信號轉(zhuǎn)換成數(shù)字信號。在以下描述中,由第一麥克風13A收集的語音信號是第一講話者的語音信號,以及由第二麥克風13B收集的語音信號是第二講話者的語音信號。
語音文件化處理器單元1503生成由第一AD轉(zhuǎn)換器單元1501轉(zhuǎn)換的第一講話者的語音信號和由第二AD轉(zhuǎn)換器單元1502轉(zhuǎn)換的第二講話者的語音信號的電子文件(語音文件)。語音文件化處理器單元1503將所生成的語音文件存儲在服務(wù)器16的存儲裝置1601中。
操作單元1504是用于操作記錄裝置15的按鈕式開關(guān)等。例如,當記錄裝置15的操作者通過操作操作單元1504而開始記錄時,指定處理的開始命令從操作單元1504被輸入至語音文件化處理器單元1503。當記錄裝置15的操作者執(zhí)行用于再現(xiàn)所記錄的語音(存儲在存儲裝置1601中的語音文件)的操作時,記錄裝置15使用揚聲器來再現(xiàn)從存儲裝置1601讀出的語音文件,其中,在附圖中未示出該揚聲器。記錄裝置15在再現(xiàn)語音文件時還使話語狀態(tài)確定裝置5確定第二講話者的話語狀態(tài)。
顯示單元1505顯示話語狀態(tài)確定裝置5的確定結(jié)果(第二講話者的滿意度)等。
同時,服務(wù)器16包括存儲裝置1601和話語狀態(tài)確定裝置5。存儲裝置1601存儲各種數(shù)據(jù)文件,包括在記錄裝置15的語音文件化處理器單元1503中生成的語音文件。話語狀態(tài)確定裝置5在再現(xiàn)存儲在存儲裝置1601中的語音文件(第一講話者與第二講話者之間的對話的記錄)時確定第二講話者的話語狀態(tài)(滿意度)。
圖24是示出了根據(jù)實施方式5的話語狀態(tài)確定裝置的功能配置的圖。如圖24中所示,根據(jù)本實施方式的話語狀態(tài)確定裝置5包括:語音區(qū)間檢測單元541、反饋語區(qū)間檢測單元542、反饋語頻率計算單元543、平均反饋語頻率估計單元544以及存儲單元545。話語狀態(tài)確定裝置5還包括確定單元546和應(yīng)答分數(shù)輸出單元547。
語音區(qū)間檢測單元541檢測第一講話者的語音信號(由第一麥克風13A收集的語音信號)中的語音區(qū)間。與根據(jù)實施方式1的話語狀態(tài)確定裝置5的語音區(qū)間檢測單元501類似,語音區(qū)間檢測單元541從第一講話者的語音信號中檢測下述區(qū)間作為語音區(qū)間:在所述區(qū)間中,根據(jù)語音信號獲得的功率為特定閾值TH或高于特定閾值TH。
反饋語區(qū)間檢測單元542檢測第二講話者的語音信號(由第二麥克風13B收集的語音信號)中的反饋語區(qū)間。與根據(jù)實施方式1的話語狀態(tài)確定裝置5的反饋語區(qū)間檢測單元502類似,反饋語區(qū)間檢測單元542對第二講話者的語音信號進行形態(tài)分析,并且檢測與登記在反饋語字典中的任意反饋語數(shù)據(jù)匹配的區(qū)間作為反饋語區(qū)間。
反饋語頻率計算單元543計算第一講話者的每說話時長內(nèi)的第二講話者的反饋語反饋的次數(shù)作為第二講話者的反饋語頻率。反饋語頻率計算單元543將特定時間單位設(shè)定為一幀,并且基于根據(jù)一幀內(nèi)的第一講話者的語音區(qū)間計算的說話時長和根據(jù)第二講話者的反饋語區(qū)間計算的反饋語反饋的次數(shù)來計算反饋語頻率。與實施方式1類似,根據(jù)本實施方式的話語狀態(tài)確定裝置5中的反饋語頻率計算單元543計算由公式(4)提供的反饋語頻率IA(m)。
平均反饋語頻率估計單元544估計第二講話者的平均反饋語頻率。平均反饋語頻率估計單元544基于從第二講話者的語音開始時間起過去指定幀數(shù)的時間段內(nèi)的第二講話者的語音區(qū)間來計算(估計)第二講話者的反饋語頻率的平均值。平均反饋語頻率估計單元544執(zhí)行與語音區(qū)間檢測單元541類似的處理,并且檢測從第二講話者的語音開始時間起指定幀數(shù)(例如,兩幀)的語音信號中的語音區(qū)間。平均反饋語頻率估計單元544計算從所檢測到的語音區(qū)間的開始時間startj'至結(jié)束時間endj'的第二講話者的連續(xù)說話時長Tj和累積說話時長Tall。連續(xù)說話時長Tj和累積說話時長Tall分別根據(jù)以下公式(19)和(20)來計算。
Tj=endj′-startj′ (19)
此外,平均反饋語頻率估計單元544通過使用連續(xù)說話時長Tj和累積說話時長Tall來計算由以下公式(21)提供的時間Tsum。
Tsum=ξ1·Tj+ξ2·Tall (21)
在公式(21)中,ξ1和ξ2是加權(quán)系數(shù),并且作為示例,給定ξ1=ξ2=0.5。
此后,平均反饋語頻率估計單元544通過參考存儲在存儲單元545中的平均反饋語頻率的對應(yīng)表545a來計算與所計算的時間Tsum對應(yīng)的平均反饋語頻率JE。此外,當?shù)诙v話者的講話者信息info2(n)發(fā)生改變時,平均反饋語頻率估計單元544將info2(n-1)和平均反饋語頻率JE存儲在存儲單元545的講話者信息列表545b中。當?shù)诙v話者的講話者信息info2(n)發(fā)生改變時,平均反饋語頻率估計單元544參考存儲單元545的講話者信息列表545b。當改變后的講話者信息info2(n)在講話者信息列表545b上時,平均反饋語頻率估計單元544從講話者信息列表545b讀出與改變后的講話者信息info2(n)對應(yīng)的平均反饋語頻率JE,并且將平均反饋語頻率JE輸出至確定單元546。另一方面,當改變后的講話者信息info2(n)不在講話者信息列表545b上時,平均反饋語頻率估計單元544使用指定的初始值JE0作為平均反饋語頻率JE直至指定幀數(shù)過去為止,并且在指定幀數(shù)過去時以上述方式計算平均反饋語頻率JE。
確定單元546基于在反饋語頻率計算單元543中計算的反饋語頻率IA(m)和在平均反饋語頻率估計單元544中計算(估計)的平均反饋語頻率JE來確定第二講話者的滿意度,即第二講話者是否滿意。確定單元546基于以下公式(22)中提供的判別式來輸出確定結(jié)果v(m)。
在公式(22)中,β1和β2是修正系數(shù),并且作為示例,給定β1=0.2以及β2=1.5。
確定單元546將所計算的確定結(jié)果v(m)傳送至記錄裝置15,使記錄裝置15的顯示單元1505顯示確定結(jié)果,并且將確定結(jié)果輸出至應(yīng)答分數(shù)計算單元547。
應(yīng)答分數(shù)計算單元547計算在第一講話者與第二講話者之間的對話期間第二講話者的滿意度V。作為示例,通過使用實施方式3中提供的公式(14)來計算該滿意度V。應(yīng)答分數(shù)計算單元547將該整體滿意度V傳送至記錄裝置15,并且使記錄裝置15的顯示單元1505顯示整體滿意度V。
圖25是提供了平均反饋語頻率的對應(yīng)表的示例的圖。
盡管實施方式1至3基于第二講話者的反饋語頻率來計算平均反饋語頻率,但本實施方式如上所述基于第二講話者的說話時長(語音區(qū)間)來計算(估計)平均反饋語頻率。具有較長說話時長的講話者往往比具有較短說話時長的講話者更頻繁地作出反饋語反饋。出于該原因,如在圖25中所示的對應(yīng)表545a中那樣,例如,隨著與通過使用公式(19)至公式(21)計算的說話時長相關(guān)的時間Tsum變得越長,平均反饋語頻率JE越大。因此,可以計算出趨勢與實施方式1至3類似的平均反饋語頻率JE。
圖26是提供了由根據(jù)實施方式5的話語狀態(tài)確定裝置執(zhí)行的處理的細節(jié)的流程圖。
當操作者操作記錄裝置15的操作單元1504以使得對存儲在存儲裝置1601中的對話記錄的再現(xiàn)開始時,根據(jù)本實施方式的話語狀態(tài)確定裝置5執(zhí)行圖26中提供的處理。
話語狀態(tài)確定裝置5讀出第一講話者和第二講話者的語音文件(步驟S500)。步驟S500由設(shè)置在話語狀態(tài)確定裝置5中的讀取單元(未示出)來執(zhí)行。話語狀態(tài)確定裝置5中的讀取單元從存儲裝置1601中讀出與通過記錄裝置15的操作單元1504指定的對話記錄對應(yīng)的第一講話者和第二講話者的語音文件。讀取單元將第一講話者的語音文件輸出至語音區(qū)間檢測單元541和平均反饋語頻率估計單元544。讀取單元還將第二講話者的語音文件輸出至反饋語區(qū)間檢測單元542和平均反饋語頻率估計單元544。
接下來,話語狀態(tài)確定裝置5執(zhí)行平均反饋語頻率估計處理(步驟S501)。步驟S501由平均反饋語頻率估計單元544來執(zhí)行。在檢測到從第二講話者的語音開始時間起兩幀(60秒)的語音信號中的語音區(qū)間之后,平均反饋語頻率估計單元544通過使用公式(19)至公式(21)來計算時間Tsum。此后,平均反饋語頻率估計單元544參考存儲在存儲單元545中的平均反饋語頻率的對應(yīng)表545a,并且將與所計算的時間Tsum對應(yīng)的平均反饋語頻率JE作為第二講話者的平均反饋語頻率輸出至確定單元546。
接下來,話語狀態(tài)確定裝置5執(zhí)行用于從第一講話者的語音文件檢測語音區(qū)間的處理(步驟S502)和用于從第二講話者的語音文件檢測反饋語區(qū)間的處理(步驟S503)。步驟S502由語音區(qū)間檢測單元541來執(zhí)行。語音區(qū)間檢測單元541通過使用公式(1)和公式(2)來計算第一講話者的語音文件中的語音區(qū)間的檢測結(jié)果u1(L)。語音區(qū)間檢測單元541將語音區(qū)間檢測結(jié)果u1(L)輸出至反饋語頻率計算單元543。步驟S503由反饋語區(qū)間檢測單元542來執(zhí)行。反饋語區(qū)間檢測單元542在通過上述形態(tài)分析等檢測到反饋語區(qū)間之后,通過使用公式(3)來計算反饋語區(qū)間的檢測結(jié)果u2(L)。反饋語區(qū)間檢測單元542將反饋語區(qū)間的檢測結(jié)果u2(L)輸出至反饋語頻率計算單元543。
注意,在圖26的流程圖中,在步驟S502之后執(zhí)行步驟S503,但是該順序并未受限。因此,可以在步驟S502之前執(zhí)行步驟S503。此外,可以并行地執(zhí)行步驟S502和步驟S503。
當步驟S502和步驟S503中的處理結(jié)束時,話語狀態(tài)確定裝置5接下來基于第一講話者的語音區(qū)間和第二講話者的反饋語區(qū)間來計算第二講話者的反饋語頻率(步驟S504)。步驟S504由反饋語頻率計算單元543來執(zhí)行。反饋語頻率計算單元543如實施方式1中說明的那樣通過使用第m幀中的語音區(qū)間的檢測結(jié)果和反饋語區(qū)間的檢測結(jié)果來計算由公式(4)提供的反饋語頻率IA(m)。
話語狀態(tài)確定裝置5接下來基于第二講話者的平均反饋語頻率JE和反饋語頻率IA(m)來確定第二講話者的滿意度并且輸出確定結(jié)果(步驟S505)。步驟S505由確定單元546來執(zhí)行。確定單元546通過使用公式(22)來計算確定結(jié)果v(m)。
接下來,話語狀態(tài)確定裝置5將與所計算的確定結(jié)果v(m)的值對應(yīng)的滿意度的幀數(shù)加1(步驟S506)。步驟S506由應(yīng)答分數(shù)輸出單元547來執(zhí)行。此處,滿意度的幀數(shù)為公式(14)中使用的c0、c1和c2。作為示例,當確定結(jié)果v(m)是0時,在步驟S506中將c0的值加1。當確定結(jié)果v(m)是1或2時,在步驟S506中分別將c1的值或c2的值加1。
話語狀態(tài)確定裝置5接下來基于滿意度的幀數(shù)來計算第一講話者的應(yīng)答分數(shù)并且輸出所計算的應(yīng)答分數(shù)(步驟S507)。步驟S507由應(yīng)答分數(shù)輸出單元547來執(zhí)行。在步驟S507中,應(yīng)答分數(shù)輸出單元547通過使用公式(14)來計算第二講話者的滿意度V,并且該滿意度V變成第一講話者的應(yīng)答分數(shù)。應(yīng)答分數(shù)輸出單元547還將所計算的滿意度V(應(yīng)答分數(shù))輸出至記錄裝置15的揚聲器(未示出)。
在計算出應(yīng)答分數(shù)之后,話語狀態(tài)確定裝置5決定是否繼續(xù)處理(步驟S508)。當不繼續(xù)處理時(步驟S508:否),話語狀態(tài)確定裝置5結(jié)束對第一講話者和第二講話者的語音文件的讀取并且結(jié)束處理。
另一方面,當繼續(xù)處理時(步驟S508:是),話語狀態(tài)確定裝置5接下來檢查第二講話者的講話者信息是否發(fā)生改變(步驟S509)。當?shù)诙v話者的講話者信息info2(n)未發(fā)生改變時(步驟S509:否),話語狀態(tài)確定裝置5重復(fù)步驟S502和后續(xù)步驟中的處理。當?shù)诙v話者的講話者信息info2(n)發(fā)生改變時(步驟S509:是),話語狀態(tài)確定裝置5將處理返回至步驟S501,針對改變后的第二講話者計算平均反饋語頻率JE,以及執(zhí)行步驟S502和后續(xù)步驟中的處理。
如上所述,實施方式5使用基于第二講話者的連續(xù)說話時長Tj和累積說話時長Tall所計算的反饋語頻率的平均值JE作為平均反饋語頻率。出于該原因,即使第二講話者例如是天生不頻繁地給出反饋語反饋的講話者,也可以適當?shù)赜嬎愠銎骄答佌Z頻率,因此可以確定第二講話者是否滿意。
注意,根據(jù)本實施方式的話語狀態(tài)確定裝置5不僅可以用于圖23中所示的記錄系統(tǒng)14,還可以用于在實施方式1至3中作為示例提供的語音呼叫系統(tǒng)。
此外,話語狀態(tài)確定裝置5的配置和由話語狀態(tài)確定裝置5執(zhí)行的處理并不限于在實施方式1至5中作為示例提供的配置或處理。
在實施方式1至5中作為示例提供的話語狀態(tài)確定裝置5例如可以通過計算機和由計算機執(zhí)行的程序來實現(xiàn)。
圖27是示出了計算機的硬件結(jié)構(gòu)的圖。如圖27中所示,計算機17包括:處理器1701、主存儲裝置1702、輔助存儲裝置1703、輸入裝置1704以及顯示裝置1705。計算機17還包括接口裝置1706、記錄介質(zhì)驅(qū)動單元1707以及通信裝置1708。計算機17中的這些元件1701至1708經(jīng)由總線1710彼此連接,并且這些元件之間可以交換數(shù)據(jù)。
處理器1701是諸如中央處理單元(CPU)的處理單元,并且通過執(zhí)行包括操作系統(tǒng)的各種程序來控制計算機17的整體操作。
主存儲裝置1702包括只讀存儲器(ROM)和隨機存取存儲器(RAM)。主存儲裝置1702中的ROM預(yù)先記錄指定的基本控制程序等,這些基本控制程序等例如在計算機17啟動時被處理器1701讀出。當處理器1701執(zhí)行各種程序時,主存儲裝置1702中的RAM在必要時用作工作存儲區(qū)。主存儲裝置1702中的RAM例如可以用于臨時存儲(保留)平均反饋語頻率、第一講話者的語音區(qū)間以及第二講話者的反饋語區(qū)間,其中,平均反饋語頻率是反饋語頻率等的平均值。
輔助存儲裝置1703是諸如硬盤驅(qū)動器(HDD)和固態(tài)驅(qū)動器(SSD)的大容量存儲裝置,其容量與主存儲裝置1702相比更大。輔助存儲裝置1703存儲由處理器1701執(zhí)行的各種程序、各種數(shù)據(jù)等。作為示例,存儲在輔助存儲裝置1703中的程序包括使計算機執(zhí)行圖4和圖5中所示的處理的程序以及使計算機執(zhí)行圖9和圖10中所示的處理的程序。此外,輔助存儲裝置1703可以存儲作為示例用于實現(xiàn)計算機17與另一話機(或另一計算機)之間的語音呼叫的程序以及用于根據(jù)語音信號生成語音文件的程序。存儲在輔助存儲裝置1703中的數(shù)據(jù)包括語音呼叫的電子文件、第二講話者的滿意度的確定結(jié)果等。
輸入裝置1704例如是鍵盤裝置或鼠標裝置,以及當計算機17的操作者操作輸入裝置1704時,與操作的內(nèi)容相關(guān)聯(lián)的輸入信息被傳送至處理器1701。
作為示例,顯示裝置1705是液晶顯示器。液晶顯示器根據(jù)從處理器1701傳送的顯示數(shù)據(jù)等顯示各種文本、圖像等。
接口裝置1706例如是用于將諸如麥克風201和接收器(揚聲器)203的電子裝置連接至計算機17的輸入/輸出裝置。
記錄介質(zhì)驅(qū)動單元1707是用于讀出記錄在便攜式記錄介質(zhì)中的程序和數(shù)據(jù)以及將存儲在輔助存儲裝置1703中的數(shù)據(jù)等寫入便攜式記錄介質(zhì)的裝置,在附圖中未示出便攜式記錄介質(zhì)。例如,具有通用串行總線(USB)連接器的閃存可以用作便攜式記錄介質(zhì)。此外,諸如致密盤(CD)、數(shù)字多功能光盤(DVD)和藍光盤(藍光是商標)的光盤可以用作便攜式記錄介質(zhì)。
通信裝置1708是可以與計算機17和其他計算機等通信的裝置或者是可以連接計算機17和其他計算機等以使得能夠通過諸如因特網(wǎng)的通信網(wǎng)絡(luò)彼此通信的裝置。
計算機17可以用作例如圖1中所示的第一話機3中的語音呼叫處理器單元202和顯示單元204以及話語狀態(tài)確定裝置5。在這種情況下,例如,計算機17從輔助存儲裝置1703讀出用于使用IP網(wǎng)絡(luò)4進行語音呼叫的程序并且預(yù)先執(zhí)行程序,以及準備與第二話機3進行呼叫連接。當通過來自第二話機3的控制信號建立了計算機17與第二話機3之間的呼叫連接時,處理器1701執(zhí)行用于執(zhí)行圖4和圖5中所示的處理的程序并且執(zhí)行與語音呼叫相關(guān)的處理以及用于確定第二講話者的滿意度的處理。
此外,作為示例,能夠使計算機17執(zhí)行用于針對每個語音呼叫根據(jù)第一講話者和第二講話者的語音信號生成語音文件的處理。所生成的語音文件可以被存儲在輔助存儲裝置1703中或者可以通過記錄介質(zhì)驅(qū)動單元1707而被存儲在便攜式記錄介質(zhì)中。此外,可以將所生成的語音文件傳送至通過通信裝置1708和通信網(wǎng)絡(luò)連接的其他計算機。
注意,用作話語狀態(tài)確定裝置5的計算機17不需要包括圖27中所示的所有元件,而是可以取決于預(yù)期使用或情形省略一些元件(例如,記錄介質(zhì)驅(qū)動單元1707)。此外,計算機17并不限于可以通過執(zhí)行各種程序來實現(xiàn)多種功能的多用途類型,而是還可以使用專用于確定語音呼叫或?qū)υ捴刑囟ㄖv話者(第二講話者)的滿意度的裝置。