為5+3 = 8。
[0048] 本發(fā)明實施例可以在確定第二用戶后,確定第一用戶與第二用戶之間的關(guān)系特征 參數(shù)值和語音的語音特征參數(shù)值。其中,確定語音特征參數(shù)的步驟可以在確定第二用戶之 前,同時或者之后。
[0049]本發(fā)明實施例可以獲得多種相互獨立的關(guān)系特征參數(shù)值和語音特征參數(shù)值。兩種 參數(shù)相互獨立的含義是兩種參數(shù)的數(shù)值互相無影響。
[0050] 其中,語音特征參數(shù)是語音本身的參數(shù),代表用戶語音的質(zhì)量。關(guān)系特征參數(shù)是第 二用戶與第一用戶之間的關(guān)系。
[0051] 本發(fā)明實施例的語音特征參數(shù)包括但不僅限于下面幾種:
[0052] (1)語音的短時平均過零率
[0053]語音的短時平均過零率用于評價語音的語速。系統(tǒng)以一定的采樣率(例如50Hz)對 含有用戶聲音的部分進行采樣,獲得多個采樣點的數(shù)值;并通過端點檢測方法將采樣的語 音中含有有效語音信號提取出來。對有效語音信號進行分幀后(每幀包括時間相鄰的128或 256個采樣點),通過加窗處理獲得每幀語音信號的短時過零率。語音信號的短時平均過零 率即為多個短時過零率數(shù)值的均值。
[0054]獲得有效語音信號中的一幀短時過零率的方法是根據(jù)公式:
(2)
[0056] 其中,sgn[ ?]中x(k)或x(k-l)語音值等于或大于零,則取為+1(即為正號),若x (k)或x(k-l)小于零則取為_1(負號)。
[0057] w(n-k)為窗函數(shù),用于提取其他函數(shù)在設(shè)定的范圍內(nèi)的值,w(n-k)的非零值范圍 為n-k 2 0,即k < n;n-k SN-1,故k 2 n-N+1 J為一幀語音包含的采樣點數(shù),可以為128也可以 為256。因此式可寫為:
(3)
[0059] 本發(fā)明實施例獲得有效語音信號中每幀采樣點的短時過零率后,用每幀采樣點對 應(yīng)的短時過零率求平均獲得求得整段語音的短時平均過零率。
[0060] 例如,語音的有效語音信號中包括兩幀語音信號,通過計算,兩幀語音信號的短時 過零率分別為a和b,則語音的短時平均過零率為(a+b)/2。
[0061] 語音的短時平均過零率公式表示如下:
(4)
[0063]其中,M代表有效語音信號包含語音的幀數(shù),Zt代表有效語音信號第t幀的短時過 零率。
[0064] (2)語音的倒譜特征均值
[0065] 語音的倒譜特征均值用于評估一段語音中的環(huán)境噪聲強度。通常,純凈語音在倒 譜域的均值接近于〇,那么帶噪語音倒譜特征均值主要表現(xiàn)為語音在信號傳輸過程中信道 卷積噪聲和加性噪聲在倒譜域的均值。獲得一段語音的倒譜均值可以通過需要對整段語音 信號進行分幀(分幀方法如上文中語音的短時平均過零率處所述),通過加窗處理獲得每一 幀的倒譜值,然后再取平均,獲得語音的倒譜特征均值。
[0066] 其中,對于語音x(n),倒譜定義為時間序列的z變換的模的對數(shù)的逆z變換,SP
[0067] c(n)=z_1[ln|z(x(n)) | ] (5)
[0068]寫成傅里葉變換的形式為:
(6)
[0070]本發(fā)明實施例用于計算倒譜均值的語音為經(jīng)過系統(tǒng)采樣的語音,語音的一幀的倒 譜均值對應(yīng)的離散形式的計算公式為
(7)
[0072]假設(shè)Ct(i)表示第t幀語音的第i個采樣點的倒譜特征值。N代表語音中包含的所有 幀的數(shù)量。mi表示語音的倒譜特征均值,根據(jù)迭代計算法來求取語音其他幀的倒譜均值mt。
[0073] 對其他幀的倒譜均值mt,向前滑動窗寬N,根據(jù)式(7)更新mt。
[0074] mt(i)=y ? mi-i(i)+(l-y ) ? Ct(i) (8)
[0075] 其中Y是更新步長,Y與N的關(guān)系如式(5)所示:
(9)
[0077]最終可以獲得所有幀的倒譜均值,對語音的所有幀的倒譜均值再求平均值,得到 語音的倒譜均值。
[0078] (3)語音的能量均值
[0079] 語音的能量均值用于評估語音的音量。
[0080] 根據(jù)上文中語音的短時平均過零率處所述的方法對整段語音進行分幀。
[0081 ]語音的一幀的短時能量定義為:
(10)
[0083]獲得語音每一幀的短時能量,對所有幀的短時能量求和再取平均值可以獲得語音 的能量均值。
[0084] (4)語音的幅度均值
[0085] 語音的幅度均值也用于評估語音的音量。
[0086] 根據(jù)上文中語音的短時平均過零率處所述的方法對整段語音進行分幀。
[0087]語音的的一幀的短時幅度定義為:
(11)
[0089] 獲得語音每一幀的短時幅度,對所有幀的短時幅度求和再取平均值可以獲得語音 的幅度均值。
[0090] (5)語音與第二用戶名稱的文本相似度 [0091 ]確定方式如上文公式(1)中所述,不再贅述。
[0092] 本發(fā)明實施例的關(guān)系特征參數(shù)包括但不僅限于下面幾種:
[0093] (1)距本次撥號在設(shè)置時長內(nèi)第一用戶與第二用戶之間通話次數(shù)占總撥號次數(shù)的 比例
[0094] (2)距本次撥號在設(shè)置時長內(nèi)第一用戶與第二用戶之間通話時長占總通話時長的 比例
[0095] (3)距本次撥號在設(shè)置時長內(nèi)第一用戶與第二用戶之間短信數(shù)目占總短信數(shù)目的 比例
[0096] (1)(2)(3)三種參數(shù)表示用戶與第二用戶的聯(lián)系頻率。設(shè)置時長可由用戶設(shè)定。通 話頻率越高、通話時間越久,發(fā)送短信數(shù)量越多,則用戶撥號給該聯(lián)系人的可能性越高。 [0097]實例應(yīng)用中,用戶近一月內(nèi)(設(shè)置時長)的總通話(來電+去電)數(shù)200次,通話時長 為100分鐘,發(fā)送和接收的短信數(shù)目為100條,本發(fā)明實施例在確定第二用戶后,確定第一用 戶在最近一個月與第二用戶通話次數(shù)為20次,通話時間10分鐘,發(fā)送短信20條。則第一用戶 與第二用戶之間通話時長占總通話時長的比例為20/200 = 0.1,第一用戶與第二用戶之間 通話時長占總通話時長的比例為10/100 = 0.1,第一用戶與第二用戶之間短信數(shù)目占總短 信數(shù)目的比例為20/100 = 0.2。
[0098] (4)親密度
[0099] 該特征值用于表示第一用戶與第二用戶之間的關(guān)系緊密程度。第一用戶與第二用 戶之間的關(guān)系可以包括但不限于下列關(guān)系:
[0100] 家人、同事、親戚、同學(xué)、朋友和其他。
[0101] 與用戶關(guān)系越近可以分配越高的親密度,例如家人的親密度為1,親戚的親密度為 0.7〇
[0102] 本發(fā)明實施例可以通過兩種方式確定第一用戶與第二用戶的關(guān)系:
[0103] 方式一、根據(jù)所述第二用戶在通訊錄中所屬的群組類型
[0104]通常的終端均有群組設(shè)置,如朋友、家人、同事、同學(xué)等,用戶可以根據(jù)個人習(xí)慣進 行群組的添加和命名(如圖2所示)。其中,〇1i為群組的親密度數(shù)值,n為所設(shè)立的群組個數(shù), 用戶可以設(shè)置不同群組的親密度數(shù)值。
[0105] 因而第一用戶可以根據(jù)第二用戶所屬的群組類型可以確定第二用戶與第一用戶 的關(guān)系,進而確定親密度。
[0106] 可選的,第一用戶和第二用戶之間的親密度按照第一用戶與第二用戶之間的關(guān)系 的取值可參照下表1。
[0108] 表1
[0109] 方式二、根據(jù)所述第二用戶在通訊錄中的名稱
[0110] 若用戶沒有將第二用戶在群組分類,終端可以根據(jù)用戶名稱中包含的頭銜確定第 一用戶與第二用戶之間的關(guān)系,不同種類的關(guān)系對應(yīng)一定的親密度。例如,"張經(jīng)理"同事或 合作伙伴關(guān)系;"王麗老師"師長或家長與老師的關(guān)系,"快遞張師傅"社會服務(wù)關(guān)系,可以根 據(jù)上述關(guān)系分別確定與關(guān)系對應(yīng)親密度。
[0111] 若通過第二用戶所在群組和用戶的名稱都無法確定第二用戶與第一用戶之間的 關(guān)系,則把第二用戶分到"其他"類別。
[0112] 綜上