口考作弊檢測方法和裝置的制造方法
【專利摘要】本發(fā)明提出一種口考作弊檢測方法和裝置,該口考作弊檢測方法包括:獲取當前考生的口考語音數(shù)據(jù),以及除所述口考語音數(shù)據(jù)之外的輔助信息;根據(jù)所述口考語音數(shù)據(jù)和所述輔助信息,提取作弊檢測特征,所述作弊檢測特征包括:從所述口考語音數(shù)據(jù)中提取的聲紋特征,以及除所述聲紋特征之外的其他特征;根據(jù)所述作弊檢測特征和預先構(gòu)建的作弊檢測模型,得到作弊檢測結(jié)果。該方法能夠擴展口考作弊檢測的適用范圍。
【專利說明】
口考作弊檢測方法和裝置
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及語音處理技術(shù)領(lǐng)域,尤其涉及一種口考作弊檢測方法和裝置。
【背景技術(shù)】
[0002]隨著人們對語言學習熱情的高漲,各類語言的口語考試在各種學業(yè)考試和職業(yè)考試中也成為非常普遍的科目,比如全國的普通話水平測試、中高考英語口語考試以及各種小規(guī)??荚嚮驕y試中。為了保證口語考試評分的客觀性、公正性,口語考試中的作弊檢測也成為至關(guān)重要的問題??谡Z考試中的作弊主要有兩種類型:一、替考作弊,考生為其他人替考;二、抄襲作弊,考生抄襲他人,主要有考生跟讀作弊和錄取其他考生語音的抄襲作弊。
[0003]相關(guān)技術(shù)中,口考作弊檢測通常基于聲紋進行。但是,基于聲紋檢測的方式存在一定的局限性,例如,不能檢測考生跟讀作弊。
【發(fā)明內(nèi)容】
[0004]本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
[0005]為此,本發(fā)明的一個目的在于提出一種口考作弊檢測方法,該方法可以擴展口考作弊檢測的適用范圍,不僅適用于基于聲紋進行作弊檢測的場景,如替考、錄取其他考生語音等,還可以適用于其他場景,如跟讀作弊檢測。
[0006]本發(fā)明的另一個目的在于提出一種口考作弊檢測裝置。
[0007]為達到上述目的,本發(fā)明第一方面實施例提出的口考作弊檢測方法,包括:獲取當前考生的口考語音數(shù)據(jù),以及除所述口考語音數(shù)據(jù)之外的輔助信息;根據(jù)所述口考語音數(shù)據(jù)和所述輔助信息,提取作弊檢測特征,所述作弊檢測特征包括:從所述口考語音數(shù)據(jù)中提取的聲紋特征,以及除所述聲紋特征之外的其他特征;根據(jù)所述作弊檢測特征和預先構(gòu)建的作弊檢測模型,得到作弊檢測結(jié)果。
[0008]本發(fā)明第一方面實施例提出的口考作弊檢測方法,通過獲取出考生的聲紋特征之外的其他特征,可以在口考作弊檢測時,應用更多的特征進行口考作弊檢測,以擴展口考作弊檢測的適用范圍。
[0009]為達到上述目的,本發(fā)明第二方面實施例提出的口考作弊檢測裝置,包括:獲取模塊,用于獲取當前考生的口考語音數(shù)據(jù),以及除所述口考語音數(shù)據(jù)之外的輔助信息;提取模塊,用于根據(jù)所述口考語音數(shù)據(jù)和所述輔助信息,提取作弊檢測特征,所述作弊檢測特征包括:從所述口考語音數(shù)據(jù)中提取的聲紋特征,以及除所述聲紋特征之外的其他特征;確定模塊,用于根據(jù)所述作弊檢測特征和預先構(gòu)建的作弊檢測模型,得到作弊檢測結(jié)果。
[0010]本發(fā)明第二方面實施例提出的口考作弊檢測裝置,通過獲取出考生的聲紋特征之外的其他特征,可以在口考作弊檢測時,應用更多的特征進行口考作弊檢測,以擴展口考作弊檢測的適用范圍。
[0011]本發(fā)明附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到。
【附圖說明】
[0012]本發(fā)明上述的和/或附加的方面和優(yōu)點從下面結(jié)合附圖對實施例的描述中將變得明顯和容易理解,其中:
[0013]圖1是本發(fā)明一個實施例提出的口考作弊檢測方法的流程示意圖;
[0014]圖2是本發(fā)明另一個實施例提出的口考作弊檢測方法的流程示意圖;
[0015]圖3是本發(fā)明實施例中構(gòu)建作弊檢測模型的流程示意圖;
[0016]圖4是本發(fā)明實施例中采用的作弊檢測模型的拓撲結(jié)構(gòu)示意圖;
[0017]圖5是本發(fā)明一個實施例提出的口考作弊檢測裝置的結(jié)構(gòu)示意圖;
[0018]圖6是本發(fā)明另一個實施例提出的口考作弊檢測裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0019]下面詳細描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的模塊或具有相同或類似功能的模塊。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。相反,本發(fā)明的實施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同物。
[0020]圖1是本發(fā)明一個實施例提出的口考作弊檢測方法的流程示意圖。
[0021]參見圖1,本實施例的流程包括:
[0022]Sll:獲取當前考生的口考語音數(shù)據(jù),以及除所述口考語音數(shù)據(jù)之外的輔助信息。
[0023]其中,當前考生是指當前進行口考的考生,該考生可以是報名的考生本人,或者,也可以是報名的考生的替考者。
[0024]可以在當前考生口考過程中,對當前考生的語音數(shù)據(jù)進行錄制,從而可以獲取到當前考生的口考語音數(shù)據(jù)。
[0025]輔助信息可以包括:當前考生的其他信息,如身份信息、座位信息、答題內(nèi)容、發(fā)音信息等,還可以包括其他考生的信息,如當前考生的鄰座考生的信息,如鄰座考生的答題內(nèi)容、發(fā)音信息等,還可以包括當前考生所在考場的整體情況,如整體答題內(nèi)容,發(fā)音信息等。
[0026]其中,當前考生的身份信息是指當前考生聲稱的考生,也就是報名的考生的身份信息,因此可以從報名信息中獲取到上述的身份信息。
[0027]由于考生在考試時,為預先為考生分配座位,因此從分配信息中可以獲取到座位
?目息O
[0028]而其他的信息,如答題內(nèi)容、發(fā)音信息等可以根據(jù)考生的實際考試情況確定。
[0029]SI2:根據(jù)所述口考語音數(shù)據(jù)和所述輔助信息,提取作弊檢測特征,所述作弊檢測特征包括:從所述口考語音數(shù)據(jù)中提取的聲紋特征,以及除所述聲紋特征之外的其他特征。
[0030]本實施例中,作弊檢測特征不限于聲紋特征,還包括其他特征。
[0031 ]其他特征例如包括如下項中的一項或多項:
[0032]當前考生與相應座位聲紋相似度特征、鄰座聲紋相似度特征、鄰座答題內(nèi)容相似度特征、鄰座答題發(fā)音對比特征、整個考場考生整體答題內(nèi)容一致性特征、整個考場考生發(fā)音時差一致性特征。
[0033]本發(fā)明實施例中,以作弊檢測特征包括上述的7種特征為例。
[0034]具體的作弊檢測特征的提取方法可以參見后續(xù)實施例的描述。
[0035]S13:根據(jù)所述作弊檢測特征和預先構(gòu)建的作弊檢測模型,得到作弊檢測結(jié)果。
[0036]其中,作弊檢測模型的輸入是作弊檢測特征,輸出可以是作弊得分或者作弊檢測結(jié)果,以作弊檢測結(jié)果包括:作弊或不作弊為例,則輸出層有兩個節(jié)點,分別代表作弊或不作弊,如輸出為【0,I】表示不作弊,【I,0】表示作弊。因此,根據(jù)作弊檢測特征和作弊檢測模型,可以得到作弊得分或者直接得到作弊檢測結(jié)果。
[0037]當?shù)玫降氖亲鞅椎梅謺r,在得到作弊得分后,可以與預先設(shè)置的閾值進行比較,得到作弊檢測結(jié)果。
[0038]進一步的,閾值可以是一個,以通過該一個閾值檢測考生是作弊或者未作弊。例如,當作弊得分大于或等于該閾值時,確定作弊檢測結(jié)果是作弊,否則,當作弊得分小于該閾值時,確定作弊檢測結(jié)果是未作弊?;蛘撸?br>[0039]閾值也可以是多個,以通過該多個閾值檢測考生的作弊等級,如作弊、疑似作弊、
未作弊等。
[0040]上述的閾值可以根據(jù)經(jīng)驗和大量實驗結(jié)果確定。
[0041]本實施例中,通過獲取出考生的聲紋特征之外的其他特征,可以在口考作弊檢測時,應用更多的特征進行口考作弊檢測,以擴展口考作弊檢測的適用范圍。
[0042]如上所示,在口考作弊檢測時,需要提取出作弊檢測特征。具體的,作弊檢測特征的提取流程可以如下所示。
[0043](I)—些實施例中,上述的聲紋特征是指從當前考生的口考語音數(shù)據(jù)中進行聲紋特征提取后得到的聲紋特征。
[0044]其中,聲紋特征不限于1- V e c t ο r特征,還可以包括:梅爾頻率倒譜系數(shù)(M e IFrequency Cepstrum Coeff icient,MFCC)特征或線性預測編碼(Linear predict1ncoding,LPC)特征等。
[0045](2)—些實施例中,當前考生與相應座位聲紋相似度特征是指當前考生對應的聲紋特征,與當前考生聲稱的考生對應的聲紋特征之間的相似度特征。
[0046]具體的,當前考生與相應座位聲紋相似度特征的提取流程包括:
[0047]從所述當前考生的口考語音數(shù)據(jù)中提取聲紋特征,得到第一聲紋特征;
[0048]獲取第二聲紋特征,所述第二聲紋特征是從所述當前考生的相應座位的報名考生的語音數(shù)據(jù)中提取的;
[0049]計算第一聲紋特征與第二聲紋特征的相似度特征,將所述相似度特征確定為當前考生與相應座位聲紋相似度特征。
[0050]其中,為了與后續(xù)聲紋特征區(qū)別,可以將從當前考生的口考語音數(shù)據(jù)中提取的聲紋特征稱為第一聲紋特征。
[0051]第二聲紋特征是當前考生聲稱的考生的語音數(shù)據(jù)對應的聲紋特征。
[0052]例如,考生報名時可以采集注冊語音數(shù)據(jù),或者在考前采集試音語音數(shù)據(jù),從而可以從注冊語音數(shù)據(jù)或試音語音數(shù)據(jù)中提取聲紋特征,作為第二聲紋特征。
[0053]計算相似度時,具體計算方式可以包括:計算第一聲紋特征與第二聲紋特征之間的余弦距離、歐式距離等。
[0054](3)—些實施例中,鄰座聲紋相似度特征是指當前考生對應的聲紋特征,與當前考生的鄰座考生對應的聲紋特征之間的相似度特征。
[0055]鄰座的個數(shù)可以設(shè)置,例如,選擇當前考生周圍的4或8個考生作為鄰座考生。本實施例以鄰座包括N=4個為例。
[0056]具體的,鄰座聲紋相似度特征的提取流程包括:
[0057]從所述當前考生的口考語音數(shù)據(jù)中提取聲紋特征,得到第一聲紋特征;
[0058]從所述當前考生的鄰座考生的口考語音數(shù)據(jù)中提取聲紋特征,得到第三聲紋特征;
[0059]計算第一聲紋特征與第三聲紋特征的相似度特征,將所述相似度特征確定為鄰座聲紋相似度特征。
[0060]進一步的,當鄰座為多個時,第三聲紋特征也為多個,可以分別計算第一聲紋特征與每個第三聲紋特征之間的相似度特征,從而可以得到與鄰座個數(shù)相同的鄰座聲紋相似度特征。
[0061 ]例如,鄰座為4個,則得到的鄰座聲紋相似度特征為4個。
[0062](4)—些實施例中,鄰座答題內(nèi)容相似度特征是指當前考生的答題內(nèi)容,與當前考生的鄰座考生的答題內(nèi)容之間的相似度特征。
[0063]具體的,鄰座答題內(nèi)容相似度特征的提取流程包括:
[0064]對所述當前考生的答題內(nèi)容進行向量化,得到第一答題內(nèi)容向量;
[0065]對所述當前考生的鄰座考生的答題內(nèi)容進行向量化,得到第二答題內(nèi)容向量;
[0066]計算第一答題內(nèi)容向量與第二答題內(nèi)容向量的相似度特征,將所述相似度特征確定為鄰座答題內(nèi)容相似度特征。
[0067]其中,內(nèi)容向量化的方法可以采用通常方法。
[0068]類似鄰座聲紋相似度特征,當鄰座為N個時,鄰座答題內(nèi)容相似度特征也為N個。
[0069](5)—些實施例中,鄰座答題發(fā)音對比特征是指當前考生的答題發(fā)音與鄰座考生的答題發(fā)音之間的對比特征。
[0070]進一步的,答題發(fā)音之間的對比特征可以分為多個維度,例如包括:
[0071]相同答案的錯讀發(fā)音一致度、語速相似度、停頓相似度、朗讀時差一致度這4個維度。
[0072]因此,當鄰座的個數(shù)是N、答題發(fā)音的對比特征是M個維度,則鄰座答題發(fā)音對比特征是N X M維的特征向量。
[0073]具體的,上述4個對比特征的提取流程可以分別是:
[0074]錯讀發(fā)音一致度:當前考生發(fā)音錯誤與鄰座考生發(fā)音錯誤相同的個數(shù)/當前考生發(fā)音錯誤總數(shù);發(fā)音錯誤的發(fā)現(xiàn)采用現(xiàn)有的口語評測技術(shù),在此不再詳細闡述。
[0075]語速相似度:當前考生語速/鄰座考生語速;
[0076]停頓相似度:當前考生與鄰座考生停頓相似處的個數(shù)/當前考生答題中停頓總數(shù);
[0077]朗讀時差一致度:當前考生與鄰座考生各朗讀子單元時差一致數(shù)/朗讀子單元的總數(shù)。舉例:以句子為朗讀子單元,如果一個答題內(nèi)容一共有3個句子,統(tǒng)計當前考生朗讀每個句子的開頭和/或結(jié)尾與鄰座考生朗讀的時差一致的個數(shù),時差一致的判斷一般是通過時差閾值進行判斷,如閾值取為2秒。
[0078](6)—些實施例中,整個考場考生整體答題內(nèi)容一致性特征的提取流程可以包括:
[0079]將考場所有考生的答題內(nèi)容向量兩兩進行相似度計算;
[0080]計算所有相似度的均值和標準方差,作為整個考場考生整體答題內(nèi)容一致性特征。
[0081 ] (7)—些實施例中,整個考場考生發(fā)音時差一致性特征的提取流程包括:
[0082]分別計算各朗讀子單元的發(fā)音一致度;
[0083]對所有朗讀子單元的發(fā)音一致度進行加權(quán)平均,得到整個考場考生發(fā)音時差一致性特征。
[0084]其中,所述各朗讀子單元的發(fā)音一致度:朗讀該子單元時發(fā)音時差一致考生個數(shù)/考生總數(shù)。
[0085]可以理解的是,上述實施例中未特別說明的部分,如聲紋特征的提取、相似度的計算等,可以參見其他實施例中已具體說明的內(nèi)容。
[0086]通過上述流程可以提取出作弊檢測特征,以用于口考作弊檢測。
[0087]圖2是本發(fā)明另一個實施例提出的口考作弊檢測方法的流程示意圖。
[0088]參見圖2,本實施例的流程包括:
[0089]S21:構(gòu)建作弊檢測模型。
[0090]可以理解的是,可以在口考作弊檢測之前,離線預先構(gòu)建作弊檢測模型。
[0091]—些實施例中,參見圖3,構(gòu)建作弊檢測模型的流程可以包括:
[0092]S31:收集歷史口考考生數(shù)據(jù),并提取所述歷史口考考生數(shù)據(jù)對應的作弊檢測特征,以及,獲取所述歷史口考考生數(shù)據(jù)對應的作弊情況的人工標注結(jié)果,得到訓練數(shù)據(jù)。
[0093]其中,可以對應收集的每個歷史考生,獲取一組口考考生數(shù)據(jù),該組口考考生數(shù)據(jù)包括:該考生的口考語音數(shù)據(jù)以及其他的輔助信息,具體的輔助信息可以參見上述實施例。
[0094]在獲取到每組口考考生數(shù)據(jù)后,可以如上述所示的提取流程,提取到上述的7種作弊檢測特征。
[0095]通過上述流程,對應一個歷史考生,可以獲取一組口考考生數(shù)據(jù),并從中提取到一組作弊檢測特征。
[0096]另外,對應每個歷史考生,可以對該考生的作弊情況進行人工標注,標注出作弊結(jié)果,如作弊或未作弊,或者,作弊等級等。
[0097]因此,可以將每個歷史考生的{作弊檢測特征,作弊結(jié)果H乍為一個訓練樣本,大量的歷史考生對應的訓練樣本組成一組訓練數(shù)據(jù)用于后續(xù)的模型訓練。
[0098]S32:確定模型拓撲結(jié)構(gòu)。
[0099]模型的拓撲結(jié)構(gòu)可以根據(jù)需要設(shè)置。
[0100]本實施例中,以循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)為例。
[0101]RNN網(wǎng)絡(luò)屬于一種神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)可以包括:輸入層、隱層和輸出層,其中,輸入層和輸出層分別是一層,隱層的個數(shù)可以根據(jù)需要設(shè)置。
[0102]如圖4所示,給出了考場內(nèi)一個考生的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖,完成結(jié)構(gòu)圖由一個考場所有考生結(jié)構(gòu)圖組成。具體說明如下:
[0103]輸入層:輸入的是一個考場所有考生所有試題的作弊檢測特征。由于口語考試中每個考場的考生數(shù)不一樣,考題數(shù)也不一樣,為了保證模型的魯棒性,可以根據(jù)經(jīng)驗值對模型結(jié)構(gòu)設(shè)定固定數(shù)量的考生數(shù)(如50)和考題數(shù)節(jié)點(30),當某一場考生數(shù)或考題數(shù)小于固定值時,訓練和測試的過程中對應空缺的節(jié)點設(shè)定常量值即可(例如設(shè)置為O)。
[0104]例如一個考場有P(P小于等于50)個考生,考題有J(J小于等于30)道,以上述7個作弊檢測特征為例,則模型的輸入為P X J X (5+6N)。
[0105]其中,5+6N表示有:I個聲紋特征、I個當前考生與相應座位聲紋相似度特征、N個鄰座聲紋相似度特征、N個鄰座答題內(nèi)容相似度特征、4N個鄰座答題發(fā)音對比特征(以發(fā)音對比特征包括4個維度為例)、2個整個考場考生整體答題內(nèi)容一致性特征、I個整個考場考生發(fā)音時差一致性特征。
[0106]隱層:隱層數(shù)一般由經(jīng)驗和/或大量實驗確定,一般取2-8層,本案中取3層。本案中隱層采用的是局部RNN的網(wǎng)絡(luò)結(jié)構(gòu),以考生為單位,輸入層連接過來的隱層節(jié)點間從左到右進行有向連接。通常情況下,同一個考生如果前面的作弊了,后面的題型作弊的概率會大大增大,故模型的第一個隱層的結(jié)構(gòu)采用考生內(nèi)部節(jié)點有向連接的方式,確保前面題型的節(jié)點可以作用到后面的題型,這樣可以大大的提高分類的準確性。
[0107]輸出層:模型的輸出為考場中每個考生每道試題出現(xiàn)作弊的概率得分,或者,輸出也可以直接是作弊或未作弊這些作弊檢測結(jié)果。
[0108]S33:根據(jù)模型拓撲結(jié)構(gòu)和所述訓練數(shù)據(jù)進行訓練,生成作弊檢測模型。
[0109]模型的訓練采用現(xiàn)有的神經(jīng)網(wǎng)絡(luò)模型訓練方法,如誤差反向傳播(ErrorBackPropagat 1n,BP)算法,具體在此不再闡述。
[0110]在構(gòu)建出作弊檢測模型后,該模型可以在線用于口考作弊檢測。即,本實施例還可以包括:
[0111]S22:獲取當前考生的口考語音數(shù)據(jù),以及除所述口考語音數(shù)據(jù)之外的輔助信息。
[0112]S23:根據(jù)所述口考語音數(shù)據(jù)和所述輔助信息,提取作弊檢測特征,所述作弊檢測特征包括:從所述口考語音數(shù)據(jù)中提取的聲紋特征,以及除所述聲紋特征之外的其他特征。
[0113]S24:根據(jù)所述作弊檢測特征和所述作弊檢測模型,得到作弊檢測結(jié)果。
[0114]可以理解的是,本實施例中無特別說明的地方,具體內(nèi)容可以參見上一實施例的相關(guān)內(nèi)容,在此不再詳細說明。
[0115]本實施例中,通過獲取出考生的聲紋特征之外的其他特征,可以在口考作弊檢測時,應用更多的特征進行口考作弊檢測,以擴展口考作弊檢測的范圍。進一步的,通過預先構(gòu)建作弊檢測模型,可以在作弊檢測時直接采用該模型,以快速完成作弊檢測。
[0116]圖5是本發(fā)明一個實施例提出的口考作弊檢測裝置的結(jié)構(gòu)示意圖。
[0117]參見圖5,本實施例的裝置50包括:獲取模塊51、提取模塊52和確定模塊53。
[0118]獲取模塊51,用于獲取當前考生的口考語音數(shù)據(jù),以及除所述口考語音數(shù)據(jù)之外的輔助信息;
[0119]提取模塊52,用于根據(jù)所述口考語音數(shù)據(jù)和所述輔助信息,提取作弊檢測特征,所述作弊檢測特征包括:從所述口考語音數(shù)據(jù)中提取的聲紋特征,以及除所述聲紋特征之外的其他特征;
[0120]確定模塊53,用于根據(jù)所述作弊檢測特征和預先構(gòu)建的作弊檢測模型,得到作弊檢測結(jié)果。
[0121 ] —些實施例中,所述其他特征包括如下項中的一項或多項:
[0122]當前考生與相應座位聲紋相似度特征、鄰座聲紋相似度特征、鄰座答題內(nèi)容相似度特征、鄰座答題發(fā)音對比特征、整個考場考生整體答題內(nèi)容一致性特征、整個考場考生發(fā)音時差一致性特征。
[0123]—些實施例中,所述聲紋特征包括:
[0124]1-vector特征或MFCC特征或LPC特征。
[0125]—些實施例中,所述提取模塊具體用于執(zhí)行如下項中的一項或多項:
[0126]從所述當前考生的口考語音數(shù)據(jù)中提取聲紋特征,得到第一聲紋特征;獲取第二聲紋特征,所述第二聲紋特征是從所述當前考生的相應座位的報名考生的語音數(shù)據(jù)中提取的;計算第一聲紋特征與第二聲紋特征的相似度特征,將所述相似度特征確定為所述當前考生與相應座位聲紋相似度特征;
[0127]從所述當前考生的口考語音數(shù)據(jù)中提取聲紋特征,得到第一聲紋特征;從所述當前考生的鄰座考生的口考語音數(shù)據(jù)中提取聲紋特征,得到第三聲紋特征;計算第一聲紋特征與第三聲紋特征的相似度特征,將所述相似度特征確定為所述鄰座聲紋相似度特征;
[0128]對所述當前考生的答題內(nèi)容進行向量化,得到第一答題內(nèi)容向量;對所述當前考生的鄰座考生的答題內(nèi)容進行向量化,得到第二答題內(nèi)容向量;計算第一答題內(nèi)容向量與第二答題內(nèi)容向量的相似度特征,將所述相似度特征確定為所述鄰座答題內(nèi)容相似度特征;
[0129]獲取當前考生與鄰座考生的如下發(fā)音特征中的一項或多項,作為所述鄰座答題發(fā)音對比特征:相同答案的錯讀發(fā)音一致度、語速相似度、停頓相似度、朗讀時差一致度;
[0130]將考場所有考生的答題內(nèi)容向量兩兩進行相似度計算;計算所有相似度的均值和標準方差,作為整個考場考生整體答題內(nèi)容一致性特征;
[0131]分別計算各朗讀子單元的發(fā)音一致度;對所有朗讀子單元的發(fā)音一致度進行加權(quán)平均,得到整個考場考生發(fā)音時差一致性特征。
[0132]—些實施例中,參見圖6,該裝置還包括:用于構(gòu)建作弊檢測模型的構(gòu)建模塊54,所述構(gòu)建模塊54具體用于:
[0133]收集歷史口考考生數(shù)據(jù),并提取所述歷史口考考生數(shù)據(jù)對應的作弊檢測特征,以及,獲取所述歷史口考考生數(shù)據(jù)對應的作弊情況的人工標注結(jié)果,得到訓練數(shù)據(jù);
[0134]確定模型拓撲結(jié)構(gòu);
[0135]根據(jù)模型拓撲結(jié)構(gòu)和所述訓練數(shù)據(jù)進行訓練,生成作弊檢測模型。
[0136]—些實施例中,所述獲取模塊51獲取的所述輔助信息包括如下項中的一項或多項:
[0137]所述當前考生的除所述口考語音數(shù)據(jù)之外的其他信息;
[0138]除所述當前考生之外的其他考生的信息;
[0139]所述當前考生所在考場的整體情況。
[0140]可以理解的是,本實施例的裝置與方法實施例對應,具體內(nèi)容可以參見方法實施例中的描述,在此不再詳細說明。
[0141]本實施例中,通過獲取出考生的聲紋特征之外的其他特征,可以在口考作弊檢測時,應用更多的特征進行口考作弊檢測,以擴展口考作弊檢測的范圍。進一步的,通過預先構(gòu)建作弊檢測模型,可以在作弊檢測時直接采用該模型,以快速完成作弊檢測。
[0142]需要說明的是,在本發(fā)明的描述中,術(shù)語“第一”、“第二”等僅用于描述目的,而不能理解為指示或暗示相對重要性。此外,在本發(fā)明的描述中,除非另有說明,“多個”的含義是指至少兩個。
[0143]流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個或更多個用于實現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實施方式的范圍包括另外的實現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時的方式或按相反的順序,來執(zhí)行功能,這應被本發(fā)明的實施例所屬技術(shù)領(lǐng)域的技術(shù)人員所理解。
[0144]應當理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實現(xiàn)。在上述實施方式中,多個步驟或方法可以用存儲在存儲器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實現(xiàn)。例如,如果用硬件來實現(xiàn),和在另一實施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項或他們的組合來實現(xiàn):具有用于對數(shù)據(jù)信號實現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現(xiàn)場可編程門陣列(FPGA)等。本技術(shù)領(lǐng)域的普通技術(shù)人員可以理解實現(xiàn)上述實施例方法攜帶的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計算機可讀存儲介質(zhì)中,該程序在執(zhí)行時,包括方法實施例的步驟之一或其組合。
[0145]此外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理模塊中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個模塊中。上述集成的模塊既可以采用硬件的形式實現(xiàn),也可以采用軟件功能模塊的形式實現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,也可以存儲在一個計算機可讀取存儲介質(zhì)中。
[0146]上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。
[0147]在本說明書的描述中,參考術(shù)語“一個實施例”、“一些實施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點包含于本發(fā)明的至少一個實施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不一定指的是相同的實施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點可以在任何的一個或多個實施例或示例中以合適的方式結(jié)合。
[0148]盡管上面已經(jīng)示出和描述了本發(fā)明的實施例,可以理解的是,上述實施例是示例性的,不能理解為對本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對上述實施例進行變化、修改、替換和變型。
【主權(quán)項】
1.一種口考作弊檢測方法,其特征在于,包括: 獲取當前考生的口考語音數(shù)據(jù),以及除所述口考語音數(shù)據(jù)之外的輔助信息; 根據(jù)所述口考語音數(shù)據(jù)和所述輔助信息,提取作弊檢測特征,所述作弊檢測特征包括:從所述口考語音數(shù)據(jù)中提取的聲紋特征,以及除所述聲紋特征之外的其他特征; 根據(jù)所述作弊檢測特征和預先構(gòu)建的作弊檢測模型,得到作弊檢測結(jié)果。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述其他特征包括如下項中的一項或多項: 當前考生與相應座位聲紋相似度特征、鄰座聲紋相似度特征、鄰座答題內(nèi)容相似度特征、鄰座答題發(fā)音對比特征、整個考場考生整體答題內(nèi)容一致性特征、整個考場考生發(fā)音時差一致性特征。3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述聲紋特征包括: 1-vector特征或MFCC特征或LPC特征。4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述提取作弊檢測特征包括如下項中的一項或多項: 從所述當前考生的口考語音數(shù)據(jù)中提取聲紋特征,得到第一聲紋特征;獲取第二聲紋特征,所述第二聲紋特征是從所述當前考生的相應座位的報名考生的語音數(shù)據(jù)中提取的;計算第一聲紋特征與第二聲紋特征的相似度特征,將所述相似度特征確定為所述當前考生與相應座位聲紋相似度特征; 從所述當前考生的口考語音數(shù)據(jù)中提取聲紋特征,得到第一聲紋特征;從所述當前考生的鄰座考生的口考語音數(shù)據(jù)中提取聲紋特征,得到第三聲紋特征;計算第一聲紋特征與第三聲紋特征的相似度特征,將所述相似度特征確定為所述鄰座聲紋相似度特征; 對所述當前考生的答題內(nèi)容進行向量化,得到第一答題內(nèi)容向量;對所述當前考生的鄰座考生的答題內(nèi)容進行向量化,得到第二答題內(nèi)容向量;計算第一答題內(nèi)容向量與第二答題內(nèi)容向量的相似度特征,將所述相似度特征確定為所述鄰座答題內(nèi)容相似度特征; 獲取當前考生與鄰座考生的如下發(fā)音特征中的一項或多項,作為所述鄰座答題發(fā)音對比特征:相同答案的錯讀發(fā)音一致度、語速相似度、停頓相似度、朗讀時差一致度; 將考場所有考生的答題內(nèi)容向量兩兩進行相似度計算;計算所有相似度的均值和標準方差,作為整個考場考生整體答題內(nèi)容一致性特征; 分別計算各朗讀子單元的發(fā)音一致度;對所有朗讀子單元的發(fā)音一致度進行加權(quán)平均,得到整個考場考生發(fā)音時差一致性特征。5.根據(jù)權(quán)利要求1-4任一項所述的方法,其特征在于,還包括:構(gòu)建作弊檢測模型,所述構(gòu)建作弊檢測模型包括: 收集歷史口考考生數(shù)據(jù),并提取所述歷史口考考生數(shù)據(jù)對應的作弊檢測特征,以及,獲取所述歷史口考考生數(shù)據(jù)對應的作弊情況的人工標注結(jié)果,得到訓練數(shù)據(jù); 確定模型拓撲結(jié)構(gòu); 根據(jù)模型拓撲結(jié)構(gòu)和所述訓練數(shù)據(jù)進行訓練,生成作弊檢測模型。6.根據(jù)權(quán)利要求1-4任一項所述的方法,其特征在于,所述輔助信息包括如下項中的一項或多項: 所述當前考生的除所述口考語音數(shù)據(jù)之外的其他信息; 除所述當前考生之外的其他考生的信息; 所述當前考生所在考場的整體情況。7.—種口考作弊檢測裝置,其特征在于,包括: 獲取模塊,用于獲取當前考生的口考語音數(shù)據(jù),以及除所述口考語音數(shù)據(jù)之外的輔助信息; 提取模塊,用于根據(jù)所述口考語音數(shù)據(jù)和所述輔助信息,提取作弊檢測特征,所述作弊檢測特征包括:從所述口考語音數(shù)據(jù)中提取的聲紋特征,以及除所述聲紋特征之外的其他特征; 確定模塊,用于根據(jù)所述作弊檢測特征和預先構(gòu)建的作弊檢測模型,得到作弊檢測結(jié)果O8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述其他特征包括如下項中的一項或多項: 當前考生與相應座位聲紋相似度特征、鄰座聲紋相似度特征、鄰座答題內(nèi)容相似度特征、鄰座答題發(fā)音對比特征、整個考場考生整體答題內(nèi)容一致性特征、整個考場考生發(fā)音時差一致性特征。9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述聲紋特征包括: 1-vector特征或MFCC特征或LPC特征。10.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述提取模塊具體用于執(zhí)行如下項中的一項或多項: 從所述當前考生的口考語音數(shù)據(jù)中提取聲紋特征,得到第一聲紋特征;獲取第二聲紋特征,所述第二聲紋特征是從所述當前考生的相應座位的報名考生的語音數(shù)據(jù)中提取的;計算第一聲紋特征與第二聲紋特征的相似度特征,將所述相似度特征確定為所述當前考生與相應座位聲紋相似度特征; 從所述當前考生的口考語音數(shù)據(jù)中提取聲紋特征,得到第一聲紋特征;從所述當前考生的鄰座考生的口考語音數(shù)據(jù)中提取聲紋特征,得到第三聲紋特征;計算第一聲紋特征與第三聲紋特征的相似度特征,將所述相似度特征確定為所述鄰座聲紋相似度特征; 對所述當前考生的答題內(nèi)容進行向量化,得到第一答題內(nèi)容向量;對所述當前考生的鄰座考生的答題內(nèi)容進行向量化,得到第二答題內(nèi)容向量;計算第一答題內(nèi)容向量與第二答題內(nèi)容向量的相似度特征,將所述相似度特征確定為所述鄰座答題內(nèi)容相似度特征; 獲取當前考生與鄰座考生的如下發(fā)音特征中的一項或多項,作為所述鄰座答題發(fā)音對比特征:相同答案的錯讀發(fā)音一致度、語速相似度、停頓相似度、朗讀時差一致度; 將考場所有考生的答題內(nèi)容向量兩兩進行相似度計算;計算所有相似度的均值和標準方差,作為整個考場考生整體答題內(nèi)容一致性特征; 分別計算各朗讀子單元的發(fā)音一致度;對所有朗讀子單元的發(fā)音一致度進行加權(quán)平均,得到整個考場考生發(fā)音時差一致性特征。11.根據(jù)權(quán)利要求7-10任一項所述的裝置,其特征在于,還包括用于構(gòu)建作弊檢測模型的構(gòu)建模塊,所述構(gòu)建模塊具體用于: 收集歷史口考考生數(shù)據(jù),并提取所述歷史口考考生數(shù)據(jù)對應的作弊檢測特征,以及,獲取所述歷史口考考生數(shù)據(jù)對應的作弊情況的人工標注結(jié)果,得到訓練數(shù)據(jù); 確定模型拓撲結(jié)構(gòu); 根據(jù)模型拓撲結(jié)構(gòu)和所述訓練數(shù)據(jù)進行訓練,生成作弊檢測模型。12.根據(jù)權(quán)利要求7-10任一項所述的方法,其特征在于,所述獲取模塊獲取的所述輔助信息包括如下項中的一項或多項: 所述當前考生的除所述口考語音數(shù)據(jù)之外的其他信息; 除所述當前考生之外的其他考生的信息; 所述當前考生所在考場的整體情況。
【文檔編號】G10L15/08GK105931632SQ201610424906
【公開日】2016年9月7日
【申請日】2016年6月13日
【發(fā)明人】何春江, 胡陽, 潘頌聲
【申請人】科大訊飛股份有限公司