欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

視頻片段的識別方法和裝置與流程

文檔序號:12908522閱讀:1094來源:國知局
視頻片段的識別方法和裝置與流程

本發(fā)明涉及視頻數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其是涉及一種視頻片段的識別方法和裝置。



背景技術(shù):

視頻是在線學(xué)習(xí)的重要載體,老師在錄制教學(xué)視頻時,不同老師錄制的視頻側(cè)重點不同,對知識點的難易把握也不盡相同。傳統(tǒng)的教學(xué)視頻較長,一節(jié)課對應(yīng)一個視頻,一個視頻包含多個知識點。因此,想要從該視頻中識別較難的知識點,以及識別這些知識點對應(yīng)于視頻的起始位置是相當(dāng)困難的?,F(xiàn)有技術(shù)方案中,一般是通過大量學(xué)生反饋,得出視頻難點大概位置。但是人工反饋存在一定的缺點,例如,當(dāng)網(wǎng)絡(luò)課堂視頻數(shù)量較大,學(xué)生數(shù)量較多時,由于缺少面對面的溝通,學(xué)生的主動式反饋比較困難。且眾多學(xué)生中個別學(xué)生的反饋,不一定是難點;大量學(xué)生反饋同一個問題,才有可能是難點,需要引起老師重視,進而優(yōu)化教案,更新教學(xué)視頻。



技術(shù)實現(xiàn)要素:

有鑒于此,本發(fā)明的目的在于提供一種視頻片段的識別方法和裝置,以緩解采用現(xiàn)有技術(shù)中的方法進行難點識別時識別精度較差,且識別過程較為緩慢的技術(shù)問題。

第一方面,本發(fā)明實施例提供了一種視頻片段的識別方法,包括:提取教學(xué)視頻中包含的每個視頻片段的知識點標簽,得到至少一個知識點標簽,其中,所述至少一個知識點標簽用于指示至少一個知識點;基于所述視頻片段的知識點標簽和所述視頻片段的字幕信息對目標試題按照知識點進行分類,得到至少一種類別的試題分組,其中,所述目標試題為所屬于所述教學(xué)視頻的試題,且不同類別的所述試題分組對應(yīng)的知識點標簽不同;基于獲取到的每個所述試題分組的答題結(jié)果在所述知識點標簽中確定目標知識點標簽所對應(yīng)的目標知識點,其中,所述目標知識點為所述至少一個知識點中難度大于預(yù)設(shè)難度的知識點;將所述視頻片段中所述目標知識點所對應(yīng)的視頻片段作為難點片段。

進一步地,提取教學(xué)視頻中包含的每個視頻片段的知識點標簽包括:提取所述視頻片段的字幕信息;對所述字幕信息進行文本分割處理,處理得到至少一個文本分割片段;采用textrank算法在每個文本分割片段中提取topn關(guān)鍵詞,并將提取到的所述topn關(guān)鍵詞作為所述視頻片段的知識點標簽。

進一步地,對所述字幕信息進行文本分割處理,處理得到至少一個文本分割片段包括:對所述字幕信息執(zhí)行目標處理,得到處理之后的所述字幕信息,其中,所述目標處理包括:分詞處理和去停用詞處理;基于文本分割算法對處理之后的所述字幕信息進行文本分割,分割之后得到所述至少一個文本分割片段。

進一步地,提取所述視頻片段的字幕信息包括:判斷所述視頻片段是否包含所述字幕信息;如果判斷出所述視頻片段包含所述字幕信息,則提取所述字幕信息;如果判斷出所述視頻片段不包含所述字幕信息,則提取所述視頻片段的音頻信息,并將所述音頻信息轉(zhuǎn)換為所述字幕信息。

進一步地,基于所述視頻片段的知識點標簽和所述視頻片段的字幕信息對目標試題按照知識點進行分類,得到至少一種類別的試題分組包括:構(gòu)建訓(xùn)練語料,其中,所述訓(xùn)練語料中包括所述至少一個知識點標簽和字幕碎片,其中,所述字幕碎片為通過對所述字幕信息進行處理得到的碎片;通過所述訓(xùn)練語料對分類模型進行訓(xùn)練;基于訓(xùn)練好的所述分類模型對所述目標試題進行分類,得到所述至少一種類別的試題分組。

進一步地,構(gòu)建訓(xùn)練語料包括:將所述視頻片段的字幕信息進行切分,得到所述字幕碎片,其中,所述字幕碎片中包括至少一個關(guān)鍵詞;通過所述訓(xùn)練語料對分類模型進行訓(xùn)練包括:將所述字幕碎片和所述至少一個知識點標簽作為所述分類模型的輸入,將目標概率信息作為所述分類模型的輸出,對所述分類模型進行訓(xùn)練,其中,所述目標概率信息表示所述至少一個關(guān)鍵詞中每個關(guān)鍵詞為所述至少一個知識點標簽中的知識點標簽的概率。

進一步地,基于獲取到的每個所述試題分組的答題結(jié)果在所述知識點標簽中確定目標知識點標簽所對應(yīng)的目標知識點包括:獲取全部學(xué)習(xí)人員對所述試題分組中每個試題的答題結(jié)果;在所述答題結(jié)果中統(tǒng)計第一答題結(jié)果的數(shù)量和第二答題結(jié)果的數(shù)量,其中,所述第一答題結(jié)果為正確的答題結(jié)果,所述第二答題結(jié)果為錯誤的答題結(jié)果;基于第二答題結(jié)果的數(shù)量判斷當(dāng)前所述試題分組所對應(yīng)的知識點標簽是否為所述目標知識點標簽;其中,如果判斷出是,則將當(dāng)前所述試題分組所對應(yīng)的知識點標簽作為所述目標知識點標簽。

進一步地,在將所述教學(xué)視頻中所述目標知識點所對應(yīng)的視頻片段作為難點片段之后,所述方法還包括:生成目標圖像,其中,所述目標圖像中包括每個所述視頻片段的難點視頻的起始時間、每個所述視頻片段的難點視頻的結(jié)束時間和每個所述視頻片段的難點視頻的難易程度;將所述目標圖像推送至教師,以使教師根據(jù)所述目標圖像確定難點視頻,其中,所述教師為所述教學(xué)視頻中的教師。

第二方面,本發(fā)明實施例還提供一種視頻片段的識別裝置,包括:提取單元,用于提取教學(xué)視頻中包含的每個視頻片段的知識點標簽,得到至少一個知識點標簽,其中,所述至少一個知識點標簽用于指示至少一個知識點;分類單元,用于基于所述視頻片段的知識點標簽和所述視頻片段的字幕信息對目標試題按照知識點進行分類,得到至少一種類別的試題分組,其中,所述目標試題為所屬于所述教學(xué)視頻的試題,且不同類別的所述試題分組對應(yīng)的知識點標簽不同;第一確定單元,用于基于獲取到的每個所述試題分組的答題結(jié)果在所述知識點標簽中確定目標知識點標簽所對應(yīng)的目標知識點,其中,所述目標知識點為所述至少一個知識點中難度大于預(yù)設(shè)難度的知識點;第二確定單元,用于將所述視頻片段中所述目標知識點所對應(yīng)的視頻片段作為難點片段。

進一步地,所述提取單元包括:第一提取模塊,用于提取所述視頻片段的字幕信息;分割處理模塊,用于對所述字幕信息進行文本分割處理,處理得到至少一個文本分割片段;第二提取模塊,用于采用textrank算法在每個文本分割片段中提取topn關(guān)鍵詞,并將提取到的所述topn關(guān)鍵詞作為所述視頻片段的知識點標簽。

在本發(fā)明實施例中,首先提取教學(xué)視頻中包含的每個視頻片段的知識點標簽,然后,基于知識點標簽和視頻片段的字幕信息對目標試題按照知識點進行分類,得到至少一種類別的試題分組;接下來,基于每個試題分組的答題結(jié)果在知識點標簽中確定目標知識點標簽所對應(yīng)的目標知識點;最后,將視頻片段中目標知識點所對應(yīng)的視頻片段作為難點片段。在本發(fā)明實施例中,通過上述方式,能夠快速有效的在教學(xué)視頻中識別難點片段,進而緩解了采用現(xiàn)有技術(shù)中的方法進行難點識別時識別精度較差,且識別過程較為緩慢的技術(shù)問題。

本發(fā)明的其他特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點在說明書、權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。

為使本發(fā)明的上述目的、特征和優(yōu)點能更明顯易懂,下文特舉較佳實施例,并配合所附附圖,作詳細說明如下。

附圖說明

為了更清楚地說明本發(fā)明具體實施方式或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對具體實施方式或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施方式,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1是根據(jù)本發(fā)明實施例的一種視頻片段的識別方法的流程圖;

圖2是根據(jù)本發(fā)明實施例的一種目標圖像的示意圖;

圖3是根據(jù)本發(fā)明實施例的另一種視頻片段的識別方法的流程圖;

圖4是根據(jù)本發(fā)明實施例的一種視頻片段的識別裝置的示意圖。

具體實施方式

為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖對本發(fā)明的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。

實施例一:

根據(jù)本發(fā)明實施例,提供了一種視頻片段的識別方法的實施例,需要說明的是,在附圖的流程圖示出的步驟可以在諸如一組計算機可執(zhí)行指令的計算機系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。

圖1是根據(jù)本發(fā)明實施例的一種視頻片段的識別方法的流程圖,如圖1所示,該方法包括如下步驟:

步驟s102,提取教學(xué)視頻中包含的每個視頻片段的知識點標簽,得到至少一個知識點標簽,其中,至少一個知識點標簽用于指示至少一個知識點;

在本發(fā)明實施例中,可以通過服務(wù)器提取教學(xué)視頻中包含的每個視頻片段的知識點標簽。

需要說明的是,一個完整的教學(xué)視頻中包括多個視頻片段,每個視頻片段的時間不等,可以為5分鐘,可以為10分鐘,還可以為15分鐘,具體以教學(xué)老師的錄制時間為準。上述知識點標簽可以術(shù)語名稱,例如,拉格朗日中值定理,羅爾定理和柯西中值定理等專有名詞。

如果一個完整的教學(xué)視頻中包含多個視頻片段,那么每個視頻片段可以對應(yīng)一個知識點標簽,可以對應(yīng)多個知識點標簽。但是,在一般情況下,一個視頻片段對應(yīng)一個知識點標簽。如果一個完整的教學(xué)視頻中包括多個視頻片段,那么任意兩個視頻片段所對應(yīng)的知識點標簽不相同。

步驟s104,基于視頻片段的知識點標簽和視頻片段的字幕信息對目標試題按照知識點進行分類,得到至少一種類別的試題分組,其中,目標試題為所屬于教學(xué)視頻的試題,且不同類別的試題分組對應(yīng)的知識點標簽不同;

在本發(fā)明實施例中,服務(wù)器可以基于視頻片段的知識點標簽和視頻片段的字幕信息對目標試題進行分類。

步驟s106,基于獲取到的每個試題分組的答題結(jié)果在知識點標簽中確定目標知識點標簽所對應(yīng)的目標知識點,其中,目標知識點為至少一個知識點中難度大于預(yù)設(shè)難度的知識點;

在本發(fā)明實施例中,服務(wù)器可以基于獲取到的試題分組的答題結(jié)果在知識點標簽中確定目標知識點標簽所對應(yīng)的目標知識點。

步驟s108,將視頻片段中目標知識點所對應(yīng)的視頻片段作為難點片段。

在本發(fā)明實施例中,服務(wù)器可以將視頻片段中目標知識點所對應(yīng)的視頻片段作為難點片段。

需要說明的是,服務(wù)器可以在該教學(xué)視頻錄制完成之后,就執(zhí)行上述步驟s102和步驟s104。并在學(xué)生們對目標試題答題完成之后,執(zhí)行步驟s106和步驟s108。

在本發(fā)明實施例中,首先提取教學(xué)視頻中包含的每個視頻片段的知識點標簽,然后,基于知識點標簽和視頻片段的字幕信息對目標試題按照知識點進行分類,得到至少一種類別的試題分組;接下來,基于每個試題分組的答題結(jié)果在知識點標簽中確定目標知識點標簽所對應(yīng)的目標知識點;最后,將視頻片段中目標知識點所對應(yīng)的視頻片段作為難點片段。在本發(fā)明實施例中,通過上述方式,能夠快速有效的在教學(xué)視頻中識別難點片段,進而緩解了采用現(xiàn)有技術(shù)中的方法進行難點識別時識別精度較差,且識別過程較為緩慢的技術(shù)問題。

在本發(fā)明實施例的一個可選實施方式中,上述步驟s102,即,提取教學(xué)視頻中包含的每個視頻片段的知識點標簽包括如下步驟:

步驟s1021,提取視頻片段的字幕信息;

其中,提取視頻片段的字幕信息包括:判斷視頻片段是否包含字幕信息;如果判斷出視頻片段包含字幕信息,則提取字幕信息;如果判斷出視頻片段不包含字幕信息,則提取視頻片段的音頻信息,并將音頻信息轉(zhuǎn)換為字幕信息。

步驟s1022,對字幕信息進行文本分割處理,處理得到至少一個文本分割片段;

步驟s1023,采用textrank算法在每個文本分割片段中提取topn關(guān)鍵詞,并將提取到的topn關(guān)鍵詞作為視頻片段的知識點標簽。

在本發(fā)明實施例中,首先判斷視頻片段是否包含字幕信息,如果判斷出包含字幕信息,則直接提取該視頻片段的字幕信息;如果判斷出視頻片段不包含字幕信息,則提取該視頻片段的音頻信息,并對該音頻信息進行識別,識別得到該視頻片段的字幕信息。

需要說明的是,服務(wù)器在對音頻信息進行識別之后,還可以將識別出的字幕信息發(fā)送給用戶,以使用戶對該字幕信息進行校正,并基于校正之后的字幕信息執(zhí)行后續(xù)流程。

在提取得到視頻片段的字幕信息之后,就可以對字幕信息進行文本分割處理,得到至少一個文本分割片段。由于每個視頻片段的字幕信息都較長,因此,可以對字幕信息進行分割,分割成多個片段。

在一個可選實施方式中,對字幕信息進行文本分割處理,處理得到至少一個文本分割片段的具體過程描述如下:

首先,對字幕信息執(zhí)行目標處理,得到處理之后的字幕信息,其中,目標處理包括:分詞處理和去停用詞處理;例如,可以先對字幕信息進行分詞處理,得到至少一個分詞,然后,將至少一個分詞中的停用詞刪除,其中,停用詞包括:吧,嗎,啊,哎,哎呦等詞匯。

然后,基于文本分割算法對處理之后的字幕信息進行文本分割,分割之后得到至少一個文本分割片段;具體地,可以采用texttiling文本分割算法對分割算法處理之后的字幕信息進行文本分割處理,得到至少一個文本分割片段。也就是說,在每個文本分割片段中,包括至少一個分詞。

在得到至少一個文本分割片段之后,就可以采用textrank算法在每個文本分割片段中提取topn關(guān)鍵詞,并對至少一個文本分割片段均執(zhí)行提取操作之后,將提取到的至少一個topn關(guān)鍵詞作為視頻片段的知識點標簽。

其中,textrank算法為一種關(guān)鍵詞提取算法,該計算基于pagerank,用于為文本生成關(guān)鍵字和摘要。

需要說明的是,也就是說,每個知識點標簽對應(yīng)一個或者多個topn關(guān)鍵詞,且任意兩個知識點標簽之間至少有一個關(guān)鍵詞不相同。

在本發(fā)明實施例的另一個可選實施方式中,上述步驟s104,即,基于視頻片段的知識點標簽和視頻片段的字幕信息對目標試題按照知識點進行分類,得到至少一種類別的試題分組包括如下步驟:

步驟s1041,構(gòu)建訓(xùn)練語料,其中,訓(xùn)練語料中包括至少一個知識點標簽和字幕碎片,其中,字幕碎片為通過對字幕信息進行處理得到的碎片;

步驟s1042,通過訓(xùn)練語料對分類模型進行訓(xùn)練;

步驟s1043,基于訓(xùn)練好的分類模型對目標試題進行分類,得到至少一種類別的試題分組。

在本發(fā)明實施例中,由于每個知識點標簽所對應(yīng)的字幕信息的文本片段較長,且目標試題的題目一般較短,因此,在構(gòu)建訓(xùn)練語料時,將視頻片段的字幕信息進行切分,得到字幕碎片,其中,字幕碎片中包括至少一個關(guān)鍵詞。

在得到訓(xùn)練語料之后,就可以通過訓(xùn)練語料對分類模型進行訓(xùn)練。具體地,可以將字幕碎片和至少一個知識點標簽作為分類模型的輸入,將目標概率信息作為分類模型的輸出,然后,對分類模型進行訓(xùn)練,其中,目標概率信息表示至少一個關(guān)鍵詞中每個關(guān)鍵詞為至少一個知識點標簽中的知識點標簽的概率。

在通過訓(xùn)練語料對分類模型進行訓(xùn)練之后,就可以基于訓(xùn)練好的分類模型對目標試題進行分類,得到至少一種類別的試題分組。其中,分類模型在對目標試題進行分類的過程中,是按照知識點標簽對目標試題進行分類。也就是說,將知識點標簽相同的目標試題作為相同的試題分組。

在基于視頻片段的知識點標簽和視頻片段的字幕信息對目標試題按照知識點進行分類之后,就可以獲取每個試題分組的答題結(jié)果,并基于獲取到的每個試題分組的答題結(jié)果在知識點標簽中確定目標知識點標簽所對應(yīng)的目標知識點。

其中,基于獲取到的每個試題分組的答題結(jié)果在知識點標簽中確定目標知識點標簽所對應(yīng)的目標知識點的過程描述如下:

首先,獲取全部學(xué)習(xí)人員對試題分組中每個試題的答題結(jié)果;

然后,在答題結(jié)果中統(tǒng)計第一答題結(jié)果的數(shù)量和第二答題結(jié)果的數(shù)量,其中,第一答題結(jié)果為正確的答題結(jié)果,第二答題結(jié)果為錯誤的答題結(jié)果;

最后,基于第二答題結(jié)果的數(shù)量判斷當(dāng)前試題分組所對應(yīng)的知識點標簽是否為目標知識點標簽;其中,如果判斷出是,則將當(dāng)前試題分組所對應(yīng)的知識點標簽作為目標知識點標簽。

例如,至少一個試題分組包括試題分組1,試題分組2和試題分組3,其中,試題分組與知識點標簽為一一對應(yīng)的關(guān)系。試題分組1中包括試題q1和試題q2,參與試題q1和試題q2的學(xué)生人數(shù)均為10人,其中,試題q1中第一答題結(jié)果的數(shù)量為6個,第二答題結(jié)果的數(shù)量為4個,試題q2中第一答題結(jié)果的數(shù)量為1個,第二答題結(jié)果的數(shù)量為9個。此時,第一答題結(jié)果的數(shù)量總和為7個,第二答題結(jié)果的數(shù)量總和為13個,也就是說,針對試題分組1,答錯的人次為13人,答錯的人次與總?cè)舜蔚谋壤秊?5%。也就是說,針對試題分組1,答錯率為65%。如果將閾值設(shè)置為40%,那么試題分組1所對應(yīng)的知識點標簽可以確定為目標知識點標簽,目標知識點標簽所對應(yīng)的目標知識點為難度大于預(yù)設(shè)難度的知識點。預(yù)設(shè)難度可以通過閾值40%來確定。也就是說,比例大于40%的即為困難,比例小于40%的即為簡單。

在本發(fā)明實施例中,在將教學(xué)視頻中目標知識點所對應(yīng)的視頻片段作為難點片段之后,還可以生成目標圖像,其中,目標圖像中包括每個視頻片段的難點視頻的起始時間、每個視頻片段的難點視頻的結(jié)束時間和每個視頻片段的難點視頻的難易程度;接下來,就可以將目標圖像推送至教師,以使教師根據(jù)目標圖像確定難點視頻,其中,教師為教學(xué)視頻中的教師。

如圖2所示的即為目標圖像,從目標圖像中可以看出,在一個完整的教學(xué)視頻中包括視頻片段1,視頻片段2,視頻片斷3和視頻片段4。圖2中,圓形的符號用于表示難易程度,其中,該圓形的符號越大,則表示難度越大,該圓形的符號越小,則表示難度越小。例如,視頻片段3的難度最大,其次是視頻片段1,再次就是視頻片段2。在圖2中,還能夠表示出每個視頻片段中難點片段的起始時間和結(jié)束時間。圖2中,b點所示的即為起始時間,圖2中,a點所示的即為結(jié)束時間。從圖2中可以看出,視頻片段3中包含兩個難點片段。

綜上,在本發(fā)明實施例中,提出了一種視頻片段的識別方法,該識別方法為在教學(xué)視頻中識別難點片段的方法。通過該方法,能夠自動利用機器處理視頻的字幕信息,以及處理目標試題,從而進行知識點標簽的提取。再結(jié)合學(xué)生的答題結(jié)果,自動識別難點片段,并以可視化的形式為教師展示視頻中的難點片段,以及每個難點片段的難易程度。

綜上各實施例提供的視頻片段的識別方法,為了直觀理解上述過程,以圖3所示的視頻片段的識別方法的示意圖為例進行說明,該方法主要包括:知識點標簽的提取,習(xí)題分類和難點片段的識別。

具體地,首先獲取教學(xué)視頻,然后,判斷教學(xué)視頻是否包含字幕信息,其中,如果判斷出是,則直接提取字幕信息,如果判斷出不是,則提取教學(xué)視頻的音頻信息,并對音頻信息進行語音識別,從而得到字幕信息。其中,在進行語音識別得到識別結(jié)果之后,還可以進行人工校對,以校對識別結(jié)果是否準確。

在提取教學(xué)視頻的字幕信息之后,就可以對字幕信息進行文本分割處理,從而,提取知識點標簽。在提取知識點標簽之后,就可以基于知識點標簽對習(xí)題進行分類,得到至少一種類別的試題分組。在得到試題分組之后,就可以獲取學(xué)生們的答題結(jié)果,并基于答題結(jié)果在教學(xué)視頻中識別難點片段,具體實現(xiàn)過程如上,這里不再贅述。

實施例二:

本發(fā)明實施例還提供了一種視頻片段的識別裝置,該視頻片段的識別裝置主要用于執(zhí)行本發(fā)明實施例上述內(nèi)容所提供的視頻片段的識別方法,以下對本發(fā)明實施例提供的視頻片段的識別裝置做具體介紹。

圖4是根據(jù)本發(fā)明實施例的一種視頻片段的識別裝置的示意圖,如圖4所示,該視頻片段的識別裝置主要包括:提取單元41,分類單元42,第一確定單元43和第二確定單元44,其中:

提取單元41,用于提取教學(xué)視頻中包含的每個視頻片段的知識點標簽,得到至少一個知識點標簽,其中,至少一個知識點標簽用于指示至少一個知識點;

分類單元42,用于基于視頻片段的知識點標簽和視頻片段的字幕信息對目標試題按照知識點進行分類,得到至少一種類別的試題分組,其中,目標試題為所屬于教學(xué)視頻的試題,且不同類別的試題分組對應(yīng)的知識點標簽不同;

第一確定單元43,用于基于獲取到的每個試題分組的答題結(jié)果在知識點標簽中確定目標知識點標簽所對應(yīng)的目標知識點,其中,目標知識點為至少一個知識點中難度大于預(yù)設(shè)難度的知識點;

第二確定單元44,用于將視頻片段中目標知識點所對應(yīng)的視頻片段作為難點片段。

在本發(fā)明實施例中,首先提取教學(xué)視頻中包含的每個視頻片段的知識點標簽,然后,基于知識點標簽和視頻片段的字幕信息對目標試題按照知識點進行分類,得到至少一種類別的試題分組;接下來,基于每個試題分組的答題結(jié)果在知識點標簽中確定目標知識點標簽所對應(yīng)的目標知識點;最后,將視頻片段中目標知識點所對應(yīng)的視頻片段作為難點片段。在本發(fā)明實施例中,通過上述方式,能夠快速有效的在教學(xué)視頻中識別難點片段,進而緩解了采用現(xiàn)有技術(shù)中的方法進行難點識別時識別精度較差,且識別過程較為緩慢的技術(shù)問題。

可選地,提取單元包括:第一提取模塊,用于提取視頻片段的字幕信息;分割處理模塊,用于對字幕信息進行文本分割處理,處理得到至少一個文本分割片段;第二提取模塊,用于采用textrank算法在每個文本分割片段中提取topn關(guān)鍵詞,并將提取到的topn關(guān)鍵詞作為視頻片段的知識點標簽。

可選地,分割處理模塊用于:對字幕信息執(zhí)行目標處理,得到處理之后的字幕信息,其中,目標處理包括:分詞處理和去停用詞處理;基于文本分割算法對處理之后的字幕信息進行文本分割,分割之后得到至少一個文本分割片段。

可選地,提取單元用于:判斷視頻片段是否包含字幕信息;如果判斷出視頻片段包含字幕信息,則提取字幕信息;如果判斷出視頻片段不包含字幕信息,則提取視頻片段的音頻信息,并將音頻信息轉(zhuǎn)換為字幕信息。

可選地,分類單元包括:構(gòu)建模塊,用于構(gòu)建訓(xùn)練語料,其中,訓(xùn)練語料中包括至少一個知識點標簽和字幕碎片,其中,字幕碎片為通過對字幕信息進行處理得到的碎片;訓(xùn)練模塊,用于通過訓(xùn)練語料對分類模型進行訓(xùn)練;分類模塊,用于基于訓(xùn)練好的分類模型對目標試題進行分類,得到至少一種類別的試題分組。

可選地,構(gòu)建模塊用于:將視頻片段的字幕信息進行切分,得到字幕碎片,其中,字幕碎片中包括至少一個關(guān)鍵詞;訓(xùn)練模塊用于:將字幕碎片和至少一個知識點標簽作為分類模型的輸入,將目標概率信息作為分類模型的輸出,對分類模型進行訓(xùn)練,其中,目標概率信息表示至少一個關(guān)鍵詞中每個關(guān)鍵詞為至少一個知識點標簽中的知識點標簽的概率。

可選地,第一確定單元用于:獲取全部學(xué)習(xí)人員對試題分組中每個試題的答題結(jié)果;在答題結(jié)果中統(tǒng)計第一答題結(jié)果的數(shù)量和第二答題結(jié)果的數(shù)量,其中,第一答題結(jié)果為正確的答題結(jié)果,第二答題結(jié)果為錯誤的答題結(jié)果;基于第二答題結(jié)果的數(shù)量判斷當(dāng)前試題分組所對應(yīng)的知識點標簽是否為目標知識點標簽;其中,如果判斷出是,則將當(dāng)前試題分組所對應(yīng)的知識點標簽作為目標知識點標簽。

可選地,該裝置還包括:生成單元,用于在將教學(xué)視頻中目標知識點所對應(yīng)的視頻片段作為難點片段之后,生成目標圖像,其中,目標圖像中包括每個視頻片段的難點視頻的起始時間、每個所述視頻片段的難點視頻的結(jié)束時間和每個視頻片段的難點視頻的難易程度;推送單元,用于將目標圖像推送至教師,以使教師根據(jù)目標圖像確定難點視頻,其中,教師為教學(xué)視頻中的教師。

另外,在本發(fā)明實施例的描述中,除非另有明確的規(guī)定和限定,術(shù)語“安裝”、“相連”、“連接”應(yīng)做廣義理解,例如,可以是固定連接,也可以是可拆卸連接,或一體地連接;可以是機械連接,也可以是電連接;可以是直接相連,也可以通過中間媒介間接相連,可以是兩個元件內(nèi)部的連通。對于本領(lǐng)域的普通技術(shù)人員而言,可以具體情況理解上述術(shù)語在本發(fā)明中的具體含義。

在本發(fā)明的描述中,需要說明的是,術(shù)語“中心”、“上”、“下”、“左”、“右”、“豎直”、“水平”、“內(nèi)”、“外”等指示的方位或位置關(guān)系為基于附圖所示的方位或位置關(guān)系,僅是為了便于描述本發(fā)明和簡化描述,而不是指示或暗示所指的裝置或元件必須具有特定的方位、以特定的方位構(gòu)造和操作,因此不能理解為對本發(fā)明的限制。此外,術(shù)語“第一”、“第二”、“第三”僅用于描述目的,而不能理解為指示或暗示相對重要性。

所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統(tǒng)、裝置和單元的具體工作過程,可以參考前述方法實施例中的對應(yīng)過程,在此不再贅述。

在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的系統(tǒng)、裝置和方法,可以通過其它的方式實現(xiàn)。以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,又例如,多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些通信接口,裝置或單元的間接耦合或通信連接,可以是電性,機械或其它的形式。

所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。

另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。

所述功能如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個處理器可執(zhí)行的非易失的計算機可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分或者該技術(shù)方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:u盤、移動硬盤、只讀存儲器(rom,read-onlymemory)、隨機存取存儲器(ram,randomaccessmemory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。

最后應(yīng)說明的是:以上所述實施例,僅為本發(fā)明的具體實施方式,用以說明本發(fā)明的技術(shù)方案,而非對其限制,本發(fā)明的保護范圍并不局限于此,盡管參照前述實施例對本發(fā)明進行了詳細的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),其依然可以對前述實施例所記載的技術(shù)方案進行修改或可輕易想到變化,或者對其中部分技術(shù)特征進行等同替換;而這些修改、變化或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明實施例技術(shù)方案的精神和范圍,都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應(yīng)所述以權(quán)利要求的保護范圍為準。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
万荣县| 盐池县| 黄石市| 金沙县| 隆林| 乌拉特后旗| 壤塘县| 额济纳旗| 霍城县| 绥芬河市| 香河县| 来凤县| 康平县| 南丰县| 犍为县| 固原市| 酒泉市| 共和县| 达日县| 灵川县| 冷水江市| 洞口县| 阿巴嘎旗| 永宁县| 商都县| 甘泉县| 浙江省| 垫江县| 西城区| 灵武市| 阳曲县| 开封市| 内江市| 沾化县| 钟祥市| 海宁市| 聂拉木县| 龙海市| 屏山县| 多伦县| 敖汉旗|