欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于機(jī)器風(fēng)格優(yōu)化的機(jī)器生成文本檢測模型的訓(xùn)練方法、機(jī)器生成文本檢測方法及裝置與流程

文檔序號:40616782發(fā)布日期:2025-01-10 18:22閱讀:2來源:國知局
基于機(jī)器風(fēng)格優(yōu)化的機(jī)器生成文本檢測模型的訓(xùn)練方法、機(jī)器生成文本檢測方法及裝置與流程

本發(fā)明涉及人工智能,尤其涉及一種基于機(jī)器風(fēng)格優(yōu)化的機(jī)器生成文本檢測模型的訓(xùn)練方法、機(jī)器生成文本檢測方法及裝置。


背景技術(shù):

1、隨著人工智能技術(shù)的迅速發(fā)展,機(jī)器生成的文本越來越逼真且難以區(qū)分。這種技術(shù)的進(jìn)步雖然帶來了自動化寫作和內(nèi)容生成的便利,但也伴隨著虛假信息傳播的風(fēng)險。惡意行為者可以利用生成的文本制造虛假新聞和偽造的社交媒體帖子,從而影響公眾輿論和社會穩(wěn)定。沒有有效的檢測手段,我們將難以應(yīng)對這些挑戰(zhàn),確保信息的真實(shí)性和可靠性。因此,探索和發(fā)展機(jī)器生成文本檢測技術(shù)變得尤為重要,以保護(hù)信息環(huán)境的健康和安全。

2、在機(jī)器生成文本檢測領(lǐng)域,零樣本(zero-shot)方法展現(xiàn)出卓越的性能。此方法利用預(yù)訓(xùn)練語言模型,分析文本中各個令牌的概率分布。通過對比原始文本和擾動版本的對數(shù)概率差異,零樣本方法無需標(biāo)注訓(xùn)練數(shù)據(jù)即可有效區(qū)分人類和機(jī)器生成的文本。由于檢測模型與源模型的概率分布高度相似,零樣本方法在檢測任務(wù)中表現(xiàn)出顯著的效果。

3、然而,現(xiàn)有的零樣本方法存在一些不可忽視的缺陷:

4、零樣本方法的有效性在面對更復(fù)雜的語言模型時受到挑戰(zhàn)。雖然早期生成模型依賴少量初始令牌生成文本,其檢測模型可以準(zhǔn)確地反映源模型的概率分布,保證了零樣本方法的有效性。然而,現(xiàn)代語言模型通常經(jīng)過額外的訓(xùn)練階段,使得生成的文本不僅符合人類偏好,還具有獨(dú)特風(fēng)格。這種風(fēng)格的獨(dú)特性導(dǎo)致源模型和檢測模型之間的對齊度降低,概率估計出現(xiàn)差異,最終削弱了零樣本檢測技術(shù)的有效性。


技術(shù)實(shí)現(xiàn)思路

1、針對現(xiàn)有技術(shù)的以上缺陷或改進(jìn)需求,本發(fā)明提供了一種基于機(jī)器風(fēng)格優(yōu)化的機(jī)器生成文本檢測模型的訓(xùn)練方法、機(jī)器生成文本檢測方法及裝置,其目的在于解決源模型與檢測模型之間存在的不對齊問題,導(dǎo)致現(xiàn)有機(jī)器生成文本檢測技術(shù)準(zhǔn)確率不佳的問題。

2、為實(shí)現(xiàn)上述目的,按照本發(fā)明的一個方面,提供了一種基于機(jī)器風(fēng)格優(yōu)化的機(jī)器生成文本檢測模型的訓(xùn)練方法,其中,所述機(jī)器生成文本檢測模型包括模型加載模塊、分詞器加載模塊、采樣偏差分析模塊和輸出模塊,所述方法包括:

3、利用模型加載模塊加載第一預(yù)訓(xùn)練模型,將加載的第一預(yù)訓(xùn)練模型作為第一參考模型和第一評分模型;

4、利用分詞器加載模塊加載第一預(yù)訓(xùn)練模型的分詞器;

5、利用采樣偏差分析模塊基于第一參考模型的輸出、第一評分模型的輸出以及真實(shí)標(biāo)簽得到第一參考模型的輸出與第一評分模型的輸出之間的差異,其中,第一參考模型的輸出為第一參考模型基于輸入的原始文本輸出的未經(jīng)歸一化處理的對每個可能輸出的原始得分,第一評分模型的輸出為第一評分模型基于輸入的原始文本輸出的未經(jīng)歸一化處理的對每個可能輸出的原始得分;

6、將采樣偏差分析模塊得到的輸出輸入輸出模塊,得到預(yù)測結(jié)果;以及

7、基于原始文本、初始化為none的真實(shí)標(biāo)簽、模型當(dāng)前的預(yù)測結(jié)果與真實(shí)標(biāo)簽之間的差異程度,對所述機(jī)器生成文本檢測模型進(jìn)行訓(xùn)練。

8、在一種實(shí)施方式中,利用模型加載模塊加載預(yù)訓(xùn)練模型,包括:

9、模型加載模塊采用一個自適應(yīng)因果語言模型,基于輸入的模型名稱、設(shè)備以及緩存目錄,得到加載到指定設(shè)備的第一預(yù)訓(xùn)練模型。

10、在一種實(shí)施方式中,利用分詞器加載模塊記載預(yù)訓(xùn)練模塊的分詞器,包括:

11、分詞器加載模塊采用一個自適應(yīng)分詞器模型,基于輸入的模型名稱、數(shù)據(jù)集以及緩存目錄,得到加載到指定設(shè)備的分詞器。

12、在一種實(shí)施方式中,利用采樣偏差分析模塊基于第一參考模型的輸出、第一評分模型的輸出以及真實(shí)標(biāo)簽得到第一參考模型的輸出與第一評分模型的輸出之間的差異,包括:

13、采樣偏差分析模塊調(diào)整第一評分模型和第一參考模型的輸出logits的大小進(jìn)行匹配,其中,第一評分模型的輸出logits為第一評分模型輸出的未經(jīng)歸一化處理的對每個可能輸出的原始得分,第一參考模型的輸出logits為第一參考模型輸出的未經(jīng)歸一化處理的對每個可能輸出的原始得分;

14、通過對第一評分模型的輸出logits進(jìn)行對數(shù)歸一化處理,得到第一評分模型對數(shù)歸一化后的概率,通過對第一參考模型進(jìn)行歸一化處理,得到第一參考模型歸一化后的概率;

15、利用第一評分模型對數(shù)歸一化后的概率,去掉多余的維度,得到第一評分模型按照真實(shí)標(biāo)簽選擇的對數(shù)概率;利用參考模型歸一化后的概率,計算第一評分模型對數(shù)歸一化后的概率的加權(quán)平均值和方差;

16、將掩碼比例設(shè)置為0,將第一評分模型按照真實(shí)標(biāo)簽選擇的對數(shù)概率的第二維數(shù)據(jù)作為長度,計算掩碼比例和長度的乘積作為裁切點(diǎn)1和裁切點(diǎn)2;

17、從裁剪點(diǎn)1開始對第一評分模型按照真實(shí)標(biāo)簽選擇的對數(shù)概率進(jìn)行均值計算,同時對裁剪點(diǎn)2進(jìn)行評分模型對數(shù)歸一化后的概率的加權(quán)平均值和方差的均值計算,將第一評分模型按照真實(shí)標(biāo)簽選擇的對數(shù)概率的均值與評分模型對數(shù)歸一化后的概率的加權(quán)平均值的均值之差除以第一評分模型對數(shù)歸一化后的概率的方差的均值的平方根,得到采樣偏差值,作為第一參考模型的輸出與第一評分模型之間的輸出的之間的差異。

18、在一種實(shí)施方式中,基于原始文本、初始化為none的真實(shí)標(biāo)簽、模型當(dāng)前的預(yù)測結(jié)果與真實(shí)標(biāo)簽之間的差異程度,對所述機(jī)器生成文本檢測模型進(jìn)行訓(xùn)練,包括:

19、使用逆映射模型分詞器對原始文本進(jìn)行標(biāo)記,返回張量形式的輸入id,并進(jìn)行填充、截斷后轉(zhuǎn)移到指定設(shè)備上,將解碼器輸入嵌入轉(zhuǎn)換到指定設(shè)備上,并根據(jù)對原始文本進(jìn)行標(biāo)記后得到的逆向映射輸入id的形狀進(jìn)行重復(fù),將得到的輸入id和解碼器輸入嵌入傳入逆映射模型進(jìn)行前向傳播;

20、獲取逆向提示的最后隱藏狀態(tài),使用逆向提示適配器對逆向提示的最后隱藏狀態(tài)進(jìn)行適配,生成逆向提示嵌入,獲取逆向提示嵌入的長度;

21、使用第一評分模型分詞器對模型的輸出文本進(jìn)行標(biāo)記,返回張量形式,并進(jìn)行填充,不返回token類型id,將其轉(zhuǎn)換到指定設(shè)備上;去掉標(biāo)記后的輸入id的第一個元素作為標(biāo)簽,獲取標(biāo)簽;

22、獲取第一評分模型的輸入嵌入;

23、將生成的逆向提示嵌入和獲取的第一評分模型的輸入嵌入進(jìn)行拼接,構(gòu)建注意力掩碼,將全為1的張量與標(biāo)記后的注意力掩碼拼接;

24、獲取第一評分模型的logits,截取靜態(tài)提示長度加上逆向提示嵌入后的部分,將第一參考模型的logits設(shè)為第一評分模型的logits;

25、判斷標(biāo)記后的輸入id去掉第一個元素是否與獲取的標(biāo)簽一致,如果不一致,進(jìn)行報錯;

26、使用第一參考模型進(jìn)行前向傳播,獲取參考模型的logits,并去掉最后一個元素;

27、利用采樣偏差分析模塊對第一參考模型和第一評分模型的輸出logits以及標(biāo)簽計算得到原始損失值;

28、獲取第一評分模型的最后一個token的logits,使用分類器對最后一個token的logits進(jìn)行預(yù)測,得到預(yù)測值;

29、構(gòu)建輸出字典,包含利用采樣偏差分析模塊得到的原始損失值和分類器得到的預(yù)測值;

30、利用采樣偏差分析模塊得到的原始損失值和傳入的標(biāo)簽,計算交叉熵?fù)p失,并返回利用采樣偏差分析模塊得到的原始損失值和計算得到的交叉熵?fù)p失。

31、基于同樣的發(fā)明構(gòu)思,本發(fā)明第二方面提供了一種機(jī)器生成文本檢測方法,所述機(jī)器生成文本檢測模型包括模型加載模塊、分詞器加載模塊、采樣偏差分析模塊和輸出模塊,所述方法包括:

32、利用模型加載模塊加載第二預(yù)訓(xùn)練模型,將加載的第二預(yù)訓(xùn)練模型作為第二參考模型和第二評分模型;

33、利用分詞器加載模塊加載第二預(yù)訓(xùn)練模型的分詞器;

34、利用采樣偏差分析模塊基于第二參考模型的輸出、第二評分模型的輸出以及真實(shí)標(biāo)簽得到第二參考模型的輸出與第二評分模型的輸出之間的差異,其中,第二參考模型的輸出為第二參考模型基于輸入的待測文本輸出的未經(jīng)歸一化處理的對每個可能輸出的原始得分,第二評分模型的輸出為第二評分模型基于輸入的待測文本輸出的未經(jīng)歸一化處理的對每個可能輸出的原始得分;

35、將采樣偏差分析模塊得到的輸出輸入輸出模塊,得到預(yù)測結(jié)果;

36、其中,所述機(jī)器生成文本檢測模型是采用權(quán)利要求1~5任一項(xiàng)所述的機(jī)器生成文本檢測模型的訓(xùn)練方法得到的模型。

37、基于同樣的發(fā)明構(gòu)思,本發(fā)明第三方面提供一種基于機(jī)器風(fēng)格優(yōu)化的機(jī)器生成文本檢測模型的訓(xùn)練裝置,其中,所述機(jī)器生成文本檢測模型包括模型加載模塊、分詞器加載模塊、采樣偏差分析模塊和輸出模塊,所述裝置包括:

38、第一預(yù)訓(xùn)練模型加載模塊,用于利用模型加載模塊加載第一預(yù)訓(xùn)練模型,將加載的第一預(yù)訓(xùn)練模型作為第一參考模型和第一評分模型;

39、第一預(yù)訓(xùn)練模型的分詞器加載模塊,用于利用分詞器加載模塊加載第一預(yù)訓(xùn)練模型的分詞器;

40、第一差異輸出模塊,用于利用采樣偏差分析模塊基于第一參考模型的輸出、第一評分模型的輸出以及真實(shí)標(biāo)簽得到第一參考模型的輸出與第一評分模型的輸出之間的差異,其中,第一參考模型的輸出為第一參考模型基于輸入的原始文本輸出的未經(jīng)歸一化處理的對每個可能輸出的原始得分,第一評分模型的輸出為第一評分模型基于輸入的原始文本輸出的未經(jīng)歸一化處理的對每個可能輸出的原始得分;

41、第一預(yù)測模塊,用于將采樣偏差分析模塊得到的輸出輸入輸出模塊,得到預(yù)測結(jié)果;以及

42、前向傳播模塊,用于基于原始文本、初始化為none的真實(shí)標(biāo)簽、模型當(dāng)前的預(yù)測結(jié)果與真實(shí)標(biāo)簽之間的差異程度,對所述機(jī)器生成文本檢測模型進(jìn)行訓(xùn)練。

43、基于同樣的發(fā)明構(gòu)思,本發(fā)明第四方面提供一種機(jī)器生成文本檢測裝置,所述機(jī)器生成文本檢測模型包括模型加載模塊、分詞器加載模塊、采樣偏差分析模塊和輸出模塊,所述裝置包括:

44、第二預(yù)訓(xùn)練模型加載模塊,用于利用模型加載模塊加載第二預(yù)訓(xùn)練模型,將加載的第二預(yù)訓(xùn)練模型作為第二參考模型和第二評分模型;

45、第二預(yù)訓(xùn)練模型的分詞器加載模塊,用于利用分詞器加載模塊加載第二預(yù)訓(xùn)練模型的分詞器;

46、第二差異輸出模塊,用于利用采樣偏差分析模塊基于第二參考模型的輸出、第二評分模型的輸出以及真實(shí)標(biāo)簽得到第二參考模型的輸出與第二評分模型的輸出之間的差異,其中,第二參考模型的輸出為第二參考模型基于輸入的待測文本輸出的未經(jīng)歸一化處理的對每個可能輸出的原始得分,第二評分模型的輸出為第二評分模型基于輸入的待測文本輸出的未經(jīng)歸一化處理的對每個可能輸出的原始得分;

47、第二預(yù)測模塊,用于將采樣偏差分析模塊得到的輸出輸入輸出模塊,得到對待測文本的第二預(yù)測結(jié)果;

48、其中,所述機(jī)器生成文本檢測模型是采用權(quán)利要求7所述的機(jī)器生成文本檢測模型的訓(xùn)練裝置得到的模型。

49、基于同樣的發(fā)明構(gòu)思,本發(fā)明第五方面提供了一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序,該程序被處理器執(zhí)行時實(shí)現(xiàn)第一方面所述的機(jī)器生成文本檢測模型的訓(xùn)練方法或者第二方面所述的機(jī)器生成文本檢測方法。

50、基于同樣的發(fā)明構(gòu)思,本發(fā)明第六方面提供了一種計算機(jī)設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運(yùn)行的計算機(jī)程序,所述處理器執(zhí)行所述程序時實(shí)現(xiàn)實(shí)現(xiàn)第一方面所述的機(jī)器生成文本檢測模型的訓(xùn)練方法或者第二方面所述的機(jī)器生成文本檢測方法。

51、相對于現(xiàn)有技術(shù),本發(fā)明的優(yōu)點(diǎn)和有益的技術(shù)效果如下:

52、由于本發(fā)明提出的基于機(jī)器風(fēng)格優(yōu)化機(jī)器生成文本檢測模型,它允許調(diào)整檢測模型的概率分布,使其更接近先進(jìn)生成模型的分布。這種方法逐步將檢測模型的偏好調(diào)整為復(fù)雜大型語言模型通常做出的風(fēng)格選擇,同時保持足夠的通用性,以適用于各種文本生成場景。因此,本發(fā)明解決了現(xiàn)有的零樣本方法內(nèi)出現(xiàn)的源模型與檢測模型之間存在的不對齊問題,使得源模型與檢測模型的概率分布之間的對齊率得以改善,進(jìn)而顯著提升了機(jī)器生成文本檢測技術(shù)的準(zhǔn)確率。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
苗栗市| 通化县| 正定县| 台中市| 陇西县| 永康市| 九寨沟县| 湖口县| 玛纳斯县| 鸡西市| 洛扎县| 凯里市| 竹溪县| 武安市| 安阳县| 新兴县| 卢湾区| 朝阳县| 札达县| 三明市| 田东县| 上杭县| 瓦房店市| 日喀则市| 青浦区| 泽州县| 万荣县| 江门市| 志丹县| 饶河县| 阳西县| 平湖市| 林甸县| 溧阳市| 延吉市| 阿城市| 特克斯县| 南阳市| 阿拉善右旗| 安泽县| 大田县|