本發(fā)明涉及數(shù)據(jù)分析,具體涉及一種用戶生成內(nèi)容防沉迷方法及系統(tǒng)。
背景技術(shù):
1、目前ugc(user-generated-content,用戶生成內(nèi)容)已經(jīng)成為主流的互聯(lián)網(wǎng)服務(wù),一些互聯(lián)網(wǎng)企業(yè)結(jié)合ugc和推薦算法,給用戶推送大量的內(nèi)容,這導(dǎo)致用戶在使用ugc的同時容易沉迷。用戶沉迷于ugc內(nèi)容平臺,可能會導(dǎo)致長時間連續(xù)瀏覽、創(chuàng)作或互動,進而忽視學(xué)習(xí)、工作、社交等現(xiàn)實生活中的重要事務(wù)。長時間的使用不僅可能對用戶的身體健康造成負面影響,如視力下降、頸椎疼痛等,還可能引發(fā)心理問題,如焦慮、孤僻、注意力分散等。因此,如何有效防止用戶沉迷ugc內(nèi)容平臺,已成為一個亟待解決的問題。
2、為了解決這一問題,目前已有多種防沉迷方法被提出和應(yīng)用。例如,通過設(shè)定使用時間限制、強制休息機制、實名認證與年齡驗證等手段,來限制用戶的在線時長和內(nèi)容訪問權(quán)限。然而,這些方法大多基于用戶的在線時長或行為模式進行簡單控制,缺乏對用戶內(nèi)容偏好的深入分析和精準識別。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提供一種用戶生成內(nèi)容防沉迷方法及系統(tǒng),通過分析和比較用戶當前頁面內(nèi)容與之前頁面內(nèi)容的特征信息,來判斷用戶是否進入沉迷狀態(tài)。該方法能夠捕捉用戶的興趣偏好和行為模式,從而為用戶提供更加個性化和精準的防沉迷提示和措施,以解決上述背景技術(shù)中存在的至少一項技術(shù)問題。
2、為了實現(xiàn)上述目的,本發(fā)明采取了如下技術(shù)方案:
3、第一方面,本發(fā)明提供一種用戶生成內(nèi)容防沉迷方法,包括:
4、獲取當前時間t時的當前頁面內(nèi)容,以及當前時間t之前一時間段t內(nèi)的多個不同歷史時刻的歷史頁面內(nèi)容;
5、根據(jù)所述當前頁面內(nèi)容,建立其對應(yīng)的第一三階張量,所述第一三階張量包括當前時間信息、當前頁面圖像樣本和當前頁面圖像顏色深度;根據(jù)多個不同歷史時刻的歷史頁面內(nèi)容,建立多個不同歷史時刻的歷史頁面對應(yīng)的多個第二三階張量,每一個所述第二三階張量均包括歷史時刻信息、該歷史時刻的頁面圖像樣本和該歷史時刻的頁面圖像顏色深度;
6、對所述第一三階張量進行字符集轉(zhuǎn)化并向量化,得到第一特征向量,根據(jù)所述第一特征向量得到第一標簽;對多個所述第二三階張量進行字符集轉(zhuǎn)化并向量化,得到多個第二特征向量,根據(jù)所述多個第二特征向量得到多個第二標簽;
7、將所述第一標簽和多個所述第二標簽逐一對比,若第一標簽和第二標簽的相似度或距離值大于預(yù)先設(shè)定的閾值,則判斷為用戶進入沉迷狀態(tài);
8、若用戶進入沉迷狀態(tài),則發(fā)出警報信號。
9、作為本發(fā)明第一方面進一步的限定,所述頁面內(nèi)容包括一種或兩種不同的模態(tài)數(shù)據(jù),所述模態(tài)數(shù)據(jù)為文本數(shù)據(jù)、圖像數(shù)據(jù)或視頻數(shù)據(jù)。
10、作為本發(fā)明第一方面進一步的限定,對所述第一三階張量進行字符集轉(zhuǎn)化并向量化,得到第一特征向量,根據(jù)第一特征向量,得到第一標簽,包括:將所述第一三階張量轉(zhuǎn)化為第一字符集,對所述第一字符集進行向量化,得到所述第一特征向量;提取所述第一特征向量的特征信息;計算不同的獨立特征的條件概率,根據(jù)條件概率值對第一特征信息進行聚類分析,得到第一標簽。
11、作為本發(fā)明第一方面進一步的限定,對多個所述第二三階張量進行字符集轉(zhuǎn)化并向量化,得到多個第二特征向量,根據(jù)所述多個第二特征向量得到多個第二標簽,包括:將所述每一個所述第二三階張量轉(zhuǎn)化為一個第二字符集,對每一個所述第二字符集進行向量化,得到一個所述第二特征向量;提取所述第二特征向量的特征信息,計算不同的獨立特征的條件概率,根據(jù)條件概率值并進行聚類分析,得到所述第二標簽。
12、作為本發(fā)明第一方面進一步的限定,將第一標簽與第二標簽進行逐一計算它們之間的相似度或距離值;若第一標簽與某一歷史時刻對應(yīng)的第二標簽的相似度高于設(shè)定的相似度閾值或距離值低于設(shè)定的距離閾值,則表明當前頁面內(nèi)容與該歷史時刻的歷史頁面內(nèi)容之間存在一致性或相似性,進而判斷用戶進入沉迷狀態(tài)。
13、作為本發(fā)明第一方面進一步的限定,使用樸素貝葉斯分類器,根據(jù)訓(xùn)練數(shù)據(jù)集,計算每個類別的先驗概率和條件概率,根據(jù)輸入的第一特征信息,計算其屬于每個類別的后驗概率,并選擇概率最大的類別作為預(yù)測結(jié)果,即第一標簽。
14、第二方面,本發(fā)明提供一種用戶生成內(nèi)容防沉迷系統(tǒng),包括:
15、獲取模塊,用于獲取當前時間t時的當前頁面內(nèi)容,以及當前時間t之前一時間段t內(nèi)的多個不同歷史時刻的歷史頁面內(nèi)容;
16、處理模塊,用于根據(jù)所述當前頁面內(nèi)容,建立其對應(yīng)的第一三階張量,所述第一三階張量包括當前時間信息、當前頁面圖像樣本和當前頁面圖像顏色深度;根據(jù)多個不同歷史時刻的歷史頁面內(nèi)容,建立多個不同歷史時刻的歷史頁面對應(yīng)的多個第二三階張量,每一個所述第二三階張量均包括歷史時刻信息、該歷史時刻的頁面圖像樣本和該歷史時刻的頁面圖像顏色深度;
17、轉(zhuǎn)化模塊,用于對所述第一三階張量進行字符集轉(zhuǎn)化并向量化,得到第一特征向量,根據(jù)所述第一特征向量得到第一標簽;對多個所述第二三階張量進行字符集轉(zhuǎn)化并向量化,得到多個第二特征向量,根據(jù)所述多個第二特征向量得到多個第二標簽;
18、對比模塊,用于將所述第一標簽和多個所述第二標簽逐一對比,若第一標簽和第二標簽的相似度或距離值大于預(yù)先設(shè)定的閾值,則判斷為用戶進入沉迷狀態(tài);
19、報警模塊,用于若用戶進入沉迷狀態(tài),則發(fā)出警報信號。
20、第三方面,本發(fā)明提供一種計算機設(shè)備,包括:處理器和計算機可讀存儲介質(zhì);處理器,適于執(zhí)行計算機程序;所述計算機可讀存儲介質(zhì)中存儲有計算機程序,所述計算機程序被所述處理器執(zhí)行時,實現(xiàn)如第一方面所述的用戶生成內(nèi)容防沉迷方法。
21、第四方面,本發(fā)明提供一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)存儲有計算機程序,所述計算機程序適于被處理器加載并執(zhí)行如第一方面所述的用戶生成內(nèi)容防沉迷方法。
22、第五方面,本發(fā)明提供一種計算機程序產(chǎn)品,所述計算機程序產(chǎn)品包括計算機程序,所述計算機程序被處理器執(zhí)行時,實現(xiàn)如第一方面所述的用戶生成內(nèi)容防沉迷方法。
23、本發(fā)明有益效果:首先獲取用戶當前頁面內(nèi)容和之前設(shè)定時間內(nèi)的頁面內(nèi)容,然后提取這些內(nèi)容的特征信息并進行聚類分析,得到相應(yīng)的標簽。接著,比較當前頁面內(nèi)容的標簽與之前頁面內(nèi)容的標簽之間的相似度或距離值,若相似度高于設(shè)定閾值(或距離值低于設(shè)定閾值),則判斷用戶可能進入沉迷狀態(tài)。最后,觸發(fā)警報信號或其他預(yù)設(shè)的防沉迷措施,以提醒用戶注意使用時長和內(nèi)容選擇。能夠針對不同用戶的興趣偏好和行為模式等實際情況進行個性化的干預(yù),使得防沉迷措施更加精準有效,提高了ugc內(nèi)容平臺的安全性,提高了用戶體驗。
1.一種用戶生成內(nèi)容防沉迷方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的用戶生成內(nèi)容防沉迷方法,其特征在于,所述頁面內(nèi)容包括一種或兩種不同的模態(tài)數(shù)據(jù),所述模態(tài)數(shù)據(jù)為文本數(shù)據(jù)、圖像數(shù)據(jù)或視頻數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的用戶生成內(nèi)容防沉迷方法,其特征在于,對所述第一三階張量進行字符集轉(zhuǎn)化并向量化,得到第一特征向量,根據(jù)第一特征向量,得到第一標簽,包括:將所述第一三階張量轉(zhuǎn)化為第一字符集,對所述第一字符集進行向量化,得到所述第一特征向量;提取所述第一特征向量的特征信息;計算不同的獨立特征的條件概率,根據(jù)條件概率值對第一特征信息進行聚類分析,得到第一標簽。
4.根據(jù)權(quán)利要求1所述的用戶生成內(nèi)容防沉迷方法,其特征在于,對多個所述第二三階張量進行字符集轉(zhuǎn)化并向量化,得到多個第二特征向量,根據(jù)所述多個第二特征向量得到多個第二標簽,包括:將所述每一個所述第二三階張量轉(zhuǎn)化為一個第二字符集,對每一個所述第二字符集進行向量化,得到一個所述第二特征向量;提取所述第二特征向量的特征信息,計算不同的獨立特征的條件概率,根據(jù)條件概率值并進行聚類分析,得到所述第二標簽。
5.根據(jù)權(quán)利要求1所述的用戶生成內(nèi)容防沉迷方法,其特征在于,將第一標簽與第二標簽進行逐一計算它們之間的相似度或距離值;若第一標簽與某一歷史時刻對應(yīng)的第二標簽的相似度高于設(shè)定的相似度閾值或距離值低于設(shè)定的距離閾值,則表明當前頁面內(nèi)容與該歷史時刻的歷史頁面內(nèi)容之間存在一致性或相似性,進而判斷用戶進入沉迷狀態(tài)。
6.根據(jù)權(quán)利要求3所述的用戶生成內(nèi)容防沉迷方法,其特征在于,使用樸素貝葉斯分類器,根據(jù)訓(xùn)練數(shù)據(jù)集,計算每個類別的先驗概率和條件概率,根據(jù)輸入的第一特征信息,計算其屬于每個類別的后驗概率,并選擇概率最大的類別作為預(yù)測結(jié)果,即第一標簽。
7.一種用戶生成內(nèi)容防沉迷系統(tǒng),其特征在于,包括:
8.一種計算機設(shè)備,其特征在于,包括:處理器和計算機可讀存儲介質(zhì);處理器,適于執(zhí)行計算機程序;所述計算機可讀存儲介質(zhì)中存儲有計算機程序,所述計算機程序被所述處理器執(zhí)行時,實現(xiàn)如權(quán)利要求1至6任一項所述的用戶生成內(nèi)容防沉迷方法。
9.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)存儲有計算機程序,所述計算機程序適于被處理器加載并執(zhí)行如權(quán)利要求1至6任一項所述的用戶生成內(nèi)容防沉迷方法。
10.一種計算機程序產(chǎn)品,其特征在于,所述計算機程序產(chǎn)品包括計算機程序,所述計算機程序被處理器執(zhí)行時,實現(xiàn)如權(quán)利要求1至6任一項所述的用戶生成內(nèi)容防沉迷方法。