本發(fā)明涉及邊緣計算技術(shù),尤其涉及基于邊緣計算的私域直播內(nèi)容分發(fā)與訪客互動方法及系統(tǒng)。
背景技術(shù):
1、現(xiàn)有技術(shù)主要存在以下缺陷和不足:
2、內(nèi)容分發(fā)效率低:傳統(tǒng)的直播內(nèi)容分發(fā)方式通常依賴中心服務(wù)器,當(dāng)用戶規(guī)模較大或地理位置分散時,容易出現(xiàn)網(wǎng)絡(luò)擁堵,導(dǎo)致內(nèi)容加載緩慢、卡頓等問題,影響用戶體驗。邊緣計算雖然可以提升內(nèi)容分發(fā)效率,但現(xiàn)有的方案大多缺乏智能化的內(nèi)容緩存和分發(fā)策略,無法根據(jù)用戶訪問模式和網(wǎng)絡(luò)狀況動態(tài)調(diào)整內(nèi)容分布,導(dǎo)致資源利用率低。
3、互動體驗不佳:現(xiàn)有的直播互動方式主要以文字彈幕和簡單的點贊為主,缺乏更加豐富的互動形式和個性化的互動體驗。用戶的多模態(tài)交互數(shù)據(jù),例如語音、表情、動作等,沒有得到充分利用,難以實現(xiàn)真正意義上的實時互動和個性化推薦。
4、缺乏有效的負(fù)載均衡機制:在邊緣計算環(huán)境下,各個邊緣節(jié)點的計算和存儲資源有限,用戶訪問模式也具有較大的波動性?,F(xiàn)有的負(fù)載均衡機制往往不夠靈活,難以有效應(yīng)對突發(fā)流量和動態(tài)變化的用戶需求,容易造成部分邊緣節(jié)點過載,影響整體系統(tǒng)的穩(wěn)定性和性能。
技術(shù)實現(xiàn)思路
1、本發(fā)明實施例提供基于邊緣計算的私域直播內(nèi)容分發(fā)與訪客互動方法及系統(tǒng),能夠解決現(xiàn)有技術(shù)中的問題。
2、本發(fā)明實施例的第一方面,
3、提供基于邊緣計算的私域直播內(nèi)容分發(fā)與訪客互動方法,包括:
4、接收直播內(nèi)容分發(fā)請求,生成邊緣計算節(jié)點的分層部署策略,所述分層部署策略包括用于全局資源調(diào)度的核心層節(jié)點、用于內(nèi)容分發(fā)優(yōu)化的區(qū)域?qū)庸?jié)點和用于用戶交互的接入層節(jié)點;基于所述分層部署策略建立分布式協(xié)同網(wǎng)絡(luò),將節(jié)點部署和資源配置指令下發(fā)至相應(yīng)的邊緣計算節(jié)點;
5、所述區(qū)域?qū)庸?jié)點通過分布式協(xié)同網(wǎng)絡(luò)采集邊緣計算節(jié)點的負(fù)載狀態(tài)信息,采用聯(lián)邦學(xué)習(xí)方法融合邊緣計算節(jié)點的負(fù)載狀態(tài)信息,結(jié)合lstm時序預(yù)測和注意力機制得到直播內(nèi)容的訪問熱度預(yù)測值,構(gòu)建自適應(yīng)內(nèi)容分發(fā)模型;基于所述自適應(yīng)內(nèi)容分發(fā)模型生成內(nèi)容緩存策略,根據(jù)所述內(nèi)容緩存策略確定內(nèi)容在邊緣節(jié)點的分布位置,并生成相應(yīng)的內(nèi)容分發(fā)路由方案;
6、所述接入層節(jié)點基于所述分布式協(xié)同網(wǎng)絡(luò)采集用戶的多模態(tài)交互數(shù)據(jù),所述多模態(tài)交互數(shù)據(jù)包括用戶輸入數(shù)據(jù)、設(shè)備感知數(shù)據(jù)和社交互動數(shù)據(jù);對多模態(tài)交互數(shù)據(jù)進(jìn)行特征提取,通過注意力機制識別交互模式,并融合歷史交互數(shù)據(jù)生成智能交互策略,所述智能交互策略包括個性化推薦策略和實時互動方案,將所述智能交互策略下發(fā)至相應(yīng)的邊緣計算節(jié)點。
7、在一種可選的實施方式中,
8、接收直播內(nèi)容分發(fā)請求,生成邊緣計算節(jié)點的分層部署策略,所述分層部署策略包括用于全局資源調(diào)度的核心層節(jié)點、用于內(nèi)容分發(fā)優(yōu)化的區(qū)域?qū)庸?jié)點和用于用戶交互的接入層節(jié)點;基于所述分層部署策略建立分布式協(xié)同網(wǎng)絡(luò),將節(jié)點部署和資源配置指令下發(fā)至相應(yīng)的邊緣計算節(jié)點的步驟包括:
9、接收直播內(nèi)容分發(fā)請求,所述直播內(nèi)容分發(fā)請求包括主播標(biāo)識、直播類型和預(yù)期觀眾規(guī)模信息;根據(jù)地理位置、網(wǎng)絡(luò)拓?fù)浜陀嬎阗Y源采用層次聚類算法生成分層部署策略;
10、基于所述分層部署策略,采用兩階段提交協(xié)議建立分布式協(xié)同網(wǎng)絡(luò),包括:在準(zhǔn)備階段向所有層節(jié)點發(fā)送包含節(jié)點布署和資源配置的預(yù)部署消息,在提交階段接收所有層節(jié)點的確認(rèn)信息后下發(fā)部署指令;
11、基于所述部署指令配置各層節(jié)點功能,包括:所述核心層節(jié)點基于動態(tài)規(guī)劃算法建立資源分配的約束優(yōu)化模型,將優(yōu)化后的資源分配結(jié)果下發(fā)至區(qū)域?qū)庸?jié)點;所述區(qū)域?qū)庸?jié)點基于優(yōu)化后的資源分配結(jié)果采用最小生成樹算法構(gòu)建邊緣內(nèi)容分發(fā)樹,所述邊緣內(nèi)容分發(fā)樹的邊權(quán)重由網(wǎng)絡(luò)帶寬、時延和抖動加權(quán)計算得到;所述接入層節(jié)點基于一致性哈希算法和虛擬節(jié)點機制實現(xiàn)用戶請求的負(fù)載均衡分配。
12、在一種可選的實施方式中,
13、所述核心層節(jié)點基于動態(tài)規(guī)劃算法建立資源分配的約束優(yōu)化模型,將優(yōu)化后的資源分配結(jié)果下發(fā)至區(qū)域?qū)庸?jié)點;所述區(qū)域?qū)庸?jié)點基于優(yōu)化后的資源分配結(jié)果采用最小生成樹算法構(gòu)建邊緣內(nèi)容分發(fā)樹,所述邊緣內(nèi)容分發(fā)樹的邊權(quán)重由網(wǎng)絡(luò)帶寬、時延和抖動加權(quán)計算得到;所述接入層節(jié)點基于一致性哈希算法和虛擬節(jié)點機制實現(xiàn)用戶請求的負(fù)載均衡分配的步驟包括:
14、基于動態(tài)規(guī)劃算法和拉格朗日乘子法構(gòu)建核心層節(jié)點的資源分配約束優(yōu)化模型,所述資源分配約束優(yōu)化模型包含計算資源、存儲資源和帶寬資源的分配參數(shù),通過求解資源分配約束條件下的極值方程得到得到優(yōu)化后的資源分配方案,將所述優(yōu)化后的資源分配方案下發(fā)至區(qū)域?qū)庸?jié)點;
15、所述區(qū)域?qū)庸?jié)點基于所述優(yōu)化后的資源分配方案構(gòu)建邊緣內(nèi)容分發(fā)樹,采用最小生成樹算法建立邊緣內(nèi)容分發(fā)網(wǎng)絡(luò)拓?fù)?,所述邊緣?nèi)容分發(fā)樹的邊權(quán)重由帶寬、時延和抖動值經(jīng)自適應(yīng)加權(quán)計算得到,自適應(yīng)加權(quán)的權(quán)重系數(shù)通過在線學(xué)習(xí)方法基于分發(fā)性能度量函數(shù)進(jìn)行動態(tài)調(diào)整,將所述邊緣內(nèi)容分發(fā)樹的拓?fù)浣Y(jié)構(gòu)信息下發(fā)至接入層節(jié)點;
16、所述接入層節(jié)點基于所述拓?fù)浣Y(jié)構(gòu)信息,采用一致性哈希算法和動態(tài)虛擬節(jié)點調(diào)整機制實現(xiàn)用戶請求的負(fù)載均衡分配,所述動態(tài)虛擬節(jié)點調(diào)整機制根據(jù)節(jié)點實際負(fù)載因子自適應(yīng)調(diào)整虛擬節(jié)點數(shù)量,通過動態(tài)調(diào)整虛擬節(jié)點分布調(diào)整用戶請求在各節(jié)點間的分配比例;
17、建立多層級反饋調(diào)節(jié)機制,所述接入層節(jié)點周期性采集負(fù)載狀態(tài)信息并反饋至區(qū)域?qū)庸?jié)點用于調(diào)整邊緣內(nèi)容分發(fā)樹,所述區(qū)域?qū)庸?jié)點采集內(nèi)容分發(fā)效率指標(biāo)并反饋至核心層節(jié)點用于優(yōu)化資源分配方案。
18、在一種可選的實施方式中,
19、所述區(qū)域?qū)庸?jié)點通過分布式協(xié)同網(wǎng)絡(luò)采集邊緣計算節(jié)點的負(fù)載狀態(tài)信息,采用聯(lián)邦學(xué)習(xí)方法融合邊緣計算節(jié)點的負(fù)載狀態(tài)信息,結(jié)合lstm時序預(yù)測和注意力機制得到直播內(nèi)容的訪問熱度預(yù)測值,構(gòu)建自適應(yīng)內(nèi)容分發(fā)模型的步驟包括:
20、所述負(fù)載狀態(tài)信息包括計算負(fù)載信息、存儲容量信息和網(wǎng)絡(luò)帶寬信息;
21、在每個邊緣計算節(jié)點的本地維護(hù)負(fù)載特征提取模型,所述負(fù)載特征提取模型的輸入為該節(jié)點在預(yù)設(shè)時間窗口內(nèi)的狀態(tài)序列,輸出為該節(jié)點的負(fù)載特征向量;將所述負(fù)載特征向量輸入預(yù)測器得到預(yù)測負(fù)載值,基于所述預(yù)測負(fù)載值與實際負(fù)載的均方誤差以及當(dāng)前特征與歷史特征的余弦相似度構(gòu)建融合損失函數(shù);各邊緣計算節(jié)點基于所述融合損失函數(shù)獨立訓(xùn)練本地的負(fù)載特征提取模型,并定期將負(fù)載特征提取模型參數(shù)上傳至協(xié)調(diào)節(jié)點;所述協(xié)調(diào)節(jié)點根據(jù)邊緣計算節(jié)點的計算能力和數(shù)據(jù)質(zhì)量確定權(quán)重,對接收的負(fù)載特征提取模型參數(shù)進(jìn)行加權(quán)聚合后分發(fā)至各邊緣計算節(jié)點;
22、將所述負(fù)載特征向量與歷史訪問記錄拼接構(gòu)建輸入序列,采用雙向長短期記憶網(wǎng)絡(luò)提取時序特征;引入注意力機制計算不同時間步的重要性權(quán)重,并基于所述重要性權(quán)重對時序特征進(jìn)行加權(quán)求和得到上下文向量;通過全連接層對所述上下文向量進(jìn)行處理得到訪問熱度預(yù)測值;
23、基于邊緣計算節(jié)點的負(fù)載特征向量和訪問熱度預(yù)測值,采用多目標(biāo)優(yōu)化方法將負(fù)載均衡目標(biāo)、訪問延遲目標(biāo)和帶寬成本目標(biāo)進(jìn)行加權(quán)組合構(gòu)建綜合目標(biāo)函數(shù);其中所述負(fù)載均衡目標(biāo)用于最小化節(jié)點負(fù)載與容量比值的最大值,所述訪問延遲目標(biāo)用于最小化用戶訪問節(jié)點的延遲總和,所述帶寬成本目標(biāo)用于最小化節(jié)點間內(nèi)容傳輸?shù)膸挸杀究偤停煌ㄟ^求解所述綜合目標(biāo)函數(shù)得到自適應(yīng)內(nèi)容分發(fā)模型。
24、在一種可選的實施方式中,
25、基于所述自適應(yīng)內(nèi)容分發(fā)模型生成內(nèi)容緩存策略,根據(jù)所述內(nèi)容緩存策略確定內(nèi)容在邊緣節(jié)點的分布位置,并生成相應(yīng)的內(nèi)容分發(fā)路由方案的步驟包括:
26、基于自適應(yīng)內(nèi)容分發(fā)模型生成內(nèi)容緩存策略,所述內(nèi)容緩存策略通過計算內(nèi)容與邊緣計算節(jié)點的匹配度確定,所述匹配度基于邊緣計算節(jié)點的負(fù)載特征向量、處理容量以及訪問熱度預(yù)測值進(jìn)行計算,當(dāng)所述匹配度超過預(yù)設(shè)閾值時將相應(yīng)內(nèi)容分配至對應(yīng)的邊緣計算節(jié)點進(jìn)行緩存;
27、根據(jù)所述內(nèi)容緩存策略構(gòu)建內(nèi)容節(jié)點分配矩陣;基于所述內(nèi)容節(jié)點分配矩陣確定內(nèi)容在邊緣計算節(jié)點的分布位置,對每個內(nèi)容執(zhí)行單一分配約束,對每個邊緣計算節(jié)點執(zhí)行容量約束;
28、基于內(nèi)容在邊緣計算節(jié)點的分布位置構(gòu)建可達(dá)性圖,所述可達(dá)性圖包括邊緣計算節(jié)點集合和節(jié)點間連接關(guān)系;針對用戶內(nèi)容訪問請求,從所述內(nèi)容節(jié)點分配矩陣中確定緩存有訪問請求內(nèi)容的源節(jié)點集合,以及用戶可直接訪問的邊緣計算節(jié)點,計算所述用戶可直接訪問的邊緣計算節(jié)點到所述源節(jié)點集合中各節(jié)點的路徑代價,所述路徑代價基于路徑跳數(shù)和路徑上節(jié)點的平均負(fù)載率進(jìn)行計算;選擇具有最小路徑代價的路徑作為內(nèi)容分發(fā)路由方案。
29、在一種可選的實施方式中,
30、所述接入層節(jié)點基于所述分布式協(xié)同網(wǎng)絡(luò)采集用戶的多模態(tài)交互數(shù)據(jù),所述多模態(tài)交互數(shù)據(jù)包括用戶輸入數(shù)據(jù)、設(shè)備感知數(shù)據(jù)和社交互動數(shù)據(jù);對多模態(tài)交互數(shù)據(jù)進(jìn)行特征提取,通過注意力機制識別交互模式,并融合歷史交互數(shù)據(jù)生成智能交互策略,所述智能交互策略包括個性化推薦策略和實時互動方案,將所述智能交互策略下發(fā)至相應(yīng)的邊緣計算節(jié)點的步驟包括:
31、基于雙向長短時記憶網(wǎng)絡(luò)對所述用戶輸入數(shù)據(jù)進(jìn)行時序特征提取得到用戶輸入特征向量,基于壓縮卷積網(wǎng)絡(luò)對所述設(shè)備感知數(shù)據(jù)進(jìn)行空間特征提取得到設(shè)備感知特征向量,基于圖注意力網(wǎng)絡(luò)對所述社交互動數(shù)據(jù)進(jìn)行交互特征提取得到社交互動特征向量;
32、將用戶輸入特征向量、設(shè)備感知特征向量和社交互動特征向量拼接形成多模態(tài)特征,通過多頭注意力機制計算所述多模態(tài)特征的特征關(guān)聯(lián)度,基于所述特征關(guān)聯(lián)度生成交互模式向量;采用門控更新機制將所述交互模式向量與歷史交互序列進(jìn)行融合得到融合交互狀態(tài);
33、基于所述融合交互狀態(tài)構(gòu)建雙分支策略網(wǎng)絡(luò),所述雙分支策略網(wǎng)絡(luò)的第一分支用于生成個性化推薦策略,所述雙分支策略網(wǎng)絡(luò)的第二分支用于生成實時互動方案,將所述個性化推薦策略和所述實時互動方案進(jìn)行策略組合得到智能交互策略。
34、在一種可選的實施方式中,
35、基于所述融合交互狀態(tài)構(gòu)建雙分支策略網(wǎng)絡(luò),所述雙分支策略網(wǎng)絡(luò)的第一分支用于生成個性化推薦策略,所述雙分支策略網(wǎng)絡(luò)的第二分支用于生成實時互動方案,將所述個性化推薦策略和所述實時互動方案進(jìn)行策略組合得到智能交互策略的步驟包括:
36、采用多層感知機構(gòu)建共享編碼層,將融合交互狀態(tài)輸入所述共享編碼層得到編碼特征,所述編碼特征用于雙分支策略網(wǎng)絡(luò)的兩個并行分支;
37、所述雙分支策略網(wǎng)絡(luò)的第一分支采用actor-critic架構(gòu)生成個性化推薦策略;其中,actor網(wǎng)絡(luò)包括多層策略神經(jīng)網(wǎng)絡(luò),基于所述編碼特征生成actor隱層狀態(tài),通過softmax激活函數(shù)輸出推薦動作概率分布作為初步個性化推薦策略;critic網(wǎng)絡(luò)包括多層價值神經(jīng)網(wǎng)絡(luò),基于所述編碼特征生成critic隱層狀態(tài)并輸出狀態(tài)價值估計,采用時序差分學(xué)習(xí)方法計算時序差分誤差,基于所述時序差分誤差分別更新actor網(wǎng)絡(luò)參數(shù)和critic網(wǎng)絡(luò)參數(shù),引入熵正則化項構(gòu)建actor網(wǎng)絡(luò)損失函數(shù)優(yōu)化所述初步個性化推薦策略得到最終的個性化推薦策略;
38、所述雙分支策略網(wǎng)絡(luò)的第二分支采用條件變分自編碼器生成實時互動方案,包括將所述編碼特征輸入編碼器得到均值向量和方差向量作為隱變量分布參數(shù),基于所述隱變量分布參數(shù)通過重參數(shù)化方法采樣隱變量,將所述隱變量與所述編碼特征拼接后依次通過解碼多層感知機和門控循環(huán)單元進(jìn)行時序建模,所述門控循環(huán)單元的隱層狀態(tài)輸入生成器網(wǎng)絡(luò)得到互動指令形成實時互動方案;
39、構(gòu)建策略組合模塊,所述策略組合模塊包括:互信息計算單元,用于計算個性化推薦策略與實時互動方案之間的互信息;聯(lián)合優(yōu)化單元,用于將所述互信息作為正則項構(gòu)建聯(lián)合優(yōu)化目標(biāo);策略融合單元,用于基于所述聯(lián)合優(yōu)化目標(biāo)計算交互策略權(quán)重系數(shù),對所述個性化推薦策略和所述實時互動方案進(jìn)行加權(quán)組合,生成智能交互策略。
40、本發(fā)明實施例的第二方面,
41、提供基于邊緣計算的私域直播內(nèi)容分發(fā)與訪客互動系統(tǒng),包括:
42、第一單元,用于接收直播內(nèi)容分發(fā)請求,生成邊緣計算節(jié)點的分層部署策略,所述分層部署策略包括用于全局資源調(diào)度的核心層節(jié)點、用于內(nèi)容分發(fā)優(yōu)化的區(qū)域?qū)庸?jié)點和用于用戶交互的接入層節(jié)點;基于所述分層部署策略建立分布式協(xié)同網(wǎng)絡(luò),將節(jié)點部署和資源配置指令下發(fā)至相應(yīng)的邊緣計算節(jié)點;
43、第二單元,用于所述區(qū)域?qū)庸?jié)點通過分布式協(xié)同網(wǎng)絡(luò)采集邊緣計算節(jié)點的負(fù)載狀態(tài)信息,采用聯(lián)邦學(xué)習(xí)方法融合邊緣計算節(jié)點的負(fù)載狀態(tài)信息,結(jié)合lstm時序預(yù)測和注意力機制得到直播內(nèi)容的訪問熱度預(yù)測值,構(gòu)建自適應(yīng)內(nèi)容分發(fā)模型;基于所述自適應(yīng)內(nèi)容分發(fā)模型生成內(nèi)容緩存策略,根據(jù)所述內(nèi)容緩存策略確定內(nèi)容在邊緣節(jié)點的分布位置,并生成相應(yīng)的內(nèi)容分發(fā)路由方案;
44、第三單元,用于所述接入層節(jié)點基于所述分布式協(xié)同網(wǎng)絡(luò)采集用戶的多模態(tài)交互數(shù)據(jù),所述多模態(tài)交互數(shù)據(jù)包括用戶輸入數(shù)據(jù)、設(shè)備感知數(shù)據(jù)和社交互動數(shù)據(jù);對多模態(tài)交互數(shù)據(jù)進(jìn)行特征提取,通過注意力機制識別交互模式,并融合歷史交互數(shù)據(jù)生成智能交互策略,所述智能交互策略包括個性化推薦策略和實時互動方案,將所述智能交互策略下發(fā)至相應(yīng)的邊緣計算節(jié)點。
45、本發(fā)明實施例的第三方面,
46、提供一種電子設(shè)備,包括:
47、處理器;
48、用于存儲處理器可執(zhí)行指令的存儲器;
49、其中,所述處理器被配置為調(diào)用所述存儲器存儲的指令,以執(zhí)行前述所述的方法。
50、本發(fā)明實施例的第四方面,
51、提供一種計算機可讀存儲介質(zhì),其上存儲有計算機程序指令,所述計算機程序指令被處理器執(zhí)行時實現(xiàn)前述所述的方法。
52、本發(fā)明能夠提升直播內(nèi)容分發(fā)效率:通過分層部署邊緣計算節(jié)點和自適應(yīng)內(nèi)容分發(fā)模型,可以根據(jù)直播內(nèi)容的訪問熱度預(yù)測值進(jìn)行精準(zhǔn)的內(nèi)容緩存和分發(fā),減少網(wǎng)絡(luò)延遲,提高用戶訪問速度和體驗質(zhì)量。
53、本發(fā)明能夠增強用戶互動體驗:利用多模態(tài)交互數(shù)據(jù)和注意力機制,可以識別用戶的交互模式,并結(jié)合歷史數(shù)據(jù)生成個性化推薦策略和實時互動方案,增強用戶參與感和互動體驗。
54、本發(fā)明能夠優(yōu)化資源利用:基于聯(lián)邦學(xué)習(xí)方法融合邊緣計算節(jié)點的負(fù)載狀態(tài)信息,可以實現(xiàn)全局資源的動態(tài)調(diào)度和優(yōu)化,提高資源利用率,降低運營成本。