1.一種基于注意力引導(dǎo)的屏幕內(nèi)容視頻質(zhì)量評(píng)價(jià)方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的基于注意力引導(dǎo)的屏幕內(nèi)容視頻質(zhì)量評(píng)價(jià)方法,其特征在于,每個(gè)關(guān)鍵幀輸入所述初始多尺度紋理表示計(jì)算模塊,先進(jìn)行通道分割并提取得到每個(gè)關(guān)鍵幀的初始多尺度紋理表示,每個(gè)關(guān)鍵幀經(jīng)過所述顯著性計(jì)算模塊計(jì)算得到每個(gè)關(guān)鍵幀的顯著性圖,具體包括:
3.根據(jù)權(quán)利要求1所述的基于注意力引導(dǎo)的屏幕內(nèi)容視頻質(zhì)量評(píng)價(jià)方法,其特征在于,所述第一預(yù)訓(xùn)練網(wǎng)絡(luò)和第二預(yù)訓(xùn)練網(wǎng)絡(luò)均包括多個(gè)并行設(shè)置的不同卷積核大小的卷積層以及分別與每個(gè)卷積層連接的全局平均池化層和全局標(biāo)準(zhǔn)差池化層,在所述屏幕內(nèi)容視頻質(zhì)量評(píng)價(jià)模型的訓(xùn)練過程中,所述第一預(yù)訓(xùn)練網(wǎng)絡(luò)和第二預(yù)訓(xùn)練網(wǎng)絡(luò)的參數(shù)凍結(jié)。
4.根據(jù)權(quán)利要求3所述的基于注意力引導(dǎo)的屏幕內(nèi)容視頻質(zhì)量評(píng)價(jià)方法,其特征在于,根據(jù)每個(gè)關(guān)鍵幀的初始多尺度紋理表示和顯著性圖得到每個(gè)關(guān)鍵幀的多尺度紋理表示,每個(gè)關(guān)鍵幀的多尺度紋理表示輸入到所述第一預(yù)訓(xùn)練網(wǎng)絡(luò),提取得到每個(gè)關(guān)鍵幀的紋理特征,具體包括:
5.根據(jù)權(quán)利要求3所述的基于注意力引導(dǎo)的屏幕內(nèi)容視頻質(zhì)量評(píng)價(jià)方法,其特征在于,每個(gè)關(guān)鍵幀輸入語義特征提取單元,先進(jìn)行劃分裁剪,得到若干個(gè)圖像塊,并重構(gòu)得到重構(gòu)關(guān)鍵幀,分別將每個(gè)圖像塊和重構(gòu)關(guān)鍵幀輸入到所述第二預(yù)訓(xùn)練網(wǎng)絡(luò),得到每個(gè)圖像塊的語義特征和重構(gòu)關(guān)鍵幀的語義特征,將所有圖像塊的語義特征和重構(gòu)關(guān)鍵幀的語義特征輸入到所述第二融合模塊,得到每個(gè)關(guān)鍵幀的語義特征,具體包括:
6.根據(jù)權(quán)利要求1所述的基于注意力引導(dǎo)的屏幕內(nèi)容視頻質(zhì)量評(píng)價(jià)方法,其特征在于,將每個(gè)關(guān)鍵幀的紋理特征和語義特征輸入所述第一融合模塊,得到空間特征,所述空間特征經(jīng)過所述空間質(zhì)量聚合模塊,得到空域質(zhì)量分?jǐn)?shù);所述每個(gè)碎片化視頻輸入所述時(shí)域質(zhì)量評(píng)價(jià)分支,得到時(shí)域質(zhì)量分?jǐn)?shù);根據(jù)所述空域質(zhì)量分?jǐn)?shù)和時(shí)域質(zhì)量分?jǐn)?shù)計(jì)算得到屏幕內(nèi)容視頻的質(zhì)量分?jǐn)?shù),具體包括:
7.一種基于注意力引導(dǎo)的屏幕內(nèi)容視頻質(zhì)量評(píng)價(jià)裝置,其特征在于,包括:
8.一種電子設(shè)備,包括:
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-6中任一所述的方法。
10.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-6中任一所述的方法。