本發(fā)明屬于圖像生成,尤其涉及一種計算機視頻圖像生成方法及系統(tǒng)。
背景技術(shù):
1、圖像生成技術(shù)是計算機視覺和人工智能的重要分支,旨在從無到有地創(chuàng)造圖像或從已有圖像生成新的變體。目前基于插幀技術(shù)的圖像生成是為了提升視頻的視覺質(zhì)量和流暢度。通過在原有視頻幀之間生成新的中間幀,插幀技術(shù)能夠顯著提高幀率,從而使低幀率的視頻轉(zhuǎn)換為更高幀率,展現(xiàn)更加流暢的畫面效果。這一點在快速運動的場景中尤為重要,因為它有助于減少運動模糊感,改善觀眾的觀看體驗。此外,插幀技術(shù)能夠有效減少因幀率不足而導致的運動偽影,使得動態(tài)場景中的物體運動更加自然,從而提升視覺效果。
2、陰影的生成依賴于光源的方向、強度和遮擋物的形狀,然而,許多現(xiàn)有技術(shù)在生成插入幀時未能充分考慮這些動態(tài)因素。例如,在室內(nèi)場景中,窗外光線的角度和強度會隨著時間而改變,如果插幀時沒有準確調(diào)整光照,可能導致室內(nèi)物體與周圍幀的光照強度不匹配,使得這些物體在插入幀中顯得過于陰暗或亮眼,從而破壞了場景的真實感。
3、且在動態(tài)表演場景中,光照條件往往隨著畫面的動作而變化,例如燈光的移動或強度的調(diào)整。如果未能在插幀過程中同步更新這些光照變化,可能會出現(xiàn)插入幀中的陰影和光亮與前后幀不一致的情況,造成畫面物體的陰影在不同幀間不穩(wěn)定或跳動。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提供一種計算機視頻圖像生成方法,旨在解決背景技術(shù)中確定的現(xiàn)有技術(shù)存在的技術(shù)問題。
2、本發(fā)明是這樣實現(xiàn)的,一種計算機視頻圖像生成方法,所述方法包括:
3、從視頻中提取所有幀,確定需要插幀的相鄰幀,以相鄰幀作為提取中心,提取相鄰幀兩側(cè)的視頻幀;
4、通過計算每個像素的rgb值,分析亮度和色彩分布,識別光源邊緣,識別場景中的光源位置和強度:
5、依據(jù)光源位置,考慮環(huán)境光、漫反射和鏡面反射因素,構(gòu)建光照模型,對每個物體計算光照強度,分析不同物體受到的光照影響;
6、分析相鄰幀之間的光照變化,識別出陰影區(qū)域,并與非陰影區(qū)域進行比對,識別可用陰影區(qū)域,基于光源位置,計算每個物體的陰影形狀和位置,根據(jù)每個物體的高度和光源角度,設定每個物體所對應的陰影長度和形狀,生成插入幀的陰影信息;
7、追蹤各個物體在相鄰幀之間的運動軌跡,并取物體在相鄰幀之間的中間位置作為相應物體在插入幀中的位置作為物體的平滑運動軌跡,并依據(jù)相鄰幀的光照狀態(tài),對插入幀的陰影信息進行調(diào)整,獲取插入幀最終圖像。
8、作為本發(fā)明更進一步的方案,所述確定需要插幀的相鄰幀,以相鄰幀作為提取中心,提取相鄰幀兩側(cè)的視頻幀,具體包括:
9、讀取視頻文件,并設定提取頻率從視頻中提取幀,并以數(shù)組的形式進行存儲;
10、對數(shù)組中的視頻幀進行分析,識別出存在的物體,并結(jié)合若干相鄰幀,判斷若干相鄰幀中的物體運動在時間上是否為連貫的,若兩個相鄰幀之間存在間斷性物體變化,則將這兩個相鄰幀定義為需要插幀的相鄰幀;
11、設定提取時長,對需要插幀的相鄰幀進行二次提取,以需要插幀的相鄰幀為時間中心,向兩側(cè)延伸相同的提取時長,提取該時長所覆蓋的全部視頻幀,并作為提取組進行存儲。
12、作為本發(fā)明更進一步的方案,所述分析亮度和色彩分布,識別光源邊緣,識別場景中的光源位置和強度,具體包括:
13、對提取組中的視頻幀進行分析,遍歷每個視頻幀中圖像的每個像素,提取rgb值,并轉(zhuǎn)換為亮度值;
14、;
15、其中表示該像素的紅色通道值,表示該像素的綠色通道值,表示該像素的藍色通道值;
16、根據(jù)提取的rgb值生成色彩直方圖,統(tǒng)計每種顏色的像素數(shù)量;
17、依據(jù)邊緣檢測算法識別圖像中的邊緣,設定強度變化閾值,提取邊緣信息,識別強度變化超過閾值的區(qū)域,定義為潛在光源位置;
18、在潛在光源位置中識別亮度值最高的點,作為光源位置,并計算光源位置周圍像素的亮度值的平均值作為光源強度;
19、基于光源強度和光源位置分布,判斷光源類型。
20、作為本發(fā)明更進一步的方案,所述構(gòu)建光照模型,對每個物體計算光照強度,分析不同物體受到的光照影響,具體包括:
21、建立光照模型,依據(jù)光源強度設定環(huán)境光強度值,用于模擬場景中的散射光,計算環(huán)境光對每個物體表面的影響;
22、對于相鄰物體之間,考慮遮擋和光照的相互影響,評估陰影和光照效果的變化,并當物體相對于光源位置和方向有所變化時,對光照向量的方向和強度進行調(diào)整;
23、將計算得到的光照模型參數(shù)和光照強度信息輸出到數(shù)據(jù)結(jié)構(gòu)中并存儲。
24、作為本發(fā)明更進一步的方案,所述計算環(huán)境光對每個物體表面的影響,具體的:
25、計算從光源到物體表面的光照向量,獲取物體表面的法線向量,計算漫反射光照強度:
26、;
27、其中,為漫反射光強度,為光源強度,為法線向量,,為光照向量;
28、其中,;
29、計算視頻畫面采集點位置與物體表面點之間的視角向量,通過光照向量和法線向量,計算反射向量:
30、;
31、計算鏡面反射強度:
32、;
33、其中,為鏡面反射系數(shù),取0.5,為視角向量;
34、計算全局環(huán)境光強度:
35、。
36、作為本發(fā)明更進一步的方案,所述生成插入幀的陰影信息,具體包括:
37、根據(jù)相鄰幀的亮度分布,自動設定用于區(qū)分陰影區(qū)域和非陰影區(qū)域的亮度閾值,遍歷當前幀的亮度矩陣,識別出所有低于亮度閾值的像素區(qū)域,并標記為潛在陰影區(qū)域;
38、對潛在陰影區(qū)域進行連通性分析,合并相鄰的潛在陰影區(qū)域,形成連續(xù)陰影區(qū)域;
39、根據(jù)光源位置和光源類型判斷結(jié)果,結(jié)合物體的高度、光源的高度和方向?qū)﹃幱伴L度進行計算:
40、;
41、其中,表示陰影長度,表示物體的高度,表示光線角度;
42、根據(jù)光源的方向和距離,生成插入幀中每個物體的陰影形狀,并細化陰影輪廓;
43、根據(jù)光源強度、距離以及環(huán)境光強度值,對陰影透明度和陰影亮度進行調(diào)整,獲取最終陰影信息。
44、作為本發(fā)明更進一步的方案,所述追蹤各個物體在相鄰幀之間的運動軌跡,并取物體在相鄰幀之間的中間位置作為相應物體在插入幀中的位置作為物體的平滑運動軌跡,并依據(jù)相鄰幀的光照狀態(tài),對插入幀的陰影信息進行調(diào)整,獲取插入幀最終圖像,具體包括:
45、利用識別出存在的物體,提取出插入幀需要追蹤的物體列表;
46、對于每個物體,計算物體在插入幀兩側(cè)的相鄰幀之間的位置差,得到物體運動向量:
47、;
48、其中,為物體的運動向量,表示物體在插入幀后一幀中的中心位置,表示物體在插入幀前一幀中的中心位置;
49、根據(jù)物體在相鄰幀中的位置,計算其在插入幀中的中間位置:
50、;
51、其中,為物體在插入幀中的中間位置;
52、提取相鄰幀的光照狀態(tài),對最終陰影信息進行核驗和調(diào)整;
53、將所有物體在插入幀中的中間位置、光照狀態(tài)和陰影信息合成到一幅圖像中,生成最終插入幀圖像。
54、本發(fā)明的另一目的在于提供一種計算機視頻圖像生成系統(tǒng),所述系統(tǒng)包括:
55、幀提取與分析模塊,用于從視頻中提取所有幀,確定需要插幀的相鄰幀,以相鄰幀作為提取中心,提取相鄰幀兩側(cè)的視頻幀;
56、光源識別與分析模塊,用于通過計算每個像素的rgb值,分析亮度和色彩分布,識別光源邊緣,識別場景中的光源位置和強度:
57、光照模型構(gòu)建模塊,用于依據(jù)光源位置,考慮環(huán)境光、漫反射和鏡面反射因素,構(gòu)建光照模型,對每個物體計算光照強度,分析不同物體受到的光照影響;
58、陰影識別與計算模塊,用于分析相鄰幀之間的光照變化,識別出陰影區(qū)域,并與非陰影區(qū)域進行比對,識別可用陰影區(qū)域,基于光源位置,計算每個物體的陰影形狀和位置,根據(jù)每個物體的高度和光源角度,設定每個物體所對應的陰影長度和形狀,生成插入幀的陰影信息;
59、物體追蹤與插幀生成模塊,用于追蹤各個物體在相鄰幀之間的運動軌跡,并取物體在相鄰幀之間的中間位置作為相應物體在插入幀中的位置作為物體的平滑運動軌跡,并依據(jù)相鄰幀的光照狀態(tài),對插入幀的陰影信息進行調(diào)整,獲取插入幀最終圖像。
60、作為本發(fā)明更進一步的方案,所述幀提取與分析模塊包括:
61、視頻讀取單元,用于讀取視頻文件,并設定提取頻率從視頻中提取幀,并以數(shù)組的形式進行存儲;
62、物體運動連貫性判斷單元,用于對數(shù)組中的視頻幀進行分析,識別出存在的物體,并結(jié)合若干相鄰幀,判斷若干相鄰幀中的物體運動在時間上是否為連貫的,若兩個相鄰幀之間存在間斷性物體變化,則將這兩個相鄰幀定義為需要插幀的相鄰幀;
63、二次提取時長設定單元,用于設定提取時長,對需要插幀的相鄰幀進行二次提取,以需要插幀的相鄰幀為時間中心,向兩側(cè)延伸相同的提取時長,提取該時長所覆蓋的全部視頻幀,并作為提取組進行存儲。
64、作為本發(fā)明更進一步的方案,所述光源識別與分析模塊包括:
65、像素rgb值提取單元,用于對提取組中的視頻幀進行分析,遍歷每個視頻幀中圖像的每個像素,提取rgb值,并轉(zhuǎn)換為亮度值;
66、色彩直方圖生成單元,用于根據(jù)提取的rgb值生成色彩直方圖,統(tǒng)計每種顏色的像素數(shù)量;
67、邊緣檢測與強度變化分析單元,用于依據(jù)邊緣檢測算法識別圖像中的邊緣,設定強度變化閾值,提取邊緣信息,識別強度變化超過閾值的區(qū)域,定義為潛在光源位置;
68、光源位置識別單元,用于在潛在光源位置中識別亮度值最高的點,作為光源位置,并計算光源位置周圍像素的亮度值的平均值作為光源強度;
69、光源類型判斷單元,用于基于光源強度和光源位置分布,判斷光源類型。
70、本發(fā)明的有益效果是:
71、通過系統(tǒng)性地提取視頻幀和識別相鄰幀的物體、背景、光源和陰影區(qū)域,該方法能夠精確捕捉場景中的動態(tài)變化,確保插入幀與原視頻內(nèi)容之間的連貫性。這種全面的幀分析為后續(xù)的光照和陰影處理提供了堅實基礎,使得插入幀能夠更自然地融入整體視頻流。
72、該方法通過細致的光照模型構(gòu)建,考慮環(huán)境光、漫反射和鏡面反射等多個因素,能夠準確地計算每個物體的光照強度。這種精確的光照分析不僅提升了物體的立體感和真實感,還增強了物體之間的相互作用,使得整個場景在視覺上更加統(tǒng)一和協(xié)調(diào)。此外,自動識別和調(diào)整陰影信息的過程,確保了陰影的形狀、位置與強度能夠與光源變化相適應,從而有效消除了物體“漂浮”在背景上的現(xiàn)象。
73、通過追蹤各個物體在相鄰幀之間的運動軌跡,該方法實現(xiàn)了物體在插入幀中的平滑過渡,確保了動態(tài)場景的流暢性和自然性。結(jié)合相鄰幀的光照狀態(tài)對陰影信息進行調(diào)整,進一步提升了插入幀的真實感。這種綜合的光照和陰影處理方式,使得生成的插入幀不僅在視覺上更為和諧,也為觀眾提供了更加愉悅的觀看體驗。