視線追蹤方法及裝置的制造方法
【技術領域】
[0001] 本發(fā)明設及圖像處理技術領域,特別設及一種視線追蹤方法及裝置。
【背景技術】
[0002] 人機交互是一種研究人與機器及其相互作用的技術,通過人機交互技術可W利用 所有可能的信息通道實現人與機器之間的交流。隨著電子技術的快速發(fā)展,人機交互技術 廣泛應用于人與電視機之間的交互中,電視機的功能越來越強大,遙控器的設計越來越復 雜,如果通過操作遙控器實現人機交互,將會使交互時間變長,交互效率降低,因此,基于視 線追蹤的人機交互的方法得到了廣泛關注。視線追蹤是利用機械、電子、光學等各種檢測手 段獲取使用者當前的"注視方向"的技術。
[0003] 相關技術中,基于視線追蹤的人機交互的方法主要是根據卡爾曼化alman)濾波 方法追蹤視線,完成人機交互過程??柭鼮V波方法采用的是遞歸技術,其認為當前時刻的 狀態(tài)只依賴于前一時刻的狀態(tài),不依賴于所有時刻的狀態(tài)。具體的,先對采集到的人臉圖像 進行處理,獲取人眼的潛在區(qū)域,再獲取人眼構造,如虹膜,的特征信息,然后通過卡爾曼濾 波方法根據第k時刻虹膜中屯、所在的區(qū)域和狀態(tài)方程確定第k+1時刻虹膜中屯、所在的預測 區(qū)域,根據觀測方程和第k+1時刻虹膜中屯、所在的預測區(qū)域確定第k+1時刻虹膜中屯、所在 的觀測區(qū)域,再采用第k+1時刻虹膜中屯、所在的觀測區(qū)域修正第k+1時刻虹膜中屯、所在的 預測區(qū)域,得到虹膜中屯、的最優(yōu)估計區(qū)域,最后根據虹膜中屯、的最優(yōu)估計區(qū)域確定人眼的 視線方向,進而確定人眼注視的屏幕落點位置,完成人機交互過程。
[0004] 由于上述過程中,人眼是不斷運動變化的,而用于確定虹膜中屯、所在的預測區(qū)域 的狀態(tài)方程是線性方程,得到的預測區(qū)域的準確率較低,相應的,用于修正預測區(qū)域的觀測 區(qū)域的準確率較低,最終確定人眼注視的屏幕落點位置的精確度較低,且速度較低。
【發(fā)明內容】
[0005] 為了解決人眼注視的屏幕落點位置的精確度較低,且速度較低的問題,本發(fā)明提 供了一種視線追蹤方法及裝置。所述技術方案如下:
[0006] 第一方面,提供了一種視線追蹤方法,所述方法包括:
[0007] 根據目標模型確定待測試虹膜圖像的虹膜中屯、所在的觀測區(qū)域,所述目標模型為 根據目標參數和極限學習機器神經網絡得到的模型,所述目標參數是向所述極限學習機器 神經網絡輸入n個視覺特征參數后得到的參數,所述n個視覺特征參數為預設的n個虹膜 圖像中每個虹膜圖像對應預設參考圖像中同一視覺區(qū)域的視覺特征參數,所述預設參考圖 像劃分為至少兩個面積相等的視覺區(qū)域,所述n為大于1的整數;
[0008] 采用所述觀測區(qū)域修正預測區(qū)域,得到目標區(qū)域,所述預測區(qū)域是通過卡爾曼濾 波方法確定的待測試虹膜圖像的虹膜中屯、所在的區(qū)域;
[0009] 根據所述目標區(qū)域確定人眼注視的屏幕落點位置。
[0010] 可選的,在所述根據目標模型確定待測試虹膜圖像的虹膜中屯、所在的觀測區(qū)域之 前,所述方法還包括:
[0011] 獲取預設的n個虹膜圖像中每個虹膜圖像對應所述預設參考圖像中同一視覺區(qū) 域的視覺特征參數,得到所述n個視覺特征參數;
[0012] 通過向所述極限學習機器神經網絡輸入所述n個視覺特征參數,確定所述極限學 習機器神經網絡的目標參數;
[0013] 根據所述目標參數與所述極限學習機器神經網絡,確定所述目標模型。
[0014] 可選的,所述目標參數為所述極限學習機器神經網絡的輸出權值,
[0015] 所述通過向所述極限學習機器神經網絡輸入所述n個視覺特征參數,確定所述極 限學習機器神經網絡的目標參數,包括:
[0016] 將所述n個視覺特征參數作為所述極限學習機器神經網絡的輸入參數;
[0017] 將所述同一視覺區(qū)域對應的坐標矩陣作為所述極限學習機器神經網絡的輸出參 數;
[0018] 根據所述輸入參數、所述輸出參數、所述極限學習機器神經網絡的輸入權值和闊 值,確定所述極限學習機器神經網絡的輸出權值,所述輸入權值為所述極限學習機器神經 網絡的輸入結點到隱層結點的權值,所述闊值為所述隱層結點的闊值;
[0019] 所述根據所述目標參數與所述極限學習機器神經網絡,確定所述目標模型,包 括:
[0020] 根據所述極限學習機器神經網絡的輸入權值、所述闊值和所述輸出權值確定所述 目標模型。
[0021] 可選的,所述采用所述觀測區(qū)域修正所述預測區(qū)域,得到目標區(qū)域,包括:
[0022] 檢測所述觀測區(qū)域的中屯、與所述預測區(qū)域的中屯、的距離;
[0023] 根據所述距離,確定調整因子的值,所述調整因子的值與所述距離正相關;
[0024] 根據所述觀測區(qū)域,通過調整卡爾曼增益公式來修正所述預測區(qū)域,得到所述目 標區(qū)域,所述卡爾曼增益公式為:
[00巧]
[0026] 其中,所述Kk為當前時刻的濾波增益矩陣,所述Pk,k_i為上一時刻到當前時刻的一 步預測誤差方差矩陣,所述Hk為當前時刻的觀測區(qū)域對應的觀測矩陣,所述為當前時刻 的觀測矩陣的轉置矩陣,所述Rk為當前時刻的過程誤差協方差矩陣,所述rk為當前時刻的 調整因子,所述k為當前時刻,所述k-1為上一時刻。
[0027] 可選的,所述根據目標模型確定待測試虹膜圖像的虹膜中屯、所在的觀測區(qū)域,包 括:
[0028] 采集待測人臉圖像;
[0029] 獲取所述待測人臉圖像對應的虹膜圖像;
[0030] 根據所述待測人臉圖像對應的虹膜圖像獲取目標視覺特征參數;
[0031] 向所述目標模型輸入所述目標視覺特征參數,得到所述目標模型輸出的參數;
[0032] 將所述目標模型輸出的參數作為待測試虹膜圖像的虹膜中屯、所在的觀測區(qū)域。
[0033] 可選的,在所述獲取預設的n個虹膜圖像中每個虹膜圖像對應預設參考圖像中同 一視覺區(qū)域的視覺特征參數,得到所述n個視覺特征參數之前,所述方法還包括:
[0034] 采集n個人臉圖像;
[0035] 獲取每個所述人臉圖像對應的虹膜圖像,得到所述n個虹膜圖像。
[0036] 可選的,所述根據所述目標區(qū)域確定人眼注視的屏幕落點位置,包括:
[0037] 根據所述目標區(qū)域確定目標視線方向;
[0038] 根據所述目標視線方向和預設的坐標系,確定人眼注視的屏幕落點位置,所述坐 標系用于記錄人眼和屏幕落點位置的位置關系。
[0039] 可選的,所述虹膜呈楠圓狀,
[0040] 所述視覺特征參數為虹膜在所述虹膜圖像中的位置坐標、所述虹膜的長軸與水平 方向的夾角、所述虹膜的長軸的長度和所述虹膜的短軸的長度中的任一特征參數。
[0041] 第二方面,提供了一種視線追蹤裝置,所述裝置包括:
[0042] 第一確定單元,用于根據目標模型確定待測試虹膜圖像的虹膜中屯、所在的觀測區(qū) 域,所述目標模型為根據目標參數和極限學習機器神經網絡得到的模型,所述目標參數是 向所述極限學習機器神經網絡輸入n個視覺特征參數后得到的參數,所述n個視覺特征參 數為預設的n個虹膜圖像中每個虹膜圖像對應預設參考圖像中同一視覺區(qū)域的視覺特征 參數,所述預設參考圖像劃分為至少兩個面積相等的視覺區(qū)域,所述n為大于1的整數;
[0043] 處理單元,用于采用所述觀測區(qū)域修正預測區(qū)域,得到目標區(qū)域,所述預測區(qū)域是 通過卡爾曼濾波方法確定的待測試虹膜圖像的虹膜中屯、所在的區(qū)域;
[0044] 第二確定單元,用于根據所述目標區(qū)域確定人眼注視的屏幕落點位置。
[0045] 可選的,所述裝置還包括:
[0046] 第一獲取單元,用于獲取預設的n個虹膜圖像中每個虹膜圖像對應所述預設參考 圖像中同一視覺區(qū)域的視覺特征參數,得到所述n個視覺特征參數;
[0047] 第=確定單元,用于通過向所述極限學習機器神經網絡輸入所述n個視覺特征參 數,確定所述極限學習機器神經網絡的目標參數;
[0048] 第四確定單元,用于根據所述目標參數與所述極限學習機器神經網絡,確定所述 目標模型。
[0049] 可選的,所述目標參數為所述極限學習機器神經網絡的輸出權值,
[0050] 所述第S確定單元,包括:
[0051] 第一處理模塊,用于將所述n個視覺特征參數作為所述極限學習機器神經網絡的 輸入參數;
[0052] 第二處理模塊,用于將所述同一視覺區(qū)域對應的坐標矩陣作為所述極限學習機器 神經網絡的輸出參數;
[0053] 第一確定模塊,用于根據所述輸入參數、所述輸出參數、所述極限學習機器神經網 絡的輸入權值和闊值,確定所述極限學習機器神經網絡的輸出權值,所述輸入權值為所述 極限學習機器神經網絡的輸入結點到隱層結點的權值,所述闊值為所述隱層結點的闊值;
[0054] 所述第四確定單元,包括:
[00巧]第二確定模塊,用于根據所述極限學習機器神經網絡的輸入權值、所述闊值和所 述輸出權值確定所述目標模型。
[0056] 可選的,所述處理單元,包括:
[0057] 檢測模塊,用于檢測所述觀測區(qū)域的中屯、與所述預測區(qū)域的中屯、的距離;
[0058]第S確定模塊,用于根據所述距離,確定調整因子的值,所述調整因子的值與所述 距離正相關;
[0059]修正模塊,用