本發(fā)明涉及圖像識別領域,更具體地涉及一種行人檢測的方法及裝置。
背景技術:
行人檢測是通用物體檢測的子問題,吸引了學術界和工業(yè)界的大量興趣。首先,行人檢測可以應用于安防、自動(輔助)駕駛、智能監(jiān)控和人機交互等多個領域,是一項基本且重要的技術。
現(xiàn)有的行人檢測無法解決遮擋、人體重疊等問題。遮擋,指由于存在障礙物導致目標只有部分可見,常見的遮擋后果是人體只有上(下)半身或左(右)半身可見。人體重疊,指兩人及以上在圖片中的位置關系發(fā)生重合,常見的人體重疊多見于人群較為密集的場景。
遮擋及重疊是行人檢測中最棘手的兩個問題。部分不可見會降低傳統(tǒng)行人檢測方法的檢出率;重疊對技術的要求則更高,因為對于重疊的人,神經(jīng)網(wǎng)絡更傾向于將兩人(甚至多人)檢測為同一個人,即不能將重疊的目標劃分開來。同時,現(xiàn)有的行人檢測技術通常需要在后期處理中運用“非最大抑制”的方法?!胺亲畲笠种啤笔菫榱颂幚砩窠?jīng)網(wǎng)絡對同一個人報出兩次(或多次)檢測,因此需對多個空間位置接近的檢測結果進行合并。在重疊的情況下,非最大抑制還會導致對不同目標的檢測結果被誤合并。
技術實現(xiàn)要素:
考慮到上述問題而提出了本發(fā)明。本發(fā)明提供了一種行人檢測的方法,能夠在基于待檢測圖片中的行人信息,得到行人檢測的結果,從而能夠提高行人檢測的精度。
根據(jù)本發(fā)明的第一方面,提供了一種行人檢測的方法,包括:
接收待檢測圖片;
采用神經(jīng)網(wǎng)絡,確定所述待檢測圖片中的行人信息,所述行人信息包括行人的位置以及所述行人的關鍵點位置;
對所述待檢測圖片中的所述行人信息進行后處理,得到所述行人檢測的結果。
示例性地,所述行人的關鍵點位置包括以下中的至少一項:頭部位置、左肩位置、右肩位置、左膝位置、右膝位置、左腳位置、右腳位置。
示例性地,所述對所述待檢測圖片中的所述行人信息進行后處理,得到所述行人檢測的結果,包括:
對所述待檢測圖片中的所述行人信息進行過濾,得到所述行人信息中的高概率行人信息;
對所述高概率行人信息進行處理,得到所述行人檢測的結果,
其中,所述高概率行人信息為概率值大于或等于概率閾值的行人信息,所述概率閾值為預設概率值。
示例性地,所述對所述高概率行人信息進行處理,得到所述行人檢測的結果,包括:根據(jù)所述高概率行人信息中的所述行人的關鍵點位置,得到所述行人檢測的結果。
示例性地,所述根據(jù)所述高概率行人信息中的所述行人的關鍵點位置,得到所述行人檢測的結果,包括:根據(jù)所述高概率行人信息中的相鄰的兩個所述行人信息中所述關鍵點的空間位置與距離確定所述相鄰的兩個所述行人信息是否屬于同一行人,以得到所述行人檢測的結果。
示例性地,所述根據(jù)所述高概率行人信息中的所述行人的關鍵點位置,得到所述行人檢測的結果,包括:根據(jù)所述高概率行人信息中的相鄰的兩個所述行人信息中所述關鍵點的空間位置與距離確定所述相鄰的兩個所述行人信息是否屬于同一行人,若所述相鄰的兩個所述行人信息屬于同一行人,則利用非最大抑制方法,對所述相鄰的兩個所述行人信息進行合并操作,得到所述行人檢測的結果。
示例性地,在所述方法之前,還包括:基于至少一張訓練圖像,通過訓練得到所述神經(jīng)網(wǎng)絡;其中,所述訓練圖像中標注有行人信息。
根據(jù)本發(fā)明的第二方面,提供了一種行人檢測的裝置,包括:
接收模塊,用于接收待檢測圖片;
確定模塊,用于采用神經(jīng)網(wǎng)絡,確定所述待檢測圖片中的行人信息,所述行人信息包括行人的位置以及所述行人的關鍵點位置;
后處理模塊,用于對所述待檢測圖片中的所述行人信息進行后處理,得到所述行人檢測的結果。
示例性地,所述行人的關鍵點位置包括以下中的至少一項:頭部位置、左肩位置、右肩位置、左膝位置、右膝位置、左腳位置、右腳位置。
示例性地,所述后處理模塊,包括:
過濾子模塊,用于對所述待檢測圖片中的所述行人信息進行過濾,得到所述行人信息中的高概率行人信息;
處理子模塊,用于對所述高概率行人信息進行處理,得到所述行人檢測的結果,
其中,所述高概率行人信息為概率值大于或等于概率閾值的行人信息,所述概率閾值為預設概率值。
示例性地,所述處理子模塊,用于:根據(jù)所述高概率行人信息中的所述行人的關鍵點位置,得到所述行人檢測的結果。
示例性地,所述處理子模塊,用于:根據(jù)所述高概率行人信息中的相鄰的兩個所述行人信息中所述關鍵點的空間位置與距離確定所述相鄰的兩個所述行人信息是否屬于同一行人,以得到所述行人檢測的結果。
示例性地,所述處理子模塊,用于:根據(jù)所述高概率行人信息中的相鄰的兩個所述行人信息中所述關鍵點的空間位置與距離確定所述相鄰的兩個所述行人信息是否屬于同一行人,若所述相鄰的兩個所述行人信息屬于同一行人,則利用非最大抑制方法,對所述相鄰的兩個所述行人信息進行合并操作,得到所述行人檢測的結果。
示例性地,還包括訓練模塊,用于:基于至少一張訓練圖像,通過訓練得到所述神經(jīng)網(wǎng)絡;其中,所述訓練圖像中標注有行人信息。
第二方面所述的該裝置能夠用于實現(xiàn)前述第一方面的行人檢測的方法。
根據(jù)本發(fā)明的第三方面,提供了一種計算機芯片,該計算機芯片包括處理器和存儲器。所述存儲器存儲有指令代碼,所述處理器用于執(zhí)行所述指令代碼,且當所述處理器執(zhí)行指令代碼時,能夠?qū)崿F(xiàn)前述第一方面所述的行人檢測的方法。
由此可見,本發(fā)明實施例對于待檢測圖片,可以采用神經(jīng)網(wǎng)絡,得到行人位置和行人的關鍵點信息,這樣通過引入行人的關鍵點信息,解決了傳統(tǒng)行人檢測方法中難以解決的遮擋和重疊問題,提升了檢測的精確度。
附圖說明
通過結合附圖對本發(fā)明實施例進行更詳細的描述,本發(fā)明的上述以及其它目的、特征和優(yōu)勢將變得更加明顯。附圖用來提供對本發(fā)明實施例的進一步理解,并且構成說明書的一部分,與本發(fā)明實施例一起用于解釋本發(fā)明,并不構成對本發(fā)明的限制。在附圖中,相同的參考標號通常代表相同部件或步驟。
圖1是本發(fā)明實施例的電子設備的一個示意性框圖;
圖2是本發(fā)明實施例的行人檢測的方法的一個示意性流程圖;
圖3是本發(fā)明實施例的行人檢測的裝置的一個示意性框圖;
圖4是本發(fā)明實施例的行人檢測的裝置的另一個示意性框圖。
具體實施方式
為了使得本發(fā)明的目的、技術方案和優(yōu)點更為明顯,下面將參照附圖詳細描述根據(jù)本發(fā)明的示例實施例。顯然,所描述的實施例僅僅是本發(fā)明的一部分實施例,而不是本發(fā)明的全部實施例,應理解,本發(fā)明不受這里描述的示例實施例的限制?;诒景l(fā)明中描述的本發(fā)明實施例,本領域技術人員在沒有付出創(chuàng)造性勞動的情況下所得到的所有其它實施例都應落入本發(fā)明的保護范圍之內(nèi)。
本發(fā)明實施例可以應用于電子設備,圖1所示為本發(fā)明實施例的電子設備的一個示意性框圖。圖1所示的電子設備10包括一個或多個處理器102、一個或多個存儲裝置104、輸入裝置106、輸出裝置108、圖像傳感器110以及一個或多個非圖像傳感器114,這些組件通過總線系統(tǒng)112和/或其它形式互連。應當注意,圖1所示的電子設備10的組件和結構只是示例性的,而非限制性的,根據(jù)需要,所述電子設備也可以具有其他組件和結構。
所述處理器102可以包括CPU 1021和GPU 1022或者具有數(shù)據(jù)處理能力和/或指令執(zhí)行能力的其它形式的處理單元,例如現(xiàn)場可編程門陣列(Field-Programmable Gate Array,F(xiàn)PGA)或進階精簡指令集機器(Advanced RISC(Reduced Instruction Set Computer)Machine,ARM)等,并且處理器102可以控制所述電子設備10中的其它組件以執(zhí)行期望的功能。
所述存儲裝置104可以包括一個或多個計算機程序產(chǎn)品,所述計算機程序產(chǎn)品可以包括各種形式的計算機可讀存儲介質(zhì),例如易失性存儲器1041和/或非易失性存儲器1042。所述易失性存儲器1041例如可以包括隨機存取存儲器(Random Access Memory,RAM)和/或高速緩沖存儲器(cache)等。所述非易失性存儲器1042例如可以包括只讀存儲器(Read-Only Memory,ROM)、硬盤、閃存等。在所述計算機可讀存儲介質(zhì)上可以存儲一個或多個計算機程序指令,處理器102可以運行所述程序指令,以實現(xiàn)各種期望的功能。在所述計算機可讀存儲介質(zhì)中還可以存儲各種應用程序和各種數(shù)據(jù),例如所述應用程序使用和/或產(chǎn)生的各種數(shù)據(jù)等。
所述輸入裝置106可以是用戶用來輸入指令的裝置,并且可以包括鍵盤、鼠標、麥克風和觸摸屏等中的一個或多個。
所述輸出裝置108可以向外部(例如用戶)輸出各種信息(例如圖像或聲音),并且可以包括顯示器、揚聲器等中的一個或多個。
所述圖像傳感器110可以拍攝用戶期望的圖像(例如照片、視頻等),并且將所拍攝的圖像存儲在所述存儲裝置104中以供其它組件使用。
當注意,圖1所示的電子設備10的組件和結構只是示例性的,盡管圖1示出的電子設備10包括多個不同的裝置,但是根據(jù)需要,其中的一些裝置可以不是必須的,其中的一些裝置的數(shù)量可以更多等等,本發(fā)明對此不限定。
圖2是本發(fā)明實施例的行人檢測的方法的一個示意性流程圖。圖2所示的方法包括:
S101,接收待檢測圖片。
作為一例,該待檢測圖片可以是實時采集的圖片,具體地可以是由圖像采集裝置實時采集的圖片。例如可以是由攝像頭采集的視頻中的一幀圖像或多幀圖像,或者,可以是由照相機拍攝到的一張圖片。作為另一例,該待檢測圖片可以是從特定的源獲取的,例如可以從存儲器中獲取先前采集并存儲的圖片。本發(fā)明對此不限定。
S102,采用神經(jīng)網(wǎng)絡,確定所述待檢測圖片中的行人信息,所述行人信息包括行人的位置以及所述行人的關鍵點位置。
示例性地,行人的關鍵點位置包括以下中的至少一項:頭部位置、兩肩位置、兩膝位置、兩腳位置。
示例性地,所述行人的關鍵點位置包括以下中的至少一項:頭部位置、左肩位置、右肩位置、左膝位置、右膝位置、左腳位置、右腳位置。
具體地,在S102中,可以將待檢測圖片輸入到神經(jīng)網(wǎng)絡中,經(jīng)由該神經(jīng)網(wǎng)絡得到行人信息。
與傳統(tǒng)的神經(jīng)網(wǎng)絡不同,本發(fā)明實施例中的神經(jīng)網(wǎng)絡不僅能夠得到行人位置,并且能夠得到行人的關鍵點位置。另外,S102所得到的行人信息中,不僅包括該待檢測圖片的身體各個部位顯示完整的行人的行人信息,還包括身體部分區(qū)域被遮擋的行人的行人信息。
舉例來說,如果該待檢測圖片中包括行人A,由于被遮擋,該行人A只有部分身體可見。那么在S102中,基于該神經(jīng)網(wǎng)絡,可以根據(jù)行人A可見的身體部分推測其他的身體部分。例如,如果行人A的頭部、左肩、左腿可見,那么基于該神經(jīng)網(wǎng)絡不僅可以直接得到該行人A的頭部位置、左肩位置、左膝位置和左腳位置,并且能夠推測出該行人A的右肩位置、右膝位置和右腳位置。從而得到了行人A的關鍵點信息:頭部位置、兩肩位置、兩膝位置和兩腳位置。
作為一例,可以基于所得到的行人的關鍵點信息確定該行人所在的矩形區(qū)域,作為行人位置。作為另一例,可以采用神經(jīng)網(wǎng)絡提取該待檢測圖片的特征張量,并基于該特征張量確定行人所在的矩形區(qū)域,作為行人位置。本發(fā)明對此不限定。
由此可見,本實施例中,基于神經(jīng)網(wǎng)絡,能夠得到被遮擋的行人的行人信息,從而能夠避免信息丟失,保證處理的精度。
S103,對所述待檢測圖片中的所述行人信息進行后處理,得到所述行人檢測的結果。
可選地,行人信息可以包括低概率行人信息和高概率行人信息。通過神經(jīng)網(wǎng)絡對接收到的圖像進行識別,獲取圖像中的行人信息,對獲取到的行人信息進行概率算法運算,獲得行人信息的概率值,將獲得的行人信息的概率值與概率閾值進行比對,若行人信息的概率值大于或等于概率閾值,則判斷為高概率行人信息;若行人信息的概率值小于概率閾值,則判斷為低概率行人信息。其中,概率閾值可以為預先設定的概率值,可依據(jù)使用場景進行設定。
示例性地,S103可以包括:對所述待檢測圖片中的所述行人信息進行過濾,得到所述行人信息中的所述高概率行人信息;對所述高概率行人信息進行處理,得到所述行人檢測的結果。其中,所述高概率行人信息為概率值大于或等于概率閾值的行人信息。
也就是說,可以過濾掉行人信息中的低概率行人信息,只包括高概率行人信息;并進一步基于高概率行人信息得到行人檢測的結果。
示例性地,所述對所述過濾之后的所述行人信息進行處理,得到所述行人檢測的結果,包括:根據(jù)所述高概率行人信息中的相鄰的兩個所述行人信息中所述關鍵點的空間位置與距離確定所述相鄰的兩個所述行人信息是否屬于同一行人,以得到所述行人檢測的結果。
也就是說,可以利用高概率行人信息中的關鍵點位置進行判斷處理,從而得到行人檢測的結果。其中,關鍵點信息包括但不限于目標頭部距離,目標肩部重合度等??蛇x地,可在上述處理過程中輔助實施非最大抑制(Non-Maximum Suppression,NMS),根據(jù)所述高概率行人信息中的相鄰的兩個所述行人信息中所述關鍵點的空間位置與距離確定所述相鄰的兩個所述行人信息是否屬于同一行人,若所述相鄰的兩個所述行人信息屬于同一行人,則利用非最大抑制方法,對所述相鄰的兩個所述行人信息進行合并操作,得到所述行人檢測的結果,從而進一步提升檢測結果的精度。
利用高概率行人信息中的關鍵點位置進行判斷處理得到行人檢測的結果,可采用如下方式之一進行。
方式一:基于人體部位特征對高概率行人信息中的關鍵點進行分類,例如,將行人信息關鍵點中屬于行人頭部的關鍵點分類識別為頭部關鍵點,將屬于行人左肩的關鍵點分類識別為左肩關鍵點;分析相鄰的同屬于一類的關鍵點之間的空間位置與距離,以區(qū)分遮擋和/或重疊的行人,例如,相鄰兩個頭部關鍵點之間的距離大于預設值,則判斷這兩個頭部關鍵點屬于兩個人,相鄰的兩個左肩關鍵點之間的距離小于預設值,則判斷這兩個左肩關鍵點屬于一個人。由于一個行人擁有多個關鍵點,通過判斷每一個關鍵點與相鄰的同類關鍵點之間的空間位置與距離,避免了傳統(tǒng)行人檢測僅檢測行人整體產(chǎn)生的遮擋和重疊問題,提升了檢測的精度;
方式二:基于人體部位特征對高概率行人信息中的關鍵點進行分類,例如,將行人信息關鍵點中屬于行人頭部的關鍵點分類識別為頭部關鍵點,將屬于行人左肩的關鍵點分類識別為左肩關鍵點;分析相鄰行人信息中的關鍵點之間的空間位置與距離,以區(qū)分遮擋和/或重疊的行人,例如,相鄰的行人信息為行人信息A和行人信息B,判斷行人信息A中的左肩關鍵點與行人信息B中的頭部關鍵點和/或右肩關鍵點和/或左膝關鍵點和/或左腳關鍵點等關鍵點之間的空間位置與距離,當行人信息A中的左肩關鍵點與行人信息B中的頭部關鍵點和/或右肩關鍵點、和/或左膝關鍵點、和/或左腳關鍵點等關鍵點之間的空間位置與距離符合預設條件時,則判斷行人信息A和行人信息B屬于同一行人,其中,預設條件包括預設距離和/或預設相對位置等。
由此可見,在S103的后處理過程中,可以綜合神經(jīng)網(wǎng)絡檢測或推測的所有行人信息,移除低置信度的行人信息而保留高置信度的行人信息,這樣能夠保證該處理過程的精度。
示例性地,本發(fā)明實施例中所采用的神經(jīng)網(wǎng)絡可以是在圖2所述的方法之前,通過訓練的方法所得到的。
具體地,在圖2所示的方法之前,可以包括:基于至少一張訓練圖像,通過訓練得到所述神經(jīng)網(wǎng)絡。其中,所述訓練圖像中標注有行人信息。所述行人信息包括行人的位置以及所述行人的關鍵點位置。
可選地,在圖2所示的方法之前,可以包括:獲取至少一張訓練圖像;對所述訓練圖像進行標注;基于所述標注的訓練圖像,通過訓練得到所述神經(jīng)網(wǎng)絡。
其中,對所述訓練圖像進行標注包括:對每一張訓練圖像中的每一個行人樣本,標注該行人樣本的位置,并標注該行人樣本的頭部位置、兩肩位置、兩膝位置和兩腳位置。其中,如果行人樣本的某個或某幾個部位被遮擋時,對該某個或某幾個部位標記為遮擋??梢?,標注信息不僅包括行人位置、頭部位置、兩肩位置、兩膝位置和兩腳位置,還包括是否被遮擋的信息。示例性的,將行人B的關鍵點信息在圖片中進行標注,假設圖片中行人B的頭部位置、左肩位置、左膝位置和左腳位置未被遮擋,右肩位置、右膝位置和右腳位置被其他行人或物體遮擋,則可在行人B的頭部位置、左肩位置、左膝位置和左腳位置分別標記為“頭部”、“左肩”、“左膝”、“左腳”;在被遮擋的行人B的右肩位置、右膝位置和右腳位置分別標記為“右肩(遮擋)”、“右膝(遮擋)”、“右腳(遮擋)”,或在被遮擋的行人B的右肩位置、右膝位置和右腳位置統(tǒng)一標記為“遮擋”。
進一步地,所訓練的神經(jīng)網(wǎng)絡不僅要學會如何檢測或推測行人位置(即行人整體的位置),還應學會如何檢測或推測每個行人的關鍵點位置。
由此可見,本發(fā)明實施例對于待檢測圖片,可以采用神經(jīng)網(wǎng)絡,得到行人位置和行人的關鍵點信息,通過引入行人的關鍵點信息,解決了傳統(tǒng)行人檢測方法中難以解決的遮擋和重疊問題,提升了檢測的精確度。另外,可理解,行人的關鍵點信息還可以用于人體姿態(tài)分析等其他的領域,本發(fā)明對此不限定。
圖3是本發(fā)明實施例的行人檢測的裝置的一個示意性框圖。圖3所示的裝置30包括:接收模塊301、確定模塊302和后處理模塊303。
接收模塊301,用于接收待檢測圖片;
確定模塊302,用于采用神經(jīng)網(wǎng)絡,確定接收模塊301接收的所述待檢測圖片中的行人信息,所述行人信息包括行人的位置以及所述行人的關鍵點位置;
后處理模塊303,用于對確定模塊302確定的所述待檢測圖片中的所述行人信息進行后處理,得到所述行人檢測的結果。
示例性地,所述行人的關鍵點位置包括以下中的至少一項:頭部位置、左肩位置、右肩位置、左膝位置、右膝位置、左腳位置、右腳位置。
示例性地,后處理模塊303,包括過濾子模塊和處理子模塊。
過濾子模塊可以用于對所述待檢測圖片中的所述行人信息進行過濾,得到所述行人信息中的高概率行人信息。處理子模塊可以用于對所述高概率行人信息進行處理,得到所述行人檢測的結果。其中,所述高概率行人信息為概率值大于或等于概率閾值的行人信息,所述概率閾值為預設概率值。
示例性地,所述處理子模塊可以用于:根據(jù)所述高概率行人信息中的所述行人的關鍵點位置,得到所述行人檢測的結果。
示例性地,所述處理子模塊可以具體用于:根據(jù)所述高概率行人信息中的相鄰的兩個所述行人信息中所述關鍵點的空間位置與距離確定所述相鄰的兩個所述行人信息是否屬于同一行人,以得到所述行人檢測的結果。
示例性地,所述處理子模塊可以具體用于:根據(jù)所述高概率行人信息中的相鄰的兩個所述行人信息中所述關鍵點的空間位置與距離確定所述相鄰的兩個所述行人信息是否屬于同一行人,若所述相鄰的兩個所述行人信息屬于同一行人,則利用非最大抑制方法,對所述相鄰的兩個所述行人信息進行合并操作,得到所述行人檢測的結果。
處理子模塊利用高概率行人信息中的關鍵點位置進行判斷處理得到行人檢測的結果,可采用如下方式之一進行。
方式一:處理子模塊基于人體部位特征對高概率行人信息中的關鍵點進行分類,例如,將行人信息關鍵點中屬于行人頭部的關鍵點分類識別為頭部關鍵點,將屬于行人左肩的關鍵點分類識別為左肩關鍵點;分析相鄰的同屬于一類的關鍵點之間的空間位置與距離,以區(qū)分遮擋和/或重疊的行人,例如,相鄰兩個頭部關鍵點之間的距離大于預設值,則判斷這兩個頭部關鍵點屬于兩個人,相鄰的兩個左肩關鍵點之間的距離小于預設值,則判斷這兩個左肩關鍵點屬于一個人。由于一個行人擁有多個關鍵點,通過判斷每一個關鍵點與相鄰的同類關鍵點之間的空間位置與距離,避免了傳統(tǒng)行人檢測僅檢測行人整體產(chǎn)生的遮擋和重疊問題,提升了檢測的精度;
方式二:處理子模塊基于人體部位特征對高概率行人信息中的關鍵點進行分類,例如,將行人信息關鍵點中屬于行人頭部的關鍵點分類識別為頭部關鍵點,將屬于行人左肩的關鍵點分類識別為左肩關鍵點;分析相鄰行人信息中的關鍵點之間的空間位置與距離,以區(qū)分遮擋和/或重疊的行人,例如,相鄰的行人信息為行人信息A和行人信息B,判斷行人信息A中的左肩關鍵點與行人信息B中的頭部關鍵點和/或右肩關鍵點和/或左膝關鍵點和/或左腳關鍵點等關鍵點之間的空間位置與距離,當行人信息A中的左肩關鍵點與行人信息B中的頭部關鍵點和/或右肩關鍵點和/或左膝關鍵點和/或左腳關鍵點等關鍵點之間的空間位置與距離符合預設條件時,則判斷行人信息A和行人信息B屬于同一行人,其中,預設條件包括預設距離和/或預設相對位置等。
由此可見,處理子模塊可以綜合神經(jīng)網(wǎng)絡檢測或推測的所有行人信息,移除低置信度的行人信息而保留高置信度的行人信息,這樣能夠保證該處理過程的精度。
示例性地,如圖4所示,裝置30還包括訓練模塊304。訓練模塊304可以用于:基于至少一張訓練圖像,通過訓練得到所述神經(jīng)網(wǎng)絡。其中,所述訓練圖像中標注有行人信息。所標注的行人信息可以包括行人的位置以及所述行人的關鍵點位置。
圖3或圖4所示的裝置30能夠用于實現(xiàn)前述圖2所示的行人檢測的方法。
另外,本發(fā)明實施例還提供了另一種行人檢測的裝置,該裝置可以包括處理器和存儲器,其中,存儲器用于存儲指令代碼,處理器執(zhí)行該指令代碼時,可以實現(xiàn)前述圖2所示的行人檢測的方法。
另外,本發(fā)明實施例還提供了另一種行人檢測的裝置,該裝置可以包括處理器,其中,處理器能夠同時實現(xiàn)圖3中確定模塊302和后處理模塊303的功能,從而實現(xiàn)前述圖2所示的行人檢測的方法。
另外,本發(fā)明實施例還提供了一種電子設備,該電子設備可以包括圖3或圖4所示的裝置30。該電子設備可以實現(xiàn)前述圖2所示的行人檢測的方法。
由此可見,本發(fā)明實施例對于待檢測圖片,可以采用神經(jīng)網(wǎng)絡,得到行人位置和行人的關鍵點信息,通過引入行人的關鍵點信息,解決了傳統(tǒng)行人檢測方法中難以解決的遮擋和重疊問題,提升了檢測的精確度。也就是說本發(fā)明實施例的方法在行人檢測過程中能夠保證高精度和準確度。另外,可理解,行人的關鍵點信息還可以用于人體姿態(tài)分析等其他的領域,本發(fā)明對此不限定。
盡管這里已經(jīng)參考附圖描述了示例實施例,應理解上述示例實施例僅僅是示例性的,并且不意圖將本發(fā)明的范圍限制于此。本領域普通技術人員可以在其中進行各種改變和修改,而不偏離本發(fā)明的范圍和精神。所有這些改變和修改意在被包括在所附權利要求所要求的本發(fā)明的范圍之內(nèi)。
本領域普通技術人員可以意識到,結合本文中所公開的實施例描述的各示例的單元及算法步驟,能夠以電子硬件、或者計算機軟件和電子硬件的結合來實現(xiàn)。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術方案的特定應用和設計約束條件。專業(yè)技術人員可以對每個特定的應用來使用不同方法來實現(xiàn)所描述的功能,但是這種實現(xiàn)不應認為超出本發(fā)明的范圍。
在本申請所提供的幾個實施例中,應該理解到,所揭露的設備和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述的設備實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結合或者可以集成到另一個設備,或一些特征可以忽略,或不執(zhí)行。
在此處所提供的說明書中,說明了大量具體細節(jié)。然而,能夠理解,本發(fā)明的實施例可以在沒有這些具體細節(jié)的情況下實踐。在一些實例中,并未詳細示出公知的方法、結構和技術,以便不模糊對本說明書的理解。
類似地,應當理解,為了精簡本發(fā)明并幫助理解各個發(fā)明方面中的一個或多個,在對本發(fā)明的示例性實施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實施例、圖、或者對其的描述中。然而,并不應將該本發(fā)明的方法解釋成反映如下意圖:即所要求保護的本發(fā)明要求比在每個權利要求中所明確記載的特征更多的特征。更確切地說,如相應的權利要求書所反映的那樣,其發(fā)明點在于可以用少于某個公開的單個實施例的所有特征的特征來解決相應的技術問題。因此,遵循具體實施方式的權利要求書由此明確地并入該具體實施方式,其中每個權利要求本身都作為本發(fā)明的單獨實施例。
本領域的技術人員可以理解,除了特征之間相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設備的所有過程或單元進行組合。除非另外明確陳述,本說明書(包括伴隨的權利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。
此外,本領域的技術人員能夠理解,盡管在此所述的一些實施例包括其它實施例中所包括的某些特征而不是其它特征,但是不同實施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實施例。例如,在權利要求書中,所要求保護的實施例的任意之一都可以以任意的組合方式來使用。
本發(fā)明的各個部件實施例可以以硬件實現(xiàn),或者以在一個或者多個處理器上運行的軟件模塊實現(xiàn),或者以它們的組合實現(xiàn)。本領域的技術人員應當理解,可以在實踐中使用微處理器或者數(shù)字信號處理器(DSP)來實現(xiàn)根據(jù)本發(fā)明實施例的物品分析設備中的一些模塊的一些或者全部功能。本發(fā)明還可以實現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的裝置程序(例如,計算機程序和計算機程序產(chǎn)品)。這樣的實現(xiàn)本發(fā)明的程序可以存儲在計算機可讀介質(zhì)上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。
應該注意的是上述實施例對本發(fā)明進行說明而不是對本發(fā)明進行限制,并且本領域技術人員在不脫離所附權利要求的范圍的情況下可設計出替換實施例。在權利要求中,不應將位于括號之間的任何參考符號構造成對權利要求的限制。單詞“包含”不排除存在未列在權利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當編程的計算機來實現(xiàn)。在列舉了若干裝置的單元權利要求中,這些裝置中的若干個可以是通過同一個硬件項來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
以上所述,僅為本發(fā)明的具體實施方式或?qū)唧w實施方式的說明,本發(fā)明的保護范圍并不局限于此,任何熟悉本技術領域的技術人員在本發(fā)明揭露的技術范圍內(nèi),可輕易想到變化或替換,都應涵蓋在本發(fā)明的保護范圍之內(nèi)。本發(fā)明的保護范圍應以權利要求的保護范圍為準。