一種基于智能手機(jī)傳感器的物體識(shí)別方法
【專利摘要】本發(fā)明公開了一種基于智能手機(jī)傳感器的物體識(shí)別方法,該發(fā)明充分利用了智能手機(jī)豐富的傳感器參數(shù),其中包括GPS定位,攝像頭,攝像頭參數(shù)等,提出了基于地理空間位置的概率FOV模型以及相關(guān)的剪枝策略和基于視覺(jué)空間的相似度度量方法。通過(guò)多模態(tài)結(jié)合的方式,本發(fā)明的方法能夠正確的識(shí)別出用戶查詢的物體。
【專利說(shuō)明】一種基于智能手機(jī)傳感器的物體識(shí)別方法【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及空間數(shù)據(jù)索引,圖像識(shí)別和檢索以及信號(hào)處理領(lǐng)域中的稀疏編碼,尤其涉及一種基于智能手機(jī)傳感器的物體識(shí)別方法。
【背景技術(shù)】
[0002]空間數(shù)據(jù)是指用來(lái)表示空間實(shí)體的位置、形狀、大小及分布特征諸多方面信息的數(shù)據(jù),目前空間數(shù)據(jù)主要應(yīng)用于地理信息系統(tǒng)(GIS)領(lǐng)域。在空間數(shù)據(jù)的使用中,需要大量的查詢、插入、刪除等空間運(yùn)算操作,因此高效的空間數(shù)據(jù)索引顯得至關(guān)重要。R樹是目前應(yīng)用最為廣泛的一種空間索引結(jié)構(gòu),R樹是B樹在多維空間的擴(kuò)展,是一種平衡的樹結(jié)構(gòu)。R樹結(jié)構(gòu)采用平行于數(shù)據(jù)空間軸的最小的邊界矩形來(lái)近似復(fù)雜的空間對(duì)象,其主要優(yōu)點(diǎn)是用一定數(shù)量的字節(jié)來(lái)表示一個(gè)復(fù)雜的對(duì)象。盡管這樣會(huì)丟失很多的信息,但是空間物體的最小邊界矩形保留了物體的最重要的幾何特性,即空間物體的位置和其在整個(gè)坐標(biāo)軸上的范圍。
[0003]在圖像識(shí)別和檢索領(lǐng)域,視覺(jué)單詞(Bag-of-visual-words)是一種最常用也是效果比較出色的方法。該方法受文本檢索領(lǐng)域中詞袋(Bag-of-words)模型啟發(fā),在離線階段將大量圖片的局部特征點(diǎn)聚類,這些聚類中心即為視覺(jué)單詞。對(duì)于新的圖片,只需要將檢測(cè)出來(lái)的局部特征投影到這些事先得到的視覺(jué)單詞上面去,就把一副圖像表示成為一個(gè)視覺(jué)單詞的特征向量,向量的維度就是視覺(jué)單詞的大小,每個(gè)維度上的值的含義是在該圖像中,這個(gè)視覺(jué)單詞出現(xiàn)的頻率。一旦將圖像向量化,那么向量模型中的相似度計(jì)算(如余弦距離)就能夠適用了。通過(guò)使用k-近鄰分類器或者支持向量機(jī)對(duì)已有的訓(xùn)練樣本學(xué)習(xí),就能夠識(shí)別出新來(lái)的圖像類別。
`[0004]稀疏編碼最早起源于神經(jīng)科學(xué),神經(jīng)生理學(xué)家在視覺(jué)系統(tǒng)上展開了全面深入的研究,并且取得了一些有重要意義的研究成果.這就使得在工程上利用計(jì)算機(jī)來(lái)模擬視覺(jué)系統(tǒng)成為可能?;谶@一認(rèn)識(shí),利用已有的生物學(xué)科研成果,聯(lián)系信號(hào)處理、計(jì)算理論以及信息論知識(shí),通過(guò)對(duì)視覺(jué)系統(tǒng)進(jìn)行計(jì)算機(jī)建模,使計(jì)算機(jī)能在一定程度上模擬人的視覺(jué)系統(tǒng),以解決人工智能在圖像處理領(lǐng)域中碰到的難題。稀疏編碼的基本假設(shè)是有一系列的基向量(basis vector),那么對(duì)于任意的輸入信號(hào)(向量),都能夠?qū)⑵浔硎境蔀檫@些基向量的線性組合,其中,這些線性組合的系數(shù)只有少數(shù)項(xiàng)是非零的,這些系數(shù)即為“稀疏的編碼”。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的在于針對(duì)現(xiàn)有技術(shù)的不足,提供一種基于智能手機(jī)傳感器的物體識(shí)別方法。
[0006]本發(fā)明解決其技術(shù)問(wèn)題采用的技術(shù)方案如下:一種基于智能手機(jī)傳感器的物體識(shí)別方法,其特征在于,該方法的步驟如下:
[0007](I)用戶在智能手機(jī)上提交一個(gè)物體查詢需求,包括GPS坐標(biāo),相機(jī)FOV參數(shù),攝像頭捕捉到的圖片信息;[0008](2)通過(guò)GPS坐標(biāo)發(fā)起一個(gè)空間索引R樹查詢,獲得空間近鄰的圖片集合;
[0009](3)在上述圖片集合中集合GPS坐標(biāo)和相機(jī)FOV參數(shù)建立概率FOV模型,該模型考慮到了 GPS定位和相機(jī)參數(shù)的不確定性,可以估計(jì)出某個(gè)物體被相機(jī)捕捉到的概率;所述概率FOV模型為;
【權(quán)利要求】
1.一種基于智能手機(jī)傳感器的物體識(shí)別方法,其特征在于,該方法的步驟如下: (1)用戶在智能手機(jī)上提交一個(gè)物體查詢需求,包括GPS坐標(biāo),相機(jī)FOV參數(shù),攝像頭捕捉到的圖片信息。 (2)通過(guò)GPS坐標(biāo)發(fā)起一個(gè)空間索引R樹查詢,獲得空間近鄰的圖片集合; (3)在上述圖片集合中集合GPS坐標(biāo)和相機(jī)FOV參數(shù)建立概率FOV模型,該模型考慮到了 GPS定位和相機(jī)參數(shù)的不確定性,可以估計(jì)出某個(gè)物體被相機(jī)捕捉到的概率;所述概率FOV模型為。
【文檔編號(hào)】G06F17/30GK103678610SQ201310690339
【公開日】2014年3月26日 申請(qǐng)日期:2013年12月16日 優(yōu)先權(quán)日:2013年12月16日
【發(fā)明者】壽黎但, 陳珂, 陳剛, 胡天磊, 彭湃 申請(qǐng)人:浙江大學(xué)