欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于內(nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎智能機(jī)器人搜索方法

文檔序號(hào):6608677閱讀:264來(lái)源:國(guó)知局

專利名稱::基于內(nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎智能機(jī)器人搜索方法
技術(shù)領(lǐng)域
:基于內(nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎智能機(jī)器人搜索方法屬于圖像內(nèi)容的搜索引擎領(lǐng)域。
背景技術(shù)
:現(xiàn)實(shí)世界中,數(shù)字圖像的數(shù)量正在飛速增長(zhǎng),每天,由各種途徑產(chǎn)生出G級(jí)字節(jié)量的圖像,然而,如果我們不對(duì)它們進(jìn)行有效的組織,就無(wú)法達(dá)到高效率的瀏覽和利用.隨著互聯(lián)網(wǎng)的高速發(fā)展,網(wǎng)上的多媒體信息也急劇增加,因此人們對(duì)多媒體信息的檢索需求也就隨之而來(lái)。傳統(tǒng)的信息檢索主要集中于文字的檢索,在多媒體方面的研究并不是很多?;ヂ?lián)網(wǎng)上的多媒體以圖像為主,圖像的檢索經(jīng)歷了兩個(gè)階段第—階段是以關(guān)鍵字為基礎(chǔ)的檢索,第二階段是以圖像自身的內(nèi)容為基礎(chǔ)的檢索,即基于內(nèi)容的圖像檢索。近年來(lái),各國(guó)研究者紛紛加入該領(lǐng)域的研究,它涉及到圖像處理、機(jī)器視覺(jué)、模式識(shí)別、數(shù)據(jù)庫(kù)技術(shù)以及信息檢索等學(xué)科。圖像檢索技術(shù)已廣泛應(yīng)用于軍事、信息安全、時(shí)裝和藝術(shù)設(shè)計(jì)、媒體、醫(yī)學(xué)、地理信息和遙感系統(tǒng)、教育和培訓(xùn)、家庭娛樂(lè)等領(lǐng)域。關(guān)于網(wǎng)絡(luò)搜索技術(shù)研究仍然是世界各個(gè)大學(xué)、各大公司的研究熱點(diǎn),研究主要集中在個(gè)人隱私、欺詐行為、多媒體搜索和個(gè)性化等方面。目前已有不少應(yīng)用于實(shí)踐環(huán)境的基于內(nèi)容圖像檢索系統(tǒng),如由I朋公司開發(fā)的最早商業(yè)化QBIC系統(tǒng),以及由哥倫比亞大學(xué)研發(fā)的WebSeek系統(tǒng)、麻省理工學(xué)院研發(fā)的Photobook系統(tǒng)、漸江大學(xué)研發(fā)的ffebscopeCBR系統(tǒng)等。以google、baidu、天網(wǎng)等為主的搜索引擎技術(shù)也取得了長(zhǎng)足的發(fā)展,但目前主要集中在基于文本信息處理基礎(chǔ)上的搜索,在圖像內(nèi)容搜索主要是文本搜索技術(shù)與相似形狀搜索技術(shù)相結(jié)合的搜索方式,并且不是太成熟。如何將圖像檢索技術(shù)成功地運(yùn)用到圖像搜索上來(lái),這正是目前研究的一個(gè)熱點(diǎn)。"唐卡",系藏語(yǔ)音譯,意為"巻軸畫",其品種多種多樣,除彩繪唐卡外,還有刺繡、堆秀、緙絲、貼花及珍珠唐卡等;唐卡的題材廣泛,內(nèi)容涉及歷史事件、宗教、人物、風(fēng)土人情、民間傳說(shuō)、神話故事、建筑布局等,堪稱藏族的"百科全書"。唐卡藝術(shù)是千百年來(lái)藏民族在文化、歷史的發(fā)展中積累的重要遺產(chǎn),具有鮮明的藏文化特點(diǎn),濃厚的宗教色彩和獨(dú)特的藝術(shù)風(fēng)格,是雪域髙原的文化瑰寶,傳襲藏傳佛教及其藝術(shù)之博大與精深。特別是經(jīng)典之作更顯珍貴,不僅具有很商觀賞性,而且是藏學(xué)研究領(lǐng)域極為珍貴的形象資料和實(shí)物史料,在國(guó)內(nèi)外都有極髙的學(xué)術(shù)價(jià)值。唐卡在國(guó)外特別是東南亞地區(qū)以及我國(guó)西南、西北久負(fù)盛名,作為藝術(shù)品,越來(lái)越多地受到收藏者青睞。在英國(guó)倫敦克里斯蒂拍賣行香港分行的一次拍賣活動(dòng)中,一幅明代宮廷巨幅唐卡,受到了海內(nèi)外人士的關(guān)注,最終以400多萬(wàn)美元的價(jià)格拍賣成交,創(chuàng)下了亞洲織物類拍賣品價(jià)格的新髙。唐卡這一民族文化遺產(chǎn)作為一種資源對(duì)其收集、挖掘、整理、保護(hù),以電子形式存儲(chǔ)和管理,構(gòu)架和實(shí)現(xiàn)基于內(nèi)容的唐卡圖像智能搜索弓像這一網(wǎng)上特定主題的服務(wù),通過(guò)對(duì)全球唐卡的搜索、分類,以滿足人們對(duì)唐卡藝術(shù)信息的欣賞、保護(hù)、收集、查詢、修復(fù)、共享、商務(wù)、研究和再創(chuàng)造等方面的需要,使珍貴的唐卡藝術(shù)得以發(fā)揚(yáng)光大并煥發(fā)出新的藝術(shù)魅力,將是非常有價(jià)值的工作。基于內(nèi)容的唐卡圖像智能搜索引擎方法與平臺(tái)的研究具有廣闊的應(yīng)用前景,其應(yīng)用將產(chǎn)生一定的社會(huì)和經(jīng)濟(jì)效益。首先,這項(xiàng)工作可以實(shí)現(xiàn)唐卡這一民族文化遺產(chǎn)的虛擬保護(hù)。唐卡是具體的實(shí)物,不可能永久保存;唐卡藝術(shù)是人類智慧的結(jié)晶,很多經(jīng)典之作精美絕倫,留給后人無(wú)限的研究空間,而圖像正是這樣的媒介和載體;隨著社會(huì)的發(fā)展,唐卡藝術(shù)其繪畫技藝得不到延續(xù),唐卡圖像的保存也將促進(jìn)這一繪畫技藝的傳授。第二,實(shí)現(xiàn)文化的交流與共享。隨著世界各民族文化交流日益頻繁,民族文化受到世人的特別關(guān)注。作為唐卡知識(shí)庫(kù)的一個(gè)重要應(yīng)用一一網(wǎng)上基于內(nèi)容和知識(shí)的唐卡圖像搜索引擎,將為世人提供對(duì)唐卡圖像的交流和共享的平臺(tái)。第三,促進(jìn)唐卡的產(chǎn)業(yè)化開發(fā),促進(jìn)民族地區(qū)經(jīng)濟(jì)的繁榮和發(fā)展。西藏、青海、甘肅和四川的一些藏區(qū),是唐卡藝術(shù)的故鄉(xiāng),唐卡這一富有民族特色的藝術(shù)品,受到世界各國(guó)收藏者和愛(ài)好者的關(guān)注。第四,唐卡圖像搜索引擎為使用者提供便利,為管理者創(chuàng)造商機(jī)。隨著搜索經(jīng)濟(jì)的崛起,人們開始越加關(guān)注全球各大搜索引擎的性能、技術(shù)和日流量。從全社會(huì)的角度看,民族文化藝術(shù)得到世界的關(guān)注,唐卡藝術(shù)具有鮮明的藏文化特點(diǎn),因而倍受人們的青睞。本發(fā)明在考慮唐卡圖像內(nèi)容特點(diǎn)的基礎(chǔ)上,根據(jù)唐卡圖像強(qiáng)象似性等特點(diǎn),選擇了適當(dāng)?shù)南嗨菩云ヅ浞椒?,抽取其圖像內(nèi)容的基本的內(nèi)容特征和語(yǔ)義特征,以知識(shí)庫(kù)和圖像庫(kù)為后臺(tái),實(shí)現(xiàn)了基于內(nèi)容的藏文網(wǎng)站唐卡圖像搜索弓l擎智能機(jī)器人搜索方法,解決了藏文網(wǎng)站沒(méi)有圖像內(nèi)容搜索引擎的關(guān)鍵技術(shù),為唐卡圖像內(nèi)容的研究與開發(fā)拓展了思路,對(duì)加速藏區(qū)信息化和國(guó)際化的具有相當(dāng)意義。這是目前其它文獻(xiàn)里面都沒(méi)有的方法。
發(fā)明內(nèi)容基于內(nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎的搜索功能是基于內(nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎的重耍組成部分和必要的環(huán)節(jié)。基于內(nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎智能機(jī)器人是基于內(nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎平臺(tái)關(guān)鍵技術(shù),提供了對(duì)基于內(nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎中的藏文網(wǎng)站中唐卡圖像的智能搜索的支持。能夠很好滿足基于內(nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎的處理需求。本發(fā)明由以下幾個(gè)部分組成唐卡圖像內(nèi)容及語(yǔ)義的確定、唐卡圖像搜索算法的設(shè)計(jì)、唐卡圖像數(shù)據(jù)庫(kù)、知識(shí)庫(kù)的設(shè)計(jì)、唐卡圖像智能機(jī)器人設(shè)計(jì)。1.唐卡圖像內(nèi)容及語(yǔ)義的確定1.1基于圖像內(nèi)容檢索與搜索的概念基于圖像內(nèi)容檢索主要思想是根據(jù)圖像所包含的色彩、紋理、形狀以及對(duì)象的空間關(guān)系等信息,建立圖像的特征矢量作為其索引,檢索方法主要是基于圖像的多維特征進(jìn)行相似査詢。圖像內(nèi)容檢索分為圖像庫(kù)整體圖像檢索和圖像內(nèi)的部分圖像檢索兩種,本課題主要研究圖像庫(kù)整體圖像檢索。與基于圖像內(nèi)容檢索相比較,基于圖像內(nèi)容檢索是基于靜態(tài)數(shù)據(jù)庫(kù)的,圖像內(nèi)容已存在于相對(duì)固定的數(shù)據(jù)庫(kù)中,數(shù)據(jù)變化小。而基于內(nèi)容的藏文網(wǎng)站圖像搜索則是針對(duì)動(dòng)態(tài)的知識(shí)庫(kù)而言的,數(shù)據(jù)庫(kù)中的圖像數(shù)據(jù)隨著知識(shí)庫(kù)的規(guī)則對(duì)引擎的驅(qū)動(dòng)而不停地發(fā)生變化。1.2唐卡圖像內(nèi)容與語(yǔ)義的表示唐卡圖像內(nèi)容在基本的底層視覺(jué)特征包括顏色、紋理、形狀、空間關(guān)系、邊緣、變換系數(shù),像素及其所構(gòu)成的直方圖、n階矩、表達(dá)空間的向量、子區(qū)域等。其相應(yīng)的表示方法有顏色直方圖、顏色一致性矢量、顏色相關(guān)圖、顏色矩等,通過(guò)顏色像素值獲取。在不受約束的圖像中,紋理的外觀由不同于Brodatz集描述,其相應(yīng)的表示方法有極坐標(biāo)圖、矩、高階統(tǒng)計(jì)量、分布特征、拓?fù)浼y理、形態(tài)學(xué)分解描述、不變直方圖等,其獲取的方法有MRSAR模型、Maikov模型、多通道Gabor濾波、小波變換、TWT、PWT等。圖像的形狀是其固有的外形輪廓圖和幾何特征的統(tǒng)稱,用面積、離心率、圓形度、形狀矩、曲率、分形維等全局和局部特征來(lái)表示,通過(guò)計(jì)算相應(yīng)特征值來(lái)獲取。唐卡圖像的語(yǔ)義從3個(gè)層次來(lái)表示第l個(gè)層為特征語(yǔ)義,即利用圖像的顏色、紋理和形狀等低層特征及其組合;第2個(gè)層次為對(duì)象語(yǔ)義,包括目標(biāo)、空間關(guān)系等;第3個(gè)層次為抽象語(yǔ)義,包括場(chǎng)景、情感、行為等。唐卡圖像中顏色的使用所表達(dá)的語(yǔ)義,不同的顏色組合導(dǎo)致諸如和諧、不和諧、平靜和興奮等效果,其顏色情感值為c五=-")〗2+,*-")]2-60+)]2+~?;谡Z(yǔ)義的圖像內(nèi)容表示對(duì)圖像深層的領(lǐng)域知識(shí)的獲取與表達(dá)有著相當(dāng)?shù)膬?yōu)越性,從圖像表義的本身出發(fā),在整體的高度上描述了圖像,這對(duì)提髙圖像搜索的準(zhǔn)確度有著重要的作用。1.3唐卡圖像內(nèi)容與語(yǔ)義的獲取依據(jù)唐卡的各種場(chǎng)景,綜合分析其唐卡深層語(yǔ)義,以唐卡的顏色,形狀以及顏色的分布和灰度分布(包含位置的近遠(yuǎn)、光與影的配置、虛實(shí)與疏密的分布),作為唐卡圖像的感性特征,以唐卡的色彩、造荊和面料確立唐卡的風(fēng)格,從唐卡部件或細(xì)節(jié)(裝飾)確立唐卡的情感?;緮?shù)據(jù)顏色、紋理、形狀、空間關(guān)系、邊緣、變換系數(shù),圖像的文本描述、圖像存儲(chǔ)位置及其它網(wǎng)絡(luò)信息如URL等,用像素(R、G、B或其它空間)及其所構(gòu)成的直方圖、n階矩、表達(dá)空間的2-D向量、子區(qū)域及文本等表達(dá)。語(yǔ)義數(shù)據(jù)目標(biāo)、場(chǎng)景、情感(如賞心悅目、使人振奮、感化熏陶)、行為(如表演、跳舞)、空間關(guān)系等,用一組對(duì)象與基本數(shù)據(jù)表達(dá)。找出唐卡圖像文件夾庫(kù)中的唐卡圖像的語(yǔ)義達(dá)表具體的方式,將唐卡圖像文件夾庫(kù)中的唐卡圖像基本數(shù)據(jù)與語(yǔ)義數(shù)據(jù)輸入到唐卡圖像內(nèi)容數(shù)據(jù)庫(kù)EB中。2.唐卡圖像搜索算法的設(shè)計(jì)2.1唐卡圖像特征藏族唐卡作為文化傳播的一種藝術(shù)形式,其神秘的宗教色彩與濃郁的藝術(shù)風(fēng)格體現(xiàn)了生活在世界屋脊上的藏民族的審美特征,成為一種越來(lái)越多地引起廣大人們欣賞的審美形式,這樣,對(duì)藏族唐卡的分門別類和檢索就成為一種必然。如何對(duì)藏族唐卡圖像進(jìn)行分類與檢索,采取常用的方式如全局圖灰度累積直方圖法、均勻分塊比較法等進(jìn)行藏族唐卡的分類與檢索時(shí),發(fā)現(xiàn)效果不佳,其主要原因是由于唐卡圖像自身的強(qiáng)相似性(所謂強(qiáng)相似性就是指圖像因其畫面豐滿、格調(diào)一致等,引起的全局灰度、對(duì)比度分布總體類似或總體均勻,分塊后灰度、對(duì)比度分布類似)引起的,"唐卡圖像整個(gè)畫面布局平穩(wěn),畫中主體周圍上下左右都有規(guī)律,有秩序地安排處理各種形象,……二是滿,唐卡藝術(shù)的構(gòu)圖多采用二維空間樣式,打破各種透視法則,充分利用畫面的各個(gè)角度,上下左右,平展地均衡地鋪滿各種形象,幾乎不留空白"。唐卡圖像灰圖直方圖如圖l所示?;覉D直方圖的對(duì)稱性說(shuō)明了唐卡圖像布局的平穩(wěn)性與對(duì)稱性,累積直方圖的近似線性關(guān)系說(shuō)明了唐卡圖像布局的豐滿性與多彩性,由此說(shuō)明了唐卡圖像具有強(qiáng)相似性。2.2W.M.A算法為了能從"相似"的唐卡圖像中找出差異,我們首先將唐卡圖像分塊,分成的子塊具有400—600個(gè)左右的像素。為了更好地獲取圖像的局部信息,再對(duì)每一個(gè)子塊進(jìn)行小波幀包分解,將低頻段和高頻段同時(shí)進(jìn)行分解,得到一系列小波包,與小波幀分解相結(jié)合得到以下小波幀包分解基函數(shù)(W。(其中1=0~~,11=0~2'+1隱1)為《"(')=>/^>賦('-2'>)其中,h(k)為低通濾波器系數(shù),g(k)為滿足完全重構(gòu)條件的髙通濾波器系數(shù),W0。(1)為尺度函數(shù),(1)為母小波,i為尺度因子,n為振蕩系數(shù)。現(xiàn)有唐卡圖像的顏色信息表達(dá)為3維RGB空間上的向量。為提取有用的顏色特征,往往需要將RGB空間變換成其它顏色空間。雖然HSV變換非常適于人眼的視覺(jué)特性,然而,這類變換卻容易產(chǎn)生一些難以去除的奇異值,因而不適于進(jìn)一步的變換及特征提取。為克服HSV變換的上述缺點(diǎn),對(duì)彩色空間進(jìn)行Karhunen—Loeve變換'0,3330.333£,,0,5000,000J,-隱一0.5001*卿0.3333"J円K-L變換將圖像空間變換為正交空間,產(chǎn)生在統(tǒng)計(jì)特性上是不相關(guān)的3個(gè)分量,變換不會(huì)產(chǎn)生奇異值。經(jīng)K-L變換以后,分量h代表信號(hào)的亮度或強(qiáng)度,fe和fo分別與色度有關(guān)。在K-L空間上,每個(gè)分量都經(jīng)小波幀分解,分別分解為4個(gè)子帶信道。為避免不必要的全域分解,將能量e、一fflj^一加e朋(;c》1(M,N分別為子帶圖像的寬與髙,mean()表示取均值)作為是否對(duì)ACV乂=1i=i'每一個(gè)子帶信道需作進(jìn)一步分解的衡量標(biāo)準(zhǔn)。把h的能量作為確定小波幀樹型分解結(jié)構(gòu)的尺度,令^—,"為k,的4個(gè)子帶信道中能量最大者,T為預(yù)先設(shè)定的常量,若k,的子帶信道i(i^4)的能量A.H滿足e,w^^ww,則信道i中含有重要的信息,信道i被進(jìn)一步分解,否則信道i不再被進(jìn)一步分解。在每一次小波幀分解后,令某一分辨率下某個(gè)子帶的系數(shù)為{dki,.J(i=l~3,mE[l,M],nE[l,N]),則對(duì)每一個(gè)子帶信道提取以下特征<formula>formulaseeoriginaldocumentpage8</formula>當(dāng)i"'時(shí),C-"J對(duì)應(yīng)于kl敏理)、k2、k3(顏色)的方差,而當(dāng)i9tj時(shí),C""對(duì)應(yīng)丁-紋理與顏色的相關(guān)性。為去除冗余,對(duì)C""進(jìn)行如下的歸一化處理<formula>formulaseeoriginaldocumentpage8</formula>計(jì)算每個(gè)子塊與周圍8個(gè)相鄰子塊之間的距離尺度<formula>formulaseeoriginaldocumentpage8</formula>。和fi分別為樣本圖像和待定圖像的第i個(gè)特征,k為特征總數(shù),Di由迭代計(jì)算得到。Di錢大表示子塊的差距越明顯,越能反映圖像的特征。計(jì)算每個(gè)子塊與周圍8個(gè)Di的距離平均值D,.,取遠(yuǎn)小于距離平均值D,v的距離值(D,,*5%)作為閾值,將距離差值小于閾值的距離值歸為同類,并對(duì)距離值進(jìn)行標(biāo)號(hào),用二元量(相鄰子塊距離的序號(hào)k,該距離的匹配對(duì)個(gè)數(shù)nj形成匹配對(duì)列表。這樣產(chǎn)生了一個(gè)反映子塊顏色直方圖差別的顏色對(duì)直方圖橫軸表示距離值標(biāo)號(hào),縱軸表示具有這一距離值的顏色匹配對(duì)個(gè)數(shù)。由于顏色對(duì)直方圖是一種人為的標(biāo)號(hào)量化過(guò)程,為克服量化的主觀性,我們采用累積直方圖,這是一個(gè)1-D離散函數(shù)<formula>formulaseeoriginaldocumentpage8</formula>其中k為距離排序后的標(biāo)號(hào),L為最大標(biāo)號(hào),ru為該距離(標(biāo)號(hào))下的匹配對(duì)個(gè)數(shù),N為匹配對(duì)總數(shù)。有了顏色對(duì)累積直方圖,就可以借助顏色對(duì)累積直方圖的距離來(lái)進(jìn)行匹配檢索。實(shí)驗(yàn)證明,基于L范數(shù)或直方圖相交方法的效果更好,我們采用直方圖匹配法進(jìn)行檢索<formula>formulaseeoriginaldocumentpage8</formula>MB(Q,D)為歐氏距離函數(shù)。為了防止計(jì)算量過(guò)大,我們可以將L映射到某一區(qū)間例如[O,255],映射公式為:…,L-l[]表示取整合并<formula>formulaseeoriginaldocumentpage8</formula>以上方法綜合利用了小波幀包分解(Waveletframepacketanalysised)、匹配對(duì)(Matchpaired)與累計(jì)直方圖(Accumulativelevelhistogram)的知識(shí),我們把這種方法簡(jiǎn)稱為W.M.A.。3.唐卡圖像數(shù)據(jù)庫(kù)、知識(shí)庫(kù)的設(shè)計(jì)基于內(nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎智能機(jī)器人是基于內(nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎平臺(tái)關(guān)鍵技術(shù),其位置如圖2所示。3.1唐卡圖像數(shù)據(jù)庫(kù)的設(shè)計(jì)藏文圖像內(nèi)容搜索引擎由圖像數(shù)據(jù)庫(kù)和知識(shí)庫(kù)構(gòu)成。為了保證圖像操作(讀取、保存)的快捷以及避免圖像數(shù)據(jù)庫(kù)的尺寸過(guò)大,采用圖像數(shù)據(jù)本身以文件的形式存儲(chǔ),而在庫(kù)中只保存圖像文件的路徑。采用流行的界面技術(shù),符合現(xiàn)行軟件設(shè)計(jì)要求,采用可視和可調(diào)相結(jié)合的方法,使得使用者可以在主界面上方便快捷地進(jìn)行相應(yīng)的操作,并且針對(duì)大批量圖像問(wèn)題設(shè)置了自動(dòng)化的智能方式進(jìn)行操作。3.2唐卡圖像知識(shí)庫(kù)的設(shè)計(jì)藏文圖像內(nèi)容搜索引擎由圖像數(shù)據(jù)庫(kù)和知識(shí)庫(kù)構(gòu)成。為了使藏文圖像內(nèi)容搜紫引擎具有啟發(fā)式推理能力,系統(tǒng)建立文本與圖像內(nèi)容特征相結(jié)合的知識(shí)庫(kù)。在知識(shí)庫(kù)中知識(shí)表示就是研究用機(jī)器表示知識(shí)的可行性、有效性、通用性的原則和方法。常用的知識(shí)表示方法有:邏輯模式、框架模式、語(yǔ)義網(wǎng)絡(luò)、產(chǎn)生式系統(tǒng)、劇本、過(guò)程性知識(shí)表示等。藏文圖像內(nèi)容搜索引擎通過(guò)用戶輸入樣本圖像或圖像相關(guān)文本關(guān)鍵字進(jìn)行搜索,其知識(shí)庫(kù)如圖3。4.唐卡圖像智能機(jī)器人設(shè)計(jì)4.1基于消息代理的分布式系統(tǒng)通信消息代理是一種面向消息的中間件,其基本結(jié)構(gòu)如圖4所示,提供應(yīng)用集成所必須的數(shù)據(jù)的遞送、收集、翻譯、過(guò)濾、映射和路由等功能,屏蔽不同的硬件平臺(tái)、數(shù)據(jù)庫(kù)、消息格式、通信協(xié)議之間的鴻溝與差異,提供應(yīng)用到應(yīng)用之間的高效、便捷的通信能力。消息代理中間件有內(nèi)置的數(shù)據(jù)規(guī)范化工具,替換一個(gè)應(yīng)用時(shí),不會(huì)影響到與其它數(shù)據(jù)交換伙伴的應(yīng)用接口。在Web圖像內(nèi)容搜索中主要是用并行計(jì)算來(lái)提高其搜索速度,這里應(yīng)用消息代理服務(wù)來(lái)實(shí)現(xiàn)并行計(jì)算。消息代理服務(wù)提供了CORBA、COM等對(duì)象間的通信耦合和解耦,建立了一種用戶請(qǐng)求對(duì)象和圖像搜索對(duì)象之間的通信模型,如圖5。這種模型允許多個(gè)用戶請(qǐng)求對(duì)象和多個(gè)圖像搜索對(duì)象通過(guò)消息代理進(jìn)行通信,它們之間的通信是通過(guò)各自的代理對(duì)象進(jìn)行的,并不直接進(jìn)行通信。用戶請(qǐng)求對(duì)象和圖像搜索對(duì)象在通信之前,都必須獲得一個(gè)消息代理,用戶請(qǐng)求對(duì)象獲得一個(gè)圖像搜索對(duì)象消息代理,用戶請(qǐng)求對(duì)象獲得一個(gè)圖像檢索對(duì)象消息代理,消息代理之間來(lái)完成信息的交換。用戶請(qǐng)求對(duì)象主要完成向各服務(wù)器廣播用戶的搜索請(qǐng)求內(nèi)容和接收搜索返回結(jié)果數(shù)據(jù)的任務(wù)。圖像搜索對(duì)象由搜索模塊、索引模塊和數(shù)據(jù)庫(kù)模塊構(gòu)成,這3個(gè)模塊共同完成檢索任務(wù)。4.2集中控制飾通信集中控制^MAS中的Agent有兩種類型,即應(yīng)用Agent(M)和管aAgents(MA),其示意圖如圖6所示。應(yīng)用Agent:在系統(tǒng)中完成特定領(lǐng)域的具有業(yè)務(wù)處理;管理Agent對(duì)應(yīng)用Agent的行為具有完全的控制權(quán),管理Agent負(fù)責(zé)保證各應(yīng)用Agent行為之間的協(xié)調(diào),包括對(duì)任務(wù)進(jìn)行規(guī)劃、分解和運(yùn)行安排,向應(yīng)用Agent發(fā)布控制命令和監(jiān)視任務(wù)的完成情況。集中控制^S可以降低系統(tǒng)的復(fù)雜性,減少Agent之間直接協(xié)商的通訊開銷,但要求管aAgent具有強(qiáng)的規(guī)劃處理能力。多文種網(wǎng)站圖像內(nèi)容搜索引擎系統(tǒng)由三層構(gòu)成第一層是搜索預(yù)處理層,負(fù)責(zé)完成用戶與系統(tǒng)交互及信息檢索前的準(zhǔn)備工作;第二層是代理搜索層,該層完成與后臺(tái)搜索引擎的交互,獲取用戶需要的査詢條目;最后一層是圖像內(nèi)容整合顯示層,用于把各個(gè)搜索引擎A辟nt獲得的條目進(jìn)行相應(yīng)調(diào)整,從中選擇最能滿足用戶需求的若干條,并以統(tǒng)一的界面呈現(xiàn)給用戶。架構(gòu)如圖7所示。MAS是多個(gè)Agent組織一起來(lái)共同完成特定任務(wù)的系統(tǒng),因此各Agent之間必定存在著一定的組織協(xié)作形式,當(dāng)Agent接到某項(xiàng)任務(wù),其根據(jù)推理判斷決定是否需要其它Agent的協(xié)作,如果需要,通過(guò)通訊器傳送通訊語(yǔ)句來(lái)告知相應(yīng)的Agent完成某項(xiàng)任務(wù)(子任務(wù))。在多文種網(wǎng)站圖像內(nèi)容搜索引擎體系結(jié)構(gòu)中采用采用集中控制方式的多A辟nt協(xié)作體系結(jié)構(gòu),控制Agent起管理、控制作用。它接收到任務(wù)后,進(jìn)行任務(wù)分解,然后統(tǒng)一規(guī)劃、,調(diào)并分派工作。負(fù)責(zé)向各Agent發(fā)送命令并監(jiān)視各Agent的工作完成情況,以及與其它Agent的同步與通訊。Agent使用規(guī)定的協(xié)議相互交換信息,用于建立通信和協(xié)調(diào)機(jī)制。其具體通信過(guò)程如圖8所示。唐卡圖像搜索引擎智能機(jī)器人中的網(wǎng)站的獲取、圖像的下載、圖像的匹配等各Agent相互通知該世界中已經(jīng)探索過(guò)的部分,使每個(gè)Agent可能少做一些探索,向其他Agent詢問(wèn)世界特定部分的情況,回答問(wèn)題,請(qǐng)求或者命令其他Agent采取行動(dòng),許諾做某事或者提供幫助,確認(rèn)請(qǐng)求和提議,分享感受和經(jīng)驗(yàn)。在面向消息的智能機(jī)器人多Agent系統(tǒng)中,發(fā)itAgent把特定消息傳送至另一Agent(接ilfeAgent),兩Agent之間的消息是直接交換的,執(zhí)行中沒(méi)有緩沖。唐卡圖像搜索引擎智能機(jī)器人中線程池間各Agent的通信存在以下問(wèn)題:每個(gè)A辟nt對(duì)于所要完成的任務(wù)擁有全面的信息或能力,系統(tǒng)的宏觀的問(wèn)題求解;Agent成員之間以及與系統(tǒng)的目標(biāo)、意愿和行為的一致;合作對(duì)象的明確選擇;沖突的檢測(cè)和協(xié)調(diào)通信的協(xié)商的合時(shí)合理;對(duì)分散的共享數(shù)據(jù)和資源的有效分配和管理系統(tǒng)的安全機(jī)制;Agent的靈活管理方式;有效及時(shí)地對(duì)環(huán)境的變化做出反應(yīng)等。為了有效地解決這些問(wèn)題,我們采用集中式管理的通信機(jī)制,負(fù)責(zé)對(duì)所有或部分Agent成員的行為、協(xié)作、任務(wù)分配以及共享資源等進(jìn)行統(tǒng)一的協(xié)調(diào)和管理,可以是管理Agent、協(xié)調(diào)Agent、監(jiān)督Agent等,與各Agent成員之間具有一定程度的管理和被管理的關(guān)系,如圖9所示。智能機(jī)器人中集中式MAS機(jī)制在一定程度上推理成員Agent的能力行為,判斷成員Agent之間行為的相互影響,幫助成員Agent更為迅速和準(zhǔn)確地確定協(xié)作對(duì)象,組織成員Agent之間的相互合作,協(xié)調(diào)成員Agent之間的矛盾和沖突,使成員Agent通過(guò)學(xué)習(xí)產(chǎn)生對(duì)整體行為有益的影響。集中5機(jī)制推測(cè)協(xié)作對(duì)象的行為和通信,減少了協(xié)調(diào)和通信代價(jià),提髙了成員之間協(xié)作的有效性。4.3CBIR藏文網(wǎng)站唐卡圖像搜索引擎智能機(jī)器人設(shè)計(jì)中的線程池技術(shù)唐卡圖像搜索引擎智能機(jī)器人使用多Agent,網(wǎng)站的獲取、圖像的下載、圖像的匹配等Agent如何并行地協(xié)同工作,使得搜索工作持續(xù)進(jìn)行,開始采用的是采用多線程技術(shù)進(jìn)行處理的。我們發(fā)現(xiàn),這樣處理存在以下問(wèn)題其一,網(wǎng)站的獲取、圖像的下載、圖像的匹配等Agent及其自身的線程創(chuàng)建和銷毀對(duì)象很費(fèi)時(shí)間,創(chuàng)建一個(gè)對(duì)象要獲取內(nèi)存資源或者其它更多資源。提高智能機(jī)器人效率的方式就是盡可能減少創(chuàng)建和銷毀對(duì)象的次數(shù),特別是一些很耗資源的對(duì)象創(chuàng)建和銷毀。其二智能機(jī)器人采用多線程技術(shù)創(chuàng)建的線程花費(fèi)了大量時(shí)間在睡眠狀態(tài)來(lái)等待事件的發(fā)生,還有一些線程進(jìn)入睡B民狀態(tài)后定期被喚醒以輪詢工作方式來(lái)改變或者更新狀態(tài)信息。這樣降低整個(gè)搜索的吞吐量,導(dǎo)致系統(tǒng)性能的下降而不是最初設(shè)計(jì)時(shí)期望要提髙系統(tǒng)性能。采用線程池技術(shù)可以更有效地使用線程,它為智能機(jī)器人提供一個(gè)由系統(tǒng)管理的工作者線程池。至少會(huì)有一個(gè)線程來(lái)監(jiān)聽放到線程池的所有等待操作,當(dāng)?shù)却僮魍瓿珊螅€程池中將會(huì)有一個(gè)工作者線程來(lái)執(zhí)行相應(yīng)的回調(diào)函數(shù)。在系統(tǒng)啟動(dòng)或空閑時(shí)創(chuàng)建一定量的線程保存在線程池中,在系統(tǒng)關(guān)閉時(shí)銷毀線程及其資源。當(dāng)有任務(wù)來(lái)時(shí)不需要?jiǎng)?chuàng)建就從線程池中取一線程執(zhí)行任務(wù),執(zhí)行完任務(wù)后又放回至空閑線程池中。如果長(zhǎng)時(shí)間沒(méi)有任務(wù)執(zhí)行也可銷毀一定量的線程,使線程池中保持一定的線程數(shù)。當(dāng)有任務(wù)來(lái)時(shí)線程池中沒(méi)有空閑線程,且此時(shí)線程數(shù)沒(méi)有達(dá)到最大線程數(shù)時(shí),創(chuàng)建新線程。如果達(dá)到最大線程數(shù)而沒(méi)有空閑線程時(shí),任務(wù)等待,直到池中有空閑線程。采用線程池技術(shù)解決了網(wǎng)站的獲取、圖像的下載、圖像的匹配等多A辟nt地協(xié)同工作的效率問(wèn)題,特別是圖像匹配與網(wǎng)站的獲取、圖像的下載不同速度的協(xié)同問(wèn)題,具有相當(dāng)?shù)膬?yōu)越性。簡(jiǎn)單線程池存在一些問(wèn)題,如果有大量的線程要求智能機(jī)器人為其服務(wù),但由于線程池的工作線程是有限的,智能機(jī)器人只能為部分線程服務(wù),其它線程提交的任務(wù),只能在任務(wù)隊(duì)列中等待處理。但智能機(jī)器人的響應(yīng)時(shí)間要求不能太長(zhǎng),則需要調(diào)整優(yōu)化線程池尺寸,主要有下列優(yōu)化措施其一,動(dòng)態(tài)增加工作線程。在智能機(jī)器人線程池中提供一個(gè)可以動(dòng)態(tài)改變的工作線程數(shù)目的功能,以適應(yīng)線程變化的需要。一旦請(qǐng)求變少了將逐步減少線程池中工作線程的數(shù)目。線程增加采用超前方式,即批量增加一批工作線程。同時(shí)在線程池中限制線程池中工作線程數(shù)目的上限和下限,以防止這種靈活的方式也就變成一種錯(cuò)誤的方式或者災(zāi)難,因?yàn)轭l繁的創(chuàng)建線程或者短時(shí)間內(nèi)產(chǎn)生大量的線程將會(huì)背離使用線程池原始初衷一減少創(chuàng)建線程的次數(shù)。其二,優(yōu)化工作線程數(shù)目。根據(jù)統(tǒng)計(jì)學(xué)的原理來(lái)統(tǒng)計(jì)線程的請(qǐng)求數(shù)目,比如髙峰時(shí)段平均一秒鐘內(nèi)有多少任務(wù)要求處理,并根據(jù)系統(tǒng)的承受能力及客戶的忍受能力來(lái)平衡估計(jì)一個(gè)合理的線程池尺寸。線程池的尺寸確實(shí)很難確定,智能機(jī)器人中采用實(shí)驗(yàn)結(jié)果的經(jīng)驗(yàn)值來(lái)做為線程池的尺寸。其三,智能機(jī)器人提供多個(gè)線程池。智能機(jī)器人根據(jù)不同任務(wù)或者任務(wù)優(yōu)先級(jí)來(lái)采用不同線程池處理。網(wǎng)站的獲取、圖像的下載、圖像的匹配等Agent采用不同的線程池進(jìn)行處理,分而治之,體現(xiàn)不同任務(wù)的任務(wù)優(yōu)先級(jí)。智能機(jī)器人中的網(wǎng)站的獲取、圖像的下載、圖像的匹配等Agent需要大量的線程來(lái)完成任務(wù),且完成任務(wù)的時(shí)間比較短,使用線程池技術(shù)取得了較好的效果。4.4唐卡圖像智能機(jī)器人設(shè)計(jì)藏文圖像內(nèi)容搜索引擎采用Spider程序進(jìn)行構(gòu)造。構(gòu)造時(shí)采用基于多任務(wù)的多線程池模式,即采用非遞歸的設(shè)計(jì)方案,Spider程序在發(fā)現(xiàn)每個(gè)新網(wǎng)頁(yè)或圖像URL時(shí),它將使用一個(gè)不調(diào)用自身的方法,而是使用多線程池。為得到Spider程序的處理,每一個(gè)新發(fā)現(xiàn)的網(wǎng)頁(yè)或圖像URL放入多線程池。給定Spider程序—個(gè)要訪問(wèn)的網(wǎng)頁(yè)或圖像URL,把這一網(wǎng)頁(yè)或圖像URL加入到它的多線程池中去;當(dāng)Spider程序發(fā)現(xiàn)新的網(wǎng)頁(yè)或圖像URL時(shí),把它們加入到多線程池;當(dāng)Spider程序處理完當(dāng)前的URL,在多線程池中查找要處理的下—URL??傮w設(shè)計(jì)方案如圖IO?;趦?nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎智能機(jī)器人主體由多線程池循環(huán)模塊構(gòu)成,系統(tǒng)模塊設(shè)計(jì)方案如圖11所示。多線程池循環(huán)模塊是基于內(nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎智能機(jī)器人的主控模塊,負(fù)責(zé)在網(wǎng)絡(luò)上循環(huán)搜索唐卡圖像。唐卡圖像搜索引擎智能機(jī)器人同時(shí)也就是知識(shí)庫(kù)專家系統(tǒng)中的推理機(jī),與知識(shí)庫(kù)專家系統(tǒng)成為一體,以線程池的方式工作,多個(gè)Agent相互協(xié)作,這對(duì)提髙機(jī)器人的搜索效率有著重要的作用。采用CstringArray的方式存放各種要處理的數(shù)據(jù)typedefstructCStringArrayarrLinks;CStringArrayarrMedia:CByteArrayarrOffsite;intnlndex;}LINKS;多線程池循環(huán)模塊是基于內(nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎智能機(jī)器人的主控模塊,負(fù)責(zé)在網(wǎng)絡(luò)上循環(huán)搜索唐卡圖像,其具體用到的主要函數(shù)如下staticUINTDownloadThread(LPVOIDlpvData);〃唐卡圖像下載多線程函數(shù)BOOLMatchTangKa(CString&strMedia):〃唐卡圖像匹配函數(shù)BOOLShouldQueuePage(CString&strNewPage,BOOLbOffsite):〃判斷網(wǎng)頁(yè)是否進(jìn)入隊(duì)列函數(shù)voidFix叩Links();〃鏈接修復(fù)函數(shù)voidResetLink(intnLevel):〃鏈接重置函數(shù)voidSetMediaCacheEntry(LPCTSTRIpszMedia,LPCTSTRlpszFileN咖e):〃唐卡圖像入口函數(shù)BOOLGetMedia(CString&strMedia,CString&strFileName):〃獲取唐卡圖像函數(shù)BOOLShouldGetMedia(CString&strMedia,MAP—FILES械pMapEntry):〃判斷是否獲取唐卡圖像函數(shù)BOOLShouldGetPage(CString&strPage,MAP_FILES*&pMapEntry):〃判斷是否獲取網(wǎng)頁(yè)函數(shù)BOOLGetPage(CString&strPage,CString&strFileName,LINKS&linkEntry):〃獲取網(wǎng)頁(yè)函數(shù)voidSetPageCacheEntry(LPCTSTRlpszPage,LPCTSTRIpszFileName,intnLevel):〃網(wǎng)頁(yè)入口函數(shù)voidClearCacheMaps();〃清除緩存函數(shù)根據(jù)輸入的URL建立多IP數(shù)組線程;依據(jù)各個(gè)IP建立各自的多線程各個(gè)多線程完成每個(gè)IP的唐卡圖像搜索;通過(guò)多線程池,反復(fù),至規(guī)定寬度與深度頁(yè)面全部搜索完成。TangKaCBIRRobot系統(tǒng)運(yùn)行結(jié)果如圖12所示。該方法依據(jù)唐卡圖像的特征,在以前基于圖像內(nèi)容檢索的算法的基礎(chǔ)上提出新的W.M.A算法,適合藏文網(wǎng)站和唐卡圖像本身特征,與藏文文本特征相結(jié)合,以知識(shí)庫(kù)和圖像數(shù)據(jù)庫(kù)為后臺(tái),具有啟發(fā)式功能,為以后向其它多文種網(wǎng)站搜索引擎結(jié)合給出擴(kuò)展結(jié)接口。在該方法下形成的軟件系統(tǒng)包括基于內(nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎智能機(jī)器人程序,用于基于內(nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎系統(tǒng)中在Internet中自動(dòng)搜索唐卡圖像,并自動(dòng)進(jìn)行相似分類。圖l唐卡圖像彩繪大觀灰圖直方圖。圖2基于內(nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎平臺(tái)總體架構(gòu)。圖3藏文圖像內(nèi)容搜索引擎知識(shí)庫(kù)關(guān)聯(lián)圖。圖4消息代理中間件的基本結(jié)構(gòu)。圖5消息代理服務(wù)結(jié)構(gòu)圖。圖6集中控制式MAS。圖7多文種網(wǎng)站圖像內(nèi)容搜索引擎系統(tǒng)架構(gòu)。圖8多Agent通信過(guò)程。圖9智能機(jī)器人中線程池集中式管理的通信機(jī)制。圖IO基于內(nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎搜索方案。圖ll基于內(nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎智能機(jī)器人系統(tǒng)模塊間關(guān)系。圖12TangKaCBIRRobot系統(tǒng)運(yùn)行結(jié)果。圖13基于W.M.A算法的CBIR唐卡圖像搜索結(jié)果。具體實(shí)施方式建立專門唐卡圖像網(wǎng)站www.Tangka.net,并同時(shí)與其它搜索引擎如baidu、google等建立元接口,與其它藏文網(wǎng)站如www.tonger.加t等建立唐卡圖像的搜索源。通過(guò)基于的CBIR藏文網(wǎng)站唐卡圖像搜索引擎智能機(jī)器人進(jìn)行搜索,將搜索的唐卡圖像的內(nèi)容特征放入知識(shí)庫(kù),唐卡圖像本身放入唐卡圖像庫(kù),再通過(guò)動(dòng)態(tài)ASP平臺(tái)顯示出搜索結(jié)果。實(shí)施例基于內(nèi)容的靜態(tài)藏文網(wǎng)站唐卡圖像搜索引擎系統(tǒng)從內(nèi)部唐卡圖像網(wǎng)www.Tangka.net上共搜索411幅唐卡圖像進(jìn)入唐卡圖像數(shù)據(jù)庫(kù),依據(jù)W.M.A.方法,在給定小波變換層數(shù)為2、歐氏參數(shù)為0.3的條件下共搜索出8幅唐卡圖像,其査準(zhǔn)率為100%,其査全率依據(jù)經(jīng)驗(yàn)統(tǒng)計(jì)達(dá)到89.61基本上達(dá)到了實(shí)際的需要要求,如圖13所示。權(quán)利要求1.基于內(nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎智能機(jī)器人搜索方法,其特征是采用基于W.M.A的算法,以唐卡圖像數(shù)據(jù)庫(kù)、知識(shí)庫(kù)為后臺(tái),以多線程的方式唐卡圖像搜索引擎智能機(jī)器人搜索方法。W.M.A方法的特征是能從“相似”的唐卡圖像中找出差異,通過(guò)小波幀包分析挖掘出了“相似”中的“不同”,同時(shí)又通過(guò)歐氏距離保證了“不同”間的“相似”,再輔以累計(jì)直方圖保證比較的“連續(xù)性”,從而達(dá)到了優(yōu)良的檢索效果。具體為首先將唐卡圖像分塊,分成的子塊具有400-600個(gè)左右的像素。為了更好地獲取圖像的局部信息,再對(duì)每一個(gè)子塊進(jìn)行小波幀包分解,將低頻段和高頻段同時(shí)進(jìn)行分解,得到一系列小波包,與小波幀分解相結(jié)合得到以下小波幀包分解基函數(shù){Win}(其中i=0~∞,n=0~2i+1-1)為<mathsid="math0001"num="0001"><math><![CDATA[<mrow><msubsup><mi>W</mi><mrow><mn>2</mn><mi>n</mi></mrow><mrow><mi>i</mi><mo>+</mo><mn>1</mn></mrow></msubsup><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow><mo>=</mo><msqrt><mn>2</mn></msqrt><munder><mi>&Sigma;</mi><mi>k</mi></munder><mi>h</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><msubsup><mi>W</mi><mrow><mn>2</mn><mi>n</mi></mrow><mi>i</mi></msubsup><mrow><mo>(</mo><mi>l</mi><mo>-</mo><msup><mn>2</mn><mi>i</mi></msup><mi>k</mi><mo>)</mo></mrow></mrow>]]></math></maths><mathsid="math0002"num="0002"><math><![CDATA[<mrow><msubsup><mi>W</mi><mrow><mn>2</mn><mi>n</mi><mo>+</mo><mn>1</mn></mrow><mrow><mi>i</mi><mo>+</mo><mn>1</mn></mrow></msubsup><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow><mo>=</mo><msqrt><mn>2</mn></msqrt><munder><mi>&Sigma;</mi><mi>k</mi></munder><mi>g</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><msubsup><mi>W</mi><mrow><mn>2</mn><mi>n</mi></mrow><mi>i</mi></msubsup><mrow><mo>(</mo><mi>l</mi><mo>-</mo><msup><mn>2</mn><mi>i</mi></msup><mi>k</mi><mo>)</mo></mrow></mrow>]]></math></maths>其中,h(k)為低通濾波器系數(shù),g(k)為滿足完全重構(gòu)條件的高通濾波器系數(shù),W00(1)為尺度函數(shù),W01(1)為母小波,i為尺度因子,n為振蕩系數(shù)。現(xiàn)有唐卡圖像的顏色信息表達(dá)為3維RGB空間上的向量。為提取有用的顏色特征,往往需要將RGB空間變換成其它顏色空間。雖然HSV變換非常適于人眼的視覺(jué)特性,然而,這類變換卻容易產(chǎn)生一些難以去除的奇異值,因而不適于進(jìn)一步的變換及特征提取。為克服HSV變換的上述缺點(diǎn),對(duì)彩色空間進(jìn)行Karhunen-Loeve變換<mathsid="math0003"num="0003"><math><![CDATA[<mrow><mfencedopen='['close=']'><mtable><mtr><mtd><msub><mi>k</mi><mn>1</mn></msub></mtd></mtr><mtr><mtd><msub><mi>k</mi><mn>2</mn></msub></mtd></mtr><mtr><mtd><msub><mi>k</mi><mn>3</mn></msub></mtd></mtr></mtable></mfenced><mo>=</mo><mfencedopen='['close=']'><mtable><mtr><mtd><mn>0.333</mn></mtd><mtd><mn>0.333</mn></mtd><mtd><mn>0.333</mn></mtd></mtr><mtr><mtd><mn>0.500</mn></mtd><mtd><mn>0.000</mn></mtd><mtd><mo>-</mo><mn>0.500</mn></mtd></mtr><mtr><mtd><mo>-</mo><mn>0.500</mn></mtd><mtd><mn>1.000</mn></mtd><mtd><mo>-</mo><mn>0.500</mn></mtd></mtr></mtable></mfenced><mo>&CenterDot;</mo><mfencedopen='['close=']'><mtable><mtr><mtd><mi>R</mi></mtd></mtr><mtr><mtd><mi>G</mi></mtd></mtr><mtr><mtd><mi>B</mi></mtd></mtr></mtable></mfenced><mo>.</mo></mrow>]]></math></maths>K-L變換將圖像空間變換為正交空間,產(chǎn)生在統(tǒng)計(jì)特性上是不相關(guān)的3個(gè)分量,變換不會(huì)產(chǎn)生奇異值。經(jīng)K-L變換以后,分量k1代表信號(hào)的亮度或強(qiáng)度,k2和k3分別與色度有關(guān)。在K-L空間上,每個(gè)分量都經(jīng)小波幀分解,分別分解為4個(gè)子帶信道。為避免不必要的全域分解,將能量<mathsid="math0004"num="0004"><math><![CDATA[<mrow><msup><mi>e</mi><mn>2</mn></msup><mo>=</mo><mfrac><mn>1</mn><mi>MN</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><mo>|</mo><msub><mi>x</mi><mrow><mi>i</mi><mo>,</mo><mi>j</mi></mrow></msub><mo>-</mo><mi>mean</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>ij</mi></msub><mo>)</mo></mrow><mo>|</mo></mrow>]]></math>id="icf0004"file="A2007100978460002C4.tif"wi="55"he="10"top="167"left="27"img-content="drawing"img-format="tif"orientation="portrait"inline="yes"/></maths>(M,N分別為子帶圖像的寬與高,mean()表示取均值)作為是否對(duì)每一個(gè)子帶信道需作進(jìn)一步分解的衡量標(biāo)準(zhǔn)。把k1的能量作為確定小波幀樹型分解結(jié)構(gòu)的尺度,令e2max,k1為k1的4個(gè)子帶信道中能量最大者,T為預(yù)先設(shè)定的常量,若k1的子帶信道i(i=1~4)的能量e2i,k1滿足e2i,k1≥e2max,k1則信道i中含有重要的信息,信道i被進(jìn)一步分解,否則信道i不再被進(jìn)一步分解。在每一次小波幀分解后,令某一分辨率下某個(gè)子帶的系數(shù)為{dkim,n}(i=1~3,m∈[1,M],n∈[1,N]),則對(duì)每一個(gè)子帶信道提取以下特征<mathsid="math0005"num="0005"><math><![CDATA[<mrow><msup><mi>C</mi><mrow><msup><mi>k</mi><mi>i</mi></msup><msup><mi>k</mi><mi>j</mi></msup></mrow></msup><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>m</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><munderover><mi>&Sigma;</mi><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><mo>|</mo><mrow><mo>(</mo><msubsup><mi>d</mi><mrow><mi>m</mi><mo>,</mo><mi>n</mi></mrow><msub><mi>k</mi><mi>i</mi></msub></msubsup><mo>-</mo><mi>mean</mi><mrow><mo>(</mo><msubsup><mi>d</mi><mrow><mi>m</mi><mo>,</mo><mi>n</mi></mrow><msub><mi>k</mi><mi>i</mi></msub></msubsup><mo>)</mo></mrow><mo>)</mo></mrow><mo>&CenterDot;</mo><mrow><mo>(</mo><msubsup><mi>d</mi><mrow><mi>m</mi><mo>,</mo><mi>n</mi></mrow><msub><mi>k</mi><mi>i</mi></msub></msubsup><mo>-</mo><mi>mean</mi><mrow><mo>(</mo><msubsup><mi>d</mi><mrow><mi>m</mi><mo>,</mo><mi>n</mi></mrow><msub><mi>k</mi><mi>i</mi></msub></msubsup><mo>)</mo></mrow><mo>)</mo></mrow><mo>|</mo></mrow>]]></math></maths>當(dāng)i=j(luò)時(shí),ckikj對(duì)應(yīng)于k1(紋理)、k2、k3(顏色)的方差,而當(dāng)i≠j時(shí),Ckikj對(duì)應(yīng)于紋理與顏色的相關(guān)性。為去除冗余,對(duì)Ckikj進(jìn)行如下的歸一化處理<mathsid="math0006"num="0006"><math><![CDATA[<mrow><msup><mi>C</mi><mi>kikj</mi></msup><mo>=</mo><mfencedopen='{'close=''><mtable><mtr><mtd><msup><mi>C</mi><mi>kikj</mi></msup><mo>,</mo></mtd><mtd><mi>i</mi><mo>=</mo><mi>j</mi></mtd></mtr><mtr><mtd><mfrac><msup><mi>C</mi><mi>kikj</mi></msup><mrow><msup><mi>C</mi><mi>kikj</mi></msup><mo>&CenterDot;</mo><msup><mi>C</mi><mrow><mi>kikj</mi><mo>*</mo></mrow></msup></mrow></mfrac></mtd><mtd><mi>i</mi><mo>&NotEqual;</mo><mi>j</mi></mtd></mtr></mtable></mfenced></mrow>]]></math></maths>計(jì)算每個(gè)子塊與周圍8個(gè)相鄰子塊之間的距離尺度<mathsid="math0007"num="0007"><math><![CDATA[<mrow><msub><mi>D</mi><mi>i</mi></msub><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>k</mi></munderover><mrow><mo>(</mo><mfrac><msup><msub><mi>f</mi><mi>i</mi></msub><mi>q</mi></msup><msub><mi>f</mi><mi>i</mi></msub></mfrac><mo>+</mo><mfrac><msub><mi>f</mi><mi>i</mi></msub><msup><msub><mi>f</mi><mi>i</mi></msub><mi>q</mi></msup></mfrac><mo>-</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math></maths>fq1和fi分別為樣本圖像和待定圖像的第i個(gè)特征,k為特征總數(shù),Di由迭代計(jì)算得到。Di值越大表示子塊的差距越明顯,越能反映圖像的特征。計(jì)算每個(gè)子塊與周圍8個(gè)Di的距離平均值Dav,取遠(yuǎn)小于距離平均值Dav的距離值(Dav*5%)作為閾值,將距離差值小于閾值的距離值歸為同類,并對(duì)距離值進(jìn)行標(biāo)號(hào),用二元量(相鄰子塊距離的序號(hào)k,該距離的匹配對(duì)個(gè)數(shù)nk)形成匹配對(duì)列表。這樣產(chǎn)生了一個(gè)反映子塊顏色直方圖差別的顏色對(duì)直方圖橫軸表示距離值標(biāo)號(hào),縱軸表示具有這一距離值的顏色匹配對(duì)個(gè)數(shù)。由于顏色對(duì)直方圖是一種人為的標(biāo)號(hào)量化過(guò)程,為克服量化的主觀性,我們采用累積直方圖,這是一個(gè)1-D離散函數(shù)<mathsid="math0008"num="0008"><math><![CDATA[<mrow><mi>I</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>L</mi><mo>-</mo><mn>1</mn></mrow></munderover><mfrac><msub><mi>n</mi><mi>k</mi></msub><mi>N</mi></mfrac><mo>,</mo><mi>k</mi><mo>=</mo><mn>0,1</mn><mo>,</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>,</mo><mi>L</mi><mo>-</mo><mn>1</mn></mrow>]]></math></maths>其中k為距離排序后的標(biāo)號(hào),L為最大標(biāo)號(hào),nk為該距離(標(biāo)號(hào))下的匹配對(duì)個(gè)數(shù),N為匹配對(duì)總數(shù)。有了顏色對(duì)累積直方圖,就可以借助顏色對(duì)累積直方圖的距離來(lái)進(jìn)行匹配檢索。實(shí)驗(yàn)證明,基于L1范數(shù)或直方圖相交方法的效果更好,我們采用直方圖匹配法進(jìn)行檢索<mathsid="math0009"num="0009"><math><![CDATA[<mrow><msub><mi>M</mi><mi>E</mi></msub><mrow><mo>(</mo><mi>Q</mi><mo>,</mo><mi>D</mi><mo>)</mo></mrow><mo>=</mo><msqrt><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>L</mi><mo>-</mo><mn>1</mn></mrow></munderover><msup><mrow><mo>[</mo><msub><mi>I</mi><mi>Q</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>-</mo><msub><mi>I</mi><mi>D</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>]</mo></mrow><mn>2</mn></msup></msqrt></mrow>]]></math></maths>ME(Q,D)為歐氏距離函數(shù)。為了防止計(jì)算量過(guò)大,我們可以將L映射到某一區(qū)間例如,映射公式為<mathsid="math0010"num="0010"><math><![CDATA[<mrow><msup><mi>k</mi><mo>&prime;</mo></msup><mo>=</mo><mo>[</mo><mfrac><mi>k</mi><mi>L</mi></mfrac><mo>&times;</mo><mn>255</mn><mo>]</mo><mo>,</mo><mi>k</mi><mo>=</mo><mn>0,1</mn><mo>,</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>,</mo><mi>L</mi><mo>-</mo><mn>1</mn></mrow>]]></math>id="icf0010"file="A2007100978460003C3.tif"wi="53"he="9"top="127"left="75"img-content="drawing"img-format="tif"orientation="portrait"inline="yes"/></maths>[]表示取整合并L′=255k′=0,1,…,L′-1藏文圖像內(nèi)容搜索引擎采用Spider程序進(jìn)行構(gòu)造。構(gòu)造時(shí)采用基于多任務(wù)的多線程池模式,即采用非遞歸的設(shè)計(jì)方案,Spider程序在發(fā)現(xiàn)每個(gè)新網(wǎng)頁(yè)或圖像URL時(shí),它將使用一個(gè)不調(diào)用自身的方法,而是使用多線程池。為得到Spider程序的處理,每一個(gè)新發(fā)現(xiàn)的網(wǎng)頁(yè)或圖像URL放入多線程池。給定Spider程序一個(gè)要訪問(wèn)的網(wǎng)頁(yè)或圖像URL,把這一網(wǎng)頁(yè)或圖像URL加入到它的多線程池中去;當(dāng)Spider程序發(fā)現(xiàn)新的網(wǎng)頁(yè)或圖像URL時(shí),把它們加入到多線程池;當(dāng)Spider程序處理完當(dāng)前的URL,在多線程池中查找要處理的下一URL?;趦?nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎智能機(jī)器人主體由多線程池循環(huán)模塊構(gòu)成。多線程池循環(huán)模塊是基于內(nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎智能機(jī)器人的主控模塊,負(fù)責(zé)在網(wǎng)絡(luò)上循環(huán)搜索唐卡圖像。唐卡圖像搜索引擎智能機(jī)器人同時(shí)也就是知識(shí)庫(kù)專家系統(tǒng)中的推理機(jī),與知識(shí)庫(kù)專家系統(tǒng)成為一體,以線程池的方式工作,多個(gè)Agent相互協(xié)作,這對(duì)提高機(jī)器人的搜索效率有著重要的作用。采用CstringArray的方式存放各種要處理的數(shù)據(jù)typedefstruct{CStringArrayarrLinks;CStringArrayarrMedia;CByteArrayarrOffsite;intnIndex;}LINKS;多線程池循環(huán)模塊是基于內(nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎智能機(jī)器人的主控模塊,負(fù)責(zé)在網(wǎng)絡(luò)上循環(huán)搜索唐卡圖像,其具體用到的主要函數(shù)如下staticUINTDownloadThread(LPVOIDlpvData);//唐卡圖像下載多線程函數(shù)BOOLMatchTangKa(CString&amp;strMedia);//唐卡圖像匹配函數(shù)BOOLShouldQueuePage(CString&amp;strNewPage,BOOLbOffsite);//判斷網(wǎng)頁(yè)是否進(jìn)入隊(duì)列函數(shù)voidFixupLinks();//鏈接修復(fù)函數(shù)voidResetLink(intnLevel);//鏈接重置函數(shù)voidSetMediaCacheEntry(LPCTSTRlpszMedia,LPCTSTRlpszFileName);//唐卡圖像入口函數(shù)BOOLGetMedia(CString&amp;strMedia,CString&amp;strFileName);//獲取唐卡圖像函數(shù)BOOLShouldGetMedia(CString&amp;strMedia,MAP_FILES*&amp;pMapEntry);//判斷是否獲取唐卡圖像函數(shù)BOOLShouldGetPage(CString&amp;strPage,MAP_FILES*&amp;pMapEntry);//判斷是否獲取網(wǎng)頁(yè)函數(shù)BOOLGetPage(CString&amp;strPage,CString&amp;strFileName,LINKS&amp;linkEntry);//獲取網(wǎng)頁(yè)函數(shù)voidSetPageCacheEntry(LPCTSTRlpszPage,LPCTSTRlpszFileName,intnLevel);//網(wǎng)頁(yè)入口函數(shù)voidClearCacheMaps();//清除緩存函數(shù)根據(jù)輸入的URL建立多IP數(shù)組線程;依據(jù)各個(gè)IP建立各自的多線程;各個(gè)多線程完成每個(gè)IP的唐卡圖像搜索;通過(guò)多線程池,反復(fù),至規(guī)定寬度與深度頁(yè)面全部搜索完成。全文摘要基于內(nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎智能機(jī)器人搜索方法屬于圖像內(nèi)容的搜索引擎領(lǐng)域,其特征在于提出了W.M.A的搜索方案將唐卡檢索樣本圖像分塊,對(duì)每個(gè)子塊進(jìn)行小波幀包分解得各子帶信道,計(jì)算各子塊與子塊之間的距離,將距離差值小于閾值的距離值歸為同類并標(biāo)號(hào),用二元量形成匹配對(duì)列表和顏色對(duì)直方圖,采用直方圖方法進(jìn)行匹配;以知識(shí)庫(kù)和圖像數(shù)據(jù)庫(kù)為后臺(tái),與藏文文本特征相結(jié)合,構(gòu)建適合于藏文網(wǎng)站和唐卡圖像本身特征的、基于多任務(wù)的多線程模式唐卡圖像搜索引擎智能機(jī)器人搜索方法。本發(fā)明在基于內(nèi)容的藏文網(wǎng)站唐卡圖像搜索引擎系統(tǒng)中自動(dòng)搜索唐卡圖像,并自動(dòng)進(jìn)行相似分類,查全率依據(jù)經(jīng)驗(yàn)統(tǒng)計(jì)達(dá)到89.6%。文檔編號(hào)G06F17/30GK101290619SQ20071009784公開日2008年10月22日申請(qǐng)日期2007年4月20日優(yōu)先權(quán)日2007年4月20日發(fā)明者劉華明,唐仕喜,戴玉剛,暉曹,王維蘭,馬國(guó)柱申請(qǐng)人:西北民族大學(xué)
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
武义县| 泰宁县| 永登县| 吉林省| 泊头市| 柞水县| 洪雅县| 池州市| 呼和浩特市| 出国| 福海县| 绥滨县| 都匀市| 鄂温| 资阳市| 高平市| 龙泉市| 阳信县| 藁城市| 南通市| 北辰区| 阿城市| 彰武县| 理塘县| 彭水| 临潭县| 卓资县| 济南市| 邵阳市| 石棉县| 临安市| 黑河市| 蒲城县| 西林县| 安陆市| 三都| 朝阳区| 华阴市| 卫辉市| 栖霞市| 香港 |