欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于確定圖像是否為帶地址信息的圖像的方法和裝置與流程

文檔序號(hào):12671080閱讀:192來(lái)源:國(guó)知局
本發(fā)明涉及圖像處理領(lǐng)域,更具體地涉及一種用于確定圖像是否為帶地址信息的圖像的方法和裝置。
背景技術(shù)
:針對(duì)現(xiàn)在的一些網(wǎng)絡(luò)應(yīng)用,例如地圖導(dǎo)航等,用戶可以方便地使用網(wǎng)頁(yè)中的目標(biāo)地點(diǎn)的地址。然而,基于安全考慮,地址通常被包括在圖片中。因?yàn)榫W(wǎng)頁(yè)含有多幅圖片,因此利用傳統(tǒng)OCR(OpticalCharacterRecognition,光學(xué)字符識(shí)別)方法進(jìn)行文本檢測(cè)定位和識(shí)別過(guò)程常常非常耗時(shí),對(duì)網(wǎng)絡(luò)應(yīng)用造成了巨大負(fù)擔(dān)。期望能夠提供一種能夠快速有效地對(duì)網(wǎng)頁(yè)圖像進(jìn)行文本類和非文本類進(jìn)行分類的方法和裝置。技術(shù)實(shí)現(xiàn)要素:在下文中給出關(guān)于本發(fā)明的簡(jiǎn)要概述,以便提供關(guān)于本發(fā)明的某些方面的基本理解。應(yīng)當(dāng)理解,這個(gè)概述并不是關(guān)于本發(fā)明的窮舉性概述。它并不是意圖確定本發(fā)明的關(guān)鍵或重要部分,也不是意圖限定本發(fā)明的范圍。其目的僅僅是以簡(jiǎn)化的形式給出某些概念,以此作為稍后論述的更詳細(xì)描述的前序。本發(fā)明的一個(gè)主要目的在于,提供了一種確定圖像是否為帶地址信息的圖像的方法,包括:對(duì)原始圖像進(jìn)行二值化得到二值化圖像并提取二值化圖像中的連通部件;對(duì)連通部件進(jìn)行濾噪,對(duì)濾噪后的連通部件中的重疊的連通部件進(jìn)行融合,并且建立新的二值化圖像;對(duì)新的二值化圖像進(jìn)行行投影得到多個(gè)行;根據(jù)每一行中的連通部件的幾何分布來(lái)確定原始圖像中是否存在文本行;如果不存在文本行,則確定原始圖像為不帶地址信息的圖像,否則,進(jìn)一步根據(jù)每行中的連通部件的筆畫寬度和顏色分布來(lái)確定原始圖像是否為帶地址信息的圖像;如果未將原始圖像確定為不帶地 址信息的圖像,則再進(jìn)一步根據(jù)每一行中的連通部件的H通道顏色來(lái)確定原始圖像是否為帶地址信息的圖像。根據(jù)本發(fā)明的一個(gè)方面,提供一種確定圖像是否為帶地址信息的圖像的裝置,包括:預(yù)處理單元,被配置為對(duì)原始圖像進(jìn)行二值化得到二值化圖像并提取二值化圖像中的連通部件;濾噪及融合單元,被配置為對(duì)連通部件進(jìn)行濾噪,對(duì)濾噪后的連通部件中的重疊的連通部件進(jìn)行融合,并且建立新的二值化圖像;行投影單元,被配置為對(duì)新的二值化圖像進(jìn)行行投影得到多個(gè)行;地址圖像確定單元,被配置為:根據(jù)每一行中的連通部件的幾何分布來(lái)確定原始圖像中是否存在文本行;如果不存在文本行,則確定原始圖像為不帶地址信息的圖像,否則,進(jìn)一步根據(jù)每行中的連通部件的筆畫寬度和顏色分布來(lái)確定原始圖像是否為帶地址信息的圖像;如果確定原始圖像是帶地址信息的圖像,則再進(jìn)一步根據(jù)每一行中的連通部件的H通道顏色來(lái)確定原始圖像是否為帶地址信息的圖像。另外,本發(fā)明的實(shí)施例還提供了用于實(shí)現(xiàn)上述方法的計(jì)算機(jī)程序。此外,本發(fā)明的實(shí)施例還提供了至少計(jì)算機(jī)可讀介質(zhì)形式的計(jì)算機(jī)程序產(chǎn)品,其上記錄有用于實(shí)現(xiàn)上述方法的計(jì)算機(jī)程序代碼。通過(guò)以下結(jié)合附圖對(duì)本發(fā)明的最佳實(shí)施例的詳細(xì)說(shuō)明,本發(fā)明的這些以及其他優(yōu)點(diǎn)將更加明顯。附圖說(shuō)明參照下面結(jié)合附圖對(duì)本發(fā)明實(shí)施例的說(shuō)明,會(huì)更加容易地理解本發(fā)明的以上和其它目的、特點(diǎn)和優(yōu)點(diǎn)。附圖中的部件只是為了示出本發(fā)明的原理。在附圖中,相同的或類似的技術(shù)特征或部件將采用相同或類似的附圖標(biāo)記來(lái)表示。圖1A-圖1B示出了網(wǎng)絡(luò)中不同類型的圖片的例子;圖2示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于確定圖像是否為帶地址信息的圖像的方法200的示例性過(guò)程的流程圖;圖3示出了一個(gè)cc連接;圖4A至圖4C示出了不同類型的連通部件;圖5示出了cc邊界像素的濾除效果;圖6A-6C示出了基于顏色來(lái)確定圖像是否為帶地址信息的圖像的一個(gè)示例;圖7是示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于確定圖像是否為帶地址信息的圖像的裝置700的示例性配置的框圖;圖8是示出圖7中的地址圖像確定單元708的一種示例性配置的框圖;圖9是示出可以用于實(shí)施本發(fā)明的用于確定圖像是否為帶地址信息的圖像的方法和裝置的計(jì)算設(shè)備的示例性結(jié)構(gòu)圖。具體實(shí)施方式在下文中將結(jié)合附圖對(duì)本發(fā)明的示范性實(shí)施例進(jìn)行描述。為了清楚和簡(jiǎn)明起見,在說(shuō)明書中并未描述實(shí)際實(shí)施方式的所有特征。然而,應(yīng)該了解,在開發(fā)任何這種實(shí)際實(shí)施例的過(guò)程中必須做出很多特定于實(shí)施方式的決定,以便實(shí)現(xiàn)開發(fā)人員的具體目標(biāo),例如,符合與系統(tǒng)及業(yè)務(wù)相關(guān)的那些限制條件,并且這些限制條件可能會(huì)隨著實(shí)施方式的不同而有所改變。此外,還應(yīng)該了解,雖然開發(fā)工作有可能是非常復(fù)雜和費(fèi)時(shí)的,但對(duì)得益于本公開內(nèi)容的本領(lǐng)域技術(shù)人員來(lái)說(shuō),這種開發(fā)工作僅僅是例行的任務(wù)。在此,還需要說(shuō)明的一點(diǎn)是,為了避免因不必要的細(xì)節(jié)而模糊了本發(fā)明,在附圖中僅僅示出了與根據(jù)本發(fā)明的方案密切相關(guān)的設(shè)備結(jié)構(gòu)和/或處理步驟,而省略了與本發(fā)明關(guān)系不大的其他細(xì)節(jié)。本發(fā)明提出了一種快速地對(duì)網(wǎng)頁(yè)圖像進(jìn)行文本類和非文本類進(jìn)行分類的方法,再基于此,確定圖像是否為帶地址信息的圖像。在本發(fā)明的方法中,基于應(yīng)用,提出處理的目標(biāo)類型如下:背景顏色單一;不同行間的文本顏色可能不同。如圖1A示出了較為常用的一類圖片,其被歸為本發(fā)明的目標(biāo)圖片,即被確定為帶有地址信息的圖像,而圖1B示出了不常用的類型的圖片,本發(fā)明對(duì)這些圖片暫不處理。針對(duì)上述目標(biāo),本文提出了一種圖像分類算法:首先,進(jìn)行預(yù)處理,如二值化和cc(連通部件)提取,然后濾噪后建立新的二值化圖;其次,利用行投影對(duì)文本行進(jìn)行聚類;再次,在每行中對(duì)cc進(jìn)行重新排列校驗(yàn);最終輸出圖像的標(biāo)簽:帶地址信息或不帶地址信息的圖像。和傳統(tǒng)方法相比,本方法具有如下優(yōu)勢(shì):1、按行對(duì)cc進(jìn)行排列,并重組合;2、多種特征被采用:如連接線的特征,每組cc之間的顏色差異等;3、利用一種新的抗噪方法對(duì)cc邊緣的色散像素進(jìn)行濾除,保留cc主要顏色,基于此提出一種新的顏色相似度度量方法。下面結(jié)合附圖詳細(xì)說(shuō)明根據(jù)本發(fā)明的實(shí)施例的用于確定圖像是否為帶地址信息的圖像的方法和裝置。下文中的描述按如下順序進(jìn)行:1.用于確定圖像是否為帶地址信息的圖像的方法2.用于確定圖像是否為帶地址信息的圖像的裝置3.用以實(shí)施本申請(qǐng)的方法和裝置的計(jì)算設(shè)備[1.用于確定圖像是否為帶地址信息的圖像的方法]圖2示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于確定圖像是否為帶地址信息的圖像的方法200的示例性過(guò)程的流程圖。首先,在步驟S202中,對(duì)原始圖像進(jìn)行預(yù)處理。具體地,對(duì)原始圖像進(jìn)行二值化得到二值化圖像并提取二值化圖像中的連通部件。接著,在步驟S204中,對(duì)連通部件進(jìn)行濾噪,并且對(duì)濾噪后的連通部件中的重疊的連通部件進(jìn)行融合,建立新的二值化圖像。在一個(gè)示例中,對(duì)連通部件進(jìn)行濾噪可以包括通過(guò)連通部件的幾何性質(zhì)來(lái)過(guò)濾邊框cc、直線cc以及小尺寸cc等。幾何性質(zhì)可以為:例如,連通部件的占空比、連通部件的面積以及連通部件的變化率。連通部件的占空比為連通部件的像素?cái)?shù)目與連通部件的面積之比。連通部件的變化率R可以定義如下。這里以x方向?yàn)槔?,先?jì)算前景連通部件的x方向直方圖H,令V=∑|H(i)–H(i+1)|>0,i∈{0,…,W-1},即,從連通部件的第1個(gè)像素開始,如果相鄰的兩個(gè)像素的直方圖之差的絕對(duì)值大于0,則對(duì)其進(jìn)行加和,直至第W個(gè)像素(W為連通部件的寬度),則變化率R=V/W。y方向的計(jì)算與x方向類似,在此不再贅述。根據(jù)邊框cc、直線cc等的變化率特性,可以過(guò)濾掉邊框cc、直線cc。對(duì)濾噪后的連通部件中的重疊的連通部件進(jìn)行融合具體為:如果兩個(gè) 連通部件具有重疊區(qū)域,則將其融合為單個(gè)連通部件,對(duì)此步驟進(jìn)行迭代直到不存在重疊的連通部件。基于濾噪后的連通部件可以建立新的二值化圖像。接著,在步驟S206中,對(duì)新的二值化圖像進(jìn)行行投影得到多個(gè)行。因?yàn)榘刂沸畔⒌膱D像會(huì)包含直方圖的波谷,因此可以檢測(cè)圖像的直方圖是否存在波谷,如果存在波谷,則可以判斷圖像為可能的帶地址信息的圖像,否則將其濾除,不再進(jìn)行處理。對(duì)于可能的帶地址信息的圖像,可以認(rèn)為每個(gè)投影聚類為一行,則多個(gè)投影則代表多個(gè)行。接下來(lái),在多個(gè)行中,驗(yàn)證圖像是否滿足帶地址信息的圖像的特征。在一個(gè)示例中,首先對(duì)多個(gè)行中的連通部件進(jìn)行重排列。具體地,對(duì)于每一行,檢查一列中鄰近的連通部件的高度的和是否小于一行的高度;如果是,則將這些連通部件進(jìn)行融合;然后對(duì)融合之后的每一行的連通部件重新進(jìn)行排列。接著,按照以下各個(gè)步驟來(lái)驗(yàn)證行是否滿足地址文本的特征。步驟S208,根據(jù)每一行中的連通部件的幾何分布來(lái)確定原始圖像中是否存在文本行。步驟S208包括以下子步驟:S2081.首先,連接鄰近的連通部件。S2082.根據(jù)連接線的傾斜度確定此連接線是否為文本行。如果傾斜度小于預(yù)定閾值,且連接的連通部件的個(gè)數(shù)大于該行中的連通部件的總數(shù)的預(yù)定比例,例如一半以上,則確定該行是文本行,否則不是文本行。如果原始圖像中存在文本行,則繼續(xù)執(zhí)行下面的步驟S210,否則直接將此圖像濾除,認(rèn)為其為不帶地址信息的圖像。圖3示出了一個(gè)cc連接。其中,302示出了灰度圖,304示出了行投影,306示出了提取的cc,308示出了cc連接。步驟S210:根據(jù)每行中的連通部件的筆畫寬度和顏色分布來(lái)確定原始圖像是否為帶地址信息的圖像。這里,首先需要將連通部件分類為文本連通部件(textcc)和非文本連通部件(non-textcc),而非文本連通部件又分為類文本連通部件(text-likecc)和不類文本連通部件(non-text-likecc)。步驟S210包括以下子步驟:S2101.對(duì)一行執(zhí)行筆畫寬度變換,來(lái)確定該行中的非文本連通部件和文本連通部件。S2102.對(duì)于文本連通部件,計(jì)算其筆畫寬度,如果一行中的文本連通部件的筆畫寬度的種類超過(guò)預(yù)定種類,例如兩種,則認(rèn)為原始圖像為不帶地址信息的圖像。S2103.對(duì)于非文本連通部件,檢查其顏色分布,如果該連通部件具有多于預(yù)定種類的顏色,例如大于一種顏色,則認(rèn)為該連通部件為不類文本連通部件,否則為類文本連通部件。S2104.如果存在不類文本連通部件,則可以確定原始圖像為不帶地址信息的圖像,否則對(duì)下一行執(zhí)行以上S2101-S2104的步驟。圖4A至圖4C示出了上述不同類型的連通部件。如圖4A中的圖像具有相同的筆畫寬度,則認(rèn)為其是textcc;圖4B中的圖像具有兩種不同的筆畫寬度,則認(rèn)為其是non-textcc;對(duì)于圖4C中的上下兩個(gè)圖像都為non-textcc,由于上部的圖像只有一種顏色,則認(rèn)為其為text-likecc,而下部的圖像有兩種以上的顏色,則認(rèn)為其為non-text-likecc。如果在步驟S210中未將原始圖像確定為不帶地址信息的圖像,則繼續(xù)執(zhí)行步驟S212。步驟S212:根據(jù)每一行中的連通部件的H通道顏色來(lái)確定原始圖像是否為帶地址信息的圖像。在該步驟中,利用HSV圖像中的H通道進(jìn)行顏色相似度判斷,可以將H通道劃分為15個(gè)格子直方圖(12種顏色加黑白灰三色),然后統(tǒng)計(jì)每個(gè)格子計(jì)數(shù)進(jìn)行連通部件的顏色描述。具體地,步驟S212包括以下子步驟:S2121.使用直方圖統(tǒng)計(jì)每一行中的每個(gè)連通部件的H通道顏色,來(lái)確定每個(gè)連通部件的前L個(gè)主要顏色(即直方圖中最多的L維),其中L為大于或等于2的預(yù)定整數(shù)。由于背景的H通道顏色會(huì)影響連通部件的邊界像素,優(yōu)選地,可以計(jì)算背景的H通道顏色,然后對(duì)于連通部件的邊界像素,刪掉其中顏色更接近于背景的像素,也即用背景的H通道顏色擦除前景的連通部件中與背景鄰近的、其H通道顏色與背景的H通道顏色接近的像素。圖5示出了cc邊界像素的濾除效果。圖5中最右側(cè)的圖是對(duì)邊界像素進(jìn)行濾除之后的二 進(jìn)制圖,可以看到在該圖中圖像的邊界更加清晰。然后,在子步驟S2122中,統(tǒng)計(jì)在一行中連通部件的顏色描述的數(shù)目。顏色描述的定義為:對(duì)于一行中的任意兩個(gè)連通部件,如果它們具有K個(gè)相同的主要顏色,則認(rèn)為它們具有相同的顏色描述,其中K為大于0且小于L的整數(shù)。最后,在子步驟S2123中,如果在一行中的連通部件的顏色描述的數(shù)目多于預(yù)定數(shù)目,則確定原始圖像為不帶地址信息的圖像。下面的表一給出了一個(gè)顏色分布示例,在該示例中,定義如果兩個(gè)連同部件至少有一個(gè)主要顏色一致,則可以認(rèn)為二者的顏色相近,即,他們具有相同的顏色描述。當(dāng)一行中的連通部件的顏色描述的數(shù)目多于2時(shí)認(rèn)為原始圖像為不帶地址信息的圖像。CC索引123456主顏色色彩1色彩2色彩1色彩4色彩1..次顏色色彩2色彩1色彩3色彩5色彩4..表一在表1中,cc1、cc2和cc3為顏色相近的cc,而cc4與cc1、cc2、cc3顏色不相近,cc5包括色彩1和色彩4,與cc1、cc2和cc3以及cc4都顏色相近,因此這一行中共有兩種顏色描述??梢哉J(rèn)為原始圖像為帶地址信息的圖像。通過(guò)上述步驟,最后留下來(lái)的圖像被認(rèn)為是帶地址信息的圖像。圖5A-5C示出了基于顏色來(lái)確定圖像是否為帶地址信息的圖像的一個(gè)示例。圖5A是原始圖像,圖5B中的圖片是提取了其中的連通部件,并且在對(duì)該圖片執(zhí)行的步驟S208和步驟S210的處理中都未被確定為不帶地址信息的圖片,然后在步驟S212的處理中,確定其中的連通部件具有三種顏色描述,即圖5C中由三個(gè)橢圓形分別圈出來(lái)的連通部件具有不同的顏色描述,因此,該圖像被認(rèn)為是不帶地址信息的圖像。[2.用于確定圖像是否為帶地址信息的圖像的裝置]圖7是示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于確定圖像是否為帶地址信息的圖像的裝置700的示例性配置的框圖。如圖7所示,確定圖像是否為帶地址信息的圖像的裝置700包括預(yù)處理單元702、濾噪及融合單元704、行投影單元706和地址圖像確定單元708。其中,預(yù)處理單元702被配置為對(duì)原始圖像進(jìn)行二值化得到二值化圖像并提取二值化圖像中的連通部件。濾噪及融合單元704被配置為對(duì)連通部件進(jìn)行濾噪,對(duì)濾噪后的連通部件中的重疊的連通部件進(jìn)行融合,并且建立新的二值化圖像。行投影單元706被配置為對(duì)新的二值化圖像進(jìn)行行投影得到多個(gè)行。地址圖像確定單元708被配置為:根據(jù)每一行中的連通部件的幾何分布來(lái)確定原始圖像中是否存在文本行;如果不存在文本行,則確定原始圖像為不帶地址信息的圖像,否則,進(jìn)一步根據(jù)每行中的連通部件的筆畫寬度和顏色分布來(lái)確定原始圖像是否為帶地址信息的圖像;如果確定原始圖像是帶地址信息的圖像,則再進(jìn)一步根據(jù)每一行中的連通部件的H通道顏色來(lái)確定原始圖像是否為帶地址信息的圖像。其中,濾噪及融合單元704進(jìn)一步被配置為:使用連通部件的占空比、連通部件的面積以及連通部件的變化率中的至少一項(xiàng)來(lái)過(guò)濾邊框連通部件、直線連通部件以及小尺寸連通部件中的至少一項(xiàng)。其中,濾噪及融合單元704進(jìn)一步被配置為:如果兩個(gè)連通部件具有重疊區(qū)域,則將其融合為單個(gè)連通部件;進(jìn)行迭代直到不存在重疊的連通部件。圖8是示出圖7中的地址圖像確定單元708的一種示例性配置的框圖。地址圖像確定單元708包括:基于幾何分布的確定子單元7082、基于筆畫寬度的確定子單元7084和基于顏色的確定子單元7086。其中,基于幾何分布的確定子單元7082被配置為:連接鄰近的連通部件;確定連接線的傾斜度是否小于預(yù)定閾值以及連接的連通部件的個(gè)數(shù)是否大于該行中的連通部件的總數(shù)的預(yù)定比例;如果是,則確定該行是文本行。其中,基于筆畫寬度的確定子單元7084被配置為:對(duì)一行執(zhí)行筆畫寬度變換,來(lái)確定該行中的非文本連通部件和文本連通部件;對(duì)于文本連通部件,計(jì)算其筆畫寬度,如果一行中的文本連通部件的筆畫寬度的種類大于N,則認(rèn)為原始圖像為不帶地址信息的圖像,其中N為第一預(yù)定整數(shù); 對(duì)于非文本連通部件,檢查其顏色分布,如果該連通部件具有多于M種顏色,則認(rèn)為該連通部件為不類文本連通部件,否則為類文本連通部件,其中,M為第二預(yù)定整數(shù);如果存在不類文本連通部件,則確定原始圖像為不帶地址信息的圖像,否則對(duì)下一行執(zhí)行從執(zhí)行筆畫寬度變換開始的上述步驟。其中,基于顏色的確定子單元7086被配置為:使用直方圖統(tǒng)計(jì)每一行中的每個(gè)連通部件的H通道顏色,來(lái)確定每個(gè)連通部件的前L個(gè)主要顏色,其中L為大于或等于2的預(yù)定整數(shù);統(tǒng)計(jì)在一行中連通部件的顏色描述的數(shù)目,其中對(duì)于一行中的任意兩個(gè)連通部件,如果它們具有K個(gè)相同的主要顏色,則認(rèn)為它們具有相同的顏色描述,其中K為大于0且小于L的整數(shù);如果在一行中的連通部件的顏色描述的數(shù)目多于預(yù)定數(shù)目,則確定原始圖像為不帶地址信息的圖像?;陬伾拇_定子單元7086進(jìn)一步被配置為:計(jì)算原始圖像的背景的H通道顏色;以及用背景的H通道顏色擦除前景的連通部件中與背景鄰近的、其H通道顏色與背景的H通道顏色接近的像素。其中,行投影單元706進(jìn)一步被配置為:檢測(cè)新的二值化圖像的直方圖是否存在波谷,如果不存在波谷,則確定原始圖像為不帶地址信息的圖像,否則,認(rèn)為每個(gè)投影聚類為一行。其中,地址圖像確定單元708進(jìn)一步被配置為:對(duì)于每一行,檢查一列中鄰近的連通部件的高度的和是否小于一行的高度;如果是,則將這些連通部件進(jìn)行融合;以及對(duì)融合之后的每一行的連通部件重新進(jìn)行排列。關(guān)于用于確定圖像是否為帶地址信息的圖像的裝置700的各個(gè)部分的操作和功能的細(xì)節(jié)可以參照結(jié)合圖1-6描述的本發(fā)明的用于確定圖像是否為帶地址信息的圖像的方法的實(shí)施例,這里不再詳細(xì)描述。在此需要說(shuō)明的是,圖7-8所示的裝置及其組成單元的結(jié)構(gòu)僅僅是示例性的,本領(lǐng)域技術(shù)人員可以根據(jù)需要對(duì)圖7-8所示的結(jié)構(gòu)框圖進(jìn)行修改。本發(fā)明提出一種用于確定圖像是否為帶地址信息的圖像的方法和裝置。和傳統(tǒng)方法相比,本方法具有如下優(yōu)勢(shì):1、按行對(duì)cc進(jìn)行排列,并重組合;2、多種特征被采用:如連接線的特征,每組cc之間的顏色差異等;3、利用一種新的抗噪方法對(duì)cc邊緣的色散像素進(jìn)行濾除,保留cc主要顏色,基于此提出一種新的顏色相似度度量方法。[3.用以實(shí)施本申請(qǐng)的方法和裝置的計(jì)算設(shè)備]以上結(jié)合具體實(shí)施例描述了本發(fā)明的基本原理,但是,需要指出的是,對(duì)本領(lǐng)域的普通技術(shù)人員而言,能夠理解本發(fā)明的方法和裝置的全部或者任何步驟或者部件,可以在任何計(jì)算裝置(包括處理器、存儲(chǔ)介質(zhì)等)或者計(jì)算裝置的網(wǎng)絡(luò)中,以硬件、固件、軟件或者它們的組合加以實(shí)現(xiàn),這是本領(lǐng)域普通技術(shù)人員在閱讀了本發(fā)明的說(shuō)明的情況下運(yùn)用他們的基本編程技能就能實(shí)現(xiàn)的。因此,本發(fā)明的目的還可以通過(guò)在任何計(jì)算裝置上運(yùn)行一個(gè)程序或者一組程序來(lái)實(shí)現(xiàn)。所述計(jì)算裝置可以是公知的通用裝置。因此,本發(fā)明的目的也可以僅僅通過(guò)提供包含實(shí)現(xiàn)所述方法或者裝置的程序代碼的程序產(chǎn)品來(lái)實(shí)現(xiàn)。也就是說(shuō),這樣的程序產(chǎn)品也構(gòu)成本發(fā)明,并且存儲(chǔ)有這樣的程序產(chǎn)品的存儲(chǔ)介質(zhì)也構(gòu)成本發(fā)明。顯然,所述存儲(chǔ)介質(zhì)可以是任何公知的存儲(chǔ)介質(zhì)或者將來(lái)所開發(fā)出來(lái)的任何存儲(chǔ)介質(zhì)。在通過(guò)軟件和/或固件實(shí)現(xiàn)本發(fā)明的實(shí)施例的情況下,從存儲(chǔ)介質(zhì)或網(wǎng)絡(luò)向具有專用硬件結(jié)構(gòu)的計(jì)算機(jī),例如圖9所示的通用計(jì)算機(jī)900安裝構(gòu)成該軟件的程序,該計(jì)算機(jī)在安裝有各種程序時(shí),能夠執(zhí)行各種功能等等。在圖9中,中央處理單元(CPU)901根據(jù)只讀存儲(chǔ)器(ROM)902中存儲(chǔ)的程序或從存儲(chǔ)部分908加載到隨機(jī)存取存儲(chǔ)器(RAM)903的程序執(zhí)行各種處理。在RAM903中,也根據(jù)需要存儲(chǔ)當(dāng)CPU901執(zhí)行各種處理等等時(shí)所需的數(shù)據(jù)。CPU901、ROM902和RAM903經(jīng)由總線904彼此鏈路。輸入/輸出接口905也鏈路到總線904。下述部件鏈路到輸入/輸出接口905:輸入部分906(包括鍵盤、鼠標(biāo)等等)、輸出部分907(包括顯示器,比如陰極射線管(CRT)、液晶顯示器(LCD)等,和揚(yáng)聲器等)、存儲(chǔ)部分908(包括硬盤等)、通信部分909(包括網(wǎng)絡(luò)接口卡比如LAN卡、調(diào)制解調(diào)器等)。通信部分909經(jīng)由網(wǎng)絡(luò)比如因特網(wǎng)執(zhí)行通信處理。根據(jù)需要,驅(qū)動(dòng)器910也可鏈路到輸入/輸出接口905??刹鹦督橘|(zhì)911比如磁盤、光盤、磁光盤、半導(dǎo)體存儲(chǔ)器等等根據(jù)需要被安裝在驅(qū)動(dòng)器910上,使得從中讀出的計(jì)算機(jī)程序根據(jù)需要被安裝到存儲(chǔ)部分908中。在通過(guò)軟件實(shí)現(xiàn)上述系列處理的情況下,從網(wǎng)絡(luò)比如因特網(wǎng)或存儲(chǔ)介 質(zhì)比如可拆卸介質(zhì)911安裝構(gòu)成軟件的程序。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,這種存儲(chǔ)介質(zhì)不局限于圖9所示的其中存儲(chǔ)有程序、與設(shè)備相分離地分發(fā)以向用戶提供程序的可拆卸介質(zhì)911??刹鹦督橘|(zhì)911的例子包含磁盤(包含軟盤(注冊(cè)商標(biāo)))、光盤(包含光盤只讀存儲(chǔ)器(CD-ROM)和數(shù)字通用盤(DVD))、磁光盤(包含迷你盤(MD)(注冊(cè)商標(biāo)))和半導(dǎo)體存儲(chǔ)器?;蛘?,存儲(chǔ)介質(zhì)可以是ROM902、存儲(chǔ)部分908中包含的硬盤等等,其中存有程序,并且與包含它們的設(shè)備一起被分發(fā)給用戶。本發(fā)明還提出一種存儲(chǔ)有機(jī)器可讀取的指令代碼的程序產(chǎn)品。指令代碼由機(jī)器讀取并執(zhí)行時(shí),可執(zhí)行上述根據(jù)本發(fā)明實(shí)施例的方法。相應(yīng)地,用于承載上述存儲(chǔ)有機(jī)器可讀取的指令代碼的程序產(chǎn)品的存儲(chǔ)介質(zhì)也包括在本發(fā)明的公開中。存儲(chǔ)介質(zhì)包括但不限于軟盤、光盤、磁光盤、存儲(chǔ)卡、存儲(chǔ)棒等。本領(lǐng)域的普通技術(shù)人員應(yīng)理解,在此所例舉的是示例性的,本發(fā)明并不局限于此。在本說(shuō)明書中,“第一”、“第二”以及“第N個(gè)”等表述是為了將所描述的特征在文字上區(qū)分開,以清楚地描述本發(fā)明。因此,不應(yīng)將其視為具有任何限定性的含義。作為一個(gè)示例,上述方法的各個(gè)步驟以及上述設(shè)備的各個(gè)組成模塊和/或單元可以實(shí)施為軟件、固件、硬件或其組合,并作為相應(yīng)設(shè)備中的一部分。上述裝置中各個(gè)組成模塊、單元通過(guò)軟件、固件、硬件或其組合的方式進(jìn)行配置時(shí)可使用的具體手段或方式為本領(lǐng)域技術(shù)人員所熟知,在此不再贅述。作為一個(gè)示例,在通過(guò)軟件或固件實(shí)現(xiàn)的情況下,可以從存儲(chǔ)介質(zhì)或網(wǎng)絡(luò)向具有專用硬件結(jié)構(gòu)的計(jì)算機(jī)(例如圖9所示的通用計(jì)算機(jī)900)安裝構(gòu)成該軟件的程序,該計(jì)算機(jī)在安裝有各種程序時(shí),能夠執(zhí)行各種功能等。在上面對(duì)本發(fā)明具體實(shí)施例的描述中,針對(duì)一種實(shí)施方式描述和/或示出的特征可以以相同或類似的方式在一個(gè)或更多個(gè)其他實(shí)施方式中使用,與其他實(shí)施方式中的特征相組合,或替代其他實(shí)施方式中的特征。應(yīng)該強(qiáng)調(diào),術(shù)語(yǔ)“包括/包含”在本文使用時(shí)指特征、要素、步驟或組件 的存在,但并不排除一個(gè)或更多個(gè)其他特征、要素、步驟或組件的存在或附加。此外,本發(fā)明的方法不限于按照說(shuō)明書中描述的時(shí)間順序來(lái)執(zhí)行,也可以按照其他的時(shí)間順序地、并行地或獨(dú)立地執(zhí)行。因此,本說(shuō)明書中描述的方法的執(zhí)行順序不對(duì)本發(fā)明的技術(shù)范圍構(gòu)成限制。本發(fā)明及其優(yōu)點(diǎn),但是應(yīng)當(dāng)理解在不超出由所附的權(quán)利要求所限定的本發(fā)明的精神和范圍的情況下可以進(jìn)行各種改變、替代和變換。而且,本發(fā)明的范圍不僅限于說(shuō)明書所描述的過(guò)程、設(shè)備、手段、方法和步驟的具體實(shí)施例。本領(lǐng)域內(nèi)的普通技術(shù)人員從本發(fā)明的公開內(nèi)容將容易理解,根據(jù)本發(fā)明可以使用執(zhí)行與在此的相應(yīng)實(shí)施例基本相同的功能或者獲得與其基本相同的結(jié)果的、現(xiàn)有和將來(lái)要被開發(fā)的過(guò)程、設(shè)備、手段、方法或者步驟。因此,所附的權(quán)利要求旨在在它們的范圍內(nèi)包括這樣的過(guò)程、設(shè)備、手段、方法或者步驟?;谝陨系恼f(shuō)明,可知公開至少公開了以下技術(shù)方案:1、一種確定圖像是否為帶地址信息的圖像的方法,包括:對(duì)原始圖像進(jìn)行二值化得到二值化圖像并提取所述二值化圖像中的連通部件;對(duì)所述連通部件進(jìn)行濾噪,對(duì)濾噪后的連通部件中的重疊的連通部件進(jìn)行融合,并且建立新的二值化圖像;對(duì)所述新的二值化圖像進(jìn)行行投影得到多個(gè)行;根據(jù)每一行中的連通部件的幾何分布來(lái)確定原始圖像中是否存在文本行;如果不存在文本行,則確定所述原始圖像為不帶地址信息的圖像,否則,進(jìn)一步根據(jù)每行中的連通部件的筆畫寬度和顏色分布來(lái)確定所述原始圖像是否為帶地址信息的圖像;如果未將所述原始圖像確定為不帶地址信息的圖像,則再進(jìn)一步根據(jù)每一行中的連通部件的H通道顏色來(lái)確定所述原始圖像是否為帶地址信息的圖像。2、根據(jù)附記1所述的方法,其中,對(duì)所述連通部件進(jìn)行濾噪包括:使用連通部件的占空比、連通部件的面積以及連通部件的變化率中的至少一項(xiàng)來(lái)過(guò)濾邊框連通部件、直線連通部件以及小尺寸連通部件中的至少一項(xiàng)。3、根據(jù)附記1所述的方法,其中,對(duì)濾噪后的連通部件中的重疊的連通部件進(jìn)行融合包括:如果兩個(gè)連通部件具有重疊區(qū)域,則將其融合為單個(gè)連通部件;進(jìn)行迭代直到不存在重疊的連通部件。4、根據(jù)附記1所述的方法,其中,根據(jù)每一行中的連通部件的幾何分布來(lái)確定原始圖像中是否存在文本行包括:連接鄰近的連通部件;確定連接線的傾斜度是否小于預(yù)定閾值以及連接的連通部件的個(gè)數(shù)是否大于該行中的連通部件的總數(shù)的預(yù)定比例;如果是,則確定該行是文本行。5、根據(jù)附記1所述的方法,其中,根據(jù)每行中的連通部件的筆畫寬度和顏色分布來(lái)確定所述原始圖像是否為帶地址信息的圖像包括:對(duì)一行執(zhí)行筆畫寬度變換,來(lái)確定該行中的非文本連通部件和文本連通部件;對(duì)于文本連通部件,計(jì)算其筆畫寬度,如果一行中的文本連通部件的筆畫寬度的種類大于N,則認(rèn)為所述原始圖像為不帶地址信息的圖像,其中N為第一預(yù)定整數(shù);對(duì)于非文本連通部件,檢查其顏色分布,如果該連通部件具有多于M種顏色,則認(rèn)為該連通部件為不類文本連通部件,否則為類文本連通部件,其中,M為第二預(yù)定整數(shù);如果存在不類文本連通部件,則確定所述原始圖像為不帶地址信息的圖像,否則對(duì)下一行執(zhí)行從執(zhí)行筆畫寬度變換開始的上述步驟。6、根據(jù)附記1所述的方法,其中,根據(jù)每一行中的連通部件的H通道顏色來(lái)確定所述原始圖像是否為帶地址信息的圖像包括:使用直方圖統(tǒng)計(jì)每一行中的每個(gè)連通部件的H通道顏色,來(lái)確定每個(gè)連通部件的前L個(gè)主要顏色,其中L為大于或等于2的預(yù)定整數(shù);統(tǒng)計(jì)在一行中連通部件的顏色描述的數(shù)目,其中對(duì)于一行中的任意兩個(gè)連通部件,如果它們具有K個(gè)相同的主要顏色,則認(rèn)為它們具有相同的顏色描述,其中K為大于0且小于L的整數(shù);如果在一行中的連通部件的顏色描述的數(shù)目多于預(yù)定數(shù)目,則確定所述原始圖像為不帶地址信息的圖像。7、根據(jù)附記6所述的方法,其中,使用直方圖統(tǒng)計(jì)每一行中的每個(gè)連通部件的H通道顏色之后還包括:計(jì)算所述原始圖像的背景的H通道顏色;以及用背景的H通道顏色擦除前景的連通部件中與背景鄰近的、其H通道顏色與背景的H通道顏色接近的像素。8、根據(jù)附記1所述的方法,其中,對(duì)所述新的二值化圖像進(jìn)行行投影得到多個(gè)行包括:檢測(cè)所述新的二值化圖像的直方圖是否存在波谷,如果不存在波谷,則確定所述原始圖像為不帶地址信息的圖像,否則,認(rèn)為每個(gè)投影聚類為一行。9、根據(jù)附記1所述的方法,其中,對(duì)所述二值化圖像進(jìn)行行投影得到多個(gè)行之后還包括:對(duì)于每一行,檢查一列中鄰近的連通部件的高度的和是否小于一行的高度;如果是,則將這些連通部件進(jìn)行融合;以及對(duì)融合之后的每一行的連通部件重新進(jìn)行排列。10、一種確定圖像是否為帶地址信息的圖像的裝置,包括:預(yù)處理單元,被配置為對(duì)原始圖像進(jìn)行二值化得到二值化圖像并提取所述二值化圖像中的連通部件;濾噪及融合單元,被配置為對(duì)所述連通部件進(jìn)行濾噪,對(duì)濾噪后的連通部件中的重疊的連通部件進(jìn)行融合,并且建立新的二值化圖像;行投影單元,被配置為對(duì)所述新的二值化圖像進(jìn)行行投影得到多個(gè)行;以及地址圖像確定單元,被配置為:根據(jù)每一行中的連通部件的幾何分布來(lái)確定原始圖像中是否存在文本行;如果不存在文本行,則確定所述原始圖像為不帶地址信息的圖像,否則,進(jìn)一步根據(jù)每行中的連通部件的筆畫寬度和顏色分布來(lái)確定所述原始圖像是否為帶地址信息的圖像;如果確定所述原始圖像是帶地址信息的圖像,則再進(jìn)一步根據(jù)每一行中的連通部件的H通道顏色來(lái)確定所述原始圖像是否為帶地址信息的圖像。11、根據(jù)附件10所述的裝置,其中,所述濾噪及融合單元進(jìn)一步被配置為:使用連通部件的占空比、連通部件的面積以及連通部件的變化率中的至少一項(xiàng)來(lái)過(guò)濾邊框連通部件、直線連通部件以及小尺寸連通部件中的至少一項(xiàng)。12、根據(jù)附件10所述的裝置,其中,所述濾噪及融合單元進(jìn)一步被配置為:如果兩個(gè)連通部件具有重疊區(qū)域,則將其融合為單個(gè)連通部件;進(jìn)行迭代直到不存在重疊的連通部件。13、根據(jù)附記10所述的裝置,其中,所述地址圖像確定單元進(jìn)一步包括基于幾何分布的確定子單元,所述基于幾何分布的確定子單元被配置為:連接鄰近的連通部件;確定連接線的傾斜度是否小于預(yù)定閾值以及連接的連通部件的個(gè)數(shù)是否大于該行中的連通部件的總數(shù)的預(yù)定比例;如果是,則確定該行是文本行。14、根據(jù)附記10所述的裝置,其中,所述地址圖像確定單元進(jìn)一步包括基于筆畫寬度的確定子單元,所述基于筆畫寬度的確定子單元被配置為:對(duì)一行執(zhí)行筆畫寬度變換,來(lái)確定該行中的非文本連通部件和文本連通部件;對(duì)于文本連通部件,計(jì)算其筆畫寬度,如果一行中的文本連通部件的筆畫寬度的種類大于N,則認(rèn)為所述原始圖像為不帶地址信息的圖像,其中N為第一預(yù)定整數(shù);對(duì)于非文本連通部件,檢查其顏色分布,如果該連通部件具有多于M種顏色,則認(rèn)為該連通部件為不類文本連通部件,否則為類文本連通部件,其中,M為第二預(yù)定整數(shù);如果存在不類文本連通部件,則確定所述原始圖像為不帶地址信息的圖像,否則對(duì)下一行執(zhí)行從執(zhí)行筆畫寬度變換開始的上述步驟。15、根據(jù)附記10所述的裝置,其中,所述地址圖像確定單元進(jìn)一步包括基于顏色的確定子單元,所述基于顏色的確定子單元被配置為:使用直方圖統(tǒng)計(jì)每一行中的每個(gè)連通部件的H通道顏色,來(lái)確定每個(gè)連通部件的前L個(gè)主要顏色,其中L為大于或等于2的預(yù)定整數(shù);統(tǒng)計(jì)在一行中連通部件的顏色描述的數(shù)目,其中對(duì)于一行中的任意兩個(gè)連通部件,如果它們具有K個(gè)相同的主要顏色,則認(rèn)為它們具有相同的顏色描述,其中K為大于0且小于L的整數(shù);如果在一行中的連通部件的顏色描述的數(shù)目多于預(yù)定數(shù)目,則確定所述原始圖像為不帶地址信息的圖像。16、根據(jù)附記15所述的裝置,其中,所述基于顏色的確定子單元進(jìn)一步被配置為:計(jì)算所述原始圖像的背景的H通道顏色;以及用背景的H通道顏色擦除前景的連通部件中與背景鄰近的、其H通道顏色與背景的H通道顏色接近的像素。17、根據(jù)附記10所述的裝置,其中,所述行投影單元進(jìn)一步被配置為:檢測(cè)所述新的二值化圖像的直方圖是否存在波谷,如果不存在波谷,則確定所述原始圖像為不帶地址信息的圖像,否則,認(rèn)為每個(gè)投影聚類為一行。18、根據(jù)附記10所述的裝置,其中,所述地址圖像確定單元進(jìn)一步被配置為:對(duì)于每一行,檢查一列中鄰近的連通部件的高度的和是否小于一行的高度;如果是,則將這些連通部件進(jìn)行融合;以及對(duì)融合之后的每一行的連通部件重新進(jìn)行排列。當(dāng)前第1頁(yè)1 2 3 
當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
江孜县| 郯城县| 合山市| 罗平县| 石楼县| 南充市| 福安市| 当雄县| 南京市| 桂阳县| 元江| 嘉义市| 天津市| 柏乡县| 江山市| 亳州市| 尼勒克县| 德格县| 清流县| 湘西| 江陵县| 同仁县| 南漳县| 大新县| 淳化县| 土默特右旗| 庆元县| 龙泉市| 科技| 徐闻县| 米林县| 钦州市| 南康市| 清镇市| 南皮县| 西充县| 达日县| 灵山县| 新野县| 陈巴尔虎旗| 连江县|