耿瑞芳(1965-)
女, 山東淄博人,副教授,工學(xué)學(xué)士。(北京聯(lián)合大學(xué)生物化學(xué)工程學(xué)院,北京 100023),主要研究方向?yàn)闄z測(cè)儀表及自動(dòng)化,計(jì)算機(jī)控制,視覺(jué)技術(shù)。
摘要:本文介紹了一種采用Blob算法實(shí)現(xiàn)圖像識(shí)別的方法,在此基礎(chǔ)上提出識(shí)別規(guī)定形狀物體的方法,利用不變矩、圖形的面積和周長(zhǎng)的比值來(lái)識(shí)別物體的形狀,從而從多個(gè)規(guī)則物體中識(shí)別出規(guī)定形狀的物體,同時(shí)利用該算法還能夠給出所識(shí)別物體的位置信息。實(shí)驗(yàn)結(jié)果表明,該圖像識(shí)別算法能夠滿足實(shí)際要求,物體識(shí)別準(zhǔn)確率達(dá)到100%。
關(guān)鍵詞:機(jī)器視覺(jué);不變矩;圖像識(shí)別
Abstract: The paper introduces an image identified-method based on the Blob algorithm. Based this algorithm, we propose the method to recognize the regular objects by the moment invariables and invariable of the ratio of area and girth. This method can identify the stipulation shape object among regular objects, and can identify the positional information of the identified object. The experiments shows that the image identified algorithm can meet the requirements, and the recognition rate can reach 100%.
Key words: robot-vision;invariability moment;image identification
1 引言
機(jī)器視覺(jué)就是用機(jī)器代替人眼來(lái)做測(cè)量和判斷。機(jī)器視覺(jué)系統(tǒng)是指通過(guò)機(jī)器視覺(jué)產(chǎn)品(即圖像攝取裝置,分CMOS和CCD兩種)將被攝取目標(biāo)轉(zhuǎn)換成圖像信號(hào),傳送給專用的圖像處理系統(tǒng),根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號(hào);圖像系統(tǒng)對(duì)這些信號(hào)進(jìn)行各種運(yùn)算來(lái)抽取目標(biāo)的特征,進(jìn)而根據(jù)判別的結(jié)果來(lái)控制現(xiàn)場(chǎng)的設(shè)備動(dòng)作。
機(jī)器視覺(jué)系統(tǒng)的特點(diǎn)是提高生產(chǎn)的柔性和自動(dòng)化程度。在現(xiàn)代自動(dòng)化生產(chǎn)過(guò)程中,將機(jī)器視覺(jué)系統(tǒng)廣泛地用于工況監(jiān)視、成品檢驗(yàn)和質(zhì)量控制等領(lǐng)域。
本文中的系統(tǒng)主要是利用VC智能攝像機(jī)進(jìn)行圖像采集,并利用Blob算法對(duì)采集到的圖像進(jìn)行處理,在幾個(gè)不同形狀的物體中識(shí)別出要抓取的物體,并救出其位置信息,然后將此信息傳遞給機(jī)械手驅(qū)動(dòng)器,由其控制機(jī)械手準(zhǔn)確地抓取該目標(biāo)物。
BLOB算法是在一塊區(qū)域內(nèi)把出現(xiàn)“灰度突變”的范圍找出來(lái),并確定其大小、形狀、面積及準(zhǔn)確位置等;該算法適用圖像質(zhì)量較高,能較好地進(jìn)行圖像閾值分割的場(chǎng)合,具有速度快,實(shí)時(shí)性好的特點(diǎn)[1]。
圖像處理是指把圖像變換成其它圖像的操作,包括圖像的變換、增強(qiáng)、復(fù)原、匹配、濾波等技術(shù)。它們都是對(duì)輸入圖像的某種有效的改善,其輸出仍然是一幅完整的圖像[2]。
由于本文涉及的機(jī)械手系統(tǒng)有一個(gè)攝像機(jī),而且做規(guī)則物體的識(shí)別,所以最終只是圖形的識(shí)別。
2 圖像特征提取
圖像的幾何特征在圖像分析中起著十分重要的作用。在許多圖像系統(tǒng)應(yīng)用中,經(jīng)常使用區(qū)域的一些幾何特征,如大小、位置和方向等來(lái)確定物體的位置并識(shí)別它們[3]。二值圖像能給出物體的輪廓信息,因此適合于圖像幾何特征的提取。
當(dāng)圖像為二值圖像時(shí),可用矩來(lái)描述圖像中一些區(qū)域的形狀特征。區(qū)域R的(i,j)階矩可由式(1)求出
(1)
式(1)中參加運(yùn)算的點(diǎn)(x,y)都是區(qū)域R的內(nèi)點(diǎn)或邊界點(diǎn)。因此,區(qū)域的M00即是區(qū)域的像素點(diǎn)數(shù)。x方向和y方向的一階矩分別由式(2)、(3)求得
(2)
(3)
由于用式(1)描述區(qū)域的形狀對(duì)區(qū)域的平移、旋轉(zhuǎn)、尺度變換不具有不變特性,因此需要對(duì)該矩進(jìn)行變化處理。首先將坐標(biāo)點(diǎn)移到區(qū)域的形心,重新計(jì)算區(qū)域的中心矩,計(jì)算方法如式(4)。
(4)
其中為區(qū)域R的形心,由式(5)、(6)求得
(5)
(6)
中心矩雖然對(duì)區(qū)域平移具有不變性,但對(duì)旋轉(zhuǎn)和尺度變化依然敏感,可通過(guò)對(duì)
進(jìn)行歸一化得到尺度的不變性。歸一化中心矩定義為式(7)。
(7)
由式(7)可求出一組歸一化的中心矩,同樣將中心矩歸一化進(jìn)行組合,可獲得如式(8)~(13)所示的6個(gè)不變的矩組合。
(8)
(9)
(10)
(11)
(13)
當(dāng)區(qū)域進(jìn)行平移、旋轉(zhuǎn)、尺度變換時(shí),這些不變矩是不變的。不變矩具備了良好的形狀特征。
3 物體圖像的識(shí)別
模式識(shí)別是指對(duì)一系列過(guò)程或事件的分類與描述。從一幅含有多個(gè)物體的數(shù)字圖像中識(shí)別某一事物的過(guò)程,一般需要3個(gè)階段:第一階段為圖像分割或分離階段;第二階段為特征提取;第三階段為分類或決策[4] 。圖像被采集進(jìn)來(lái)時(shí)進(jìn)行二值化處理,再用Blob算法將目標(biāo)和背景進(jìn)行分離,同時(shí)進(jìn)行特征提取,特征包括圖形的不變矩、面積和周長(zhǎng),最后進(jìn)行分類識(shí)別。
本文涉及的物體圖像都為規(guī)則幾何圖形。此圖形的邊緣輪廓幾乎包含了該物體幾何形狀的所有信息。因?yàn)檫@里考慮的是規(guī)則圖形的識(shí)別,在規(guī)則圖形中其周長(zhǎng)與面積有固定的比例關(guān)系,見(jiàn)式(14)。
(14)
式中P為周長(zhǎng), S為圖形面積。
采用式(14)的比例公式并結(jié)合不變矩的圖形識(shí)別算法,可判斷出指定物體圖形的形狀。
最簡(jiǎn)單的面積計(jì)算方法是統(tǒng)計(jì)邊界內(nèi)部的像素?cái)?shù)目,在這個(gè)定義下面積的計(jì)算非常簡(jiǎn)單,求出域邊界內(nèi)像素點(diǎn)的總和即可。計(jì)算公式如式(15)。
(15)
這里的f (x,y)為二值圖像,其取值“0”時(shí)表示物體,取值“1”時(shí)表示背景,其面積就是統(tǒng)計(jì)的f (x,y)=0個(gè)數(shù)。
在算法中數(shù)值化的二值圖像用坐標(biāo)( x, y) 表示像素點(diǎn)的位置,值為“1”表示空白像素點(diǎn),值為“0”表示圖像經(jīng)過(guò)的像素點(diǎn)。通過(guò)灰度值判別是否為像素點(diǎn)。 對(duì)于每個(gè)像素點(diǎn)利用八鄰域的方法進(jìn)行跟蹤,判斷其是否為邊緣點(diǎn),從而求取周長(zhǎng)P。
根據(jù)以上相關(guān)的算法很容易得到:一個(gè)圖形邊緣的像素點(diǎn)代表圖形的周長(zhǎng)P,整體部分像素點(diǎn)的個(gè)數(shù)總和代表圖形的面積S,根據(jù)二者像素點(diǎn)的比值,結(jié)合不變矩識(shí)別方法可以很容易的確定其為哪種形狀的圖形。
在處理過(guò)程中,Blob并不是分析單個(gè)的像素,而是對(duì)圖像的行進(jìn)行操作,圖像的每一行都用游程長(zhǎng)度編碼(RLC)來(lái)表示相鄰的目標(biāo)范圍。所謂游程長(zhǎng)度編碼(RLC)就是根據(jù)黑白像素的長(zhǎng)度進(jìn)行編碼,其方法是按不同長(zhǎng)度段發(fā)生的概率而分配不同長(zhǎng)度的碼段。這種方法與基于像素的算法相比,算法簡(jiǎn)單而快速,可以檢測(cè)出目標(biāo)物的形態(tài)參數(shù)如區(qū)域面積、質(zhì)心、周長(zhǎng)、尺寸、方位、數(shù)量等。
4 圖像識(shí)別結(jié)果
利用Blob算法對(duì)圖像中的指定物體進(jìn)行識(shí)別,結(jié)果如圖1、圖2所示。
圖1-1 圖像識(shí)別結(jié)果
圖1-2 被識(shí)別出物體的位置信息
圖1 從2個(gè)物體中識(shí)別出正六棱柱體
圖2-1 圖像識(shí)別結(jié)果
圖2-2 被識(shí)別出物體的位置信息
圖2 從3個(gè)物體中識(shí)別出正三棱柱體
上圖中帶“十”字號(hào)的圖形為要求識(shí)別的物體形狀。同時(shí)用該“十”字號(hào)標(biāo)出了被識(shí)別物體在圖像上的中心坐標(biāo),以便給機(jī)械手的動(dòng)作提供準(zhǔn)確的位置信息。
5 小結(jié)
圖像的識(shí)別有很多種方法:如統(tǒng)計(jì)模式識(shí)別、結(jié)構(gòu)模式識(shí)別、模糊模式識(shí)別、神經(jīng)網(wǎng)絡(luò)識(shí)別、支撐向量機(jī)識(shí)別等方法。本文提出的基于Blob算法的圖像識(shí)別方法簡(jiǎn)便、準(zhǔn)確,實(shí)驗(yàn)結(jié)果表明,該圖像識(shí)別算法能夠滿足實(shí)際要求,物體識(shí)別準(zhǔn)確率達(dá)到了100%。但對(duì)于復(fù)雜形狀的物體無(wú)法識(shí)別,這一點(diǎn)還有待于進(jìn)一步改進(jìn)。
其他作者:
曹 輝,馬永華,張 罡(北京聯(lián)合大學(xué)生物化學(xué)工程學(xué)院,北京 100023)
參考文獻(xiàn):
[1] 耿瑞芳,沈晉慧,張罡,曹輝,馬永華.基于Blob算法的機(jī)械手視覺(jué)系統(tǒng)[J].自動(dòng)化博覽.2006,5: 24-25.
[2] 陳書(shū)海,傅錄祥.實(shí)用數(shù)字圖像處理[M].科學(xué)出版社,2005.
[3] 劉禾.數(shù)字圖像處理及應(yīng)用[M].北京:中國(guó)電力出版社,2006.
[4] 邊肇琪.模式識(shí)別[M].北京:清華大學(xué)出版社,2000.
[5] 陳書(shū)海,傅錄祥.實(shí)用數(shù)字圖像處理[M].北京:科學(xué)出版社,2005.