1 模式識(shí)別
所謂的模式識(shí)別是指自動(dòng)模式識(shí)別或計(jì)算機(jī)模式識(shí)別。在模式識(shí)別問題中,人們必須首先通過測量來獲得數(shù)據(jù)。例如,為了應(yīng)用模式識(shí)別方法識(shí)別特體表面的特征,必須先測量物體表面上多點(diǎn)的反射光。為了模式識(shí)別問題獲得數(shù)據(jù),不但可能通過物理測量的方式,還可有其它的方式,如經(jīng)濟(jì)數(shù)據(jù)。從廣義上講,測量是把現(xiàn)實(shí)世界的情況映射到參數(shù)域,依據(jù)這種定義,上述后一種方式獲得數(shù)據(jù)也是通過測量獲得的,因此可以說模式識(shí)別是從某種測量開始的,而測量一般來說又是以傳感器開始的。圖1是模式識(shí)別的模型。在模式識(shí)別中,有時(shí)可用常規(guī)或通用的傳感器,例如,語音識(shí)別中測量聲壓的麥克風(fēng)或反射光測量中用的光傳感器等。然而,在很多情況下,必須改進(jìn)現(xiàn)有傳感器或開發(fā)新的傳感器才能產(chǎn)生適當(dāng)?shù)哪J阶R(shí)別信號(hào),從這種意義上講,模式識(shí)別刺激了傳感器的開發(fā)并因此推動(dòng)了儀器測量的發(fā)展。
測量的目的可以是確定某個(gè)變量的數(shù)值以驗(yàn)證某個(gè)物理假設(shè),如石油綜合測井中的油氣顯示。測量數(shù)據(jù)還可被處理并與其它數(shù)據(jù)結(jié)合和比較,以便獲得一個(gè)特定的結(jié)論。這種結(jié)論也可以是簡單的二元決策(是或否),如工業(yè)的質(zhì)量控制或醫(yī)學(xué)檢查。這種結(jié)論可以劃分成很多類,這種多類決策有很多,如醫(yī)學(xué)診斷(哪種???)、粒子物理(產(chǎn)生這種軌跡的粒子是哪種?)或石油測井(哪個(gè)深度有石油生成?)等。在這些例子中,測量的目的不僅是獲得變量的具體數(shù)值,而是生成對變量有意義的解釋。在較為復(fù)雜的情況下,需要使用模式識(shí)別的方法才能使測量獲得這種解釋,因此,模式識(shí)別是測量中的關(guān)鍵步驟之一。模式識(shí)別與儀器測量關(guān)系密切,模式識(shí)別依靠測量又是測量過程中的一部分。在模式識(shí)別中,除了分類外,還可給出數(shù)值估計(jì)或者把類的成員的數(shù)值或概率加到分類結(jié)果中,這更說明模式識(shí)別與儀器測量是緊密相關(guān)的。儀器測量和模式識(shí)別通??闯墒莾缮喜回溠芯款I(lǐng)域,每個(gè)領(lǐng)域都有自己的方法、傳統(tǒng)、雜志和學(xué)術(shù)會(huì)議,然而在很多情況下,跨領(lǐng)域的方法會(huì)很有用,應(yīng)加以鼓勵(lì),如某種模式識(shí)別算法需要與之匹配的測量(如合適的傳感器等),這時(shí)就需要這兩個(gè)領(lǐng)域的專家的密切配合才能獲得成功。
2 模式識(shí)別中模式的可變性
通過對模式識(shí)別的問題的分析,可以把包含一至多個(gè)模式的復(fù)雜的輸入數(shù)據(jù)通過系統(tǒng)的處理在系統(tǒng)的輸出端映射成相應(yīng)模式的類,因此輸出結(jié)果相當(dāng)簡單。某特定模式也未必只映射成一類,可用模糊方法映射成多個(gè)類,每個(gè)類有自己特定的數(shù)值或概率。另外,一個(gè)類可以代表多個(gè)完全不同的輸入情況,這是多對一的映射,可以舉個(gè)明顯的例子,字母A的書寫方法是各種各樣的,但都屬于同一類,即字母“A”。屬于同一類的各個(gè)模式的可變性的起源和內(nèi)容是不相同的,存在于“文化”模式(如文字、汽車、房屋等)中的可變性與人類的習(xí)慣有關(guān)?!白匀弧蹦J绞桥c生物有關(guān)的實(shí)體(如染色體、血細(xì)胞、心電圖等),它們的可變性由自然界決定的。不管是自然模式還是文化模式,實(shí)驗(yàn)環(huán)境和方法及傳感器的不同特性又為它們產(chǎn)生更多的可能性。人們希望測量是使這種附加的可變性盡可能小。
應(yīng)注意到,類的定義通常由人的意愿或傳統(tǒng)所左右,這就影響了哪些不同類型的輸入應(yīng)該結(jié)合在一起形成一個(gè)特定的類。類的定義還與具體的分類目標(biāo)有關(guān),例如,人們可能對一個(gè)景象中的動(dòng)物或交通工具的識(shí)別感興趣,等等。選擇了形成一個(gè)類(具有一個(gè)特定模式)的輸入集以后,這個(gè)集合就構(gòu)成了所謂的“學(xué)習(xí)集”。模式識(shí)別系統(tǒng)必須既能識(shí)別這個(gè)學(xué)習(xí)集的一個(gè)樣本還能識(shí)別所有等效的樣本。與上述識(shí)別過程相反的是一種無監(jiān)督模式識(shí)別問題,即對于給定的類沒有學(xué)習(xí)集,因此這樣的系統(tǒng)必須能借助“簇分析”的技術(shù)教會(huì)自己,以便在輸入的數(shù)據(jù)中能識(shí)別出目標(biāo)較為復(fù)雜的場合,不過這里說的復(fù)雜的場合與簡單的場合之間僅存在一個(gè)“模糊”的邊界,是很難明確區(qū)分的。
3 模式識(shí)別與標(biāo)定測量
標(biāo)定測量常常被認(rèn)為是最基本的沒量方式,在有關(guān)測量的教材中是在開始時(shí)就介紹的。一般來說,這是把未知的實(shí)體與參照實(shí)體的標(biāo)準(zhǔn)集比較。顏色的比較是一個(gè)傳統(tǒng)的例子,如把下一年的小汽車的顏色作為標(biāo)準(zhǔn)集,未知顏色就可獲得標(biāo)準(zhǔn)參照集中相同的(或幾乎相同)顏色的名稱。這個(gè)過程看起來確實(shí)很簡單,只需與標(biāo)準(zhǔn)參照集比較,找出相同(或幾乎相同)的實(shí)體,這種比較是無序的并且不必下具體數(shù)值映射。
可以把標(biāo)定測量過程描述成一個(gè)分類過程,即把輸入數(shù)據(jù)映射到參照集的某個(gè)上。如果在參照集中找不到等價(jià)的實(shí)體,那么這種映射就被放棄。這種標(biāo)定測量與模式識(shí)別的相似性是顯然的。不過標(biāo)定測量中,比較過程是由人完成的,在模式識(shí)別中,這種比較分類過程是借助測量和很復(fù)雜的方法來完成的。并且在模式識(shí)別中,一個(gè)定義好的參照實(shí)體的標(biāo)準(zhǔn)集是不存在的,而需要使用學(xué)習(xí)集才能識(shí)別所有的類或模式。在前面描述標(biāo)定時(shí)用了“幾乎相同”的概念,這與模式識(shí)別中的可變性的概念是相似的。
4 模式識(shí)別方法
由于在一維、二維、三維甚至多維空間中要識(shí)別的模式的種類如此繁多,又由于可能存大很大的可變性,因此存在眾多的模式識(shí)別的方法,包括一些特別的專用方法,這是不足為奇的。下面介紹兩種常用的方法,兩種方法都需要先確定“特征”,但關(guān)于特征性質(zhì)的描述,這兩種方法又完全不同。通過處理從傳感器輸入的數(shù)據(jù),并盡可能地壓縮數(shù)據(jù),可以提取特征。人們希望特征的值能夠反映模式的特征,依靠特征來進(jìn)行數(shù)據(jù)壓縮,在幾乎所有的模式識(shí)別的方法是必須的,這是因?yàn)檩斎氲膫鞲衅鞯臄?shù)據(jù)通常很復(fù)雜且含有很多不相關(guān)的冗余數(shù)據(jù)。在模式識(shí)別的問題中常用到二維圖像,假如一格含有512×512個(gè)象素,用8個(gè)比特表示每個(gè)象素,這樣就是2百萬個(gè)比特還多,因此必須進(jìn)行數(shù)據(jù)壓縮,這需要至少兩步完成,即先生成特征數(shù)據(jù),再根據(jù)特征數(shù)據(jù)通過實(shí)施決策過程找到測量數(shù)據(jù)中包含的類。
高質(zhì)量的特征數(shù)據(jù)的選擇要求有關(guān)于模式的大量的先驗(yàn)知識(shí),如果沒有這種先驗(yàn)知識(shí),就需要采用嘗試的方法,與統(tǒng)計(jì)等方法結(jié)合使用,這需要一個(gè)很大的學(xué)習(xí)集。通常模式識(shí)別方法有以下兩種: 1 統(tǒng)計(jì)方法 它利用了作為特征的一些參數(shù)的數(shù)值,如交通工具的高度和長度、曲線上特征點(diǎn)的坐標(biāo)、染色體的大小和位置。這些值可以通過直接測量獲得,但常常需要進(jìn)行大量的數(shù)據(jù)處理。如果選到了K個(gè)特征值,那么在K維維持特征空間中,要用K個(gè)值來表示一個(gè)點(diǎn)。模式的可變性引起了每個(gè)模式的學(xué)習(xí)集的樣點(diǎn)的分散,這就導(dǎo)致每個(gè)模式擁有一個(gè)樣點(diǎn)簇。好的特征和完全不同的模式使每個(gè)模式的樣點(diǎn)簇分散減小,使不同模式的樣點(diǎn)簇分散減小,并且使不同模式的樣點(diǎn)簇之間的距離相對增大。如果樣點(diǎn)簇間不疊加,那么就可構(gòu)建判別平面,完全把樣點(diǎn)簇分開。如果示知模式的特征空間的樣點(diǎn)靠近樣點(diǎn)簇,就可以做出正確的分類決策。不過,通常樣點(diǎn)特征值擴(kuò)散很大并且樣點(diǎn)簇間的距離很小,樣點(diǎn)簇常常是疊加的。在這種情況下,需要尋找決策算法來構(gòu)建某種最優(yōu)的判別平面,這需要有關(guān)于樣點(diǎn)簇的概率密度的統(tǒng)計(jì)知識(shí)。 2語言符號(hào)法 這種方法是基于把模式分解成基本部分或元素,例如拼在幾何圖形中的直線和曲線段。元素及其位置和它們間的關(guān)系有時(shí)可用一種語法來表達(dá),這與自然語言中的語法相似。人們?yōu)槟J阶R(shí)別已經(jīng)提出了很多不同種類的語法,包括隨機(jī)過程語法,這種語法考慮了模式的可變性。在模式識(shí)別過程中,先確定元素、它們的位置和關(guān)系,然后通過決策即語法分解確定哪種模式識(shí)別語法可以通過先驗(yàn)知識(shí)獲得,也可以從學(xué)習(xí)集中獲得。根據(jù)語法的類型和現(xiàn)有的先驗(yàn)知識(shí),人們已經(jīng)開發(fā)出了很多決策算法。 5 模式識(shí)別問題求解中的傳感器和處理器
由于大部分模式識(shí)別算法都采用數(shù)字法表示,因此在模擬傳感器后總是跟著模/數(shù)轉(zhuǎn)換器。在圖象處理中,對于具有很多象素的圖象,要求采用快速模/數(shù)轉(zhuǎn)換器,并且要配備專用存儲(chǔ)器和處理器。除了光學(xué)圖象外,還有很多其它種類的圖象,如通過核測量、X射線和超聲波、核磁共振或石油測井的各種成象。
通過對這些圖象的處理可以獲得光學(xué)圖象不能提供的不透光實(shí)體的內(nèi)部結(jié)構(gòu)?! ∧J阶R(shí)別問題中應(yīng)用的某些光掃描器與傳統(tǒng)的掃描器有著密切的聯(lián)系,如電視、光陣列掃描器等。飛機(jī)或衛(wèi)星遙感中的掃描器生成的數(shù)據(jù)的波長極窄,可以依靠這些數(shù)據(jù)識(shí)別地質(zhì)、農(nóng)業(yè)、地理或石油等方面的模式,通過實(shí)體視覺方法可以從一個(gè)二維圖象中獲得三維的信息,或通過層析成象的方法從多個(gè)以不同方向透射產(chǎn)生的圖象中獲得這樣的三維的信息。對于處理有限個(gè)三維目標(biāo)的機(jī)器人系統(tǒng),使用與某軸平行的平面光可以在目標(biāo)中產(chǎn)生特別的光照效果,根據(jù)目標(biāo)表面反射的激光束的傳播時(shí)間也可獲得關(guān)于第三維的數(shù)據(jù)信息。
傳感器獲得測量數(shù)據(jù)的同時(shí)也帶來失真,因此在進(jìn)行模式識(shí)別的處理之前需要通過預(yù)處理恢復(fù)測量數(shù)據(jù)。預(yù)處理方法包括反向?yàn)V波、線形最小均方濾波和保邊沿濾波等。為了使特征提取更容易,也可故意在圖象中加入失真,即圖象的增強(qiáng),如側(cè)面高頻濾波可以增強(qiáng)圖象的邊緣,這點(diǎn)對于形狀識(shí)別很重要。對于這樣的預(yù)處理及特征提取,常規(guī)的計(jì)算機(jī)常常速度太慢,因此有些傳感器常需配備專用的處理器或預(yù)處理器,并采用專用軟件、更快的硬件及并行處理等。智能傳感器和處理器(預(yù)處理器)的結(jié)合為實(shí)用系統(tǒng)構(gòu)建快速經(jīng)濟(jì)的組件提供了廣闊的前景。
傳感器的發(fā)展,(預(yù))處理、特征提取和決策算法的發(fā)展使人們可以期望看到模式識(shí)別和電子儀器在實(shí)際中的應(yīng)用不斷地增長。