《模式識(shí)別緒論》PPT課件.ppt
《《模式識(shí)別緒論》PPT課件.ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《《模式識(shí)別緒論》PPT課件.ppt(47頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
,,,,,,,,,,,,,,,模式識(shí)別,2012年2月22日,自動(dòng)化學(xué)院袁立,1,出勤:10%實(shí)驗(yàn):4學(xué)時(shí),兩個(gè)實(shí)驗(yàn),10%考試:80%,開(kāi)卷,課程要求,11:02,2,教材:張學(xué)工等編,《模式識(shí)別》清華大學(xué)出版社,2010年,第3版,參考書(shū):RuchardO.Duda等模式分類(PatternClassification)機(jī)械工業(yè)出版社,2004年,課程要求,11:02,3,模式與模式識(shí)別的概念模式識(shí)別的主要方法監(jiān)督模式識(shí)別與非監(jiān)督模式識(shí)別模式識(shí)別系統(tǒng)的典型構(gòu)成模式識(shí)別系統(tǒng)應(yīng)用舉例,第一章緒論,4,一、模式識(shí)別,1.1模式與模式識(shí)別的概念,直觀,無(wú)所不在兒童認(rèn)數(shù)字:數(shù)字符號(hào)的識(shí)別讀書(shū)看報(bào):文字識(shí)別汽車、火車,狗叫、人語(yǔ):聲音識(shí)別人群中尋找一個(gè)人:根據(jù)面像、形體或其他特征進(jìn)行識(shí)別人類的模式識(shí)別能力是極其平常的,時(shí)刻在完成某種模式識(shí)別的任務(wù)。隨著社會(huì)活動(dòng)以及生產(chǎn)科研的發(fā)展,需要識(shí)別的對(duì)象種類越來(lái)越多,內(nèi)容越來(lái)越復(fù)雜和深入,要求越來(lái)越高。為了減輕工作強(qiáng)度,希望計(jì)算機(jī)代替人來(lái)完成識(shí)別工作;有些場(chǎng)合環(huán)境惡劣、存在危險(xiǎn)或人類不能接近,需要借助機(jī)器、運(yùn)用分析算法進(jìn)行識(shí)別。,11:02,5,,第一章緒論,11:02,6,1.模式識(shí)別(PatternRecognition):使計(jì)算機(jī)模仿人的感知能力,從感知數(shù)據(jù)中提取信息(判別物體和行為)的過(guò)程。模式識(shí)別作為一門學(xué)科,是研究用機(jī)器完成自動(dòng)識(shí)別事物的工作;研究?jī)?nèi)容:使計(jì)算機(jī)做以前只能由人類才能做的事,具備人所具有的、對(duì)各種事物或現(xiàn)象進(jìn)行分析、描述與判斷的部分能力。模式識(shí)別學(xué)科形成于50~60年代,與眾多學(xué)科有聯(lián)系,尤其與人工智能和圖像處理關(guān)系密切。,,1.1模式與模式識(shí)別的概念,2.模式與模式類:模式:需要識(shí)別且可測(cè)量的對(duì)象的描述。這些對(duì)象與實(shí)際的應(yīng)用有關(guān),如:字符識(shí)別的模式——每個(gè)字符圖像人臉識(shí)別的模式——每幅人臉圖像模式類:當(dāng)用一定的度量來(lái)衡量?jī)蓚€(gè)模式,而找不出它們之間的差別時(shí),它們?cè)谶@種度量條件下屬于同一等價(jià)類,就說(shuō)它們是同一模式類。例如:數(shù)字識(shí)別有10個(gè)類別,每個(gè)數(shù)字就是一個(gè)類。不同模式類之間是可以區(qū)分的,應(yīng)有明確界限。,11:02,7,,1.1模式與模式識(shí)別的概念,3.識(shí)別最基本的方法:計(jì)算計(jì)算機(jī)根據(jù)已研制的識(shí)別算法,把輸入的未知模式劃入正確類別中,從而實(shí)現(xiàn)自動(dòng)分類。識(shí)別算法中的關(guān)鍵環(huán)節(jié)就是要對(duì)待識(shí)別事物與標(biāo)準(zhǔn)“模板”的相似程度進(jìn)行計(jì)算。,特征向量表示法:將對(duì)事物進(jìn)行度量的指標(biāo)排成向量的形式。一維表示X1=1.5X2=3二維表示X1=(x1,x2)T=(1,2)TX2=(x1,x2)T=(2,1)T三維表示X1=(x1,x2,x3)T=(1,1,0)TX2=(x1,x2,x3)T=(1,0,1)T蘋(píng)果(重量,直徑,顏色),4.模式描述方法,,圖像的向量表示方法:在計(jì)算機(jī)里分析的稱為數(shù)字圖像,它由排列整齊的二維網(wǎng)格組成,分為若干行與若干列,相當(dāng)于一個(gè)二維數(shù)組,或稱矩陣。我們稱每個(gè)元素為像素。,左圖為57的數(shù)字圖像;一個(gè)數(shù)字就用57共35個(gè)網(wǎng)格是黑是白來(lái)表示;如令是黑為“1”,是白為“0”,那么一個(gè)數(shù)字就可用35維的二進(jìn)制向量表示。這就是典型的特征向量表示法,,1.1模式與模式識(shí)別的概念,結(jié)構(gòu)表示法:由事物的組成成分與相互關(guān)系表示在右側(cè)的圖中八個(gè)基元分別表示0,1,2,3,4,5,6,7,八個(gè)方向和基元線段長(zhǎng)度。則右側(cè)樣本可以表示為X1=006666這種方法將在句法模式識(shí)別中用到。,二、模式識(shí)別簡(jiǎn)史1929年G.Tauschek發(fā)明閱讀機(jī),能夠閱讀0-9的數(shù)字。30年代Fisher提出統(tǒng)計(jì)分類理論,奠定了統(tǒng)計(jì)模式識(shí)別的基礎(chǔ)。統(tǒng)計(jì)模式識(shí)別是模式識(shí)別的主要理論。50年代NoamChemsky提出形式語(yǔ)言理論——傅京蓀提出句法結(jié)構(gòu)模式識(shí)別。60年代L.A.Zadeh提出了模糊集理論,模糊模式識(shí)別方法得以發(fā)展和應(yīng)用。80年代以Hopfield網(wǎng)、BP網(wǎng)為代表的神經(jīng)網(wǎng)絡(luò)模型導(dǎo)致人工神經(jīng)元網(wǎng)絡(luò)復(fù)活,并在模式識(shí)別得到較廣泛的應(yīng)用。90年代小樣本學(xué)習(xí)理論,支持向量機(jī)受到了很大的重視。2000年,流形學(xué)習(xí)(manifoldlearning):流形學(xué)習(xí)就是從高維采樣數(shù)據(jù)中恢復(fù)低維流形結(jié)構(gòu),即找到高維空間中的低維流形,并求出相應(yīng)的嵌入映射,以實(shí)現(xiàn)維數(shù)約簡(jiǎn)或者數(shù)據(jù)可視化.2005年,稀疏表示(sparserepresentation):近年來(lái)有關(guān)生理學(xué)的研究成果表明:人類的視覺(jué)系統(tǒng)具有對(duì)圖像的稀疏表示特性,神經(jīng)元對(duì)于輸入圖像的激活機(jī)制具有高度的稀疏性.,,1.1模式與模式識(shí)別的概念,三.關(guān)于模式識(shí)別的國(guó)內(nèi)、國(guó)際學(xué)術(shù)組織,1973年IEEE發(fā)起了第一次關(guān)于模式識(shí)別的國(guó)際會(huì)議“ICPR”,成立了國(guó)際模式識(shí)別協(xié)會(huì)---“IAPR”,每2年召開(kāi)一次國(guó)際學(xué)術(shù)會(huì)議。1977年IEEE的計(jì)算機(jī)學(xué)會(huì)成立了模式分析與機(jī)器智能(PAMI)委員會(huì),每2年召開(kāi)一次模式識(shí)別與圖象處理學(xué)術(shù)會(huì)議。國(guó)內(nèi)組織:中國(guó)自動(dòng)化學(xué)會(huì):模式識(shí)別與機(jī)器智能(PRMI)專業(yè)委員會(huì),1981年成立,IAPR成員組織;人工智能與模式識(shí)別專業(yè)委員會(huì);中國(guó)人工智能學(xué)會(huì)國(guó)內(nèi)學(xué)術(shù)機(jī)構(gòu):中科院模式識(shí)別國(guó)家重點(diǎn)實(shí)驗(yàn)室,中科院計(jì)算所,微軟研究院,清華大學(xué)等。,11:02,10,,1.1模式與模式識(shí)別的概念,模式識(shí)別學(xué)科位置,模式識(shí)別:計(jì)算機(jī)科學(xué)與電子工程交叉學(xué)科中國(guó):“控制科學(xué)與工程”一級(jí)學(xué)科二級(jí)學(xué)科:控制理論與控制工程、模式識(shí)別與智能系統(tǒng)、系統(tǒng)工程等西方:沒(méi)有自動(dòng)控制系自動(dòng)控制:電子工程系、機(jī)械工程系模式識(shí)別:電子工程系、計(jì)算機(jī)科學(xué)系,四、模式識(shí)別的應(yīng)用多媒體數(shù)據(jù)檢索(文檔、圖像、視頻、音樂(lè)檢索)字符識(shí)別(印刷體字符的識(shí)別;手寫(xiě)體字符的識(shí)別(脫機(jī)/聯(lián)機(jī)),信函分揀、支票查對(duì)、自動(dòng)排板、稿件輸入等)醫(yī)療診斷(心電圖,腦電圖,染色體,癌細(xì)胞識(shí)別,疾病診斷等)工程(產(chǎn)品缺陷檢測(cè)、自動(dòng)導(dǎo)航系統(tǒng)、污染分析)軍事(航空攝像分析、雷達(dá)和聲納信號(hào)檢測(cè)和分類、自動(dòng)目標(biāo)識(shí)別等)安全監(jiān)控(基于生物特征的身份識(shí)別、視頻監(jiān)控、交通監(jiān)控、音視頻監(jiān)聽(tīng)),,1.1模式與模式識(shí)別的概念,現(xiàn)有生物特征識(shí)別類型,11:02,12,,1.1模式與模式識(shí)別的概念,,1.2模式識(shí)別的主要方法,基于知識(shí)的方法(Knowledge-based)AI、專家系統(tǒng)(ExpertSystems)句法(結(jié)構(gòu))模式識(shí)別(SyntaxPRorStructuralPR)(基于結(jié)構(gòu)性描述)基于數(shù)據(jù)的方法(Data-based)統(tǒng)計(jì)模式識(shí)別方法(StatisticalPR)(基于特征向量表示方法)人工神經(jīng)網(wǎng)絡(luò)(ANN)支持向量機(jī)(SVM),統(tǒng)計(jì)模式識(shí)別方法:在確定了描述樣本所采用的特征之后,收集一定數(shù)量的已知樣本,用這些樣本作為訓(xùn)練集來(lái)訓(xùn)練一定的模式識(shí)別機(jī)器,使之在訓(xùn)練后能夠?qū)ξ粗獦颖具M(jìn)行分類。這是基于數(shù)據(jù)的機(jī)器學(xué)習(xí)中研究最多的一個(gè)方向。,統(tǒng)計(jì)模式識(shí)別用函數(shù)表示:Y=F(X)X的定義域取自特征集Y的值域?yàn)轭悇e的標(biāo)號(hào)集F是模式識(shí)別的判別方法有監(jiān)督模式識(shí)別——分類(classification)給出若干已知答案的樣本(訓(xùn)練樣本trainingsamples)由機(jī)器從這些樣本中進(jìn)行學(xué)習(xí)(訓(xùn)練training/learning)學(xué)習(xí)的目的在于從這些樣本中總結(jié)規(guī)律,使之能夠?qū)π碌臉颖具M(jìn)行判斷無(wú)監(jiān)督模式識(shí)別——聚類(clustering)所面對(duì)的只有未知答案的樣本由機(jī)器從這些樣本中進(jìn)行學(xué)習(xí)(自學(xué)習(xí))學(xué)習(xí)的目的在于從這些樣本中發(fā)現(xiàn)規(guī)律,這種規(guī)律應(yīng)該是某種固有的關(guān)系,或者依據(jù)這種規(guī)律對(duì)對(duì)象的分類有某種功用,,1.3監(jiān)督模式識(shí)別與非監(jiān)督模式識(shí)別,1.模式識(shí)別系統(tǒng):執(zhí)行模式識(shí)別的計(jì)算機(jī)系統(tǒng)。,1.4模式識(shí)別系統(tǒng)的典型構(gòu)成,,2.模式識(shí)別系統(tǒng)組成:信息獲取與預(yù)處理,特征提取與選擇、分類或聚類、后處理等四個(gè)部分。,,第一章緒論,1.4模式識(shí)別系統(tǒng)的典型構(gòu)成,,1.4模式識(shí)別系統(tǒng)的典型構(gòu)成,,1.4模式識(shí)別系統(tǒng)的典型構(gòu)成,,監(jiān)督模式識(shí)別系統(tǒng)組成:數(shù)據(jù)獲取,預(yù)處理,特征提取選擇、分類器設(shè)計(jì)以及分類決策五部分。,訓(xùn)練過(guò)程:對(duì)作為訓(xùn)練樣本的量測(cè)數(shù)據(jù)進(jìn)行特征選擇與提取,得到它們?cè)谔卣骺臻g的分布,依據(jù)這些分布決定分類器的具體參數(shù),也就是設(shè)計(jì)分類器的過(guò)程。識(shí)別過(guò)程:分類決策的過(guò)程,則是在特征空間中用統(tǒng)計(jì)方法把被識(shí)別對(duì)象歸為某一類別。,,3.監(jiān)督模式識(shí)別系統(tǒng)構(gòu)成及功能,,(1)信息獲?。河貌煌问降膫鞲衅鳂?gòu)成,實(shí)現(xiàn)信息獲取與信息在不同媒體之間的轉(zhuǎn)換,非電信號(hào)轉(zhuǎn)換成電信號(hào)。,,用話筒將聲音信號(hào)轉(zhuǎn)換成電信號(hào),表現(xiàn)出電壓(電流)隨時(shí)間變化的復(fù)雜波形。景物信息在攝像機(jī)靶面成像并轉(zhuǎn)換成二維的象素矩陣,每個(gè)像素(矩陣元素)的電信號(hào)與物體表面反射的光強(qiáng)或顏色信息呈現(xiàn)函數(shù)關(guān)系,一般輸入對(duì)象的信息有三種類型:二維圖象,如文字、指紋、地圖、照片等一維波形,如腦電圖、心電圖、機(jī)械震動(dòng)波形等物理參量和邏輯值,如疾病診斷中病人體溫,各種化驗(yàn)數(shù)據(jù);或?qū)ΠY狀有無(wú)描述,如疼與不疼(0/1),1.4模式識(shí)別系統(tǒng)的典型構(gòu)成,,(2)預(yù)處理去除所獲取信息中的噪聲,增強(qiáng)有用的信息,及一切必要的使信息純化的處理過(guò)程。預(yù)處理這個(gè)環(huán)節(jié)內(nèi)容很廣泛,與要解決的具體問(wèn)題有關(guān),例如,從圖象中將汽車車牌的號(hào)碼識(shí)別出來(lái),就需要先將車牌從圖像中找出來(lái),再對(duì)車牌進(jìn)行劃分,將每個(gè)數(shù)字分別劃分開(kāi)。做到這一步以后,才能對(duì)每個(gè)數(shù)字進(jìn)行識(shí)別。以上工作都應(yīng)該在預(yù)處理階段完成。,(3)特征選擇和提取功能:對(duì)所獲取的信息實(shí)現(xiàn)從測(cè)量空間到特征空間的轉(zhuǎn)換。將所獲取的原始量測(cè)數(shù)據(jù)轉(zhuǎn)換成能反映事物本質(zhì),并將其最有效分類的特征表示。輸入:原始的量測(cè)數(shù)據(jù)(經(jīng)過(guò)必要的預(yù)處理),例如由聲波變換成的電信號(hào),表現(xiàn)為電壓電流幅度隨時(shí)間的變化,二維圖像每個(gè)像素所具有的灰度值等。輸出:將原始量測(cè)數(shù)據(jù)轉(zhuǎn)換成有效方式表示的信息,從而使分類器能根據(jù)這些信息決定樣本的類別。,1.4模式識(shí)別系統(tǒng)的典型構(gòu)成,,特征選擇和提取:選擇什么樣的方法來(lái)描述事物,從而可以有效、牢靠地把事物正確地區(qū)分開(kāi)。,,,,如令是黑為“1”,是白為“0”,那么一個(gè)數(shù)字就可用35維的二進(jìn)制向量表示。這就是典型的特征向量表示法。,另一種方法則是將數(shù)字用筆劃表示,也就是將它分成一橫加上一斜杠表示。這種表示方法屬于結(jié)構(gòu)表示法范疇。這種方法沒(méi)有前一種方法的缺點(diǎn),但提取這種結(jié)構(gòu)信息也不是一件容易方便的事。,缺點(diǎn):這種表示與網(wǎng)格的尺寸有關(guān),與字的筆劃粗細(xì)有關(guān),更主要的是字在網(wǎng)格中的不同位置與轉(zhuǎn)向有關(guān)。這個(gè)字在網(wǎng)格中略為偏一點(diǎn),其特征向量表示就會(huì)有很大的不一樣。這就說(shuō)明了這種表示的穩(wěn)定性差。,例:印刷體數(shù)字大多通過(guò)掃描儀輸入,或從圖像中獲取。這樣,一個(gè)數(shù)字往往用一個(gè)NM的數(shù)組表示。如果N=5,M=7,則一個(gè)數(shù)字就用57共35個(gè)網(wǎng)格是黑是白來(lái)表示。,1.4模式識(shí)別系統(tǒng)的典型構(gòu)成,,(4)分類器設(shè)計(jì)與分類決策分類器設(shè)計(jì):將該特征空間劃分成由各類占據(jù)的子空間,確定相應(yīng)的決策分界和判決規(guī)則,使按此類判決規(guī)則分類時(shí),錯(cuò)誤率最低。把這些判決規(guī)則建成標(biāo)準(zhǔn)庫(kù)。分類決策:分類器在分界形式及其具體參數(shù)都確定后,用相應(yīng)的決策分界對(duì)待分類樣本進(jìn)行分類決策的過(guò)程。,,,,1.4模式識(shí)別系統(tǒng)的典型構(gòu)成,1.5模式識(shí)別系統(tǒng)實(shí)例,19名男女同學(xué)進(jìn)行體檢,測(cè)量了身高和體重,但事后發(fā)現(xiàn)其中有4人忘記填寫(xiě)性別,試問(wèn)(在最小錯(cuò)誤的條件下)這4人是男是女?體檢數(shù)值如下:,11:02,24,,待識(shí)別的模式:性別(男或女)測(cè)量的特征:身高和體重訓(xùn)練樣本:15名已知性別的樣本特征,模式識(shí)別系統(tǒng)實(shí)例(一),目標(biāo):希望借助于訓(xùn)練樣本的特征建立判別函數(shù)(即數(shù)學(xué)模型)由訓(xùn)練樣本得到的特征空間分布圖:,11:02,25,,從圖中訓(xùn)練樣本的分布情況,找出男、女兩類特征各自的聚類特點(diǎn),從而求取一個(gè)判別函數(shù)(直線或曲線)。只要給出待分類的模式特征的數(shù)值,看它在特征平面上落在判別函數(shù)的哪一側(cè),就可以判別是男還是女了。,1.5模式識(shí)別系統(tǒng)實(shí)例,,11:02,26,,魚(yú)類罐頭加工廠:將傳送帶上的魚(yú)按品種自動(dòng)分類,即把不同的魚(yú)分開(kāi)。魚(yú)的分類:鮭魚(yú)(salmon),鱸魚(yú)(seabass),模式識(shí)別系統(tǒng)實(shí)例(二),數(shù)據(jù)采集:用光學(xué)感知手段,定時(shí)拍攝魚(yú)的數(shù)字圖像,將其傳入計(jì)算機(jī)。預(yù)處理:增強(qiáng)圖像中感興趣的部分,抑制圖像中的噪聲,將不同的魚(yú)、魚(yú)與背景分離開(kāi)來(lái)。特征提?。╢eatureextraction):待分對(duì)象鮭魚(yú)和鱸魚(yú)確實(shí)存在一些差異,比如長(zhǎng)度、寬度、光澤和形狀等。利用類別之間的這些差異來(lái)分類。,1.5模式識(shí)別系統(tǒng)實(shí)例,11:02,27,,模式識(shí)別系統(tǒng)實(shí)例(二),特征提?。╢eatureextraction):待分對(duì)象鮭魚(yú)和鱸魚(yú)確實(shí)存在一些差異,比如長(zhǎng)度、寬度、光澤和形狀等。利用類別之間的這些差異來(lái)分類。特征:從模式中提取的、對(duì)分類有用的特征。特征選擇是模式識(shí)別的核心問(wèn)題之一。分類判別(classification)——單一特征先驗(yàn)知識(shí):鱸魚(yú)一般比鮭魚(yú)長(zhǎng)。因此可以選擇長(zhǎng)度為分類特征;長(zhǎng)度l超過(guò)預(yù)定閾值l*時(shí)判定為鱸魚(yú),否則判定為鮭魚(yú)。如何獲得長(zhǎng)度閾值l*呢?(預(yù)定),1.5模式識(shí)別系統(tǒng)實(shí)例,11:02,28,,模式識(shí)別系統(tǒng)實(shí)例(二),利用特征直方圖獲得長(zhǎng)度閾值l*,直方圖表明:無(wú)論怎樣確定長(zhǎng)度閾值l*,都不能將兩類魚(yú)截然分開(kāi),分類錯(cuò)誤比較嚴(yán)重。通常,單一特征不足以很好分類。,1.5模式識(shí)別系統(tǒng)實(shí)例,11:02,29,,模式識(shí)別系統(tǒng)實(shí)例(二),嘗試?yán)闷渌卣鳎呼~(yú)的光澤度,用x表示。,1.5模式識(shí)別系統(tǒng)實(shí)例,11:02,30,,模式識(shí)別系統(tǒng)實(shí)例(二),利用多個(gè)特征進(jìn)行分類形成特征空間:以每個(gè)特征為坐標(biāo)軸形成的空間。特征的個(gè)數(shù),就是特征空間的維數(shù)。特征向量:特征空間中的一個(gè)點(diǎn)。X=(x1,x2)T表示一條魚(yú),x1代表長(zhǎng)度,x2代表光澤度。分類器設(shè)計(jì):要找到一個(gè)判定邊界,兩類問(wèn)題?判定線判定線把特征空間分為兩個(gè)區(qū)域,識(shí)別時(shí)特征向量落在那個(gè)區(qū)域就判定為相應(yīng)類別。其總分類錯(cuò)誤比單一特征分類器好一些,但仍存在一些錯(cuò)誤的分類。,1.5模式識(shí)別系統(tǒng)實(shí)例,11:02,31,,模式識(shí)別系統(tǒng)實(shí)例(二),分類器的推廣能力:即分類器對(duì)未知模式的正確分類的能力復(fù)雜的分類算法導(dǎo)致復(fù)雜的判定邊界。判決曲線被過(guò)分調(diào)諧到這些訓(xùn)練樣本上,雖然所有訓(xùn)練樣本都被正確分類,但其推廣能力卻很差。比如:圖中的?新模式更像鮭魚(yú),卻被分到鱸魚(yú)類了。,1.5模式識(shí)別系統(tǒng)實(shí)例,11:02,32,,模式識(shí)別系統(tǒng)實(shí)例(二),簡(jiǎn)化分類器設(shè)計(jì)方案分類器設(shè)計(jì)無(wú)需上面那樣復(fù)雜,即便對(duì)訓(xùn)練樣本不能完美識(shí)別,只要對(duì)新模式有足夠的推廣能力就可以接受。分類器如何自動(dòng)產(chǎn)生比較簡(jiǎn)單的判決邊界,使其比上面的直線和復(fù)雜邊界更優(yōu)秀?如何預(yù)測(cè)分類器對(duì)新模式的推廣能力?這些都是模式識(shí)別要研究的問(wèn)題。,1.5模式識(shí)別系統(tǒng)實(shí)例,,模式識(shí)別系統(tǒng)舉例(三):汽車車牌識(shí)別,,,,應(yīng)用領(lǐng)域:自動(dòng)收費(fèi)站,十字路口的違章車輛監(jiān)視等。,主要步驟:(1)圖像獲?。?)車牌的提取和定位(3)字符識(shí)別部分,1.5模式識(shí)別系統(tǒng)實(shí)例,,,,,1.5模式識(shí)別系統(tǒng)實(shí)例,11:02,35,,1.5模式識(shí)別系統(tǒng)實(shí)例,,車牌定位模塊目的:從整幅圖像中定位出車牌的精確位置。利用的信息:是車牌部分的紋理分布,主要利用的是水平和豎直兩個(gè)方向上的邊緣。在車牌部分,邊緣分布比較密集,可以利用這一點(diǎn)提取出候選的車牌區(qū)域,在圖中用方框標(biāo)出。粗略定位的結(jié)果往往不是很準(zhǔn),我們還可以利用顏色的連續(xù)性信息對(duì)定位的結(jié)果進(jìn)行修正。之后輸出的就是候選的車牌位置,這些位置中,只有一個(gè)是真正的車牌。而究竟哪一個(gè)是對(duì)的,要到字符識(shí)別階段才能有結(jié)果。,11:02,36,,1.5模式識(shí)別系統(tǒng)實(shí)例,,字符識(shí)別模塊目的:輸入包括每一個(gè)候選車牌區(qū)域,而通過(guò)它們的輸出評(píng)價(jià),來(lái)把不合適的偽車牌區(qū)域去掉,只把最正確車牌的結(jié)果作為最終結(jié)果輸出出來(lái)。第一部分:字符分割,要把車牌中的一個(gè)個(gè)字符逐一切分開(kāi),這樣才能在下一步的識(shí)別中對(duì)每一個(gè)字符分別處理。分割方法:利用灰度圖像往水平方向的投影。在有數(shù)字或字符的部分,這個(gè)投影值應(yīng)該比較大,而在字符之間的間隙處,投影的累計(jì)值就幾乎為零了。確定是否車牌:如果劃分結(jié)果比較合理,劃分出的每個(gè)字符的寬度都差不多,那么說(shuō)明這個(gè)區(qū)域比較像車牌。如果字體太寬,說(shuō)明是其它的字符。,11:02,37,,1.5模式識(shí)別系統(tǒng)實(shí)例,模板匹配:是把樣本字符與輸入的待識(shí)別字符作匹配,如果兩個(gè)字符很像(在某種距離度量下距離很小),說(shuō)明匹配成功,把這個(gè)模板的對(duì)應(yīng)字符作為輸出結(jié)果。特征提?。菏菍?duì)樣本和待測(cè)圖像都先提取一些明顯的特征,例如對(duì)“5”和“9”考慮其右上角是否封口,這樣作的好處是可以用維數(shù)較低的向量來(lái)描述圖像,而且這些特征都是有代表性,可以用來(lái)區(qū)分不同樣本的。,11:02,38,,第二部分:字符識(shí)別,方法很多:神經(jīng)元網(wǎng)絡(luò),PCA,特征提取及匹配等,模板匹配和特征提取是比較常用的方法。,1.5模式識(shí)別系統(tǒng)實(shí)例,,字符識(shí)別模塊的訓(xùn)練和識(shí)別過(guò)程,11:02,39,,車牌定位模塊的訓(xùn)練和識(shí)別,1.5模式識(shí)別系統(tǒng)實(shí)例,11:02,40,,其它應(yīng)用舉例:人臉檢測(cè)與跟蹤人臉識(shí)別視頻監(jiān)控異常行為分析智能交通,1.5模式識(shí)別系統(tǒng)實(shí)例,智能視覺(jué)物聯(lián)網(wǎng)(SmartVisualInternetofThings,SVIOT),物聯(lián)網(wǎng)是指通過(guò)各種信息傳感設(shè)備,如射頻識(shí)別(RFID)、紅外感應(yīng)器、藥理傳感器、聲音傳感器、圖像視頻傳感器等,實(shí)時(shí)采集其聲、光、熱、電、力學(xué)、化學(xué)、生物、位置等各種需要的信息,與互聯(lián)網(wǎng)結(jié)合形成的一個(gè)巨大網(wǎng)絡(luò)。其目的是實(shí)現(xiàn)物與物、物與人,所有的物品與網(wǎng)絡(luò)的連接,方便識(shí)別、管理和控制。“智能視覺(jué)物聯(lián)網(wǎng)”涉及物聯(lián)網(wǎng)的視覺(jué)感知部分,利用各類圖像獲取傳感器,包括監(jiān)控?cái)z像機(jī)、手機(jī)、數(shù)碼相機(jī),獲取人、車、物圖像或視頻,并采用智能分析技術(shù)對(duì)視覺(jué)信息進(jìn)行處理,為后續(xù)利用提供支撐。智能視覺(jué)物聯(lián)網(wǎng)它是未來(lái)物聯(lián)網(wǎng)中重要組成部分,對(duì)視覺(jué)感知范圍內(nèi)的人、車或其他物件等目標(biāo)賦以“身份”標(biāo)簽并識(shí)別目標(biāo)的實(shí)際“身份”,并利用網(wǎng)絡(luò)化特點(diǎn)對(duì)大范圍中的目標(biāo)標(biāo)簽進(jìn)行關(guān)聯(lián),有效地分析目標(biāo)標(biāo)簽物體的實(shí)時(shí)狀態(tài),感知各類異常事件,就異常事件的發(fā)生向相關(guān)受體提出自動(dòng)警示。,11:02,41,,1.5模式識(shí)別系統(tǒng)實(shí)例,,,11:02,42,,學(xué)習(xí)機(jī)器的學(xué)習(xí)過(guò)程:使用一批包括各類別的訓(xùn)練樣本勾畫(huà)出各種事物在特征空間分布的規(guī)律性確定使用分類的具體數(shù)學(xué)公式及其參數(shù),1.6模式識(shí)別的若干問(wèn)題,第一章緒論,,分類器設(shè)計(jì):求優(yōu)化解的過(guò)程模式識(shí)別中的學(xué)習(xí)與訓(xùn)練是從訓(xùn)練樣本提供的數(shù)據(jù)中找出某種數(shù)學(xué)式子的最優(yōu)解,這個(gè)最優(yōu)解使分類器得到一組參數(shù),按這種參數(shù)設(shè)計(jì)的分類器使人們?cè)O(shè)計(jì)的某種準(zhǔn)則達(dá)到極值。分類器參數(shù)的選擇或?qū)W習(xí)過(guò)程得到的結(jié)果取決于設(shè)計(jì)者選擇什么樣的準(zhǔn)則函數(shù)。不同準(zhǔn)則函數(shù)的最優(yōu)解對(duì)應(yīng)不同的學(xué)習(xí)結(jié)果,得到性能不同的分類器。,,例:兩類訓(xùn)練樣本分布圖中兩類訓(xùn)練樣本的分布體現(xiàn)出近似圓形的分布。因此如能把這兩個(gè)圓形區(qū)域確定下來(lái),將它們的邊界用某種數(shù)學(xué)式子近似,那么落在某一個(gè)圓形內(nèi)的樣本就可以用這種數(shù)學(xué)式子來(lái)判斷。當(dāng)不一定非要精確地表達(dá)不同類樣本分布地聚集區(qū)時(shí)。用一條直線(線性方程)也許可以達(dá)到同樣的目的。滿足直線的方程是一個(gè)線性方程,寫(xiě)成f(x1,x2)=ax1+bx2+c=0,而不在該直線上的點(diǎn)則用f(x1,x2)是否大于零或小于零來(lái)分辨。,1.3模式識(shí)別的若干問(wèn)題,,,一般來(lái)說(shuō),決定使用什么樣的分類函數(shù)往往是人為決定的。對(duì)一個(gè)實(shí)際分類問(wèn)題,快速計(jì)算、快速分類是十分重要的。,兩類樣本在二維特征空間中有相互穿插很難用簡(jiǎn)單的分界線將它們完全分開(kāi)。直線作為分界線?線性分類器對(duì)圖中所示的樣本分布情況,無(wú)論直線參數(shù)如何設(shè)計(jì),總會(huì)有錯(cuò)分類發(fā)生。如果以錯(cuò)分類最小為原則分類,則圖中A直線可能是最佳的分界線,它使錯(cuò)分類的樣本數(shù)量為最小。,,2.模式的緊致性分類器設(shè)計(jì)難易程度與模式在特征空間的分布方式有密切關(guān)系。,1.3模式識(shí)別的若干問(wèn)題,,,,,,(a)(b)(c),例:(a)、(b)與(c)分別表示了兩類在空間分布的三種狀況。其中(a)中兩類樣本存在各自明確的區(qū)域,它們之間的分界線(或面,超曲面)具有簡(jiǎn)單的形式,因而也較易區(qū)分,(b)中兩類雖有各自不同的區(qū)域,但分界面的形式比較復(fù)雜,因而設(shè)計(jì)分類器的難度要大得多,如果遇到(c)類的情況則無(wú)法將它們正確分類。,緊致集:同一類模式類樣本的分布比較集中,沒(méi)有或臨界樣本很少,這樣的模式類稱緊致集。性質(zhì):(1)臨界點(diǎn)的數(shù)量與總的點(diǎn)數(shù)相比很少。(2)集合中任意兩個(gè)內(nèi)點(diǎn)可以用光滑線連接,在該連線上的點(diǎn)也屬于這個(gè)集合。(3)每個(gè)內(nèi)點(diǎn)都有一個(gè)足夠大的鄰域,在該鄰域中只包含同一集合中的點(diǎn)。,,特征提?。焊纳茢?shù)據(jù)的緊致性,1.3模式識(shí)別的若干問(wèn)題,許多問(wèn)題在量測(cè)空間表示時(shí)往往不滿足緊致性。但是如果它們的確是可分的話,這就意味著可以通過(guò)一種變換,使它們?cè)谙鄳?yīng)的特征空間中界線分明,也就是具有了緊致性。模式識(shí)別系統(tǒng)設(shè)計(jì)的任務(wù)就是要尋找這樣一種變換,即選擇一種特征空間,使不同類別的樣本能正確地分開(kāi)。因此在討論模式識(shí)別的問(wèn)題時(shí),通常假設(shè)同一類的各個(gè)模式在該空間中組成一個(gè)緊致集。至于如何找到這種變換還沒(méi)有一種統(tǒng)一的有效的理論與方法。,,3.距離和相似性度量在特征空間中用特征向量描述樣本的屬性,把相似性度量用距離量表示。給定一個(gè)輸入樣本集合,用D維空間中的一個(gè)點(diǎn)表示某個(gè)樣本,可以選擇某個(gè)隨距離增加而下降的函數(shù)f作為兩個(gè)樣本和之間相似性度量,1.3模式識(shí)別的若干問(wèn)題,歐式距離的減函數(shù),絕對(duì)值偏差的減函數(shù),偏差的夾角,- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開(kāi)word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 模式識(shí)別緒論 模式識(shí)別 緒論 PPT 課件
鏈接地址:http://www.hcyjhs8.com/p-11509618.html