物聯(lián)網(wǎng)

圖形辨識與物聯(lián)網(wǎng)之發(fā)展將日趨密切

ainet.cn   2017年07月03日

  前言

  圖形識別(Pattern recognition,或稱模式識別),為透過計(jì)算機(jī)運(yùn)算技術(shù)方法達(dá)到圖形的自動判讀之技術(shù)。影像在計(jì)算機(jī)中以數(shù)組的形式儲存與運(yùn)算,如三原色光模式(RGB),先將影像以不同色彩分層,以上述方法代表不同顏色后,再以相對位置分配顏色的強(qiáng)度數(shù)值。此外尚有印刷四分色模式(CMYK)、CIE 1931等色彩空間結(jié)構(gòu)。模型識別將代表影像的數(shù)組進(jìn)行數(shù)學(xué)算,利用機(jī)率、向量等特征模型,進(jìn)行特征選取或萃取、分類器設(shè)計(jì)以及系統(tǒng)辨識率測試,使得信息系統(tǒng)得以自動化辨識輸入影像中的信息,將目標(biāo)信息主體與背景分離并轉(zhuǎn)換成所需之內(nèi)容,以利后續(xù)運(yùn)算。

  《圖一》國際照明協(xié)會

  《圖二》 識別辨識戰(zhàn)斗機(jī)機(jī)型樣本

 

  隨著信息科技的進(jìn)步,信息處理過程日趨復(fù)雜,應(yīng)用范疇也與日俱增,物聯(lián)網(wǎng)(IOT;Internet of Things)時(shí)代的來臨使得圖像處理需求增加,含有影像攝取鏡頭的硬設(shè)備越來越多,并融入各種生產(chǎn)制造、商業(yè)行為甚至日常生活,不同應(yīng)用的信息系統(tǒng)漸漸倚靠自動化影像辨識技術(shù),完成各種新的應(yīng)用。

  當(dāng)今常見的代表性技術(shù)如字符識別(OCR;Optical Character Recognition),將文字影像進(jìn)行處理,抽取主要表達(dá)特征并將特征模型紀(jì)錄,比對實(shí)際輸入影像后,依邏輯與機(jī)率轉(zhuǎn)換成字符串形式,供系統(tǒng)進(jìn)行后續(xù)處理,如車牌辨識系統(tǒng),將各種車輛的影像做為系統(tǒng)輸入,以特征匹配辨識車牌字符后,即可進(jìn)行如計(jì)費(fèi)、安全控管、疑車追蹤等應(yīng)用。某些系統(tǒng)結(jié)合甚至機(jī)器學(xué)習(xí)等算法,透過訓(xùn)練,能自動修正模型提升準(zhǔn)確率。拜計(jì)算機(jī)運(yùn)算之速度快、準(zhǔn)確性高、效率高特性之賜,此技術(shù)能逐步取代人工操作行為,目前常用于醫(yī)療判讀、聲紋辨識、車輛監(jiān)控計(jì)費(fèi)、個人安全等信息系統(tǒng),應(yīng)用范疇仍隨著時(shí)間快速擴(kuò)展中。

  《圖三》文字識別辨識標(biāo)的不同角度的樣本

 

  圖形辨識的流程

  圖形辨識流程可以分為特征表現(xiàn)、特征萃取、分類器設(shè)計(jì)以及系統(tǒng)辨識率測試幾個步驟。在特征表現(xiàn)步驟將數(shù)據(jù)之特征量化取出,再借助特征萃取找出較具分類效果的特征,限縮數(shù)據(jù)維度。再根據(jù)數(shù)據(jù)是否包含先前取得并選取之類別信息以與應(yīng)用面考慮采用分群法或分類法來進(jìn)行分類器設(shè)計(jì),產(chǎn)生分類函數(shù),最后依測試數(shù)據(jù)來驗(yàn)證該系統(tǒng)準(zhǔn)確率,了解分類函數(shù)是否完善等個步驟之準(zhǔn)確性,逐一優(yōu)化。

  圖形辨識的相關(guān)技術(shù)

  圖形偵測(detection)技術(shù),如線條偵測、臉部偵測等,偵測一個物體在一個圖像中的表現(xiàn),線條偵測即偵測影像中是否含有符合條件的直線;臉部偵測則欲在影像中偵測人臉。Hough Transform(霍式轉(zhuǎn)換)為此技術(shù)之經(jīng)典算法,將圖形轉(zhuǎn)換成特征空間,再由投票選取圖形。圖形辨識(recognition)則是要判斷影像中物體所屬條件,相對于偵測,以人臉為例,偵測的目的為標(biāo)記出人臉位置,辨識則是能進(jìn)一步的認(rèn)出這是屬于哪個人物的人臉。圖形偵測主要鉆研偵測速度以及對于噪聲的敏感度,而辨識則討論復(fù)雜環(huán)境中對應(yīng)不同結(jié)果的方法。相較于圖形偵測除定位與判斷欲偵測的對象是否存在外,圖形辨識因能判斷出圖形中存在對象的其他特性,應(yīng)用更為多廣。

  至于辨識時(shí)的分類方法,多源自于機(jī)率上的理論,如貝氏定理(Bayes' theorem)、主成分分析(PCA;Principal component analysis)、線性識別分析(LDA;Latent Dirichlet allocation)、支持向量機(jī)(SVM;Support Vector Machine)、類神經(jīng)網(wǎng)絡(luò)Neural Network等,研究將辨識對象進(jìn)行分類并優(yōu)化。

  結(jié)論

  智能家居、數(shù)字安全監(jiān)控、個人裝置安全控管等議題一直是物聯(lián)網(wǎng)的熱門討論內(nèi)容,車牌辨識、街道影像系統(tǒng)、移動裝置應(yīng)用等熱門技術(shù)亦需要成熟的影像辨識技術(shù),任何需要針對圖形中的對象(如用戶、車輛、文件等)進(jìn)行萃取的系統(tǒng)均能看到圖形辨識的技術(shù)實(shí)作。因圖形辨識可應(yīng)用之領(lǐng)域相當(dāng)廣泛,在物聯(lián)網(wǎng)發(fā)展的同時(shí),圖形辨識的技術(shù)仍同樣在進(jìn)步中,各種圖形辨識算法均有擅長的辨識對象目標(biāo),優(yōu)良的圖形辨識算法須結(jié)合不同領(lǐng)域之知識,開發(fā)者熟悉辨識對象的各種外顯特性,以及動態(tài)行為,并且不斷設(shè)計(jì)修改算法內(nèi)容,方能設(shè)計(jì)出最適宜的辨識與分類算法,提升準(zhǔn)確率。對于跨領(lǐng)域之技術(shù)人才如醫(yī)療與信息;工業(yè)設(shè)計(jì)與信息;機(jī)械與信息等,同時(shí)具有辨識對象與辨識算法知識的人才,將能在這一波躍進(jìn)中提供更多見解、嶄露頭角。

(轉(zhuǎn)載)

標(biāo)簽:物聯(lián)網(wǎng) 我要反饋 
什么是新一代機(jī)器人界面(HMI)?
ABB協(xié)作機(jī)器人,自動化從未如此簡單
優(yōu)傲機(jī)器人下載中心
2024全景工博會
專題報(bào)道
2023-2024 智能·零碳成果展映
2023-2024 智能·零碳成果展映

“2023-2024智能·零碳成果展映”展示國內(nèi)外企業(yè)推進(jìn)“雙碳”實(shí)踐的最新成果,鼓勵更多企業(yè)、科研機(jī)構(gòu)、投資機(jī)構(gòu)等廣泛... [更多]

中國國際進(jìn)口博覽會
中國國際進(jìn)口博覽會

11月5日至10日,第七屆中國國際進(jìn)口博覽會在國家會展中心(上海)舉行。152個國家、地區(qū)和國際組織,近3500家參展企... [更多]

2024 工博會 | 直播探館 · 全景解讀
2024 工博會 | 直播探館 · 全景解讀

第二十四屆中國工博會于9月24日至28日在國家會展中心(上海)舉行,展會以“工業(yè)聚能 新質(zhì)領(lǐng)航”為全新主題。 [更多]