人工智能強(qiáng)勁發(fā)展機(jī)器視覺(jué)瓶頸亟待突破

2025China.cn 2016年04月06日

　　機(jī)器視覺(jué)是人工智能正在快速發(fā)展的一個(gè)分支，旨在賦予機(jī)器可媲美人類(lèi)的視覺(jué)。隨著研究人員應(yīng)用專門(mén)的神經(jīng)網(wǎng)絡(luò)來(lái)幫助機(jī)器識(shí)別和理解現(xiàn)實(shí)世界的圖像，機(jī)器視覺(jué)在過(guò)去幾年取得了巨大的進(jìn)步。

　　2015年12月，谷歌發(fā)布了其云視覺(jué)API，來(lái)執(zhí)行這些任務(wù)，如：識(shí)別人臉、標(biāo)志和文字，探測(cè)物體并了解其環(huán)境的應(yīng)用。一些客戶都對(duì)這些功能感到非常興奮，在市場(chǎng)上其它企業(yè)也正在尋找類(lèi)似的一種服務(wù)，為使其適應(yīng)其業(yè)務(wù)模式。

　　機(jī)器為什么需要視覺(jué)呢?視覺(jué)是主要的感官。機(jī)器要能夠理解人類(lèi)，提供他們所需的支持，那么它們必須能夠在視覺(jué)范疇進(jìn)行觀察和表現(xiàn)。這可能是一個(gè)小攝像頭的形式，可以幫助盲人去“看”和感受環(huán)繞他們周?chē)氖澜?。或者是一個(gè)家庭監(jiān)控系統(tǒng)，該系統(tǒng)能夠正確識(shí)別一群流浪貓之間的差異，或者移動(dòng)樹(shù)枝，和一個(gè)防盜的形式。

　　在過(guò)去的一年中，圍繞著人工智能的嗡嗡聲，一直在非常強(qiáng)勁的增長(zhǎng)。我們還從來(lái)沒(méi)有如此接近的觀察到這個(gè)技術(shù)的好處。2016年，將會(huì)看到新式的人工智能的供電設(shè)備，因?yàn)槲覀儗?duì)于人工智能，所面臨的最困難的挑戰(zhàn)之一，已經(jīng)取得了進(jìn)展：讓我們的設(shè)備，能夠了解它們所看到的。

　　在我們的日常生活中，由于設(shè)備逐漸成為我們不可分割的一部分，我們已經(jīng)看到如果沒(méi)有足夠的視覺(jué)能力，越來(lái)越多的應(yīng)用程序?qū)⒆呦蚴?，其中包括空中無(wú)人機(jī)碰撞和機(jī)器人吸塵器“吃”了它們本不應(yīng)該吃的東西。

　　機(jī)器視覺(jué)是人工智能正在快速發(fā)展的一個(gè)分支，旨在賦予機(jī)器可媲美人類(lèi)的視覺(jué)。隨著研究人員應(yīng)用專門(mén)的神經(jīng)網(wǎng)絡(luò)來(lái)幫助機(jī)器識(shí)別和理解現(xiàn)實(shí)世界的圖像，機(jī)器視覺(jué)在過(guò)去幾年取得了巨大的進(jìn)步。如今的計(jì)算機(jī)在視覺(jué)識(shí)別上能夠做到各種各樣的事情，從識(shí)別網(wǎng)絡(luò)上的貓到在諸多的照片中識(shí)別特定的面孔。不過(guò)，該類(lèi)技術(shù)還有很長(zhǎng)的路要走。今天，我們看到機(jī)器視覺(jué)能夠離開(kāi)數(shù)據(jù)中心，并適用于一切從自主無(wú)人機(jī)到機(jī)器人身上，可以整理我們的食物。

　　為了更好的了解機(jī)器人視覺(jué)，一個(gè)常見(jiàn)的類(lèi)比，機(jī)器人視覺(jué)與人類(lèi)自己的視覺(jué)，就好比天空中飛行的鳥(niǎo)類(lèi)與飛機(jī)。兩者最終都將依賴于基礎(chǔ)物理學(xué)(如伯努利原理)，來(lái)幫助它們飛入到高空中，但是，這并不意味著飛機(jī)將要扇動(dòng)它的翅膀進(jìn)行飛翔。只是因?yàn)槿伺c機(jī)器可能會(huì)看到同樣的東西，并且對(duì)這些圖像進(jìn)行解釋的方式，甚至可能有一定的共性，最后的結(jié)果仍然可能是具有很大的不同。

　　雖然基本的圖像分類(lèi)已經(jīng)變得更加容易，但是，當(dāng)它涉及到從抽象的場(chǎng)景中提取意義和信息時(shí)，機(jī)器人就面臨著一系列新的問(wèn)題。錯(cuò)覺(jué)就是一個(gè)很好的例子，機(jī)器人視覺(jué)仍然還有很長(zhǎng)的路要走。

　　舉例來(lái)說(shuō)，當(dāng)人看到兩張面對(duì)面的臉的輪廓圖像時(shí)，他們看到的不僅僅是抽象的形狀。他們的大腦會(huì)進(jìn)行進(jìn)一步的解讀，讓他們能夠識(shí)別圖像的多個(gè)部分，看到兩張臉，又或者看到一個(gè)花瓶。但對(duì)于機(jī)器來(lái)說(shuō)，這樣的圖像是非常難以理解的?；镜姆诸?lèi)器分辨不了兩張臉和花瓶，它看到的會(huì)是諸如短柄斧、吊鉤、避彈衣甚至吉他的物體。該系統(tǒng)并不能確定那些物體是在該圖像當(dāng)中，這說(shuō)明這類(lèi)圖像的識(shí)別對(duì)于機(jī)器而言極具挑戰(zhàn)性。

　　如果我們看到一些更復(fù)雜的東西，這個(gè)問(wèn)題甚至?xí)兊酶永щy，比如BeverlyDoolittle(富康杜利特爾)的一幅畫(huà)，雖然看到這個(gè)圖的每個(gè)人，可能不能夠發(fā)現(xiàn)，其實(shí)每個(gè)人的臉都在這塊畫(huà)布上，他們幾乎立即看到，比映入他們眼簾更多的圖片。另外，正如復(fù)雜的圖像，現(xiàn)實(shí)世界也十分凌亂。在當(dāng)中正常航行可不是光開(kāi)發(fā)算法分析數(shù)據(jù)就能夠?qū)崿F(xiàn)的，它需要對(duì)真實(shí)場(chǎng)景有清楚的了解，進(jìn)而能夠相應(yīng)作出行動(dòng)。

（轉(zhuǎn)載）

標(biāo)簽：機(jī)器視覺(jué) 人工智能

我要反饋

引言：前段時(shí)間，我國(guó)出臺(tái)的“十三五”規(guī)劃中，明確指出將機(jī)器人產(chǎn)業(yè)作為我國(guó)工業(yè)發(fā)展的重要方向。機(jī)器視覺(jué)作為工業(yè)機(jī)器人重要零部件之一，對(duì)機(jī)器人靈活性和可操作性的提升有著決定性... [詳情]

2016年04月06日機(jī)器視覺(jué) 工業(yè)機(jī)器人

最有可能被機(jī)器取代的十大職業(yè)

引言：工業(yè)4.0時(shí)代，機(jī)器人正在逐漸走進(jìn)人們的生活，工廠車(chē)間隨處可見(jiàn)機(jī)器人的身影。未來(lái)，機(jī)器人將會(huì)更加智能。那么，最有可能被機(jī)器人取代的職業(yè)有哪些呢?19世紀(jì)伊始，地球迎來(lái)了第... [詳情]

2016年04月06日機(jī)器人 AGV機(jī)器人機(jī)械

克服機(jī)器視覺(jué)障礙，實(shí)現(xiàn)人工智能革命

機(jī)器視覺(jué)是人工智能正在快速發(fā)展的一個(gè)分支，旨在賦予機(jī)器可媲美人類(lèi)的視覺(jué)。隨著研究人員應(yīng)用專門(mén)的神經(jīng)網(wǎng)絡(luò)來(lái)幫助機(jī)器識(shí)別和理解現(xiàn)實(shí)世界的圖像，機(jī)器視覺(jué)在過(guò)去幾年取得了巨大的進(jìn)... [詳情]

2016年04月06日機(jī)器視覺(jué) 人工智能

資訊熱點(diǎn)

華為全聯(lián)接大會(huì)：大族機(jī)器人受邀展示協(xié)作機(jī)器人動(dòng)態(tài)插裝應(yīng)用華為與長(zhǎng)城汽車(chē)簽署營(yíng)銷(xiāo)數(shù)智化全面合作協(xié)議華為與廣汽集團(tuán)簽署數(shù)字化戰(zhàn)略合作備忘錄仙工智能副總裁張綏：以新質(zhì)生產(chǎn)力助力機(jī)器人行業(yè)高質(zhì)量發(fā)展華為發(fā)布交通與物流大模型和鐵路一云一網(wǎng)N樞紐創(chuàng)新解決方案汽車(chē)智能化“卷”向車(chē)燈，安森美兩款重磅方案透露出哪些趨勢(shì)? 創(chuàng)新為鑰施耐德電氣發(fā)布全新EcoStruxure開(kāi)放自動(dòng)化平臺(tái)V24.0版臨工智科攜智能化解決方案引領(lǐng)智能制造新潮流喜報(bào)丨珞石機(jī)器人入選工信部《首臺(tái)(套)重大技術(shù)裝備推廣應(yīng)用指導(dǎo)目錄》

專題報(bào)道

視頻

/resupload/guangzhi/AS00012420/1722563248652_1.jpg

2024年魏因加特納隆重推出vario?系列轉(zhuǎn)子銑床賦能食品加工行業(yè)變革，GEA持續(xù)推進(jìn)本土化戰(zhàn)略直擊美國(guó)RE+展 | 欣旺達(dá)動(dòng)力儲(chǔ)能電芯及領(lǐng)先解決方案走向全球施耐德電氣對(duì)話英偉達(dá)：AI算力的迅猛增長(zhǎng)，如何推動(dòng)數(shù)據(jù)中心物理基礎(chǔ)建設(shè)？億萬(wàn)克分布式存儲(chǔ)解決方案億萬(wàn)克全液全冷解決方案億萬(wàn)克政務(wù)云平臺(tái)解決方案

人工智能強(qiáng)勁發(fā)展 機(jī)器視覺(jué)瓶頸亟待突破

人工智能強(qiáng)勁發(fā)展機(jī)器視覺(jué)瓶頸亟待突破