編者按:人工智能已經(jīng)走進(jìn)各行各業(yè),但仍然有哪些困境需要突破?如何更好的應(yīng)用人工智能,未來的趨勢又在何方?
導(dǎo)語
人工智能技術(shù)廣泛應(yīng)用的今天,各行各業(yè)的發(fā)展均離不開人工智能的幫助。如何合理利用人工智能技術(shù)助力企業(yè)發(fā)展是每個企業(yè)都在思考的問題。
阿里巴巴達(dá)摩院人工智能中心城市大腦實(shí)驗(yàn)室負(fù)責(zé)人、國際電氣與電子工程師協(xié)會院士華先勝結(jié)合 AI 技術(shù)在各個行業(yè)的應(yīng)用實(shí)例解析 AI 技術(shù)的發(fā)展現(xiàn)狀,并對未來人工智能的發(fā)展做出預(yù)測。
01
人工智能的三次高峰
人工智能的發(fā)展經(jīng)歷過三次高峰。第一次高峰產(chǎn)生于五十年代人工智能技術(shù)初步興起,第二次熱潮產(chǎn)生于八十年代,其代表為專家系統(tǒng)。目前世界上正在經(jīng)歷人工智能的第三次發(fā)展高峰。
前兩次高峰并未給社會帶來預(yù)想的翻天覆地的變化,這次的高峰是否會重蹈覆轍,還是會有不同?其實(shí),本次發(fā)展高峰有以下 4 個不同于以往的特點(diǎn):
1.深度學(xué)習(xí):作為人工智能強(qiáng)大的輔助工具,深度學(xué)習(xí)的出現(xiàn)為很多尚未解決的難題提供了解決方法。
2.強(qiáng)大計(jì)算:云計(jì)算和芯片算力的提升大大增加了計(jì)算機(jī)處理數(shù)據(jù)的能力。
3.海量數(shù)據(jù):各行各業(yè)中積累的海量數(shù)據(jù),為人工智能的應(yīng)用提供了創(chuàng)造價值的條件。
4.成功案例:搜索引擎、電商推薦、刷臉支付等成功的應(yīng)用案例為人工智能技術(shù)的發(fā)展提供了參考。
02
人工智能產(chǎn)業(yè)的快速增長
人工智能產(chǎn)業(yè)從 2012 年前后開始經(jīng)歷了一段快速發(fā)展的時期。2017 年及之前全球涌現(xiàn)了 8000 余家 AI 創(chuàng)業(yè)公司,活躍的 AI 創(chuàng)業(yè)公司數(shù)量較過往增加了 14 倍。在 2017 年當(dāng)中,167 家中國 AI 公司獲得了總計(jì) 50 多億的 USD 投資。目前絕大多數(shù)公司都成立了自己的 AI 實(shí)驗(yàn)室,試圖通過人工智能技術(shù)輔助公司業(yè)務(wù)發(fā)展。
03
AI之困境
當(dāng)前 AI 技術(shù)雖然發(fā)展的如火如荼,但在技術(shù)實(shí)際的應(yīng)用過程中仍然存在營收困難、數(shù)據(jù)差異大、核心價值難以實(shí)現(xiàn)、用戶期望過高等多種問題。
1. 營收問題
如何利用 AI 技術(shù)創(chuàng)造營收是 AI 企業(yè)面臨的首要難題。根據(jù) 2018 年的數(shù)據(jù)統(tǒng)計(jì),超過 90% 的 AI 公司營收都在虧損。公司承接的 AI 項(xiàng)目定制成本及開發(fā)所用人力成本都很高,且項(xiàng)目資金不易回流,造成了 AI 項(xiàng)目投入大回報低的缺陷。同時由于各家公司技術(shù)差距的不斷縮小,開發(fā) AI 通用產(chǎn)品所能獲得的回報也在逐漸減少。
2. 實(shí)驗(yàn)室 VS 真實(shí)世界
人工智能技術(shù)落地的第二個困境是實(shí)驗(yàn)數(shù)據(jù)與實(shí)際數(shù)據(jù)的差異巨大。由于公開數(shù)據(jù)集與真實(shí)企業(yè)數(shù)據(jù)之間的巨大差異,企業(yè)真實(shí)場景中的結(jié)果常常不能令人滿意。這使得企業(yè)無法正確估量相關(guān)技術(shù)應(yīng)用后的效果,大大消減了企業(yè)的信心。例如在人臉識別技術(shù)的應(yīng)用中,開發(fā)者們的代碼往往可以在著名人臉識別數(shù)據(jù)集 LFW 上取得極高的準(zhǔn)確率。但當(dāng)代碼被用在真實(shí)場景中時,由于不同使用場景差異很大,代碼也常常不能獲得很好的效果。
另一個例子,人員重識別 (Person Re-ID),公開測試數(shù)據(jù)集與實(shí)際應(yīng)用的區(qū)別則更大。相較于公開數(shù)據(jù)集的數(shù)據(jù),真實(shí)場景中的人員會穿著不同的衣服,乘坐不同的交通工具并正在進(jìn)行不同的動作。這些變化都給算法的識別造成了很大的困難,使得算法的準(zhǔn)確度大大下降。
3. 成熟的技術(shù) VS 用戶的需求
成熟的技術(shù)與用戶實(shí)際需求之間較大的差異是 AI 技術(shù)應(yīng)用的第三個困境。企業(yè)的用戶對 AI 技術(shù)抱有很高的期望,常常寄希望于通過 AI 解決絕大部分業(yè)務(wù)問題。實(shí)際上 AI 技術(shù)僅能對業(yè)務(wù)中的某一類問題提供很好的解決方法,并不能解決全部的業(yè)務(wù)需求。
04
AI 技術(shù)和應(yīng)用成功的關(guān)鍵因素
AI 技術(shù)成功應(yīng)用的關(guān)鍵因素往往在于其能否為企業(yè)帶來相應(yīng)的核心價值。AI 技術(shù)的價值可以分為以下三個境界。
1.錦上添花:若企業(yè)在錦上添花階段投入大量人力物力,往往得不到理想的產(chǎn)出并會造成資源的浪費(fèi)。
2.雪中送碳:在這個境界中,企業(yè)開發(fā)的技術(shù)能為行業(yè)帶來不可替代的價值,為解決某些業(yè)務(wù)問題提供了良好的解決方法。
3.無中生有:因?yàn)槟稠?xiàng) AI 技術(shù)的產(chǎn)生,從而衍生出相關(guān)的需求與業(yè)務(wù)。例如,手機(jī)的大屏,就是個很好的例子。用于通訊的手機(jī)通過技術(shù)的發(fā)展實(shí)現(xiàn)大屏觀看視頻、瀏覽網(wǎng)站、視頻通信等需求,大屏并不是手機(jī)的“初衷”,但現(xiàn)在已經(jīng)成為了手機(jī)不可缺少的功能。
05
大規(guī)模人工智能應(yīng)用場景
阿里巴巴的人工智能技術(shù)研發(fā)背靠大規(guī)模人工智能應(yīng)用場景,通過解決實(shí)際應(yīng)用場景中出現(xiàn)的問題促進(jìn)相應(yīng) AI 技術(shù)的發(fā)展。下圖展示了阿里巴巴中人工智能技術(shù)的部分應(yīng)用場景,下面本文將圍繞其中一些 AI 技術(shù)應(yīng)用實(shí)例進(jìn)行介紹。
1. 視覺搜索應(yīng)用場景
目前視覺搜索技術(shù)的應(yīng)用非常廣泛,該技術(shù)普遍應(yīng)用于通用搜索、商品搜素、城市搜索及原料搜索等多個領(lǐng)域之中。以電商中的視覺搜索為例,流程可以分為 6 個部分,分別是類目識別、主體檢測、特征提取、檢索、排序及結(jié)果呈現(xiàn)。算法首先對圖片中的商品類別進(jìn)行識別,將商品正確劃歸到其所屬的類別之下。在類目識別后,通過主體檢測方法將待觀測商品在圖片中標(biāo)注出來,算法會將商品圖像的像素轉(zhuǎn)化為可以計(jì)算的特征,商品圖搜搜索引擎對得到的特征數(shù)據(jù)與索引中的數(shù)據(jù)進(jìn)行特征的比對及檢索,并對返回的結(jié)果進(jìn)行相似度的排序,最后將經(jīng)過重排后的商品列表呈現(xiàn)在用戶面前。
淘寶 App 中的拍立淘功能使用視覺搜索技術(shù)實(shí)現(xiàn)了識別用戶圖片并進(jìn)行商品檢索的功能,通過這種方式減少了用戶手動搜索商品的時間,大大提高了用戶的購物體驗(yàn)。
2. 視覺制造應(yīng)用場景
視覺制造技術(shù)可以應(yīng)用算法制造視覺數(shù)據(jù),包括圖像、三維圖形和視頻。該技術(shù)通過結(jié)合視覺分析、搜索技術(shù),以及視覺制造引擎將用戶的想法轉(zhuǎn)換為可見的視覺數(shù)據(jù)。以下為視覺制造技術(shù)在不同場景下的應(yīng)用實(shí)例。
阿里巴巴應(yīng)用視覺制造技術(shù)在淘寶中實(shí)現(xiàn)了商品頁面秒變視頻的功能。系統(tǒng)會自動進(jìn)行商品頁面的圖像分析及文本分析,并將分析得到的數(shù)據(jù)自動生成視頻。通過將靜態(tài)商品頁面轉(zhuǎn)換為動態(tài)播放視頻的形式,增加了該種商品的點(diǎn)擊率與轉(zhuǎn)化率,同時節(jié)省了制作相關(guān)視頻所需的成本。
使用視覺制造技術(shù)還可以實(shí)現(xiàn)對低質(zhì)量視頻的修復(fù)。一部 1.5 小時的老舊電影,傳統(tǒng)手工修復(fù)要 40 天,AI 智能修復(fù)則只需 3 個小時。阿里巴巴與優(yōu)酷聯(lián)合上線的 “經(jīng)典高清”專區(qū)即通過視頻修復(fù)增強(qiáng)方式在極短的時間內(nèi)對超過 1000 部經(jīng)典老片進(jìn)行自動修復(fù),使影片煥發(fā)出了新的生命力。下圖所示為通過該方式對影視劇士兵突擊修復(fù)后的效果,曾在電影院高清屏幕上播放,獲得了觀眾的大量好評。
通過視頻制造技術(shù)可以在視頻中找到合適的位置放入企業(yè)的植入廣告。視頻植入技術(shù)通過算法解析視頻中的場景,在較為合適的水平或垂直平面或曲面放置企業(yè)的廣告并將廣告無縫渲染進(jìn)場景之中。這種方式幫助企業(yè)做宣傳的同時,同時保證了植入廣告的自然度,并且不占用觀眾的時間,也不破壞視頻內(nèi)容,不會引起觀看者的反感。下圖所示為視頻植入技術(shù)在視頻中的應(yīng)用效果。
鹿班智能平臺是視覺制造技術(shù)的另一應(yīng)用實(shí)例。阿里巴巴設(shè)計(jì)開發(fā)的鹿班智能平臺可以為使用者自動設(shè)計(jì)平面廣告。使用時,鹿班平臺會整合用戶的文案、圖片及希望的廣告風(fēng)格,自動生成符合用戶需求的廣告圖片或海報。鹿班平臺可以以本科畢業(yè)生的水平每秒制作 8000 個 banners 圖。在 2017 年的雙十一期間,阿里巴巴集團(tuán)使用鹿班平臺共生成了 4.1 億個 banners 圖,增大了雙十一活動的宣傳影響力,并為企業(yè)節(jié)省了很大的宣傳成本。
鹿班平臺的開發(fā)為企業(yè)積累了成功的經(jīng)驗(yàn)。鹿班這種場景,也就是大批量短時間產(chǎn)生廣告圖的需求,原來是沒有的,因?yàn)槿肆茈y實(shí)現(xiàn)。但自動設(shè)計(jì)技術(shù)使得這種場景變成可能,從而這項(xiàng)技術(shù)也成為大促場景的剛需了。企業(yè)認(rèn)識到 AI 技術(shù)的應(yīng)用要注重于關(guān)注剛性需求,而不是注重于炫酷的技術(shù)。新的 AI 技術(shù)可以提升商業(yè)創(chuàng)新,商業(yè)創(chuàng)新則可以反哺技術(shù)上的創(chuàng)新。
3. 視覺診斷
視覺診斷技術(shù)為 AI 技術(shù)的另一重要應(yīng)用,可以分為兩類:診斷人,也就是醫(yī)療影像技術(shù);診斷產(chǎn)品或機(jī)器,也就是工業(yè)視覺技術(shù),特別是質(zhì)量檢測技術(shù)。以下為阿里巴巴集團(tuán)在視覺診斷方面落地的技術(shù)和應(yīng)用。
■ 醫(yī)療影像技術(shù)
阿里巴巴醫(yī)療團(tuán)隊(duì)通過采集人體聽覺、視覺、感知及文本的數(shù)據(jù)搭建智能健康管理平臺。平臺會對人體數(shù)據(jù)整合分析,為糖尿病、高血脂、心血管等高危疾病的病人提供預(yù)警服務(wù),為使用用戶提供每日健康數(shù)據(jù)的分析。幫助使用者實(shí)時了解自己的身體狀況,并通過身體狀況信息隨時調(diào)節(jié)自己的身體,達(dá)到通過促進(jìn)用戶保持健康行為保障身體健康的效果。
通過深度學(xué)習(xí)方法及三維圖像檢測方式,CTA 影像分析技術(shù)可以對心臟冠狀動脈進(jìn)行非常精細(xì)的分割和命名,并對冠狀動脈中出現(xiàn)的狹窄區(qū)域及細(xì)小的病變斑塊進(jìn)行識別。通過精準(zhǔn)的圖像及深度學(xué)習(xí)技術(shù)可以檢查出病人體內(nèi)所有細(xì)微的病變。
應(yīng)用 AI 技術(shù)在骨科中可以進(jìn)行脊柱結(jié)構(gòu)的提取,對脊柱中錐體和椎間盤進(jìn)行高精度的分割與測量。同時算法可以輔助醫(yī)生進(jìn)行輔助診療,以細(xì)粒度的級別區(qū)分退變性疾病,大大提升醫(yī)生的診斷效率。
智能骨科技術(shù)在髖膝關(guān)節(jié)手術(shù)測量中的應(yīng)用示例。算法可以自動標(biāo)注出關(guān)節(jié)中特征點(diǎn)的位置、角度和長度,為醫(yī)生實(shí)施手術(shù)提供可靠的參考。
通過阿里巴巴搭建的醫(yī)療健康搜索平臺,醫(yī)生可以在平臺中找到與當(dāng)前相似的病例信息及醫(yī)療影像,通過參考?xì)v史治療記錄及治療經(jīng)驗(yàn)更好的診斷病人并為之制定更合理的治療方案。
阿里巴巴將有關(guān)醫(yī)療健康知識的數(shù)據(jù)構(gòu)建成知識圖譜,儲存到天貓精靈可訪問的數(shù)據(jù)庫中。用戶通過與天貓精靈對話可以調(diào)取數(shù)據(jù)庫中的信息,天貓精靈會根據(jù)知識圖譜為用戶提供改善健康的方案。天貓精靈還可以對用戶健康狀況進(jìn)行自動的分析管理。
傳統(tǒng)醫(yī)學(xué)文化強(qiáng)調(diào)治未病,即在人體未生病時便開始對健康干預(yù)。阿里巴巴構(gòu)建的未來健康管理通過認(rèn)知、判斷、決策、學(xué)習(xí)四個部分幫助用戶防范健康問題于未然,結(jié)合 AI 醫(yī)療的技術(shù)為人們的身體健康保駕護(hù)航。
阿里巴巴 AI 醫(yī)療團(tuán)隊(duì)在 2 月 16 日成功上線了針對于新冠肺炎疫情的 CT 影像分析系統(tǒng)。系統(tǒng)會在 20 秒內(nèi)對患者的患新冠肺炎的概率及病區(qū)占肺部的百分比等數(shù)據(jù)進(jìn)行分析輸出,預(yù)測的準(zhǔn)確度高達(dá) 96%,現(xiàn)已落地 160 多家定點(diǎn)醫(yī)院,經(jīng)過 29萬余次調(diào)用(最新數(shù)據(jù)),為新冠肺炎的快速確診提供了可靠的幫助。
阿里巴巴為新冠肺炎設(shè)計(jì)的全基因測序分析技術(shù)在 10 分鐘內(nèi)即可完成全部基因組的比對工作,算法通過高達(dá) 95% 的全基因序列覆蓋使得確診的準(zhǔn)確度基本上接近100%。由此,將全鏈路的新冠病毒全基因測序從兩三天降低到 14 小時。
■ 工業(yè)視覺技術(shù)
行業(yè)視覺診斷技術(shù)廣泛應(yīng)用于電池板、紡織業(yè)、大型機(jī)械等工業(yè)制造過程中的產(chǎn)品質(zhì)量檢測和故障診斷中,旨在節(jié)省人力并提高產(chǎn)品的良品率和設(shè)備的精確度與穩(wěn)定性。以下為行業(yè)診斷技術(shù)在各行各業(yè)中的應(yīng)用實(shí)例。
針對以往人工檢測太陽能電池板瑕疵消耗時間長、不能全部檢測等問題,阿里巴巴設(shè)計(jì)實(shí)現(xiàn)的太陽能電池板檢測系統(tǒng)可以實(shí)現(xiàn)全量電池板的檢測,通過 AI 技術(shù)輔助分析的方式使相關(guān)企業(yè)檢測效能提升 36 倍。
行業(yè)視覺檢測技術(shù)同時廣泛應(yīng)用于輸電線路巡檢、食品質(zhì)檢等多個行業(yè)的場景之中,并取得了良好效果。
阿里巴巴創(chuàng)建的智能養(yǎng)豬場使用 AI 技術(shù)可以實(shí)時掌握每頭豬的身體狀況。AI 技術(shù)可以對豬場進(jìn)行遠(yuǎn)程計(jì)數(shù),通過對豬的行為與飲食分析了解豬的情況,并在必要時對豬的健康報警。
4. 城市大腦
阿里巴巴集團(tuán)設(shè)計(jì)實(shí)現(xiàn)的城市大腦旨在打通城市中積累的大量數(shù)據(jù),通過人工智能分析采集的數(shù)據(jù),并為城市提出相應(yīng)的優(yōu)化方案。城市大腦應(yīng)用 AI 技術(shù)與算力相結(jié)合,分析城市中的數(shù)據(jù),使城市治理和服務(wù)數(shù)據(jù)化、智能化,做到高效、低耗、便捷的管理城市。實(shí)現(xiàn)城市在治理模式、服務(wù)模式、產(chǎn)業(yè)發(fā)展上的多方面突破。
下圖為城市大腦的結(jié)構(gòu)示意圖。城市大腦首先會匯集視頻、GPS、微波等多種類型的數(shù)據(jù),并對視頻數(shù)據(jù)進(jìn)行分析理解,對數(shù)據(jù)產(chǎn)生初步的認(rèn)知。對于已經(jīng)生成的認(rèn)知信息,城市大腦會通過 AI 算法對數(shù)據(jù)進(jìn)行分析處理并提出優(yōu)化決策,優(yōu)化方案包含且不限于紅綠燈優(yōu)化、公交優(yōu)化、事故事件報警等等。通過將城市中的要素放入搜索引擎,系統(tǒng)將會自動進(jìn)行搜索與數(shù)據(jù)挖掘,此時系統(tǒng)可以同時進(jìn)行可疑車搜索、發(fā)現(xiàn)交通規(guī)律、尋找擁堵原因等多個任務(wù)。系統(tǒng)在提供管理優(yōu)化方案的同時提供數(shù)據(jù)預(yù)測功能,可以根據(jù)當(dāng)前交通狀況、天氣、事件等因素對交通流量、交通事故概率等多方面數(shù)據(jù)做出預(yù)測,并基于預(yù)測數(shù)據(jù)進(jìn)行相關(guān)的干預(yù)。
目前阿里巴巴的城市大腦系統(tǒng)已實(shí)現(xiàn) 30 余個城市或城區(qū) 60 余個項(xiàng)目的部署,企業(yè)開發(fā)的城市大腦人工智能開放創(chuàng)新平臺支持十余家研究機(jī)構(gòu)及第三方廠商的研發(fā)與部署。城市大腦系統(tǒng)的 6 組產(chǎn)品已廣泛應(yīng)用于交通、平安和市政管理等多個重要領(lǐng)域中。
城市大腦人工智能開放創(chuàng)新平臺具有功能全面、使用靈活、實(shí)時性高、運(yùn)行高效及開放性高等五大優(yōu)點(diǎn),可以為開發(fā)及研究團(tuán)隊(duì)提供安全可靠的 AI 平臺層的支持。平臺提供的大規(guī)模視頻分析處理加速技術(shù)可以支持一臺服務(wù)器同時處理超過 100 路視頻,大大的增加了處理視頻數(shù)據(jù)的效率。
城市大腦的全天候異常事故檢測功能會將近實(shí)時檢測到的城市中的事件事故自動排列在數(shù)據(jù)大屏上并對發(fā)生的事故不斷的更新數(shù)據(jù)信息,根據(jù)事件事故的不同類型,系統(tǒng)自動處理或由交通警察及時進(jìn)行相關(guān)處理。
通過阿里巴巴城市大腦提供的交通態(tài)勢、信號燈優(yōu)化,杭州的交通通行效率比以往提升了 15.3%,每天系統(tǒng)可報告 2 萬起事件事故信息,準(zhǔn)確度達(dá) 96%。
針對特殊車輛如警車、救護(hù)車、救火車等,城市大腦會通過干預(yù)信號燈、優(yōu)化道路交通等方式為該種車輛保駕護(hù)航,使特殊車輛可以更快的到達(dá)目的地。
城市大腦同時提供車輛巡檢、高危駕駛行為識別、車流量人流量預(yù)測、市政管理及智能安全檢測等多個功能。通過這些功能為城市的發(fā)展提供保障。
城市大腦提供的城市 3D 重建及 4D 推理功能可以將城市的狀態(tài)用實(shí)時 3D 沙盤的方式呈現(xiàn)給用戶,并通過 AI 技術(shù)在 3D 沙盤上還原城市在不同時刻的運(yùn)行情況。
在城市大腦的設(shè)計(jì)實(shí)現(xiàn)過程中,阿里巴巴 AI 團(tuán)隊(duì)通過 AI 技術(shù)創(chuàng)造出不可替代的價值,潛心理解應(yīng)用場景并打磨產(chǎn)品功能,建立起產(chǎn)品的核心競爭力,最后通過打造平臺建立起生態(tài),實(shí)現(xiàn)了從項(xiàng)目到產(chǎn)品再到平臺的演變,為城市的治理、管理提供了有力的技術(shù)支撐。
結(jié)語
今天的人工智能方法論雖有局限,但各行各業(yè)之中有很多問題尚未解決,故人工智能仍有很大的發(fā)展空間。對于傳統(tǒng)產(chǎn)業(yè)和數(shù)字產(chǎn)業(yè),擁抱 AI 技術(shù)才可以更好的發(fā)展。對于人工智能的從業(yè)者而言,深入理解行業(yè)至關(guān)重要。對人工智能的商業(yè)化而言,需要用技術(shù)為客戶創(chuàng)造足夠的價值,否則無法很好的規(guī)?;涞亍τ诿總€人來說,人工智能已經(jīng)開始深入人們生活的方方面面,擁抱 AI 技術(shù)發(fā)展帶來的變化不可避免。
人工智能技術(shù)到底是風(fēng)是云是雨,取決于我們?nèi)绾慰创?、研發(fā)或使用這些技術(shù)。如果不能選擇好的路線,AI 可能會如風(fēng)般不實(shí),如云般縹緲;若能可以深入研究技術(shù),使用先進(jìn)的核心技術(shù)打造產(chǎn)品,創(chuàng)造不可替代的價值,AI 技術(shù)便可變成滋潤萬物的春雨,幫助我們走向成功。
來源:CIO學(xué)院 X 開發(fā)者社區(qū) 《給ITer的技術(shù)前沿課》
編輯:阿里云研究中心 張楠
(轉(zhuǎn)載)