siemens x
人工智能

為什么說“智能決策”將拉開商業(yè)變革大幕?

2025China.cn   2021年01月13日

 

  文章來源:轉(zhuǎn)載自甲子光年微信公眾號

  文 | 劉景豐
  編輯 | 甲小姐

  什么是智能?

  人的智能,不僅來自眼睛的看,耳朵的聽,更重要的,是大腦的決策。無數(shù)看不見摸不著卻時刻都在發(fā)生的決策,推動著我們將思維轉(zhuǎn)化為一言一行,讓人類真正有能力和現(xiàn)實世界交互。

  美劇《復仇者聯(lián)盟3》中有一個畫面:在復仇者聯(lián)盟即將與滅霸進行大戰(zhàn)前,奇異博士用時間寶石推進了時間,瀏覽了未來這一戰(zhàn)可能出現(xiàn)的結(jié)果,預測到在14000605種結(jié)果中,只有一種是獲勝的結(jié)果。這是一種高級的智能。

  商業(yè)的智能,不僅需要感知智能,認知智能,更重要的,是決策的智能。伴隨著時刻發(fā)生的億萬用戶的海量需求,企業(yè)要短時間內(nèi)做出大量決策——研發(fā)環(huán)節(jié)如何減少試錯成本,制造環(huán)節(jié)如何減少迭代次數(shù),營銷環(huán)節(jié)如何提升投放效果,此外還有電商平臺如何給不同用戶動態(tài)推薦產(chǎn)品,網(wǎng)約車平臺如何給不同司機動態(tài)派發(fā)激勵,物流倉儲平臺如何更快地揀選貨物……決策時刻都有需求,顯然,很難靠人力去實現(xiàn)大數(shù)據(jù)和個性化時代數(shù)以億計的決策需求。

  如今,機器可以比人看得更清,算得更快,但讓機器取代人來直接做決策,一直是人工智能的挑戰(zhàn)高地。

  如果只看機器取代人做決策,這早已不是新鮮事兒。在游戲環(huán)境中,機器的決策能力已超越人類。2016年,AlphaGo打敗人類頂級棋手李世乭;2019年,DeepMind Alpha Star在《星際2》中擊敗了99.8%的人類玩家。時隔多年,“AlphaGo們”仍沒有走出游戲虛擬區(qū)——在真實環(huán)境里,AI的決策能力仍未大放光彩。

  為什么在科技突飛猛進的今天,AI的決策能力——智能決策——仍難在真實場景中發(fā)揮作用?阻力在哪里?如何打破這一瓶頸?

  一家位于南京的AI企業(yè),通過自己的實踐,為這些待解之題提供解題思路。

  2021年1月9日,南棲仙策在南京發(fā)布旗下新一代智能決策系統(tǒng)REVIVE。其最大的特點是,讓強化學習通過一套通用流程就能在現(xiàn)實業(yè)務場景中應用,目前已探索出從研發(fā)、生產(chǎn)、物流到營銷等多個制造業(yè)環(huán)節(jié)的落地場景。

  脫胎于南京大學人工智能學院的南棲仙策,是一家專注于智能決策的人工智能新銳公司,公司的核心能力便是通過推演億萬種結(jié)果,找到通向未來的最優(yōu)決策,進而提供現(xiàn)實世界自主決策系統(tǒng)。

  值得一提的是,南棲仙策并非按傳統(tǒng)數(shù)據(jù)挖掘的方式做大數(shù)據(jù)預測,而是根據(jù)數(shù)據(jù)模擬成環(huán)境,讓機器具有“想象能力”,并在此基礎上根據(jù)目標尋找最優(yōu)的策略。

  換句話說,南棲仙策正把“AlphaGo們”從游戲搬到現(xiàn)實應用中。

  更重要的是,比起近些年AI落地場景的“需求真?zhèn)巍焙汀笆袌龃笮 敝疇幾h,智能決策是各行各業(yè)古已有之的需求,而智能決策供給端終于出現(xiàn)了突破口。

  如果一切實踐順利,一個由智能決策驅(qū)動的大時代將開啟。比起攝像頭讓機器看見,語音助手讓機器聽見聽懂,智能決策,將開啟一個更大的全面智能時代,商業(yè)將真正進化到下一階段。

1.時代呼喚智能決策

  對于2020年的“雙11”,人們或許仍記憶猶新。在“雙11”期間(11月1日-11月11日),近8億消費者在天貓累計下單了4982億元,訂單峰值高達至58.3萬筆/秒。截至11日24時,天貓“雙11”實時物流訂單也突破23.21億單,約等于2010年全國快遞量總和。

  這串讓人震撼的消費數(shù)據(jù)背后,隱藏著玄機。

  表面上,用戶在天貓上通過關鍵字搜想要的商品是“主動”行為,實際其瀏覽的每個商品,都是平臺根據(jù)其喜好、需求精準推薦的。

  將每秒數(shù)十萬的商品進行個性化推薦,如果讓人類去決策,可能僅耗費的人力就要數(shù)萬之眾,此外針對每個用戶的需求作分析也需要一個過程,對普通人而言,一秒之內(nèi)也很難做出準確的決策判斷。

  但機器就可以輕易完成。

  真實的情況是,用戶在天貓通過關鍵字“搜索”商品行為的背后,他第一眼會看到什么、在第一次點擊之后再給他看什么,類似這樣的決策其實都是機器自主完成的。用戶看到的一切其實都是通過數(shù)據(jù)智能的算法自動形成的,不存在任何人為干預。

  這個案例,恰對應了阿里巴巴集團總參謀長曾鳴在其著作《智能商業(yè)》一書中總結(jié)的“智能商業(yè)”三個特征:實時服務海量用戶,滿足每一個用戶的個性化需求,服務自我更新與提升。

  電商,和訂單配送、出行打車、信息推送、自動駕駛等等眾多場景共同組成了智能商業(yè),這是一個數(shù)萬億級別的市場。

  曾鳴斷言,基于數(shù)據(jù)智能的商業(yè)必將超越1913年橫空出世的福特流水線,給人類整體的生產(chǎn)力帶來一次根本性的巨大突破。

  在當下的時間點看,疫情倒逼著企業(yè)加速數(shù)字化,人工智能推動著產(chǎn)業(yè)加速智能化,兩者共同推動商業(yè)智能的到來。近日,騰訊研究院發(fā)布的《2020騰訊人工智能白皮書》中就提出,人工智能技術與產(chǎn)業(yè)發(fā)展正在邁向“泛在智能”時代,未來中國不再有純粹的傳統(tǒng)產(chǎn)業(yè),每個產(chǎn)業(yè)或多或少都將開啟數(shù)字化進程。

  智能商業(yè)下的每一個場景,都面臨大量的服務決策需求,且動輒百萬量級、千萬量級,且要求決策實時完成,靠原來人力決策的方式根本無法滿足這一需求。在巨大需求之下,一種新的決策手段誕生了——智能決策。

  實際上,目前人們對智能決策并沒有準確的定義。一種解釋認為,智能決策是綜合了人工智能(AI)、商務智能(BI)、決策支持系統(tǒng)(DSS)、知識管理系統(tǒng)(KMS)、專家系統(tǒng)(ES)以及管理信息系統(tǒng)(MIS)的輔助決策支持系統(tǒng),其本質(zhì)還是通過改進決策流程,用大數(shù)據(jù)的方式輔助決策。盡管這種決策方法已經(jīng)在現(xiàn)實中有了較多的落地應用,但其最終還需要決策者自己“拍腦袋”,因此天花板較底。

  智能決策的另一種解釋則簡單得多——決策自動化,或決策機器人。南棲仙策聯(lián)合創(chuàng)始人、CTO秦熔均將其本質(zhì)概括為“讓機器自主決策”。它背后則涉及一種時下熱門的硬科技——強化學習。

  這一復雜的人工智能技術,可使機器自主完成從采樣到學習的過程,進而自主決策。

  理論上,這種技術可自主決策,不再需要決策者去“拍腦袋”。然而,這一跟人工智能概念幾乎同時期誕生的智能決策理念,在很長一段時間內(nèi),只能在游戲中展示和應用。當人工智能發(fā)展到今天,大眾對智能決策的期待早已不是局限在虛幻的游戲世界,而是如何在真實環(huán)境中解決問題。

  “我們更愿意說‘智能決策’,而不是‘決策智能’,就是希望強調(diào)自主決策能力的應用?!?/STRONG>秦熔均對「甲子光年」表示。

2.走出游戲區(qū)

  強化學習誕生以來,就一直通過游戲來展示自己的能力。從1997年前國際象棋世界冠軍卡斯帕羅夫被IBM的深藍(Deep Blue)計算機擊敗,到2016年AlphaGo戰(zhàn)勝世界頂級圍棋棋手,20年間強化學習的智能決策本領接連在不同游戲中超越人類,但問題是,它仍未擺脫游戲環(huán)境。

  強化學習走不出游戲區(qū),是有原因的。

  其中一個原因是,強化學習需要了解決策后果,而很多情況下這只能在決策執(zhí)行后看到,因此強化學習需通過“試錯”來完成學習。

  本質(zhì)上看,象棋、圍棋等游戲都屬于封閉環(huán)境,具有清晰明確的運行規(guī)則,可在計算機中以100%的精度模擬。因此該環(huán)境下的強化學習試錯數(shù)據(jù)幾乎是免費獲得。唯一的開銷只是支撐計算機運行的電力。

  而真實業(yè)務場景是開放環(huán)境,環(huán)境運行規(guī)則不明。一旦試錯會產(chǎn)生巨大的代價,輕則商業(yè)客戶流失,重則發(fā)生致命危害,如自動駕駛事故等。

  如何既用深度學習發(fā)揮智能決策的巨大價值,又降低開放環(huán)境中的試錯成本?這個“魚與熊掌”難題,曾困擾著許多強化學習研究者,其中就包括俞揚。

  從2004年進入南京大學周志華教授的LAMDA研究組求學,俞揚在人工智能領域已有超過15年的研究經(jīng)歷。2011年,俞揚在周志華教授指導下獲得南京大學博士學位,研究方向正是機器學習。此后,俞揚集中在強化學習理論與應用技術領域的研究,并于2018年獲聘南京大學人工智能學院教授。

  對強化學習了解越深,俞揚對“讓強化學習走出游戲”的想法就越強烈。

  轉(zhuǎn)機出現(xiàn)在2016年底。AlphaGo的光彩閃耀,讓互聯(lián)網(wǎng)頭部企業(yè)看到強化學習的巨大價值,并希望拓展應用。隨后,淘寶搜索組找到俞揚博士,希望進行一項校企合作項目。

  這個項目是“如何在淘寶上創(chuàng)建搜索和推薦的模擬器”。

  此前,淘寶面臨的問題正是強化學習的“老大難”——在商品搜索和推薦決策中的使用成本過高,無法真正落地。

  2017年,在與淘寶搜索團隊討論后,俞揚向阿里提交了“虛擬淘寶”模擬器項目申請,試圖從歷史數(shù)據(jù)中學習出一個有虛擬用戶的環(huán)境,有了這個環(huán)境,便可以實現(xiàn)“0成本”訓練強化學習。項目申請?zhí)峤缓?,俞揚團隊很快收到了阿里評審專家的質(zhì)疑:用戶行為如此復雜,從沒有方法能成功模擬,這個項目能行得通嗎?

  以往對于環(huán)境模型學習的理論分析顯示出,環(huán)境模型的誤差會導致策略誤差平方級增長,模擬一個好的環(huán)境可能比直接學策略還要困難。

  在當時看來,這樣的構想此前沒有任何成功案例,而且團隊也沒有經(jīng)驗,缺乏信心。但這是俞揚預見的唯一可行的途徑。成功只剩這一條路,只能硬著頭皮試試看。

  在跟阿里評審專家進行了多次溝通后,俞揚頂著失敗的風險繼續(xù)嘗試。這套“虛擬淘寶”模擬器,是一套針對電商平臺的虛擬仿真系統(tǒng),其目的是幫助平臺實現(xiàn)更合理的運作機制,平衡微觀執(zhí)行和宏觀決策的一致性問題。

  從技術上看,這一過程極其復雜,但其運行過程與《復仇者聯(lián)盟3》中的奇異博士用時間寶在14000605種結(jié)果中尋找獲勝結(jié)果一樣。

  “虛擬淘寶”是通過模擬器克隆多個虛擬用戶,并對其實施基于強化學習的商品推薦,從中找到最優(yōu)策略。慶幸的是,俞揚不僅實現(xiàn)了在開放環(huán)境中低成本使用強化學習決策,還將原來平方級的誤差降低到線性——誤差回到可控范圍。

使用強化學習構建的“虛擬淘寶”架構

  事實也證明了這一方法的優(yōu)越性。該項目的研究結(jié)果顯示,“虛擬淘寶”模擬器能夠忠實反映真實環(huán)境中的特征,將其用于訓練強化學習,可以避免試錯的代價。訓練出的模型于2018年上線測試,在現(xiàn)實業(yè)務中獲得了2%的性能提升。

  這一結(jié)果,第一次展示出環(huán)境學習途徑在真實場景應用的可行性,證明了俞揚的判斷是正確的。“虛擬淘寶”的探索,也為后來的淘寶國際項目中的搜索推薦任務提供了寶貴的研究積累。

  阿里巴巴達摩院機器視覺團隊負責人徐盈輝對「甲子光年」表示,“智能決策在阿里巴巴整個業(yè)務版圖里,已起到至關重要的作用?!痹陔娚唐脚_上帶約束的供給(平臺流量)和需求(商家)的在線匹配機制,新品推薦策略中應用的規(guī)模化賭博機和半賭博機算法,以及為商家智能發(fā)布所研發(fā)的基于上下文的賭博機算法,還有傳統(tǒng)供應鏈、物流運輸領域,都有智能決策的身影。

  此后,俞揚又接連與滴滴出行、菜鳥倉庫等公司合作,在網(wǎng)約車、倉儲揀選優(yōu)化等多個真實開放場景中,進一步驗證了該技術路徑,打磨了算法。以菜鳥網(wǎng)絡倉儲揀選優(yōu)化為例,此前只是按照路徑最優(yōu)的方式給工人派單,但南棲仙策模擬了無數(shù)種可能的派單策略下工人的工作效率,最后從中選擇了最高效的策略。

  最終結(jié)果顯示,該技術可將一個天貓倉庫揀貨時間在人工優(yōu)化幾乎到頭的情況下,再縮短超過10%。

  至此,強化學習終于走出游戲區(qū),跨過產(chǎn)業(yè)落地的第一道門檻。

3.解開落地之困

  2018年,強化學習在現(xiàn)實環(huán)境中的多次成功應用,讓俞揚有了更強的信心,同時也看到了一片藍海。

  “我們拿著強化學習的技術跟企業(yè)去合作,在別人看來這不過是一個探索的項目,也不會投入太多資源來推動這件事。”俞揚說。與此同時,俞揚的博士生、后來成為南棲仙策聯(lián)合創(chuàng)始人和CTO的秦熔均也對強化學習的落地應用充滿了憧憬,“非常希望能有一次契機和俞老師合作,我覺得公司的研究和項目與在學校里非常不同,有更多機會接觸產(chǎn)業(yè)界的問題,不僅要仰望星空,還要腳踏實地?!鼻厝劬嬖V「甲子光年」。

  另一方面,需求確實存在。南棲仙策COO徐亮是俞揚的大學同學,不同于俞揚的學術經(jīng)歷,徐亮自大學畢業(yè)就一直在產(chǎn)業(yè)界摸爬滾打,產(chǎn)業(yè)落地經(jīng)驗十分豐富。

  計算機專業(yè)出身的他,從2017年開始,對自己所從事的行業(yè)越來越感覺“不適”了。

  “那時候,很多企業(yè)開始了數(shù)字化轉(zhuǎn)型、智能化轉(zhuǎn)型。就是裝一些傳感器,傳感器再把數(shù)據(jù)收集后放到數(shù)據(jù)中臺?!毙炝粱貞?,“其實很多企業(yè)只是把數(shù)據(jù)收集起來,但并沒有產(chǎn)生價值?!?/P>

  盡管在當時看來,智能化的趨勢已經(jīng)顯現(xiàn),但實際中智能化的應用卻有名無實。數(shù)據(jù)原本是為了提升生產(chǎn)和決策的效率,但由于各種約束,數(shù)據(jù)只能躺在數(shù)據(jù)庫里,并未產(chǎn)生明顯的決策價值。

  要讓這些數(shù)據(jù)真正發(fā)揮決策價值,還需要一些更落地的解決方案。

  2018年9月30日,在南京大學人工智能創(chuàng)新研究院新型研發(fā)機構的孵化促進下,南棲仙策(南京)科技有限公司成立。

  公司最初選擇的方向是自動駕駛中的智能決策。在與更有經(jīng)驗的投資人溝通后,俞揚改變了想法?!皼Q策只是自動駕駛的一個環(huán)節(jié),自動駕駛的很多環(huán)節(jié)都不夠成熟,即使我們把決策做好,也無法解決整個問題。”俞揚告訴「甲子光年」。南棲仙策的天使投資人涌鏵投資近年來積極布局AI前沿產(chǎn)業(yè),2016年天使輪投資了寒武紀,回報頗豐。在談及與俞揚教授的交集之時,涌鏵天使基金合伙人洪亦修笑道:“我們預感到人工智能可能處在爆發(fā)前夜,陳天石是教授創(chuàng)業(yè),而國內(nèi)人工智能的頂級學術圈子并不大,自然而然也就認識了俞揚教授。”

  洪亦修告訴「甲子光年」,“作為天使投資人,更多的是信任和幫助,我們完全信任南棲仙策團隊在核心科研上的實力和優(yōu)勢,更多的是在商業(yè)和戰(zhàn)略等方面提供幫助”。他認為,南棲仙策智能決策最大的潛力是通用性,它適用于包括制造、物流、營銷等很多場景,凡是需要做決策的地方就有應用的可能性。而我國既是全球最大的生產(chǎn)國也是最大的消費國,因此南棲仙策的產(chǎn)品在提升生產(chǎn)效率和促進消費方面都具有巨大的想象空間。

  與洪亦修深入溝通后,南棲仙策開始了通用場景的強化學習應用,并形成四大核心技術:構建虛擬世界、高效強化學習、對抗攻擊訓練、在線模型適配——這四項技術,進化出一套“現(xiàn)實世界自主決策系統(tǒng)”。

  說起來容易,但如果面對這樣的決策系統(tǒng),客戶依然顧慮重重。最大顧慮是:如何保證虛擬環(huán)境下的決策能適用于真實環(huán)境?

  為了解決這一顧慮,南棲仙策做了兩件事。

  首先,在理論上證明其優(yōu)越性。2020年俞揚帶領團隊成員,花了一年半的時間,最終用理論證明了在學習環(huán)境模型時,強化學習的方法性能好于傳統(tǒng)監(jiān)督學習。這一理論已形成論文,并于2020年11月在NeurIPS 2020(2020年度國際人工智能頂會)上發(fā)表。

  其次,還要保證從虛擬環(huán)境到現(xiàn)實環(huán)境的可靠性。為此,秦熔均打造了南棲仙策檢驗標準,上線前對決策系統(tǒng)進行檢驗,以確定其和現(xiàn)實環(huán)境的擬合程度,并形成評分,直到達到要求。

  經(jīng)過這兩個環(huán)節(jié)的驗證,幾乎就可以確保決策系統(tǒng)的可靠。

  但俞揚對該決策系統(tǒng)的要求并不止于可靠,“我們決策系統(tǒng)的優(yōu)勢在于,它有想象力,能做出歷史上沒有見過的決策。”好比AlphaGo  Zero沒見過人類下棋,就能學會各種下棋策略。

  如今,南棲仙策智能決策已經(jīng)在一些場景中完成落地。

  “中國是個制造業(yè)大國,如果能在制造業(yè)場景把智能決策賦能上去,那能帶來很大的價值?!毙炝粮嬖V「甲子光年」。制造業(yè)分幾個場景,第一個場景是研發(fā)階段,需要從初始狀態(tài)找到更接近目標的過程或者參數(shù)組合,這個目標肯定有很多;第二是效率最大化的場景,或者性能最好,或者成本最低,對于研發(fā)過程中可能有這樣一個目標的定義。

  為了實現(xiàn)這個目標,南棲仙策通過不斷的試驗來完成這個目標,比如不斷調(diào)整參數(shù)做試驗,就是試錯的過程。但真實場景中試錯帶來的代價很大,業(yè)務人員第一反應就是能不能用模擬器的方式把這個東西實現(xiàn),在過程中智能決策就能自然而然派上用場,幫助企業(yè)降低試錯成本?!拔覀冋患移噺S商合作,幫助它們研發(fā)智能決策。預計可大幅減少測試次數(shù),加快新車上市的時間,為車企贏得競爭力?!毙炝裂a充道。

  實際上,在南棲仙策的探索下,基于強化學習的智能決策系統(tǒng)已經(jīng)有了頗為清晰的應用路徑:在研發(fā)環(huán)節(jié),可減少迭代次數(shù),提升研發(fā)效率;在生產(chǎn)環(huán)節(jié),可優(yōu)化產(chǎn)線配置,加快制造流程;在物流環(huán)節(jié),通過優(yōu)化揀選方案,提升物流環(huán)節(jié)效率,降低成本;在營銷環(huán)節(jié),則可改善投放策略、精準投放群體,進而提升銷量。

南棲仙策智能決策系統(tǒng)可應用場景

  讓俞揚引以為傲的是,盡管谷歌的AlphaGo曾讓深度學習名揚天下,但南棲仙策是全球第一個將這一技術走出游戲,并用于真實業(yè)務環(huán)境的。從這個意義上講,南棲仙策自主決策系統(tǒng)具有劃時代的價值。

4.中國AI的真機會

  基于強化學習的自主決策系統(tǒng)雖然價值巨大,但其“高冷”的外表讓很多人對其望而卻步。

  “我們接觸的很多人,包括客戶、投資人,都看不懂我們的技術,不知道我們到底是做什么的?!庇釗P對「甲子光年」稱。即使客戶有意愿使用這套智能決策系統(tǒng),也需要一定的門檻。

  如果研發(fā)出來的產(chǎn)品沒人用,那它的價值就等于零。

  所以對南棲仙策而言,一個重要的任務就是,讓這套智能決策系統(tǒng)更普適?!拔覀兿Ma(chǎn)品是,扔進去數(shù)據(jù),就出來決策結(jié)果。通過走一套通用的流程就可以投入實際的業(yè)務場景當中去。”南棲仙策COO徐亮解釋稱。

  這個愿望,已經(jīng)接近實現(xiàn)。2021年1月9日,南棲仙策在南京發(fā)布了旗下新一代智能決策系統(tǒng)——REVIVE。南棲仙策產(chǎn)品副總裁李濟君在發(fā)布會上稱,REVIVE要做的事,就是以強化學習算法為基礎,形成一個通用產(chǎn)品,再將這個通用產(chǎn)品應用到各行各業(yè),“用戶不用關注算法的細節(jié),只需要關注自身業(yè)務?!?/P>

  REVIVE系統(tǒng)的特色在于,用戶只需根據(jù)系統(tǒng)內(nèi)的模版,將excel等數(shù)據(jù)表上傳到系統(tǒng),描述業(yè)務邏輯,系統(tǒng)就可以自動訓練模擬器,并學習得到策略模型,應用到實際生產(chǎn)中。

REVIVE工作流程

  REVIVE已經(jīng)能做到以目標為導向,輸入當前業(yè)務當中需要最優(yōu)化的維度,策略模型就可以輸出一個決策結(jié)果。

  如此一來,其使用門檻大大降低,基于強化學習的自主決策系統(tǒng)就變成一個人人可用的產(chǎn)品。

  南棲仙策強化學習落地的速度不斷加快,也引起了越來越多同行業(yè)團隊的關注。

  在國際上,此前Google、DeepMind、Berkeley等世界知名人工智能機構的研究方向是虛擬環(huán)境下的決策系統(tǒng);如今這些機構的學者,也把目光放在如何讓強化學習走出游戲環(huán)境上。他們推動“離線強化學習”、“數(shù)據(jù)驅(qū)動強化學習”方向的研究,并建立了測評環(huán)境。照此下去,不出幾年,走出游戲環(huán)境將成為強化學習領域的主流研究方向之一。

  在俞揚看來,強化學習技術大規(guī)模應用后,將帶來重大變革,技術弱勢的競爭者可能會面臨來自算法的打擊。但國內(nèi)在基于強化學習的智能決策領域布局的公司非常少,通常的做法是從數(shù)據(jù)中利用一些進階的規(guī)則輔助決策。

  “這是個起點,也是我們的機會。中國AI企業(yè)需要突破原始創(chuàng)新能力,如果能抓住這一時機,促進強化學習在真實商業(yè)場景快速應用,很有可能實現(xiàn)人工智能應用的彎道超車。”甲子光年副總裁李世民表示。

  根據(jù)李世民的測算,目前該技術面向任一適用領域的市場空間都在百億級以上,前景十分廣闊。

  在這一機遇之下,南棲仙策已開始與相關企事業(yè)單位的合作,率先將強化學習技術落地在我國制造、物流、服務等行業(yè)以及在國防應用中,為我國的產(chǎn)業(yè)智能化升級和國家安全做出貢獻。

  在學術研究方面,俞揚聯(lián)合發(fā)起了亞洲強化學習研討會,并承擔了多屆研討會的組織;他還擔任了2020年在南京舉辦的國際分布式人工智能會議程序主席,該會議以智能體和多智能體為主要議題;在今年剛過去的1月9日南棲仙策智能決策發(fā)布會上,南棲仙策還與多家單位一起,發(fā)起成立CCF多智能體系統(tǒng)專業(yè)學組——智能決策對抗MeetUp暨智能決策開放研究聯(lián)盟,聯(lián)合企業(yè)應用優(yōu)勢與高校基礎研究優(yōu)勢,為中國AI研發(fā)帶來更多正向助力。

  但這條路并不好走,甚至還要面對質(zhì)疑。

  “歷史其實都是這樣,往后看滿是道理,往前看全是質(zhì)疑。不如堅守自己的信念,開始自己的征途,讓強化學習在真實決策問題上落地,創(chuàng)造不同的世界?!边@是俞揚的感慨,也是他的追求。

(轉(zhuǎn)載)

標簽:人工智能 大數(shù)據(jù) 我要反饋 
2024世界人工智能大會專題
即刻點擊并下載ABB資料,好禮贏不停~
優(yōu)傲機器人下載中心
西克
2024全景工博會
專題報道
2024 工博會 | 直播探館 · 全景解讀
2024 工博會 | 直播探館 · 全景解讀

第二十四屆中國工博會于9月24日至28日在國家會展中心(上海)舉行,展會以“工業(yè)聚能 新質(zhì)領航”為全新主題。 [更多]

2024世界人工智能大會
2024世界人工智能大會

WAIC 2024將于7月在上海舉行,論壇時間7月4日-6日,展覽時間7月4日-7日。WAIC 2024將圍繞“以共商促... [更多]

2024漢諾威工業(yè)博覽會專題
2024漢諾威工業(yè)博覽會專題

2024 漢諾威工業(yè)博覽會將于4月22 - 26日在德國漢諾威展覽中心舉行。作為全球首屈一指的工業(yè)貿(mào)易展覽會,本屆展覽會... [更多]