siemens x
原創(chuàng)

圓桌對話:從技術(shù)到應(yīng)用,大模型如何轉(zhuǎn)向?

2025China.cn   2024年08月02日

智能網(wǎng)原創(chuàng),轉(zhuǎn)載請注明來源

從ChatGPT橫空出世,引發(fā)了無數(shù)的猜想和商機(jī),到撥開迷霧,積極尋找大模型應(yīng)用落地的支點,短短1年多的時間,大模型市場就迎來了從狂熱到冷靜的理性回歸。但是大模型與產(chǎn)業(yè)如何結(jié)合?開源模型和閉源模型如何選擇?除了資金企業(yè)還應(yīng)該做好哪些準(zhǔn)備?在產(chǎn)業(yè)應(yīng)用之前,大模型依然有很多待解的難題。

近日,一場圍繞AI大模型的圓桌對話試圖從不同維度對上述問題給出答案。

安筱鵬:安筱鵬 阿里云智能集團(tuán)副總裁

討論嘉賓:

殷宇輝 360集團(tuán)副總裁、數(shù)智化集團(tuán)CEO、人工智能研究院院長

周亞靈 華為云工業(yè)數(shù)字化首席產(chǎn)業(yè)架構(gòu)師,總監(jiān)

杜夏威 中科曙光總裁助理兼智能計算產(chǎn)品事業(yè)部總經(jīng)理

馬超 潤和軟件首席AI技術(shù)官

圓桌討論實錄

安筱鵬:歡迎大家來到圓桌對話環(huán)節(jié)!首先請4位嘉賓分別用一個關(guān)鍵詞來分享對于當(dāng)下火熱的AI大模型的觀察。

殷宇輝:如果說用一個詞的話,我覺得是新質(zhì)生產(chǎn)力的場明星場景。大模型是新質(zhì)生產(chǎn)力的核心引擎,但基于 AI怎么樣找到場景去落地,其實是今年百行千業(yè)都面臨的問題。對此,每家企業(yè)都有自己的一些方法論和實踐,但是這些實踐怎么樣變得更通用,推動大模型更完善,或者更行業(yè)化、更垂直化,可能是我們下一步要探索的重點。

周亞靈:如果用一個詞的話,就是大模型代際技術(shù)升級帶來的商業(yè)價值閉環(huán)。

通信從3G到4G,手機(jī)從功能機(jī)到智能機(jī),汽車從燃油車到新能源汽車都是代際升級,那么大模型或者人工智能的代際升級在哪里?能否像新能源汽車一樣帶來代際上的差異。其次,人工智能的具身智能,能夠真正帶來大規(guī)模顆粒變現(xiàn),顆粒正循環(huán)的場景在哪里?這對于對行業(yè)的示范意義和引導(dǎo)意義非常重大。

杜夏威 :用一個關(guān)鍵詞的話,我個人會選擇落地。大家都能夠感知到現(xiàn)在大模型的火熱程度,但是如何實現(xiàn)整個技術(shù)鏈條的閉環(huán),形成產(chǎn)業(yè)級的應(yīng)用,不僅是眼下的主要問題,也是決定大模型和AIGC技術(shù)持續(xù)可循環(huán)發(fā)展的一個關(guān)鍵問題。

馬超:用一個詞來形容大模型,我關(guān)注的是企業(yè)級應(yīng)用。

企業(yè)應(yīng)用大模型的時候會面臨成本、數(shù)據(jù)收集,行業(yè)KNOW-HOW沉淀等很多問題。相比AI1.0時代,大模型讓我們看到了人工智能的上限,同時也增加了企業(yè)級AI應(yīng)用的落地成本,這個也是我今年比較關(guān)注的。

安筱鵬:AI大模型是一次技術(shù)的升級,還是會帶來一次技術(shù)的產(chǎn)業(yè)革命,業(yè)界有不同的認(rèn)識和判斷。各位看來,這一輪的AI大模型跟5、6年前的傳統(tǒng)AI或者說判別式人工智能的本質(zhì)區(qū)別是什么?它會不會帶來顛覆式的產(chǎn)業(yè)影響?

殷宇輝:AI大模型跟傳統(tǒng)AI或者大數(shù)據(jù)技術(shù)不同的幾個方面:第一在生成,第二是在邏輯性推理的增強(qiáng),第三,也是最重要的是對交互方式的改變。

從Chat GPT開始,不管數(shù)字人還是各類問答,新的交互方式已經(jīng)改變了我們的生活,這是大語言模型最本質(zhì)的功能或特性。從GPT開始到現(xiàn)在文生視頻,基于transform架構(gòu)可以實現(xiàn)文本的對齊,圖片的對齊,甚至視頻拆成一個立體空間再小塊的對齊,這和原來的技術(shù)架構(gòu)是完全不一樣的。所以我同意您講的后半句,就是說這是一次產(chǎn)業(yè)革命,是產(chǎn)業(yè)革命一定是它給人們的使用帶來了交互式的革新。

第二,AI大模型的技術(shù)能隨著時間推演,逐步升維,同時成本還在持續(xù)降低。下一步,從泛互聯(lián)網(wǎng)延伸到傳統(tǒng)產(chǎn)業(yè),這個模式最后會席卷所有產(chǎn)業(yè),我覺得它會是一次真正的 AGI(通用人工智能)的革命。

馬超:我認(rèn)為大模型跟傳統(tǒng)判別式模型的關(guān)鍵區(qū)別之一在開放域問題上。判別式模型要求在特定任務(wù)范圍產(chǎn)生相應(yīng)的能力,而生成式模型更擅長于對開放域的問題進(jìn)行相應(yīng)的解決。

另外的區(qū)別是大模型的參數(shù)量,訓(xùn)練數(shù)據(jù)量,還有智能化程度。比如,一些開源大模型,它不需要做任何的訓(xùn)練就可以直接用于實際的應(yīng)用,而且能取得比較好的效果,傳統(tǒng)的判別式模型需要從0開始訓(xùn)練。另外,從產(chǎn)業(yè)顛覆的角度來講,AI的出現(xiàn)使得原本沒有進(jìn)入賽道的企業(yè),有可能通過AI技術(shù)進(jìn)入客戶視野,可能會引起市場的重新洗牌。

其次,技術(shù)供應(yīng)商的合作模式也發(fā)生了很大的改變。AI 1.0時代因為成本比較低,AI技術(shù)服務(wù)提供商可以一站式提供技術(shù)或方案。但是大模型出來之后,算力成本、數(shù)據(jù)成本、模型成本都在提高,不是一家供應(yīng)商能夠完成的,所以形成了算力服務(wù)商、數(shù)據(jù)標(biāo)注服務(wù)商、基礎(chǔ)模型服務(wù)商和解決方案服務(wù)商,4個角色共同為1家企業(yè)提供人工智能服務(wù),技術(shù)供應(yīng)商的體系結(jié)構(gòu)分工更加明確。

安筱鵬:今年的漢諾威工業(yè)博覽會上提出了一個問題,美國的大模型和德國的制造業(yè)在結(jié)合之后做什么。中國也在探討大模型跟實體經(jīng)濟(jì)的結(jié)合,在結(jié)合融合落地的過程中面臨哪些問題挑戰(zhàn)?加速推進(jìn)應(yīng)該具備哪些基礎(chǔ)?

周亞靈:大模型跟實體經(jīng)濟(jì)的結(jié)合跟制造業(yè)數(shù)字化轉(zhuǎn)型一樣,很難有一個放之四海而皆準(zhǔn)的法則,但是我們可以從細(xì)枝末節(jié)里看到一些通用的方法?;谌A為公司自身去做大模型和應(yīng)用大模型過程中形成的一些經(jīng)驗,我們認(rèn)為,做企業(yè)大模型首先要回答三個基本問題:第一,公司內(nèi)部業(yè)務(wù)用大模型到底有沒有達(dá)成統(tǒng)一的共識,有沒有行動綱領(lǐng)。第二,公司有沒有核心的業(yè)務(wù)場景。第三、有沒有明確的組織,應(yīng)用大模型一定要有組織和人才。

在應(yīng)用大模型的過程中,華為形成了“四位一體”概念,即將業(yè)務(wù)場景、數(shù)據(jù)、算力和算法結(jié)合,在公司內(nèi)部達(dá)成共識。

在核心業(yè)務(wù)場景方面,華為梳理了三大類的業(yè)務(wù)場景:第一類是價值最高的,生產(chǎn)力和競爭力提升的場景。第二類是防控風(fēng)險防控場景,如合同大模型,供應(yīng)鏈大模型。第三類是業(yè)務(wù)和體驗效率提升的場景,如員工的數(shù)字助理。

此外,在服務(wù)客戶的過程中又定義了“五有”,即有意愿、有場景、有數(shù)據(jù)、有人才、有計劃,并形成場景應(yīng)用的價值閉環(huán),運(yùn)營閉環(huán),生態(tài)閉環(huán)。

杜夏威 :我覺得當(dāng)下的大模型,如果僅僅作為一個技術(shù)研究領(lǐng)域,或者類似于一個純娛樂性的東西,可能并不需要去考慮太多的可治理性和嚴(yán)謹(jǐn)性。一旦回到工業(yè)化應(yīng)用層面,就會變成一個非常嚴(yán)肅的問題,比如,故障率,穩(wěn)定性,容錯率怎么做。

我覺得可能有兩個層面需要嚴(yán)肅探討。第一,如果做工業(yè)級的應(yīng)用,工業(yè)領(lǐng)域的專家首先要思考清楚,到底打算把它用在什么場景上,或者什么樣的場景適合和AI技術(shù)結(jié)合。并不是所有的場景都需要大模型,可能5年、10年前的AI技術(shù)完全可以把當(dāng)前的問題解決掉。第二,原則上不存在一種萬能的大模型,或者說可能存在但未必是最高效的。探討工業(yè)級應(yīng)用可能又是一個高度耦合的問題,需要復(fù)合型人才,需要多領(lǐng)域的協(xié)同來解決。

安筱鵬:下一個問題,當(dāng)企業(yè)要解決特定行業(yè)發(fā)展中的問題時,基于一個基礎(chǔ)模型,如何能夠快速、低成本、高質(zhì)量的訓(xùn)練符合自己業(yè)務(wù)需要的模型?在算力數(shù)據(jù)、人才算法上有沒有什么樣的挑戰(zhàn)和問題?

殷宇輝 :坦白講,在當(dāng)前階段要想快速、低成本還要高質(zhì)量,會有一些悖論。

今天,泛互聯(lián)網(wǎng)的業(yè)務(wù)基本上是在一個通用大模型上針對各種應(yīng)用場景做微調(diào)。但是在to B場景里面,首先數(shù)據(jù)是一個特別大的壁壘,怎么懂專家知識,怎么讓大模型懂行話,這個是必須得邁過去的一道坎。

還有幾點我們在實際案例中摸索出來的經(jīng)驗,首先,企業(yè)不一定需要一個參數(shù)量特別大的通用大模型,可能是又小又專的大模型的組合,針對不同場景可以用最輕量的微調(diào)方式,得到一個最適合自身場景的大模型應(yīng)用。

周亞靈:現(xiàn)在大模型成本還是比較高的,又快速又便宜目前還是有挑戰(zhàn)的。

從我實際接觸的項目來看,有幾點觀察和可以跟各位分享。第一,模型的選型要結(jié)合場景,看企業(yè)自身的技術(shù)路線是什么。第二、根據(jù)自身能力選擇實施方式,選擇開源意味著你有組織和能力去不斷優(yōu)化、調(diào)優(yōu),但是很多公司特別是中型企業(yè)或傳統(tǒng)企業(yè),如果沒有這個能力,可以選擇一些商用的大模型,由供應(yīng)商來提供端到端的高質(zhì)量服務(wù)。第三、實施的時候可以從從輔助場景開始,一方面能快速看到價值,另一方面也是讓團(tuán)隊快速成長起來。

我個人認(rèn)為,大模型最終要重構(gòu)所有的企業(yè),重構(gòu)所有人員,公司無論規(guī)模大小,自己一定要有構(gòu)建能力,如果完全依賴供應(yīng)商,很難把大模型用到實處。因為大模型有一個特點,會根據(jù)數(shù)據(jù)積累,根據(jù)應(yīng)用場景越用越好用,如果完全不清楚怎么用的話,企業(yè)很難發(fā)揮好這個特點,這樣跟使用小模型相比,其實沒有任何的競爭力了。

安筱鵬:好,第三個好我們再問4位嘉賓最后一個問題?,F(xiàn)在數(shù)字技術(shù)體系的競爭是一個這個國家的競爭,生態(tài)的競爭,在這個過程中,怎么來看大模型的開源和閉源在整個產(chǎn)業(yè)發(fā)展中的作用?

馬超:我說一句比較客觀的話,閉源模型無論從數(shù)據(jù)投入還是算力投入,在通用的領(lǐng)域里面是要超越開源的。但是在在一些特定行業(yè),經(jīng)過微調(diào)后的開源模型能力不輸于沒法微調(diào)的商業(yè)模型。

商業(yè)模型可以生成一些數(shù)據(jù),幫助引導(dǎo)訓(xùn)練開源模型開源模型可能更適合于解決固定的場景化、低成本的解決方案,而商業(yè)模型更適合去推動整個行業(yè)發(fā)展,然后去輔助落實這些解決方案。

杜夏威:開源模型還是閉源模型,如果從用的角度上說,最后一定會變成你適合的是哪個。

閉源模型有它自身的一些技術(shù)優(yōu)勢,畢竟它通過了很多數(shù)據(jù)資產(chǎn)的凝練打磨,還有技術(shù)迭代,但是未必所有人都支付得起。開源在一定維度上提升了大模型技術(shù)的覆蓋面,讓更多的領(lǐng)域和用戶都有機(jī)會去嘗試。所以我覺得這個問題可能還會延續(xù)下去,兩者還是一個并存的狀態(tài)。

周亞靈 :我個人覺得從整個信息產(chǎn)業(yè)來說,開源是個好事情。對于供應(yīng)商來說,開源和閉源其實主要取決于商業(yè)決策,靠什么去變現(xiàn),本質(zhì)上它是商業(yè)行為,并不是技術(shù)路線的問題。開源也不意味著免費(fèi),閉源也并不意味著落后。

對用戶來說,開源和閉源還是和組織能力和場景選擇有關(guān)系。如果用戶真正的想把大模型融入骨子里,做成產(chǎn)品的一部分,可能選擇開源更好。從我們的經(jīng)驗來說,閉源其實更方便,因為有商業(yè)保障,有商業(yè)服務(wù)。

殷宇輝 :我特別贊同的說法是,開源真的改變了世界。

但是企業(yè)如果真正要用,還是要從自身定位出發(fā),像互聯(lián)網(wǎng)企業(yè)大多數(shù)的基礎(chǔ)設(shè)施都是構(gòu)建于開源軟件,因為互聯(lián)網(wǎng)場景多又復(fù)雜,如果基于閉源軟件很多情況需要持續(xù)去調(diào)優(yōu)。但是對于很多傳統(tǒng)企業(yè),坦白講我覺得閉源可能用起來更放心,更穩(wěn)定更好用。

安筱鵬:根據(jù)大家的討論,我們的結(jié)論是:今天的AI大模型不是一次技術(shù)的簡單升級,而是一次技術(shù)的革命。

如果再去追問到底是什么革命,我覺得是三場革命:第一場革命就是人機(jī)交互革命。第二個場革命叫做認(rèn)知協(xié)作,互聯(lián)網(wǎng)的本質(zhì)是信息的供需精準(zhǔn)匹配,而大模型帶來的認(rèn)知協(xié)作是從問題到答案給出了最短路徑。第三個是計算范式的革命。今天我們看到全球芯片廠商市值在高速增長,這個革命如果是一場馬拉松的話,我們可能才跑出一公里,這是一個長跑,在這個過程中需要有爆發(fā)力,需要有耐力,它不僅僅是一個大模型本身的競爭,也是一個整個產(chǎn)業(yè)生態(tài)體系的競爭。

標(biāo)簽:大模型 我要反饋 
2024世界人工智能大會專題
即刻點擊并下載ABB資料,好禮贏不停~
優(yōu)傲機(jī)器人下載中心
西克
2024全景工博會
專題報道
2024 工博會 | 直播探館 · 全景解讀
2024 工博會 | 直播探館 · 全景解讀

第二十四屆中國工博會于9月24日至28日在國家會展中心(上海)舉行,展會以“工業(yè)聚能 新質(zhì)領(lǐng)航”為全新主題。 [更多]

2024世界人工智能大會
2024世界人工智能大會

WAIC 2024將于7月在上海舉行,論壇時間7月4日-6日,展覽時間7月4日-7日。WAIC 2024將圍繞“以共商促... [更多]

2024漢諾威工業(yè)博覽會專題
2024漢諾威工業(yè)博覽會專題

2024 漢諾威工業(yè)博覽會將于4月22 - 26日在德國漢諾威展覽中心舉行。作為全球首屈一指的工業(yè)貿(mào)易展覽會,本屆展覽會... [更多]