siemens x
人工智能

趨勢洞見 | 生成式AI

2025China.cn   2023年04月24日

生成式AI(Generative AI 或 AIGC)是利用現(xiàn)有文本、音頻文件或圖像創(chuàng)建新內(nèi)容的技術(shù)。

過去一年,其技術(shù)上的進(jìn)展主要來自于三大領(lǐng)域:圖像生成領(lǐng)域以DALL·E-2、Stable Diffusion為代表的擴(kuò)散模型(diffusion model),自然語言處理(NLP)領(lǐng)域基于GPT-3.5的ChatGPT,代碼生成領(lǐng)域基于GPT-3的Copilot。

現(xiàn)階段的生成式AI通常被用來生成產(chǎn)品原型或初稿,應(yīng)用場景涵蓋圖文創(chuàng)作、代碼生成、游戲、廣告、藝術(shù)平面設(shè)計(jì)等。未來,生成式AI將成為一項(xiàng)大眾化的基礎(chǔ)技術(shù),極大的提高數(shù)字化內(nèi)容的豐富度、創(chuàng)造性與生產(chǎn)效率,其應(yīng)用邊界也將隨著技術(shù)的進(jìn)步與成本的降低擴(kuò)展到更多領(lǐng)域。

趨勢解讀

生成式AI使用各種機(jī)器學(xué)習(xí)算法,從數(shù)據(jù)中學(xué)習(xí)要素,使機(jī)器能夠創(chuàng)建全新的數(shù)字視頻、圖像、文本、音頻或代碼等內(nèi)容。它創(chuàng)建出的內(nèi)容與訓(xùn)練數(shù)據(jù)保持相似,而非復(fù)制。

它的發(fā)展得益于近年來大模型在基礎(chǔ)研究尤其是深度學(xué)習(xí)上的突破,真實(shí)數(shù)據(jù)的積累和計(jì)算成本的下降。在過去的這一年,生成式AI將人工智能的價(jià)值聚焦到“創(chuàng)造”二字,這標(biāo)志著人工智能開始具備定義和呈現(xiàn)新事物的能力。

過去一年,生成式AI的進(jìn)展主要體現(xiàn)在如下領(lǐng)域:

圖像生成領(lǐng)域的進(jìn)展來自擴(kuò)散模型(Diffusion model)的應(yīng)用,以DALL·E-2、Stable Diffusion為代表。擴(kuò)散模型是一種從噪聲中生成圖像的深度學(xué)習(xí)技術(shù)。擴(kuò)散模型技術(shù)的背后,是更精準(zhǔn)理解人類語義的預(yù)訓(xùn)練模型、以及文本與圖像統(tǒng)一表示模型(CLIP)的支撐。它的出現(xiàn),讓圖像生成變得更具想象力。

自然語言處理(NLP)領(lǐng)域的進(jìn)展來自于基于GPT3.5的ChatGPT(Generative Pre-trained Transformer)。這是一種基于互聯(lián)網(wǎng)可用數(shù)據(jù)訓(xùn)練的文本生成深度學(xué)習(xí)模型,用于問答、文本摘要生成、機(jī)器翻譯、分類、代碼生成和對(duì)話AI。得益于文本和代碼相結(jié)合的預(yù)訓(xùn)練大模型的發(fā)展,ChatGPT引入了人工標(biāo)注數(shù)據(jù)和強(qiáng)化學(xué)習(xí)(RLHF)來進(jìn)行持續(xù)訓(xùn)練和優(yōu)化。加入強(qiáng)化學(xué)習(xí)后,大模型能夠理解人類的指令以及背后的含義,根據(jù)人類反饋來判斷答案的質(zhì)量,給出可解釋的答案,并對(duì)于不合適的問題給出合理的回復(fù),形成一個(gè)可迭代反饋的閉環(huán)。

代碼生成領(lǐng)域的進(jìn)展來自代碼生成系統(tǒng)AlphaCode和Copilot。2022年2月,Deepmind推出了他們的最新研究成果AlphaCode。它是一個(gè)可以自主編程的系統(tǒng),在 Codeforces 舉辦的編程競賽中,超過了 47% 的人類工程師。這標(biāo)志著 AI 代碼生成系統(tǒng),首次在編程競賽中,達(dá)到了具有競爭力的水平。 基于開源代碼訓(xùn)練的Copilot開始商業(yè)化,作為訂閱服務(wù)提供給開發(fā)者,用戶可以通過使用Copilot自動(dòng)補(bǔ)全代碼。 Copilot作為一個(gè)基于大型語言模型的系統(tǒng),盡管在多數(shù)情況下仍需要人工二次修正,但在簡單、重復(fù)性的代碼生成上,將幫助開發(fā)者提升工作效率,并給IDE(集成開發(fā)環(huán)境)行業(yè)帶來重大影響。

隨著內(nèi)容創(chuàng)造的爆發(fā)式增長,如何做到內(nèi)容在質(zhì)量和語義上的可控,成為可控式生成,將是生成式AI面臨的主要挑戰(zhàn)。在產(chǎn)業(yè)化方面,降成本仍是關(guān)鍵挑戰(zhàn)。只有像ChatGPT這樣的大模型訓(xùn)練成本和推理成本足夠低,才有可能規(guī)模化推廣。此外,數(shù)據(jù)的安全可控、創(chuàng)作版權(quán)和信任問題也需要隨著產(chǎn)業(yè)化加快逐一解決。

未來三年,生成式AI將步入技術(shù)產(chǎn)品化的快車道,在商業(yè)模式上會(huì)有更多探索,產(chǎn)業(yè)生態(tài)也會(huì)隨著應(yīng)用的普及逐步完善。Gartner預(yù)計(jì),到2025年,生成式人工智能將占所有生成數(shù)據(jù)的10%,而目前這一比例還不到1%。

屆時(shí),生成式AI的內(nèi)容創(chuàng)造能力將達(dá)到人類水平。擁有數(shù)據(jù)、計(jì)算能力、產(chǎn)品化經(jīng)驗(yàn)的大型科技公司將成為生成式AI落地的主要參與者?;谏赡P偷挠?jì)算基礎(chǔ)設(shè)施和平臺(tái)會(huì)逐步發(fā)展起來,模型變成隨手可得的服務(wù),客戶不需要部署和運(yùn)行生成式模型的專業(yè)技能就可以使用。生成模型將在交互能力、安全可信、認(rèn)知智能上取得顯著進(jìn)展,以輔助人類完成各類創(chuàng)造性工作。

專家點(diǎn)評(píng)

生成式AI在2022年迎來了突破。不管是圖片生成,代碼生成還是開放域文本生成,在生成內(nèi)容的質(zhì)量,邏輯性和安全性方面都有明顯的提升?;贏I生成技術(shù)的應(yīng)用場景在今后幾年會(huì)更多涌現(xiàn)。但是,安全可控有倫理負(fù)責(zé)任的生成技術(shù)仍然需要重點(diǎn)研發(fā),對(duì)于虛假生成內(nèi)容造成的不良社會(huì)影響需要尤其關(guān)注。

黃非 達(dá)摩院語言技術(shù)實(shí)驗(yàn)室負(fù)責(zé)人

(達(dá)摩院)

標(biāo)簽:生成式AI 我要反饋 
2024世界人工智能大會(huì)專題
即刻點(diǎn)擊并下載ABB資料,好禮贏不停~
優(yōu)傲機(jī)器人下載中心
西克
2024全景工博會(huì)
專題報(bào)道
2024 工博會(huì) | 直播探館 · 全景解讀
2024 工博會(huì) | 直播探館 · 全景解讀

第二十四屆中國工博會(huì)于9月24日至28日在國家會(huì)展中心(上海)舉行,展會(huì)以“工業(yè)聚能 新質(zhì)領(lǐng)航”為全新主題。 [更多]

2024世界人工智能大會(huì)
2024世界人工智能大會(huì)

WAIC 2024將于7月在上海舉行,論壇時(shí)間7月4日-6日,展覽時(shí)間7月4日-7日。WAIC 2024將圍繞“以共商促... [更多]

2024漢諾威工業(yè)博覽會(huì)專題
2024漢諾威工業(yè)博覽會(huì)專題

2024 漢諾威工業(yè)博覽會(huì)將于4月22 - 26日在德國漢諾威展覽中心舉行。作為全球首屈一指的工業(yè)貿(mào)易展覽會(huì),本屆展覽會(huì)... [更多]