趨勢洞見 | 生成式AI

2025China.cn 2023年04月24日

生成式AI(Generative AI 或 AIGC)是利用現(xiàn)有文本、音頻文件或圖像創(chuàng)建新內(nèi)容的技術(shù)。

過去一年，其技術(shù)上的進(jìn)展主要來自于三大領(lǐng)域：圖像生成領(lǐng)域以DALL·E-2、Stable Diffusion為代表的擴(kuò)散模型(diffusion model)，自然語言處理(NLP)領(lǐng)域基于GPT-3.5的ChatGPT，代碼生成領(lǐng)域基于GPT-3的Copilot。

現(xiàn)階段的生成式AI通常被用來生成產(chǎn)品原型或初稿，應(yīng)用場景涵蓋圖文創(chuàng)作、代碼生成、游戲、廣告、藝術(shù)平面設(shè)計(jì)等。未來，生成式AI將成為一項(xiàng)大眾化的基礎(chǔ)技術(shù)，極大的提高數(shù)字化內(nèi)容的豐富度、創(chuàng)造性與生產(chǎn)效率，其應(yīng)用邊界也將隨著技術(shù)的進(jìn)步與成本的降低擴(kuò)展到更多領(lǐng)域。

趨勢解讀

生成式AI使用各種機(jī)器學(xué)習(xí)算法，從數(shù)據(jù)中學(xué)習(xí)要素，使機(jī)器能夠創(chuàng)建全新的數(shù)字視頻、圖像、文本、音頻或代碼等內(nèi)容。它創(chuàng)建出的內(nèi)容與訓(xùn)練數(shù)據(jù)保持相似，而非復(fù)制。

它的發(fā)展得益于近年來大模型在基礎(chǔ)研究尤其是深度學(xué)習(xí)上的突破，真實(shí)數(shù)據(jù)的積累和計(jì)算成本的下降。在過去的這一年，生成式AI將人工智能的價(jià)值聚焦到“創(chuàng)造”二字，這標(biāo)志著人工智能開始具備定義和呈現(xiàn)新事物的能力。

過去一年，生成式AI的進(jìn)展主要體現(xiàn)在如下領(lǐng)域：

圖像生成領(lǐng)域的進(jìn)展來自擴(kuò)散模型(Diffusion model)的應(yīng)用，以DALL·E-2、Stable Diffusion為代表。擴(kuò)散模型是一種從噪聲中生成圖像的深度學(xué)習(xí)技術(shù)。擴(kuò)散模型技術(shù)的背后，是更精準(zhǔn)理解人類語義的預(yù)訓(xùn)練模型、以及文本與圖像統(tǒng)一表示模型(CLIP)的支撐。它的出現(xiàn)，讓圖像生成變得更具想象力。

自然語言處理(NLP)領(lǐng)域的進(jìn)展來自于基于GPT3.5的ChatGPT(Generative Pre-trained Transformer)。這是一種基于互聯(lián)網(wǎng)可用數(shù)據(jù)訓(xùn)練的文本生成深度學(xué)習(xí)模型，用于問答、文本摘要生成、機(jī)器翻譯、分類、代碼生成和對(duì)話AI。得益于文本和代碼相結(jié)合的預(yù)訓(xùn)練大模型的發(fā)展，ChatGPT引入了人工標(biāo)注數(shù)據(jù)和強(qiáng)化學(xué)習(xí)(RLHF)來進(jìn)行持續(xù)訓(xùn)練和優(yōu)化。加入強(qiáng)化學(xué)習(xí)后，大模型能夠理解人類的指令以及背后的含義，根據(jù)人類反饋來判斷答案的質(zhì)量，給出可解釋的答案，并對(duì)于不合適的問題給出合理的回復(fù)，形成一個(gè)可迭代反饋的閉環(huán)。

代碼生成領(lǐng)域的進(jìn)展來自代碼生成系統(tǒng)AlphaCode和Copilot。2022年2月，Deepmind推出了他們的最新研究成果AlphaCode。它是一個(gè)可以自主編程的系統(tǒng)，在 Codeforces 舉辦的編程競賽中，超過了 47% 的人類工程師。這標(biāo)志著 AI 代碼生成系統(tǒng)，首次在編程競賽中，達(dá)到了具有競爭力的水平。基于開源代碼訓(xùn)練的Copilot開始商業(yè)化，作為訂閱服務(wù)提供給開發(fā)者，用戶可以通過使用Copilot自動(dòng)補(bǔ)全代碼。 Copilot作為一個(gè)基于大型語言模型的系統(tǒng)，盡管在多數(shù)情況下仍需要人工二次修正，但在簡單、重復(fù)性的代碼生成上，將幫助開發(fā)者提升工作效率，并給IDE(集成開發(fā)環(huán)境)行業(yè)帶來重大影響。

隨著內(nèi)容創(chuàng)造的爆發(fā)式增長，如何做到內(nèi)容在質(zhì)量和語義上的可控，成為可控式生成，將是生成式AI面臨的主要挑戰(zhàn)。在產(chǎn)業(yè)化方面，降成本仍是關(guān)鍵挑戰(zhàn)。只有像ChatGPT這樣的大模型訓(xùn)練成本和推理成本足夠低，才有可能規(guī)模化推廣。此外，數(shù)據(jù)的安全可控、創(chuàng)作版權(quán)和信任問題也需要隨著產(chǎn)業(yè)化加快逐一解決。

未來三年，生成式AI將步入技術(shù)產(chǎn)品化的快車道，在商業(yè)模式上會(huì)有更多探索，產(chǎn)業(yè)生態(tài)也會(huì)隨著應(yīng)用的普及逐步完善。Gartner預(yù)計(jì)，到2025年，生成式人工智能將占所有生成數(shù)據(jù)的10%，而目前這一比例還不到1%。

屆時(shí)，生成式AI的內(nèi)容創(chuàng)造能力將達(dá)到人類水平。擁有數(shù)據(jù)、計(jì)算能力、產(chǎn)品化經(jīng)驗(yàn)的大型科技公司將成為生成式AI落地的主要參與者?；谏赡Ｐ偷挠?jì)算基礎(chǔ)設(shè)施和平臺(tái)會(huì)逐步發(fā)展起來，模型變成隨手可得的服務(wù)，客戶不需要部署和運(yùn)行生成式模型的專業(yè)技能就可以使用。生成模型將在交互能力、安全可信、認(rèn)知智能上取得顯著進(jìn)展，以輔助人類完成各類創(chuàng)造性工作。

專家點(diǎn)評(píng)

生成式AI在2022年迎來了突破。不管是圖片生成，代碼生成還是開放域文本生成，在生成內(nèi)容的質(zhì)量，邏輯性和安全性方面都有明顯的提升?；贏I生成技術(shù)的應(yīng)用場景在今后幾年會(huì)更多涌現(xiàn)。但是，安全可控有倫理負(fù)責(zé)任的生成技術(shù)仍然需要重點(diǎn)研發(fā)，對(duì)于虛假生成內(nèi)容造成的不良社會(huì)影響需要尤其關(guān)注。

黃非達(dá)摩院語言技術(shù)實(shí)驗(yàn)室負(fù)責(zé)人

（達(dá)摩院）

標(biāo)簽：生成式AI

我要反饋

一塊煤被挖出來，從井下送到地面，運(yùn)到礦倉，再到洗煤廠，很多時(shí)候是用皮帶運(yùn)送。皮帶有幾公里長，在一些大型礦山，甚至有幾十公里長。皮帶不是完整的一根，從主皮帶到一級(jí)皮帶、二級(jí)... [詳情]

2023年04月24日曠視MEGVII AI

Cadence 推出 Allegro X AI，旨在加速 PCB 設(shè)計(jì)流程，可將周轉(zhuǎn)時(shí)間縮短 10 倍以上

2023年4月7日，楷登電子(美國Cadence公司，NASDAQ：CDNS)今日宣布推出Cadence?Allegro?XAItechnology，這是Cadence新一代系統(tǒng)設(shè)計(jì)技術(shù)，在性能和自動(dòng)化方面實(shí)現(xiàn)了革命性的提升。這款A(yù)... [詳情]

2023年04月24日 Cadence

中國擬給生成式人工智能立規(guī)

導(dǎo)讀：監(jiān)管與技術(shù)發(fā)展如何兼顧?作者|第一財(cái)經(jīng)劉佳高雅樊雪寒類ChatGPT的生成式人工智能(AIGC)大模型引發(fā)資本競逐，各國對(duì)于AIGC合規(guī)性的重視正在推動(dòng)相應(yīng)的監(jiān)管措施出臺(tái)。4月11日，中... [詳情]

2023年04月24日人工智能