siemens x
人工智能

“幻覺(jué)”會(huì)成為AI的終極問(wèn)題嗎?

2025China.cn   2024年08月06日

“盡管AI產(chǎn)生的“幻覺(jué)”可能令人擔(dān)憂,但該技術(shù)仍然是塑造行業(yè)以及開(kāi)創(chuàng)未來(lái)的重要一環(huán)。”—Shoshana Kranish

人工智能通常被視為有助于解決當(dāng)今社會(huì)中大量緊迫問(wèn)題的良策,其強(qiáng)大的功能包括:快如閃電的數(shù)據(jù)整理速度、準(zhǔn)確的預(yù)測(cè)功能、無(wú)人可及的分類效率,不一而足。但其仍然是一項(xiàng)不斷發(fā)展、存在缺陷的技術(shù),最近,“幻覺(jué)”成為了關(guān)于AI的焦點(diǎn)議題。

具體而言,AI會(huì)提出一些不合常理的建議,比如在披薩上涂膠水,以免奶酪滑落,而且在被要求進(jìn)行法律研究時(shí),它還會(huì)虛構(gòu)整個(gè)法庭案件。然而,盡管存在這些幻覺(jué)問(wèn)題,AI仍然是一種備受依賴的工具:如今,企業(yè)、政府以及整個(gè)行業(yè)都將其作為運(yùn)營(yíng)的重要支柱。

但是,一款經(jīng)常產(chǎn)生錯(cuò)誤結(jié)果的工具怎么能用于對(duì)精度要求極高的工業(yè)應(yīng)用呢?答案有點(diǎn)復(fù)雜。

何為AI幻覺(jué)?

AI幻覺(jué)是其由于處理失誤以及不良的訓(xùn)練數(shù)據(jù)等多種原因而可能生成不準(zhǔn)確或誤導(dǎo)性的結(jié)果。

以谷歌最近推出的AI概覽(AI Overviews)功能為例,AI概覽幾乎從一開(kāi)始就產(chǎn)生了“幻覺(jué)”,給用戶的建議包括吃石頭來(lái)避免礦物質(zhì)缺乏,或者從金門大橋上跳下去。但當(dāng)這些概覽答案出現(xiàn)之后,谷歌立即迅速撤回了大部分答案。

達(dá)索系統(tǒng)自然語(yǔ)言處理專家和AI專家Eric Vernet解釋道:“大型語(yǔ)言模型(LLM)通過(guò)大量公共文本得到訓(xùn)練,而這些文本大多來(lái)自互聯(lián)網(wǎng)。其學(xué)習(xí)環(huán)境自然而然地會(huì)包含大量通用信息,其中一些為垃圾信息。”

“掌握所有這些同時(shí)包括了有用和誤導(dǎo)性的知識(shí)后,AI可能會(huì)在某些情況下得出完全錯(cuò)誤的答案”,他補(bǔ)充道。

AI系統(tǒng)必須對(duì)來(lái)自LLM的海量數(shù)據(jù)進(jìn)行分類,才能執(zhí)行相關(guān)功能

像大多數(shù)技術(shù)一樣,AI也有弱點(diǎn),而生成式AI工具尤為脆弱。AI本身不會(huì)思考,只會(huì)分類。它會(huì)查閱大量數(shù)據(jù),識(shí)別模式并從中推斷真理。它本身不具備思維,無(wú)法權(quán)衡其給出的想法,而且在接收海量信息(其中一些是垃圾信息)時(shí),它不知道如何區(qū)分對(duì)錯(cuò)。

在解釋谷歌概覽功能的爭(zhēng)議時(shí),谷歌搜索副總裁Liz Reid表示,該產(chǎn)品經(jīng)過(guò)訓(xùn)練,“會(huì)顯示排序最靠前的網(wǎng)頁(yè)結(jié)果所支持的信息”,不過(guò)指定網(wǎng)頁(yè)的瀏覽量與其發(fā)布內(nèi)容的正確性并無(wú)關(guān)系。

AI最大的缺陷之一是,其智能取決于所接收的數(shù)據(jù),如果接收的信息質(zhì)量不高,那輸出結(jié)果也不盡如人意。

盡管存在幻覺(jué),但仍有用武之地:

AI超越了聊天機(jī)器人的范疇

毋庸置疑,生成式AI存在一定缺陷。但還有很多其它類型的人工智能對(duì)于企業(yè)的日常運(yùn)營(yíng)不可或缺。

例如,汽車制造商可能會(huì)使用判別式AI對(duì)零件進(jìn)行分類,然后將其與預(yù)測(cè)式AI進(jìn)行耦合,后者可以識(shí)別模式并做出預(yù)測(cè),以便用于決策制定。這些預(yù)測(cè)可應(yīng)用于從材料成本到機(jī)器維護(hù)的任何環(huán)節(jié),在業(yè)務(wù)運(yùn)營(yíng)的各個(gè)層面,AI用例屢見(jiàn)不鮮。

汽車制造商利用AI來(lái)優(yōu)化零件采購(gòu)與設(shè)計(jì),調(diào)整工作流程并確保機(jī)器的準(zhǔn)確性和高效率。

這類可自由支配的工具比一些公開(kāi)的程序更準(zhǔn)確、實(shí)用,而且更容易獲得成功,這都要?dú)w功于其所采用的訓(xùn)練方式。

面向公眾的程序是通過(guò)LLM進(jìn)行訓(xùn)練,但用于工業(yè)用途的AI并非如此。它在僅包含所需信息的孤島環(huán)境中學(xué)習(xí),以確保工具提供準(zhǔn)確性和實(shí)用性。由于只接觸相關(guān)的特定信息,這種AI不太可能產(chǎn)生幻覺(jué)。

Vernet表示:“根據(jù)企業(yè)自己的專有數(shù)據(jù)和分類標(biāo)準(zhǔn)訓(xùn)練的后端AI要比生成式AI準(zhǔn)確得多。一些企業(yè)擁有自己專用的詞匯和流程等,因此,如果AI專門根據(jù)這些信息集進(jìn)行訓(xùn)練,它將變得‘更智能’。”

這對(duì)于擁有重要專有信息或使用特定內(nèi)部語(yǔ)言的企業(yè)而言尤為重要。通過(guò)部署基于公共數(shù)據(jù)訓(xùn)練的工具將無(wú)法勝任這項(xiàng)工作,只有熟悉企業(yè)術(shù)語(yǔ)、縮略詞及流程等的獨(dú)特工具才能實(shí)現(xiàn)其所需要的目標(biāo)。

我們能夠解決AI幻覺(jué)嗎?

與所有技術(shù)一樣,AI需要經(jīng)歷NLP專家Kelly Stone所提出的“人機(jī)回圈”驗(yàn)證階段。通過(guò)將人類納入到檢查和改進(jìn)AI輸出的流程之中,這將確保此類技術(shù)能夠持續(xù)學(xué)習(xí),從而最終產(chǎn)生更精細(xì)、更準(zhǔn)確的答案。

AI企業(yè)一直在努力改進(jìn)其產(chǎn)品,通常有幾種重要的方式來(lái)實(shí)現(xiàn)這些改進(jìn)。擁有海量數(shù)據(jù)已經(jīng)讓人感到開(kāi)頭難了,但真正的挑戰(zhàn)在于采用一種易于訪問(wèn)和使用的方式來(lái)組織這些數(shù)據(jù)。同時(shí),考慮到大多數(shù)企業(yè)的數(shù)據(jù)都在不斷增長(zhǎng),有時(shí)甚至呈指數(shù)級(jí)增長(zhǎng),這就說(shuō)明穩(wěn)健可靠的結(jié)構(gòu)非常重要。

在3DEXPERIENCE平臺(tái)等統(tǒng)一位置維護(hù)數(shù)據(jù)庫(kù),可讓企業(yè)在一致的環(huán)境和狀態(tài)下保存信息。這些數(shù)據(jù)可從統(tǒng)一位置高效應(yīng)用于任何類型的功能,無(wú)論是預(yù)測(cè)成本波動(dòng)還是通過(guò)執(zhí)行NLP來(lái)描述市場(chǎng)趨勢(shì),都易如反掌。托管的平臺(tái)擺脫了孤島信息,讓用戶能夠訪問(wèn)高級(jí)分析功能,從而有望優(yōu)化流程,發(fā)現(xiàn)新機(jī)遇,并改進(jìn)企業(yè)運(yùn)營(yíng)。

達(dá)索系統(tǒng)信息情報(bào)品牌NETVIBES的Stone主張進(jìn)一步開(kāi)發(fā)和使用此類程序。通過(guò)完善AI,這將減少幻覺(jué)問(wèn)題,為各類用戶帶來(lái)更值得信賴的工具。再結(jié)合不斷擴(kuò)展的后端程序以及為其提供動(dòng)力的AI,我們將獲得完美的情報(bào)風(fēng)暴。

Stone表示:“我確信,未來(lái)的AI將非??煽?。”盡管她承認(rèn)我們尚未成功,但她認(rèn)為,將生成式、判別式和預(yù)測(cè)式等所有類型的AI的準(zhǔn)確率提高到接近100%,而非80%左右,這并非天方夜譚。

眾所周知,人無(wú)完人,人類尚且如此,因此要?jiǎng)?chuàng)建一臺(tái)完美無(wú)缺的機(jī)器有點(diǎn)強(qiáng)人所難。但克服生成式AI幻覺(jué)等重重障礙,將開(kāi)啟一個(gè)無(wú)限可能的新世界,并幫助我們兌現(xiàn)這類新興技術(shù)的全部承諾。

為未來(lái)AI完善解決問(wèn)題的方法

和所有其它技術(shù)及創(chuàng)新一樣,AI也面臨“最后一英里”的終極問(wèn)題。

公交車會(huì)停靠在終點(diǎn)站,但乘客的旅程永無(wú)止境。禁止通行的道路和失靈的GPS設(shè)備會(huì)給送貨上門設(shè)置障礙,但這依舊阻擋不了我們?cè)诰€購(gòu)物的行動(dòng)。人工智能也不例外。其生成式功能就是這最后幾英里,正如那些尚未開(kāi)通地鐵的社區(qū)或者只有無(wú)人機(jī)才能到達(dá)的偏遠(yuǎn)地區(qū)。

當(dāng)公共交通系統(tǒng)并未覆蓋城市的每個(gè)街區(qū)時(shí),我們沒(méi)有棄之不用;當(dāng)一些偏遠(yuǎn)的地址難以到達(dá)時(shí),我們也沒(méi)有放棄在線購(gòu)物的想法。我們?nèi)栽谂ο蛩腥颂峁┻@些機(jī)會(huì),而且AI趨于完美的坎坷之路也如出一轍。

盡管生成式AI可能會(huì)繼續(xù)產(chǎn)生幻覺(jué),但后端AI將不遺余力地為整個(gè)行業(yè)發(fā)光發(fā)熱。持續(xù)改進(jìn)、訓(xùn)練和接觸高質(zhì)量的結(jié)構(gòu)化數(shù)據(jù),將是確保人工智能臻于卓越的必要條件。實(shí)踐證明,在實(shí)現(xiàn)完美的路途中,最后一英里的終極挑戰(zhàn)(細(xì)微的差別、不可言喻的人情味、未預(yù)見(jiàn)情況的應(yīng)對(duì)之策)往往都晦澀難懂。但晦澀難懂并非不可實(shí)現(xiàn)。雖然AI幻覺(jué)現(xiàn)象帶來(lái)了一系列獨(dú)特的挑戰(zhàn),但也凸顯了人類協(xié)作在AI開(kāi)發(fā)和部署中的重大意義。

隨著企業(yè)和技術(shù)專家持續(xù)開(kāi)發(fā)用于提高AI性能的戰(zhàn)略,業(yè)界對(duì)其有能力實(shí)現(xiàn)行業(yè)變革的信心不斷提升。完善AI的旅程遍布荊棘,但對(duì)于跨越“最后一英里”鴻溝的不懈追求正是人們共同向往美好未來(lái)的良好例證。未來(lái),AI解決方案不僅近乎完美,而且值得信賴、高度可靠,將成為解決世界上一些最緊迫挑戰(zhàn)的關(guān)鍵利器。

作者:Shoshana Kranish:

Shoshana目前擔(dān)任達(dá)索系統(tǒng)企業(yè)出版部門高級(jí)經(jīng)理。她在新聞、市場(chǎng)營(yíng)銷和公關(guān)方面擁有豐富的經(jīng)驗(yàn),其作品已在世界各地出版,并在互聯(lián)網(wǎng)上發(fā)表。

(來(lái)源:達(dá)索系統(tǒng))

標(biāo)簽:達(dá)索系統(tǒng) 我要反饋 
2024世界人工智能大會(huì)專題
即刻點(diǎn)擊并下載ABB資料,好禮贏不停~
優(yōu)傲機(jī)器人下載中心
西克
2024全景工博會(huì)
專題報(bào)道
2024 工博會(huì) | 直播探館 · 全景解讀
2024 工博會(huì) | 直播探館 · 全景解讀

第二十四屆中國(guó)工博會(huì)于9月24日至28日在國(guó)家會(huì)展中心(上海)舉行,展會(huì)以“工業(yè)聚能 新質(zhì)領(lǐng)航”為全新主題。 [更多]

2024世界人工智能大會(huì)
2024世界人工智能大會(huì)

WAIC 2024將于7月在上海舉行,論壇時(shí)間7月4日-6日,展覽時(shí)間7月4日-7日。WAIC 2024將圍繞“以共商促... [更多]

2024漢諾威工業(yè)博覽會(huì)專題
2024漢諾威工業(yè)博覽會(huì)專題

2024 漢諾威工業(yè)博覽會(huì)將于4月22 - 26日在德國(guó)漢諾威展覽中心舉行。作為全球首屈一指的工業(yè)貿(mào)易展覽會(huì),本屆展覽會(huì)... [更多]