隨著 ChatGPT 的橫空出世,瞬間點燃全球 AI 產(chǎn)業(yè)的希望之火,AI 大模型吸引了大批科技巨頭、初創(chuàng)企業(yè)與科研院所入場。同時也引發(fā)了這個剛剛崛起的新興產(chǎn)業(yè)的深度思考,大模型公司到底該怎么做?有的認為應該專注基礎大模型技術(shù)開發(fā),有的認為技術(shù)開發(fā)非常難,完全可以只做純應用。在眾說紛紜下,國內(nèi)頭部大模型企業(yè)百川智能給出了參考答案,既要掌握大模型的底層技術(shù)也要做超級應用。
陳煒鵬 百川智能技術(shù)聯(lián)合創(chuàng)始人
雙輪驅(qū)動,大模型的技術(shù)與超級應用
不久前,百川智能正式發(fā)布其最新一代基座大模型Baichuan 4 及首款 AI 助手“百小應”。“百小應”的推出,體現(xiàn)了百川智能通過基礎大模型的技術(shù)賦能超級應用的發(fā)展戰(zhàn)略。百川智能技術(shù)聯(lián)合創(chuàng)始人陳煒鵬表示,“百川智能將繼續(xù)探索和突破技術(shù)邊界,不斷提升大模型的性能,尤其是在通用性、數(shù)學和代碼能力、多模態(tài)處理等方面。保持公司在人工智能領域的競爭優(yōu)勢。雙輪驅(qū)動,為技術(shù)找到合適場景,通過基礎大模型的技術(shù)賦能與超級應用,從創(chuàng)造、健康、快樂三個維度為用戶和合作伙伴創(chuàng)造更多價值。”
百川智能提供了MaaS+AaaS(Model as aService + Agent as a Service)的商業(yè)服務,為企業(yè)提供生產(chǎn)力、生產(chǎn)效率的提升,讓企業(yè)更便捷地利用AI 技術(shù),加速智能化轉(zhuǎn)型。
大模型的技術(shù)創(chuàng)新與落地應用
作為國內(nèi)較早開始研發(fā)大模型的公司,百川智能在技術(shù)創(chuàng)新和落地應用方面有著非常多的經(jīng)驗與話語權(quán),百川智能技術(shù)聯(lián)合創(chuàng)始人陳煒鵬認為,“在技術(shù)創(chuàng)新方面,模型的參數(shù)規(guī)模、多模態(tài)融合能力,可解釋性和透明度在持續(xù)演進,在落地應用上,大模型的參數(shù)規(guī)模一方面在持續(xù)擴大,拉伸 AGI 的能力上限,解決復雜場景的落地問題,另一方面不斷提升小模型的能力上限,滿足端側(cè)或者垂直應用場景的落地也是重要的趨勢。”大模型正從單一模態(tài)(如文本)向多模態(tài)(文本、圖像、聲音等)融合發(fā)展,以實現(xiàn)更豐富的交互和理解能力,不斷擴大模型的能力邊界和應用場景。
隨著技術(shù)的成熟和市場需求的增長,大模型的商業(yè)化應用正在加速,尤其是在金融、醫(yī)療、教育等領域。
大模型發(fā)展面臨的三大挑戰(zhàn):數(shù)據(jù)、算力、安全
大模型開放、AIGC 深度應用,不僅對數(shù)據(jù)、算法、算力提出了更高要求,也對安全、隱私、倫理提出了更多挑戰(zhàn)。陳煒鵬認為:大模型發(fā)展面臨的最大挑戰(zhàn)主要是數(shù)據(jù)、算力、安全等問題。數(shù)據(jù)是大模型訓練的基礎,獲取和構(gòu)建高質(zhì)量、多樣化的數(shù)據(jù)是主要挑戰(zhàn),需要通過引入多樣數(shù)據(jù)和合成數(shù)據(jù)等方式來解決。其次,大模型的參數(shù)規(guī)模巨大,使得理解模型內(nèi)部決策過程變得復雜,如果理解模型的決策機理,提升模型的可解釋性和透明度,尤其是在可控高的場景,是一個關鍵的問題。
最后,持續(xù)提升模型的規(guī)劃能力,借助 self-play 等方式持續(xù)提升模型的長程規(guī)劃能力,也是重要的問題。
(智能網(wǎng)原創(chuàng),轉(zhuǎn)載請注明來源)