雙輪驅(qū)動，通過基礎大模型技術(shù)賦能超級應用

ainet.cn 2024年06月13日

隨著 ChatGPT 的橫空出世，瞬間點燃全球 AI 產(chǎn)業(yè)的希望之火，AI 大模型吸引了大批科技巨頭、初創(chuàng)企業(yè)與科研院所入場。同時也引發(fā)了這個剛剛崛起的新興產(chǎn)業(yè)的深度思考，大模型公司到底該怎么做?有的認為應該專注基礎大模型技術(shù)開發(fā)，有的認為技術(shù)開發(fā)非常難，完全可以只做純應用。在眾說紛紜下，國內(nèi)頭部大模型企業(yè)百川智能給出了參考答案，既要掌握大模型的底層技術(shù)也要做超級應用。

陳煒鵬百川智能技術(shù)聯(lián)合創(chuàng)始人

雙輪驅(qū)動，大模型的技術(shù)與超級應用

不久前，百川智能正式發(fā)布其最新一代基座大模型Baichuan 4 及首款 AI 助手“百小應”。“百小應”的推出，體現(xiàn)了百川智能通過基礎大模型的技術(shù)賦能超級應用的發(fā)展戰(zhàn)略。百川智能技術(shù)聯(lián)合創(chuàng)始人陳煒鵬表示，“百川智能將繼續(xù)探索和突破技術(shù)邊界，不斷提升大模型的性能，尤其是在通用性、數(shù)學和代碼能力、多模態(tài)處理等方面。保持公司在人工智能領域的競爭優(yōu)勢。雙輪驅(qū)動，為技術(shù)找到合適場景，通過基礎大模型的技術(shù)賦能與超級應用，從創(chuàng)造、健康、快樂三個維度為用戶和合作伙伴創(chuàng)造更多價值。”

百川智能提供了MaaS+AaaS(Model as aService + Agent as a Service)的商業(yè)服務，為企業(yè)提供生產(chǎn)力、生產(chǎn)效率的提升，讓企業(yè)更便捷地利用AI 技術(shù)，加速智能化轉(zhuǎn)型。

大模型的技術(shù)創(chuàng)新與落地應用

作為國內(nèi)較早開始研發(fā)大模型的公司，百川智能在技術(shù)創(chuàng)新和落地應用方面有著非常多的經(jīng)驗與話語權(quán)，百川智能技術(shù)聯(lián)合創(chuàng)始人陳煒鵬認為，“在技術(shù)創(chuàng)新方面，模型的參數(shù)規(guī)模、多模態(tài)融合能力，可解釋性和透明度在持續(xù)演進，在落地應用上，大模型的參數(shù)規(guī)模一方面在持續(xù)擴大，拉伸 AGI 的能力上限，解決復雜場景的落地問題，另一方面不斷提升小模型的能力上限，滿足端側(cè)或者垂直應用場景的落地也是重要的趨勢。”大模型正從單一模態(tài)(如文本)向多模態(tài)(文本、圖像、聲音等)融合發(fā)展，以實現(xiàn)更豐富的交互和理解能力，不斷擴大模型的能力邊界和應用場景。

隨著技術(shù)的成熟和市場需求的增長，大模型的商業(yè)化應用正在加速，尤其是在金融、醫(yī)療、教育等領域。

大模型發(fā)展面臨的三大挑戰(zhàn)：數(shù)據(jù)、算力、安全

大模型開放、AIGC 深度應用，不僅對數(shù)據(jù)、算法、算力提出了更高要求，也對安全、隱私、倫理提出了更多挑戰(zhàn)。陳煒鵬認為：大模型發(fā)展面臨的最大挑戰(zhàn)主要是數(shù)據(jù)、算力、安全等問題。數(shù)據(jù)是大模型訓練的基礎，獲取和構(gòu)建高質(zhì)量、多樣化的數(shù)據(jù)是主要挑戰(zhàn)，需要通過引入多樣數(shù)據(jù)和合成數(shù)據(jù)等方式來解決。其次，大模型的參數(shù)規(guī)模巨大，使得理解模型內(nèi)部決策過程變得復雜，如果理解模型的決策機理，提升模型的可解釋性和透明度，尤其是在可控高的場景，是一個關鍵的問題。

最后，持續(xù)提升模型的規(guī)劃能力，借助 self-play 等方式持續(xù)提升模型的長程規(guī)劃能力，也是重要的問題。

（智能網(wǎng)原創(chuàng)，轉(zhuǎn)載請注明來源）

標簽：百川智能大模型

我要反饋