在2025商湯技術(shù)交流日上,作為最懂大模型的AI基礎(chǔ)設(shè)施,商湯大裝置SenseCore 2.0全新升級(jí),致力于為企業(yè)提供敏捷、靈活、可靠的全棧AI基礎(chǔ)設(shè)施服務(wù),以極致性價(jià)比推動(dòng)大模型技術(shù)的高效落地與規(guī)模化應(yīng)用。
商湯大裝置還發(fā)布了面向具身智能、AIGC、AI4S(AI For Science)以及傳統(tǒng)企業(yè)智能化轉(zhuǎn)型的四大行業(yè)解決方案,更重磅推出1億元代金券計(jì)劃,為企業(yè)提供全流程AI服務(wù)支持,全棧賦能各行業(yè)智能化升級(jí)。
當(dāng)下,大模型產(chǎn)業(yè)正展現(xiàn)出三大全新趨勢(shì),亟待AI基礎(chǔ)設(shè)施的全面升級(jí)。
隨著開(kāi)源模型和工具逐漸成為主流,AI基礎(chǔ)設(shè)施需要與開(kāi)源產(chǎn)品進(jìn)行深度集成與整合;性價(jià)比已成為大模型應(yīng)用的生死線,需要持續(xù)推動(dòng)訓(xùn)練和推理成本的降低;多模態(tài)技術(shù)推動(dòng)新一代智能終端與應(yīng)用場(chǎng)景的爆發(fā),企業(yè)亟需獲得從產(chǎn)品到場(chǎng)景的端到端全鏈路支持。
專(zhuān)為AI 2.0時(shí)代量身打造的商湯大裝置SenseCore 2.0,從技術(shù)突破、商業(yè)落地到生態(tài)協(xié)同等多個(gè)維度發(fā)力,助力大模型突破規(guī)?;瘧?yīng)用的卡點(diǎn)、堵點(diǎn),創(chuàng)造增量?jī)r(jià)值。
商湯科技聯(lián)合創(chuàng)始人、大裝置事業(yè)群總裁楊帆表示:“商湯大裝置SenseCore 2.0希望依托更敏捷、更靈活、更可靠的平臺(tái)能力,積極擁抱開(kāi)源生態(tài),通過(guò)提供更高性價(jià)比的產(chǎn)品服務(wù)和一系列行業(yè)解決方案,將商湯多年積累的核心能力與生態(tài)伙伴的行業(yè)優(yōu)勢(shì)充分整合,為不同行業(yè)、不同場(chǎng)景的客戶提供貼身的解決方案,切實(shí)幫助客戶解決技術(shù)問(wèn)題、產(chǎn)品問(wèn)題和商業(yè)化問(wèn)題,從而推動(dòng)人工智能產(chǎn)業(yè)的長(zhǎng)遠(yuǎn)發(fā)展。”
實(shí)現(xiàn)國(guó)產(chǎn)算力規(guī)?;逃?,多模態(tài)推理成本持平大語(yǔ)言模型實(shí)現(xiàn)極性價(jià)比
性價(jià)比是大模型應(yīng)用的生死線。
目前AI產(chǎn)業(yè)發(fā)展面臨多重成本壓力:供應(yīng)鏈成本變化快導(dǎo)致算力供需波動(dòng)大,國(guó)產(chǎn)芯片亦存在產(chǎn)能有限、種類(lèi)繁多以及利用率較低等挑戰(zhàn);模型參數(shù)量的指數(shù)級(jí)增長(zhǎng),使訓(xùn)練成本持續(xù)增加;推理成本大幅下降帶動(dòng)需求爆發(fā)增長(zhǎng),導(dǎo)致總算力消耗進(jìn)一步加劇。
商湯大裝置實(shí)現(xiàn)了異構(gòu)算力混合計(jì)算利用率和推理成本的顯著突破,以極致性價(jià)比幫助客戶更早突破成本限制。
在國(guó)產(chǎn)芯片方面,商湯大裝置異構(gòu)訓(xùn)練效率可達(dá)同構(gòu)訓(xùn)練的95%。商湯大裝置還聯(lián)合某頭部客戶進(jìn)行了大規(guī)模異構(gòu)混訓(xùn),基于異構(gòu)算力調(diào)度、自動(dòng)并行策略、跨芯通信、自動(dòng)容錯(cuò)恢復(fù)等核心技術(shù),在5000張國(guó)產(chǎn)GPU集群上實(shí)現(xiàn)1個(gè)月穩(wěn)定異構(gòu)混訓(xùn),算力利用率達(dá)到80%,成功突破單一GPU限制,有力推動(dòng)國(guó)產(chǎn)算力的規(guī)模化商用進(jìn)程。
另外,通過(guò)基礎(chǔ)設(shè)施、模型優(yōu)化和動(dòng)態(tài)負(fù)載均衡優(yōu)化,商湯大裝置實(shí)現(xiàn)了多模態(tài)大模型推理成本與大語(yǔ)言模型持平。
同時(shí)在線推理性能較頭部廠商提升15%,離線推理Prefill階段實(shí)現(xiàn)提速5倍、Decode階段提速3.5倍,為大模型技術(shù)的應(yīng)用提供極致性價(jià)比的基礎(chǔ)設(shè)施服務(wù)。
擁抱開(kāi)源,打造零成本、零門(mén)檻、零開(kāi)發(fā)的一站式模型服務(wù)
數(shù)據(jù)顯示,開(kāi)源模型能力已逼近閉源模型,這帶動(dòng)了企業(yè)應(yīng)用需求快速涌現(xiàn)。商湯大裝置積極擁抱開(kāi)源主流趨勢(shì),通過(guò)OpenAPI兼容、K8S原生平臺(tái)適配、開(kāi)源大模型托管服務(wù)、全棧開(kāi)源工具鏈及豐富的開(kāi)源組件等,實(shí)現(xiàn)了技術(shù)棧的無(wú)縫整合與敏捷迭代,滿足快速發(fā)展的技術(shù)棧應(yīng)用訴求。
面向不同客戶群體,商湯大裝置可提供“零成本遷移、零門(mén)檻使用、零開(kāi)發(fā)部署”的一站式模型服務(wù)。
其中,極客創(chuàng)業(yè)團(tuán)隊(duì)可通過(guò)標(biāo)準(zhǔn)化的 k8s API直接對(duì)接商湯大裝置,完成應(yīng)用組件、日志、監(jiān)控等無(wú)縫遷移并實(shí)現(xiàn)彈性擴(kuò)展;應(yīng)用企業(yè)可在模型廣場(chǎng)中直接選擇DeepSeek等開(kāi)源主流模型,一鍵部署和微調(diào),實(shí)現(xiàn)模型托管與零門(mén)檻使用;互聯(lián)網(wǎng)平臺(tái)企業(yè)則可借助 JuiceFS 緩存和 Volcano 優(yōu)化等技術(shù),提升開(kāi)源方案在生產(chǎn)環(huán)境的穩(wěn)定性等。
四大行業(yè)解決方案亮相,從場(chǎng)景定義到業(yè)務(wù)落地全鏈路賦能
多模態(tài)大模型的突破,正快速激活各類(lèi)新場(chǎng)景、新模式,比如席卷全球的GPT-4o“吉卜力風(fēng)”、形態(tài)各異的AI機(jī)器人等,激發(fā)行業(yè)大量跨模態(tài)能力需求。打通從產(chǎn)品到多模態(tài)場(chǎng)景的端到端行業(yè)解決方案,是AI 2.0時(shí)代新興行業(yè)加速技術(shù)落地,傳統(tǒng)行業(yè)實(shí)現(xiàn)數(shù)智升級(jí)的“快車(chē)道”。
此次,商湯大裝置面向具身智能、AIGC、AI4S以及傳統(tǒng)企業(yè)智能化轉(zhuǎn)型推出四大行業(yè)解決方案,針對(duì)不同行業(yè)客戶提供從場(chǎng)景定義到業(yè)務(wù)落地的全鏈路賦能,真正解決智能化落地最后一公里難題。
其中,具身智能解決方案能夠端到端賦能技術(shù)研發(fā),覆蓋數(shù)據(jù)生產(chǎn)、工具支撐及模型研發(fā)全流程。
針對(duì)具身智能數(shù)據(jù)生產(chǎn)需求,可提供"仿真+真機(jī)"雙通道,云上通過(guò)全棧工具鏈實(shí)現(xiàn)仿真數(shù)據(jù)生成、模型驗(yàn)證;并依托商湯全國(guó)智算布局支持跨地域數(shù)據(jù)采集匯聚,實(shí)現(xiàn)分鐘級(jí)同步,并結(jié)合智能分級(jí)存儲(chǔ)有效控制成本。
會(huì)上,商湯與松應(yīng)科技簽署戰(zhàn)略合作協(xié)議,雙方將在數(shù)據(jù)仿真、研發(fā)管線、客戶服務(wù)層面展開(kāi)全面合作。
重磅發(fā)放“1億元代金券”,全棧賦能AI場(chǎng)景落地
為加速 AI 全場(chǎng)景落地,商湯科技宣布重磅投入1億元專(zhuān)項(xiàng)代金券,聚焦具身智能、AIGC等多行業(yè),通過(guò)多維度的精準(zhǔn)扶持,為企業(yè)提供從專(zhuān)家咨詢到模型訓(xùn)練、推理驗(yàn)證的全流程AI服務(wù)支持,打造"高效率、低成本、端到端"的一站式賦能方案。通過(guò)從技術(shù)、產(chǎn)品到服務(wù)的多層次支持,商湯大裝置希望助力各行業(yè)客戶加速推動(dòng)大模型的商業(yè)化落地,推動(dòng)中國(guó)人工智能產(chǎn)業(yè)繁榮發(fā)展。
(來(lái)源:商湯科技)