
今天消息,階躍星辰完成了 B 輪融資,總?cè)谫Y金額達(dá)數(shù)億美元。此次融資有國資、戰(zhàn)略和財(cái)務(wù)投資人等多家參與,核心投資方包括上海國有資本投資有限公司及其旗下基金,戰(zhàn)略和財(cái)務(wù)投資人包括騰訊投資、五源資本、啟明創(chuàng)投等。據(jù)了解,這筆融資將用于繼續(xù)投入基礎(chǔ)模型研發(fā),強(qiáng)化多模態(tài)和復(fù)雜推理能力,并通過產(chǎn)品和生態(tài)加大覆蓋 C 端應(yīng)用場景,提供豐富的用戶體驗(yàn)。
這起融資事件在業(yè)內(nèi)引起了廣泛關(guān)注。此時(shí)距離智譜官宣其完成最新一輪 30 億人民幣的融資才不到一周。上一周,智譜的融資被視為「可能是 2024 年大模型領(lǐng)域最后一筆融資」,但這個(gè)預(yù)言隨著階躍星辰的融資消息被打破。
不僅如此,階躍星辰的追趕,也使得未來至少一年內(nèi)中國大模型的競爭格局將發(fā)生肉眼可見的變化:
據(jù)我們了解,智譜是國內(nèi)第一家跨越 200 億估值門檻的大模型,此外還有 MiniMax、月之暗面、百川智能。本輪階躍星辰?jīng)]有披露其估值,但據(jù) AI 科技評論獲悉,階躍星辰很可能是 2024 年最后一家跨過 200 億門檻的大模型公司。
其次是回歸基座大模型話題,智譜與階躍成為「基座雙雄」的勢力格局愈加明晰。
隨著過去兩年的技術(shù)與產(chǎn)品探索,截至 2024 年 12 月,200 億以上估值的大模型公司在發(fā)展路線上越發(fā)涇渭分明。這其中,MiniMax 主打出海,月之暗面主打 C 端產(chǎn)品,百川智能轉(zhuǎn)向醫(yī)療等垂直領(lǐng)域——「主打」并非「單一」,但在基座大模型賽道,只有智譜與階躍堅(jiān)持追求基座大模型的預(yù)訓(xùn)練與效果提升,同時(shí)積極探索商業(yè)模式。
作為一家成立不到兩年的公司,階躍星辰能快速追趕,是令筆者意想不到的。一年前,階躍星辰還未浮出水面;一年后,這家大模型獨(dú)角獸已經(jīng)崛起,成為一股無法忽視的國產(chǎn)大模型力量。
在得知階躍星辰或是 2024 年最后一家拿到融資的大模型公司后,驚訝之余,筆者也與國內(nèi)多位投資人圍繞目前國內(nèi)幾家明星大模型公司的融資與估值進(jìn)行了討論。
今年年中,業(yè)內(nèi) VC 投資創(chuàng)業(yè)公司的普遍觀點(diǎn)是「追求賠率」,如押某一家公司的 C 端應(yīng)用,賭其是否能成為爆款。在這種趨勢下,上半年 Kimi 概念股的爆發(fā)是意料之中,這一階段的踴躍分子也以 VC 為主。但到了下半年,隨著大廠入局用流量澆灌C端應(yīng)用,「追求勝率」就成為更受歡迎的觀點(diǎn),按這套邏輯,繼續(xù)研發(fā)通用基座大模型的公司會有更廣闊的市場空間,且資方中擁有國資背景的大模型創(chuàng)業(yè)公司也被視為這一邏輯下的最佳選擇。
今年下半年,在大模型投資愈加冷靜的大環(huán)境下,智譜與階躍還能拿到融資,除了兩個(gè)團(tuán)隊(duì)的技術(shù)實(shí)力使然,或許也是因?yàn)槠浞袭?dāng)前追求勝率的投資目標(biāo)。
一位人民幣基金的從業(yè)者直截了當(dāng)?shù)卦u價(jià):「至少智譜與階躍目前還有投資邏輯,其他家的不確定性高:Kimi 只有 C 端增長,要看投流有沒有收益、以及能不能打得過豆包;MiniMax 的角色扮演產(chǎn)品與出海要賭賠率,看能不能爆發(fā)。如果賭上市,階躍與智譜還有勝率?!?/span>
「如果走互聯(lián)網(wǎng)產(chǎn)品的流量邏輯,那么大模型的 C 端產(chǎn)品只有三條路:要么勝出,要么死掉,要么轉(zhuǎn)型。」一位投資者向 AI 科技評論說道。
都知道,AI 2.0 之所以比 AI 1.0 的想象力更大,是因?yàn)?AI 1.0 時(shí)代公司的技術(shù)能落地的 C 端場景依然不夠廣泛,競爭到最后往往是跟垂直領(lǐng)域的傳統(tǒng)行業(yè)競爭,如安防領(lǐng)域的海大宇、手機(jī)領(lǐng)域的虹軟,而 AI 2.0 時(shí)代大模型技術(shù)落地能進(jìn)入廣泛的互聯(lián)網(wǎng)產(chǎn)品賽道,因此更「Sexy」。但也正是因?yàn)楦ヂ?lián)網(wǎng)的邏輯太近,加上 C 端產(chǎn)品有「新鮮感焦慮」,所以目前國內(nèi)大模型公司在 C 端的收入仍面臨重重挑戰(zhàn)。
不過,純 B 端的模式也不受追捧。據(jù) AI 科技評論了解,今年 B 端大模型收入也受到了來自華為、科大訊飛等大廠的競爭,導(dǎo)致一些企業(yè)的 B 端收入沒有去年高。加上純 B 端故事不好撐估值,所以一些類 B 端的營收也被放到了 C 端下。
總的來說,對AI2.0時(shí)代的創(chuàng)業(yè)公司而言,誰能最先推出通用能力最強(qiáng)的基座大模型,成功進(jìn)入最多的商業(yè)化場景中激發(fā)C端消費(fèi)需求,才會成為資本的寵兒。
基座大模型的能力提升仍是當(dāng)前的重中之重。即使已經(jīng)過去兩年,技術(shù)增長仍是大模型公司吸引融資的一大要素。
當(dāng)前第一梯隊(duì)的大模型公司中,只有階躍與智譜仍追求基座大模型的效果提升,也只有這兩家最像 OpenAI。
堅(jiān)持基座大模型研發(fā),意味著堅(jiān)持 AGI,才能支撐起更高上限的資本故事和商業(yè)化空間。從成果發(fā)布來看,智譜依舊在對標(biāo) OpenAI 推出新模型,而從年底國際權(quán)威榜單 LiveBench 與 LMSYS 來看,階躍星辰的模型水平也是國內(nèi)為數(shù)不多能與 OpenAI、Anthropic 等國際頂尖大模型公司一較高下的。
其余三家,百川對外講醫(yī)療大模型的故事。相比智譜有唐杰帶隊(duì)與清華子弟兵,階躍星辰有前微軟全球副總裁姜大昕帶隊(duì)加朱亦博與張祥雨等核心骨干。而 MiniMax 與月之暗面都是主打 C 端產(chǎn)品,一個(gè)出海、一個(gè)對內(nèi),相比預(yù)訓(xùn)練,產(chǎn)品創(chuàng)新與體驗(yàn)的效果提升優(yōu)先級更高。
如果再加上上市的考慮,智譜與階躍也是投資者最青睞的兩個(gè)標(biāo)的。背后的原因很簡單:「北京跟上海都押一個(gè)寶?!挂晃煌顿Y者告訴 AI 科技評論。
根據(jù)公開信息與行業(yè)分析,智譜的背后主要是北京國資,階躍背后則是上海國資。在 12 月宣布的最新一輪融資中,智譜的投資方全是國資,由北京海淀區(qū)政府的市場化投資平臺中關(guān)村科學(xué)城?持。階躍星辰B輪核心投資方包括上海國有資本投資有限公司及其旗下基金。
縱觀「大模型六小虎」背后的資方情況,不難發(fā)現(xiàn)各有特色:MiniMax 和月之暗面以互聯(lián)網(wǎng)投資居多,智譜是純國資加互聯(lián)網(wǎng),百川同時(shí)吸納了北京與上海的國資加互聯(lián)網(wǎng)、但沒有洋氣的美元基金,階躍是上海國資、戰(zhàn)略和財(cái)務(wù)投資人,零一萬物則是純美元與外資為主。
作為一家成立不到兩年、但死磕基座大模型的創(chuàng)業(yè)公司來說,階躍星辰的進(jìn)步速度比我們想象地要快很多。角逐基座大模型其實(shí)是一件投入成本高、同時(shí)技術(shù)挑戰(zhàn)大的事情,尤其在國內(nèi)面臨的競爭對手是成立時(shí)間最長的大模型獨(dú)角獸智譜。
在這樣一個(gè)看似不可能的目標(biāo)下,階躍星辰依然能得到投資方的認(rèn)可,說明實(shí)力不可小覷。2025 年,階躍很可能是智譜最有力的競爭對手。
如果將更多的聚光燈給到階躍星辰,我們驚詫地發(fā)現(xiàn):這家成立不到兩年的大模型公司,在過去的10個(gè)月里竟發(fā)布了 11 款基座模型;也就是說,他們平均不到一個(gè)月就有一次發(fā)布,意味著其基座模型迭代的速度飛快,為中國大模型之最。
根據(jù)基座模型的能力劃分,階躍星辰的 Step 系列大模型矩陣覆蓋了從千億參數(shù)到萬億參數(shù)、從語言到多模態(tài)、從理解到生成的全方位能力。
在語言大模型上,階躍星辰先后分布了千億參數(shù)語言大模型 Step-1、萬億參數(shù)語言大模型 Step-2 與 Step-1-flash 極速版大模型。
其中,Step-1 只用兩個(gè)月就一次性訓(xùn)練成功,在邏輯推理、中文知識、英文知識、數(shù)學(xué)與代碼等方面的能力全面超越了 GPT-3.5。Step-1-flash 極速版大模型能夠處理上下文長度為 8K 的長文本。Step-2 采用 MoE 架構(gòu),是國內(nèi)首個(gè)由大模型創(chuàng)業(yè)公司發(fā)布的萬億參數(shù)語言大模型。
在剛剛過去的 11 月,Step-2 更是在「最難 LLM 評測榜單」LiveBench 上成為唯一進(jìn)入榜單前十名的中國語言大模型,位列全球第五,超越了 GPT-4o 和 Gemini-1.5,拿下中國第一。
當(dāng)時(shí)同樣上榜的大模型還有通義千問和 DeepSeek,但均沒有沖進(jìn)前十,分別位列第十三和第二十三名。上述提到的估值超過 200 億人民幣的第一梯隊(duì)大模型公司,則除了階躍星辰外均沒有上榜。
榜單鏈接:https://livebench.ai/,2024-11-19
語言基座大模型是競爭 AGI 的準(zhǔn)入門檻。根據(jù) LiveBench 的結(jié)果,階躍星辰的 Step-2 能成為上榜模型,實(shí)力不言而喻。換言之,即使基座大模型的競爭到最后只會剩下少數(shù)幾家,階躍星辰的基座模型憑借技術(shù)實(shí)力也能贏得最終的入場券。
從技術(shù)發(fā)展的趨勢來看,OpenAI 認(rèn)為,AGI 的實(shí)現(xiàn)會分為五個(gè)階段:第一個(gè)階段是聊天機(jī)器人,AI 具備語言對話能力;第二個(gè)階段是推理模型,AI 可以解決人類層面的問題;第三個(gè)階段是智能體(Agents),AI 系統(tǒng)可以自主決策與執(zhí)行;第四個(gè)階段是創(chuàng)新模型,AI 可以自主思考并誕生想法;第五個(gè)階段是智能組織,AI 可以完成組織性的工作。
第五個(gè)階段被認(rèn)為與當(dāng)前具身智能對通用機(jī)器人的追求重合,即無論是一個(gè)人工智能系統(tǒng)或一個(gè)機(jī)器人,均可以完成一個(gè)工種的全流程、而非其中一個(gè)或兩個(gè)步驟。OpenAI 認(rèn)為,他們現(xiàn)在才處于階段二,即模型的推理層,代表成果是 o1。
而在國內(nèi)的學(xué)術(shù)探討中,AGI 的實(shí)現(xiàn)從階段一到階段二的研究目標(biāo)除了包括思維鏈在內(nèi)的模型推理,還有多模態(tài)。目前多模態(tài)模型的研發(fā)還沒有一個(gè)主導(dǎo)性的思路,多模態(tài)不僅包含語言,還包含視覺、以及語言與視覺乃至語音等多個(gè)模態(tài)的信息對齊,視覺研究人才將在這當(dāng)中發(fā)揮重要作用。
眾所周知,階躍星辰由前微軟全球副總裁姜大昕博士創(chuàng)立。據(jù)悉,階躍在技術(shù)上下一階段的目標(biāo)是實(shí)現(xiàn)多模態(tài)理解和生成一體化。階躍星辰的研發(fā)團(tuán)隊(duì)有諸多牛人,包括計(jì)算機(jī)視覺領(lǐng)域核心奠基工作 ResNet 的二作張祥雨;
此外,大模型的訓(xùn)練需要消耗大量算力,技術(shù)底層系統(tǒng)能力將決定創(chuàng)業(yè)公司能否以最高的性價(jià)比和效率訓(xùn)練模型。階躍星辰的系統(tǒng)負(fù)責(zé)人為朱亦博,其先后任職于微軟、字節(jié)與谷歌,在大規(guī)模系統(tǒng)和萬卡集群方面有豐富的實(shí)踐經(jīng)驗(yàn)。
不同于 AI 1.0,AI 2.0 時(shí)代的基座大模型在預(yù)訓(xùn)練中不僅要求算法能力強(qiáng)、也要求底層系統(tǒng)的高效與穩(wěn)定性。國內(nèi)同時(shí)兼顧算法與系統(tǒng)方面強(qiáng)勢人才的大模型公司并不多,階躍星辰是之一,這也是為什么過去一年階躍星辰不僅在語言基座大模型、同時(shí)在多模態(tài)大模型上也頻繁發(fā)布研究成果的原因。
過去一年,階躍星辰在多模態(tài)領(lǐng)域已經(jīng)發(fā)布了 8 個(gè)大模型,包括:
兩款多模態(tài)大模型 Step-1V 與 Step-1.5V,其中 Step-1.5V 是在 Step-1V 的基礎(chǔ)上迭代,從圖像理解升級到了視頻理解。今年 11 月,LMSYS Org 發(fā)布 Chatbot Arena 最新榜單,Step-1V 上榜位列視覺領(lǐng)域中國大模型第一,總分跟 Gemini-1.5-Flash-8B-Exp-0827 持平,超過國內(nèi)所有大模型公司。
一款圖像生成大模型 Step-1X,其具備強(qiáng)大語義理解與圖像創(chuàng)意實(shí)現(xiàn)能力,可用于各種圖像創(chuàng)作與設(shè)計(jì)任務(wù)。
兩款視頻模型:Step-1.5v-turbo 視頻理解模型與 Step-Video 視頻生成模型,不僅能準(zhǔn)確識別并理解視頻中所出現(xiàn)的物體、人物和環(huán)境,具備突出的指令跟隨能力,還能文生視頻,生成 1080P 長達(dá) 10s 的高清視頻,尤其擅長生成具有中國風(fēng)美學(xué)效果的視頻。
除了文圖與視頻,階躍星辰還發(fā)布了三款語音大模型:Step-tts-mini 語音復(fù)刻和生成大模型、Step-asr 語音識別大模型與 Step-1o Audio 語音大模型。其中,Step-tts-mini 只需上傳 5s 音頻就能進(jìn)行生動(dòng)形象的音色復(fù)刻,Step-1o Audio 是國內(nèi)首個(gè)千億參數(shù)端到端語音大模型、支持語音與文本的混合輸入與輸出。
國內(nèi)大模型創(chuàng)業(yè)公司極少同時(shí)兼顧語言、圖像、視頻與語音等多個(gè)模態(tài)的基座模型,目前看來,階躍星辰的基座模型研發(fā)還在持續(xù)加速,體現(xiàn)了其堅(jiān)持追求 AGI 的理想與決心。
值得注意的是,不斷打磨基座模型的同時(shí),階躍星辰在將技術(shù)應(yīng)用落地上也有獨(dú)特思考。
毫無疑問,大模型會衍生出全新的商業(yè)模式,目前各家都還在探索中。據(jù)觀察,當(dāng)前階躍星辰的嘗試是通過自研與幫助生態(tài)伙伴的方式去打造 C 端超級應(yīng)用。
目前階躍星辰最廣為人知的自研 C 端產(chǎn)品是智能助手「躍問」。
同時(shí),他們也與客戶進(jìn)行了更深入的合作,比如在金融領(lǐng)域與財(cái)聯(lián)社成立合資公司「財(cái)躍星辰」一起打造了 C 端應(yīng)用「AI 小財(cái)神」。后者的合作形式不是只提供 API、解決方案或私有化部署,所以跟 AI 1.0 時(shí)代的純 B 端打法也有所不同。
目前躍問已經(jīng)接入Step-2 萬億參數(shù)大模型和 Step-1.5V 多模態(tài)模型,具有智能搜索、拍照答疑、高效閱讀、寫作、翻譯等能力,而且率先將多模態(tài)功能「拍照問」接入了 iPhone 16 的「相機(jī)控制」,實(shí)現(xiàn)了真正意義上的「智能視覺搜索」。
OpenAI 預(yù)言 AGI 的下一個(gè)階段是智能體,某個(gè)意義上,階躍星辰基于 Step 自研基座模型所打造的「躍問」、或「AI 小財(cái)神」應(yīng)用,也是在探索 AGI 時(shí)代的智能體。比如,「AI小財(cái)神」能夠?yàn)橛脩籼峁┌?AI 數(shù)據(jù)挖掘、AI 對話、AI 熱點(diǎn)信息和財(cái)報(bào)解讀等功能。
在開發(fā)者生態(tài)中,階躍星辰開放平臺也推出了「繁星計(jì)劃」,幫助開發(fā)者打造 AI 應(yīng)用。據(jù)了解,網(wǎng)紅 AI 應(yīng)用「胃之書」、國內(nèi)首款 C 端 AI 電商應(yīng)用「物圓」、AI 科研大模型專業(yè)社區(qū)「ReadPaper」、AI 心理陪伴應(yīng)用「林間聊愈室」、面向胰腺癌腫瘤患者的智能 RAG 平臺「小胰寶」等等應(yīng)用都是基于階躍星辰的 Step 大模型。
中國第一梯隊(duì)的大模型公司中,原先智譜、MiniMax、月之暗面與百川智能獨(dú)占鰲頭,花開四朵、各表一枝。一年過去,大浪淘沙,百川退出預(yù)訓(xùn)練模型的競爭隊(duì)伍,月之暗面與 MiniMax 的優(yōu)先級在產(chǎn)品,只有智譜與階躍有實(shí)力、有決心對標(biāo) OpenAI,堅(jiān)持研究基座大模型。
在不遠(yuǎn)的未來,模型效果仍是決定上層應(yīng)用的關(guān)鍵因素?;竽P碗p雄,北有智譜、南有階躍,孰勝孰敗一時(shí)還難以分曉,不如將答案交給時(shí)間。(來源AI科技評論)