過去12個月,幾乎所有的大模型六小虎都遇到過“不得不選”的時刻。只不過,2024年上半年他們還在選“該走哪條路”,下半年則只能考慮“還剩哪條路可以走”了。(編者注:大模型六小虎為國內(nèi)六家在大模型開發(fā)上較為領(lǐng)先的創(chuàng)業(yè)公司統(tǒng)稱,包括智譜、MiniMax、月之暗面、百川、零一萬物和階躍星辰。)
一位在2024年投進(jìn)六小虎的投資人告訴「四木相對論」,2024年上半年,大多數(shù)小虎的融資還處于烈火烹油的狀態(tài)。
他舉了一個例子,以示他們在盛極時刻的狀態(tài):當(dāng)時,以Kimi為代表的明星公司不僅不開放全部盡調(diào),還有老股東計劃對一些希望入局的小股東們設(shè)置投資機制,自己從中賺取新的管理費。
但到了下半年,在投資市場和AI行業(yè),包括六小虎在內(nèi)的AI初創(chuàng)公司們,口碑開始急轉(zhuǎn)直下。“現(xiàn)在除了國資,基本沒有什么潛在買家。”上述投資人表示。
此外,「四木相對論」還了解到,有一、兩家小虎希望長期尋找國際化資本的支持,但沒有拿到結(jié)果。
2024年上半年,六小虎們還在考慮做To C還是To B,聚焦國內(nèi)市場還是進(jìn)軍全球市場。到了下半年,大家發(fā)現(xiàn)國內(nèi)的C端用戶忠誠度不高,B端錢又很難賺,六小虎中至少有三家認(rèn)真考慮過出海。
但是,在月之暗面階段性收縮出海業(yè)務(wù)之后,近期又有一家明星大模型公司對北美團隊進(jìn)行了裁撤。MiniMax的海外拳頭產(chǎn)品Talkie,12月中旬也在美區(qū) App Store 中消失。
不能說大模型公司這一年沒有進(jìn)步,但卻和一年前的市場預(yù)期相去甚遠(yuǎn)。
這一困局不僅限于中國的六小虎,無論是激進(jìn)的國內(nèi)大廠,還是海外AI公司,都經(jīng)歷了曲折的一年。
現(xiàn)狀:巨頭“攪局”,賺錢的業(yè)務(wù)寥寥
首先,以通用助手為代表的To C模式,已經(jīng)不是初創(chuàng)企業(yè)玩得起的“樂園”。
“接下來的目標(biāo),是追平豆包目前的用戶數(shù)量。”一位頭部六小虎的業(yè)務(wù)負(fù)責(zé)人告訴我們,這是這家公司近期經(jīng)過業(yè)務(wù)復(fù)盤,對通用助手產(chǎn)品提出的預(yù)期。
一位接近Kimi的投資人表示,它2024年原本的目標(biāo)是日活1000萬,現(xiàn)在完成了1/3左右。
在內(nèi)測時,豆包還叫"Grace",在Kimi、文心一言、通義千問、智譜清言甚至海螺問問(現(xiàn)在的海螺AI)都推出后,才在2023年9月姍姍來遲。
但一年之后,綜合AI產(chǎn)品榜、量子位智庫等渠道的數(shù)據(jù),豆包在2024年11月的月活已經(jīng)接近6000萬,日活超過900萬,是國內(nèi)通用助手的斷層第一。
在我們近期密切交流的多位創(chuàng)業(yè)者和投資人朋友中,大多數(shù)人認(rèn)為豆包App之所以異軍突起,最大優(yōu)勢是對流量渠道的掌控。
根據(jù)移動營銷平臺AppGrowing數(shù)據(jù),2024年以來(截止11月15日),Kimi、豆包、星野等國內(nèi)十款大模型產(chǎn)品,合計投放超625萬條廣告,投放金額達(dá)15億元。

這些在各個渠道被火熱傳播的投放金額,被多家“主角”質(zhì)疑數(shù)據(jù)有所夸大。
但至少對掌握流量渠道的大廠來說,投放金額的確用不了這么多。大廠內(nèi)部的業(yè)務(wù)投放自家的渠道,往往會采用特殊的結(jié)算標(biāo)準(zhǔn),“有時候內(nèi)部部門會分得一部分流量,也可以用其他內(nèi)部資源兌換。”有大廠AI從業(yè)者告訴我們。
一家在2024年獲得巨頭投資,估值超1億美金的AI明星初創(chuàng)公司曾對「四木相對論」表示,由于自己主攻的領(lǐng)域和某大公司重注的方向基本重合,所以在被該大廠掌控的流量渠道上,自己無法進(jìn)行投放。
Kimi也不例外。不久前曾有媒體報道,年初在抖音、B站等內(nèi)容APP上刷屏并獲取大量用戶的Kimi,下半年在抖音上被限制投放,不得不轉(zhuǎn)戰(zhàn)快手等平臺。
據(jù)“AI新榜”公眾號統(tǒng)計,截至10月29日,Kimi在過去三個月內(nèi)的廣告投放總數(shù)已經(jīng)超過2500條。其中,在快手平臺上投放的內(nèi)容超過2100條,幾乎占據(jù)總投放量的84%。
還有一些沒能在熱錢涌動時完成融資的創(chuàng)業(yè)公司,負(fù)擔(dān)不起日漸增長的流量成本,只能轉(zhuǎn)型。
有家2024年成立的AI教育公司CEO告訴我們,自己的早期產(chǎn)品定價在20元,但現(xiàn)在投放一個人至少需要25元,“我們根本算不過來賬”。
其次,To C模式之外,大廠的身影同樣在大模型的To B市場掠食。
海外,大模型公司賣API是個還不錯的生意。OpenAI預(yù)計2024年將依靠API賺得5億美元,占總營收的15%。據(jù)CNBC報道,Anthropic對API的依賴更大,預(yù)計總營收的60%~75%將來自第三方調(diào)用API。
在國內(nèi),提供大模型API,愈發(fā)變成模型廠商搶占市場的方式,未被寄予豐厚的利潤預(yù)期。
年中由DeepSeek和字節(jié)率先掀起的降價潮,限制了API的價格空間。
5月,DeepSeek推出DeepSeek-V2 ,價格直接“殺”到了每百萬輸入Tokens1元,每百萬輸出Tokens2元。
同樣是在5月,字節(jié)跳動把豆包通用模型pro-32k版的推理輸入價格定為0.0008元/千tokens,比行業(yè)均價低99.3%。
面對價格攻勢,競爭對手只能快速應(yīng)對。阿里將通義千問主力模型的價格下調(diào)97%;百度宣布文心兩款模型免費。
「四木相對論」了解到,2024年初,字節(jié)內(nèi)部就定下了要成為LLM調(diào)用市場第一的目標(biāo)。其中,企業(yè)客戶的占比要接近一半。為此,火山引擎還組建了算法和服務(wù)數(shù)十人團隊,幫助客戶做咨詢、測試Prompt,消耗量大的“優(yōu)質(zhì)客戶”有機會獲得更多優(yōu)惠。
一位大廠的大模型銷售告訴我們,現(xiàn)在一個日Token消耗超過二十億的客戶,用豆包API每月花費的成本只需要小幾千。但在其他公司,這樣的模式不一定被支持。
到了年末,字節(jié)已經(jīng)在檢索、對話、文娛、游戲、客服等領(lǐng)域,收獲了不少公有云客戶。
第三,僅剩的商業(yè)模式,還有服務(wù)大B客戶的私有化部署。
這個領(lǐng)域,目前基本是國企和訊飛、百度的地盤。

智譜在很長時間里,是唯一從中刷到存在感的初創(chuàng)公司。到了2024年下半年,百川和零一,也出現(xiàn)了個位數(shù)的公開中標(biāo)信息。
對比2023年年初大模型1000萬的部署價格,現(xiàn)在一些純軟件、小幾百萬的單子,算上人力成本和服務(wù)周期,很可能導(dǎo)致AI公司“做一單虧一單”。但即便如此,在非招投標(biāo)渠道中,各AI公司的私有化部署業(yè)務(wù)已開始白熱化搶奪。
一家在2024年下半年才加入大B市場的六小虎,曾嘗試按市場價溝通客戶,但后續(xù)遇到另一家老牌“四小龍”故意壓低價格,客戶選擇了低價的一方。
前不久,火山引擎總裁譚待表示,雖然他更看好在公有云上使用大模型,但接下來混合模式還會持續(xù)存在。
2024年下半年,火山引擎開始頻繁出現(xiàn)在招投標(biāo)信息中。字節(jié)最近主推的AI應(yīng)用開發(fā)平臺「HiAgent」,由于主攻企業(yè)場景,也會搭載豆包的私有化部署版本。
事實上,雖然很多人是在年底舉辦的火山「原動力大會」上第一次聽到HiAgent——此前更被熟知的是更偏開發(fā)者屬性的Coze/扣子,但HiAgent至少已經(jīng)低調(diào)出現(xiàn)半年之久。
當(dāng)時——也就是2024年年中,火山的不少內(nèi)部員工還未意識到字節(jié)也希望提供一些私有化部署方案。有AI公司的員工反饋,之后的幾個月,字節(jié)的銷售開始對外許諾可以免費幫企業(yè)部署、微調(diào)。
面對巨頭的全面進(jìn)攻,初創(chuàng)公司的業(yè)務(wù)方向變得飄忽不定。
10月,六小虎中有不少放棄預(yù)訓(xùn)練的消息傳出。雖然,繼續(xù)盲目提升參數(shù)量可能會導(dǎo)致模型效果的提升與投入不成正比。但這一動作,還是會讓它們動輒幾十億美金的估值被打上問號。
有兩位投資人向我們透露,一家估值不在前三、且確定轉(zhuǎn)型垂類領(lǐng)域的小虎,甚至已把用作預(yù)訓(xùn)練的卡賣掉了。
全行業(yè):Killer App未出現(xiàn),技術(shù)急需新范式
反差的地方在于,已經(jīng)吸金數(shù)十億的AI通用助手,并不是所有人心中的Killer App。
前不久「智能涌現(xiàn)」曾報道,即便豆包用戶數(shù)斷層第一,但字節(jié)高層認(rèn)為它只是產(chǎn)品的中間態(tài),另一款A(yù)pp——即夢的優(yōu)先級被提升。
我們觀察到,即夢在持續(xù)嘗試將AI生成的內(nèi)容,轉(zhuǎn)化為App中的Feeds流。這個細(xì)節(jié)折射出,雖然即夢的關(guān)注度遠(yuǎn)弱于豆包,但它或許更加AI Native。
更多AI Native應(yīng)用,還處在跑出來的過程中。
2023年3月,開源項目 AutoGPT 的爆火,讓能夠獨立完成人類任務(wù)的Agent走到更多人面前。2023年底,OpenAI推出GPTs之后,國內(nèi)大廠們開始爭相推出如 Coze/扣子、百度文心智能體平臺等一系列Agent構(gòu)建平臺。
但從實際表現(xiàn)來看,無論是訂機票、還是買咖啡,Agent依舊難被順滑使用。比如,采用了Agent的麥當(dāng)勞AI點單系統(tǒng),已經(jīng)因為經(jīng)常錯誤下單被關(guān)停了。加拿大航空的Agent——咨詢和理賠機器人也因為隨意給出并未被授權(quán)的優(yōu)惠券被下線。

(麥當(dāng)勞AI點單系統(tǒng)錯誤地給顧客添加了數(shù)百美元的雞塊)
Agent進(jìn)展緩慢的根本原因還是模型能力不足。
在12月的火山FORCE大會上,火山引擎總裁譚待表示,Agent落地的核心還是技術(shù)要好;智譜2024年也在持續(xù)招募技術(shù)人才,目的之一是通過提升模型能力,讓Agent的效果更好。
整個2024年,大模型技術(shù)的最大變量是通向AGI之路的法則—— Scaling Law正在失效。
OpenAI在2020年發(fā)布的論文指出,模型的性能會隨著模型參數(shù)量、訓(xùn)練數(shù)據(jù)規(guī)模、訓(xùn)練計算資源的增加而呈現(xiàn)線性增長,這是第一代Scaling Law的核心觀點。
然而,Llama-3.1-405B 這樣參數(shù)量的模型,在幾乎用盡了所有公開數(shù)據(jù)集進(jìn)行訓(xùn)練后,實際效果并不理想——很多評測場景的結(jié)果,它與自家70B的模型相差不大;OpenAI在GPT-4后,也未在2024年推出通用能力明顯提升的基礎(chǔ)大模型。它的GPT-5,被《華爾街日報》曝出由于高質(zhì)量數(shù)據(jù)不足等原因,效果遠(yuǎn)不達(dá)預(yù)期。
“GPT-5已至少完成2輪訓(xùn)練,每次長達(dá)數(shù)月,但是每次訓(xùn)練后都遇到新問題。”《華爾街日報》援引知情人士稱。

(華爾街日報報道)
預(yù)訓(xùn)練的規(guī)模秘訣失效,OpenAI和Anthropic給出的解法,是通過強化學(xué)習(xí)(RL)提升模型推理能力。
2024年9月中,OpenAI上線了首個推理模型--o1。12月底,進(jìn)階版推理模型o3上線。它展現(xiàn)出大模型在科學(xué)、編碼、數(shù)學(xué)等領(lǐng)域解決復(fù)雜問題的能力,引來各家追隨。
11月,也就是OpenAI的 o1 發(fā)布兩個月后,國內(nèi)至少有近10個團隊在復(fù)現(xiàn)o1。

“測了一圈國內(nèi)的類o1模型,效果都差強人意。”一位從事模型研究的算法工程師告訴「四木相對論」,“阿里的QwQ效果能好一點。如果o1是100分,QwQ能達(dá)到60-70分。”
另一種聲音是質(zhì)疑o1、o3的“應(yīng)用場景太狹窄”。在數(shù)學(xué)、代碼之外,它適配的場景并不多。如果再算上成本,落地前景并不明朗。
在這個技術(shù)迷茫期,國內(nèi)的大模型公司開始悄然分野。
現(xiàn)在訓(xùn)練一個性能接近Claude3.5 Sonnet或GPT-4o的模型,價格并非高不可攀。
DeepSeek 最新發(fā)布的V3,訓(xùn)練成本是557.6萬美元。
但它在技術(shù)報告中特地表明,這個價格只是正式訓(xùn)練的成本,不包括之前的研究和算法、架構(gòu)、數(shù)據(jù)的試驗成本。
如果想真正突破到下一代模型,大模型公司要付出更高的“試錯代價”。
OpenAI的經(jīng)歷側(cè)面證明了這一點。
早在2022年,它大火之前,一年的花費是5.4 億美元。而到了2024年,The Information報道,OpenAI的成本恐怕高達(dá)85億美元。這里面,訓(xùn)練和推理成本占了70億美元,人員成本15億美元。
篩選人才和算力這兩個要素,2025年堅持訓(xùn)練底層大模型的國內(nèi)公司,恐怕只會剩下四、五家。
根據(jù)科技咨詢公司Omdia的報道,2024年采購GPU最多的國內(nèi)大廠是字節(jié)和騰訊。我們了解到,從2023年起,字節(jié)內(nèi)部就在“不惜一切代價”囤卡。2024年,它依舊在搶奪GPU和內(nèi)含GPU的整機。
(科技咨詢公司Omdia估計,2024年買卡最多的國內(nèi)公司是字節(jié)和騰訊)
一位頭部大模型公司高管曾對我們評價,字節(jié)豆包大模型的效果,是在高價挖來原通義千問技術(shù)負(fù)責(zé)人周暢后,才有明顯起色。
和張一鳴的動作一致,最近,科技圈的另一位大佬雷軍也開始親自下場挖人。12月底,DeepSeek成員羅福莉被曝出即將加入小米大模型團隊。
「四木相對論」還了解到,由于雷軍的順為資本投資了智譜、月之暗面、百川智能、MiniMax等公司。雷軍在招攬人才期間,也親自接觸了六小虎的高管。
“但小米開出的Offer不一定有吸引力。”一位AI投資人表示,雖然小米在努力挖人,但算上算力資源和品牌知名度,還是難和“搶人大戶”字節(jié)相比。
六小虎中,被認(rèn)為會堅定發(fā)力模型層的公司是智譜和階躍。它們在12月分別公布了數(shù)億元的大額融資。
還有一個出人意料的面孔出現(xiàn)在了資本市場。多方消息稱,DeepSeek數(shù)月前就在推進(jìn)獨立融資。
(DeepSeek于12月26日發(fā)布通用模型DeepSeek-V3,圖源DeepSeek官網(wǎng))
搶人、搶卡、“搶錢”,模型層的選手們,都在為2025年儲備糧草。
經(jīng)過一年的快速狂飆,基礎(chǔ)大模型的早期套利空間宣告結(jié)束。
剩下的創(chuàng)業(yè)者,大概率會主攻AI應(yīng)用。2024年底,十余家早期投資機構(gòu)告訴我們,2025年會重點關(guān)注AI應(yīng)用。
近期最快拿下大額融資的項目,幾乎都是創(chuàng)始團隊為大公司高管或六小虎聯(lián)創(chuàng)的AI應(yīng)用。這類項目團隊背景閃亮,融資周期極短,一般會由三、四家知名美元基金一起搶定首輪融資,估值迅速飆升至億元級別。
最近的例子,就是追覓前中國區(qū)執(zhí)行總裁郭人杰的消費機器人創(chuàng)業(yè)項目。我們還了解到,一些大廠和創(chuàng)業(yè)公司的高P近期也在籌備創(chuàng)業(yè),正在初步接觸投資人。
至于小而美的AI應(yīng)用團隊,雖無法斬獲巨額融資,但有更高概率收獲50萬美金左右的小額投資支票。這些團隊的員工一般只有個位數(shù)。他們會基于大模型,做出AI內(nèi)容創(chuàng)作、AI健康監(jiān)測、AI小游戲等精巧的功能/應(yīng)用。50萬美金至150萬美金的投資,足夠支撐他們跑出第一、二個版本的產(chǎn)品,獲得用戶和一部分收入。
這些跡象表明,到了2025年,AI應(yīng)用創(chuàng)業(yè)者的融資環(huán)境或許會寬松許多。
但另一個問題是,不論是明星創(chuàng)業(yè)者的AI Coding、消費機器人項目,還是開發(fā)者小團隊的AI創(chuàng)作應(yīng)用、健康監(jiān)測,似乎都和想象中Killer APP的樣子有些距離。
“團隊背景很重要,數(shù)據(jù)很重要,增長很重要。”不止一位AI投資人如此總結(jié)自己對AI應(yīng)用的投資標(biāo)準(zhǔn)。
這個和移動互聯(lián)時代如出一轍的標(biāo)準(zhǔn),似乎說明對Killer App的思考已經(jīng)擱置。
(來源騰訊科技)