物聯(lián)網(wǎng)

亞馬遜云科技獨(dú)家首推Writer新一代自適應(yīng)推理模型Palmyra X5

ainet.cn   2025年04月30日

Palmyra X5 是專為高效驅(qū)動(dòng)多步驟 agents 而開發(fā)的模型,現(xiàn)僅可通過 Writer 和 Amazon Bedrock 以完全托管的方式提供。

北京 2025年4月29日 /美通社/ -- 亞馬遜云科技宣布,在Amazon Bedrock上正式推出Palmyra X5——這是一款全新的具備一百萬token上下文窗口的自適應(yīng)推理模型。該模型由企業(yè)級生成式AI領(lǐng)軍企業(yè)Writer發(fā)布,是首批在Amazon Bedrock提供如此大規(guī)模上下文窗口的模型之一。該模型在速度和成本效率方面進(jìn)行了優(yōu)化,使客戶能夠構(gòu)建先進(jìn)的多步驟AI agents,并能精確處理海量企業(yè)數(shù)據(jù),從根本上改變了推理方式。亞馬遜云科技現(xiàn)已成為首家且目前唯一提供Writer完全托管、無服務(wù)器模型的云提供商,包括最新Palmyra X5及Palmyra X4,其他更多模型也將很快上線。

隨著生成式AI技術(shù)的加速發(fā)展,客戶需要廣泛的模型選擇以精準(zhǔn)匹配業(yè)務(wù)需求。Writer模型在Amazon Bedrock的推出,進(jìn)一步豐富了Amazon Bedrock廣泛的完全托管模型的選擇,這些模型均來自領(lǐng)先的AI企業(yè),幫助客戶能更輕松、安全地構(gòu)建和擴(kuò)展生成式AI應(yīng)用,推動(dòng)業(yè)務(wù)轉(zhuǎn)型與創(chuàng)新。

Palmyra X5是首批在Amazon Bedrock提供一百萬token上下文窗口的模型之一,為亞馬遜云科技的客戶提供更多選擇(上下文窗口指一個(gè)模型每次輸入/請求能處理和"記憶"的信息量。它以模型處理的最小文本單位token為計(jì)量單位,可視為模型的"短期記憶")。憑借這種規(guī)模的上下文窗口,Palmyra可精準(zhǔn)處理1500頁內(nèi)容(相當(dāng)于6本書)。該模型還是業(yè)界首批企業(yè)級自適應(yīng)推理模型之一,并兼具先進(jìn)的大語言模型能力以及擴(kuò)展的記憶、處理能力。企業(yè)現(xiàn)可在預(yù)算范圍內(nèi)處理廣泛任務(wù),包括財(cái)務(wù)報(bào)告、法律合同分析、醫(yī)療記錄整合、客戶反饋挖掘等。

除推理能力外,Palmyra X5 還具有多項(xiàng)強(qiáng)大功能,能夠支持與系統(tǒng)交互的agents、支持高級代碼生成與部署,并支持超過30種語言。

Palmyra X5 介紹:

若將Palmyra X5模型擬人化,它就像具有超能力——可在22秒內(nèi)讀完一百萬個(gè)單詞的內(nèi)容,并即時(shí)生成可執(zhí)行的見解。它不僅能完整記憶200頁戰(zhàn)略文檔的全部內(nèi)容,更能理解其與昨天的客戶會(huì)議、上個(gè)季度財(cái)務(wù)數(shù)據(jù)的內(nèi)在關(guān)聯(lián)。面對復(fù)雜的問題時(shí),它能系統(tǒng)化地逐步推進(jìn)解決方案,全程清晰闡述思考路徑——無論是幫助分析海量客戶反饋以提煉共性,還是排查技術(shù)故障。

Writer 首席技術(shù)官兼聯(lián)合創(chuàng)始人 Waseem AlShikh 表示:"我們選擇亞馬遜云科技作為首家提供Writer完全托管模型的主流云服務(wù)提供商,源于其無與倫比的安全性,以及雙方在變革企業(yè)AI應(yīng)用方式、驅(qū)動(dòng)創(chuàng)新增長愿景上的高度契合。Palmyra X5是Writer迄今最先進(jìn)的模型,它能高速處理海量企業(yè)數(shù)據(jù),這對于擴(kuò)展多代理系統(tǒng)(multi-agent systems)至關(guān)重要。通過Amazon Bedrock,我們將這些強(qiáng)大功能帶給全球更多企業(yè),幫助客戶在安全、可擴(kuò)展的環(huán)境中部署。"

亞馬遜云科技 Amazon Bedrock 總監(jiān) Atul Deo 表示:"基于與Writer的深度戰(zhàn)略合作,我們很高興通過Amazon Bedrock提供Writer的Palmyra系列模型,賦能企業(yè)開啟智能Agent創(chuàng)新的新時(shí)代。Palmyra X5在長上下文窗口中提供卓越性能,兼具企業(yè)級可靠性與速度。無縫接入Writer的Palmyra X5將讓開發(fā)者和企業(yè)利用亞馬遜云科技的安全性、擴(kuò)展性和性能,構(gòu)建和擴(kuò)展AI agents,實(shí)現(xiàn)海量企業(yè)數(shù)據(jù)推理范式的革新。"

數(shù)據(jù)解析:

● Palmyra X5是最高效的大規(guī)模上下文大語言模型之一,對速度與成本均進(jìn)行了優(yōu)化。它可在約22秒內(nèi)處理完整百萬token提示詞,單次函數(shù)調(diào)用響應(yīng)僅需約0.3秒。

● 在最新Longbench v2評測中,Palmyra X5以53%的平均得分展現(xiàn)其同類領(lǐng)先的性價(jià)比。企業(yè)在大幅降低每百萬token成本的同時(shí),可獲得接近頂級的準(zhǔn)確性,在預(yù)算可控的情況下,可執(zhí)行大量agents與長上下文處理任務(wù)。

● 支持30多種語言,為全球企業(yè)提供真正的多語言處理能力。

● 定價(jià)為每百萬輸入token 0.60美元,每百萬輸出token 6美元,是目前最具成本效益的大規(guī)模上下文大語言模型之一。

● 在BigCodeBench (完整版, 指令版)評估中,Palmyra X5以48.7分位列頂級模型,展現(xiàn)了其解決實(shí)用且具有挑戰(zhàn)性的復(fù)雜編程任務(wù)的能力。

盡管生成式AI正在改變我們創(chuàng)建、分析和交互信息的方式,但Agentic AI將從根本上重塑工作本質(zhì)。AI的這一新前沿超越了內(nèi)容生成與洞察提煉,轉(zhuǎn)向能夠自主規(guī)劃、執(zhí)行和調(diào)整復(fù)雜動(dòng)作序列的AI agents。通過Amazon Bedrock提供的Palmyra X5,亞馬遜云科技的客戶可使用Writer的模型安全私密地構(gòu)建和擴(kuò)展AI agents,無需管理底層基礎(chǔ)設(shè)施。此外,對各行業(yè)的企業(yè)來說,Palmyra X5最令人振奮的是能夠構(gòu)建和部署更復(fù)雜的AI agents,這些agents可以處理海量數(shù)據(jù),并與其他agents、大語言模型及外部系統(tǒng)工具進(jìn)行交互。

Writer提供精確且完全自主的模型,杜絕后期訓(xùn)練量化與知識蒸餾,確保今天驗(yàn)證的行為模式與明天的行為模式保持一致。Palmyra X5在此基礎(chǔ)上強(qiáng)化技術(shù)承諾,嚴(yán)格保持后向兼容性以避免團(tuán)隊(duì)重復(fù)調(diào)優(yōu)流程的痛苦,同時(shí)發(fā)布客戶可參與制定的公開企業(yè)技術(shù)路線圖,并通過優(yōu)化推理延遲,使即便在百萬token量級下,大語言模型交互和檢索增強(qiáng)生成(RAG)也能實(shí)現(xiàn)近乎即時(shí)的響應(yīng)。

Writer宣布,得益于創(chuàng)新型Transformer設(shè)計(jì)(一種支持輸入數(shù)據(jù)并行處理而非順序處理的架構(gòu))與混合注意力機(jī)制(允許多種方式同時(shí)關(guān)注信息,既保證效率也確保效果),其未來發(fā)布的所有大語言模型將以一百萬token作為最小上下文窗口規(guī)模。這意味著企業(yè)可基于持續(xù)擴(kuò)展的AI能力制定長期戰(zhàn)略,而不受限于上下文窗口的規(guī)模約束。

(來源:亞馬遜云科技)

標(biāo)簽:亞馬遜云科技 我要反饋 
泰科電子ECK、ECP系列高壓直流接觸器白皮書下載
ABB協(xié)作機(jī)器人,自動(dòng)化從未如此簡單
優(yōu)傲機(jī)器人下載中心
億萬克
專題報(bào)道
2023-2024 智能·零碳成果展映
2023-2024 智能·零碳成果展映

“2023-2024智能·零碳成果展映”展示國內(nèi)外企業(yè)推進(jìn)“雙碳”實(shí)踐的最新成果,鼓勵(lì)更多企業(yè)、科研機(jī)構(gòu)、投資機(jī)構(gòu)等廣泛... [更多]

中國國際進(jìn)口博覽會(huì)
中國國際進(jìn)口博覽會(huì)

11月5日至10日,第七屆中國國際進(jìn)口博覽會(huì)在國家會(huì)展中心(上海)舉行。152個(gè)國家、地區(qū)和國際組織,近3500家參展企... [更多]

2024 工博會(huì) | 直播探館 · 全景解讀
2024 工博會(huì) | 直播探館 · 全景解讀

第二十四屆中國工博會(huì)于9月24日至28日在國家會(huì)展中心(上海)舉行,展會(huì)以“工業(yè)聚能 新質(zhì)領(lǐng)航”為全新主題。 [更多]