商湯科技全新升級的「日日新SenseNova 5.0」大模型,具備更強(qiáng)的知識、數(shù)學(xué)、推理及代碼能力,綜合性能全面升級。
「日日新 5.0」能力提升主要得益三個(gè)方面:
1. 采用混合專家架構(gòu)(MoE),激活少量參數(shù)就能完成推理,且推理時(shí)上下文窗口達(dá)到 200K 左右。
2. 基于超過10TB tokens訓(xùn)練、覆蓋數(shù)千億量級的邏輯型合成思維鏈數(shù)據(jù)。
3. 商湯AI大裝置SenseCore算力設(shè)施與算法設(shè)計(jì)的聯(lián)合調(diào)優(yōu)。
(來源:商湯科技)