ICCV 2023生成式AI引人矚目，商湯多項(xiàng)技術(shù)突破展現(xiàn)中國(guó)“創(chuàng)新力”

ainet.cn 2023年10月07日

10月2日至6日，全球AI頂級(jí)國(guó)際會(huì)議ICCV(International Conference on Computer Vision)在法國(guó)巴黎舉行。本屆ICCV投稿總數(shù)達(dá)8068篇，其中2160篇被接收，錄用率為26.8%，略高于上屆ICCV 2021錄用率25.9%。

商湯科技及聯(lián)合實(shí)驗(yàn)室共49篇論文入選，涵蓋文生圖、3D數(shù)字人、自動(dòng)駕駛、目標(biāo)檢測(cè)、視頻分割等多個(gè)與大模型和生成式AI相關(guān)的熱點(diǎn)方向。

基于商湯AI大裝置SenseCore和“日日新SenseNova”大模型體系。

在生成式AI和視覺大模型等領(lǐng)域，商湯提出多項(xiàng)極具價(jià)值的技術(shù)突破和研究范式創(chuàng)新。

“ 商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛表示：持續(xù)深耕AI基礎(chǔ)設(shè)施建設(shè)、堅(jiān)持做注重產(chǎn)業(yè)實(shí)踐的學(xué)術(shù)研究、深耕人才階梯式培養(yǎng)，是商湯多年來在全球?qū)W術(shù)舞臺(tái)上不斷產(chǎn)出創(chuàng)新成果的基石。商湯將積極擁抱大模型帶來的全新研究范式，不斷提升研發(fā)體系，堅(jiān)持將基礎(chǔ)研究與業(yè)務(wù)發(fā)展緊密融合，為行業(yè)貢獻(xiàn)更具價(jià)值的技術(shù)成果?！?/FONT>

多項(xiàng)技術(shù)突破和范式創(chuàng)新

大模型及生成式AI成焦點(diǎn)

大模型和生成式AI在全球范圍內(nèi)備受矚目，也為學(xué)術(shù)研究提出了諸多具有挑戰(zhàn)性的全新課題。

生成式AI方向的文生圖領(lǐng)域，如何讓模型更容易生成與人類偏好相符的圖像?在論文《Human Preference Score: Better Aligning Text-to-Image Models with Human Preference》中，商湯研究團(tuán)隊(duì)將人類偏好引入Stable Diffusion的模型訓(xùn)練中，證明了人類偏好信息可以提升Stable Diffusion生成的圖像質(zhì)量，尤其在人體、四肢等經(jīng)典的failure case中更是展示了優(yōu)異的效果。

將人類偏好引入Stable Diffusion的模型訓(xùn)練過程

數(shù)字人是生成式AI的重要領(lǐng)域，但其制作依然需要一定門檻。

商湯研究團(tuán)隊(duì)在論文《SHERF: Generalizable Human NeRF from a Single Image》中提出一種基于單張圖片的可泛化、可驅(qū)動(dòng)人體神經(jīng)輻射場(chǎng)方法，僅需一張任意角度的3D人體圖片，結(jié)合必要的參數(shù)，就能實(shí)現(xiàn)3D數(shù)字人重建和驅(qū)動(dòng)，有望簡(jiǎn)化3D數(shù)字人的創(chuàng)作流程。

基于單張圖片的人體神經(jīng)輻射場(chǎng)重建和驅(qū)動(dòng)

高質(zhì)量的3D人體數(shù)據(jù)集是研究眾多人體相關(guān)的感知模型、重建模型和生成式AI的基礎(chǔ)。

商湯研究團(tuán)隊(duì)在論文《SynBody: Synthetic Dataset with Layered Human Models for 3D Human Perception and Modeling》中提出一個(gè)合成數(shù)據(jù)集SynBody，其構(gòu)建了穿著衣物的參數(shù)化人體模型，并生成了海量的人體虛擬數(shù)據(jù)，有助于3D人體感知和重建的模型訓(xùn)練。

此外，團(tuán)隊(duì)公布了開源代碼庫(kù)XRFeitoria，一個(gè)合成數(shù)據(jù)渲染工具箱，通過提供方便的Python API與CLI工具，極大簡(jiǎn)化了制作虛擬數(shù)據(jù)集的流程。

SynBody是基于分層人體模型的大規(guī)模合成數(shù)據(jù)集，可用于人體感知與建模等任務(wù)

在自動(dòng)駕駛場(chǎng)景的3D目標(biāo)檢測(cè)領(lǐng)域，商湯團(tuán)隊(duì)還在論文《Temporal Enhanced Training of Multi-view 3D Object Detector via Historical Object Prediction》中提出一種新的用于多視角3D檢測(cè)的時(shí)序增強(qiáng)訓(xùn)練方式——?dú)v史幀物體預(yù)測(cè)(HoP)，不僅在nuScenes測(cè)試集上使用ViT-L得到了68.5%NDS和62.4%mAP，超過了排行榜上所有3D物體檢測(cè)器，還可以即插即用，無縫集成到最先進(jìn)的 BEV 檢測(cè)框架中，重塑3D檢測(cè)時(shí)序利用的新范式。

HoP算法框架圖

此外，本屆ICCV，商湯科技還在目標(biāo)檢測(cè)、視頻分割、3D感知與重建、半監(jiān)督學(xué)習(xí)、NeRF等領(lǐng)域取得諸多技術(shù)創(chuàng)新突破。

開源開放、構(gòu)建大模型時(shí)代

產(chǎn)學(xué)研協(xié)同新生態(tài)

產(chǎn)學(xué)研協(xié)同是實(shí)現(xiàn)學(xué)術(shù)研究成果到行業(yè)應(yīng)用轉(zhuǎn)化的高效路徑。

商湯不斷夯實(shí)技術(shù)研究的同時(shí)，也積極參與和舉辦各類學(xué)術(shù)交流和競(jìng)賽活動(dòng)，促進(jìn)創(chuàng)新成果產(chǎn)出，探索大模型時(shí)代產(chǎn)學(xué)研協(xié)作模式的構(gòu)建。

同時(shí)，商湯長(zhǎng)期致力于推動(dòng)AI基礎(chǔ)設(shè)施和開源生態(tài)的建設(shè)，與開發(fā)者共創(chuàng)共建，共同推動(dòng)AI社區(qū)的繁榮發(fā)展。

商湯早在2018年開源的計(jì)算機(jī)視覺框架OpenMMLab已在GitHub上收獲超過8.7萬(wàn)個(gè)星標(biāo)。

今天，商湯的開源項(xiàng)目已拓展到?jīng)Q策智能、大語(yǔ)言模型、拓展現(xiàn)實(shí)、數(shù)據(jù)平臺(tái)、高性能訓(xùn)練和推理框架、AI智能體框架等領(lǐng)域，為學(xué)術(shù)界的科研突破和工業(yè)界的產(chǎn)業(yè)落地提供全方位的算法與平臺(tái)支撐。

其中，在大語(yǔ)言模型領(lǐng)域，商湯與上海AI實(shí)驗(yàn)室等聯(lián)合推出的書生·浦語(yǔ)大模型(InternLM)在開源社區(qū)和產(chǎn)業(yè)界產(chǎn)生廣泛影響。

最新的InternLM-20B模型性能先進(jìn)且應(yīng)用便捷，以不足三分之一的參數(shù)量，達(dá)到當(dāng)前被視為開源模型標(biāo)桿的Llama2-70B的能力水平。

秉承開源、開放的發(fā)展理念，商湯愿與行業(yè)伙伴共同迎接大模型的新一輪科技革命，讓AI技術(shù)釋放更廣泛的產(chǎn)業(yè)價(jià)值。

（來源：商湯科技）

標(biāo)簽：商湯科技

我要反饋

相關(guān)鏈接

兩大倡議發(fā)布，WAIC 2023科技倫理治理論壇圓滿舉辦

2023年7月7日，由世界人工智能大會(huì)組委會(huì)辦公室、工業(yè)和信息化領(lǐng)域科技倫理專家委員會(huì)指導(dǎo)，中國(guó)信息通信研究院承辦的“科技倫理治理論壇”在上海世博中心召開。本次論壇以“科技向善... [詳情]

2023年10月07日世界人工智能大會(huì)

商湯軟硬一體鋰電質(zhì)檢解決方案，助力鋰電生產(chǎn)質(zhì)量、效率雙提升

鋰電池，是支撐智能手機(jī)、新能源汽車快速發(fā)展的重要零部件。在鋰電池生產(chǎn)制造過程中，嚴(yán)苛的質(zhì)量檢驗(yàn)是確保鋰電行業(yè)高質(zhì)量發(fā)展的核心基礎(chǔ)。AI視覺技術(shù)，正在驅(qū)動(dòng)鋰電質(zhì)檢實(shí)現(xiàn)質(zhì)量和效... [詳情]

2023年10月07日商湯科技

上海科技時(shí)尚打卡地，商湯AR導(dǎo)航上線前灘太古里

上海盆友們請(qǐng)注意，由商湯科技為前灘太古里專屬打造的AR導(dǎo)航已正式上線!只需通過前灘太古里官方小程序，就能開啟由商湯SenseMARS火星混合現(xiàn)實(shí)平臺(tái)支持的全新升級(jí)的AR導(dǎo)航服務(wù)，不論樓... [詳情]

2023年10月07日商湯科技

資訊熱點(diǎn)

浪潮軟件低空數(shù)字孿生項(xiàng)目入選山東省企業(yè)技術(shù)創(chuàng)新項(xiàng)目計(jì)劃 2025工業(yè)互聯(lián)網(wǎng)大會(huì)在蘇州開幕科技賦能未來！斯坦德工業(yè)具身智能機(jī)器人DARWIN-01亮相深圳政協(xié)文史館中國(guó)民航管理干部學(xué)院與新華三集團(tuán)簽署戰(zhàn)略合作協(xié)議智領(lǐng)未來·協(xié)作革新 | 華沿機(jī)器人攜手長(zhǎng)榮科，共赴華南國(guó)際工業(yè)博覽會(huì)! 瑞士百超集團(tuán)中國(guó)區(qū)及亞太區(qū)總裁游松博士：踐行“有意義的創(chuàng)新” 當(dāng)AI加速落地，這企業(yè)級(jí)SSD新品不容錯(cuò)過德馬科技戰(zhàn)略投資斯克斯，人形機(jī)器人產(chǎn)業(yè)鏈布局注入新動(dòng)能華為聯(lián)合齊魯醫(yī)院、潤(rùn)達(dá)醫(yī)療發(fā)布“齊魯·心智”心肌病大模型

專題報(bào)道

聚力同行 · 新智“碳”索

“新華社-智能·零碳”項(xiàng)目策劃以“聚力同行·新智‘碳’索”為主題的新能源專題，主要圍繞光伏、儲(chǔ)能、鋰電、氫能、風(fēng)能五大新... [更多]

2025中國(guó)國(guó)際機(jī)床展覽會(huì)

4月21至26日，以“融合創(chuàng)新，數(shù)智未來”為主題的第十九屆中國(guó)國(guó)際機(jī)床展覽會(huì)在首都國(guó)際會(huì)展中心盛大舉辦。憑借場(chǎng)館的卓越服... [更多]

2023-2024 智能·零碳成果展映

“2023-2024智能·零碳成果展映”展示國(guó)內(nèi)外企業(yè)推進(jìn)“雙碳”實(shí)踐的最新成果，鼓勵(lì)更多企業(yè)、科研機(jī)構(gòu)、投資機(jī)構(gòu)等廣泛... [更多]

視頻

/resupload/guangzhi/AS00012420/1735897073649_1.jpg

欣旺達(dá)跨界玩說唱：當(dāng)創(chuàng)新技術(shù)遇上硬核Rap 武漢市中心醫(yī)院：以數(shù)字“小切片”，守護(hù)民生“大健康” 我與SABIC：材賦新能駛向理想【與昱能，共向往】十五周年零碳案例系列預(yù)告片伊頓Bussmann：百年品牌以創(chuàng)新驅(qū)動(dòng)發(fā)展 WHAT’S NEW 蔡司軟件新功能發(fā)布會(huì)南京站活動(dòng)回顧億緯鋰能攜手深向重卡以創(chuàng)新科技助力新能源運(yùn)力升級(jí)

ICCV 2023生成式AI引人矚目，商湯多項(xiàng)技術(shù)突破展現(xiàn)中國(guó)“創(chuàng)新力”

ICCV 2023生成式AI引人矚目，商湯多項(xiàng)技術(shù)突破展現(xiàn)中國(guó)“創(chuàng)新力”