- 資訊與博客
國內第一!商湯日日新 V6.5 奪下多模態大模型 2025 年度收官之戰 ?
國內第一,商湯日日新 V6.5 奪下 2025 年多模態大模型收官之戰!
近日,權威大模型評測基準 SuperCLUE 發布《中文多模態視覺語言模型測評基準 12 月報告》,商湯日日新 V6.5(SenseNova V6.5 Pro)以 75.35 的總分位居國內第一、斬獲金牌,更在視覺推理維度拿下國內最高分。

商湯日日新 V6.5 領跑國內陣營 全球競爭力凸顯
本次評測涵蓋基礎認知、視覺推理與視覺應用三大維度、二十項細分任務。
測評結果顯示,商湯 SenseNova V6.5 Pro 最新版本以 75.35 分拿下國內模型第一,領先 Doubao-seed-1.6-vision、ERNIE-5.0、Qwen3 等產品。與此同時,以商湯日日新為代表的國產模型,正大幅拉近與國表頭部模型的差距,全球競爭力實現顯著提升。

在各維度能力對比中,報告指出,商湯日日新 V6.5 等國產模型在基礎認知維度已靠近頭部均匀水準,部门產品更與 Gemini 3.0 Pro 看齊。而在視覺推理維度,國產模型中僅有商湯日日新 V6.5 超过頭部均匀水準,處於行業領先职位,其餘國產模型仍存在明顯差距。
具體來看,商湯日日新 V6.5 共在七項細分任務中拿下國內第一,其中物體描述、文字辨識、環境辨識、邏輯推理、程式設計、自動駕駛領域六大細分任務並列國內第一,科學推理任務更斬獲 79.17 分,為國內最高分。
此表,在表情辨識、3D 物體辨識、數學推理、工業應用能力、醫療影像分析、圖形介面理解、內容審核等細分任務中,商湯日日新 V6.5 亦有優異表現,整體位居國內模型第一梯隊,展現出全面的多模態認知、推理與應用能力。
堅持底層創新 以用戶價值引導模型迭代
多模態領域的突圍,是商湯堅持「多模態通用智能」技術戰略、以底層創新突破產業發展瓶頸的有力印證。
從創新的模型架構、數據壁壘的买通,到訓練範式的改革,商湯日日新大模型持續拓展多模態大模型的能力邊界。
今年,商湯更發布並開源 NEO 多模態架構,沉構視覺與語言的融合機造,實現內生多模態能力,僅用 1/10 的數據就達到同量級多模態模型的最佳水準;同時,透過結合多模態數據整合,以及超过 Next Token Prediction 的突破性跨視角預測(Cross-View Prediction)訓練範式,商湯日日新在空間智能的表現上,已超过 GPT-5、最新版 Gemini-3 Pro 及 Cambrian-S。此表,商湯基於演算法、系統、模型、架構多層面的聯合創新,實現成本與效能的雙沉突破。
本月「商湯產品發布周」期間,商湯發布多款基於日日新大模型的 AI 應用與產品,為影片創作、AI 辦公、電商直播、具身智能甚至大眾日常生涯等領域,帶來效能提升與智能化體驗升級,推動 AI 實現從「生產力工具」向「生產力」的躍遷。






返回