东升国际官网

申请试用
登录
  • hd-share-img01
新闻中心

综合评分登顶八大榜单!东升国际官网开源SenseNova-SI-1.3,空间智能尺度效应突破

2026-02-06

东升国际官网科技正式开源空间智能模型日日新SenseNova-SI-1.3,在空间丈量、视角转换、综合推理等主题工作中展示出显著提升,另表对比之前的版本加强了回覆简答题的能力。

在集成多项权威空间智能榜单的综合评测平台EASI上,SenseNova-SI-1.3综合机能超过Gemini-3-Pro,均分斩获EASI-8(八个权威空间智能榜单的混合评测)尺度第一,在多个高难度空间工作(尤其是视角转换)中阐发优异。

登顶1.png


刁钻考题验证:SenseNova-SI-1.3精准突破空间智能主题难点

EASI-8蕴含一系列专门调查空间理解能力的高难度测试题,让Gemini-3-Pro等模型都再三踩坑。那么SenseNova-SI-1.3阐发若何呢?(下列问题在测试模型时使用的原题为英文,为便于读者理解翻译为中文)。


登顶2.png


标题要求统计两张照片中构筑模型的总数量,主题难点是理解两张图的对应关系,以此预防遮挡漏数和沉复无数。图2视角下显露出图1中被遮挡的深灰色构筑,且部门模型在两图中沉复出现。Gemini-3-Pro未齐全去沉,误数为6个;SenseNova-SI-1.3则给出“4 个”的正确答案。


登顶3.png


标题给出两张书房部门照片,已知 iMac 位于房间北部,询问学生写作业区域的方位。需先理解两张图片属于统一空间,再通过视觉线索拼接场景。Gemini-3-Pro误判进建区在西侧;SenseNova-SI-1.3精准定位 “西北角”,齐全切合空间逻辑。


登顶4.png


标题要求以“未戴眼镜男士的自身视角” 判断身旁戴眼镜男士的方位,调查“参照系转换” 能力,模型很容易以“观察者视角”来判断方向。Gemini-3-Pro就误选了 “右边”;SenseNova-SI-1.3则能正确给出“左边” 的正确答案。


登顶5.png


标题给出粉色瓶子前、后、左、右4张照片,询问图4角度下瓶子左边物体。这路题需整合多视角线索沉构房间全局布局,再切换至指标视角判断方位—— 第4张照片中瓶子左侧齐全处于视觉盲区,仅能通过前3张图中的窗户、床、衣柜等线索还原空间关系。Gemini-3-Pro误选 “窗户和蓝色窗帘”,SenseNova-SI-1.3精准锁定正确答案 “衣柜和门”。


登顶6.png


以双层巴士与公交站的场景为题,需预防陷入“英国巴士靠左行驶,因而靠站的是左侧”的学问陷阱,而是通过现实的视觉画面判断方位。Gemini-3-Pro误判 “左侧” 为答案;而 SenseNova-SI-1.3则正确理解 “右侧” 为正确答案。


空间智能是极其怪异的多模态能力


登顶7.png

Core Knowledge Deficits in Multi-Modal Language Models (2025)发现视角转换工作与其它多模态工作的有关性(红框内)呈蓝色,即代表有关性较低

一篇2025年颁发于机械进建顶会ICML的论文《Core Knowledge Deficits in Multi-Modal Language Models》揭示了一个有趣的发现:视角转换(Perspective)和所有传统多模态模型的能力的有关性均异常得低,这代表主流算法蹊径可能不是空间智能的形成的有效蹊径,这也诠氏缢为什么当先的多模态大模型在空间智能有关的工作上阐发欠安。


登顶8.png

Core Knowledge Deficits in Multi-Modal Language Models (2025)发现增大模型尺寸对提升视角转换工作成效欠安


这篇论文也发现,空间智能似乎存在反尺度效应的景象:更大的模型并不能更好地解决空间智能工作。另表,在EASI的官方汇报中也能够找到类似的描述,指出视角转换工作(Perspective-taking)依然是最具挑战的基础能力之一。

空间智能必要全新的进建范式。


从3D世界数据匮乏到空间智能的尺度效应


登顶9.png

空间智能的主题——视角转换工作被拆解成了三个关键步骤:成立跨视角关联、理解视角移动、设想视角变换,并萦绕着解决这三个基础能力机关大量训练数据


学术界现罕见据集多着沉于指标鉴别与场景理解,模型往往停顿在图像模式匹配阶段,难以形成不变的空间理解能力;谡庖欢床,想要解决空间智能尤其是视角转换工作,单一扩充有关数据规模是不够的。

为相识决这一底子问题,我们将视角转换看作从二维视觉信息迈向三维空间关下讽解的关键桥梁,并将其拆解为递进的能力阶段,由易到难、难度递增的三个工作层级(成立跨视角关联、理解视角移动、设想视角变换),并机关大量且档次明显的训练数据,使模型成立完整的空间理解能力。

同时,在数据规模持续扩大的过程中,SenseNova-SI团队挖掘并沉组多视角学法术据资源,将很多从前未被充分利用的标注转化为视角转换训练数据。例如,多目关联数据集 MessyTable 提供了高物体复杂度场景,其中跨视角物体一致性信息与精确的相机位姿标注,可用于训练物体对应与相机活动推理能力;而部门室内场景扫描数据如CA-1M中蕴含物体自身朝向标注的样本,则被用于补充模型进行视角转换与设想所需的稀缺数据。这种跨数据源的沉组与再利用,使堆集大量丰硕而系统的空间理解数据成为可能。


登顶10.png

空间智能的尺度效应:SenseNova-SI在视角转换工作上超过GPT-5


大规模高质量的空间智能数据在SenseNova-SI团队的手中最终验证了空间智能的尺度效应:SenseNova-SI的8B参数基模型最终超过了强关源模型如GPT-5,而2B参数的幼模型也阐发不俗,在一样数据规模下,甚至超过了纽约大学的Cambrian-S和字节的VST两个7B参数的模型。


登顶11.png

只在Ego-Exo4D上训练第一/第三人称视角匹配的模型能够大幅提升(+90.4%)MMSI2D迷宫导航问题上的阐发

更有趣的是,团队在钻研中似乎发现了一些智能涌现的预兆:一些看起来毫无关联的但也许细想之下有底层能力联系的工作能够协同发展。另表,团队也发此刻视角转换工作上训练的模型也能够加强如心智沉建(Mental Reconstruction)、综合空间推理(Comprehensive Reasoning)等能力。


东升国际官网引领空间智能普惠生态

SenseNova-SI-1.3模型的升级颁布背后,是东升国际官网科技始终致力于突破技术壁垒,让顶尖空间智能技术惠及更多开发者与企业。

对科研人员而言,SenseNova-SI-1.3通过在空间智能上验证数据尺度效应提供了一个与现有基座模型齐全兼容,但又长于空间智能的强力预训练模型和基线(SenseNova-SI已被VSI-Bench, MMSI-Bench等权威榜单官方收录),能够直接在其之上设计创新算法或者续训,推动空间智能向人类水平迈进;

对企衣反说,可直接基于 SenseNova-SI-1.3急剧落地利用,缩短研发周期、降低技术门槛;

对通常用户而言,将来将有更多搭载先进空间智能的产品走进生涯——从智能家电到自动驾驶,从工业机械人到教育设备,都将更懂 “空间逻辑”、更贴合现实需要。

登顶12.png

SenseNova-SI在具身工作上的索求了空间智能的沉要性

开源地址

SenseNova-SI模型家族(点击阅读原文跳转)

https://huggingface.co/collections/sensenova/sensenova-si

SenseNova-SI开源代码

https://github.com/OpenSenseNova/SenseNova-SI

Discord 社区约请码:

https://discord.gg/WBzH62bk

SenseNova-SI专属群,欢迎入群扫码互换~↓↓↓

登顶13.png

产品试用
填写此单一表格,我们将尽快联系您!
商务合作
400 900 5986
周一至周五 9:00-12:00,13:00-18:00
合作同伴招募
【网站地图】