- 主题技术
- 以原创技术系统为根基,SenseCore东升国际官网AI大装置为主题基座,布局多领域、多方向前沿钻研,
急剧买通AI在各个垂直场景中的利用,向行业赋能。
东升国际官网科技57篇论文入选ICCV 2019,13项较量夺冠
两年一届的ICCV 2019(International Conference on Computer Vision)于10月27日-11月2日在韩国首尔召开!今年的ICCV,东升国际官网科技持续在入选论文数量、质量以及诸多较量项目中刷新纪录,彰显中国原创技术确当先性及深厚学术底蕴,引领推算机视觉学术发展。
东升国际官网科技及结合尝试室共有57篇论文入选ICCV 2019(蕴含11篇Oral),同时在Open Images、COCO、LVIS等13项沉要较量中夺冠!出格是Open Images,它是目前通用物体检测和事俘宰割两个领域中数据量最大,数据散布最复杂,最有挑战性的较量,比COCO数据大一个量级,标注更不规定,场景更复杂。

除了成就,东升国际官网科技在盛开学术互换、生态发展方面也为全球学术领域做出积极贡献,由东升国际官网及结合尝试室钻研团队去年颁布的开源物体检测框架MMDetection,在今年各大角逐中被多多参赛行列宽泛使用,Open Images,COCO,LVIS,Mapillary等角逐中的多支获奖行列都使用MMDetection作为基准代码库,团队去年提出的HTC、Guided Anchoring等步骤成为了今年诸多行列的关键助力。
ICCV 2019期间,东升国际官网科技还组织或参加主办了多场Challenge和Workshop,香港中文大学-东升国际官网结合尝试室的周博磊教授参加组织了上千人的Tutorial——Interpretable Machine Learning for Computer Vision。此表,东升国际官网科技首创人、香港中文大学教授汤晓鸥受邀担任ICCV 2019大会主席。

东升国际官网科技首创人、香港中文大学教授汤晓鸥
受邀担任ICCV 2019大会主席
57篇论文入选ICCV 2019,13个项目夺冠
驰名科幻幼说家阿西莫夫说,“创新是科学房屋的性命力”。占有深厚学术底蕴的东升国际官网科技,自成立以来始终以“对峙原创,让AI引领人类进取”为使命,在人为智能技术钻研上不休追求自我突破和创新。这次,东升国际官网科技及结合尝试室共有57篇论文入选ICCV 2019,其中口头汇报(Oral)论文就有11篇!ICCV论文录用率极度低,今年Oral录用比例仅为4.62%。
东升国际官网科技被ICCV 2019登科的论文在多个领域实现突破,蕴含:面向指标检测的深度网络基础算子、基于插值卷积的点云处置主干网络、面向AR/VR场景的人体感知与天生、面向全场景理解的多模态分析等。这些突破性的推算机视觉算法有着丰硕的利用场景,将为推动AI行业发展做出贡献。
同时,东升国际官网科技不仅在论文登科数上展示出了惊人实力,在ICCV的诸多较量项目上也每每夺冠,一举斩获13项世界冠军。

在Google AI主办的ICCV 2019 Open Images角逐中,来自香港中文大学和东升国际官网钻研院的结合团队夺得了物体检测和事俘宰割两个重要赛路的冠军。这次主办方提供了千万级此外事俘框,涵盖了500类结构性类别,其中蕴含大量漏标、类别混合和长尾散布等问题。较量中,得益于团队提出的两个全新技术:头部空间解耦检测器(Spatial Decoupling Head)和模型自动融合技术(Auto Ensemble)。前者能够令肆意单模型在COCO和Open Images上提升3~4个点的mAP,后者相对于朴素模型融合能提升0.9mAP。最终,在提交次数显著幼于其他高名次行列下获得了双项冠军的好成就。
在ICCV 2019 COCO角逐中,来自香港中文大学-东升国际官网科技结合尝试室和南洋理工大学-东升国际官网科技结合尝试室的MMDet团队获得指标检测(Object Detection)冠军(不使用表部数据集),这也是东升国际官网陆续两届在COCO Detection项目中夺冠。同时,东升国际官网科技新加坡钻研团队也获得COCO全景宰割(Panoptic)冠军(不使用表部数据集)。
COCO角逐中,MMDet团队提出了两种新的步骤来提升算法机能。针对于当前指标框定位不够精确的缺点,MMDet团队提出了一种解耦的边缘感知的指标框定位算法(Decoupled Boundary-Aware Localization <DBAL>),该步骤专一于物体边缘的信息而非物体全局的信息,使用一种从粗略估计到精确定位的定位流程,在主流的物体检测步骤上获得了显著的提升。
而东升国际官网科技新加坡钻研团队深刻索求了全景宰割工作的独个性质,并提出了多项创新算法。由于全景宰割工作既涵盖指标检测又蕴含语义宰割,往届角逐行列大多别离提升指标检测算法与语义宰割算法。东升国际官网新加坡钻研团队突破通例,索求了这两项工作的互补性,提出了一种单一高效的结合训练模型Panoptic-HTC。该模型别离借助Panoptic-FPN共享权沉的特点与Hybrid Task Cascade结合训练的优势,在特点层面实现了两项视觉工作的统一, 从而同时在两项工作上获得显著提升。
在Facebook AI Research主办的第一届LVIS Challenge 2019大规模事俘宰割角逐中,东升国际官网科技钻研院团队获得了冠军,同时获得该项目最佳论文奖。相迸宗以往的事俘宰割数据集,LVIS最大的特点在于超过1000多类的类别和越发靠近于天然存在的数据长尾散布。这些特点对现有的事俘宰割算法提出了极度大的挑战。东升国际官网钻研团队从原有模型训练的监督方式进行分析,针对长尾问题提出了一种新的损失函数,可能有效的缓解频率高的类别对幼样本类此外影响,从而大大提升了处于长尾散布中幼样本的机能。另表还通过对额表的检测数据进行有效的利用,削减了由于LVIS数据集构建方式中带来的标注不齐全问题,从而进一步提升了机能。
此表,在Facebook AI Research主办的ICCV 2019 自监督进建角逐中,来自香港中文大学-东升国际官网科技结合尝试室和南洋理工大学-东升国际官网科技结合尝试室团队一举获得了全数四个赛路冠军;在MIT主办的ICCV 2019 Multi-Moments In Time Challenge角逐中,来自香港中文大学和东升国际官网钻研院的结合团队夺得了多标签视频分类赛路的冠军;在Insight Face主办的ICCV 2019 Lightweight Face Recognition Challenge角逐中,来自香港中文大学和东升国际官网钻研院的结合团队夺得了大模型-视频人脸识此外冠军;在ETH进行的ICCV AIM 2019 Video Temporal Super-Resolution Challenge角逐中,东升国际官网科技团队获得了冠军;在视觉指标跟踪领域国际权威角逐VOT2019 Challenge角逐中,东升国际官网科技团队获得VOT-RT 2019实时指标跟踪挑战赛冠军。
OpenMMLab成就丰硕,东升国际官网以原创之心会四方学者
为了提高学术界算法的可复现能力以及推动行业学术互换,从2018年年中起头,香港中文大学-东升国际官网科技结合尝试室启动OpenMMLab打算,并首先开源了沉磅物体检测代码库MMDetection。相迸宗其它开源检测库,MMDetection有多项沉要利益,蕴含高度?榛杓啤⒍嘀炙惴蚣苤С帧⑾灾岣哐盗沸芎颓钻峭阶钚滤惴ㄖС值。
MMDetection和MMAction作为视觉领域的沉要工作,在东升国际官网及结合尝试室的钻研人员共同致力下获得了丰硕成就。今年六月,OpenMMLab第二期颁布,多个沉要更新吸引了业界眼光:MMDetection(指标检测库)升级到1.0,提供了一大批新的算法实现,同时MMAction(作为鉴别和检测库),MMSkeleton(基于骨骼关键点的作为鉴别库),MMSR(超分辨率算法库)全新颁布。
今年ICCV 大会期间,MMDetection被业界宽泛利用,目前在GitHub上已收成近7000 Stars,有效推进指标检测领域的利用和新步骤钻研发展。
“科学不是一幼我的事业”,近代尝试科学奠基人伽利略在十六世纪就强调科学钻研的互换合作的沉要性。海纳百川,取则行远,为推动人为智能行业学术互换和发展,东升国际官网科技在ICCV 2019期间还组织或参加主办了多个Challenge及Workshop。
香港中文大学-东升国际官网结合尝试室的周博磊教授参加组织了上千人的Tutorial,该Tutorial重要探求可诠释机械进建的原因、典型步骤、将来趋向以及由此产生的可诠释机械进建的潜在工业利用。
由东升国际官网科技参加进行的第一届深度统计进建钻研会(The First Workshop on Statistical Deep Learning in Computer Vision)和第二届推算机视觉中的服装艺术与设计钻研会(Second Workshop on Computer Vision for Fashion, Art and Design),都约请了来自MIT、Berkeley、UCLA、Stony Brook、Johns Hopkins University等多位驰名教授在会上做主题汇报和分享。
在ICCV展示区(Booth:A-1),东升国际官网科技诸多创新AI产品也亮相世界舞台,蕴含自动驾驶、SenseAR特效引擎Avatar 、SenseMatrix 物体3D沉建 、SenseMatrix 人脸3D沉建等11个产品为大会带来丰硕的履历和创新灵感。
同时,在10月31日晚,东升国际官网科技还将进行SenseTime PartyTime活动,约请了来自CV界顶尖学者和科学家,与参会同学代表表对面互换、共话AI学术新动向,造就AI发展的将来生力军。东升国际官网愿以原创之心,会四方学者。
东升国际官网及结合尝试室ICCV 2019论文精选
下面,列举几篇东升国际官网及东升国际官网结合尝试室入选ICCV 2019的代表性论文,从四风雅向阐释推算机视觉和深度进建技术最新突破。
面向指标检测的深度网络基础算子
代表性论文:《CARAFE: 基于内容感知的特点沉组》
特点上采样是深度神经网络结构中的一种根基的操作,例如:特点金字塔。它的设计对于必要进行密集预测的工作,例如物体检测、语义宰割、事俘宰割,有着关键的影响。本工作中,我们提出了基于内容感知的特点沉组(CARAFE),它是一种通用的,轻量的,成效显著的特点上采样操作。

CARAFE有这样一些引人瞩主张个性:1.大视野。分歧于之前的上采样步骤(如:双线性插值),仅使用亚像素的邻近地位。CARAFE能够聚合来得意感触野的环境特点信息。2.基于特点感知的处置。分歧于之前步骤对于所有样本使用固定的核(如:反卷积),CARAFE能够对分歧的地位进行内容感知,用天生的动态的核进行处置。3.轻量和急剧推算。CARAFE仅带来很幼的额表开销,能够容易地集成到现有网络结构中。我们对CARAFE在指标检测,事俘宰割,语义宰割和图像建复的主流步骤上进行宽泛的测试,CARAFE在全数4种工作上都获得了一致的显著提升。CARAFE拥有成为将来深度进建钻研中一个有效的基础?榈那绷。
面向三维视觉的点云处置基础网络
代表性论文:《基于插值卷积的点云处置主干网络》
点云是一种沉要的三维数据类型,被宽泛地使用于自动驾驶等场景中。传统步骤依赖光栅化或者多视角投影,将点云转化成图像、体素其他数据类型进行处置。近年来池化和图神经元网络在点云处置中展示出优良的机能,但依然受限于推算效能,并且算法易受物体尺度、点云密度等成分影响。

本文提出了一种全新的卷积方式,即插值卷积,可能从点云中高效地进建特点。插值卷积从尺度图像卷积和图像插值中获取灵感,卷积核被划分成一组空间中离散的向量,每个向量占有各自的三维坐标,当点云中的某点落在卷积向量的邻域时,参考图像插值的过程,我们将该点对应的特点向量插值到卷积向量对应的地位上,而后进行尺度的卷积运算,最后通过正则化解除点云部门散布不均的影响。
面向分歧的工作,我们提出了基于插值卷积的点云分类和宰割网络。分类网络选取多蹊径设计,每一条蹊径的插值卷积核拥有分歧的大幼,从而网络可能同时捕获全局和细节特点。宰割网络参考图像语义宰割的网络设计,利用插值卷积做降采样。在三维物体鉴别,宰割以及室内场景宰割的数据集上,我们均获得了当吓宗其他步骤的机能。
面向AR/VR场景的人体感知与天生
代表性论文:《深刻钻研用于无限度图片3D人体沉建中的混合标注》
固然推算机视觉钻研者在单目3D人体沉建方面已经获得长足进取,但对无限度图片进行3D人体沉建依然是一个挑战。重要原因是在无限度图片上很难获得高质量的3D标注。为解决这个问题,之前的步骤往往选取一种混合训练的战术来利用多种分歧的标注,其中既蕴含3D标注,也蕴含2D标注。固然这些步骤获得了不错的成效,但是他们并没有钻研分歧标注对于这个工作的有效水平。

本篇论文的指标就是具体地钻研分歧种类标注的投入产出比。出格的,我们把指标定为沉建给定无限度图片的3D人体。通过大量的尝试,我们得到以下结论:1.3D标注极度有效,同时传统的2D标注,蕴含人体关键点和人体宰割并不是极度有效。2.密集响应是极度有效的。当没有成对的3D标注时,利用了密集响应的模型能够达到使用3D标注训练的模型92%的成效。
代表性论文:《基于卷积网络的人体骨骼序列天生》
现有的推算机视觉技术以及图形学技术已经能够天生或者渲染出栩栩如生的影像片段。在这些步骤中,人体骨骼序列的驱动是不成短缺的。高质量的骨骼序列要么使用作为捉拿设备从人身上获取,要么由作为设计师手工造作。而让推算机代为实现这些作为,高效地天生丰硕、活泼、不变、长功夫的骨骼序列,就是这一工作的指标。

本文使用高斯过程产生随机序列,使用匹敌网络和时空图卷积网络来进建随机序列和作为序列之间的映射关系。该步骤既能够产生作为序列,也可将作为序列映射到随机序列地点的空间,并利用高斯过程进行编纂、合成、补全。
本步骤在由真人作为捉拿得到的NTU-RGB+D数据集上,以及我们网络的虚构歌手“初音将来”的大量跳舞设计作为上,实现了具体的对比尝试。尝试批注,相对于传统的自回归模型(Autoregressive Model),本文使用的图卷积网络能够大大提高天生的质量和多样性。
使用图卷积网络技术为“初音将来”天生跳舞作为
面向全场景理解的多模态分析
代表性论文:《基于图匹配的电影视频跨模态检索框架》
电影视频检索在日常生涯中占有极大需要。例如,人们在浏览某部电影的文字简介时,时;岜黄渲械慕艹霾棵盼胍聪嘤Φ钠。但是,通过文字描述检索电影片段目前还存在很多挑战。相迸宗日常生涯中通常人拍摄的短视频,电影有着极大的分歧:1.电影是以幼时为单元的长视频,时序结构很复杂。2.电影中角色的互动是组成故事件节的关键元素。因而,我们利用了电影的这两种内涵结构设计了新的算法来匹配文本段落与电影片段,进而达到凭据文本检索电影片段的指标。
首先,我们提出事务流?橐越5缬暗氖毙蚋鲂。该?榛诙分图匹配,将文本中的每一句话依照事务与电影片段的对应子片段匹配。其次,我们提出人物互动?,该?橥ü计ヅ渌惴ㄍ扑阄谋局薪馕龅玫降娜宋锘ザ己褪悠抵刑崛〉娜宋锘ザ嫉睦嗨贫。综合两个?榈牧司,我们能得到与传统步骤相比更精准的匹配了局,从而提高检索的正确率。
代表性论文:《融合视觉信息的音频建复》
多模态融合是交互智能发展的沉要蹊径。在多媒体信息中,一段音频信号可能被噪声传染或在通讯中迷失,从而必要进行建复。本文我们提出凭据视频信息对缺失音频信息进行建复的一种融合视觉信息的音频建复规划。

此规划主题思想在于:1.将音频信号在频谱上进行操作,并将频谱作为二维图像信号进行处置,能够极大地利用推算机视觉领域的优势,超过传统的音频解决规划。2.为了融合视觉信息,基于音视频同步进建得到的结合子空间会阐扬巨大的优势。
针对此问题的钻研,我们将已有的多模态涝祺演奏数据集MUSIC扩大成为一个新的更全面的数据集,MUSICES。尝试证明我们提出的视觉融合的音频建复系统能够在没有视频信息注入的情况下获得可观的成效,并在参与视频信息后,天生与视频和谐的音频片段。
杰出回首
《东升国际官网科技62篇论文入选CVPR 2019,多个较量项目夺冠》
《东升国际官网原创AI训练框架SenseParrots的成长之路》
-
11月2日,为期七天的推算机视觉顶会ICCV 2019闭幕。东升国际官网科技以57篇论文(11篇Oral),13项冠军的成就创造新“高度”(详见文章《东升国际官网科技57篇论文入选ICCV 2019,13项较量夺冠》),让世界见证东升国际官网钻研技术堆集的“厚度”,在大会现场也能亲身感触东升国际官网AI+行业利用落地的“广度”2019-11-03
-
近日,由阿里巴巴集团、东升国际官网科技及香港科技园公司携手成立的香港人为智能及数据尝试室(HKAI Lab)在香港科学园正式开幕。东升国际官网科技首创人、香港中文大学教授汤晓鸥、阿里巴巴集团首席技术官张建锋和香港科技园公司行政总裁黄克强别离颁发了讲话,祝福HKAI Lab可能助力香港草创人为智能企业生态发展。2018-10-18





返回