系列解读:深度时空视觉表征进修方法及应用

系列解读:深度时空视觉表征学习方法及应用



机器之心知识站与国际顶尖实验室及研究团队合作,将陆续推出系统展现实验室成果的系列技术直播,动作深入国际顶尖团队及其前沿工作的又一个入口。赶紧点击「阅读原文」关注起来吧!

视觉表征学习是人工智能领域的一个重要分支,它也是大部分计算机视觉与多媒体任务的基石。近几年受自然语言处理领域 transformer 结构的启发,视觉表征学习的网络架构也从传统卷积神经网络(cnn)演变到 vision transformer 的设计范式。此外,得益于无监督、自监督机器学习的技术发展,视觉表征学习的训练模式逐渐摆脱了对大量人工标注数据的紧张依赖,涌现出一系列高性能的自监督视觉表征学习技术。因此本次分享将由京东科技视觉技术创新团队的四位研究员分别介绍深度时空视觉表征学习(图像、视频及 3d 视觉)在网络架构和自监督训练模式这两个维度上的一系列技术创新,例如针对图像和视频表征学习的高性能 transformer 结构(cotnet、wave-vit、dual-vit、sifa、dtf)。

12 月 20 日,来自京东科技视觉技术创新团队的 4 位高朋将带来线上分享,详情如下:

12 月 20 日 19:00-21:00



主题一:图像表征进修方法及应用
分享嘉宾:潘滢炜,京东科技视觉技术创新团队资深研究员,谷歌学术引用率 5000 余次,曾获微软学者奖学金、acm sigmm china 最好博士论文奖和新星奖、acm multimedia 最佳演示系统奖和最佳开源项目奖。

主题二:自监督表征进修方法及应用
分享嘉宾:亚龙,京东科技视觉技术创新团队资深研究员。在人工智能、计算机视觉领域国际会议如 cvpr, iccv, iclr, aaai 等刊登论文 20 余篇,并获得 acm mm 图像检索、cvpr 细粒度图像识别等多项竞赛冠军。


主题三:视频表征进修方法及应用
分享嘉宾:邱钊凡,京东科技视觉技术创新团队研究员,主要研究兴趣是视频内容理解、多媒体数据分析和多媒体内容检索等方向,在相关领域国际会议上刊登论文 20 余篇,谷歌学术引用率三千余次,曾获微软学者奖学金、acm sigmm china 最佳博士论文奖。



主题四:3d视觉表征进修方法及应用
分享嘉宾:蔡琪,京东科技视觉技术创新团队研究员,在 CVPR、NeurIPS、TIP 等会议期刊发表多篇无监督学习、目标检测相关论文,曾获得 VisDA 跨域目标检测、SAPIEN ManiSkill 机械臂比赛等多项竞赛冠军,相关研究工作在物流场景中落地应用。


加群看直播
直播间关注机器之心机动组视频号,北京时间 12 月 20 日 19:00 开播。


交流群:本次直播设有 QA 环节,欢迎加入本次直播交流群探讨交流。


如群已超出人数限制,请添加机器之心小助手:syncedai2、syncedai3、syncedai4 或 syncedai5,备注「视觉表征」即可加入。
如果你也有最新工作希望分享或提交你感兴趣的内容方向,随时告诉我们吧:https://jiqizhixin.mikecrm.com/fFruVd3



本文链接: https://www.yizhekk.com/1214175458.html

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注