无人车的眼睛、UP主的生产力工具,都藏在百度
CVPR 上诞生的技术正在逐渐「出圈」。
啤酒、烧烤、欧洲杯是很多球迷今年夏天的消暑利器。但你可能想不到的是,那些精彩的进球集锦、球星慢动作回放说不定是 AI 做的。
在今年的 CVPR 大会上,百度向我们确认了这一点。
他们的 AI 可以在无人工介入的条件下,精准、实时地切分出进球、射门、犯规等动作片段。基于此项能力,团队开发出了一系列应用工具并成功落地,包括:
1. 自定义足球精彩集锦生成工具。只需输入球员并选定比赛场次,AI 就能自动生成这个球员的精彩瞬间视频集锦以及慢动作回放。相关产品已经在百度百科 400 多个足球球员和球队页面落地。
2. 足球图文战报一键转换视频平台。只需要输入文字直播内容或者直播间地址,AI 就能智能聚合生成对应的视频内容。
3. 基于图像场景识别的智能视频生产线。该生产线可以快速理解上传的长视频,检测是否有进球、精准定位视频中的进球瞬间,并完成自动剪辑。
最近,这些技术还帮他们拿到了一个重量级赛事的双料冠军。
在刚刚闭幕的 CVPR 2021 大会上,百度取得了 SoccerNet-v2 足球视频理解竞赛的全部两项任务的冠军,这是全球首个以足球比赛视频的全方位理解为目标的竞赛。
而且,这还只是百度今年 CVPR 成绩单的一部分。
作为「中国军团」多年出征 AI 顶会的一员「老兵」,百度在今年的 CVPR 上再次创下新纪录:不仅入选了 22 篇优质论文,还连获 10 个挑战赛冠军,在去年 8 个冠军基础上实现新突破。
此外,百度还主办了一场重量级学术 Workshop 和一场 Tutorial,并受邀在大会上做同声传译特邀报告和 PaddleCV 技术分享演讲。
这种全方位的发声方式不仅让我们看到了百度在 CV 领域的研究、落地成果,还展示了该公司在 NLP、AutoDL 等领域的前沿探索以及多个领域的融合创新。
在这篇文章中,我们就来盘点一下这些内容。
十项 CV 冠军,聚焦自动驾驶、智能交通、智慧城市、智能创作等多个赛道
CVPR 2021 覆盖了计算机视觉多个细分领域,百度此次参与并获得了七项挑战赛的十个冠军。其中,六项冠军成果可加速自动驾驶、智能交通、智慧城市等落地和应用,部分成果可助力智能创作工具的打造。
六项冠军助力自动驾驶、智能交通、智慧城市应用落地
对于百度来说,自动驾驶可以说是 CVPR 舞台上的一项「传统艺能」了。早在 2018 年,百度 Apollo 就占据了 CVPR 自动驾驶的主场;2019 年,Apollo 又在 CVPR 上公开了国内唯一的自动驾驶纯视觉城市道路闭环解决方案——Apollo Lite。这些高光时刻在今年的多项竞赛中得到了延续。
在今年取得的十项冠军中,「语义分割、高分辨率人体解析、雾天环境检测」赛道的三项冠军或对百度强化自动驾驶能力有直接的助力。
以 AutoNUE 2021 挑战赛的语义分割赛道为例,该赛道聚焦街景图像的语义分割。与普通语义分割数据集不同,街景数据集物体更多,场景更为复杂。针对该赛道的问题,百度提出了基于 CNN 和 Transformer 的融合算法策略,通过异构模型互补方式,实现了驾驶场景特征的更强表达能力,从而提升了分割性能。针对密集目标,百度提出了区域递进算法,将稠密任务切分为若干稀疏子任务,降低了模型复杂度,加速了模型收敛,提升了测试精度。最终,百度以三项测评指标均第一的优势超越其他参赛机构获得冠军。比赛代码也计划不久后开源:https://github.com/PaddlePaddle/PaddleSeg
除了复杂的街景,雾霾等极端天气也是阻碍自动驾驶落地的一大难题。本届 CVPR 就有一个专门针对雾霾天气的检测竞赛——UG2+ (SEMI-)SUPERVISED OBJECT DETECTION IN HAZE CONDITIONS。
在这场竞赛中,百度使用最新的 Swin Transformer 模型配合 cascade-rcnn 结构作为基础模型并针对任务特点优化了 anchor 选择以提高模型的识别能力,同时使用去雾和非去雾的数据组合进行训练,提升了模型的泛化性能。另外,针对样本不平衡问题,团队使用了基于样本分布的采样平衡方法,有效提升了模型性能。
上述竞赛展现的技术能力或已逐渐在百度自动驾驶落地过程中得以展现。目前,在早晚高峰交通流密集路口左转礼让行人,车辆视觉盲区突然窜出行人、车辆等一系列长尾场景中,百度 Apollo 自动驾驶车均能进行良好处置。4 月 13 日,百度 Apollo 拿到了北京市颁发的中国首批夜间及特殊天气测试资质,机器之心也在上个月冒雨体验了一次 Apollo GO 自动驾驶车的夜间试乘。
Apollo 车辆平缓通过车流密集的路口。
除了自动驾驶,百度在智能交通、智慧城市方向的技术进展更多地在第五届 AI CITY 智慧城市挑战赛中得以展现。AI CITY 聚焦交通相关的车流统计、再识别、异常事件分析等应用场景,一共 5 个赛道,是百度多次夺冠的「自留地」,今年百度也在车流统计、异常事件检测两个赛道拿到冠军。
在车流统计任务中,比赛要求在端上设备上实现整体技术方案,并对端上的速度与效果指标进行综合打分。百度基于复杂场景下路口车辆多目标检测、跟踪技术,实现了分车道的车流统计,并通过模型小型化以及流水线并行化处理流程,实现了性能 + 效果综合提升,最终取得冠军。
在异常事件检测赛道中,百度使用双向多粒度融合的异常检测算法,配合视频稳像、区域特取、背景建模等预处理,经过车辆检测及后续跟踪判断异常,并融合撞车判断逻辑找到准确的异常开始时间,最终取得第一。