0
人脸识别之后的下一个风口是什么?
对于这个问题,业界似乎早已有了共识。从AI的人脸识别能力超越人类以来,学术界和产业界的目光逐渐转向另一个更具科研意义和应用价值的课题——行人重识别(Person Re-identification,ReID)。
近日,依图科技在ReID领域取得新突破,刷新业界三大权威数据集当前最优成绩(SOTA),算法性能达到业界迄今最高标准,极大拓展了算法和应用的边界。
注:YITU算法结果在不利用时空信息,不进行重排再优化(Re-ranking),等限制下取得
还记得2018年底依图进军智能语音,随即在中文语音识别领域创下识别精度的新纪录。2019年5月推出全球首颗云端视觉AI芯片,而且“发布即商用”。似乎无论进入哪个技术领域,依图都能快速将行业整体水平推至新的高点,并加速技术的产业化落地。
这背后的关键是什么?
在交通运输、工业制造和城市规划等实际场景下,99%的图像都是不含人脸或人脸部分是极其模糊的,仅有几个像素大小,这时候人脸识别的作用较为有限。
行人重识别(ReID,也称“行人再识别”),是指在多摄像设备网络下对行人进行检索,利用步态动作、身体特征等更为全面的信息来识别人物,无论单独使用还是与人脸识别相结合,都能发挥更大的应用价值。
除了智能零售、智慧交通、智能城市等经常提及的应用场景,ReID技术的应用也将使日常生活更加便捷:游乐园更易寻找走失儿童、宠物/家庭机器人可以凭背影准确识别主人或顾客并提供相应服务。
然而,由于ReID需要从不同摄像机拍摄的图像或视频中找出同一个人物,而这些摄像机所覆盖的范围彼此并不重叠,导致缺乏连贯的信息,而且不同画面中人物的姿态、行为甚至外观(比如: 正身、侧身、背身)会发生较大变化,不同时间、场景的光照、背景和遮挡物各不相同(背景中常还有体型、衣着相似的其他人物干扰),摄像机的分辨率也有高有低,人物在画面中出现的位置有远有进, 这些都对ReID技术提出了极大的挑战。
依图科技凭借自身工程与研发实力,深度优化了ReID算法框架,显著提升了算法效率,通过结合AutoML等前沿技术,进一步创新性地实现了模型参数的自动搜索与迭代,突破了依赖算法研究员手工设计与调优的传统算法开发流程,在降低人力成本的同时,使得算法的泛化性能更强。
此次依图自研算法在业界最具影响力的三大ReID数据集Market1501、DukeMTMC-ReID、CUHK03上,将衡量算法性能的两大关键指标“首位命中率”(Rank- 1 Accuracy)及“平均精度均值”(Mean Average Precision,mAP)6项数据全部提升,充分显示了依图的技术实力,进一步稳固了中国技术团队在该任务下领跑地位。
需要指出,首位命中率高,只意味着算法能够在众多图像中准确找出最容易识别或者说匹配的那张,并不能反应模型的真实能力,尤其是应对复杂场景的表现。
因此,评价ReID算法性能时需要结合mAP值,它反映的是系统的综合检索性能。mAP值越高,说明系统的实用性越好,既能查得全也能查得准,能够较好地应对多遮挡、光线暗、画面模糊等情况。
面对又一项业界纪录,依图团队却十分平静。依图研发人员表示,这次刷榜只是一次尝试,依图在工业界实战落地的ReID项目,其规模与问题的复杂程度已经远超三大数据集,可以说,学术界现有ReID基准已经无法体现工业界算法的最高水平。
举个例子, Market-1501在清华大学内采集,行人(ID)基本上是穿短袖、短裤和裙装的亚洲人,DukeMTMC-reID在杜克大学内采集,ID主要是身着冬季服饰的欧美人, 这些在特定场景, 特定时间段采集的数据往往与真实世界中的图像分布不一致。在真实场景下ReID算法需要做到在跨时间段, 跨场景, 跨不同成像质量的图像采集设备下进行高精度的快速识别. 其数据分布远远与问题复杂程度远远大于现有的学术数据集。
这些现实因素导致了现有ReID学术界数据集无法有效模拟或者还原实际真实情况。因此,基于现有ReID数据集的基准具有很大的局限性。依图研究人员表示,业界需要更好的ReID数据集,也需要更全面的算法衡量数据集,至少对于商业化落地的算法是如此。
实战场景下的ReID任务,不仅对算法提出更高要求,也需要更高效的芯片提供强大的算力支持,二者缺少任意一个,都会影响ReID的实际应用价值。目前看来,依图是当下同时具备算法和算力能力的公司。依图在2017年投入云端AI芯片QuestCore™(求索)的研发,并于2019年5月“发布即商用”。QuestCore™是全球首颗云端视觉AI芯片,提供强大算力,单路摄像头功耗不到1W。
在ReID实战应用中,依图研发人员针对本次提出的算法做了进一步优化, 依托依图自研AI芯片, 在仅凭穿着、体态特征的条件下,已能将ReID做到2017年~2018年人脸识别的精度。这不仅加速了ReID的大规模商业化落地,更解锁了新的应用场景。
2017年,以苹果FaceID为代表的人脸识别商业化应用开始在全球范围内普及。如今,刷脸支付、刷脸乘车已经渗透到我们的日常生活。有理由相信,世界级的ReID算法,加上自研AI芯片, 业界期待的下一个计算机视觉领域“杀手级应用”已经到来。
雷锋网雷锋网
雷峰网版权文章,未经授权禁止转载。详情见转载须知。