0
近日,创新奇智凭借突破性的单目标跟踪算法,在通用单目标跟踪测评数据集GOT-10k(Generic Object Tracking Benchmark)上,以绝对优势获得冠军。
GOT-10K数据集由中科院发布,包括超过10000条取材于真实世界的视频片段和560多个类别,超过150万个手动标记框,具备场景丰富、算法挑战难度高等特点。
创新奇智夺冠的单目标跟踪算法,具有较强的鲁棒性,有效克服了人或物在运动中各种复杂因素的干扰。目前,该算法已成为创新奇智MatrixVision视频智能平台上的重要算法资产,正在工业安全生产和公共服务等领域发挥作用。
来源于:http://got-10k.aitestunion.com/leaderboard
GOT-10K数据集由中国科学院自动化研究所CASIA的智能系统与工程研究中心发布并维护,是具有国际权威的通用单目标跟踪算法评测数据集。其中训练集由10000个视频序列组成,全部取材于现实世界里移动的物体,包含563个目标类别与87种运动模式。物体的边界框全部是手动标记,总计超过150万个。
测试集由180个视频序列组成,包含84类移动物体和32种运动模式,且训练视频与测试视频之间所有的对象不重叠。
GOT-10K数据集是以WordNet英文词汇数据库作为骨架搭建起来的,分为5个大类:动物(Animal)、人造物体(Artifact)、人物(Person)、自然物体(Natural Object),以及Part。在这个大类别之下再细分成563个类别,不过这只是其中一个标签,另外一个标签是动作类别,共有87种运动模式,极具挑战性,吸引了海内外广大学者和知名学术机构参与。
目标跟踪算法是为模拟人眼在目标运动估计和跟踪方面的能力,给定一个目标的初始位置,然后跟踪算法会负责输出后续帧中该物体的位置。同时,算法要克服物体在运动中存在的诸如运动模糊、运动遮挡、外观变化、光照变化、背景相似干扰等因素的影响,才能获得好的算法性能。
创新奇智跟踪算法能够有效地解决上述问题,还具备超强的鲁棒性。该算法以DIMP算法为骨干,首先使用孪生网络来同时提取训练数据集和测试图像的特征,然后加入一个模型优化器,再加入背景信息对初始帧得到的卷积层进行权重优化,然后使用自研的损失函数能够解决正负样本不均衡的问题,同时让优化网络能够有效地提取前景和背景的特征,做出具备鲁棒性的判断。
DIMP网络
目标跟踪任务是计算机视觉领域的重要任务,广泛使用在智能视频监控、工业视觉的安全生产等领域。该先进算法已经收录在创新奇智MatrixVision视频智能平台上面。该平台预先内置图像分类、物体检测、图像分割、目标跟踪等多种算法,可以快速灵活得整合外部软硬件,让交付变得更轻,同时让各个功能算法更好地适配到各个硬件平台上面。目前,MatrixVision已经支持智慧工地,智慧园区,明厨亮灶,智慧油站,智慧防疫,智慧电梯等6大边缘场景,提供车辆车牌识别追踪、明火烟雾检测、行人识别追踪、安全服帽检测等多种检测任务。
明厨亮灶功能应用
智慧电梯功能应用
雷锋网雷锋网
雷峰网版权文章,未经授权禁止转载。详情见转载须知。