易学智能

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 2310|回复: 2

中科院发布了目标追踪数据集,1万多条视频,150万个边界...

[复制链接]

166

主题

616

帖子

1万

积分

xdtech

Rank: 5Rank: 5

积分
11777
发表于 2019-1-6 11:42:46 | 显示全部楼层 |阅读模式
中科院发布了一个目标追踪数据集,叫做Got-10k。很大,很精致。
它包含了超过10,000条视频,主角都是在现实世界里移动的物体,分成560多个类别
物体的边界框全部是手动标记,总计超过150万个
除此之外,数据集还是个Benchmark,可以用来衡量模型的性能,也已经有排行榜了。

官方还提供Python工具包,以便小伙伴们用这个Benchmark来测试自己的AI。
那么,来仔细观察一下数据集,吧。
事无巨细
除了规模大,Got-10k还有许多重要的特质。

通用类别 (Generic Classes)
数据集是以WordNet英文词汇数据库作为骨架,搭建起来的。分成5个大类:
动物 (Animal) 、人造物体 (Artifact) 、人物 (Person) 、然物体 (Natural Object) ,以及Part
大类之下再细分,一共563个类别

上面讲的是目标类别,只是数据的其中一个标签。
另一个标签是动作类别,一共分为87种。一部分按照WordNet来划分,还有一部分是数据收集者定义的。
单样本学习 (One-Shot Learning)
为了训练出的模型能有更强的泛化能力,训练集和测试集之间不存在交集。
模型可以用少量的数据去学习分类,这样也能避免测试结果偏向AI熟悉的那些样本类别。

统一训练数据 (Unified Training Data)
所有方法都用相同的训练数据。依靠这样的协议,来保障所有追踪器之间的公平对比。
额外标记 (Extra Labeling)
除了目标类别、动作类别和标记框之外,还有其他标签。
比如,目标可见比 (针对遮挡或者出画的情况) ,负责监督那些难度比较大的任务。

有效评估 (Efficient Evaluation)
测试集包含180段视频,分属于84个目标类别,32个动作类别,用来衡量模型的追踪能力。
万事俱备,只差你了
现在,完整的GOT-10k数据集已经可以下载了。

并且,评估服务器 (Evaluation Server) 准备好为各路模型打分了,排行榜也会实时更新。
温暖的官方为小伙伴们提供了Python工具包,用来运行实验,方便在Benchmark上评估性能。
另外,除了Python工具包,还有MATLAB工具包
你还不来么?

这样好像可以玩一天

回复

使用道具 举报

81

主题

162

帖子

493

积分

推广大使

积分
493
发表于 2019-1-11 15:15:46 | 显示全部楼层
国内的数据
越来越强了
实力的体现
回复

使用道具 举报

81

主题

162

帖子

493

积分

推广大使

积分
493
发表于 2019-1-11 15:16:06 | 显示全部楼层
哪天把这个数据
拿来
训练一个模型
估计是超强吧
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|易学智能

GMT+8, 2025-1-9 04:05 , Processed in 0.013301 second(s), 20 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表