背景介绍
近年来,机器学习在图像识别、语音识别等领域取得了重大进步,但在视频内容理解领域仍有许多问题需要探索。字节跳动公司旗下的TikTok(抖音海外版)短视频APP在全球范围内的用户中获得非常多的好评,短视频的内容理解与推荐技术成为了我们关注的焦点。
一图胜千言,仅一张图片就包含大量信息,难以用几个词来描述,更何况是短视频这种富媒体形态。面对短视频内容理解的难题,字节跳动作为一家拥有海量短视频素材和上亿级用户行为数据的公司,通过视频内容特征和用户行为数据,可以有充足的数据来预测用户对短视频的喜好。
本次竞赛提供多模态的短视频内容特征,包括视觉特征、文本特征和音频特征,同时提供了脱敏后的用户点击、喜爱、关注等交互行为数据。参赛者需要通过一个视频及用户交互行为数据集对用户兴趣进行建模,然后预测该用户在另一视频数据集上的点击行为,这两个数据集的视频ID交集为空。
竞赛最终根据参赛者提交的模型和预测结果,依据评分进行排名,具体见评估准则。
竞赛任务
通过构建深度学习模型,预测测试数据中每个用户id在对应作品id上是否浏览完作品和是否对作品点赞的概率加权结果。 本次比赛使用 AUC(ROC曲线下面积)作为评估指标。AUC 越高,代表结果越优,排名越靠前。
赛道1 大规模数据集,亿级别的数据信息。
赛道2 小规模数据集,百万级别的数据信息。
两个赛道的区别是:赛道1提供大规模数据集,赛道2提供小规模数据集,请参赛者根据自己的计算资源选择性参赛。届时,将会有两个独立榜单进行排名。两个赛道的竞赛本质相同。
时间线
2019年1月10日:比赛上线,开放参赛选手注册 2019年1月30日:发布完毕训练集(包括验证集)和baseline方法代码 2019年2月11日:发布测试集,开放测试集结果提交入口 2019年4月1日:参赛报名截止 2019年4月7日:测试集结果提交截止,计算排名 2019年4月22日:公布最终排名,胜出赛队需要提交参赛方法说明 *以上时间均为 23:59p.m UTC
奖励
本次竞赛总奖金为20,000美元。
赛道1 - 第一名:7000美元 - 第二名:4000美元 - 第三名:3000美元
赛道2 - 第一名:3000美元 - 第二名:2000美元 - 第三名:1000美元
其他奖励
(1)各赛道最终排名排名前三的参赛队:荣誉证书+奖金 (2)各赛道榜单周冠军参赛队:周冠军证书/奖品 (3)各赛道最终排名前十的参赛队:荣誉证书+字节跳动直通面试机会
|