1. 比赛背景介绍 Airbus(中文为空中客车公司,它是欧洲一家民航飞机制造公司)近日向Kaggle机器学习社区求助,希望通过kaggle发动机器学习爱好者建立一个能够在卫星图像中检测所有船只的机器学习模型。你能在有云或雾霾的图像中找到它们吗? 航运交通正在快速地增长。越来越多的船只 增加了海上违法事件发生的可能性。这些事件包括船只事故导致的环境破坏、海盗、非法捕鱼、贩毒和非法货物运输等。这迫使从环境保护机构到保险公司和国家政府当局的许多组织对公海进行更密切的监视。 Airbus通过建立一个有效的解决方案来提供全面的海事监控服务。该方案覆盖面广泛,可以获取详细的信息以及进行密集地监控。他们将其拥有的数据与训练有素的分析师结合在一起,帮助航运业增长知识、预测威胁、触发警报和提高航运效率。 在过去的10年里,Airbus在从卫星图像中自动提取目标方面做了大量的工作,取得了显著的进步,但没有达到可实际运行的效果。通过机器学习构建相应模型,很可能会显著提高船舶自动识别的速度和准确率,于是Airbus在机器学习高手汇集的kaggle机器学习社区发起了这场竞赛。 2. 奖池介绍
3. 比赛时间轴: 2018年9月27日--报名截止日期。 为了参加比赛,你必须在此日期之前报名并同意比赛规则。 2018年9月27日--团队合并截止日期。 这是参与者可以加入或合并团队的最后一天。 2018年10月4日--最终提交截止日期。 2018年10月18日--最快算法奖的最终提交截止日期。 2018年11月22日--宣布最快算法奖得主。 4.数据集介绍 4.1数据背景 在这个机器学习比赛中,我们需要在图像中定位船只,并且在定位的船只周围放置一个对齐的标记框。在训练集与测试集中许多图像不包含船只,而那些包含船只的图像中可能包含多个船只。 在训练集和测试集中都有一小部分的图像,当船在一起的时候物体部分有轻微的重叠。可以通过设置他们的背景编码删除重叠部分。这就导致一个具有真实标签的图像的边界框,其中一些边缘像素可能会被移除。这些小的调整将对计分产生极小的影响,因为计分是在增加重叠阈值的基础上进行评估的。 4.2数据
图4-1训练集样例
图4-2 测试集样例 5.结果评价方法 本次机器学习比赛的评分标准是在不同交并比(IoU)阈值上的F2分数。IoU计算公式为:
评价时会遍历一系列的IoU阈值,在每个点计算平均精度值。阈值范围从0.5到0.95,步长为0.050.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.95)。换句话说,在0.5的阈值下,如果预测对象与真实对象的交集大于0.5,则被认为是"准确"的。 在每个阈值t上,F2评分值是根据预测对象与所有真实对象的比较产生的true positives (TP), false negatives (FN), and false positives (FP) 计算出来的。 以下方程等价于F2得分(当β设置为2):
当一个船只预测结果与一个正确的标记匹配时,如果该对象的IoU超过阈值则TP的值加1,FN表示预测错误的数量。FP表示没有被预测到的数量。然后将单个图像的平均F2分数计算为每个IoU阈值下的上述F2分值的平均值(thresholds为阈值数目):
最后,竞赛评价结果返回的分数是测试数据集中每个图像的平均F2分数的平均值。 6.参加kaggle机器学习竞赛
图6-1 kaggle官网页面 https://www.kaggle.com
图6-2比赛页面
图6-3 Airbus Ship Detection竞赛页面 https://www.kaggle.com/c/airbus-ship-detection
|