admin 发表于 2018-8-26 13:53:11

Kaggle机器学习挑战赛之船只检测,奖金诱人就等你来

1. 比赛背景介绍Airbus(中文为空中客车公司,它是欧洲一家民航飞机制造公司)近日向Kaggle机器学习社区求助,希望通过kaggle发动机器学习爱好者建立一个能够在卫星图像中检测所有船只的机器学习模型。你能在有云或雾霾的图像中找到它们吗?航运交通正在快速地增长。越来越多的船只 增加了海上违法事件发生的可能性。这些事件包括船只事故导致的环境破坏、海盗、非法捕鱼、贩毒和非法货物运输等。这迫使从环境保护机构到保险公司和国家政府当局的许多组织对公海进行更密切的监视。Airbus通过建立一个有效的解决方案来提供全面的海事监控服务。该方案覆盖面广泛,可以获取详细的信息以及进行密集地监控。他们将其拥有的数据与训练有素的分析师结合在一起,帮助航运业增长知识、预测威胁、触发警报和提高航运效率。在过去的10年里,Airbus在从卫星图像中自动提取目标方面做了大量的工作,取得了显著的进步,但没有达到可实际运行的效果。通过机器学习构建相应模型,很可能会显著提高船舶自动识别的速度和准确率,于是Airbus在机器学习高手汇集的kaggle机器学习社区发起了这场竞赛。2. 奖池介绍http://p3.pstatp.com/large/pgc-image/1535204015136c294f32206

3. 比赛时间轴:2018年9月27日--报名截止日期。为了参加比赛,你必须在此日期之前报名并同意比赛规则。2018年9月27日--团队合并截止日期。这是参与者可以加入或合并团队的最后一天。2018年10月4日--最终提交截止日期。2018年10月18日--最快算法奖的最终提交截止日期。2018年11月22日--宣布最快算法奖得主。4.数据集介绍4.1数据背景在这个机器学习比赛中,我们需要在图像中定位船只,并且在定位的船只周围放置一个对齐的标记框。在训练集与测试集中许多图像不包含船只,而那些包含船只的图像中可能包含多个船只。在训练集和测试集中都有一小部分的图像,当船在一起的时候物体部分有轻微的重叠。可以通过设置他们的背景编码删除重叠部分。这就导致一个具有真实标签的图像的边界框,其中一些边缘像素可能会被移除。这些小的调整将对计分产生极小的影响,因为计分是在增加重叠阈值的基础上进行评估的。4.2数据http://p9.pstatp.com/large/pgc-image/153520359156403e4e67af1

图4-1训练集样例http://p3.pstatp.com/large/pgc-image/153520441589397bde88178

图4-2 测试集样例5.结果评价方法本次机器学习比赛的评分标准是在不同交并比(IoU)阈值上的F2分数。IoU计算公式为:http://p3.pstatp.com/large/pgc-image/1535203590811d4d248f2f4

评价时会遍历一系列的IoU阈值,在每个点计算平均精度值。阈值范围从0.5到0.95,步长为0.05:(0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.95)。换句话说,在0.5的阈值下,如果预测对象与真实对象的交集大于0.5,则被认为是"准确"的。在每个阈值t上,F2评分值是根据预测对象与所有真实对象的比较产生的true positives (TP), false negatives (FN), and false positives (FP) 计算出来的。以下方程等价于F2得分(当β设置为2):http://p99.pstatp.com/large/pgc-image/1535203590911b75ae69f92

当一个船只预测结果与一个正确的标记匹配时,如果该对象的IoU超过阈值则TP的值加1,FN表示预测错误的数量。FP表示没有被预测到的数量。然后将单个图像的平均F2分数计算为每个IoU阈值下的上述F2分值的平均值(thresholds为阈值数目):http://p9.pstatp.com/large/pgc-image/15352035909810d5738b85d

最后,竞赛评价结果返回的分数是测试数据集中每个图像的平均F2分数的平均值。6.参加kaggle机器学习竞赛http://p9.pstatp.com/large/pgc-image/15352035911543a2aafae6d

图6-1 kaggle官网页面https://www.kaggle.comhttp://p3.pstatp.com/large/pgc-image/1535203591245f8007dc03b

图6-2比赛页面http://p3.pstatp.com/large/pgc-image/1535203591406f094424179

图6-3 Airbus Ship Detection竞赛页面https://www.kaggle.com/c/airbus-ship-detection

I_Like_AI 发表于 2018-9-10 08:21:54

图像比赛,奖金诱人,可惜我不熟悉计算机视觉:'(

马猴烧酒 发表于 2018-9-12 08:48:48

我觉得可以从评价得分函数下手, 是注重精确度,还是准确率更高些,有针对性的调参

深度大佬进修 发表于 2018-9-14 08:49:15

这个数据集怎么看,有点看不懂他给的csv,那些参数都是啥意思也没说

马猴烧酒 发表于 2018-9-15 09:24:30

深度大佬进修 发表于 2018-9-14 08:49
这个数据集怎么看,有点看不懂他给的csv,那些参数都是啥意思也没说

这个得去官网去看吧,锻炼你的英语的时候到了:)

天使与魔鬼 发表于 2018-10-8 15:54:08

发现一个有趣的比赛

学海无涯赶快跑 发表于 2018-10-10 08:27:51

不说了,我要去比赛了!
页: [1]
查看完整版本: Kaggle机器学习挑战赛之船只检测,奖金诱人就等你来