learnAI 发表于 2018-8-27 17:40:12

Kaggle机器学习入门赛之出租车费用预测,练手的机会来了...

1. 比赛背景介绍在谷歌与Coursera(Coursera是大型公开的在线课程项目,由美国两名计算机科学教授创办)合作举办的机器学习竞赛中,你的任务是预测纽约市出租车的费用。虽然可以根据两个点之间的距离得到一个基本的估计值,但是这将导致5- 8美元的RMSE(均方根误差),至于误差会是多少这取决于所使用的机器学习模型。挑战在于使用机器学习技术做得比这更好!2. 比赛时间轴2018年9月25日-最终提交截止日期。3. 数据集介绍属性列介绍:http://p99.pstatp.com/large/pgc-image/1535353262592bffe52d1fd

图3-1属性介绍样例展示:(从左往右列名依次为:Key、fare_amount、pickup_datetime、pickup_longitude、pickup_latitude、dropoff_longitude、dropoff_latitude、passenger_count)http://p3.pstatp.com/large/pgc-image/15353532618783e495470db

图3-2 训练集展示(从左往右列名依次为:Key、pickup_datetime、pickup_longitude、pickup_latitude、dropoff_longitude、dropoff_latitude、passenger_count)http://p99.pstatp.com/large/pgc-image/1535353261980f41ee4a556

图3-3 测试集展示4. 结果评价方法通过计算预测收费与真实收费的RMSE(均方根误差)来计算误差,RMSE公式如下:http://p99.pstatp.com/large/pgc-image/15353532621080aa868251e

图4-1 n=预测集样本数,obs代表真实值,model代表预测值预测值与真实值偏离越大,则最后得出的RMSE越大。5. 参加kaggle机器学习竞赛http://p3.pstatp.com/large/pgc-image/1535353262220fa14477221

图5-1kaggle官网页面(https://www.kaggle.com/)http://p99.pstatp.com/large/pgc-image/15353532623381dd184546d

图5-2比赛页面http://p3.pstatp.com/large/pgc-image/1535353262484840609a0eb

图5-3 New York City Taxi Fare Prediction竞赛页面(https://www.kaggle.com/c/new-york-city-taxi-fare-prediction)

污妖王 发表于 2018-9-10 08:16:03

回归预测的好比赛,值得探索

学海无涯赶快跑 发表于 2018-10-10 08:28:25

慢慢来吧~
页: [1]
查看完整版本: Kaggle机器学习入门赛之出租车费用预测,练手的机会来了...