易学智能

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 2489|回复: 2

Kaggle机器学习入门赛之出租车费用预测,练手的机会来了...

[复制链接]

2

主题

3

帖子

14

积分

新手上路

Rank: 1

积分
14
发表于 2018-8-27 17:40:12 | 显示全部楼层 |阅读模式
1. 比赛背景介绍
在谷歌与Coursera(Coursera是大型公开的在线课程项目,由美国两名计算机科学教授创办)合作举办的机器学习竞赛中,你的任务是预测纽约市出租车的费用。
虽然可以根据两个点之间的距离得到一个基本的估计值,但是这将导致5- 8美元的RMSE(均方根误差),至于误差会是多少这取决于所使用的机器学习模型。挑战在于使用机器学习技术做得比这更好!
2. 比赛时间轴
2018年9月25日-最终提交截止日期。
3. 数据集介绍
属性列介绍:


图3-1属性介绍
样例展示:
(从左往右列名依次为:Key、fare_amount、pickup_datetime、pickup_longitude、pickup_latitude、dropoff_longitude、dropoff_latitude、passenger_count)


图3-2 训练集展示
(从左往右列名依次为:Key、pickup_datetime、pickup_longitude、pickup_latitude、dropoff_longitude、dropoff_latitude、passenger_count)


图3-3 测试集展示
4. 结果评价方法
通过计算预测收费与真实收费的RMSE(均方根误差)来计算误差,RMSE公式如下:


图4-1 n=预测集样本数,obs代表真实值,model代表预测值
预测值与真实值偏离越大,则最后得出的RMSE越大。
5. 参加kaggle机器学习竞赛


图5-1kaggle官网页面(https://www.kaggle.com/


图5-2比赛页面


图5-3 New York City Taxi Fare Prediction竞赛页面

回复

使用道具 举报

10

主题

82

帖子

200

积分

中级会员

Rank: 3Rank: 3

积分
200
发表于 2018-9-10 08:16:03 | 显示全部楼层
回归预测的好比赛,值得探索
回复

使用道具 举报

2

主题

25

帖子

69

积分

注册会员

Rank: 2

积分
69
发表于 2018-10-10 08:28:25 | 显示全部楼层
慢慢来吧~
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|易学智能

GMT+8, 2024-5-20 02:45 , Processed in 0.017779 second(s), 20 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表