1.比赛背景介绍: 在这次比赛中,我们将使用一个具有挑战性的时间序列数据集,其中包括每日的销售数据,由1C公司--俄罗斯最大的软件公司之一提供。我们需要使用机器学习的方法来预测下个月每个产品和商店的总销售额。通过参与这个竞赛,你将能够提高将机器学习应用于数据科学领域的能力。 2. 数据介绍 该机器学习比赛数据集包括以下2个csv数据文件: sales_train.csv-2013年1月至2015年10月每日历史数据。 test.csv-你需要预测这些店铺和产品在2015年11月的销售情况。 数据的属性分为6行:
图2-1属性展示 训练集测试集样例展示:
图2-2训练集样例展示
图2-3测试集样例展示 3.结果评价方法: 提交通过均方根误差(RMSE)来评估。 RMSE公式如下:
图3-1 n=预测的总个数,obs代表真实值,model代表预测值 4.参加kaggle机器学习竞赛
图4-2比赛页面
图4-3 Predict Future Sales机器学习比赛页面 https://www.kaggle.com/c/competitive-data-science-predict-future-sales
|