易学智能

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1931|回复: 0

[机器学习] 机器学习的案例分析

[复制链接]

665

主题

1234

帖子

6567

积分

xdtech

Rank: 5Rank: 5

积分
6567
发表于 2020-3-17 10:37:14 | 显示全部楼层 |阅读模式
https://mp.weixin.qq.com/s/93EuF5cU4NPMD2QCGDWtuw

完整的端到端的机器学习流程(附代码和数据)|比赛、工程都可以用!

项目目标:
  • 使用提供的建筑能源数据开发一个模型,该模型可以预测建筑物的能源之星得分
  • 然后解释结果以找到最能预测得分的变量。
项目介绍:

这是一个受监督的回归机器学习任务:给定一组包含目标(在本例中为分数)的数据,我们希望训练一个可以学习将特征(也称为解释变量)映射到目标的模型。

  • 受监督问题:我们可以知道数据的特征和目标,我们的目标是训练可以学习两者之间映射关系的模型。
  • 回归问题:Energy Star Score是一个连续变量。

在训练中,我们希望模型能够学习特征和分数之间的关系,因此我们给出了特征和答案。然后,为了测试模型的学习效果,我们在一个从未见过答案的测试集上进行评估

我们在拿到一个机器学习问题之后,要做的第一件事就是制作出我们的机器学习项目清单。下面给出了一个可供参考的机器学习项目清单,它应该适用于大多数机器学习项目,虽然确切的实现细节可能有所不同,但机器学习项目的一般结构保持相对稳定:

  • 数据清理和格式化

  • 探索性数据分析

  • 特征工程和特征选择

  • 基于性能指标比较几种机器学习模型

  • 对最佳模型执行超参数调整

  • 在测试集上评估最佳模型

  • 解释模型结果

  • 得出结论


提前设置机器学习管道结构让我们看到每一步是如何流入另一步的。但是,机器学习管道是一个迭代过程,因此我们并不总是以线性方式遵循这些步骤。我们可能会根据管道下游的结果重新审视上一步。例如,

  • 虽然我们可以在构建任何模型之前执行特征选择,但我们可以使用建模结果返回并选择一组不同的特征。
  • 或者,建模可能会出现意想不到的结果,这意味着我们希望从另一个角度探索我们的数据。
  • 一般来说,你必须完成一步才能继续下一步,但不要觉得一旦你第一次完成一步,你就不能回头做出改进!你可以在任何时候返回前面的步骤并作出相应的修改。


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|易学智能

GMT+8, 2024-4-20 08:33 , Processed in 0.018728 second(s), 20 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表