本帖最后由 shaoheshaohe 于 2020-3-10 14:38 编辑
专栏 | 基于 Jupyter 的特征工程手册:数据预处理(一)https://mp.weixin.qq.com/s?__biz=MzIwOTc2MTUyMg==&mid=2247496583&idx=3&sn=1313d3f3910a309ec6fa562265b979aa&chksm=976c561aa01bdf0c16f8556d7c6c253c006a85e7cf7959b61fdf224c1823b3fda38a7df352ee&scene=21#wechat_redirect
特征工程在机器学习中的重要性不言而喻,恰当的特征工程能显著提升机器学习模型性能。我们在 Github 上整理编写了一份系统的特征工程教程,供大家参考学习。
项目地址: https://github.com/YC-Coder-Chen/feature-engineering-handbook
本文将探讨数据预处理部分:介绍了如何利用 scikit-learn 处理静态的连续变量,利用 Category Encoders 处理静态的类别变量以及利用 Featuretools 处理常见的时间序列变量。
目录
特征工程的数据预处理我们将分为三大部分来介绍:
|