精通特征工程-Feature Engineering For Machine Learning-Books


机器学习的流程

简单而又奇妙的数值

文本数据: 扁平化,过滤和分块

特征缩放的效果:从词袋到tf-idf

分类变量:自动化时代的数据计数

数据降维:使用PCA 挤压数据

非线性特征话与k-均值模型堆叠

自动特征生成:图像特征提取和深度学习

回到特征:建立学术论文推荐器

附录A: 线性建模与线性代数基础