机器学习：原理、算法与Python实战（微课视频版）

定　价：¥59.90

作　者：	姚捃，刘华春，侯向宁著
出版社：	清华大学出版社
丛编项：
标　签：	暂缺

购买这本书可以去

京东 (¥52.90)

ISBN：	9787302616603	出版时间：	2022-09-01	包装：	平装
开本：	16开	页数：		字数：

内容简介

　　本书以Python为开发语言，采用理论与实践相结合的形式，系统全面地介绍了机器学习涉及的核心知识。本书共6章，其中第1章介绍机器学习的基础知识，包括机器学习的概念、分类、研究范围、开发环境等，介绍第一个机器学习案例；第2、3章介绍机器学习的主要方法：监督学习与无监督学习，涉及目前机器学习最为流行的经典算法和模型，如KNN、朴素贝叶斯、决策树、线性回归、逻辑回归、SVM、神经网络、PCA降维、KMeans，每个算法模型都配有代码及可视化演示，让读者能更直观形象地理解机器学习；第4章介绍机器学习非常重要的数据处理方法：特征工程，特征工程能进一步提高机器学习算法的性能；第5章介绍机器学习模型的评估与优化，通过评估判断模型优劣，评估后利用优化方法使其达到生产需求；第6章介绍机器学习的应用案例，让读者更直观地感受机器学习在生产生活中的实际用途。本书附有配套教学课件、源代码、习题，供读者实践，旨在通过边学边练的方式，巩固所学知识，提升开发能力。本书可作为高等学校计算机相关专业的教材，也可作为机器学习工程技术人员的参考用书。

作者简介

暂缺《机器学习：原理、算法与Python实战（微课视频版）》作者简介

图书目录

随书资源

第1章机器学习基础

1.1机器学习

1.1.1什么是机器学习

1.1.2从数据中学习

1.1.3机器学习能够解决的问题

1.2机器学习的分类

1.2.1学习方式

1.2.2算法的分类

1.3机器学习的范围

1.4编程语言与开发环境

1.4.1选择Python的原因

1.4.2安装开发环境

1.4.3Scikitlearn

1.5第一个机器学习应用：鸢尾花分类

1.5.1特征数据与标签数据

1.5.2训练数据与测试数据

1.5.3构建机器学习模型

1.5.4预测与评估

1.6本章小结

习题

第2章监督学习

2.1监督学习概念与术语

2.1.1监督学习工作原理

2.1.2分类与回归

2.1.3泛化

2.1.4欠拟合

2.1.5过拟合

2.1.6不收敛

2.2K近邻算法

2.2.1K近邻分类

2.2.2K近邻回归

2.3朴素贝叶斯

2.3.1贝叶斯定理

2.3.2朴素贝叶斯算法步骤

2.3.3在Scikitlearn中使用贝叶斯分类

2.4决策树

2.4.1决策树的基本思想

2.4.2决策树学习算法

2.4.3构造决策树

2.4.4决策树的优化与可视化

2.4.5决策树回归

2.5线性模型

2.5.1线性回归

2.5.2岭回归与Lasso回归

2.5.3多项式回归

2.5.4线性分类模型

2.6逻辑回归

2.6.1逻辑回归模型介绍

2.6.2逻辑回归算法实现

2.7支持向量机

2.7.1支持向量

2.7.2线性SVM分类

2.7.3核技巧

2.7.4SVM回归

2.7.5Scikitlearn SVM参数

2.8集成学习方法

2.8.1集成学习

2.8.2Bagging和Pasting

2.8.3随机森林

2.8.4提升法

2.9人工神经网络

2.9.1从生物神经元到人工神经元

2.9.2感知器学习

2.9.3神经网络的训练过程

2.9.4神经网络应用案例

2.10分类器的不确定度估计

2.10.1决策函数

2.10.2预测概率

2.11本章小结

习题

第3章无监督学习与数据预处理

3.1无监督学习

3.1.1无监督学习的类型

3.1.2无监督学习的挑战

3.2数据预处理

3.2.1数据清洗

3.2.2数据变换

3.2.3数据集成

3.2.4数据规约

3.3降维

3.3.1数据压缩

3.3.2数据可视化

3.3.3降维的主要方法

3.3.4PCA

3.3.5利用PCA实现半导体制造数据降维

3.4聚类

3.4.1KMeans聚类

3.4.2均值偏移聚类

3.4.3DBSCAN

3.4.4高斯混合模型的期望最大化(EM)聚类

3.4.5层次聚类

3.5本章小结

习题

第4章特征工程

4.1特征理解

4.2特征增强

4.2.1EDA

4.2.2处理数据缺失

4.2.3标准化和归一化

4.3特征构建

4.3.1特征构建的基础操作

4.3.2特征构建的数值变量扩展

4.3.3文本变量处理

4.4特征选择

4.4.1单变量特征选择

4.4.2模型特征选择

4.4.3迭代特征选择

4.5特征转换

4.5.1PCA

4.5.2LDA

4.6特征学习

4.6.1数据的参数假设

4.6.2受限玻尔兹曼机(RBM)

4.6.3词嵌入

4.7本章小结

习题

第5章模型评估与优化

5.1算法链与管道

5.1.1用管道方法简化工作流

5.1.2通用的管道接口

5.2交叉验证

5.2.1K折交叉验证

5.2.2分层K折交叉验证

5.3模型评价指标

5.3.1误分类的不同影响

5.3.2混淆矩阵

5.3.3分类的不确定性

5.3.4准确率召回率曲线

5.3.5受试者工作特征（ROC）与AUC

5.3.6多分类指标

5.3.7回归指标

5.3.8在模型选择中使用评估指标

5.4处理类的不平衡问题

5.4.1类别不平衡问题

5.4.2解决类别不平衡问题

5.5网格搜索优化模型

5.5.1简单网格搜索选择超参数

5.5.2验证集用于选择超参数

5.5.3带交叉验证的网格搜索

5.6本章小结

习题

第6章机器学习应用案例

6.1电影推荐系统

6.1.1推荐系统基础

6.1.2推荐引擎算法

6.1.3相似度指标

6.1.4电影推荐系统实战

6.2情感分析系统

6.2.1情感分析概述

6.2.2导入数据集

6.2.3词袋模型

6.2.4TFIDF

6.2.5数据预处理

6.2.6训练模型

6.2.7模型评估及调优

6.3房价预测系统

6.3.1案例背景

6.3.2数据处理及可视化分析

6.3.3训练模型

6.3.4模型评估

6.3.5模型调优

6.4人脸识别

6.4.1概述

6.4.2加载数据集

6.4.3训练模型

6.4.4测试模型

6.4.5PCA主成分分析

6.4.6模型调优

6.5本章小结

习题