本书的读者不需要具有高等数学的深厚知识,也不需要有机器学习或者人工智能(AI)的基础,只需具备Python语言的基础知识和简单了解过NumPy、Pandas等科学基础库,就可以轻松阅读并掌握。另外,高等院校和培训机构也可以将此书作为机器学习入门教材使用。
为了避免机器学习背后的复杂数学原理以及异常复杂的算法证明和推导吓退一大批初学者,本书遵循“极简入门”的理念,通过通俗易懂的语言,丰富的图示和经典的案例,有效地降低了学习的门槛,让广大机器学习爱好者轻松入门机器学习。
本书共分11章,覆盖的主要内容有机器学习概述、数据预处理、K最近邻算法、回归算法、决策树、K-means聚类算法、随机森林、朴素贝叶斯算法、支持向量机SVM、神经网络(卷积神经网络、Keras深度学习框架)和人脸识别入门等。从最简单的常识来切入AI领域,打造无缝平滑的学习体验。
目 录
第1章 机器学习概述 1
1.1 什么是机器学习 1
1.2 机器学习的流程 3
1.2.1 数据收集 3
1.2.2 数据预处理 3
1.2.3 特征工程 4
1.2.4 模型构建和训练 4
1.3 机器学习该如何学 5
1.3.1 AI时代首选Python 5
1.3.2 PyCharm可视化编辑器和Anaconda大礼包 7
1.3.3 掌握算法原理与掌握机器学习软件库同等重要 13
1.3.4 机器学习与深度学习的区别 13
1.4 机器学习分类 15
1.4.1 监督学习 15
1.4.2 无监督学习 16
1.4.3 强化学习 16
1.5 过拟合和欠拟合 17
1.5.1 过拟合 18
1.5.2 欠拟合 18
1.6 衡量机器学习模型的指标 19
1.6.1 正确率、精确率和召回率 19
1.6.2 F1 score和ROC曲线 21
第2章 机器学习中的数据预处理 24
2.1 数据预处理的重要性和原则 24
2.2 数据预处理方法介绍 25
2.2.1 数据预处理案例——标准化、归一化、二值化 25
2.2.2 数据预处理案例——缺失值补全、标签化 26
2.2.3 数据预处理案例——独热编码 28
2.2.4 通过数据预处理提高模型准确率 29
2.3 数据降维 31
2.3.1 什么叫数据降维 31
2.3.2 PCA主成分分析原理 31
2.3.3 PCA主成分分析实战案例 33
第3章 k最近邻算法 36
3.1 K最近邻算法的原理 36
3.2 K最近邻算法过程详解 37
3.3 KNN算法的注意事项 39
3.3.1 k近邻的k值该如何选取 39
3.3.2 距离的度量 39
3.3.3 特征归一化的必要性 41
3.4 K最近邻算法案例分享 42
3.4.1 电影分类kNN算法实战 42
3.4.2 使用scikit-learn机器学习库内置的kNN算法实现水果识别器 44
3.5 KNN算法优缺点 47
第4章 回归算法 49
4.1 线性回归 49
4.1.1 什么是线性回归 49
4.1.2 最小二乘法 51
4.1.3 梯度下降法 52
4.2 线性回归案例实战 57
4.2.1 房价预测线性回归模型案例一 57
4.2.2 房价预测线性回归模型案例二 60
4.3 逻辑回归 62
4.3.1 逻辑回归概念和原理 62
4.3.2 逻辑回归案例实战 64
4.4 回归算法总结和优缺点 65
第5章 决策树 66
5.1 决策树概念 66
5.2 信息熵 68
5.3 信息增益与信息增益比 69
5.4 基尼系数 70
5.5 过拟合与剪枝 70
5.6 决策树算法案例实战——预测患者佩戴隐形眼镜类型 71
5.7 决策树算法实战案例——电影喜好预测 73
5.8 总结 77
第6章 K-means聚类算法 78
6.1 何为聚类 78
6.2 K-MEANS算法思想和原理 79
6.3 K-MEANS算法涉及的参数和优缺点 82
6.3.1 K-means涉及参数 82
6.3.2 K-means优缺点 84
6.4 K-MEANS应用场景 84
6.5 K-MEANS聚类算法实现鸢尾花数据的聚类 85
6.6 K-MEANS算法实现客户价值分析 87
6.7 K-MEANS算法实现对亚洲足球队做聚类 90
第7章 随机森林 92
7.1 随机森林概述 92
7.1.1 什么是随机森林 92
7.1.2 随机森林的优缺点 93
7.2 随机森林实战——红酒数据集案例 94
7.3 随机森林算法实战——泰坦尼克号生存预测 97
第8章 朴素贝叶斯算法 101
8.1 朴素贝叶斯算法概念和原理 101
8.2 贝叶斯算法实战案例——曲奇饼 105
8.3 贝叶斯算法案例实战——单词拼写纠错 106
8.4 贝叶斯算法案例实战——识别中文垃圾邮件 109
8.5 贝叶斯算法案例实战——鸢尾花分类预测 112
第9章 支持向量机SVM 116
9.1 支持向量机概述 116
9.2 工作原理 119
9.2.1 线性分类 119
9.2.2 线性不可分 120
9.2.3 核函数 122
9.3 SVM的核函数选择和参数的调整 122
9.4 SVM算法案例实战——波士顿房价分析 124
9.5 SVM算法案例实战——鸢尾花分类 126
9.6 SVM算法优缺点 128
第10章 神经网络 130
10.1 神经网络概念 130
10.1.1 神经元 130
10.1.2 激活函数 132
10.1.3 神经网络 133
10.2 卷积神经网络(CNN) 135
10.2.1 计算机识别图像的过程 135
10.2.2 卷积神经网络详解 136
10.3 用PYTHON实现自己的神经网络案例 138
10.4 多层神经网络基于SKLEARN的实现案例 141
10.5 使用KERAS框架实现神经网络案例 145
10.5.1 Keras深度学习框架简介和安装 145
10.5.2 Keras实现多层感知器模型MLP 146
10.5.3 Keras实现卷积神经网络CNN 149
第11章 人脸识别入门实践 151
11.1 人脸识别简介 151
11.1.1 什么是人脸识别 151
11.1.2 人脸识别过程步骤 153
11.2 人脸检测和关键点定位实战 156
11.3 人脸表情分析——情绪识别实战 160
11.4 我能认识你——人脸识别实战 161
温馨提示:请使用石家庄市图书馆的读者帐号和密码进行登录