注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书教育/教材/教辅教材研究生/本科/专科教材人工智能的数学基础

人工智能的数学基础

人工智能的数学基础

定 价:¥59.00

作 者: 冯朝路,于鲲,杨金柱,栗伟
出版社: 清华大学出版社
丛编项: 面向新工科专业建设计算机系列教材
标 签: 暂缺

购买这本书可以去


ISBN: 9787302603818 出版时间: 2022-09-01 包装:
开本: 16开 页数: 字数:  

内容简介

  本书详细介绍了人工智能领域涉及的数学基础,对于每个问题尽可能给出足够详尽的证明过程,以帮助读者深入理解智能算法的原理。本书内容涉及线性代数、高等数学、概率论、化等多个数学分支内的重要知识点。采用公式推导、图表示例、应用举例相结合的方式,以翔实的语言、全新的视角,帮助读者理解其中的关键知识点。 \n全书共分为10章: 第1章、第3章、第4章详细介绍与人工智能算法相关的向量与矩阵分析、函数与泛函分析、概率与数理统计的数学基础。第2章介绍可用于评定不同待观测样本相似程度的度量方法。第5章重点介绍人工智能领域涉及的信息论知识。第6章结合实例介绍线性分析与卷积的数学基础。第7章详细介绍与模型正则化及范数相关的数学基础知识。第8章介绍目标函数化相关数学知识。第9章重点介绍核函数映射相关内容。第10章介绍数据驱动人工智能模型性能评价与度量相关知识。 \n本书适合人工智能专业的学生、对人工智能感兴趣的学者、正在从事人工智能应用开发的工程师,以及其他想深入了解智能算法行之有效原因的读者参考阅读。 \n

作者简介

暂缺《人工智能的数学基础》作者简介

图书目录

第1章特征向量与矩阵分析1

\n

1.1标量1

\n

1.2特征向量与特征空间2

\n

1.2.1特征空间的正交性3

\n

1.2.2特征向量的大小与方向3

\n

1.3向量转置4

\n

1.4向量加法4

\n

1.5向量乘法5

\n

1.5.1向量数乘5

\n

1.5.2向量内积6

\n

1.5.3向量外积8

\n

1.5.4分量乘法8

\n

1.6向量的线性相关性9

\n

1.7矩阵分析与人工智能9

\n

1.8矩阵转置11

\n

1.9矩阵加法12

\n

1.10矩阵乘法13

\n

1.10.1矩阵数乘13

\n

1.10.2矩阵内积14

\n

1.10.3矩阵内积的外积展开15

\n

1.10.4元素乘法15

\n

1.11矩阵的特征值与特征向量16

\n

1.12矩阵的秩17

\n

1.12.1初等变换18

\n

1.12.2初等矩阵19

\n

1.13矩阵的逆19

\n

1.14矩阵的分块操作22

\n

1.15矩阵的迹24

\n

1.16矩阵分解26

\n

1.16.1LU分解26

\n

1.16.2特征分解27

\n

1.16.3奇异值分解29

\n

〖3〗人工智能的数学基础目录〖3〗1.17二次型与正定矩阵30

\n

1.18张量32

\n

小结32

\n

习题33

\n

参考文献34

\n

第2章相似性度量35

\n

2.1相似性度量的重要性35

\n

2.2相似性度量的多样性36

\n

2.3闵氏距离37

\n

2.3.1曼哈顿距离38

\n

2.3.2欧氏距离39

\n

2.3.3切比雪夫距离39

\n

2.3.4曼切转换39

\n

2.4马氏距离40

\n

2.4.1维度相关问题41

\n

2.4.2独立化处理41

\n

2.4.3与欧氏距离的关系42

\n

2.5余弦距离43

\n

2.5.1夹角余弦43

\n

2.5.2距离度量44

\n

2.6汉明距离44

\n

2.6.1严格定义44

\n

2.6.2松弛定义45

\n

2.7杰卡德距离45

\n

2.7.1严格定义45

\n

2.7.2松弛定义45

\n

2.8皮尔森距离46

\n

2.8.1相关系数46

\n

2.8.2距离度量47

\n

2.8.3局限性47

\n

2.9斯皮尔曼距离48

\n

2.9.1相关系数48

\n

2.9.2距离度量49

\n

2.10肯德尔距离50

\n

2.10.1相关系数50

\n

2.10.2距离度量51

\n

小结52

\n

习题52

\n

参考文献53

\n

第3章函数与泛函分析55

\n

3.1集合55

\n

3.1.1定义与表示56

\n

3.1.2元素特性56

\n

3.1.3集合运算57

\n

3.1.4凸集分离定理58

\n

3.2区间60

\n

3.2.1定义与表示60

\n

3.2.2元素特性61

\n

3.2.3区间算术61

\n

3.3函数映射62

\n

3.3.1自变量与因变量63

\n

3.3.2多元函数63

\n

3.3.3复合函数64

\n

3.3.4连续性、单调性、奇偶性65

\n

3.3.5函数凸性与极值66

\n

3.3.6激活函数68

\n

3.4导数69

\n

3.4.1函数可导与泰勒展开69

\n

3.4.2求导法则72

\n

3.4.3偏导数与雅可比矩阵73

\n

3.4.4方向导数与梯度76

\n

3.4.5Hessian矩阵与函数凸性77

\n

3.4.6凸函数成立条件78

\n

3.4.7散度79

\n

3.5微积分79

\n

3.5.1微分79

\n

3.5.2密切圆与曲率81

\n

3.5.3不定积分81

\n

3.5.4定积分82

\n

3.6泛函数分析83

\n

3.6.1基函数与函数内积84

\n

3.6.2特征值与特征函数84

\n

3.6.3线性空间与线性映射85

\n

3.6.4对偶空间与对偶基85

\n

3.6.5希尔伯特空间86

\n

小结87

\n

习题88

\n

参考文献89

\n

第4章条件概率与贝叶斯90

\n

4.1事件与概率90

\n

4.1.1随机试验90

\n

4.1.2样本空间90

\n

4.1.3随机事件91

\n

4.1.4概率91

\n

4.1.5条件概率92

\n

4.1.6事件独立性92

\n

4.1.7全概率93

\n

4.2随机变量及其概率分布93

\n

4.2.1随机变量93

\n

4.2.2概率分布94

\n

4.2.3独立同分布94

\n

4.3样本统计量95

\n

4.3.1均值95

\n

4.3.2样本方差96

\n

4.3.3期望96

\n

4.3.4概率方差97

\n

4.3.5协方差97

\n

4.3.6协方差矩阵98

\n

4.4常见的概率分布98

\n

4.4.1二项分布98

\n

4.4.2泊松分布99

\n

4.4.3指数分布与伽马分布99

\n

4.4.4贝塔分布100

\n

4.4.5高斯分布及其变形100

\n

4.4.6其他分布103

\n

4.5贝叶斯决策103

\n

4.5.1离散型贝叶斯公式103

\n

4.5.2连续型贝叶斯公式104

\n

4.5.3最小错误率贝叶斯决策105

\n

4.5.4最小风险贝叶斯决策107

\n

4.5.5朴素贝叶斯分类108

\n

4.6参数估计109

\n

4.6.1估计量与估计值109

\n

4.6.2点估计与区间估计109

\n

4.6.3置信区间与水平110

\n

4.6.4估计量的评价110

\n

4.6.5矩估计111

\n

4.6.6最小二乘估计112

\n

4.6.7最大似然估计112

\n

4.6.8最大后验概率估计114

\n

4.6.9贝叶斯估计与共轭分布114

\n

4.7假设检验116

\n

4.7.1原假设与备择假设116

\n

4.7.2弃真与取伪116

\n

4.7.3显著性水平与pvalue117

\n

4.7.4双侧检验与单侧检验118

\n

4.7.5代表性检验统计量与方法118

\n

小结118

\n

习题119

\n

参考文献120

\n

第5章信息论与熵121

\n

5.1人工智能与信息论121

\n

5.2特征编码122

\n

5.2.1直接编码122

\n

5.2.2Onehot编码123

\n

5.2.3Dummy编码123

\n

5.3压缩编码124

\n

5.3.1聚类124

\n

5.3.2特征降维124

\n

5.3.3特征选择125

\n

5.3.4稀疏编码126

\n

5.3.5压缩感知127

\n

5.4决策编码127

\n

5.4.1假设空间128

\n

5.4.2版本空间128

\n

5.4.3决策平面128

\n

5.4.4纠错输出码128

\n

5.5决策解码129

\n

5.5.1聚类129

\n

5.5.2线性分类130

\n

5.5.3纠错输出码130

\n

5.5.4特征降维130

\n

5.6自编码130

\n

5.6.1恒等变换130

\n

5.6.2欠完备自编码131

\n

5.6.3稀疏自编码131

\n

5.6.4收缩自编码器131

\n

5.7不确定性与熵132

\n

5.7.1定义与性质132

\n

5.7.2联合熵133

\n

5.7.3条件熵134

\n

5.7.4交叉熵与损失函数135

\n

5.7.5相对熵与KL散度136

\n

5.8互信息136

\n

5.8.1定义与性质137

\n

5.8.2点互信息138

\n

5.8.3与熵的关系138

\n

小结139

\n

习题140

\n

参考文献141

\n

第6章线性分析与卷积142

\n

6.1线性分析142

\n

6.1.1线性运算142

\n

6.1.2线性空间142

\n

6.1.3线性空间基143

\n

6.1.4线性映射与变换143

\n

6.1.5线性映射的矩阵表达144

\n

6.1.6坐标变换144

\n

6.2线性判别145

\n

6.2.1判别函数145

\n

6.2.2判别分析146

\n

6.2.3非线性问题147

\n

6.3卷积148

\n

6.3.1定义148

\n

6.3.2两个例子150

\n

6.3.3性质151

\n

6.3.4边界填充152

\n

6.3.5步长153

\n

6.3.6与线性变换的关系154

\n

6.3.7几种特殊应用154

\n

6.4池化154

\n

6.4.1定义155

\n

6.4.2作用与意义155

\n

6.4.3与卷积的关系155

\n

6.5反卷积156

\n

6.5.1作用与意义156

\n

6.5.2与线性变换的关系156

\n

6.5.3卷积表示157

\n

小结158

\n

习题158

\n

参考文献159

\n

第7章正则化与范数160

\n

7.1过拟合问题与正则化160

\n

7.1.1泛化能力161

\n

7.1.2过拟合与欠拟合161

\n

7.1.3假设空间与归纳偏好161

\n

7.1.4无免费午餐定理162

\n

7.2硬正则化164

\n

7.2.1数据归一化、标准化164

\n

7.2.2提前终止训练166

\n

7.2.3权值共享166

\n

7.2.4池化167

\n

7.2.5随机失效167

\n

7.2.6集成学习168

\n

7.2.7支持向量机169

\n

7.3软正则化170

\n

7.3.1损失函数170

\n

7.3.2期望风险171

\n

7.3.3经验风险172

\n

7.3.4置信风险173

\n

7.3.5VC维与置信风险173

\n

7.3.6目标函数与支持向量机174

\n

7.4范数正则化175

\n

7.4.1定义与性质175

\n

7.4.2向量范数175

\n

7.4.3矩阵范数176

\n

7.4.4关联关系178

\n

小结178

\n

习题179

\n

参考文献179

\n

第8章最优化理论与方法180

\n

8.1最优化的意义与重要性180

\n

8.2直接法181

\n

8.2.1极值、最值与驻点181

\n

8.2.2一元函数182

\n

8.2.3二元函数182

\n

8.2.4多元函数183

\n

8.3无约束迭代法183

\n

8.3.1一般迭代法183

\n

8.3.2下降迭代法183

\n

8.4梯度法184

\n

8.4.1一阶泰勒展开184

\n

8.4.2柯西施瓦茨不等式184

\n

8.4.3学习率与梯度降184

\n

8.4.4最速下降法185

\n

8.4.5批量下降法与随机下降法185

\n

8.5牛顿法186

\n

8.5.1二阶泰勒展开与Hessian矩阵186

\n

8.5.2一维线性搜索186

\n

8.6拟牛顿法187

\n

8.6.1Hessian逆的秩1修正188

\n

8.6.2Hessian逆的秩2修正189

\n

8.6.3秩1修正的逆190

\n

8.6.4Hessian矩阵的近似及其变形191

\n

8.7共轭梯度法193

\n

8.7.1共轭向量与共轭方向193

\n

8.7.2共轭方向法194

\n

8.7.3共轭方向与梯度的正交关系196

\n

8.7.4基于梯度的共轭方向生成198

\n

8.8次梯度法201

\n

8.8.1次梯度定义201

\n

8.8.2次梯度取值201

\n

8.8.3次梯度优化条件202

\n

8.9坐标下降法202

\n

8.9.1基本原理202

\n

8.9.2解的可靠性203

\n

8.9.3与共轭方向法的关系204

\n

8.10约束优化205

\n

8.10.1拉格朗日乘数法206

\n

8.10.2KKT条件207

\n

8.10.3拉格朗日对偶207

\n

8.10.4强对偶成立的条件209

\n

8.10.5一个实例212

\n

小结214

\n

习题215

\n

参考文献216

\n

附录216

\n

第9章核函数映射219

\n

9.1线性不可分问题219

\n

9.2Cover定理221

\n

9.2.1普通位置向量集221

\n

9.2.2维度与线性可分的关系221

\n

9.3核函数224

\n

9.3.1Mercer定理225

\n

9.3.2可组合扩展性226

\n

9.3.3有效核的构造228

\n

9.4多项式核228

\n

9.4.1核矩阵的半正定性228

\n

9.4.2齐次有序单项式向量空间229

\n

9.4.3有序单项式向量空间231

\n

9.4.4齐次无序单项式向量空间232

\n

9.4.5无序单项式向量空间233

\n

9.4.6线性核234

\n

9.4.7高阶非线性核234

\n

9.5径向基核235

\n

9.5.1径向基函数235

\n

9.5.2高斯核236

\n

9.5.3幂指数核238

\n

9.5.4拉普拉斯核238

\n

9.5.5核矩阵的半正定性239

\n

9.6Sigmoid核239

\n

9.6.1条件半正定240

\n

9.6.2与径向基核的关系240

\n

9.7艰难的抉择241

\n

9.8一个实例241

\n

小结242

\n

习题243

\n

参考文献243

\n

第10章性能评价与度量244

\n

10.1性能评价的意义与重要性244

\n

10.2模型选择与交叉验证244

\n

10.3错误率与精度246

\n

10.4混淆矩阵247

\n

10.5查准查全问题248

\n

10.5.1查准率与查全率249

\n

10.5.2PR曲线249

\n

10.5.3F分数250

\n

10.6真假阳性问题251

\n

10.6.1真/假阳/阴性率251

\n

10.6.2ROC曲线与AUC252

\n

10.7多混淆矩阵问题256

\n

10.7.1宏平均256

\n

10.7.2微平均257

\n

10.8代价敏感问题258

\n

10.8.1代价敏感矩阵258

\n

10.8.2代价曲线与预测错误总体代价259

\n

10.9假设检验261

\n

10.9.1单一模型261

\n

10.9.2多模型262

\n

小结262

\n

习题263

\n

参考文献264

\n


本目录推荐