知识增强大模型

定　价：¥118.00

作　者：	王文广
出版社：	电子工业出版社
丛编项：
标　签：	暂缺

购买这本书可以去

当当网 (¥112.10)

ISBN：	9787121499166	出版时间：	2025-03-01	包装：	平装-胶订
开本：	16开	页数：		字数：

内容简介

　　全书共分10 章，全面介绍知识增强大模型涉及的各类技术，涵盖大模型、向量数据库、图数据库、知识图谱、检索增强生成、GraphRAG 等内容，并辅以丰富的实例、精心绘制的插图和深入浅出的技术解析，帮助读者快速掌握知识增强大模型的理论，引导读者逐步构建知识增强大模型应用。本书既可以作为人工智能相关的技术从业者、企业或机构管理者的工具书，指导实际工作；也适合作为人工智能、计算机等相关专业高年级本科生或研究生学习知识增强大模型应用开发的入门图书和进阶指南。

作者简介

　　王文广，高级工程师，浙江大学硕士，浦东新区“明珠计划”菁英人才，省部级科技进步奖获得者，人工智能标准编制专家，浦东新区首席技师，腾讯云最具价值专家（TVP），中国人工智能产业发展联盟突出贡献个人，曾出版《知识图谱：认知智能理论与实战》一书，致力于推进通用人工智能技术的研究和应用。现为上海市人工智能标准化技术委员会委员、上海市科学技术委员会评审专家、中国计算机学会（CCF）高级会员、中国中文信息学会（CIPS）语言与知识计算专委会委员、中国人工智能学会（CAAI）深度学习专委会委员、上海市人工智能技术协会专委会委员，曾参与编制十余项（篇）人工智能领域的标准，发表数十项人工智能领域的国家发明专利和学术论文，并参与编写多本人工智能方面的图书。

图书目录

第1章绪论：迎接大模型纪元 0
1.1 大模型崛起   2
1.2 大模型的固有特性      4
1.2.1 幻觉    5
1.2.2 知识陈旧    6
1.3 知识增强大模型   6
1.4 迎接大模型纪元   8
第2章大语言模型    10
2.1 大模型概述   12
2.2 语言模型简史      14
2.3 大模型为何如此强大   20
2.3.1 语言模型与无监督学习    21
2.3.2 人类反馈强化学习    22
2.3.3 情境学习与思维链    24
2.4 如何使用大模型   29
2.4.1 翻译    30
2.4.2 文本摘要    31
2.4.3 求解数学问题    31
2.4.4 语言学习和考试       32
2.4.5 高效撰写文章    34
2.4.6 自动化编程和辅助编程    35
2.4.7 数据分析    38
2.5 垂直大模型   40
2.5.1 什么是垂直大模型    41
2.5.2 垂直大模型的特点    41
2.6 思考题   42
2.7 本章小结      43
第3章向量数据库    44
3.1 向量表示与嵌入   46
3.1.1 语言的向量表示       47
3.1.2 图像的向量表示       48
3.1.3 知识图谱的向量表示       49
3.2 向量相似度   49
3.2.1 L2距离      50
3.2.2 余弦相似度       51
3.2.3 内积相似度       52
3.2.4 L1距离      53
3.3 向量索引与检索方法   54
3.3.1 最近邻检索和近似最近邻检索       55
3.3.2 局部敏感哈希算法    56
3.3.3 基于图结构的HNSW算法      58
3.3.4 向量量化与乘积量化       63
3.4 Milvus向量数据库      65
3.4.1 Milvus架构       66
3.4.2 向量索引方法    68
3.4.3 向量检索方法    70
3.4.4 数据一致性       70
3.4.5 用户认证与权限控制       72
3.5 Milvus向量数据库实战指南      73
3.5.1 安装、配置和运行Milvus       73
3.5.2 连接服务器和创建数据库       75
3.5.3 数据准备    76
3.5.4 创建集合    77
3.5.5 创建索引    80
3.5.6 插入数据    81
3.5.7 载入数据    82
3.5.8 标量查询    83
3.5.9 单向量检索       84
3.5.10 混合检索 87
3.6 其他主流的向量数据库系统与工具   91
3.6.1 原生向量数据库       91
3.6.2 数据库的向量处理扩展    92
3.6.3 向量索引和检索库    93
3.7 思考题   94
3.8 本章小结      94
第4章检索增强生成 96
4.1 检索增强生成概述      98
4.2 为什么需要RAG 99
4.2.1 RAG、SFT与LoRA 99
4.2.2 长上下文与RAG      102
4.2.3 锂电池供应链管理案例    103
4.2.4 RAG的特点      105
4.3 通用的RAG流程 106
4.3.1 创建知识库       107
4.3.2 知识检索    107
4.3.3 大模型生成答案       108
4.3.4 质量评估与迭代优化       109
4.4 使用Dify构建RAG系统   110
4.4.1 Dify概述   110
4.4.2 安装Dify   111
4.4.3 初始化Dify       115
4.4.4 创建知识库       116
4.4.5 简单的RAG应用     119
4.4.6 RAG效果优化   121
4.4.7 引入Elasticsearch      123
4.4.8 构建RAG系统 129
4.5 RAG系统的最佳实践 135
4.5.1 文本分块    135
4.5.2 分层检索    136
4.5.3 查询改写    137
4.5.4 检索路由    138
4.6 其他主流的RAG系统框架 138
4.6.1 LobeChat    138
4.6.2 Quivr 139
4.6.3 LlamaIndex 139
4.6.4 Open WebUI      139
4.7 思考题   140
4.8 本章小结      140
第5章知识图谱技术体系 142
5.1 什么是知识图谱   144
5.1.1 知识图谱的相关概念及其定义       144
5.1.2 知识图谱实例    146
5.1.3 大脑的联想机制与知识图谱的关系建模       147
5.2 DIKW模型与知识图谱      149
5.2.1 DIKW模型 149
5.2.2 从DIKW模型到知识图谱       150
5.2.3 知识图谱的内涵与外延    151
5.2.4 知识的源流与知识图谱    152
5.3 知识图谱的技术体系   153
5.3.1 知识图谱模式设计与管理       153
5.3.2 知识图谱构建技术    154
5.3.3 知识图谱存储技术    156
5.3.4 知识图谱应用技术    156
5.3.5 用户接口与界面       158
5.4 知识图谱模式设计的基本原则   159
5.4.1 赋予一类事物合适的名字       159
5.4.2 建立事物间清晰的联系    160
5.4.3 明确且正式的语义表达    161
5.5 知识图谱模式设计的六韬法      162
5.6 大模型结合六韬法设计知识图谱模式      165
5.6.1 场景：对齐参与各方的认知    166
5.6.2 复用：站在巨人的肩膀上       168
5.6.3 事物：定义实体类型及属性    169
5.6.4 联系：场景需求之下的普遍联系    173
5.6.5 约束：多层次的约束规范       176
5.6.6 评价：迭代优化的起点    182
5.7 知识图谱模式设计的最佳实践   182
5.7.1 熟知知识图谱及其具体应用领域    183
5.7.2 明确边界，切记贪多嚼不烂    183
5.7.3 高内聚、低耦合       184
5.7.4 充分利用可视化工具       185
5.8 思考题   186
5.9 本章小结      187
第6章构建知识图谱 188
6.1 知识图谱构建技术概述      190
6.1.1 映射式构建技术       190
6.1.2 抽取式构建技术       192
6.2 抽取实体和实体属性   193
6.2.1 实体、实体属性及其抽取       193
6.2.2 用大模型抽取实体和实体属性       196
6.3 抽取关系和关系属性   205
6.3.1 实体间的关系和关系抽取       205
6.3.2 用大模型抽取关系和关系属性       210
6.4 抽取事件      214
6.4.1 事件、事件要素和事件抽取    214
6.4.2 用大模型抽取事件    217
6.5 多语言和跨语言   222
6.6 知识抽取的评价指标   223
6.7 思考题   226
6.8 本章小结      227
第7章图数据库与图计算 228
7.1 图数据库概述      230
7.1.1 顶点、边、属性与标签    230
7.1.2 图数据库的存储与查询    231
7.1.3 主流的图数据库       231
7.2 JanusGraph分布式图数据库       232
7.2.1 JanusGraph系统架构 233
7.2.2 CAP理论与JanusGraph    234
7.2.3 与搜索引擎的集成    235
7.2.4 事务和故障修复       235
7.2.5 属性图模式的定义    236
7.2.6 图查询语言Gremlin 237
7.3 JanusGraph实战指南   238
7.3.1 安装、运行和配置JanusGraph 238
7.3.2 在JanusGraph中定义属性图模式   243
7.3.3 为图创建索引    247
7.3.4 索引的状态及动作    251
7.3.5 查看属性图模式       252
7.3.6 为图插入顶点、边和属性       254
7.3.7 查询的起始与终末    258
7.3.8 提取图中元素的信息       259
7.3.9 过滤查询条件    260
7.3.10 图的游走 262
7.3.11 分组与聚合     263
7.3.12 分支与循环     265
7.3.13 match、map、filter和sideEffect   266
7.3.14 性能优化工具的使用     267
7.4 JanusGraph的可视化   269
7.4.1 JanusGraph-Visualizer       269
7.4.2 其他可视化工具       270
7.5 遍历与最短路径算法   271
7.5.1 广度优先搜索    271
7.5.2 深度优先搜索    272
7.5.3 路径和最短路径       274
7.6 中心性   276
7.6.1 中心性的概念及应用       276
7.6.2 度中心性    277
7.6.3 亲密中心性       279
7.6.4 中介中心性       280
7.6.5 特征向量中心性       282
7.6.6 PageRank    283
7.7 社区检测      285
7.7.1 社区检测概述    285
7.7.2 社区检测算法一览    286
7.7.3 Leiden算法实战       289
7.7.4 社区检测算法的应用场景       292
7.8 思考题   294
7.9 本章小结      294
第8章图模互补应用范式 296
8.1 图模互补概述      298
8.2 图模互补中的知识图谱      299
8.2.1 知识的确定性和一致性    299
8.2.2 知识来源可追溯       299
8.2.3 知识的实时与及时更新    300
8.2.4 可解释与可追溯的演绎推理    301
8.2.5 纠错机制与知识的持续维护    301
8.2.6 基于图机器学习与图神经网络的概率推理    301
8.2.7 知识图谱的全局视野       302
8.3 图模互补中的大模型   302
8.3.1 从任务描述到任务需求的理解       302
8.3.2 利用知识图谱检索、整合和推理结果    303
8.3.3 高质量的自然语言生成    303
8.3.4 结合多源知识生成创新性内容       305
8.3.5 概率推理能力与通用性    306
8.3.6 知识抽取    306
8.3.7 知识补全    306
8.3.8 跨语言知识对齐       307
8.4 图模互补应用范式的特点   307
8.5 大模型对知识图谱的增强   308
8.5.1 增强知识图谱的构建       308
8.5.2 增强知识图谱的补全       310
8.5.3 增强对知识的描述    310
8.5.4 增强知识图谱的推理       312
8.5.5 增强知识图谱的查询       312
8.6 知识图谱对大模型的增强   313
8.6.1 减少大模型的幻觉    313
8.6.2 内嵌知识图谱的大模型    314
8.6.3 提升大模型的推理能力    315
8.6.4 知识图谱增强生成    316
8.6.5 提升大模型生成内容的可解释性    316
8.6.6 应用案例    318
8.7 基于图模互补应用范式的智能系统的典型流程      318
8.8 思考题   320
8.9 本章小结      321
第9章知识图谱增强生成与GraphRAG 322
9.1 知识图谱增强生成的原理   324
9.1.1 深度推理和实时推理       324
9.1.2 全局视野与深度洞察       325
9.1.3 知识整合    326
9.2 知识图谱增强生成的通用框架   327
9.3 为知识图谱创建索引   327
9.3.1 图索引       328
9.3.2 文本索引    328
9.3.3 向量索引    329
9.3.4 混合索引    329
9.4 从知识图谱中检索知识      329
9.4.1 检索方法    330
9.4.2 检索过程    331
9.4.3 知识粒度    334
9.5 知识表示形式      335
9.5.1 邻接表和边表    335
9.5.2 自然语言文本    336
9.5.3 编程语言    336
9.5.4 语法树       341
9.5.5 顶点序列    341
9.6 GraphRAG概述   341
9.7 GraphRAG实战   344
9.7.1 安装GraphRAG和数据资源准备    344
9.7.2 转换为实体的关系属性的DataFrame     346
9.7.3 计算实体、关系的排序值       347
9.7.4 为实体生成描述文本及向量化       347
9.7.5 为关系生成描述文本及向量化       348
9.7.6 社区分类和社区描述文本       349
9.7.7 调用API生成GraphRAG可用数据       354
9.7.8 大模型的初始化       355
9.7.9 局部搜索与全局搜索       355
9.8 思考题   358
9.9 本章小结      358
第10章知识增强大模型应用 360
10.1 应用框架    362
10.2 知识来源    363
10.2.1 非结构化知识 363
10.2.2 结构化数据库 364
10.2.3 知识图谱 365
10.3 知识运营    366
10.3.1 知识的质量     366
10.3.2 数据管理流程 367
10.3.3 法律合规、隐私与知识产权 368
10.3.4 可观测性工具 368
10.4 应用指南    369
10.4.1 应用价值 370
10.4.2 面向进取者：全面推进的策略     371
10.4.3 面向保守者：试点驱动的策略     372
10.4.4 选型的“四三二一”原则     373
10.4.5 最佳实践要点 374
10.5 行业应用案例    375
10.5.1 文档助手 375
10.5.2 教育领域应用场景 377
10.5.3 智慧金融应用场景 378
10.5.4 智慧医疗应用场景 381
10.5.5 智能制造应用场景 383
10.6 思考题 386
10.7 本章小结    386
附录A    388
附录B    389
参考文献       390