注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络图形图像、多媒体、网页制作深度学习应用开发实践:文本音频图像处理30例

深度学习应用开发实践:文本音频图像处理30例

深度学习应用开发实践:文本音频图像处理30例

定 价:¥79.00

作 者: 李永华、田云龙、许亮斌、苑世宁
出版社: 清华大学出版社
丛编项:
标 签: 暂缺

购买这本书可以去


ISBN: 9787302682660 出版时间: 2025-04-01 包装: 平装-胶订
开本: 16开 页数: 字数:  

内容简介

  本书根据当前人工智能及机器学习的发展成果,具体设计基于人工智能的模型算法,并给出了具体实现,最新算法流程及代码实现。其主要内容包括:AI作曲、语音识别、人像识别、车牌识别、骨架识别与肢体定位、人脸识别、古诗与歌词生成的具体实现。本书从系统设计、代码实现以及运行结果展示相结合,语言简洁,深入浅出,通俗易懂,不仅适合对人工智能编程有兴趣的爱好者,而且可作为高等院校参考教材,还可作为从事智能应用创新开发专业人员的技术用书。

作者简介

  李永华,现执教于北京邮电大学,信息通信学院,教授,拥有超过10年的嵌入式开发经验,致力于物联网、云计算与大数据的研究工作。在教学中善于以兴趣为导向,激发学生的创造性;以素质为基础,提高自身教学水平;以科研为手段,促进教学理念的转变。在研发及教学实践中指导学生实现500个创新案例,承担参与了30余项国家级、企业组织的理论研究和工程项目没在国内外学术期刊以及会议发表论文60余篇,申请专利40余项,出版教材30余部。

图书目录


项目1AI作曲
1.1总体设计
1.1.1整体框架
1.1.2系统流程
1.2运行环境
1.2.1Python环境
1.2.2虚拟机环境
1.2.3TensorFlow环境
1.2.4Python类库
1.3模块实现
1.3.1数据准备
1.3.2信息提取
1.3.3模型构建
1.3.4模型训练及保存
1.3.5音乐模块
1.4系统测试
1.4.1训练过程
1.4.2测试效果
项目2语音识别
2.1总体设计
2.1.1整体框架
2.1.2系统流程
2.2运行环境
2.2.1Python环境
2.2.2PyCharm环境
2.2.3PyTorch环境
2.2.4CUDA和cuDNN环境
2.2.5网页端配置环境
2.3模块实现
2.3.1数据准备
2.3.2模型构建
2.3.3模型训练及保存
2.3.4模型应用
2.4系统测试
2.4.1训练准确率
2.4.2测试效果
项目3人像分割
3.1总体设计
3.1.1整体框架
3.1.2系统流程
3.2运行环境
3.2.1Python环境
3.2.2PyTorch环境
3.2.3PyQt5配置
3.3模块实现
3.3.1数据准备
3.3.2模型构建
3.3.3模型训练
3.3.4模型保存
3.3.5模型测试
3.3.6模型运行
3.4系统测试
3.4.1训练准确率
3.4.2测试效果
项目4车辆信息识别
4.1总体设计
4.1.1整体框架
4.1.2系统流程
4.2运行环境
4.3模块实现
4.3.1车牌字符分割
4.3.2训练数据
4.3.3车牌字符识别
4.4系统测试
项目5骨架识别与肢体定位
5.1总体设计
5.1.1整体框架
5.1.2系统流程
5.2运行环境
5.2.1Python环境
5.2.2Openpose环境
5.2.3PyQt6环境
5.3模块实现
5.3.1静态识别
5.3.2动态识别
5.3.3模块展示
5.4系统测试
项目6生成古诗与歌词
6.1总体设计
6.1.1整体框架
6.1.2系统流程
6.2运行环境
6.2.1Python环境
6.2.2TensorFlow环境
6.2.3PyCharm环境
6.3模块实现
6.3.1数据准备
6.3.2模型构建
6.3.3模型训练及保存
6.3.4使用模型生成古诗
6.3.5产生藏头诗
6.3.6用词云展示生成的古诗
6.4歌词生成
6.4.1数据准备
6.4.2模型构建
6.4.3模型训练及保存
6.4.4生成歌词
6.5系统测试
6.5.1生成古诗和藏头诗
6.5.2生成歌词
项目7车牌分割与识别
7.1总体设计
7.1.1整体框架
7.1.2系统流程
7.2运行环境
7.3模块实现
7.3.1模型训练
7.3.2模型预测
7.3.3模型展示
7.4系统测试
项目8音乐源分离
8.1总体设计
8.1.1整体框架
8.1.2系统流程
8.2运行环境
8.2.1Python环境
8.2.2训练环境
8.2.3网页端环境
8.3模块实现
8.3.1数据准备
8.3.2模型训练
8.3.3模型调用及音源分离
8.3.4前端交互
8.4系统测试
8.4.1模型训练效果
8.4.2音频分离效果
8.4.3前端交互效果
项目9宠物识别
9.1总体设计
9.1.1整体框架
9.1.2系统流程
9.2运行环境
9.2.1Python环境
9.2.2TensorFlow环境
9.2.3网页端环境
9.3模块实现
9.3.1数据准备
9.3.2模型构建
9.3.3模型训练
9.3.4模型保存
9.3.5模型应用
9.4系统测试
9.4.1训练准确率
9.4.2测试效果
项目10人脸口罩辨别
10.1总体设计
10.1.1整体框架
10.1.2系统流程
10.2运行环境
10.2.1Python环境
10.2.2PyTorch环境
10.2.3Android环境
10.3模块实现
10.3.1数据准备
10.3.2模型构建
10.3.3模型训练
10.3.4模型保存
10.3.5模型应用
10.4系统测试
10.4.1训练准确率
10.4.2测试效果
项目11图像风格迁移
11.1总体设计
11.1.1整体框架
11.1.2系统流程
11.2运行环境
11.2.1Python环境
11.2.2TensorFlow环境
11.2.3Android环境
11.3模块实现
11.3.1数据准备
11.3.2模型构建
11.3.3模型训练
11.3.4模型评估
11.3.5模型保存
11.3.6模型应用
11.4系统测试
11.4.1损失函数变化趋势
11.4.2模型运行
11.4.3测试效果
项目12目标检测网页应用
12.1总体设计
12.1.1整体框架
12.1.2系统流程
12.2运行环境
12.2.1Python环境
12.2.2PyTorch环境
12.2.3网络环境
12.3模块实现
12.3.1数据准备
12.3.2模型构建
12.3.3模型训练
12.4系统测试
12.4.1训练结果
12.4.2测试效果
项目13图像隐写
13.1总体设计
13.1.1整体框架
13.1.2系统流程
13.2运行环境
13.3模块实现
13.3.1数据准备
13.3.2模型实现
13.3.3模型训练及评估
13.3.4模型保存
13.4系统测试
13.4.1训练准确率
13.4.2测试效果
项目14图像检索
14.1总体设计
14.1.1整体框架
14.1.2系统流程
14.2运行环境
14.2.1Python环境
14.2.2TensorFlow环境
14.3模块实现
14.3.1数据准备
14.3.2模型初始化及移植
14.3.3数字图像处理
14.4系统测试
项目15人脸口罩检测
15.1总体设计
15.1.1整体框架
15.1.2系统流程
15.2运行环境
15.2.1Python环境
15.2.2PyTorch环境
15.2.3微信小程序 
15.3模块实现
15.3.1数据准备
15.3.2模型训练
15.3.3服务器端部署
15.3.4移动端应用
15.4系统测试
15.4.1训练准确率
15.4.2模型推理测试
项目16生活垃圾识别
16.1总体设计
16.1.1整体框架
16.1.2系统流程
16.2运行环境
16.2.1Python环境
16.2.2PyTorch环境
16.2.3网页端
16.3模块实现
16.3.1数据准备
16.3.2模型构建
16.3.3模型训练
16.3.4模型保存
16.4系统测试
16.4.1训练准确率
16.4.2测试效果
项目17动态交通手势识别的车辆控制
17.1总体设计
17.1.1整体框架
17.1.2系统流程
17.2运行环境
17.2.1Python环境
17.2.2TensorFlow环境
17.2.3Arduino环境
17.3模块实现
17.3.1数据准备
17.3.2导入模型并编译
17.3.3模型训练及评估
17.3.4训练结果
17.3.5通信模块
17.3.6蓝牙模块
17.4系统测试 
项目18物体识别
18.1总体设计
18.1.1整体框架
18.1.2系统流程
18.2运行环境
18.2.1Python环境
18.2.2PyTorch环境
18.2.3网页端环境
18.3模块实现
18.3.1数据准备
18.3.2模型构建
18.3.3模型训练
18.3.4模型保存
18.3.5模型应用
18.4系统测试
18.4.1训练准确率
18.4.2测试效果
项目19人体识别
19.1总体设计
19.1.1整体框架
19.1.2系统流程
19.2运行环境
19.2.1Python 环境
19.2.2StreamYOLO 环境
19.2.3CUDA环境
19.2.4Qt 相关安装
19.3模块实现
19.3.1数据准备
19.3.2模型训练
19.3.3模型应用
19.4系统测试
项目20垃圾分类
20.1总体设计
20.1.1整体框架
20.1.2系统流程
20.2运行环境
20.2.1Python环境
20.2.2TensorFlow环境
20.2.3PyQt5环境
20.3模块实现
20.3.1数据准备
20.3.2模型构建
20.3.3模型训练
20.3.4模型应用
20.4系统测试
项目21垃圾邮件识别
21.1总体设计
21.1.1整体框架
21.1.2系统流程
21.2运行环境
21.2.1Python环境
21.2.2Flask 环境
21.3模块实现
21.3.1数据准备
21.3.2朴素贝叶斯算法
21.3.3词划分
21.3.4贝叶斯垃圾邮件分类自动化处理
21.3.5训练效果展示
21.4系统测试
项目22宿舍门禁系统
22.1总体设计
22.1.1整体框架
22.1.2系统流程
22.2运行环境
22.2.1Python环境
22.2.2网页端
22.3模块实现
22.3.1数据准备
22.3.2模型构建
22.3.3模型训练
22.3.4模型应用
22.3.5模型运行
22.4系统测试
项目23人数检测
23.1总体设计
23.1.1整体框架
23.1.2系统流程
23.2运行环境
23.2.1Python环境
23.2.2其他安装包
23.3模块实现
23.3.1数据准备
23.3.2模型构建
23.3.3模型训练
23.3.4模型保存
23.3.5模型应用
23.4系统测试
23.4.1训练准确率
23.4.2测试效果
项目24医疗诊断
24.1总体设计
24.1.1整体框架
24.1.2系统流程
24.2运行环境
24.2.1Python环境
24.2.2Sklearn环境
24.2.3网页端
24.3模块实现
24.3.1数据准备
24.3.2模型构建
24.3.3数据集划分及模型训练
24.3.4模型选择
24.3.5模型保存
24.3.6模型应用
24.4系统测试
24.4.1训练准确率
24.4.2测试效果
项目25水果识别
25.1总体设计
25.1.1整体框架
25.1.2系统流程
25.2运行环境
25.2.1Python环境
25.2.2TensorFlow环境
25.2.3PyQt5环境
25.3模块实现
25.3.1模型构建及训练
25.3.2模型测试
25.3.3图形化界面
25.4系统测试
25.4.1测试准确率
25.4.2测试效果
项目26表情识别
26.1总体设计
26.1.1整体框架
26.1.2系统流程
26.2运行环境
26.3模块实现
26.3.1数据准备
26.3.2模型构建
26.3.3模型训练
26.3.4前端展示
26.4系统测试
26.4.1训练准确率
26.4.2测试效果
项目27生成图像字幕
27.1总体设计
27.1.1整体框架
27.1.2系统流程
27.2运行环境
27.2.1Python环境
27.2.2PyTorch环境
27.2.3网页端环境
27.3模块实现
27.3.1数据准备
27.3.2数据预处理
27.3.3数据读取
27.3.4模型构建
27.3.5模型保存
27.3.6模型应用
27.4系统测试
项目28验证码的生成和识别
28.1总体设计
28.1.1整体框架
28.1.2系统流程
28.2运行环境
28.2.1Python环境
28.2.2TensorFlow环境
28.2.3Android环境/网页端/鸿蒙/iOS
28.3模块实现
28.3.1数据准备
28.3.2模型构建
28.3.3模型训练
28.3.4模型保存
28.3.5模型应用
28.4系统测试
28.4.1训练准确率
28.4.2测试效果
项目29中文语音输入法
29.1总体设计
29.1.1整体框架
29.1.2系统流程
29.2运行环境
29.2.1Python环境
29.2.2TensorFlow环境
29.2.3其他依赖库
29.3模块实现
29.3.1数据准备
29.3.2模型构建
29.3.3模型训练及验证
29.3.4模型应用
29.4系统测试
29.4.1训练准确率
29.4.2测试效果
项目30狗种类识别
30.1总体设计
30.1.1整体框架
30.1.2系统流程
30.2运行环境
30.2.1Python环境
30.2.2PyTorch环境
30.2.3Android环境
30.3模块实现
30.3.1数据准备
30.3.2模型构建
30.3.3模型训练
30.3.4模型保存
30.3.5模型应用
30.3.6模型运行
30.4系统测试
30.4.1训练准确率
30.4.2测试效果
 

本目录推荐