生物医药大数据与智能分析

定　价：¥99.80

作　者：	彭绍亮著
出版社：	人民邮电出版社
丛编项：
标　签：	暂缺

购买这本书可以去

ISBN：	9787115558435	出版时间：	2021-05-01	包装：	平装
开本：	16开	页数：	195	字数：

内容简介

　　生物医药大数据蕴含了非常丰富的信息和知识，是关乎人类生存与健康的重要战略资源，但只有对生物医药大数据进行高效处理和智能分析，才能真正推动生物医药研究和产业化从原来的假设驱动向数据驱动转变，因而近些年来生物医药大数据与智能分析逐渐成为潜力巨大且发展迅猛的交叉领域。本书简要介绍了并行计算、机器学习和深度学习应用于生物医药大数据的相关基础知识，并总结了作者团队在生物医药大数据处理和分析领域的若干成果，主要涵盖基因表达谱分析、微生物基因组、药物虚拟筛选、肿瘤基因表达谱分类、RNA编辑位点识别、增强子识别等，以作者团队的研究成果为实际案例，详细介绍了研究的路线和方法。本书属于高性能计算、大数据、机器学习和生物医药等专业的交叉领域，可以为这些领域的研究人员提供参考，也可作为相关专业高年级本科生和研究生的补充教材。

作者简介

　　彭绍亮国家超级计算长沙中心副主任，湖南大学信息科学与工程学院教授、博导，湖南大学教育舆情研究中心副主任（兼），2020年被聘为长江学者特聘教授，2019年获湖南省杰出青年基金支持，长期从事高性能计算、大数据、生物信息、人工智能、区块链等方面研究。担任国防科技大学“天河”系列超级计算机生命科学方向负责人，国防科技大学/华大基因兼职教授，鹏城实验室智慧医疗平台课题负责人，中央军委科技委生物交叉立项专家组成员，科技部、工信部、教育部会评专家；中国计算机学会（CCF）理事，生物信息学、计算机应用专委副主任，大数据、高性能计算专委常委，区块链专委委员，CCF杰出会员和杰出讲者；湖南省生物信息学会发起人、理事长，3个SCI期刊和多个EI期刊的主编、副主编。出版专著7部，发表学术论文上百篇，Google引用五千余次。负责“天河”系列超级计算机应用软件研发工作，主持和参与科技部、国家自然科学基金委重点项目，973/863项目等项目13项。获2019年国家科学技术进步奖二等奖，2019年湖南省技术发明奖一等奖（排名第1），2013年军队科学技术进步奖一等奖，2018年CCF科学技术奖自然科学二等奖（排名第1），2016年荣立三等功。王晓伟国防科技大学计算机科学与技术专业博士、软件工程博士后科研流动站博士后。长期从事网络空间安全、生物医药、军事信息系统等领域的大数据与人工智能技术研发工作。作为骨干参与“天河”系列超级计算机应用软件研发工作，获2017年军队科学技术进步奖一等奖。参与国家863计划、国家重点研发计划、国家自然科学基金重点项目等项目6项，参与制定国家及行业标准3项，作为第一译者出版译著2部（《命令行中的数据科学》《实时分析：流数据的分析与可视化技术》），参与编写教材2部（《生物信息计算》《大数据导论》）。

图书目录

目录
第　一篇绪论
第　1 章生物医药大数据与智能分析概述　2
1．1　生物医药大数据　2
1．2　生物医药大数据的高效处理　3
1．2．1　大规模并行处理技术　3
1．2．2　云计算技术　5
1．3　生物医药大数据的智能分析　5
1．4　总结　6
1．5　本书的内容安排　6
第二篇　生物医药大数据的高效处理
第　2 章生物医药大数据高效处理的基础　9
2．1　大数据计算模型　9
2．1．1　外存模型　9
2．1．2　数据流模型　9
2．1．3　PRAM 模型　10
2．1．4　MapReduce 模型　10
2．2　并行计算　10
2．2．1　计算密集型和数据密集型　11
2．2．2　并行计算的粒度　11
2．2．3　并行编程的一般设计过程　11
2．2．4　并行编程模型　12
2．3　总结　12
第　3 章海量基因表达谱分析　13
3．1　基因表达谱分析与生物效应评估概述　14
3．2　海量基因表达谱快速查询　15
3．2．1　GSEA 工具　15
3．2．2　海量基因表达谱查询算法　17
3．2．3　性能评估　25
3．3　海量基因表达谱并行比对与聚类　27
3．3．1　基因表达数据库 CMap　28
3．3．2　基因表达谱并行比对　29
3．3．3　基因表达谱并行聚类　30
3．3．4　性能评估　34
3．4　总结　40
第　4 章功能性前噬菌体预测　42
4．1　前噬菌体预测概述　43
4．1．1　噬菌体与功能性前噬菌体　43
4．1．2　前噬菌体与功能性前噬菌体预测的挑战　45
4．2　功能性前噬菌体预测算法　47
4．2．1　LysoPhD 流程设计　47
4．2．2　数据质量控制流水线　49
4．2．3　前噬菌体范围的粗略预测　50
4．2．4　前噬菌体范围的精确预测　53
4．2．5　前噬菌体功能性分析　54
4．2．6　基于末端延伸算法的溶原性噬菌体完整序列提取　55
4．2．7　性能评估　57
4．3　预测算法并行化　62
4．3．1　多线程并行加速　63
4．3．2　溶原性噬菌体数据库构建　64
4．4　总结　65
第　5 章高通量药物虚拟筛选　67
5．1　药物虚拟筛选概述　68
5．1．1　药物虚拟筛选　68
5．1．2　虚拟筛选软件 D3DOCKxb　70
5．2　基于 CPU 多核的药物虚拟筛选并行优化　71
5．2．1　D3DOCKxb 程序分析　72
5．2．2　基于 CPU 多核的 D3DOCKxb 设计与实现　73
5．2．3　性能评估　76
5．3　基于 CPU-MIC 协同的药物虚拟筛选并行优化　79
5．3．1　基于 MIC 协处理器的 D3DOCKxb 移植　80
5．3．2　CPU-MIC 异构协同的 mD3DOCKxb　84
5．3．3　性能评估　86
5．4　基于“天河二号”超级计算机的大规模高通量药物虚拟筛选平台　90
5．4．1　高通量虚拟筛选的主要挑战　90
5．4．2　高通量虚拟筛选的算法设计　91
5．4．3　性能评估　93
5．4．4　应用研究　97
5．5　总结　99
第三篇　生物医药大数据的智能分析
第　6 章生物医药大数据的智能分析基础　102
6．1　传统的机器学习技术　102
6．2　深度学习在生物医药大数据中的应用　103
6．2．1　在组学研究中的应用　104
6．2．2　在生物医学影像中的应用　105
6．2．3　在生物医学信号处理中的应用　105
6．2．4　在药物研发中的应用　106
6．3　常见的深度学习模型和框架　107
6．3．1　常见的深度学习模型　107
6．3．2　常见的深度学习框架　111
6．4　深度学习解决生物大数据问题的一般方法　112
6．4．1　数据获取及编码　112
6．4．2　数据预处理　113
6．4．3　模型训练　115
6．4．4　性能评估　116
6．5　总结　117
第　7 章基于字典学习的肿瘤基因表达谱分类　118
7．1　肿瘤基因表达谱分类概述　119
7．1．1　肿瘤与基因表达谱　119
7．1．2　分类算法　123
7．2　基于判别投影的字典学习基因表达谱分类　126
7．2．1　字典学习分类算法　126
7．2．2　基于判别投影的字典学习算法　128
7．2．3　性能评估　132
7．3　结合集成学习的字典学习基因表达谱分类　134
7．3．1　集成学习　134
7．3．2　结合集成学习的字典学习算法　136
7．3．3　性能评估　140
7．4　基于随机序列和样本距离的基因表达谱特征选择　143
7．4．1　数据预处理方法　144
7．4．2　肿瘤基因表达谱数据的特征选择　145
7．4．3　性能评估　148
7．5　总结　149
第　8 章基于深度学习的 RNA 编辑位点识别　150
8．1　RNA 编辑识别概述　150
8．1．1　RNA 编辑　150
8．1．2　RNA 编辑识别面临的挑战　151
8．2　RNA 编辑位点金标集的构建　152
8．2．1　ENCODE 计划　152
8．2．2　基于 ENCODE 计划的 RNA 编辑位点金标集设计　154
8．2．3　训练集和测试集的构建　155
8．3　基于双向 LSTM 的 RNA 编辑位点识别　157
8．3．1　双向长短时记忆网络　157
8．3．2　rnnRed 算法网络模型的构建、训练及性能评估　158
8．4　基于 ResNet 的 RNA 编辑位点识别　165
8．4．1　残差网络　165
8．4．2　cnnRed 算法网络模型的构建、训练及性能评估　166
8．5　总结　171
第　9 章基于深度学习的增强子识别　172
9．1　增强子识别概述　172
9．2　增强子识别神经网络　174
9．2．1　模型的设计　174
9．2．2　模型的优化　177
9．3　增强子序列数据集的预处理　178
9．3．1　增强子数据集　178
9．3．2　增强子序列的数值映射　179
9．4　模型的训练　180
9．4．1　训练集及实验平台　180
9．4．2　参数的选择　181
9．5　模型的预测评估　182
9．5．1　测试集及实验平台　182
9．5．2　性能度量指标　182
9．5．3　模型性能评估　184
9．6　总结　186
参考文献　187