注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络软件与程序设计Python文本分析(原书第2版)

Python文本分析(原书第2版)

Python文本分析(原书第2版)

定 价:¥129.00

作 者: [印度] 迪潘简·萨卡尔(Dipanjan Sarkar) 著,闫龙川,高德荃,李君婷 译
出版社: 机械工业出版社
丛编项: 数据科学与工程技术丛书
标 签: 暂缺

购买这本书可以去


ISBN: 9787111666776 出版时间: 2020-10-01 包装: 平装
开本: 16开 页数: 429 字数:  

内容简介

  面对自然语言处理和文本分析应用,解决问题的正确技术是什么?文本摘要如何真正有效?哪些才是解决多类文本分类的框架?《Python文本分析(原书第2版)》通过将数学和理论概念与现实用例的Python实现相结合,全面介绍了文本分析的相关概念、技术、工具及实践,可帮助你快速掌握文本分析技术,解决实际问题。《Python文本分析(原书第2版)》首先介绍与文本分析相关的自然语言基本概念以及Python语言的特点、特性和常用功能,然后结合示例代码详细阐述文本理解与处理、文本分类、文本摘要、文本相似度与聚类、语义与情感分析等内容。通过《Python文本分析(原书第2版)》,你可以全面掌握文本分析的基础技术和机器学习的一些经典方法,包括SVM、贝叶斯分类器、k-均值聚类、层次聚类等,为进一步的学习和研究奠定基础。《Python文本分析(原书第2版)》介绍了Python中的自然语言处理(NLP),以及如何设置健壮的环境来完成文本分析。《Python文本分析(原书第2版)》本版基于NLP的新趋势对上一版进行了重大的修改,并引入几个重要的变化和新的主题。你将通过实际案例了解如何使用Python中的先进NLP框架,配合机器学习和深度学习模型进行有监督的情感分析。《Python文本分析(原书第2版)》首先回顾了Python以及字符串和文本数据相关的NLP基础知识,接着介绍了文本数据的工程表示方法,包括传统的统计模型和新的基于深度学习的嵌入模型。《Python文本分析(原书第2版)》中还讨论了文本解析和处理方面的改进技术与新方法。《Python文本分析(原书第2版)》对文本摘要和主题模型的内容进行了全面改写,展示了如何在有趣的数据集-NIPS会议论文数据集上下文中构建、调整和解释主题模型。此外,《Python文本分析(原书第2版)》通过一个电影推荐系统实例介绍了文本相似度技术,以及使用有监督和无监督技术的情感分析。《Python文本分析(原书第2版)》还有一章专门讨论语义分析,你将看到如何从头开始构建自己的命名实体识别(NER)系统。虽然本版的总体结构保持不变,但整个代码库、模块和章节都已更新到Python3.x版本。

作者简介

  迪潘简·萨卡尔(Dianjan Sarkar)是红帽(Red Hat)公司的数据科学家、畅销书作者、顾问和培训师。他曾在多家初创公司以及《财富》500强公司(如英特尔)任职并提供咨询服务,主要致力于利用数据科学、高级分析、机器学习和深度学习来构建大规模智能系统。他拥有数据科学和软件工程专业的硕士学位,是自学教育和大规模开放在线课程的坚定支持者。他目前涉足开源产品领域,致力于提高全球开发人员的生产力。闫龙川,硕士,国家电网公司信息通信分公司高级工程师,信息通信技术专家,主要从事电力信息通信系统运行管理工作,研究兴趣包括深度学习、强化学习、自然语言处理、云计算及数据中心管理等。高德荃,博士,国家电网公司信息通信分公司高级工程师,主要从事电力信息通信系统运行分析工作,研究兴趣包括机器学习与数据科学、地理空间分析等。李君婷,硕士,国家电网公司信息通信分公司工程师,主要从事电力信息通信运维数据统计分析、项目管理等工作,研究兴趣包括机器学习、数据挖掘、颠覆性创新等。

图书目录

译者序
推荐序
前言
致谢
作者简介
技术审校者简介
第1章 自然语言处理基础
1.1 自然语言
1.1.1 什么是自然语言
1.1.2 语言哲学
1.1.3 语言习得和用法
1.2 语言学
1.3 语言句法和结构
1.3.1 单词
1.3.2 短语
1.3.3 从句
1.3.4 语法
1.3.5 语序类型学
1.4 语言语义
1.4.1 词汇语义关系
1.4.2 语义网络和模型
1.4.3 语义表示
1.5 文本语料库
1.5.1 文本语料库标注及使用
1.5.2 流行的语料库
1.5.3 访问文本语料库
1.6 自然语言处理
1.6.1 机器翻译
1.6.2 语音识别系统
1.6.3 问答系统
1.6.4 上下文识别与消解
1.6.5 文本摘要
1.6.6 文本分类
1.7 文本分析
1.8.机器学习
1.9 深度学习
1.1 0本章小结
第2章 Python自然语言处理
2.1 了解Pvthon
2.2 Python之禅
2.3 应用:何时使用Pymon
2.4 缺点:何时不用Pymon
2.5 Python的实现和版本
2.6 建立强大的Python环境
2.6.1 用哪个Python版本
2.6.2 用哪个操作系统
2.6.3 集成开发环境
2.6.4 环境设置
2.6.5 软件包管理
2.6.6 虚拟环境
2.7 Python语法和结构
2.8 使用文本数据
2.8.1 字符串文字
2.8.2 表示字符串
2.8.3 字符串操作和方法
2.9 基本的文本处理和分析:综合案例
2.1 0自然语言处理框架
2.1 1本章小结
第3章 处理和理解文本
3.1 文本预处理和整理
3.1.1 删除HTML标签
3.1.2 文本标记解析
3.1.3 删除重音字符
3.1.4 扩展缩写词
3.1.5 删除特殊字符
3.1.6 大小写转换
3.1.7 文本校正
3.1.8 词干提取
3.1.9 词形还原
3.1.10 删除停用词
3.1.11 将以上整合在一起——构建文本规范器
3.2 理解文本句法和结构
3.2.1 安装必要的依赖项
3.2.2 机器学习的重要概念
3.2.3 词性标注
3.2.4 浅层解析或分块
3.2.5 依存关系解析
3.2.6 成分结构解析
3.3 本章小结
……
第4章 用于文本表示的特征工程
第5章 文本分类
第6章 文本摘要和主题模型
第7章 文本相似度和聚类
第8章 语义分析
第9章 情感分析
第10章 深度学习的前景

本目录推荐