注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络数据库数据库设计/管理基于R语言的自动数据收集:网络抓取和文本挖掘实用指南

基于R语言的自动数据收集:网络抓取和文本挖掘实用指南

基于R语言的自动数据收集:网络抓取和文本挖掘实用指南

定 价:¥99.00

作 者: (德)西蒙·蒙策尔特等
出版社: 机械工业出版社
丛编项:
标 签: 计算机/网络 数据仓库与数据挖掘 数据库

购买这本书可以去


ISBN: 9787111527503 出版时间: 2016-03-01 包装: 平装
开本: 16开 页数: 366 字数:  

内容简介

暂缺《基于R语言的自动数据收集:网络抓取和文本挖掘实用指南》简介

作者简介

暂缺《基于R语言的自动数据收集:网络抓取和文本挖掘实用指南》作者简介

图书目录

译者序

前  言

第1章概述

1.1案例研究:濒危世界遗产地

1.2有关网络数据质量的一些讨论

1.3传播、提取和保存网络数据的技术

1.3.1在网络上传播内容的技术

1.3.2从Web文档中提取信息的

技术

1.3.3  数据保存的技术

1.4本书的结构

第一部分网络和数据技术入门

第2章HTML

2.1浏览器显示及源代码

2.2语法规则

2.2.1标签、元素和属性

2.2.2树形结构

2.2.3注释

2.2.4保留字符和特殊字符

2.2.5文档类型定义

2.2.6  空格和换行

2.3标签和属性

2.3.1  锚标签

2.3.2  元数据标签

2.3.3  外部引用标签

2.3.4  强调标签、和



2.3.5段落标签

2.3.6  标题标签、、



2.3.7  通过、和

列举内容

2.3.8组织型标签和



2.3.9 标签及其同伴

2.3.10  外部脚本标签

2.3.11  表格标签、、



2.4解析

2.4.1  解析简介

2.4.2丢弃节点

2.4.3在创建过程中提取信息

小结

延伸阅读

习题

第3章  XML和JSON

3.1  XML文档示例

3.2 XML语法规则

3.2.1  元素和属性

3.2.2 XML结构

第4章xpath

第5章HTTP

第6章AJAX

第7章SQL和关系型数据库

第8章正则表达式和基本字符串函数

第二部分网络抓取和文本挖掘实用工具箱

第9章网络抓取

第10章统计性文本处理

第11章管理数据项目

第三部分一组案例分析

第12章美国参议院里的合作网络

第13章从半结构化文档解析信息

第14章利用Twitter预测2014年奥斯卡奖

第15章绘制姓氏地理分布图

第16章采集关于手机的数据

第17章分析产品评论里的情绪  

本目录推荐