数据挖掘技术：市场营销、销售与客户关系管理领域应用（原书第二版）

定　价：¥49.00

作　者：	（美）贝瑞（Berry,M.J.A.），（美）莱诺夫（Linoff,G.S.）著，别荣芳，尹静，邓六爱译
出版社：	机械工业出版社
丛编项：	计算机科学丛书
标　签：	数据库存储与管理

购买这本书可以去

ISBN：	9787111190561	出版时间：	2006-07-01	包装：	胶版纸
开本：	16开	页数：	410	字数：

内容简介

　　本书是一本优秀的数据挖掘教材，全面而系统地介绍了数据挖掘酌商业环境、数据挖掘技术及其在商业环境中的应用。.全书共18章，内容涵盖核心的数据挖掘技术，包括：决策树、神经网络、协同过滤、关联规则、链接分析、聚类和生存分析等。此外，还提供了数据挖掘最佳实践的概观、数据挖掘的最新进展和一些极具挑战性的研究课题，极具技术深度与广度。通过学习本书，读者不仅可以精通数据挖掘的整体结构和核心技术，还可以领略数据挖掘在销售和客户关系管理等方面的成功应用，为实践数据挖掘打下坚实的基础。本书适合作为高等院校相关专业高年级本科生或研究生的教材或参考书，也适合当前和未来的数据挖掘实践者学习和参考。..本书是数据挖掘领域的经典著作，数年来畅销不衰。全书从技术和应用两个方面，全面、系统地介绍了数据挖掘的商业环境、数据挖掘技术及其在商业环境中的应用。自从1997年本书第1版出版以来，数据挖掘界发生了巨大的变化，其中的大部分核心算法仍然保持不变，但是算法嵌入的软件、应用算法的数据库以及用于解决的商业问题都有所演进。第2版展示如何利用基本的数据挖掘方法和技术，解决常见的商业问题。本书涵盖核心的数据挖掘技术，包括：决策树、神经网络、协同过滤、关联规则、链接分析、聚类和生存分析等。此外，还提供了数据挖掘最佳实践、数据挖掘的最新进展和一些富有挑战性的研究课题，极具技术深度与广度。配套网站www．data-miners．com／companion提供了每章的练习和用于测试各种数据挖掘技术的数据。全书语句凝炼、清新，对复杂概念的实际应用进行了生动解释，是必不可少的数据挖掘教材。...

作者简介

　　本书提供作译者介绍Michael J. A. Berry， Gordon S. Linoff，他们是专业的数据挖掘咨询公司DataMiners的创办人。他们合作出版了一些经典的数据挖掘著作，包括Data Mining Techniques、Mastering Data Mining和Mining the Web（均由Wilev公司出版）。作为数据挖掘顾问，他们一起为北美洲、欧洲和亚洲的许多大公司提供专业咨询，把客户数据、呼叫数据、网络日志条目、销售点记录和账单文件变成有用的信息，用于改善客户体验。他们都有近20年在营销和客户关系管理方面应用数据挖掘技术的经验。...

图书目录

第1章数据挖掘的缘起和内容
11分析客户关系管理系统
111交易处理系统的作用
112数据仓库的作用
113数据挖掘的作用
114客户关系管理策略的作用
12什么是数据挖掘
13数据挖掘可以完成哪些工作
131分类
132估计
133预测
134关联分组或关联规则
135聚类
136建立简档
14为什么现在研究
141数据正在生成
142数据正在形成数据仓库
143计算能力足以承受
144客户关系管理的兴趣增强
145商业数据挖掘软件产品已经易于使用
15目前如何使用数据挖掘
151超级市场成为信息经纪人
152基于推荐的商业
153交叉销售
154抓住好的客户
155淘汰差的客户
156变革一个行业
157其他
16小结
第2章数据挖掘的良性循环
21商业数据挖掘案例研究
211识别商务挑战
212应用数据挖掘
213按照结果采取行动
214测试效果
22何谓良性循环
221识别商业机会
222挖掘数据
223采取行动
224测试结果
23良性循环环境下的数据挖掘
24移动通信公司建立恰当的联系
241机会
242如何应用数据挖掘
243处理行动
244完成循环
25神经网络和决策树驱动SUV的销售
251最初的挑战
252如何应用数据挖掘
253最终措施
254完成循环
26小结
第3章数据挖掘方法论和最佳实践
31为什么需要方法论
311获取不真实的知识
312获取真实但无用的知识
32假设测试
33模型、建立简档和预测
331建立简档
332预测
34方法论
341第一步：将商业问题转换为数据挖掘问题
342第二步：选取合适数据
343第三步：设法理解数据
344第四步：创建模型集
345第五步：修复数据问题
346第六步：变换数据，获取信息
347第七步：建立模型
348第八步：评估模型
349第九步：部署模型
3410第十步：评估结果
3911第十一步：重新开始
35小结
第4章数据挖掘在市场营销和客户关系管理中的应用
41寻找潜在客户
411识别好的潜在客户
412选择沟通渠道
413遴选适当的信息
42为选择正确的广告场所进行数据挖掘
421谁匹配简档
422测量读者群组的匹配度
43通过数据挖掘改进定向市场营销活动
431响应建模
432优化固定预算的响应率
433优化营销活动收益
434接触那些受相关信息影响最大的人们
435差别响应分析
44使用当前客户来了解潜在客户
441在他们成为客户前就开始跟踪客户
442从新客户那里收集信息
443获取时间变量可预测未来结果
45客户关系管理数据挖掘
451按客户需求策划营销活动
452划分客户群体
453减少信用风险
454决定客户价值
455交叉销售、提升销售和销售推荐
46保持和流失
461识别流失
462流失为什么重要
463不同类型的流失
464不同类型的流失模型
47小结
第5章统计学的魅力：数据挖掘常用的工具
51Occam的剃刀
511原假设
512p值
52观察数据
521观察离散数值
522观察连续变量
523另一对统计概念
53测定响应
531比例标准误差
532使用置信界限比较结果
533使用比例差值比较结果
534样本大小
535置信区间的真正含义
536实验的测试群组和对照群组大小
54多重比较
541多重比较下的置信层次
542Bonferroni修正
55卡方检验
551期望值
552卡方值
553卡方与比例差值的比较
56示例：区域和起点的卡方
57数据挖掘和统计学异同
571原始数据中没有测量误差
572有大量的数据
573时间从属性随处出现
574试验是艰难的
575数据审查和截取
58小结
第6章决策树
61什么是决策树
611分类
612评分
613估计
614树以多种形态生长
62决策树是如何长成的
621发现拆分
622生成完全树
623度量决策树的有效性
63选择最佳拆分的测试
631纯度和发散性
632基尼或总体发散性
633熵归约或信息增益
634信息增益比率
635卡方检验
636方差归约
637F测试
64修剪
641CART修剪算法
642C5修剪算法
643基于稳定性的修剪
65从树中提炼规则
66考虑成本
67决策树方法的进一步修正
671每次使用多于一个字段
672倾斜超平面
673神经树
674使用树分段回归
68决策树的替代表示法
681方格图
682树年轮图
69实际应用中的决策树
691决策树作为数据探查工具
692把决策树方法应用于顺序事件
693模拟未来
610小结
第7章人工神经网络
71历史回眸
72房地产评估
73用于定向数据挖掘的神经网络
74神经网络是什么
741神经网络的单元是什么
742前馈神经网络
743神经网络如何使用反向传播学习
744前馈网络和反向传播网络的启发
75选择训练集
751覆盖所有特征值
752特征数目
753训练集的大小
754输出数目
76准备数据
761具有连续数值的特征
762具有有序、离散(整数)数值的特征
763具有分类数值的特征
764其他类型的特征
77解释结果
78时间序列神经网络
79如何了解在神经网络内部正在运行的事情
710自组织映像
7101什么是自组织映像
7102实例：发现簇
711小结
第8章最近邻方法：基于存储的推理和协同过滤
81基于存储的推理
82MBR面临的挑战
821选择一组平衡的历史记录
822表示训练数据
823确定距离函数、组合函数和邻居的数目
83案例研究：分类新闻报导
831什么是代码
832应用MBR
833结果
84测量距离
841什么是距离函数
842每次每个字段只建立一个距离函数
843其他数据类型的距离函数
844当距离度量已经存在时
85组合函数：向邻居求答案
851基本的方法：民主
852加权投票
86协同过滤：可以做出推荐的最近邻方法
861建立简档
862比较简档
863做出预测
87小结
第9章购物篮分析和关联规则
91定义购物篮分析
911购物篮数据的三个层次
912订单特征
913项流行性
914跟踪市场干预
915按用途聚类产品
92关联规则
921可操作的规则
922平凡的规则
923费解的规则
93一个关联规则有多好
94建立关联规则
941选择恰当的项集
942从所有这些数据中生成规则
943克服实际局限
944大数据的问题
95扩展思想
951使用关联规则比较店铺
952无关规则
96使用关联规则的顺序分析
97小结
第10章链接分析
101图论基础
1011哥尼斯堡七桥问题
1012旅行推销员问题
1013有向图
1014检测图中的环
102链接分析的一个熟悉的应用
1021Kleinberg算法
1022细节：查找网络中心和权威
1023实践中的网络中心和权威
103案例研究：谁在家中使用传真机
1031为什么发现传真机是有用的
1032用数据画图
1033方法
1034一些结果
104案例研究：分段移动电话客户
1041数据
1042不使用图论的分析
1043两位客户的对比
1044链接分析的力量
105小结
第11章自动聚类探测
111搜索单纯岛状片段
1111星光与星的亮度
1112适应多维情况
112K平均聚类
1121K平均算法的三个步骤
1122K的意义
113相似性和距离
1131相似性度量与变量类型
1132相似性的常规度量
114聚类过程的数据准备
1141利用比例缩放使变量相对一致
1142使用权重编码外部信息
115聚类探测的其他途径
1151高斯混合模型
1152凝聚聚类
1153分裂聚类
1154自组织映像
116评价簇
1161在簇内部
1162在簇之外
117案例研究：聚类城镇
1171创造城镇特征
1172创建簇
1173利用主题簇调整区域边界
118小结
第12章市场营销中的风险函数和生存分析
121客户保持
1211计算保持
1212保持曲线揭示的内容
1213从保持曲线找出平均保有期
1214把客户保持看做衰变
122风险
1221基本思想
1222风险函数示例
1223审查
1224其他类型的审查
123从风险到生存
1231保持
1232生存
124比例风险
1241比例风险实例
1242分层：测量生存的初始结果
1243Cox比例风险
1244比例风险的局限性
125生存分析实践
1251处理不同的流失类型
1252客户何时会回来
1253预测
1254风险随时间变化
126小结
第13章遗传算法
131遗传算法如何工作
1311计算机上的遗传学
1312表示数据
132案例研究：使用遗传算法进行资源优化
133模式：遗传算法为什么起作用
134遗传算法的更多应用
1341在神经网络方面的应用
1342案例研究：为响应建模完善一个解决方案
135超越简单算法
136小结
第14章数据挖掘贯穿客户生存周期
141客户关系层次
1411深度亲密
1412大众亲密
1413中间关系
1414间接关系
142客户生存周期
1421客户生存周期：生存阶段
1422客户生存周期
1423基于订阅关系和基于事件关系的比较
143围绕客户生存周期组织商业过程
1431客户获取
1432客户激活
1433关系管理
1434保持
1435赢回
144小结
第15章数据仓库、 OLAP和数据挖掘
151数据结构
1511交易数据——基础层
1512操作汇总数据
1513决策支持汇总数据
1514数据库模式
1515元数据
1516商业规则
152数据仓库的大致结构
1521源系统
1522提取、转化和加载
1523中央储存库
1524元数据储存库
1525数据集市
1526操作反馈
1527最终用户和桌面工具
153OLAP适用于何处
1531立方体中的内容
1532星形模式
1533OLAP和数据挖掘
154数据挖掘在哪里切入数据仓库
1541大量数据
1542一致的、清洁的数据
1543假设测试和测量
1544可升级硬件及RDBMS支持
155小结
第16章构造数据挖掘环境
161以客户为中心的组织
162理想的数据挖掘环境
1621确定什么数据可用的能力
1622将数据转化为可操作信息的技巧
1623所有必需的工具
163返回现实世界
1631建立以客户为中心的组织
1632创建单个客户视图
1633定义以客户为中心的度量标准
1634收集正确的数据
1635从客户交互到学习机会
1636挖掘客户数据
164数据挖掘组
1641外包数据挖掘
1642内部数据挖掘
1643数据挖掘组成员需要具备的条件
165数据挖掘基础设施
1651挖掘平台
1652评分平台
1653一个产品数据挖掘结构实例
166数据挖掘软件
1661所应用的技术范围
1662可扩展性
1663评分支持
1664用户界面的多种层次
1665可理解的输出
1666处理各种数据类型的能力
1667文档及简单使用
1668对新手和高级用户的培训、咨询和支持
1669卖方可信度
167小结
第17章为挖掘准备数据
171数据应该像什么
1711客户特征标识
1712列
1713模型在建模中的角色
1714变量度量
1715用于数据挖掘的数据
172构建客户特征标识
1721编写数据目录
1722识别客户
1723第一次尝试
1724取得进展
1725实际的问题
173探查变量
1731直方图分布
1732随时间变化
1733交叉表
174衍生变量
1741提取来自单个数值的特征
1742在记录内合并数值
1743查找辅助信息
1744转轴正则时间序列
1745汇总交易记录
1746汇总跨越模型集的字段
175基于行为变量的例子
1751购买频率
1752衰减使用
1753旋转者、交易商和便利用户：定义客户行为
176数据的黑暗面
1761缺失值
1762脏数据
1763不一致数值
177计算问题
1771源系统
1772提取工具
1773专用代码
1774数据挖掘工具
178小结
第18章应用数据挖掘
181开始
1811从概念验证方案中能期待什么
1812识别概念验证方案
1813实现概念验证方案
182选择数据挖掘技术
1821将商务目标转换为数据挖掘任务
1822决定数据的相关特性
1823考虑混合方法
183公司如何开展数据挖掘
1831保持的对照实验
1832数据
1833一些发现
1834实践出真知
184小结