注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络计算机科学理论与基础知识基于代表记录的增量实体解析方法研究

基于代表记录的增量实体解析方法研究

基于代表记录的增量实体解析方法研究

定 价:¥68.00

作 者: 高广尚 著
出版社: 科学出版社
丛编项:
标 签: 暂缺

购买这本书可以去


ISBN: 9787030603586 出版时间: 2019-08-01 包装: 平装
开本: 16开 页数: 135 字数:  

内容简介

  《基于代表记录的增量实体解析方法研究》从记录、代表记录、相似记录、记录簇、传递闭包、并查集、实体、实体解析(entity resolution,ER)、增量实体解析(incremental entity resolution,IER)等概念出发,研究了基于代表记录的增量实体解析方法。《基于代表记录的增量实体解析方法研究》共8章,内容包括绪论、相关研究、基于代表记录的增量实体解析方法研究框架和关键问题、基于优先队列的代表记录产生模型构建方法研究、基于并查集的相似记录聚类模型构建方法研究、基于代表记录的记录簇调整模型构建方法研究、基于代表记录的增量实体解析方法的有效性实验、总结与展望。《基于代表记录的增量实体解析方法研究》可供高等院校计算机、数据分析、信息管理等专业的本科生和硕士研究生使用,也可供数据库、数据质量和数据集成领域研究人员和从业者参考。

作者简介

暂缺《基于代表记录的增量实体解析方法研究》作者简介

图书目录

第1章 绪论
1.1 研究背景
1.2 相关概念
1.2.1 记录
1.2.2 代表记录
1.2.3 相似记录
1.2.4 记录簇
1.2.5 传递闭包
1.2.6 并查集
1.2.7 实体
1.2.8 实体解析
1.2.9 增量实体解析
1.3 研究目标和意义
1.3.1 研究目标
1.3.2 研究意义
1.4 研究思路与研究方法
1.4.1 研究思路
1.4.2 研究方法
1.5 本书的组织结构
本章小结
第2章 相关研究
2.1 经典聚类算法下的实体解析方法
2.1.1 基于凝聚层次聚类的实体解析方法
2.1.2 基于k-means聚类的实体解析方法
2.1.3 基于相关性聚类的实体解析方法
2.2 一般聚类算法下的实体解析方法
2.2.1 基于优先队列的实体解析方法
2.2.2 基于相似图形的实体解析方法
2.2.3 基于相似性值的实体解析方法
2.2.4 基于比较向量的实体解析方法
2.3 增量聚类算法下的增量实体解析方法
2.3.1 基于位置敏感哈希算法的增量实体解析方法
2.3.2 基于经典聚类算法的增量实体解析方法
2.3.3 基于其他增量聚类算法的增量实体解析方法
2.4 现有研究方法中的不足分析
2.4.1 基于优先队列的实体解析方法中的不足
2.4.2 基于相关性聚类的增量实体解析方法中的不足
本章小结
第3章 基于代表记录的增量实体解析方法研究框架和关键问题
3.1 总体研究框架
3.2 基于优先队列的代表记录产生模型的关键问题及解决思路
3.2.1 代表记录产生方法分析
3.2.2 基于优先队列的代表记录产生模型的构建
3.3 基于并查集的相似记录聚类模型的关键问题及解决思路
3.3.1 相似记录聚类方法分析
3.3.2 基于并查集的相似记录聚类模型的构建
3.4 基于代表记录的记录簇调整模型的关键问题及解决思路
3.4.1 记录簇调整方法分析
3.4.2 基于代表记录的记录簇调整模型的构建
本章小结
第4章 基于优先队列的代表记录产生模型构建方法研究
4.1 代表记录产生模型构建方法的技术路线
4.2 相关定义
4.2.1 不确定属性值
4.2.2 记录间的相似性计算
4.2.3 相似记录的合并
4.3 代表记录产生模型的设计
4.3.1 待比较记录与代表记录间的相似性判定模块的设计
4.3.2 待比较记录与代表记录间的合并模块的设计
4.3.3 基于优先队列的代表记录产生模块的设计
4.4 代表记录产生模型的实现
4.4.1 待比较记录与代表记录间的相似性判定模块的实现
4.4.2 待比较记录与代表记录间的合并模块的实现
4.4.3 基于优先队列的代表记录产生模块的实现
4.5 代表记录产生模型的评测
4.5.1 实验目的
4.5.2 实验数据
4.5.3 实验过程
4.5.4 实验结果分析
4.5.5 实验结论
本章小结
第5章 基于并查集的相似记录聚类模型构建方法研究
5.1 相似记录聚类模型构建方法的技术路线
5.2 相关定义
5.2.1 记录间相似性
5.2.2 记录间相似关系的传递性
5.3 相似记录聚类模型的设计
5.3.1 基于重要属性生成高质量Key模块的设计
5.3.2 基于传递闭包发现相似记录模块的设计
5.3.3 基于并查集合并相似记录模块的设计
5.4 相似记录聚类模型的实现
5.4.1 基于重要属性生成高质量Key模块的实现
5.4.2 基于传递闭包发现相似记录模块的实现
5.4.3 基于并查集合并相似记录模块的实现
5.5 相似记录聚类模型的评测
5.5.1 实验目的
5.5.2 实验数据
5.5.3 实验过程
5.5.4 实验结果分析
5.5.5 实验结论
本章小结
第6章 基于代表记录的记录簇调整模型构建方法研究
6.1 记录簇调整模型构建方法的技术路线
6.2 相关定义
6.2.1 增量操作与增量记录
6.2.2 相似性查询
6.3 记录簇调整模型的设计
6.3.1 潜在相似代表记录的确定模块的设计
6.3.2 相关的记录簇自适应调整模块的设计
6.3.3 记录簇的代表记录更新模块的设计
6.4 记录簇调整模型的实现
6.4.1 潜在相似代表记录的确定模块的实现
6.4.2 相关的记录簇自适应调整模块的实现
6.4.3 记录簇的代表记录更新模块的实现
6.5 记录簇调整模型的评测
6.5.1 实验目的
6.5.2 实验数据
6.5.3 实验过程
6.5.4 实验结果分析
6.5.5 实验结论
本章小结
第7章 基于代表记录的增量实体解析方法的有效性实验
7.1 实验目的
7.2 实验数据
7.3 实验过程
7.3.1 新增操作下的增量实体解析
7.3.2 删除操作下的增量实体解析
7.3.3 更新操作下的增量实体解析
7.4 实验结果分析
7.5 实验结论
第8章 总结与展望
8.1 研究工作总结
8.2 本书的主要创新工作
8.3 存在的问题
8.4 未来的研究工作
参考文献
附录
附录1 基于优先队列的代表记录产生Java函数(部分代码)
附录2 基于并查集的相似记录聚类Java函数(部分代码)
附录3 基于代表记录的记录簇调整Java函数(部分代码)

本目录推荐