正文

庞杂赢得胜利(3)

智慧政府:大数据治国时代的来临 作者:徐继华


大数据所依仗的就是数据量大。要想获得大数据带来的好处,混乱应该是一种标准途径,而不应该是竭力避免的。接受数据的不完美和不精准,承认它们的杂乱,我们才能够更好地进行预测,更好地认识和理解世界万物。一旦我们能正确地看待各类数据存在的价值,我们就会发现完全不必为数据的杂乱烦恼,拥抱数据的杂乱让我们进一步接近事实的真相,更加全面地认识这个世界。这就是大数据最美的地方。

基于数据发现的五种知识类型

(1)广义型知识:根据数据的微观特性发现其表征的、带有普遍性的、高层次概念的、中观或宏观的知识。

(2)分类型知识:反映同类事物共同性质的特征型知识和不同事物之间差异型特征知识。用于反映数据的汇聚模式或根据对象的属性区分其所属类别。

(3)关联型知识:反映一个事件和其他事件之间依赖或关联的知识,又称依赖关系,这类知识可用于数据库中的归一化、查询优化等。

(4)预测型知识:通过时间序列型数据,由历史的和当前的数据预测未来的情况,它实际上是一种以时间为关键属性的关联知识。

(5)偏差型知识:通过分析标准类以外的特例、数据聚类外的离群值、实际观测值和系统预测值间的显著差别,对差异和极端特例进行描述。


上一章目录下一章

Copyright © 读书网 www.dushu.com 2005-2020, All Rights Reserved.
鄂ICP备15019699号 鄂公网安备 42010302001612号