数据挖掘的九大定律

原标题:数据挖掘的九大定律

通用流程CRISP-DM的缔造者之一Tom Khabaza曾总结了在数据挖掘上的九大定律,如下所示。

(1)Business Goals Law:每个数据挖掘解决方案的根源都是有商业目的的。

(2)Business Knowledge Law:数据挖掘过程的每一步都需要以商业信息为中心。

(3)Data Preparation Law:数据挖掘过程前期的数据准备工作要超过整个过程的一半。

(4)NFL Law:NFL(没有免费午餐,No Free Lunch)。 对于数据挖掘者来说没有免费的午餐,数据挖掘的任何一个过程都是来之不易的。

(5)Watkins’ Law:此定律以此命名是因为David Watkins首次提出这个概念。这个定律说的是在数据的世界里,总是有模式可循的。您找不到规律不是因为规律不存在,而是因为您还没有发现它。

(6)Insight Law:数据挖掘可以把商业领域的信息放大。

(7)Prediction Law:预测可以为我们增加信息。

(8)Value Law:数据挖掘模式的精准和稳定并不决定数据挖掘过程的价值,换句话说技术手段再精妙,没有商业意义和合适的商业应用是没有价值的。

(9)Law of Change:所有的模式都会变化。

上面这九条其实归根到底就是一条,商业决定数据挖掘。数据挖掘各类技术和算法的飞速发展不能让我们偏离以商业行为为核心的方向,只是纯粹为了追求高深的技术而忽略或损害到商业目的就本末倒置了。

ETHINK数据智能分析平台http://www.ethinkbi.com,包含大数据存储与集成、大数据可视化、大数据自助分析、大数据挖掘、人工智能等核心技术,采用了分布式内存计算技术以及精心优化的分布式数据挖掘算法。ETHINK涵盖ETHINK BI商业智能产品(主要实现数据可视化,数据报表,自助分析,移动BI等功能)、ETHINK DM 数据挖掘产品(主要包括数据挖掘,机器学习,统计分析等,目前覆盖算法约200种)、ETHINK AI数据智能应用产品(主要包括认知算法、深度学习算法、特征工程,自然语言识别,文本分析等一系列数据应用)。返回搜狐,查看更多

责任编辑:

平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
推荐阅读