数据挖掘有哪两种方法?——数字化转型网数据专题
数据挖掘的2种方法是什么?——数字化转型网数据专题
比较数据挖掘和统计分析的区别,数据挖掘是知识发现,统计分析是假设检验,但真的是这样吗?
假设检验(面向目标) 数据挖掘有一个客观变量来预测购买量和客户反应,并据此对客户进行分类。回归分析、决策树和神经网络等许多技术都用于有目的地构建模型。
知识发现(探索性)数据挖掘没有目标变量,试图从获得的数据中寻找有用的规则、模式、相似性等,作为一种典型的方法用于购物篮分析,属于关联分析。
在假设检验数据挖掘中,估计和理解是指估计和理解定量的数字,例如在什么地区销售什么样的产品,销售多少。分类提炼 是指将各个地区畅销的产品和产品类别进行提炼,分类整理后进行分析。这两个是为了正确识别当前的情况,但预测 不是当前的情况,而是通过创建某种模型来预测未来的销量和畅销产品。统计分析处理的数据量比较少,数据挖掘可能更多。数据挖掘也有知识发现的成分,但不是通过输入数据就能自动发现的。应该认识到数据挖掘有两种类型:不仅是知识发现,还有假设检验,就像统计分析一样。
另一方面,知识启发式数据挖掘 关联规则制定 是探索性地同时知道买了什么和买了什么。 聚类 是指根据购买趋势等对相似的人进行分组,并尝试对每个组实施最佳措施。由于这两种方法没有目标变量,所以它们对应于多元分析中的汇总方法,但也不是没有目标的。
聚类和分类的区别在于分组依据是基于预定义的属性、购买金额等,还是分组基于事后定义的探索性依据。分位分析、RFM 分析等是对客户进行分组的类似方法,但基于预定义的标准,例如购买数量和频率。在聚类分析中,由于某种原因,分组是任意的,并且在事后进行分析以了解组的特征,因此方法完全不同。
文本挖掘是一种具有代表性的 了解群体特征 的数据挖掘方法,用于假设检验和知识发现。文本挖掘可用于定性和定量地了解有目的所说的内容,或探索性地发现所说的内容。
这样就有了两种类型的数据挖掘:假设检验(面向目标)数据挖掘和知识发现(探索)数据挖掘。 向楼主学习 不错 支持下 我也来顶一下..
页:
[1]