找回密码
 立即注册
搜索

数据挖掘中的十大实用分析方法

数据挖掘中的十大实用分析方法

1.基于历史的MBR分析

最最主要的概念是用已知的案例来预测未来案例的一些属性,通常寻找类似的案例来做比较。有两个主要因素,分别为距离函数和结合函数。距离函数的用意在找出最相似的案例,结合函数则将相似的案例属性结合起来,以共预测只用。

2.购物篮分析

最主要的目的在于找出什么样的东西应放在一起。购物篮分析基本运作过程包括下列三点:选择正确的品项,经由对共同发生矩阵的探讨挖掘出联想规则,克服实际上的限制。

3.决策树

在解决归类与预测上有着极强的能力,它以法则的方式表达,而这些法则则以一连串的问题表示出来,经由不断询问问题最终能导出所需的结果。此外,决策树可能有着不同的外型,如二元树、三元树或混合的决策树形态。

4.遗传算法

它必须预先建立好一个模式,再经由一连串类似产生新细胞过程的运作,利用合适函数决定所产生的后代是否与这个模式吻合,最后仅有最吻合的结果能够存活,这个程序一直运作到此函数收敛到最佳解。

5.聚类分析

它的目标为找出数据中以前未知的相似群体。

6.连接分析

以数学中图形理论为基础,籍由记录之间的关系发展出一个模式,它是以关系为主题,由人与人、物与物或是人与物的关系发展出相当多的应用。

7.OLAP分析

在线分析On-Line Analytic Processing

8.神经网络

以重复学习的方法,将一串例子交与学习,使其归纳出一组足以区分的样式。若面对新的例证,神经网络即可根据其过去学习的成果归纳后,推出新的结果。

9.判断分析

当所遭遇的问题的因变量为定性,而自变量为定量时,判别分析为一门非常适当之技术,通常应用在解决分类的问题上面。若因变量为两个群体所构成,称为双群体判断分析,若由多个群体构成,则称之为多元判别分析。

首先,找出预测变量的线性组合,使组间变异相对于组内变异的比值为最大,而每一个线性组合与先前已经获得的线性组合均不想关。其次,检定各组的重心是否有差异。然后,找出哪些预测变量具有最大的区别能力。最后,根据新受试者的预测变量数值,将该受试者指派到某一群体。

10.逻辑回归分析

当判别分析中群体不符合正态分布假设时,逻辑回归是个很好的替代方法。
回复

使用道具 举报

大神点评5

过敏的家 2022-6-10 19:37:06 显示全部楼层
转发了
回复

使用道具 举报

6werr3b 2022-6-10 19:37:28 显示全部楼层
转发了
回复

使用道具 举报

liynghot 2022-6-10 19:37:41 显示全部楼层
[赞][玫瑰]
回复

使用道具 举报

真羡慕你们这些有故事的人
回复

使用道具 举报

woi12hf 2022-6-13 17:12:00 显示全部楼层
强烈关注楼主~请继续!
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies