请选择 进入手机版 | 继续访问电脑版
 找回密码
 立即注册
搜索

7种最重要的数据挖掘技术

数据挖掘是查看大量信息库以生成新信息的过程。直觉上,你可能认为数据“挖掘”是指提取新数据,但事实并非如此; 相反,数据挖掘是关于从已经收集的数据中推断出模式和新知识。

数据挖掘专家依靠数据库管理,统计和机器学习的技术,致力于更好地了解如何处理信息并从大量信息中得出结论。但他们使用什么技术来实现这一目标?



数据挖掘技术

只要采用以下一种或多种技术,数据挖掘就会变得非常有效:

1.跟踪模式。数据挖掘中最基本的技术之一是学习识别数据集中的模式。这通常是对定期发生的数据中某些异常的识别,或某个变量随时间推移的潮起潮落。例如,你可能会看到某个产品的销售额似乎在节假日之前飙升,或者注意到温暖的天气会让更多人访问你的网站。

2.分类。分类是一种更复杂的数据挖掘技术,它迫使你将各种属性收集到可识别的类别中,然后可以使用这些类别来得出进一步的结论,或者提供某些功能。例如,如果你正在评估有关个人客户的财务背景和购买历史的数据,可以将其归类为“低”,“中等”或“高”信用风险。然后,使用这些分类来了解有关这些客户的更多信息。



3.关联。关联与跟踪模式有关,但对于依赖关联的变量更具体。在这种情况下,你将查找与其他事件或属性高度相关的特定事件或属性; 例如,可能会注意到,当你的客户购买特定商品时,他们通常也会购买第二个相关商品。这通常是用于填充“猜你喜欢”在线商店的部分。

4.异常值检测。在许多情况下,仅仅识别总体模式无法让的清楚地了解数据集。你还需要能够识别数据中的异常或异常值。例如,如果购买者几乎完全是男性,但在7月的一个奇怪的一周,女性购买者的数量激增,需要调查峰值,看看是什么推动了它,以便可以复制或更好地理解你的观众在这个过程中的行为和想法。



5.聚类。聚类与分类非常相似,但涉及根据数据的相似性将数据块分组在一起。例如,你可以选择根据他们拥有多少可支配收入,或者他们在商店购物的频率,将不同人群的受众群体聚类到不同的数据包中。

6.回归。回归主要用作规划和建模的一种形式,用于在存在其他变量的情况下识别某个变量的可能性。例如,你可以根据可用性,消费者需求和竞争等其他因素,使用它来预测某个价格。更具体地说,回归的主要焦点是帮助揭示给定数据集中两个(或更多)变量之间的确切关系。



7.预测。预测是最有价值的数据挖掘技术之一,因为它用于预测将来会看到的数据类型。在许多情况下,仅仅识别和理解历史趋势就足以准确预测将来会发生什么。例如,你可以查看消费者的信用记录和过去的购买情况,以预测他们将来是否会成为信用风险。

数据挖掘工具

那么是否需要最新最好的机器学习技术才能应用这些技术?不必要。实际上,你可以使用相对适中的数据库系统完成一些尖端数据挖掘,以及几乎任何公司都可以使用的简单工具。如果没有合适的工具,可以随时创建自己的工具。

无论如何处理它,数据挖掘都是充分利用已经收集的数据的最佳技术集合。只要应用正确的逻辑并提出正确的问题,你可以获得有可能彻底改变企业的结论,指导其正确地走下去。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评10

_.5`s凹特曼 2024-4-29 10:34:14 显示全部楼层
转发了
回复

使用道具 举报

n娃哈哈 2024-4-29 10:34:48 显示全部楼层
转发了
回复

使用道具 举报

Yc馃槺 2024-4-29 10:35:48 显示全部楼层
转发了
回复

使用道具 举报

li675624081 2024-4-29 10:36:05 显示全部楼层
转发了
回复

使用道具 举报

pybbs 2024-4-29 10:37:02 显示全部楼层
转发了
回复

使用道具 举报

蒙奇黄猿 2024-4-29 10:37:55 显示全部楼层
转发了
回复

使用道具 举报

vx:w1214324096 2024-4-29 10:38:22 显示全部楼层
转发了
回复

使用道具 举报

ameliehome 2024-4-29 10:38:52 显示全部楼层
转发了
回复

使用道具 举报

dayu 2024-4-29 10:39:02 显示全部楼层
你可能言中了。八零后留
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies