FENGER106 发表于 2024-4-29 10:33:51

7种最重要的数据挖掘技术

数据挖掘是查看大量信息库以生成新信息的过程。直觉上,你可能认为数据“挖掘”是指提取新数据,但事实并非如此; 相反,数据挖掘是关于从已经收集的数据中推断出模式和新知识。

数据挖掘专家依靠数据库管理,统计和机器学习的技术,致力于更好地了解如何处理信息并从大量信息中得出结论。但他们使用什么技术来实现这一目标?

https://p3-sign.toutiaoimg.com/pgc-image/7e7c5d4367074493b028c40d8f4fbf82~tplv-tt-large.image?_iz=30575&lk3s=06827d14&x-expires=1714963989&x-signature=KfDe%2FjeJka6v32YwqWTkj2QMglk%3D

数据挖掘技术

只要采用以下一种或多种技术,数据挖掘就会变得非常有效:

1.跟踪模式。数据挖掘中最基本的技术之一是学习识别数据集中的模式。这通常是对定期发生的数据中某些异常的识别,或某个变量随时间推移的潮起潮落。例如,你可能会看到某个产品的销售额似乎在节假日之前飙升,或者注意到温暖的天气会让更多人访问你的网站。

2.分类。分类是一种更复杂的数据挖掘技术,它迫使你将各种属性收集到可识别的类别中,然后可以使用这些类别来得出进一步的结论,或者提供某些功能。例如,如果你正在评估有关个人客户的财务背景和购买历史的数据,可以将其归类为“低”,“中等”或“高”信用风险。然后,使用这些分类来了解有关这些客户的更多信息。

https://p3-sign.toutiaoimg.com/pgc-image/2b3162aad52b40fb94ac1625c8869b96~tplv-tt-large.image?_iz=30575&lk3s=06827d14&x-expires=1714963989&x-signature=CFQoZ7itzSZpoPVGSPOFJoXA4fM%3D

3.关联。关联与跟踪模式有关,但对于依赖关联的变量更具体。在这种情况下,你将查找与其他事件或属性高度相关的特定事件或属性; 例如,可能会注意到,当你的客户购买特定商品时,他们通常也会购买第二个相关商品。这通常是用于填充“猜你喜欢”在线商店的部分。

4.异常值检测。在许多情况下,仅仅识别总体模式无法让的清楚地了解数据集。你还需要能够识别数据中的异常或异常值。例如,如果购买者几乎完全是男性,但在7月的一个奇怪的一周,女性购买者的数量激增,需要调查峰值,看看是什么推动了它,以便可以复制或更好地理解你的观众在这个过程中的行为和想法。

https://p3-sign.toutiaoimg.com/pgc-image/672847f9ad054dd5909d8f9265f0fa09~tplv-tt-large.image?_iz=30575&lk3s=06827d14&x-expires=1714963989&x-signature=3eie%2Fuf%2FODVLrWxOnova%2B6ksTM4%3D

5.聚类。聚类与分类非常相似,但涉及根据数据的相似性将数据块分组在一起。例如,你可以选择根据他们拥有多少可支配收入,或者他们在商店购物的频率,将不同人群的受众群体聚类到不同的数据包中。

6.回归。回归主要用作规划和建模的一种形式,用于在存在其他变量的情况下识别某个变量的可能性。例如,你可以根据可用性,消费者需求和竞争等其他因素,使用它来预测某个价格。更具体地说,回归的主要焦点是帮助揭示给定数据集中两个(或更多)变量之间的确切关系。

https://p3-sign.toutiaoimg.com/pgc-image/6134668935f9424caa62401ba3a7c419~tplv-tt-large.image?_iz=30575&lk3s=06827d14&x-expires=1714963989&x-signature=AYM%2F4G8g1LsOC6gKxVPd9ZmGB1Y%3D

7.预测。预测是最有价值的数据挖掘技术之一,因为它用于预测将来会看到的数据类型。在许多情况下,仅仅识别和理解历史趋势就足以准确预测将来会发生什么。例如,你可以查看消费者的信用记录和过去的购买情况,以预测他们将来是否会成为信用风险。

数据挖掘工具

那么是否需要最新最好的机器学习技术才能应用这些技术?不必要。实际上,你可以使用相对适中的数据库系统完成一些尖端数据挖掘,以及几乎任何公司都可以使用的简单工具。如果没有合适的工具,可以随时创建自己的工具。

无论如何处理它,数据挖掘都是充分利用已经收集的数据的最佳技术集合。只要应用正确的逻辑并提出正确的问题,你可以获得有可能彻底改变企业的结论,指导其正确地走下去。

_.5`s凹特曼 发表于 2024-4-29 10:34:14

转发了

n娃哈哈 发表于 2024-4-29 10:34:48

转发了

Yc馃槺 发表于 2024-4-29 10:35:48

转发了

li675624081 发表于 2024-4-29 10:36:05

转发了

pybbs 发表于 2024-4-29 10:37:02

转发了

蒙奇黄猿 发表于 2024-4-29 10:37:55

转发了

vx:w1214324096 发表于 2024-4-29 10:38:22

转发了

ameliehome 发表于 2024-4-29 10:38:52

转发了

dayu 发表于 2024-4-29 10:39:02

你可能言中了。八零后留
页: [1] 2
查看完整版本: 7种最重要的数据挖掘技术