找回密码
 立即注册
搜索

Python数据挖掘入门与实践:带你入门数据挖掘技术并应用实际项目

前言


本篇作为数据挖掘入门读物,介绍了数据挖掘的基础知识、基本工具和实践方法,通过循序渐进地讲解算法,带你轻松踏上数据挖掘之旅。
本篇采用理论与实践相结合的方式,呈现了如何使用决策树和随机森林算法预测美国职业篮球联赛比赛结果,如何使用亲和性分析方法推荐电影,如何使用朴素贝叶斯算法进行社会媒体挖掘,等等。

本篇也涉及神经网络、深度学习、大数据处理等内容。

本篇面向愿意学习和尝试数据挖掘的程序员。
全面释放Python的数据分析能力,掌握大数据时代核心技术,轻松入门数据挖掘技术并将其应用于实际项目。





本篇主要分为12章的内容,由于细节内容实在是太多了,所以小编只把部分知识点截图出来粗略的介绍,每个小节都有更加细化的内容。

第1章开始数据挖掘之 旅,介绍我们即将用到的技术,接着通过讲解两个基础算法的实现方法达到热身目的。

第2章用scikit-learn估计器分类, 涵盖了数据挖掘的-一个重要主题一分类。 这一章还会介绍将数据挖掘流程标准化的流水线结构,便于你管理实验流程。

第3章用决策树预测获胜球队, 介绍决策树和随机森林两个新算法。我们将通过抽取区分度高的特征来预测获胜选手。



第4章用 亲和性分析方法推荐电影,思考根据以往消费记录推荐产品的问题,介绍Apriori算法。

第5章用转 换器抽取特征,介绍不同类别特征的抽取方法及不同数据集的处理方法。

第6章使用朴素贝叶斯进行社会媒体挖掘,使用朴素贝叶斯算法自动分析来自社交网站Twitter的文本信息。

第7章用图挖掘找到感兴趣的人, 采用聚类和网络分析方法, 发现社会媒体上感兴趣的人。

第8章用神经网络 破解验证码,从图像中抽取信息,然后训练神经网络,来发现图像中的单词和字母。



第9章作者归属问题, 通过抽取文本特征,使用支持向量机算法。

第10章新闻语料分类, 使用k-means聚类算法, 根据新闻文章内容进行分类。

第11章用深度学 习方法为图像中的物体进行分类,采用深度神经网络算法确定图像中的物体。



第12章大数据处理, 探讨对大数据进行数据挖掘的流程及方法。



由于篇幅限制,所以小编就不做过的介绍啦,需要本【Python数据挖掘入门与实践】技术文档的小伙伴,就可以转发关注小编,私信小编“学习”来得到获取方式啦~~~~




在数据规模急速膨胀的大数据时代,数据挖掘这项甄别重要数据的核心技术正发挥越来越重要的作用。它将赋予你解决实际问题的“超能力”:预测体育赛事结果、精确投放广告、根据作品的风格解决作者归属问题,等等。

本篇使用简单易学且拥有丰富第三方库和良好社区氛围的Python语言,由浅入深,以真实数据作为研究对象,真刀实枪地向读者介绍Python数据挖掘的实现方法。通过本篇,读者将迈入数据挖掘的殿堂,透彻理解数据挖掘基础知识,掌握解决数据挖掘实际问题的最佳实践!

理解决策树、朴素贝叶斯、支持向量机和深度学习

运用常见算法为解决现实问题建立数据模型

利用API从Reddit等网站获取数据集

从数据集中找出并提取特征

使用数据集设计并开发数据挖掘应用

基于实时数据,进行大数据处理

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评2

xyc999 2022-6-17 21:57:00 显示全部楼层
转发了
回复

使用道具 举报

我爱胡杨树 2022-6-20 21:23:31 显示全部楼层
优质内容,应该长期发下去。别看了,就说你呢。
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies