找回密码
 立即注册
搜索

机器学习实战-sklearn引见

最近几年,机器学习算是很火的一个方向,但是有一点成绩,这个方向需求研讨生毕业的的敲门砖,但是假如本人想学,又不知道从何动手?

从本篇末尾,将会给各位看官引见怎样动手这个东西,并且怎样去运用。

文章结构
    什么是sklearn sklearn与tensorflow优优势 机器学习有几种方式 运用范畴有哪些
什么是sklearn

Sklearn原称是Scikit learn,是机器学习范畴中最知名的python模块之一,是基于Python言语的机器学习的工具。他次要建立在NumPy,SciPy,matplotlib之上,提供简单高效,用于数据发掘,数据分析等的工具,最重要的是,他是开源的,基于BSD答应证,可以商业运用。这样子,就给了我们有限的想像。

sklearn与tensorflow优优势

目前,在社区中,tensorflow会比较火,很多同窗会问,为什么不用tensorflow,这两个有什么区别,我想,次要从以下这方面来做对比

1、sklearn次要定位是一种通用的机器学习的学习库,tf次要定位还是深度学习。

2、特征工程上,sklearn提供了例如维度紧缩、特征选择等,但是这样子并不代表这tf就比sklearn弱。在传统的机器学习中,sklearn需求运用者自行对数据停止数据处理,例如停止特征选择,维度紧缩,转换格式等,但是tf可以在末尾停止数据训练的过程中,自行从数据中提取有效的特征,从而减少人为的干涉。

3、易用性及封装度上,sklearn更高,这点上,我想很多用过的人都清楚,不做负担描画。

4、面对项目的不同,sklearn更合适中小型,特别是数据量不大的项目,此时更需求手动者对数据停止处理,并且选择合适模型的项目,这些计算是可以在CPU直接计算的,没有什么硬件要求。相对的,tf的运用范畴上,往往愈加注重数据量较大,普通状况下需求GPU停止加速运算。目前很多公司并没有很大量的数据,在选择上,可以作为参考。


机器学习有几种方式

针对sklearn来讲,常常用到的次要有:数据预处理、分类、回归、分监督分类(聚类),模型选择,数据降维


运用范畴有哪些



目前,sklearn在运用中,次要有四类算法:聚类,分类,回归,降维

聚类:即非监督学习的方式,例如我有一堆人,这堆数据是没有男孩或者女孩这些标签的,此时我需求给这堆数据停止聚类,根据一些身体特征,分成两类,并标记为男孩,女孩。

分类/回归:监督学习的方式,还是那堆人,但是曾经分好类了,男孩,女孩,此时来了一个新人,我根据这个新人的特征,给他归类。

降维:假如按照字面意思来了解,那就有成绩,当数据集有很多属性的时分,我们此时需求把100个属性变成10个,并不是挑出10个,而是紧缩成10个,这10个属性,就集合了100个属性特征,简单了解,就是重要的特征就拿起来,不重要的就吸收了。

至此结束,在下一章节中,我们将会引见怎样来开发一个机器学习运用。

--END--

作者:溪云阁

原创作品,抄袭必究。

部分图片来源网络,如侵权请联络删除,谢谢!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评3

aqxu001 2020-4-6 21:36:26 显示全部楼层
占坑编辑ing
回复

使用道具 举报

极品月光猪 2020-4-7 22:25:45 来自手机 显示全部楼层
回复

使用道具 举报

蝌蚪V 2020-4-8 22:23:14 来自手机 显示全部楼层
一点毛病没有,顶你
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies