找回密码
 立即注册
搜索

数据发掘系统学习过程应该这样

数学基础:

大部分的人说,学机器学习,只需掌握大学三门课(数学分析、线性代数、概率论与数理统计),但这很不客观,有很多数学知识是这三门课中没有讲到的,这就会成为学习的瓶颈。想深化学习机器学习的人,很有必要学习以下数学课程:

1.《矩阵分析》:机器学习很多算法需求运用计算机来计算,就需求转换成计算机所接受的格式,而且很多矩阵相关的内容在线性代数中并没有触及,所以学习《矩阵分析》是很有必要的。

书籍:引荐 Horn的《矩阵分析》

2.《统计学》:大学时期开的概率统计的次要部分在于概率,而统计部分则是浅尝即止,就算包含了大数定律、抽样分布还是参数估计,也只触及了很粗浅的一部分(是以考研数学一的标准来衡量,而并非是课本,由于答主考的就是数学一,虽然浙大那本书里甚至包含了Markov Chain,但内容真的看不下去)。这些统计知识可以说是机器学习算法的基础组成,而且在实践项目中,掌握很多统计学方法会如虎添翼。

书籍:引荐 门登霍尔的《统计学》

(以上两门课程,可以在学习机器学习算法的同时停止学习,毕竟的确很多机器学习算法只需求大学数学的程度就够了,但学习这两门课是很必要的)

3.《最优化》

optimization是大部分机器学习算法都会遇到的成绩,由于很多机器学习算法都会被变成目的函数,最优化就是用来对目的函数参数求解的工具。

引荐:鼎鼎大名的《凸优化》

此书算是一本大部头,但并不难,本人当初只要大学工科数学基础就能比较流利地通读一遍。

以及一位冤家在回复中引荐的 《最优化导论》(答主未读过,暂不评价)

————————————————

入门书单与视频:

《数据发掘导论》

学习数据发掘,要先了解其到底是什么,这本书作为入门书非常好。这本书以实践运用为主,对算法的分析只触及到一点点,经过这本书阐明的次要是算法的运转过程和意义,而非算法本身的数学推理。这本书上的内容,高中生都能读懂,但答主读了不只三遍,而且在不同的阶段阶段,读这本书都有很大的体悟和播种。

李航教师的《统计学习方法》(已更新第二版)、周志华教师的《机器学习》(西瓜书)、Mitchell的《机器学习》



这三本书都是机器学习入门的经典书籍,之所以同时引荐三本,不是为了从这三本书中选一个,而是全部买上去对照着看:《统计学习方法》对公式的推理相对详细;周志华的书内容愈加广泛,但推理不太详细;Mitchell的书重在算法的思绪,对公式的推理很粗浅,但易懂。建议学习的时分以李航教师的书为基础,对周志华教师的书停止系统的学习。

视频:台大的《机器学习基石》与《机器学习技法》

不断以来,很多人引荐的入门视频都是Andrew NG的课程,但本人愈加倾向于台大这两门课,这两门课从最基础的实际到各种典型的机器学习算法都包括,非常注重公式的推导,相比NG的课难度更高,但播种也更多。当残缺的学习残缺个课程,将会对机器学习的知识体系有很好的了解。

————————————————

实战:

《集体智慧编程》

此书无公式推导,只告诉我们哪个算法能做什么,需求做什么。虽然粗浅,但真正的触及到了数据发掘存在的意义:数据发掘真正的目的就是对数据停止分析发掘,得到有用的信息。数据发掘最基础的当然是数学和统计学,但假如只会对数学公式停止推导确不知道如何运用这些数学公式,那应该是一个假的数据迷信家。答主大一时学习的是Java,当时次要搞的是JavaEE开发,也很喜欢数据结构以及ACM,自然对于编程算是比较擅长的,答主是以一个程序员的身份末尾学习的数据发掘,所以对这本以Coding来对数据发掘停止引见的书很有好感。

《机器学习实战》[选修]

这本书是真正的造轮子,将各种机器学习算法真正的用python完成了一边,虽然对于数值分析等方面思索的并不周祥,但曾经算是一本造轮子的书。学习了机器学习算法后,造着这本书完成一遍,是一件很有成就感的事情,但这本书并非必读,答主也只是完成了其中几个算法而已,由于这本书的很多算法写的并不是很好,而想对这本书的程序停止改善,通常会走弯路,所以行不足力,则读此书

《应用Python停止数据分析》

这本书引见了最次要的python数据处理工具:numpy,pandas,matplotlib等,当通读完一遍之后,这本书就可以被当成工具书,偶然查一查。

《机器学习系统设计》

python平台上最火机器学习库一定是scikit-learn,在答主还没有预备考研的时分,这本书还没出,当时答主将次要目的放在了算法的学习上,虽然对scikit-learn爱慕已久,但苦于没有中文版的书籍又懒得读英文版(当时中二的以为本人编程很吊,等出了中文版随意看看就学会了,没有必要糜费脑细胞去读英文版),所以不断到考研结束后继续学习机器学习之路,发现这本书后,欣喜若狂,很快就将这本书买下并拜读。

————————————————

中级:

在这一阶段,基础的机器学习算法曾经不是成绩,较为深化的部分也分出了方向,答主目前在学习深度学习,但不断没有放弃深化学习机器学习的目的

机器学习:《pattern recognition and machine learning》

这本书曾经有很多人引见过了,这本书虽然是大部头,但作者写的行云流水,把贝叶斯玩的很6,思绪非常明晰,而且。每当我在推导算法的时分遇到妨碍,都会从这本书中找答案,侥幸的是这本书通常都会给我答案。比如前几天学习Boltzmann机的时分对MCMC和Gibbs算法的了解不太好,有写疑惑,我回头翻了这本书的中文版(马春鹏学长翻译的版本,我本人印成了书),读了书中第11章,又在网络上找了相关的知识,就完全了解了。

深度学习:Yoshua Bengio的《深度学习》

这本书就不引见了,由于答主也正在读这本书,而且对深度学习连入门都不算,只是有一点神经网络基础。网络上很多人引荐这本书,目前答主正在读此书第二部分,播种颇丰。

深度学习:Nielsem的《Neural Networks and Deep Learning》

这本书简短精悍,从BP算法和引见到了CNN,算是深度学习很好的入门书籍。




机器学习视频:徐亦达的机器学习视频

youtube地址:https://www.youtube.com/channel/UConITmGn5PFr0hxTI2tWD4Q/playlists

他的视频是之前在复习EM算法的时分发现本人的了解不太深,在youtube上查相关的讲解,发现到的。他上传的视频只要四个系列,次要在于公式的推导,讲解深化浅出,个人以为是非常优秀的机器学习教程。

(还有很多优秀的书籍没有引荐,比如《ESL》《MLAPP》等等,为什么没有引荐,不是书不好精神及才能有限,还未拜读到,假如日后读到了,会给补上。)

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评3

锦烛儿 2019-12-3 19:41:23 显示全部楼层
前排支持下了哦~
回复

使用道具 举报

张宇 2019-12-4 13:35:22 显示全部楼层
有没有什么需要注意的?
回复

使用道具 举报

广东梅州靓 2019-12-5 14:20:12 显示全部楼层
支持楼主,用户楼主,楼主英明呀!!!
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies