找回密码
 立即注册
搜索

机器学习实践指南 案例应用解析(推书活动第七期)





本来准备等小嗷公众号涉及到相关内容就从网上搜一下相关pdf推送给大家,结果发现大伙的学习速度,远超小嗷的写文速度.....
机器学习实践指南 案例应用解析

当然,小嗷的原则是能在图书馆借到的话,买书尽量不要买。很多时候,我们不是急需书上内容,往往看几眼就扔在一个角落,或者看完过几个月忘了差不多。
内容简介

机器学习及数据分析领域不可多得的一本著作,也是为数不多的既有大量实践应用案例又包含算法理论剖析的著作,作者针对机器学习算法既抽象复杂又涉及多门数学学科的特点,力求理论联系实际,始终以算法应用为主线,由浅入深以全新的角度诠释机器学习。全书分为准备篇、基础篇、统计分析实战篇和机器学习实战篇。准备篇介绍了机器学习的发展及应用前景以及常用科学计算平台,主要包括统计分析语言r、机器学习模块mlpy和neurolab、科学计算平台numpy、图像识别软件包opencv、网页分析beautifulsoup等软件的安装与配置。基础篇先对数学基础及其在机器学习领域的应用进行讲述,同时推荐配套学习的数学书籍,然后运用实例说明计算平台的使用,以python和r为实现语言,重点讲解了图像算法、信息隐藏、最小二乘法拟合、因子频率分析、欧氏距离等,告诉读者如何使用计算平台完成工程应用。最后,通过大量统计分析和机器学习案例提供实践指南,首先讲解回归分析、区间分布、数据图形化、分布趋势、正态分布、分布拟合等数据分析基础,然后讲解神经网络、统计算法、欧氏距离、余弦相似度、线性与非线性回归、数据拟合、线性滤波、图像识别、人脸辨识、网页分类等机器学习算法。此书可供算法工程师、it专业人员以及机器学习爱好者参考使用
推荐序  前言  第一部分 准备篇第1章 机器学习发展及应用前景 21.1 机器学习概述 21.1.1 什么是机器学习 31.1.2 机器学习的发展 31.1.3 机器学习的未来 41.2 机器学习应用前景 51.2.1 数据分析与挖掘 51.2.2 模式识别 61.2.3 更广阔的领域 61.3 小结 7第2章 科学计算平台 82.1 科学计算软件平台概述 92.1.1 常用的科学计算软件 92.1.2 本书使用的工程计算平台 102.2 计算平台的配置 112.2.1 Numpy等Python科学计算包的安装与配置 112.2.2 OpenCV 安装与配置 142.2.3 mlpy 安装与配置 142.2.4 BeautifulSoup安装与配置 152.2.5 Neurolab安装与配置 152.2.6 R安装与配置 162.3 小结 16第二部分 基础篇第3章 计算平台应用实例 183.1 Python计算平台简介及应用实例 183.1.1 Python语言基础 183.1.2 Numpy库 293.1.3 pylab、matplotlib绘图 363.1.4 图像基础 383.1.5 图像融合与图像镜像 463.1.6 图像灰度化与图像加噪 483.1.7 声音基础 513.1.8 声音音量调节 533.1.9 图像信息隐藏 583.1.10 声音信息隐藏 623.2 R语言基础 683.2.1 基本操作 693.2.2 向量 713.2.3 对象集属性 773.2.4 因子和有序因子 783.2.5 循环语句 793.2.6 条件语句 793.3 R语言科学计算 803.3.1 分类(组)统计 803.3.2 数组与矩阵基础 813.3.3 数组运算 843.3.4 矩阵运算 853.4 R语言计算实例 933.4.1 学生数据集读写 933.4.2 最小二乘法拟合 943.4.3 交叉因子频率分析 963.4.4 向量模长计算 973.4.5 欧氏距离计算 983.5 小结 99思考题 99第4章 生产环境基础 1004.1 Windows Server 2008基础 1004.1.1 Windows Server 2008 R2概述 1014.1.2 Windows PowerShell 1024.2 Linux基础 1034.2.1 Linux命令 1044.2.2 Shell基础 1144.3 Vim编辑器 1224.3.1 Vim编辑器概述 1224.3.2 Vim常用命令 1234.4 虚拟化平台 1244.4.1 Citrix Xenserver概述 1254.4.2 Citrix Xenserver部署 1264.4.3 基于XenCenter的虚拟服务器管理 1264.5 Linux环境下的NumPy安装 1354.6 Linux环境下的R运行环境 1364.7 PyPy编译器 1364.7.1 PyPy概述 1364.7.2 PyPy安装与配置 1374.7.3 PyPy性能 1374.7.4 PyPy实践之Lempel-Ziv压缩 1384.8 小结 145思考题 146第三部分 统计分析实战篇第5章 统计分析基础 1485.1 数据分析概述 1485.2 数学基础 1495.3 回归分析 1545.3.1 单变量线性回归 1545.3.2 多元线性回归 1565.3.3 非线性回归 1575.4 数据分析基础 1595.4.1 区间频率分布 1595.4.2 数据直方图 1615.4.3 数据散点图 1625.4.4 五分位数 1645.4.5 累积分布函数 1655.4.6 核密度估计 1665.5 数据分布分析 1675.6 小结 169思考题 170第6章 描述性分析案例 1716.1 数据图形化案例解析 1716.1.1 点图 1716.1.2 饼图和条形图 1726.1.3 茎叶图和箱线图 1736.2 数据分布趋势案例解析 1756.2.1 平均值 1756.2.2 加权平均值 1756.2.3 数据排序 1766.2.4 中位数 1776.2.5 极差、半极差 1776.2.6 方差 1786.2.7 标准差 1786.2.8 变异系数、样本平方和 1786.2.9 偏度系数、峰度系数 1796.3 正态分布案例解析 1806.3.1 正态分布函数 1806.3.2 峰度系数分析 1816.3.3 累积分布概率 1816.3.4 概率密度函数 1826.3.5 分位点 1836.3.6 频率直方图 1856.3.7 核概率密度与正态概率分布图 1856.3.8 正态检验与分布拟合 1866.3.9 其他分布及其拟合 1886.4 多变量分析 1896.4.1 多变量数据分析 1896.4.2 多元数据相关性分析 1976.5 小结 201思考题 201第7章 假设检验与回归模型案例 2027.1 假设检验 2027.1.1 二项分布假设检验 2027.1.2 数据分布检验 2047.1.3 正态总体均值检验 2057.1.4 列联表 2067.1.5 符号检测 2077.1.6 秩相关检验 2107.1.7 Kendall相关检验 2137.2 回归模型 2147.2.1 回归预测与显著性检验 2147.2.2 回归诊断 2167.2.3 回归优化 2177.2.4 主成分回归 2197.2.5 广义线性模型 2217.3 小结 226思考题 226第四部分 机器学习实战篇第8章 机器学习算法 2308.1 神经网络 2308.1.1 Rosenblatt感知器 2328.1.2 梯度下降 2458.1.3 反向传播与多层感知器 2518.1.4 Python神经网络库 2708.2 统计算法 2728.2.1 平均值 2728.2.2 方差与标准差 2748.2.3 贝叶斯算法 2768.3 欧氏距离 2798.4 余弦相似度 2808.5 SVM 2818.5.1 数学原理 2818.5.2 SMO算法 2838.5.3 算法应用 2838.6 回归算法 2878.6.1 线性代数基础 2888.6.2 最小二乘法原理 2898.6.3 线性回归 2908.6.4 多元非线性回归 2928.6.5 岭回归方法 2948.6.6 伪逆方法 2958.7 PCA降维 2968.8 关联规则 2978.8.1 关联规则概述 2978.8.2 频繁项集算法 2988.8.3 关联规则生成 3018.8.4 实例分析 3028.9 自动分类 3068.9.1 聚类算法 3068.9.2 决策树 3138.9.3 AdaBoost 3168.9.4 竞争型神经网络 3178.9.5 Hamming神经网络 3238.10 小结 325思考题 325第9章 数据拟合案例 3279.1 数据拟合 3279.1.1 图像分析法 3279.1.2 神经网络拟合法 3389.2 线性滤波 3529.2.1 WAV声音文件 3529.2.2 线性滤波算法过程 3529.2.3 滤波Python实现 3539.3 数据或曲线平滑 3589.3.1 平滑概述 3589.3.2 移动平均 3599.3.3 递归线性过滤 3629.3.4 指数平滑 3649.4 小结 368思考题 368第10章 图像算法案例 37010.1 图像边缘算法 37010.1.1 数字图像基础 37010.1.2 算法描述 37110.2 图像匹配 37210.2.1 差分矩阵求和 37310.2.2 差分矩阵均值 37510.2.3 欧氏距离匹配 37610.3 图像分类 38210.3.1 余弦相似度 38210.3.2 PCA图像特征提取算法 38810.3.3 基于神经网络的图像分类 38910.3.4 基于SVM的图像分类 39410.4 高斯噪声生成 39710.5 二值化 40110.5.1 threshold 40110.5.2 adaptiveThreshold 40210.6 插值与缩放 40410.7 仿射 40510.7.1 仿射原理 40510.7.2 仿射变换实例 40510.8 透视投影与透视变换 40610.8.1 透视投影原理 40610.8.2 透视投影实例 40710.9 灰度变换与图像增强 40910.9.1 灰度变换概述 40910.9.2 对数变换 40910.9.3 分段线性变换 41010.9.4 指数变换 41110.9.5 直方图均衡化 41210.10 图像滤波与除噪 41510.10.1 均一化块滤波 41510.10.2 邻域平均法 42010.10.3 中值滤波 42310.10.4 高斯滤波 42710.10.5 双边滤波 42910.10.6 卷积滤波 43110.10.7 边缘检测 43310.11 小结 435思考题 435第11章 机器视觉案例 43711.1 人脸辨识 43711.1.1 人脸定位 43711.1.2 人脸辨识 43911.2 手写数字识别 44611.2.1 手写数字识别算法 44611.2.2 算法的Python实现 44711.3 运动侦测 44911.3.1 视频采集 45011.3.2 差分算法 45211.3.3 光流法 45611.4 形状检测 45811.4.1 KNN算法概述 45811.4.2 形状特征提取 45911.4.3 形状分类 45911.5 小结 462思考题 462第12章 文本分类案例 46312.1 文本分类概述 46312.2 余弦相似度分类 46412.2.1 中文分词 46512.2.2 停用词清理 46712.2.3 算法实战 46812.3 朴素贝叶斯分类 47312.3.1 算法描述 47312.3.2 先验概率计算 47412.3.3 最大后验概率 47412.3.4 算法实现 47412.4 自然语言处理 48012.4.1 NLTK简介 48012.4.2 NLTK与jieba的配置 48112.4.3 中文分词并标注词性 48312.4.4 词特征指标分析 48412.4.5 Web文档分析 49912.4.6 Web文档的朴素贝叶斯分类 50312.4.7 语法结构分析 51512.4.8 Web文档聚类 51812.5 小结 526思考题 526 如果大家的代码不怎么好,小嗷还是建议大家先学学代码,当闲书看。
如果大家的数学不怎么好,小嗷还是建议大家先看看小嗷文章中有关数学的内容,还是看不懂就看高数或者看免费视频(网易可汗公开课)。
小嗷是不建议大伙因为数学付费。
第一,中国的金融,你使用什么高深的数学和什么鬼深度学习是行不通。
第二,学好代码,起码能混口饭吃。
第三,小嗷不喜欢All in,这边不行,那边起码过着还可以。(想想父辈那代从泥水工出身到包工头老板,就知道路不止一条,没必要All in)
当然,每年都有书籍打折季,到时小嗷会通知一下大家或者大家通知一下小嗷
书籍源码:
https://pan.baidu.com/s/1nw37A5N
pdf链接如下:
https://pan.baidu.com/s/1nTM4b4-YkkiNNNT-syznRw
提取码:c9kp
pdf均来自百度,Google以及csdn,小嗷只提供链接,如有侵犯版权,小嗷立即删除链接,谢谢大家支持。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies