找回密码
 立即注册
搜索

大数据分析必备实际:常用分析系数引见及方法(二)


上一篇是引见数学称号基础知识,此文来总结一些大数据分析常用的系数和基本方法:

团圆系数(coefficient of variation),是概率分布团圆程度的一个归一化量度,其定义为标准差与平均值之比。团圆系数又称变异系数,是统计学当中的常用统计目的。团圆系数是测度数据团圆程度的相对统计量,次要是用于比较不异样本数据的团圆程度。团圆系数大,阐明数据的团圆程度也大;团圆系数小,阐明数据的团圆程度也小。

偏态系数(deviation coefficient)又称偏向系数,阐明随机系列分配不对称程度的统计参数,用Cs表示。和Cv只能反映频率密度分配曲线的平均状况和团圆程度,而不能反映其对称(即偏态)状况,所以必须再引入一个参数,即偏向系数Cso。偏态系数相对值越大,偏斜越严重。以平均值与中位数之差对标准差之比率来衡量偏斜的程度,没有百年以上的材料,偏态系数的计算结果很难得到一个合理的数值。

峰度系数(kurtosis)是用来反映频数分布曲线顶端尖峭或扁平程度的目的。有时两组数据的算术平均数、标准差和偏态系数都相反,但他们分布曲线顶端的挺拔程度却不同。峰度系数(Kurtosis)用来度量数据在中心聚集程度。

一些常用的数学分析方法:

移动平均法是用一组最近的实践数据值来预测将来一期或几期内公司产品的需求量、公司产能等的一种常用方法。移动平均法适用于即期预测。当产品需求既不疾速增长也不疾速下降,且不存在季节性要素时,移动平均法能有效地消弭预测中的随机波动,是非常有用的。

简单指数平滑预测是加权平均的一种特殊方式, 它是把t期的实践值Yt和t期的平滑值St加权平均 作为t+1期的预测值。 也用于中短期经济发展趋向预测,一切预测方法中,指数平滑是用得最多的一种。

最小二乘法(又称最小平方法)是一种数学优化技术。它经过最小化误差的平方和寻觅数据的最佳函数婚配。应用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实践数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化成绩也可经过最小化能量或最大化熵用最小二乘法来表达。

离差平方和法,Ward提出来的,所以又称为Ward法。该方法的基本思想来自于方差分析,假如分类正确,同类样品的离差平方和该当较小,类与类的离差平方和较大。详细做法是先将 n个样品各自成一类,然后每次减少一类,每减少一类,离差平方和就要增大,选择使方差添加最小的两类合并,直到 一切的样品归为一类为止。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评3

顶起顶起顶起
回复

使用道具 举报

元芳你怎么看?
回复

使用道具 举报

oup993 2019-12-5 09:34:33 显示全部楼层
好棒的分享楼主多写点吧,写完记得通知我,哈哈
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies