智客公社

标题: 数据发掘十大算法之贝叶斯分类算法 [打印本页]

作者: wangdaxia7    时间: 2018-12-14 12:43
标题: 数据发掘十大算法之贝叶斯分类算法
1、引言

贝叶斯分类算法是统计学的一种分类方法,它是一类应用概率统计知识停止分类的算法。在许多场合,朴素贝叶斯(Naïve Bayes,NB)分类算法可以与决策树和神经网络分类算法相媲美,该算法能运用到大型数据库中,而且方法简单、分类准确率高、速度快。

由于贝叶斯定理假设一个属性值对给定类的影响独立于其它属性的值,而此假设在实践状况中常常是不成立的,因此其分类准确率能够会下降。为此,就衍生出许多降低独立性假设的贝叶斯分类算法,如TAN(tree augmented Bayes network)算法。

2、以一个实例来描画朴素贝叶斯分类算法:

标题:下面的例子分为3类: {Short,Tall,Medium},Height为延续属性,假定该属性服从高斯分布 ,数据集如表4-5所示,请用贝叶斯分类方法对例子t=(Adam,M,1.95m)停止分类。

[attach]83210[/attach]

解:

数据样本用属性name,Gender和Height描画。类别标号属性Output具有{Short,Tall,Medium}三个不同值。

设:C1类对应于Output=”Short”,C2类对应于Output=”Tall”,C3类对应于Output=”Medium”

希望分类的已知样本为:t=(Adam,M,1.95m)

[attach]83211[/attach]

[attach]83212[/attach]

[attach]83213[/attach]

3、Word文档下载

(1)http://download.csdn.net/detail/u012339743/8829507

原文作者:Joe Chael

原文地址:http://blog.csdn.net/qingdujun/article/details/46598187
作者: gaozhzx    时间: 2018-12-14 14:13
这个还得会点统计学的
作者: 薰轩    时间: 2018-12-14 15:41
每个字都看法,连起来就不懂了
作者: 喝点酒脸就红    时间: 2018-12-14 15:45
写这个有意思吗?贝叶斯变换都说不清,其他的谁信
作者: JVC    时间: 2018-12-14 16:42
已改进过
作者: 叶赫那拉静    时间: 2018-12-14 17:05
果然算法才是编程的最高境界 看懂了一部分  高斯分布忘了。
作者: 名户用好    时间: 2018-12-14 18:59
要是会这个,年薪快百万了,搬砖的路过。
作者: Ni-Co    时间: 2018-12-14 19:41
不明觉厉
作者: amwidtfhao    时间: 2018-12-14 19:54
mk
作者: 冰莫凝    时间: 2018-12-14 20:09
没看懂啊
作者: 李少龙    时间: 2018-12-14 20:30
概率统计
作者: danziwang    时间: 2018-12-14 21:38
一句一句看上去,尼玛真是看不懂,看来最多就是个码农了
作者: 不好de不坏    时间: 2018-12-14 21:44
搞了几天贝叶斯,做渣滓邮件过滤,误判很严重…不知道成绩在哪里…
作者: da陳_儱    时间: 2018-12-14 21:50
无论是不是沙发都得回复下
作者: 一声轻描淡写    时间: 2018-12-14 22:24
M
作者: allanboy12    时间: 2018-12-14 22:32
表示没看懂
作者: 吴风    时间: 2018-12-15 07:33
是爷们的娘们的都帮顶!大力支持




欢迎光临 智客公社 (http://bbs.cnaiplus.com/) Powered by Discuz! X3.4