1、引言
贝叶斯分类算法是统计学的一种分类方法,它是一类应用概率统计知识停止分类的算法。在许多场合,朴素贝叶斯(Naïve Bayes,NB)分类算法可以与决策树和神经网络分类算法相媲美,该算法能运用到大型数据库中,而且方法简单、分类准确率高、速度快。
由于贝叶斯定理假设一个属性值对给定类的影响独立于其它属性的值,而此假设在实践状况中常常是不成立的,因此其分类准确率能够会下降。为此,就衍生出许多降低独立性假设的贝叶斯分类算法,如TAN(tree augmented Bayes network)算法。
2、以一个实例来描画朴素贝叶斯分类算法:
标题:下面的例子分为3类: {Short,Tall,Medium},Height为延续属性,假定该属性服从高斯分布 ,数据集如表4-5所示,请用贝叶斯分类方法对例子t=(Adam,M,1.95m)停止分类。
解:
数据样本用属性name,Gender和Height描画。类别标号属性Output具有{Short,Tall,Medium}三个不同值。
设:C1类对应于Output=”Short”,C2类对应于Output=”Tall”,C3类对应于Output=”Medium”
希望分类的已知样本为:t=(Adam,M,1.95m)
3、Word文档下载
(1)http://download.csdn.net/detail/u012339743/8829507
原文作者:Joe Chael
原文地址:http://blog.csdn.net/qingdujun/article/details/46598187 |