临近期末考试,简单总结了一下朴素贝叶斯分类器,共3个部分的内容。
朴素贝叶斯分类器的思想朴素贝叶斯分类器的通用过程两个具体例子的计算
1 朴素贝叶斯分类器的思想
对于给出的一个待分类项x,求解x出现的条件下各个类别的概率。哪个类别的概率值最大,就认为x属于哪个类别。
2 朴素贝叶斯分类器的通用过程
对于一个待分类项x ={,,,.....,},其中每个a都是x的一个特征上的取值现有类别集合C={,,,......,}计算,,,.....的值(使用朴素贝叶斯公式计算)若其中值最大,则x属于类。
朴素贝叶斯公式:
3 两个具体例子的计算
只有离散值的数据集计算
数据集如下,求当男生x={不帅,性格不好,不高,不上进}时,女生是否会选择该男生:
帅性格好身高上进是否选择Y N
NNNNYNYNYYNYYNYYYYYNNYNYNNYNYYYNYNYYYYYYYYYNNYYYYYNNNYYNNN
首先,我们从表中可以看出,共有选择和不选择两种类别,且两种类别的概率如下:
P(选择)= P(不选择)=
接下来,我们分别计算给定的男生x下女生选择和不选择的概率
因为,所以女生不会选择该男生
离散值加连续值的数据集计算
这个例子是西瓜书上的例子,我就直接截图上来,中间会加入一些公式之间的变换。
数据集如下:
其中概率计算过程如下:
那么:
将计算后的概率值带入可得:
因此该瓜属于是好瓜。
注意:
对于连续值的概率计算,公式为: