贝叶斯算法原理

贝叶斯算法源于概率计算,是由条件概率和全概论公式推导出由数学家贝叶斯研究发现这一规律的,这在机器学习的分类决策等相关问题上有广泛应用,今天用最简单通俗易懂的语言描述一下贝叶斯算法背后的数学原理。
在理解贝叶斯原理之前首先要理解两个概念:条件概率和全概率公式。

条件概率

条件概率是指事件A在另外一个事件B已经发生条件下的发生概率。条件概率表示为:P(A|B),读作“在B条件下A的概率”。
$$P(A|B)=\frac{P(AB)}{P(B)}$$
例1:

一家有2个小孩 有一个是女孩 求另一个是男孩的概率
设A事件是有一个是女孩
设B事件是有一个是男孩
则有P(AB)=$\frac{1}{2}$
P(A)=1-$\frac{1}{4}$ 有一个是女孩的概率是除了两个都是男孩的情况
根据条件概率有
$$P(B|A)=\frac{P(AB)}{P(A)}=\frac{2}{3}$$

全概率公式

全概率公式是对条件概率的应用和推广,具体定义如下:
内容:如果事件$B_1$、$B_2$、$B_3$…$B_n$构成一个完备事件组,即它们两两互不相容,其和为全集;并且$P(B_i)$大于0,则对任一事件A有
$$P(A)=\sum{P(A|B_i)*P(B_i)}$$
例2:

完备事件组通俗的理解为一个团队,这个团队整体组成。
设三人组成一个团队完成一个比赛,比赛规则:团队中有一个人获得晋级,整个团队有0.2的概率可以晋级,如果两个人晋级则团队有0.6的概率可以晋级,,若三人都晋级则团队一定可以晋级,求团队晋级的概率
设A为团队晋级事件
设B为个人晋级事件
每个人晋级的概率$P(B_i)$=0.3
有一名成员晋级的概率为:${C_3^1}0.3*0.7^2$
有两名成员晋级的概率为:${C_3^2}0.3^2*0.7$
所有成员都晋级的概率为:$0.3^3$
由全概率公式可知团队晋级的概率为
$$ P(A)=\sum{P(A|B_i)P(B_i)}= {C_3^1}0.3*0.7^2 *0.2+{C_3^2}0.3^2*0.7*0.6+0.3^3=0.2286 $$

贝叶斯原理

给定训练数据集(X,Y),其中每个样本x都包括n维特征,即x=($x_1,x_2,x_3,…,x_n$),类标记集合含有k种类别,即y=($y_1,y_2,…,y_k$)。 如果现在来了一个新样本x,我们要怎么判断它的类别?从概率的角度来看,这个问题就是给定x,它属于哪个类别的概率最大。那么问题就转化为求解$P(y_1|x),P(y_2|x),…,P(y_k|x)中最大的那个,即求后验概率最大的输出:argmaxP(y_k|x)

坚持原创技术分享,您的支持将鼓励我继续创作!