已知某人身高6英尺,身高165体重180全身照30磅,脚掌8英寸,请问该人是男是女

  生活中很多场合需要用到分类仳如新闻分类、病人分类等等实际用用场景。为了让大家可以形象的理解本文从实际的应用入手介绍一种简单的常用分类算法----朴素贝叶斯(Navie Bayes classifier)。

让我从一个例子开始讲起你会看到贝叶斯分类器很好懂,一点都不难某个医院早上收了六个门诊病人,如下表

现在又来了第七個病人,是一个打喷嚏的建筑工人请问他患上感冒的概率有多大? 根据贝叶斯定理:

P(感冒|打喷嚏x建筑工人)     = P(打喷嚏x建筑工人|感冒) x P(感冒)     / P(打喷嚏x建筑工人)

假定"打喷嚏"和"建筑工人"这两个特征是独立的因此,上面的等式就变成了

P(感冒|打喷嚏x建筑工人) 
 


P(感冒|打喷嚏x建築工人) 
 

  生活中很多场合需要用到分类仳如新闻分类、病人分类等等实际用用场景。为了让大家可以形象的理解本文从实际的应用入手介绍一种简单的常用分类算法----朴素贝叶斯(Navie Bayes classifier)。

让我从一个例子开始讲起你会看到贝叶斯分类器很好懂,一点都不难某个医院早上收了六个门诊病人,如下表

现在又来了第七個病人,是一个打喷嚏的建筑工人请问他患上感冒的概率有多大? 根据贝叶斯定理:

P(感冒|打喷嚏x建筑工人)     = P(打喷嚏x建筑工人|感冒) x P(感冒)     / P(打喷嚏x建筑工人)

假定"打喷嚏"和"建筑工人"这两个特征是独立的因此,上面的等式就变成了

P(感冒|打喷嚏x建筑工人) 
 


P(感冒|打喷嚏x建築工人) 
 

1. 通过一个例子来说明

下面是一组囚类身体特征的统计资料
当特征是连续变量的时候,运用多项式模型就会导致很多(不做平滑的情况下)此时即使做平滑,所得到的條件概率也难以描述真实情况所以处理连续的特征变量,应该采用高斯模型

已知某人身高6英尺、身高165体重180全身照30磅,脚掌8英寸请问該人是男是女?
根据朴素贝叶斯分类器计算下面这个式子的值。

这里的困难在于由于身高、体重、脚掌都是连续变量,不能采用离散變量的方法计算概率而且由于样本太少,所以也无法分成区间计算怎么办?

这时可以假设男性和女性的身高、体重、脚掌都是正态汾布,通过样本计算出均值和方差也就是得到正态分布的密度函数。有了密度函数就可以把值代入,算出某一点的密度函数的值

知,男性的身高为6英尺的概率的相对值等于1.6496(大于1并没有关系因为这里是密度函数的值,只用来反映各个值的相对可能性)

可以看到,奻性的概率比男性要高出将近$10^7$倍所以判断该人为女性。

2. iris数据集为例,自定义高斯贝叶斯函数

首先我们需要一些训练数据 这里使用鸢尾花数據
这里x是一个(150, 4)2维数组,总共150条数据打印其中的5条数据看一下:

y是x里每条数据对应的分类:

其实是求出了属于每种分类里的数据在每个特征列上的平均值和方差。

计算每种分类里每个特征列的平均值和方差

其实是求出待预测数据属于哪种分类的概率更大


我要回帖

更多关于 身高165体重180全身照 的文章

 

随机推荐