用身高和体重数据进行性别分类的实验报告.docx
《用身高和体重数据进行性别分类的实验报告.docx》由会员分享,可在线阅读,更多相关《用身高和体重数据进行性别分类的实验报告.docx(14页珍藏版)》请在第一文库网上搜索。
1、实验一用身高和/或体重数据进行性别分类姓名:学号:姓名:学号:一、实验目的1)加深对Bayes分类器原理的理解和认识2)掌握Bayes分类器的设计方法二、实验内容1)用FAMALE. TXT和MALE. TXT的数据作为训练样本集,建立Bayes分类器;2)用测试样本数据test2, txt对该分类器进行测试;3)调整特征、分类器等方面的一些因素,考察它们对分类器性能的影响,从而加深对所学内容的理解和感性认识。三、实验步骤1)应用单个特征进行实验:以(a)身高或者(b)体重数据作为特征,在正态分布假设下利用最大似然法或者贝叶斯估计法估计分布密度参数,建立最小错误率Bayes分类器,写出得到的决
2、策规则,将该分类器应用到测试样本,考察测试错误情况.在分类器设计时可以考察采用不同先验概率(如0.5对0. 5, 0. 75对0.25,0.9对0.1等)进行实验,考察对决策规则和错误率的影响;2)用两个特征进行实验:同时采用身高和体重数据作为特征,分别假设二者相关或不相关,在正态分布假设下估计概率密度,建立最小错误率Bayes分类器,写出得到的决策规则,将该分类器应用到训练/测试样本,考察训练/测试错误情况。比较相关假设和不相关假设下结果的差异。在分类器设计时可以考察采用不同先验概率(如 0. 5 vs. 0. 5, 0. 75 vs. 0. 25, 0. 9 vs. 0. 1 等)进行实验
3、,考察对决策和错误率的影响;3)自行给出一个决策表,采用最小风险的Bayes决策重复上面的某个或全部实验。四、原理简述、程序流程图及相应结果(一)、实验一在正态分布假设下,利用最大似然法估计分布密度函数,具体过程如下:1、原理(1)、一维情况:n=1对于每个学习样本只有一个特征(取身高为特征)的简单情况:2Xk61)0 = 41,仇=. log P(Xk )=log(2=62)-n an ilog P(Xa I 夕)=Z(Xla) = 0&=1 3 1hl 02n anZ 短。gp(x&i)=2k=l。仇hl202、2(Xk-伍丁2俄=0学习样本的算术平均样本方差的最大似然估计(2)、最小错误
4、率Bayes分类器多元正态概率型下的最小错误率贝叶斯判别函数(一般情况)。判别函数:&(X)= 一;(X 一Z:(X 一 4)一 :In IZ, | + In (外)=xTWtx + 叱0叱=一3汇;(*矩阵)叱.维列向量)叱0 = 一!M 一In, I + In P(外)决策规则:&(x)= /叱叱0=X3j=max xTW.x + w1 j x e 69;.2、具体步骤:a.算出各类别特征值的均值b.求出特征值的协方差矩阵C.将第二步所得矩阵代入判别函数(X)、g2(X)d.将待测试样本集数据依次代入处(才)一32(才),若由(王)一32(才)。,则判断其为第一类,反之为第二类。3、程序流



- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 身高 体重 数据 进行 性别 分类 实验 报告
