人工智能基础与应用第5章 物以类聚:发现新簇群课后习题参考答案.docx
《人工智能基础与应用第5章 物以类聚:发现新簇群课后习题参考答案.docx》由会员分享,可在线阅读,更多相关《人工智能基础与应用第5章 物以类聚:发现新簇群课后习题参考答案.docx(6页珍藏版)》请在第一文库网上搜索。
1、第5章物以类聚:发现新簇群课后习题答案一、考考你1 .关于聚类说法正确是一D。A.聚类样本一定要有标签B.应该将所有特征数据作为聚类依据C聚类的k值可以随意指定D.聚类质心就是各簇群特征的平均值2 .下列C聚类性能评价指标在-1,11之间,值越接近1说明聚类效果越好。A.CH分数B.戴维森堡丁指数DBIC.轮廓系数D.inertia3 .k-means模型的_A_参数能保证聚类结果复现。A.random_stateB.initC.maxjterD.a1gorithm4 .衡量聚类效果好坏的主要依据是D。A.各类之间的界限明显B.各样本离各自质心之和最小C.类别之间的协方差越大越好D.同类样本紧
2、促,不同类样本相距远5 .关于RFM模型的应用,说法错误的是3。A.R、F、M是区分客户的三个重要指标B.这三个指标是基于原始数据统计出来的C.在具体场景应用RFM模型时,可以添加其它指标D.训练模型前样本不进行标准化处理也是可以的二、亮一亮1在案例1中用k均值算法对莺尾花进行聚类时,有哪些办法能帮你找到最优的k值?参考答案:(1)尽可能多的获得莺尾花的特征数据进行初步分析,基于特征数据确定种类的有效值作为k的数值。(2)在运行k-means聚类中根据聚类结果对比分析确定最优的k值。2.在案例2的电商用户分类过程中,求各类客户样本的均值有何意义?请举例说明。参考答案:由于聚类前对原始数据进行了
3、标准化处理,所以需要聚类后对质心进行反标准化转换,得到原始均值,方便观察聚类结果和对业务场景的解释。三、帮帮我1. Who1esa1ecustomersdata.csv文件保存有批发商客户数据,前5行数据如下图5.20所示。数据集各属性函数如下。Channe1RegionFreshMi1kGroceryFrozenDetergents-PaperDe1icassen02312669965675612142674133812370579810956817623293177622363538808768424053516784431313265119642216404507178842322615
4、54107198391517775185图5.20批发商客户数据 Channe1:客户渠道,1指酒店类,2指零售类。QRegion:客户所在地区,1指里斯本,2指波尔图,3指其它地区。 Fresh:在新鲜产品上的支出。令Mi1k:在乳制品上的支出。 Grocery:在杂货上的支出。令Frozen:在冷冻产品上的支出。 Detergents_Paper:在清洁剂(纸)上的支出。令De1icassen:在熟食上的支出。请运用k-means聚类算法将这400名批发商客户进行聚类,并试图解释聚类结果。提示:聚类时只考虑后6个特征,因为这6个特征代表客户的进货能力。参考答案:#数据预处理#1.处理异常值
5、在处理异常值之前,先来通过箱线图看看异常值.importseabornassnsimportpandasaspdimportmatp1o(1ib.pyp1otaspitdf=pd.read_csv(rda(aWho1esa1ecustomersdata.csv,sep=,)defget_boxp1ot(data,start,end):fig,ax=p1t.subp1ots(1,end-start,figsize=(24,4)foriinrange(start,end):sns.boxp1ot(y=data(data.co1umnsi,data=data,ax=axi-start)get-box
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能基础与应用第5章 物以类聚:发现新簇群课后习题参考答案 人工智能 基础 应用 物以类聚 发现 新簇群 课后 习题 参考答案