21秋东财《数据挖掘概论》单元作业三【奥鹏作业辅导】
东北财经大学《数据挖掘概论》单元作业三
试卷总分:100 得分:100
一、单选题 (共 10 道试题,共 50 分)
1.线性回归通常通过( )方法进行参数估计。
A.最小二乘法
B.牛顿法
C.聚类
D.拉格朗日法
2.简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作( )。
A.层次聚类
B.划分聚类
C.非互斥聚类
D.模糊聚类
3.ID3、C4.5和CART都采用的是( )方法。
A.贪心
B.回溯
C.动态规划
D.递归
4.表示簇内距离与簇间距离之比的指标为( )。
A.DBI指数
B.Jaccard系数
C.rand指数
D.轮廓系数
5.存在噪声和离群点时,( )是更鲁棒的划分聚类方法。
A.k-中心点方法
B.AGNES
C.k-均值方法
D.BIRCH
6.在决策树中,树的最顶层结点是( )。
A.内部结点
B.树叶结点
C.分支
D.根结点
7.垃圾邮件检测通常通过( )方法实现。
A.线性回归
B.岭回归
C.Lasso
D.逻辑回归
8.对于有n个数据点的数据集,经验上通常设置簇数为( )。
A.√(2n)
B.√n
C.√2
D.√(n/2)
9.在基本k-均值算法里,当邻近度函数采用( )的时候,合适的质心是簇中各点的中位数。
A.曼哈顿距离
B.平方欧几里德距离
C.余弦距离
D.Bregman散度
10.事件的优势比(odds)的取值范围是( )。
A.(0,+∞)
B.(0,1)
C.(-∞,+∞)
D.(-1,1)
二、多选题 (共 5 道试题,共 25 分)
11.( )可能成为k-均值的终止条件。
A.对固定数量的迭代
B.在局部最小值不是特别差的情况下,在迭代中对簇观测值的分配不发生变化
C.在连续迭代中质心不发生变化
D.RRS下降到阈值以下
12.以下属于分类器评价或比较尺度的有( )。
A.预测准确度
B.召回率
C.模型描述的简洁度
D.计算复杂度
13.k-均值聚类分析在( )情况下无法得出好的结果。
A.具有异常值的数据点
B.具有不同密度的数据点
C.具有非凹形的数据点
D.具有非环形的数据点
14.具有相同的时间复杂度的聚类算法有( )。
A.BIRCH
B.k-均值
C.DBSCAN
D.OPTICS
15.回归方法主要分为( )。
A.线性回归
B.非线性回归
C.岭回归
D.Lasso
三、判断题 (共 5 道试题,共 25 分)
16.分类是无监督学习,即每个训练样本的类编号是未知的,要学习的类集合或数量也可能是事先未知的。( )
17.精准率是分类器正确分类的检验元组所占的百分比。( )
18.给定由两次运行K均值产生的两个不同的簇集,误差的平方和最大的那个应该被视为较优。( )
19.在基于密度的聚类方法中,当“领域”中密度超过某一阈值会继续增长给定的簇。( )
20.轮廓系数的数值越小说明模型的聚类效果越好。( )
版权保护: 本文由 奥鹏作业答案-泽学网-专业的奥鹏作业毕业论文辅导网 原创,转载请保留链接: https://www.zexuewang.nethttps://www.zexuewang.net/zaixianzuoye/5853.html