东财21年春《数据分析与决策》综合作业【奥鹏作业】
数据分析与决策综合作业
一、单项选择题:共15道题,每题2.0,共30.0分。
【1】绝大多数的数据分析算法均是按照( )的输入来实现的。
A、关系型
B、网状型
C、树型
D、混合型
【2】两步聚类算法是一种( )算法。
A、分层聚类
B、K均值聚类
C、凝聚聚类
D、Kohonen network
【3】下列选项中,对有监督的建模技术理解错误的是( )。
A、有监督的建模技术必须有一个模型的训练过程
B、模型训练的目的是“在已知目标值的情况下,试图找出预测变量与目标值之间的有效推理方式”
C、输出数据是预测变量
D、有监督的建模技术分为分类或者倾向和估计或回归
【4】当一个项目集I的相对支持度满足预先指定的( )支持度阈值,项目集I就是一个频繁项目集。
A、最大
B、最小
C、固定
D、随机
【5】决策者在使用决策管理系统时,使用频度最高的是( )。
A、测试
B、场景分析
C、What-If分析
D、验证
【6】下列说法中关于“分箱”的说法错误的是( )。
A、数据分箱可以用来对数据进行平滑处理与去除噪声
B、数据分箱不可以对数据进行离散化处理
C、可视化分箱可以将现有字段的连续指进行分组
D、优化分箱通过将每个字段的值分布到不同的分箱中
【7】常见的OLAP使用的数据立方体或多维体,可以通过( )来降维。
A、二维关系型结构
B、网状型结构
C、混合型结构
D、树型结构
【8】时间序列的( )是否是离散的决定了一个时间序列的类型。
A、竖轴
B、横轴
C、时间轴
D、数据轴
【9】时间序列是通过( )测量时间段中某个变量获得的一组观察值。
A、定期
B、随机
C、不定期
D、不确定时期
【10】传统的统计模式识别方法在进行机器学习时,强调经验风险( )。
A、最大化
B、最小化
C、不变化
D、随机变化
【11】当残差的绝对值较大时,可认为误差的方差( )。
A、变大
B、变小
C、不变
D、不确定
【12】关联规则中,当提升度等于( )时,表明两项交易同时出现属于概率事件,不具有特别意义。
A、0
B、1
C、2
D、3
【13】业务分析应该为明确的( )服务。
A、企业目标
B、计划
C、组织目标
D、战略目标
【14】既要花费少,又要收益大的问题属于( )问题。
A、线性规划
B、0-1规划
C、动态规划
D、多目标规划
【15】决策管理系统应当具有的默认功能是( )。
A、定义功能
B、分析功能
C、比较功能
D、查询功能
二、多项选择题:共20道题,每题3.0,共60.0分。
【16】一般来讲,统计量的标准有( )。
A、无偏性
B、有偏性
C、一致性
D、有效性
【17】根据对季节性参数的不同处理方式,可将温特斯指数平滑法分为( )。
A、温特斯加法指数平滑法
B、温特斯减法指数平滑法
C、温特斯乘法指数平滑法
D、温特斯除法指数平滑法
【18】业务分析比较典型和适用的系统有( )。
A、客户关系管理系统
B、决策支持系统
C、管理信息系统
D、企业资源计划系统
【19】下列关于随机变量的说法正确的有( )。
A、随进变量是其值随机发生变化的量
B、变量、字段等在数理统计领域中都被称为随机变量
C、随机变量的独立性需要从数学定义去验证
D、随机变量的独立性从变量产生的实际背景去判断
【20】下列关于支持向量机的理论正确的是( )。
A、支持向量机的理论基础就是统计学习理论。
B、根据统计学习理论,学习机器的实际风险由经验风险值和置信范围值两部分组成
C、支持向量机在解决大样本、非线性机高维模式识别问题中表现出许多特有的优势
D、线性分类器是支持向量机的基础
【21】下列关于相关分析的说法正确的有( )。
A、相关分析着眼于找到变量间的某些数量性指标间关系深浅的程度
B、相关关系分为函数关系和随机关系
C、相关分析的主要目的是确定相关系数的具体取值
D、相关系数的计算方法比较单一
【22】按照决策影响的大小,可以分为( )。
A、战略层决策
B、战术层决策
C、实施层决策
D、结构化决策
【23】基于技能的公司通常有( )。
A、咨询公司
B、技术供应商
C、数据供应商
D、分析公司
【24】根据时间序列的测量周期是否连续,可以将时间序列分为( )。
A、连续时间序列
B、随机时间序列
C、离散时间序列
D、平衡时间序列
【25】K均值聚类算法的输入包括( )。
A、聚类个数K
B、初始中心
C、n个数据对象
D、方差
【26】数据挖掘是从大量数据中寻找其规律的技术,是( )的综合。
A、统计学
B、计算机网络技术
C、数据库技术
D、人工智能技术
【27】分层聚类可细分为( )。
A、凝聚聚类
B、两步聚类
C、分裂聚类
D、K均值聚类
【28】下列选项中,属于应用业务分析方法的是( )。
A、只创建一个业务分析部门
B、有明确的业务分析应用目标
C、雇佣合适的分析师
D、使用正确的技术
【29】神经元网络的拓扑结构可以分为( )。
A、前向型
B、反馈型
C、自组织竞争型
D、随机型网络
【30】商业智能大多利用( )工具回答一些决策问题。
A、查询
B、报告
C、OLAP
D、预警
【31】两步聚类算法的步骤为( )。
A、预聚类
B、归一化处理
C、离散值处理
D、聚类
【32】下列关于决策的说法正确的有( )。
A、目前,对于决策的基本概念还未有一个统一的说法
B、决策是对不确定条件下发生的偶发事件所做的处理决定。
C、按照对决策的狭义的理解,决策是有风险的。
D、按照狭义的理解,决策是从几种备选的行动方案中作出最终抉择。
【33】K均值聚类算法的特点包括( )。
A、数据集中包含符号属性时,直接应用K均值聚类算法是有问题的
B、用户事先需要制定K的个数
C、对噪声和孤立点数据比较敏感
D、少量的敏感数据能够对聚类均值起到很大的影响
【34】下列选项中列出的聚类算法能很好处理大批量数据的有( )。
A、BIRCH聚类算法
B、分层聚类算法
C、两步聚类算法
D、K均值聚类算法
【35】根据决策的广义理解,把决策看作是( )过程。
A、提出问题
B、确立目标
C、设计方案
D、选择方案
三、判断题:共5道题,每题2.0,共10.0分。
【36】决策间的关系只能是分先后的,不可能是平行的。( )
正确
错误
【37】线性规划仅仅适用于优化和运筹问题。( )
正确
错误
【38】数据集中的异常数据和重复数据都可能对建模的速度和精确度造成影响。( )
正确
错误
【39】CARMA算法执行分为发现频繁项目集和生成规则两个阶段。( )
正确
错误
【40】准备数据时数据挖掘项目中最重要的步骤之一,通常也是最省时的一个步骤。( )。
正确
错误
版权保护: 本文由 奥鹏作业答案-泽学网-专业的奥鹏作业毕业论文辅导网 原创,转载请保留链接: https://www.zexuewang.nethttps://www.zexuewang.net/biyelunwen/2455.html