大家好,现在宣布CDA数据分析师认证考试二级模拟试题时间到了。今天,我们给大家带来模拟试题(2)中的141-145题。(材料标题)
然而,在提问之前,我们应该宣布上一期第二级问题131-135的答案。让我们看看!
136、A
137、A
138、D
139、乙
140、乙
在数据分析中,我们经常需要划分训练集和测试集,并考虑数据预处理、特征提取、特征工程等。所以我们要仔细分析这些步骤之间的相互关系。请回答以下关于训练集、测试集、数据预处理和特征工程的问题
141、关于缺失值填充与训练集和测试集的关系,以下正确操作是()
A.首先用整个数据的均值填充缺失值,然后随机划分训练集和测试集
b .首先随机划分训练集和测试集,然后用每一集的均值填充缺失值
c .首先随机划分训练集和测试集,然后用训练集的均值填充缺失值
d .首先随机划分训练集和测试集,然后用测试集的均值填充缺失值
142、如果一个回归模型分为两步:先用PCA降维,再用多元线性回归做预测,那么测试集的结果应该如何计算()
A.利用训练集上的PCA模型对测试集的数据进行处理,然后将得到的数据输入多元线性回归模型进行预测。
b .利用测试集上的PCA模型对测试集数据进行处理,然后将得到的数据输入多元线性回归模型进行预测。
c、对所有数据集使用PCA模型处理测试集数据,然后将得到的数据输入多元线性回归模型进行预测。
D.以上都可以使用
143.在建模中,数据中的一个变量x是z-标准化的,那么在模型实际上线后如何标准化x呢?
A.使用训练数据集的均值和方差
B.使用测试数据集的平均值和方差
C.使用验证数据集的均值和方差
D.使用所有数据集的平均值和方差
144、能检测异常值的方法有哪些?
A.方框图
B.散点图
C.条形图
D.学生剩余指数
145、属于数据标准化的方法有哪些?
A.z分数标准化
B.施密特标准化
C.区间缩放
D.矢量单位化
仔细回答问题。我们将在下期公布正确答案。敬请期待。
报名方式
登录官网进行CDA认证考试
报名费用
一级:1200元级:1700元
级:2000元
考试时间
一级:用报告测试。二级:考试会跟报告。
三级:一年四节(3月、6月、9月、12月最后一个周六),每节课的报名在考试前一个月截止。
考试地点
级:mainland China 30个省市、70个市、250个考场。考生可选择就近考场预约。三级:mainland China、北京/上海/天津/重庆/成都/深圳/广州/济南/南京/杭州/苏州/福州/太原/武汉/长沙/Xi安/贵阳/郑州/南宁/昆明/乌鲁木齐/沈阳/哈尔滨/合肥/石家庄/呼和浩特/南昌/长春/30个城市。