以服务于中国广大创业者为己任,立志于做最好的创业网站。

标签云创业博客联系我们

导航菜单

数据分析师报名入口,上海数据分析师培训机构推荐

大家好,现在宣布CDA数据分析师认证考试三级模拟试题时间到了。今天,我们给大家带来模拟试题(1)中的第31-35题。(选择题)

不过在出题之前,先公布一下《三级》最后一期第26-30题的答案,一起看看吧!

26、乙

27、A

28、C

29、A

30、乙

31、自然语言处理工作中,在自动构造关键词(非控制词汇)时,常用的方法是?

A.受控词汇

B.条款倒置(逐项)

C.反向文档频率

D.全文扫描

32、向量空间模型是一种信息检索技术,下面描述向量空间模型(VSM),错误是:

A.当文档用向量表示时,它们之间的夹角越小,相似度越高。

B.文本特征词的向量权重可以通过TF-IDF实现,从而保留文本词序结构的信息

C.在向量空间模型中,当添加新文档时,需要重新计算特征词的权重

D.在基于向量的文本相似度计算中,除内积、Dice系数和夹角余弦外,还可以使用Jaccard方法

33.全文扫描、逐项倒排和签名文件是信息检索技术中的基本检索方法。什么是信息检索技术中的签名文件?

A.计算点与点之间的距离,以查找类似于此查询的文档,并对它们进行排序以供输出

b .利用余弦相似度找出文件的相似度,按照相似度由大到小排序输出

c .将待搜索的字符串直接与原始字符串进行比较,进行快速字符串比较

D.签名文件使用重叠编码技术将文件转换为固定长度的签名,以加快字符串比较。

34.中文自动分词是中文信息处理的重要基石。困扰中文自动分词发展的原因有很多,歧义字段的消除是亟待解决的几个难题之一。以下哪一项不属于多义词的经典歧义消除算法?

A.基于规则的算法

B.基于概率统计模型的算法

C.结合规则和统计的算法

D.基于协同过滤算法

35.Word2vec是一组用于生成单词向量的相关模型。这些模型是浅层和双层神经网络,用于训练重建语言单词。关于word2vec模型,以下说法不正确:

A.得到的词向量维数小,可以节省存储和计算资源

B.考虑全局语料库的信息

C.无法解决多义词的问题

d能表达单词之间的关系

仔细回答问题。我们将在下期公布正确答案。敬请期待。

报名方式

登录官网进行CDA认证考试

报名费用

一级:1200元

级:1700元

级:2000元

考试时间

一级:用报告测试。

二级:考试会跟报告。

三级:一年四节(3月、6月、9月、12月最后一个周六),每节课的报名在考试前一个月截止。

考试地点

级:mainland China 30个省市、70个市、250个考场。考生可选择就近考场预约。

三级:mainland China、北京/上海/天津/重庆/成都/深圳/广州/济南/南京/杭州/苏州/福州/太原/武汉/长沙/Xi安/贵阳/郑州/南宁/昆明/乌鲁木齐/沈阳/哈尔滨/合肥/石家庄/呼和浩特/南昌/长春/30个城市。