2024年浙江财经大学研究生初试《数据挖掘综合》考试大纲

成都华新文登考研辅导中心
成都华新文登考研辅导中心

人气:50 2023-10-31

《数据挖掘综合》考试大纲

第一部分:考试内容及要求

一、数据挖掘概述

考试内容

数据挖掘的概念 数据挖掘的任务 数据挖掘应用 数据挖掘的主要问题

考试要求

1.了解数据库系统技术的演变过程;理解数据挖掘的概念;掌握知识发现过程的7个步骤。

2.掌握数据挖掘要解决的问题;掌握数据挖掘功能和模式;理解数据挖掘与统计学、机器学习的联系和区别;了解数据挖掘的起源;掌握数据挖掘的任务。

二、数据

考试内容

数据类型 数据质量 数据预处理  相似性和相异性度量

考试要求

1.了解数据对象与属性类型。

2.了解进行数据预处理的原因及其重要性;了解数据质量涉及的因素;掌握数据预处理的主要步骤。

4.了解数据清理的概念;了解处理数据缺失值的方法;了解处理噪音数据的方法。

5.理解数据预处理中的聚集、抽样、特征子集选择以及离散化和二元化等方法。

8.理解数据对象之间相似度;数据对象之间的相异度。

三.分类和预测

考试内容

数据分类和预测的概念 判定树归类算法 信息增益 树剪枝 回归分析 分类法的准确性 组合分类器 类不平衡问题

考试要求

1.理解数据分类的概念;了解分类的两个过程;理解监督学习和非监督学习的区别;了解分类和预测的数据预处理方法;掌握评估分类和预测方法的标准。

2.了解决策树的概念和优缺点;了解决策树归分类的主要步骤;了解常用的属性选择度量,掌握信息增益度量的求法;理解两种常用的树剪枝方法。

3、掌握神经网络的分类与构造原理

4、熟练掌握单层感知机原理与学习算法

5、掌握BP算法原理与学习过程

6.了解评估分类器性能的度量;了解评估分类和预测准确率的方法(混淆矩阵、灵敏度和特小型、F度量)。

7、掌握Boosting算法的基本思想。

8、熟练掌握支持向量机SVM分类建模原理和计算方法。

9.了解组合分类器的概念和常用的组合分类方法;了解装袋和提升的基本思想以及两者的区别;了解随机森林的基本思想。

10.了解类不平衡问题的概念;了解提高类不平衡数据分类准确率的一般方法。

四.挖掘频繁模式、关联和相关性

考试内容

频繁项集概念  频繁项集挖掘方法  Apriori算法  FP-growth算法  

考试要求

1.理解项集、闭项集、频繁项集和关联规则的概念 ;了解规则兴趣度的两种度量(支持度和置信度)。

2.了解关联规则挖掘的步骤。

3.了解Apriori算法的步骤;了解FP-growth算法的步骤和优缺点;掌握相关性度量提升度(lift)的计算方法。

五. 聚类分析

考试内容

聚类分析的概念 聚类方法的分类 算法方法的距离度量 划分方法 层次方法 基于密度的方法 基于网格的方法 聚类评估

考试要求

1.理解聚类分析的概念;了解聚类分析的应用领域;了解比较聚类方法的标准;了解数据挖掘对聚类的典型要求;了解比较聚类方法的各个方面。

2.理解划分方法的概念和一般特点,以及典型算法;理解层次方法的概念和一般特点,以及典型算法;理解基于密度的聚类方法的概念和一般特点,以及典型算法;理解基于网格的聚类方法的概念和一般特点,以及典型算法;

3.理解K-均值算法的步骤和优缺点;

4.了解算法方法的距离度量。

5.了解聚类评估概念和主要任务;了解测定聚类质量的方法。

第二部分:考试方法和考试时间

数据挖掘导论考试采用闭卷、笔试形式,考试时间为180分钟。

第三部分:试卷结构及参考书目

(一)题分:试卷满分为150分

(二)题型比例:

选择题与判断题  约30%

简答题和计算题  约70%

(三)参考书目:

《数据挖掘导论》,(美)陈封能,(美)斯坦巴赫,(美)库玛尔,人民邮电出版社,2010年。

更多培训课程,学习资讯,课程优惠,课程开班,学校地址等学校信息,请进入 成都华新文登考研辅导中心 成都华新文登考研辅导中心 你也可以留下你的联系方式,让课程老师跟你详细解答 4006-303-880 在线咨询
预约申请试听课程

只要一个电话,我们免费为您回电

推荐课程
同类文章

关于我们 | 联系我们 | 咨询电话:4006-303-880

汇上优课 招生合作 版权/投诉

川ICP备07505283号

 以上信息知识产权归“成都华新文登考研辅导中心”所有,并对内容的真实性和合法性负责,如有侵权或投诉,请联系我们处理。

汇上优课 成都华新文登考研辅导中心 考研资讯 2024年浙江财经大学研究生初试《数据挖掘综合》考试大纲

还没有找到合适的课程?赶快告诉课程顾问,让我们顾问马上联系您! 靠谱的培训课程,省时又省力!