选课类别:专业 | 教学类型:理论实验课 |
课程类别:研究生课程 | 开课单位:计算机科学与技术系 |
课程层次:硕士 | 学分:3.0 |
课程有点名,需要期末考试。讲的内容跟本科的数据挖掘课程差不多,不过研究生课程对理论分析要求更高一些,比如需要推导感知机的梯度下降和反向传播公式。
教材:
课件:
2013 版课件:
2013 年的讲座:
陈老师上课就是个reader,偶尔喜欢手推一下公式或者叫同学上来推公式。本来这门课也不简单,再加上老师上课基本就是复述课本或者PPT,所以课程学习基本靠自觉。可以参考李航的《统计学习方法》来学,其他学院也开了统计学习的课程,讲得不错(就是期末考试挺难)。
至于考试,每年题型都大同小异,今年是九道大题,每道题大概是十来分,题量非常大,开卷考试也做不完的居多,以算法比较和概念题等开放题目为主,剩下就是计算题,今年的题目大概是:
1、”过拟合“和”欠拟合“的概念、导致的问题和解决方案
2、给了一组表格数据,带标签,分别用信息增益和信息基尼算决策树,冗余数据对决策树对结果有没有影响
3、给了一组二维坐标,用PCA方法降维
4、贝叶斯网络的计算天气概率
5、一个奖赏算法的改写,写出伪代码
6、K-means算法的局限性,有什么改进?领导者算法是什么,和K-means有什么异同?写出一个自动求分类簇数的改进K-means算法。
7、已知一组样本,设计实验比较LR、SVM、多层感知机的优劣
8、什么是直推学习?TSVM和自训练半监督学习有什么异同?半监督聚类的必连约束和勿连约束是什么?
9、基于新冠病毒的人群聚集预测,可以使用什么机器学习算法,怎么设计流程
总得下来,两个钟做不完,做了计算题就没时间做概念题,总得下来卷面完成率也就百分之七八十的样子,卷面分感觉很难及格(大神略过),最终出分再追评