选课类别:基础 | 教学类型:理论实验课 |
课程类别:研究生课程 | 开课单位:软件学院苏州 |
课程层次:硕士 | 学分:3.0 |
王老师的课程给分很好,作业也是很简单的。最后的结课大作业需要认真对待,分数占比不小。
课程内容:主要是数据挖掘(传统机器学习)的基础加一些学科前沿。
使用教材:《数据挖掘导论》,想要深入可以看看西瓜书和李航那本书。
作业内容:两次作业+组队pre+论文,想卷也能卷,不想卷的话作业量适中。总的来说不如隔壁水。
考试内容:开卷,前70%打印了PPT再看一遍教材都能答出来,后30%考察前沿内容,所以最好去听。给分很好。记得带计算器。
虽然名字叫《数据仓库与数据挖掘》但23秋完全没讲数据仓库,其实这对数开来说挺重要的。
王老师第一次讲课节奏把握的不大好,感觉有些太慢了,身边人都觉得有点催眠,有节课更是创下了只有5个人来上课的科软记录。但是客观地说其实讲的还可以,基本概念、算法逻辑、理论推导啥的都给你梳理清楚了,就是上课节奏实在太慢了,感觉不如自己自学……如果能开2倍速这课应该不至于这么冷清。
一共两次实验,都是数据科学里最基础的hello world,是真的水没啥好讲的。大作业是2人组队,完成一个数据挖掘领域相关问题的讨论和综述,或者对已有方法改进或新方法,或者组队打比赛。大部分人选了写综述,只有两队选了比赛,当然我就是其中之一,直接把隔壁数据科学基础的大作业比赛拿来复用了。
最后是考试,一出考场这个卷子就让人吐槽了,出的题半天写不完。比如决策树那题信息增益划分点有6个,狂按计算器,然后换成基尼系数再按一遍,没带计算器的同学完全没法做。开放题也是天马行空,继考研政治以来头一回写这么多字。虽说是开卷但是时间真不够你去翻的,还是得好好复习。
给分是课程大作业 40% + 课程实验 20% + 开卷考试 40%。最后给了87,大伙平时分基本都差不多拉满了,算出来我考试卷面分大概68分,倒也正常。