选课类别:计划内与自由选修 | 教学类型:理论课 |
课程类别:本科计划内课程 | 开课单位:计算机科学与技术系 |
课程层次:专业选修 | 学分:2.0 |
数据科学(Data Science)是关于数据的一门新兴科学,旨在研究探索数据规律及其相关的理论、方法与技术,并为自然科学与社会科学研究提供支撑。随着大数据时代的来临,数据所蕴含的巨大价值正日益受到关注,高效、准确解读数据已成为关系国计民生的重要问题。本课程面向全校对基础数据科学有兴趣的本科学生开放,将通过理论教学、案例分析与课题实践相结合的方式,全景介绍数据科学及其主要分支的基础概念、基本方法、应用实践与前沿概况,从而使学生树立运用数据和相关算法工具解决实际问题的基本思路,并初步掌握用于数据分析手段解决实际应用问题的能力。
《数据科学导论》主要由黄振亚老师授课,陈恩红老师仅在第一节课讲述绪论。黄老师讲课耐心负责,PPT可以在课程主页下载,适合数据科学入门的同学。课程内容覆盖数据预处理、特征分析和模型构建,并包括两次小专题。
课程无期末考试,任务主要是:一篇文献调研和一个实验报告(少数小测和点名)。调研报告需与数据科学相关,实验报告可以通过组队参加Kaggle比赛或自行实验。作业时间充裕且不拖至考试周。
考核包括课堂参与(30%)、调研报告(30%)和实验报告(40%)。部分同学反映各项得分不公开,但总体给分较好,适合高年级学生水学分。一位同学表示:“即使翘课也能取得不错的成绩”。
多数同学认为课程适合初学者,上课内容有趣且不算太难。有同学提到黄老师在讲新名词时会重复,稍显怪异。此外,一些同学对课程的调研和实验报告有所收获,特别是通过比赛获得实践经验。助教回复问题及时,但课程群曾一度禁言。
今天出分了,来写个点评,这是一门公选课,课程任务主要包括:一篇文献调研,一篇实验报告(实验可以组队打CCF的比赛,也可以一个人找个感兴趣方向做实验,最后以实验报告的形式给出自己的实验过程以及收获)。另外上课会偶尔以小测的形式签到(小测主要是PPT上的一些简单问答题,有手就行)。黄老师讲课讲得真的很好,耐心负责,PPT也做得很OK,对于那些入门数据科学的同学很友好,所以有感兴趣的同学快来选啊!!!我是组队参加了CCF的比赛,也没有很卷,就按部就班的写了文献调研、实验报告,最后喜提4.3!
这门课虽然挂了两个老师的名字,但实际上陈老师只在第一节课上讲了些绪论性质的内容,主要还是由黄老师负责授课。讲课以 PPT 为主,PPT 可以在 课程主页 上下载。个人觉得黄老师讲课还可以,就是有个口癖在说到新名词时会重复一遍,感觉有些怪。
课程内容上,除了一开始的绪论,之后就是按照拿到数据之后进行分析的顺序,大致分为预处理、分析数据统计特征、挖掘数据背后信息形成模型三大步,此外还有两次小专题。每周一次课,一共十八周的课,应该是有两次小测和倒数第二次课的一次点名。
这门课没有考试,只有两个任务。一篇个人调研报告,与数据科学相关即可;一次三人小组打比赛,提供了一些 Kaggle 或是别的平台的比赛供选择,交一份实验报告。比较好的是时间给得很足的同时又没有把 DDL 拖到考试周。最后一次课上老师请了三位同学讲调研报告,三组同学讲比赛。
收获上,课程的内容还是不错的,就是有些在别的专业选修课上已经学过了。而更大的收获是完整地参加了一次 Kaggle 比赛,比赛中体会到了很多之前没有注意过的或是从没有学过的内容,虽然比赛结果不算好,但这种实践的经历还是很宝贵的。
以下内容不计入评课:
助教:一共是三位助教,学期中有次课由一位助教来讲了下 Python 的实验基础专题,此外队友问助教问题回复还挺及时的。
给分:不过助教好像是在某次有人进课程群打广告禁言后就忘记再打开了,所以看不到讨论不知道总体给分情况。个人感觉挺好的。
都快过年了,怎么还不出分,是我的教务系统坏了吗:p
为啥课程群还全员禁言了
利益相关:开学给出的给分公式:课堂(30%) +调研报告(30%) +实验报告(40%),但是由于其中每一项的得分都是不公开的,所以不知是否是按照公式给分。就个人情况而言给分蛮好的(即使是在我翘了最后一节课又刚好点名被抓的情况下~ 总之,这门课非常适合高年级学生去水学分(不过据说之后就不再算作核心通识的学分了?)
上课:由于之前选修过连老师的《机器学习概论》,说实话这门课我一直都没怎么认真听(狗头保命),感觉大体是机器学习的入门版本,也不怎么数学,大二萌新听一听应该比较舒适~ 点名的方式是做题,大概有3-4次,好像有决策树划分、极大似然估计与贝叶斯估计,还有一次记不太清了…….
作业:完全没有!!!
调研报告:要求是和AI沾边都可以,可以是聚焦于一篇论文写自己的总结和思考(不过应该比较难写),也可以就一个子领域作一些整理和归纳(这个想摆的话找篇综述翻译翻译就有了,想卷的话发挥空间也很大)。调研报告写得好会被选出在最后一节课作汇报,据助教gg说可以加分~ 从个人情况来看貌似不太追求子领域的新颖性,总结几十年前的东西也是ok的~
实验报告:就是参加一个机器学习比赛(也可以自己找问题做实验,不过老师不推荐~)然后写报告反映比赛经历。赛题难度选择也很自由,简单的可以选二分类这种,复杂一点的有推荐系统,时间序列相关的。要求是模型可以调库,不用手写(当然如果用SOTA方法就未必有库可调了hhh~)与调研报告相同,实验报告写得好也会被选出在最后一节课作汇报并加分
总的来说,无论是大二萌新入门还是大四用来水学分,这课还是值得一选的