数据分析及实践(刘淇) 2024春 2023春 2022春 2021春  课程号:DS300101
2024春 2023春 2022春 2021春  课程号:DS300101
6.5(19人评价)
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:一般
选课类别:计划 教学类型:理论实验课
课程类别:本科计划内课程 开课单位:大数据学院
课程层次:专业核心   学分:3.0
课程主页:暂无(如果你知道,劳烦告诉我们!)
排序 学期

评分 评分 19条点评

Swayee 2023春
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:杀手
  • 收获大小:一般
  • 难度:中等
  • 作业:中等
  • 给分:杀手
  • 收获:一般

这门课带给我最大的收益:促使我学习如何使用chatGPT。

上课的时候,周围的大佬们都在用chatGPT,几分钟就写出了实验报告的一大段,绘制的图表美观简洁;而我像个原始人一样,还在百度、知乎、CSDN中苦苦寻觅,和若干技术性的细节厮磨,手调各个参数。


课程内容:

  • 每节课都点名,形式为小测,算入总评;
  • 课堂小测的题目有点难度,至少不是抄PPT就行的,或许要听课;
  • 共计五次实验,每次的DDL都不长;
  • 一篇文献调研,DDL和实验挤在一起。

实验内容:

  • Python入门级难度的编程练习,OJ平台,不需要写实验报告(以下的实验均需要报告);
  • 一个简单的网页爬虫,从三个任务中选一个:王者荣耀,豆瓣,评课社区;
  • 数据分析:参考模板数据集的一个子集;
  • 关联规则发掘,数据集同上(今年新增);
  • 特征预测,数据集同上。

总评给分:

  • 逆天。助教表示优秀率给满,那实在不好喷什么,也不公布具体成绩明细。可能是如果有课堂小测缺席,就直接总评扣个大几分,那我确实该寄。不过已经修够所有学分了,懒得去计较这门课赋分。

你可能感兴趣的内容:

完美的数据分析JupyterNotebook模板

关联规则python实现

神经网络算法python实现

(最后修改于 15 0 复制链接
匿名用户 2023春
  • 课程难度:困难
  • 作业多少:很多
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:困难
  • 作业:很多
  • 给分:一般
  • 收获:一般

我想这门课最大的问题其实在于:所有实验做之前几乎没有指导,做完后完全没有反馈。一学期花费这么多时间都是在实验报告上卷生卷死,最后给分也就这样,你说能有什么收获!

7 0 复制链接
trytgug 2023春
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:超好
  • 收获大小:很多
  • 难度:中等
  • 作业:中等
  • 给分:超好
  • 收获:很多

看到大家对这门课意见这么大,提供一些给学弟学妹们的个人看法,不喜勿喷

利益相关:小测全勤,实验和调研报告自认为写的还算认真,最后总评90,相较于我的code水平来说非常满意

感觉这门课的争议可能是因为报告作为主要的评分标准过于主观了,每个人对于自己写的报告肯定都是充满了信心,毕竟没有人会觉得自己辛辛苦苦写了几个小时的东西是一坨屎。这样主观的报告最后用客观的方式评分,必然会有很多人会产生“为啥我分这么低”的愤怒,高分也会觉得是自己写的很好,理所应当。

至于评分标准,中间问过好几次老师和助教,得到的回答有一点我想可能很关键——就是要有自己的想法,并且在报告中体现出来。我在每次报告中都会把实验过程中奇奇怪怪的尝试和心得写进去,这可能也是我总评比较高的原因。班上的大佬,每次布置实验光速写一篇完事,代码截图一粘,总页数2页,最后总评85,虽然人家真实水平比我高很多(逃

还有一点可能就是要和助教多交流,有一次周五晚去实验课,看到偌大的实验课教室里只有助教孤身一人,一问才知道,我是第一个来的。后来实验课也因为没同学去,改成了线上,我想问问那些说实验要求不明的同学,你们真的问过助教一句实验要求吗?

说到底,最逆天的还是科大的卡优秀率限制。这课如果没有优秀率限制,就是一门大家开开心心写报告不考试的好课,可是加上了优秀率限制,就得强行在报告里卷生卷死。或许以后这门课也会加入期末考试这种客观性的评价标准吧,高手速通,菜逼复习的死去活来喜提及格,不过大家都没异议,一个愿打一个愿挨。

至少对于我这个普普通通的学生来说,这门课让我学到了很多以后炼丹可能会用到的东西,让我凭借着勤勤恳恳地写好报告每一个步骤,就能得到一个很好的分数,所以我个人非常推荐这门课。如果真要来一场期末考试,最后出几道逆天难的压轴题,我必然还会回到属于我的普通的分数位置,看着佬们在我面前谈笑风生,还要互相装弱膜拜。难道科大的教学体系,就只为了让那前百分之十的人更加耀眼,我们这些普通人,就只配被你们踩在脚下,成为你们通向光辉未来的分数放大器和铺路石吗?

6 2 复制链接
细雨点洒在花前感谢同学的认真总结和评价,助教感动哭了
立即登录,说说你的看法
2023春
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:中等
  • 作业:中等
  • 给分:一般
  • 收获:一般

感觉老师上课有点摆,理论课学不到多少东西,没有纸质作业,不过上课经常有小测。

实验基本靠自己摸索,由于我太菜了,虽然花了很多时间但依然做得一塌糊涂。不过自学了pandas库,对以后有点帮助。


虽然我不太满意这门课,但43%优秀率已经很好了(虽然我没有优秀),只是实验报告这种形式容易导致内卷。

(最后修改于 6 0 复制链接
Chase 2023春
  • 课程难度:简单
  • 作业多少:很少
  • 给分好坏:超好
  • 收获大小:一般
  • 难度:简单
  • 作业:很少
  • 给分:超好
  • 收获:一般

要写课评的时候却发现这门课在pksq的风评坠落,表示略感惊奇,因为作为编程小白选了大佬云集的课总觉得身边的人都好厉害因而自觉调低了对成绩的期望,只是日常到课按时交实验和调研报告,结果得到的成绩居然还蛮好(?)

按着这学期的体验来说,这门课课上讲的和课后布置的仿佛是两个维度。

课上的节奏感觉一直都是蛮舒缓的,刘淇上课其实蛮有魅力,当我不困并且有兴致听讲的时候总是能给我清晰的讲解。不过作为数院人,中间有一段讲概统的内容因为几乎没学过会几乎听不懂,不过反正这门课没有期末考没听懂也无伤大雅。几乎每周都有的小测环节对我来说是把达摩克利斯之剑,不过记得有一周的课,三节课小测了三回,简直把我摸鱼的灵魂扼杀得死死的,小测不免太过频繁了:这样尽管到课的人数得到了保证,但上课效率实属难绷,有一次老师连着点了三个回答一个相当简单的问题却得到了不会三连,笑。

记得假期选上这门专业选修课之后,收到建议预习Python编程的短信,一开始不以为意,结果第一次课老师就布置了CODIA的Python实验——难度一题更比一题高,最后干脆一路ChatGPT写题,似乎后面的实验也没怎么用上ex1后面几道好难的题。结果之后的ex2~4,感觉老师似乎默认了我自然地就能掌握许多前置知识,每次布置下来的实验都让人耳目一新(在这并不是个褒义词,因为课上老师也没怎么教和实验有关的东西...), 咨询助教感觉他们总是在忙经常失踪,因而每次实验基本都是面向ChatGPT完成,感觉自己学会的好多还是latex的操作方法(bushi)。由于刘淇在课上对实验报告鲜明的偏好,做实验的时候自己也没想太多,实验只要能跑出个结果,老师要我多做几个图就多做几个图贴上去,让报告看起来不那么干瘪就算了结一个实验hhh。文献调研倒的确是认认真真地把时间花下去了,挑着老师发的一个实验室网页里的自己蛮感兴趣的论文啃下去,然后把论文的细节重新整合成了一篇调研报告,自我感觉做的工作尽管不止翻译和复述,但顶多也就是个梳理兼润色之劳。anyway就是朴朴素素地做了老师要求我做的,结课之后没多久就退了群,出分平平淡淡,所以看到pksq大家的评课反而觉得错愕o((⊙﹏⊙))o

4 1 复制链接
Eastwind(请读我的个人简介)大部分人认为的槽点大概就是在 面向GPT试验 这件事上 (当然也可能有一部分是因为优秀率)
立即登录,说说你的看法
  • 课程难度:困难
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:很多
  • 难度:困难
  • 作业:中等
  • 给分:一般
  • 收获:很多

老师讲课水平高+1; 自己对这门学科感兴趣+1; 无作业无考试+1; 实验标准不明确且需要大量课下自学分别-1.

----

这门课这学期上了一个月后我注意到一个很有意思的地方: 它和22春孙广中老师开的计科选修课 "程序设计进阶与实践" 在许多彼此正交的维度上都颇为神似, 包括但不限于:

没有考试作业, 4次小实验和1次上机和1次大报告决定总评 (数据分析的第一个实验是python编程基础, 和程设进阶的上机可以相当) ;

课时安排是每周一次三节课;

每次上课教室都挤得要死, 到得稍微晚一点就得到处搜刮空座位;

老师讲得挺好, 就是没什么用;

实验难度对萌新极其离谱, 需要大量的课下自学;

卷王 (非贬义甚至比较褒义) 可以把你觉得很正常的实验任务做出来的效果卷出万花筒, 而作为萌新你甚至都听不懂他们在干什么;

......

甚至于这门课出分后很多人抱怨体验抽象给分不好, 感觉都和程设进阶是一个模板刻出来的结果, 不免使这种相似感又增加了几分. 不知道大数据有没有修过这两门课的同学和我有相似的感受.

----

等有空了补正经的评课.

3 0 复制链接
匿名用户 2024春
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:中等
  • 作业:中等
  • 给分:一般
  • 收获:一般

 

老师挺幽默,上课喜欢讲故事,爱了爱了


这老师是会自搜的吧。。  

尽管如此还是吐槽下,这老师废话真多,第一节课不说些什么欢迎啊讨人欢喜的话,开堂就尽说些什么哪些人不适合学啊,有学生用gpt来写报告啊,又是什么转院啊理科同学不适合啊不爱听的同学可以走啊云云,谁听啊,把这些废话放到课堂结尾说多好,这些个讨烦的话放在开场白还真是个性啊

(最后修改于 2 4 复制链接
Mr.Ran你希望老师第一节课讲什么?
omo回复 @Mr.Ran: 介绍课程呗,你没上过?
omo回复 @shyyyy: 跟牛魔风呢?
omo回复 @shyyyy: 不知道现在一些人在哪里学的这种+1的评论方式,不感觉很讨嫌吗?放在弹幕里刷屏,放在评论区顶楼,有害无益。评论时不走心,难道还要我为这些+1的落井下石者每人回复一句单独的话吗?
立即登录,说说你的看法
匿名用户 2023春
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:中等
  • 作业:中等
  • 给分:一般
  • 收获:一般

写这篇评课主要是来降低(提高?)幸存者偏差的比例。

考核方式:4实验+1调研报告+课堂小测(一般1-3题,频率较高,如果当时有在认真听课或者掌握相关基础应该难度不大,主要用于考勤,并且据助教说在如果考勤没到可能总评比较吃亏)

课程内容是数据分析中用到的各种思想和算法,印象最深的是先验后验那部分相关的,以及最后粗略涉及到推荐系统相关的SVM等算法,其它的因为没太听讲不太记得了。

看到其他同学评课里面讲到了面向GPT实验以及针对每次的实验及相关实验报告没有即时反馈的问题。由于本人在学期内没有成功使用过GPT,并且编程基础不太好,所以我的四个实验以及调研报告都是自学手册+面向CSDN编程,过程稍显艰难。而且因为拖延症,所以常常在ddl前一周才开始准备,ddl当天写完上交。自我感觉实验结果都是勉强达标,想写的很多,但是常因ddl迫在眉睫而放弃一些额外的想法。相对来说,调研报告是我最用心的一项,前后写了快两周。我做的是关于推荐系统的内容,以两篇论文为基本内容提取关键算法,用自己的话复述了一遍,然后还参考了一些使用类似算法或者应用于类似情景的论文进行了比较,总共写了12页。上交报告后的两节课(也就是最后两节课)才发现老师的授课也讲到了很多推荐算法(和我的报告中涉及的算法重复率40%左右)感觉总评要寄了。不过结果还不错,最后喜提优秀,对于我这种常年班级平均分上下拿不到优秀的人来说很是惊喜。(出分后发现有些大佬没有拿到高分,也不排除电风扇给分的可能)

对于给分,由于没有公布给分细则及每次实验的分数(助教的说法是怕大家因此卷实验报告),我只能给出我猜测的给分标准:考勤重要+报告中要美观并体现出自己的思考。老师比较重视报告格式的规范。此外,上课时多次强调了希望大家做实验时可以发散思考,不要只局限于实验要求。我虽然不知道怎么去拓展我的实验内容,但是尽量地多用几种方法去对比效果(例如选择不同的局部数据集)然后在调研报告里面也加入了很多自己的思考。其中当然也有投机的成分,因为知道实验很难拉开分数的差距(个别做的格外细致和详尽的除外),猜测调研报告可能是拉开差距的一环(能看出是否用心地阅读论文)。后来私下里了解到有不少同学都是抱着随便看看随便写写的态度来写调研报告的。

2 0 复制链接
匿名用户 2024春
  • 课程难度:中等
  • 作业多少:很少
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:中等
  • 作业:很少
  • 给分:一般
  • 收获:一般

兄弟们给个五分公平公正。

总结为自学的课,主要比重在实验,实验的知识大都要自学,上课不爱听因为听了就忘了。

最好的一点是老师讲的一些道理挺不错的。

不建议选啊兄弟们,不如自学Python什么的爽。

1 1 复制链接
youxi666牛魔,我是必修🤓
立即登录,说说你的看法
匿名用户 2023春
  • 课程难度:困难
  • 作业多少:很多
  • 给分好坏:一般
  • 收获大小:很多
  • 难度:困难
  • 作业:很多
  • 给分:一般
  • 收获:很多

这学期花时间最多的一门课,实验确实需要很多精力,不过有GPT辅助,也还能接受,选这门课的同学建议提前熟悉pandas、sklearn(最好是熟练到常见方法不用查文档快速写出的程度)和latex,爬虫可以速成。

本人小测全勤,文献调研用USTC毕业论文模板写的,前两次实验报告倒是直接markdown水了过去(个人建议课程设计实验的时候如果用jupyter notebook的话其实可以把报告和代码直接集成,不必让同学们另写一份)

最后给分还算与付出精力匹配,拿了92。其实很建议在学ml之前学一下这门课作为前置。

1 0 复制链接
˃ʍ˂ 2023春
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:中等
  • 作业:中等
  • 给分:一般
  • 收获:一般

这门课只有4次实验+1次算法题+调研报告,结果实验一直没有反馈也没有具体的评分标准,尤其是调研报告,很难让人不怀疑评分具有很大的主观因素。

 

最绷不住的,提交实验的邮箱连个自动回复都没有

1 0 复制链接
匿名用户 2023春
  • 课程难度:简单
  • 作业多少:很多
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:简单
  • 作业:很多
  • 给分:一般
  • 收获:一般

上课根本学不到东西,然而每节课小测,教室是3A,人又爆满,整个教室弥漫着汗臭脚臭

 

课程实验全靠自学,不过收获还是不少,鼓励卷报告我是比较反感的

0 0 复制链接
ColinJ 2021春
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:很多
  • 难度:中等
  • 作业:中等
  • 给分:一般
  • 收获:很多

沙发~

19大数据,这课和《数据科学导论》其实是一门课,和往年的评价相对比,我觉得刘老师在这门课上的教学已经取得了很大的进步。

数据分析及实践主要从数据分析、数据统计、数据挖掘三个方面讲述了数据分析的全过程,包括数据处理、各种统计方法、机器学习、深度学习的东西都多多少少涉及了,由于课时的原因不可能深入的去讲,因此这门课更多的是一个导论课(所以我觉得改名是没有必要的)。

这课没有考试,分数全部由几次作业决定(上课有小测,听课就能做,但不知道算不算分;也没有去年的比赛),作业也由浅入深,非常照顾大二的同学。这个学期的作业主题是LOL,虽然可能对不玩游戏的同学有一些不公平,但是上课的时候说作业最后的效果并不完全和成绩绑定,报告写得好、经过多次试错等都可以给报告加分。还有一个调研报告,但说实话这个报告对于这门课的意义我感觉不是很大,如果这门课能增加一些课时给同学们分享可能会好一点。

大数据的同学和想选这门课的外院同学最好自己在开课前学好python的基础内容以免浪费时间,另外学习如何写一篇漂亮的报告也对这门课和之后的学习会有很大的帮助。

0 0 复制链接

刘淇

教师主页: 戳这里

其他老师的「数据分析及实践」课

刘淇老师的其他课

“科学与社会”研讨课 10.0 (2) 2024春 2023秋...
数据科学导论 8.8 (5) 2020秋 2019秋...
数据库概论 10.0 (1) 2021春
数据库概论 9.0 (1) 2020春 2019春...
数据科学导论 7.8 (4) 2021秋 2019秋
数据库概论 2017春