机器学习概论(何向南, 王翔) 2024秋  课程号:22900301
2024秋  课程号:22900301
9.5(15人评价)
9.5(15人评价)
  • 课程难度:困难
  • 作业多少:中等
  • 给分好坏:超好
  • 收获大小:很多
选课类别:计划内与自由选修 教学类型:理论实验课
课程类别:本科计划内课程 开课单位:人工智能与数据科学学院
课程层次:专业核心   学分:4.0
课程主页:暂无(如果你知道,劳烦告诉我们!)
AI 总结 AI 总结为根据点评内容自动生成,仅供参考

课程内容

《机器学习概论》在2024年秋季的课程内容有所更新,删除了贝叶斯和概率图,加入了强化学习(MDP、RL、Gaming),符合时代趋势,如“DeepSeek-R1展示了RL的强大能力”。课程广度大,涵盖丰富内容,适合作为入门课程,但部分同学反馈内容不够深入,多为“启发式”学习。课堂注重数学推导和概念讲解,有同学认为部分内容与大数据学院的其他课程重叠过多。

教学水平

王翔和何向南老师的教学被普遍认为“深入浅出特别清晰”,细节周到,虽然信息密度不高,但课堂体验良好。老师在给分和调整分数方面展现了同情心,并为低分段同学提供了提升空间。有学生称“王老师和何老师是神”,助教团队也被广泛赞赏,表现出色,认真负责。

作业与实验

实验减少至4个,但有难度,部分被认为繁重而复杂,尤其是lab1,要求提前开始,包含较多实操内容和Python编程,可能对新手不友好。实验框架设计详细,评价标准清晰,但操作性要求较高。有评论指出作业偏理论且与考试联系不强,但有助于掌握概念。

考试与给分

考试难度适中,内容包括神经网络、MDP、Q-learning、线性回归等,一般为概念理解和推导实操。课程采用半开卷形式,考点多在课堂与作业中反映,尽管挑战不小,对认真学习的同学较友好。期末分数计算方式公正透明,给分慷慨,总评普遍偏高,令不少同学满意。

学生体验与选课建议

课程适合对机器学习有兴趣并愿意投入时间的学生,特别是大数据学院的同学。对数院背景的学生而言,虽然引入了数学元素,但可能不足以满足深入学习需求,建议结合其他课程(如西瓜书)自学。总体来说,课程对编程能力要求较高,数院同学、编程新手自选需谨慎。

总结

本课程作为机器学习的入门课程,基础扎实且内容广泛,教师与助教团队水平高,给分宽松。适合对机器学习理论、应用均有兴趣的同学,但需为其广度和实验做好时间管理准备。对于想要进一步研究机器学习的学生,建议选择更高阶的后续课程或自学补充。

排序 学期

评分 评分 15条点评

Rosykunai 2024秋
  • 课程难度:困难
  • 作业多少:中等
  • 给分好坏:超好
  • 收获大小:很多
  • 难度:困难
  • 作业:中等
  • 给分:超好
  • 收获:很多

我于2023年修读这门课(连老师班), 这是当时的评课: https://icourse.club/course/19042/#review-83442

 

2024年的课程内容相比往年删去了贝叶斯和概率图, 新增了强化学习(MDP, RL, Gaming)。目前来看是符合当前时代趋势的, 今年的o1,o3还有最近的DeepSeek-R1都展示了RL的强大能力, 感觉后面做Post-Training或者Alignment的同学最好还是多了解一些RL知识。

特别提醒: 今年课堂上没讲ELBO推导(变分推断),我们在课后补充了这一部分内容(考试没考),但是如果你将来要从事生成模型的研究,请务必认真学习这部分内容,以及保研面试时可能会考到这个…大家自行评估吧。

 

2024秋季我担任本课程编外助教, 负责lab1、lab3和lab4,相比往年,今年实验数量减少到4个(Linear Model, NN, Clustering & Dimension Reduction, RL) 。 我出的几个实验应该都不算太容易,而且初版都多少有点bug,这里特别感谢同学们及时提issue帮助修复。原本计划是要给每个实验做好分段测试的,可惜最后助教精力能力有限,只能给整个实验写一个评分脚本,给同学们做实验带来不便还请谅解。下面回答一些大家可能比较关心的问题:

  • lab1为什么这么难?
    截止我写这篇评价时,我们的github仓库里有70条issue,其中有近50条是关于lab1的(说实话我也被震惊到了),还有相当一部分是关于如何从HuggingFace上下载数据集的。其实在出这个实验时,我是想趁着线性模型比较简单,再加上同学们或多或少之前都接触过,让同学们提前感受一下后面用pytorch训模型和测试大概是什么样子,于是我用numpy对着pytorch源码手搓了一个用起来比较像pytorch的实验框架,然后添加了大量的注释,希望同学们能做一点学一点。没成想,在我很早就提醒大家早点开始做实验的情况下还是有不少同学国庆假期才开始做实验,相信这些同学在没听到ddl延期之前都考虑过退课吧。其实从最后提交结果来看, 大家耐心读完文档和注释之后, lab1并没有那么难。
     
  • 为什么要有实验框架?
    有许多同学问过可不可以自行发挥,不遵照或者调整实验框架的内容。首先,我出的实验都有对应的评分脚本,如果同学提交的代码不兼容评分脚本会给实验评分带来相当大的困难。另一方面,我们的实验框架设计遵循一定的逻辑,相信同学们如果有仔细阅读过代码框架还是能够学到一些东西。今后同学们不论是工作还是科研,阅读他人的代码的能力可以说十分重要,可能那时你会感叹我的实验框架注释写得还是太多了。
     
  • 为什么有不计分的Optional?
    出现这部分内容一般是以下情况: 实验内容已经够多了但是这几个问题确实可以思考尝试一下;这个东西和实验关系不大,但是挺好玩的;本来以为老师要讲的,结果没讲。

我们的实验应该和同学们之前任何一门课的实验风格都不相同,刚开始同学们可能不太适应,不过坚持了一个学期, 后面同学们再接触pytorch和HuggingFace生态库以及作为可选项的wandb时才不会那么痛苦,希望同学们做完实验都能有所收获。

一个有趣的发现: 期末考试除了最后一题以外得分率最低的题是MDP和Q-learning那道题,看起来同学们考前都没怎么做lab4啊。

选课建议:
如果你是必修: 认真对待这门课, 对于大数据的同学来说,这门课绝对当得起“专业核心”这四个字。
如果你是选修: 请充分评估学习这门课需要花费的精力,理论和实验部分都不轻松。如果你想更理论一点, 请选择春季学期的大数据算法,如果你想要更多的code, 感觉科大还没有这种课(

后续学习建议:
我们实验框架的设计参考:https://github.com/addtt/variational-diffusion-models
大数据算法:大数据算法(丁虎) - USTC评课社区 (icourse.club)
深度学习导论:深度学习导论(王皓) - USTC评课社区 (icourse.club)(这门课似乎换老师了)
如果你和我当初一样遇到了多卡并行的debug困难,推荐选择:并行计算(孙经纬) - USTC评课社区 (icourse.club)(现在似乎改名了)
对于想做理论的同学,有一门不错的数学课:https://www.bilibili.com/video/BV1CK411W7Ep
推荐在这里选一门你感兴趣的课学习HuggingFace生态:Hugging Face - Learn

最后,感谢各位同学对课程实验的积极反馈,如果今后有什么学习科研上的问题也欢迎与我交流!

2025年1月21日 16:20 17 1 复制链接
TheBunniestForever助教gg辛苦了!虽然我这学期没选课) 2025年1月22日 00:23
立即登录,说说你的看法
  • 课程难度:中等
  • 作业多少:很多
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:中等
  • 作业:很多
  • 给分:一般
  • 收获:一般

作业表述有点迷惑,难道只有我一个人看不懂题目想让我干什么吗┭┮﹏┭┮

另外反向传播不就一个链式法则的事情吗,感觉这辈子只会在上课和作业里手算😅 有必要讲这么久吗?我已经是人肉计算机的形状了


感觉不是一门适合数院宝宝体质的机器学习😭 我怎么只学到了一堆名词😭


其实讲的东西挺多的,这也导致了很多东西没有深究,只学到了一个朴素的想法,感觉很多都是启发式的。占个坑,出分细评一下


给分非常不错😋内容深度不是很大,导致像我摸一个学期也能拿个不错的成绩。以下先说说我Email给老师的一些建议:

  1. 课程内容方面选材丰富,涵盖内容非常广。但是我注意到有部分内容在您的课堂部分和何向南老师课堂部分有所重复,比如泛化和优化算法部分,个人觉得有点拖课程进度了,可以节约这部分时间来讲更多的东西。
     
  2. 关于优化算法部分,我了解到大数据学院是要求必修数院的运筹学课程,优化算法会在这门课中详细介绍,所以我觉得可以减少机器学习概论课程中介绍优化算法的部分,而是直接使用。
     
  3. 关于考试和平时作业部分,我觉得二者的联系有点弱,作业更偏理论证明的风格,而考试基本是实操的风格,可以对二者做一点平均,增加作业中实操的部分。不过确实实操的部分也不太好作为书面作业布置,也可以考虑一些其他的方法。

 

这门课正如其名是概论,很多内容只是导论性质,导致虽然广度很大,但是很多内容我并没有真正学懂,很多启发式的内容对我来说只会留下一个这样做确实挺好的想法而已。既然只是导论性质的课的话,我认为还可以再增加一些内容,这几天看到了交大的ML课程CS420 ML,感觉真包含机器学习概论。唉,学完导论性质的课后,发现对某块内容有点兴趣,看看中科大的课程库,结果发现查无此课,这是何等悲哀😭

 

提供一点书面作业参考,一些比较困难的作业题可以找找这里有没有CS229/Problem Set Solutions/ps1-sol.pdf at master · kumi123/CS229

2024年11月13日 07:15 (最后修改于 2025年2月24日 05:22 7 5 复制链接
JameTimeICS 评课有人说改革了,还有求导作业,看来考试也要算 2024年11月13日 07:17
HaHAhaHA好奇数院人想从机器学习学啥 2025年1月12日 11:22
我真的不懂微分方程回复 @HaHAhaHA: 我对这门课的期望当然只是想了解一下基本知识,作为ml theory的起步吧 2025年1月12日 11:45
红领巾回复 @我真的不懂微分方程: 可能更适合王杰老师班一点 2025年1月15日 07:38
我真的不懂微分方程回复 @红领巾: 主要王老师班讲了部分凸优化,感觉和运筹学重叠了,就没选 2025年1月16日 07:28
立即登录,说说你的看法
  • 课程难度:困难
  • 作业多少:很多
  • 给分好坏:超好
  • 收获大小:很多
  • 难度:困难
  • 作业:很多
  • 给分:超好
  • 收获:很多

半开卷好啊

自己算的总评没法及格, 被捞到2.7了, 大四还要啥自行车

王老师何老师助教是我爹orz

2025年2月24日 15:11 5 2 复制链接
是好事 2025年2月24日 15:12
TheBunniestForever恭喜 2025年2月24日 15:24
立即登录,说说你的看法
  • 课程难度:困难
  • 作业多少:很多
  • 给分好坏:超好
  • 收获大小:很多
  • 难度:困难
  • 作业:很多
  • 给分:超好
  • 收获:很多

按照公式算是73.1总评80 ???????

已经被管院给分PUA的菜鸡不敢相信这个世界上会有这样的给分(;><;)

自报家门:大四管统摆烂人(python零基础)(但是数学不好hh)水专选学分

关于课程

选课的初衷就是水学分但是意外地学到了很多东西

关于老师&助教

wx老师的数学推导深入浅出特别清晰,hxn老师讲的计算机相关内容(虽然可能是因为没有学过前序课程有不少听不太懂)但是也学得到东西;助教水平很高&炒鸡认真负责

关于作业

(因为老师&助教水平很高所以)作业&实验都很有挑战性,从零开始配环境学python无数次想退课(x),但是真的有收获

lab1反馈

关于考试&给分

考试感觉还是有难度的,题量比较大,比较数学(不知道是因为真的有难度还是我大四太摆烂没好好学习)

(不过大多数PPT上都有&上课讲过&作业练习过,只要好好听课做作业应该是问题不大?)

按照平时50%+期末50%算出来的是73.1

总评80(这不是给分好那什么是给分好啊啊啊啊啊)

(怎么大四摆烂学的课比大二的时候认认真真学习的专业课分还要高,这个世界上竟然会有这样的给分)

总结:符合我对信智学部课程的所有美好想象

2025年2月24日 03:36 (最后修改于 2025年2月24日 03:40 4 0 复制链接
υ 2024秋
  • 课程难度:困难
  • 作业多少:很多
  • 给分好坏:超好
  • 收获大小:一般
  • 难度:困难
  • 作业:很多
  • 给分:超好
  • 收获:一般

数院大四概统人表示,这学期上这个课写作业写代码次次写破防,现在复习更破防,ppt信息密度低的离谱,但看回放感觉听课体验也许还行,给个8分观望,考试要是跟作业一样逆天我就直接开喷了。

以及正在准备cheatpaper,然而并不知道往上写什么…

我只是想混个专业选修学分好让我毕业😫


考试后更新:难度还行。神经网络相关的有三道题,基本上把能考到的点都给考了(第一题单层网络算几个梯度、第三题多层算一个很简单的反向传播、第四题softmax还是算几个梯度);第二题是Markov决策和强化学习;第五题是线性回归,作业题改编;第六题是K-means聚类的核方法的应用,第一小问构造个高斯核,第二问其实我没太看懂要我干什么,可能是在问核化时把什么东西换成核函数?感觉和第一小问没啥关系。

比较难的EM、集成学习、KL散度和变分推断都没考,唯一的槽点就是好多地方都用了这个矩阵求导公式:

tr(XBXTC)X=CXB+CTXBT

这是我cheatpaper上唯一用到的东西。

最后,依然不推荐概统人选修这门课…整门课给我的感觉是上课开开心心划过,结果作业逼着我又花大量时间查资料,那我为什么要选课,看看西瓜书自学就好了。


“在王翔老师的强烈要求下,低分段同学的分数有了明显的提高,高分段同学的分数保持不变。”

伟大,无需多言。

2025年1月14日 15:10 (最后修改于 2025年1月17日 00:39 4 1 复制链接
我真的不懂微分方程点了,看着ppt根本不知道写什么带上去 2025年1月14日 15:14
立即登录,说说你的看法
tanleo 2024秋
  • 课程难度:困难
  • 作业多少:很多
  • 给分好坏:超好
  • 收获大小:很多
  • 难度:困难
  • 作业:很多
  • 给分:超好
  • 收获:很多

数院大四人,国庆期间赶来评课。

目前来讲王老师授课还是非常清楚的,授课内容也很丰富,课件也非常清晰。

内容和难度方面,数院的同学如果学过回归分析以及运筹学的话理解起来会轻松一些。如果是大三刚开始接触数理统计的同学可能会稍微感觉有一点难。(这里吐槽一下数院概统方向的培养方案,如果说不提前修课完全按照培养方案走的话大三上几乎选不了什么课,因为如果只学过概率论没有学过数理统计的话刚开始上手回归分析或者机器学习都会有一定程度的不适应,可能选陈士祥老师的运筹学刚开始的时候上手会舒服一些)

本课程的几位助教也是非常负责任,和同学的沟通做的非常好,充分考虑了同学们的需求。

不过这个第一次上机作业是真的难。对于数院的同学(特别是像我这种Python编程水平很低的同学)还是有较高的挑战性的。另一个角度来看这也是数院希望走统计方向的同学锻炼coding能力的一次机会。

2024年10月2日 03:20 (最后修改于 2024年10月2日 03:26 4 1 复制链接
求捞求调分求不被卡绩嘤嘤已经写破防了......如果有下次我一定留作业的时候就开始配环境 2024年10月2日 15:38
立即登录,说说你的看法
匿名用户 2024秋
  • 课程难度:困难
  • 作业多少:中等
  • 给分好坏:超好
  • 收获大小:很多
  • 难度:困难
  • 作业:中等
  • 给分:超好
  • 收获:很多

数院摆烂人,几乎没有去上课全靠回放续命

这门课的内容基本上是各个方面都有涉及,但是并不深入,适合作为方向入门。

作业次数不多(4次),但是每次作业时间较长(>15h),时间是需要有所协调。

给分可以说特别好,书面作业avg=99.75,实验avg=97,期末77总评奶到了92,王老师和何老师是神()

本学期作业和实验的个人版本以及课程ppt放在https://github.com/Intelligent114/ML24了,有需要可以参考。

2025年2月26日 06:48 (最后修改于 2025年2月26日 10:46 3 1 复制链接
TheBunniestForever千古!🙏 2025年2月26日 09:44
立即登录,说说你的看法
CobaltBlues 2024秋
  • 课程难度:困难
  • 作业多少:很多
  • 给分好坏:一般
  • 收获大小:很多
  • 难度:困难
  • 作业:很多
  • 给分:一般
  • 收获:很多

非常硬核的一门课,硬核到我这样的计算机小白有点高攀不起。

王老师是我见过讲课最清楚最有条理的老师之一,上课跟着走一遍,听懂不成问题。收获非常大的一门课,但是作业和实验真的写到怀疑人生了,计科人被各种数学折磨得痛不欲生,代码更是一调就是好几天(除了10分钟就能写完的lab2的神经网络+鸢尾花dataset)

PPT基本是中英双语的,细节非常到位但是自学还是有点小困难。复习过程非常痛苦,18周的课全部上满,量大管饱。但是因为没有任何往年卷子参考(这门课的风格据说都和往年很不一样),只能硬瞪作业题上的各种奇妙数学小公式(数学还是太高雅了)

无点名无小测有回放。考试是半开卷。

本学期课程大纲:

  1. 机器学习简史
  2. 线性回归Linear Regression
  3. 性能评估Performance Evaluation
  4. 正则化(Ridge Regression & Lasso Regression)
  5. Linear Models I - 逻辑回归
  6. (国庆节)
  7. Linear Models II - 分类器评估,广义线性模型,多分类
  8. 神经网络Neural Network
  9. 神经网络的反向传播BPTT
  10. 无监督学习 - 聚类Clustering
  11. 决策树Decision Tree
  12. 集成学习Ensemble
  13. 无监督学习2 - EM算法
  14. 降维方法PCA
  15. 支持向量机SVM
  16. 马尔科夫决策MDP
  17. 强化学习Reinforced Learning
  18. 博弈Gaming

真的复习到破防了,,,希望考试题不会像作业一样离谱。

考完啦,总体感觉还是偏概念理解和推导实操,应该还算友好(?),考试有6个大题,分别是神经网络,MDP和Q-learning算法,(第三题忘了,好像也是推公式),反向传播计算,线性回归梯度计算,kernel方法的运用。除了最后一题其他都还算基础,而且第五题的线性回归和作业一的第4题相似度还蛮高的,大概是是作业的一个简单浅显一点的版本

2025年1月15日 07:14 (最后修改于 2025年1月16日 04:30 2 0 复制链接
匿名用户 2024秋
  • 课程难度:困难
  • 作业多少:很多
  • 给分好坏:一般
  • 收获大小:很多
  • 难度:困难
  • 作业:很多
  • 给分:一般
  • 收获:很多

作业实验都挺多的,还是得早点做实验写作业啊

2024年10月6日 15:33 2 3 复制链接
TheBunniestForever是啊,我有个数院哥们因为任务量太大被逼到退课了(( 2024年10月6日 16:28
科大小青菜回复 @TheBunniestForever: 大数据是必修TAT 2024年10月7日 11:00
TheBunniestForever回复 @科大小青菜: 致敬DS人! 2024年10月7日 14:49
立即登录,说说你的看法
匿名用户 2024秋
  • 课程难度:困难
  • 作业多少:中等
  • 给分好坏:超好
  • 收获大小:很多
  • 难度:困难
  • 作业:中等
  • 给分:超好
  • 收获:很多

PPT有点混乱,但是老师很耐心,讲的很好,作业比较难,实验的难度不平均,但是确实能学到东西

老师和助教都很善解人意替大家考虑,最后给分也超级好,谢谢你们,谢谢😭

2025年2月26日 08:02 1 0 复制链接
匿名用户 2024秋
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:中等
  • 作业:中等
  • 给分:一般
  • 收获:一般

咱就说能不能别一直手算梯度了,在这样要退课了捏

2024年10月30日 04:32 1 1 复制链接
TheBunniestForever吓人 2024年10月30日 08:08
立即登录,说说你的看法

何向南

教师主页: 戳这里

王翔

教师主页: 戳这里

其他老师的「机器学习概论」课

连德富 7.1 (37) 2023秋 2022秋...

何向南老师的其他课

人工智能原理与技术 8.5 (2) 2025春 2024春
数据科学基础 8.0 (1) 2020秋
数据科学导引 7.0 (1) 2020春
数据科学基础 7.4 (5) 2024秋 2023秋...
“科学与社会”研讨课 2025春 2024秋...

王翔老师的其他课

人工智能原理与技术 8.5 (2) 2025春 2024春
工程硕士专业英语(电子信息) 8.0 (1) 2024秋 2023秋
人工智能原理与技术 7.3 (6) 2023春
数据建模与分析基础 7.3 (9) 2024春
“科学与社会”研讨课 2025春 2024秋...