强化学习(吉建民) 2024秋 2023秋 2022秋 2021秋 2020秋 2019秋 2018秋  课程号:DSCI6003P01
2024秋 2023秋 2022秋 2021秋 2020秋 2019秋 2018秋  课程号:DSCI6003P01
8.8(13人评价)
8.8(13人评价)
  • 课程难度:中等
  • 作业多少:很少
  • 给分好坏:超好
  • 收获大小:一般
选课类别:基础 教学类型:理论实验课
课程类别:研究生课程 开课单位:人工智能与数据科学学院
课程层次:硕士   学分:4.0
课程主页:暂无(如果你知道,劳烦告诉我们!)
AI 总结 AI 总结为根据点评内容自动生成,仅供参考

教学水平与课程内容

吉建民老师的《强化学习》课程以其渊博的知识和丰富的激情受到学生好评。课程内容深度丰富,涉及许多经典数学推导,强调理论与实验结合,学生也能从中了解领域内的前沿知识。尽管讲课速度较快,预习和复习可帮助学生跟上节奏,课程辅助以线上学习材料,邀请业界专家授课。

作业与评定

课程不设常规作业,也不点名,主要由3次实验和1个大作业构成。实验难度适中,给出框架帮助,学生能通过课下努力和助教指导完成。大作业通常为组队或个人进行代码调试和调研,较高自由度。平时无考试,表现良好者可获高分。

考核与给分

给分较容易获得较高成绩,但过于依赖开源资源可能导致分数下滑。个别学生认为给分不如预期高,但大多数人给分满意。总体来看,课程对于初学者友好,尤其适合想要高效获得学分的学生。

排序 学期

评分 评分 13条点评

匿名用户 2022秋
  • 课程难度:中等
  • 作业多少:很少
  • 给分好坏:超好
  • 收获大小:很多
  • 难度:中等
  • 作业:很少
  • 给分:超好
  • 收获:很多

省流:分高事少,狠狠选。

开明的教育家,渊博的学者,富有激情的创业者,这是我心中吉老师的画像,也很符合我对一个优秀导师的期待。

开明的教育家是指吉老师对考核方式,及到课率的非强制。而且经常会站在同学们的角度思考问题,直言如果对强化学习非常熟悉的同学可以不到堂,但是我觉得对强化学习比较熟悉的同学听课可能会收获更多,因为这门课内容整体还挺多的,而且经典部分涉及了很多数学推导,私以为吉老师把自己定义为了引路者而不是讲授者,所以讲课速度确实快了一点,偶尔还会来点跳跃性,课前预习课后及时复习才能跟上节奏。By the way,可能也是这个原因当课程过半的时候到堂学生数也流失过半了。但可能这才是精英教育该有的样子。

渊博的学者是指吉老师上课期间并不会完全的照本宣科,常常会插入自己的做科研时的心得以及本实验室的研究经验,上面说的上课速度快也说建立在老师对知识的烂熟于心。激情的讲课方式,字里行间都显示着自己对自己研究领域的热爱。所以希望各位后来人坚持跟一跟,虽然老师不会点名,也没有平时的随堂作业,但是听惯了许多上课像上fen(二声)的课堂,如此充满激情且风格鲜明的老师值得。

富有激情的创业者,时过几月,让我再推ballman equation肯定是磕磕绊绊,但是吉老师上课所分享的一些小故事还是历历在目,无论是讲述他自己激情燃烧的岁月,还是讲一些前沿进展,仔细琢磨都会有些启发。他也谈到自己在不断鼓励自己的学生们去创业,并且准备好了许多资源,每每谈到创业他热切的眼神总是那么深入人心,祝愿有一天在中国的机器人圈提到南方的李泽湘和北方的王田苗时,人们也会不由自主想起中部的吉建民。

2023年3月31日 08:08 12 0 复制链接
daiaqswde 2021秋
  • 课程难度:中等
  • 作业多少:很少
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:中等
  • 作业:很少
  • 给分:一般
  • 收获:一般

终于出分了,竟然比机器学习出分还要晚!

本学期没有作业,上课不签到(可以不去,学期末的时候教室空空荡荡的),有 3 个实验 + 1 个组队 (上限5人) 大作业,分别写 

1. Sarsa、Q-learning

2. PG、A2C

3. DQN

框架都会给出,用心去github上搜搜总是有答案的。每次实验都有加分项供巨佬卷,第三个实验建议早做或者用个好显卡,否则一次就要跑三天

给分给了 85+,只做了实验一的附加,大作业写的水,已经很满意了。大作业是去 github 上找了个著名的RL算法进行一波调参+分析。

貌似大家的分数都不是很高,我有个猜想,会不会是组队人数过多导致分数下降

混分还是很简单的,想要卷绩点就比较困难了

2022年3月25日 14:35 4 0 复制链接
匿名用户 2024秋
  • 课程难度:简单
  • 作业多少:中等
  • 给分好坏:超好
  • 收获大小:一般
  • 难度:简单
  • 作业:中等
  • 给分:超好
  • 收获:一般

后面加的线上上课,最近 LLM + RL 挺火的,顺带入门 RL 又拿4学分。
给分还不错,最后刚好 4.3。

2025年3月5日 02:13 2 0 复制链接
hyfqphy 2023秋
  • 课程难度:中等
  • 作业多少:很少
  • 给分好坏:超好
  • 收获大小:很多
  • 难度:中等
  • 作业:很少
  • 给分:超好
  • 收获:很多

这个课,我只能说是神中神。吉老师是全国强化学习老师中的GOAT!!!

课程设计和作业都特别特别合理,收获很多。不选后悔系列。

事少分多,yyds!

2024年3月12日 00:33 2 0 复制链接
JingT-LIU 2023秋
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:超好
  • 收获大小:很多
  • 难度:中等
  • 作业:中等
  • 给分:超好
  • 收获:很多

这门强化学习(RL)课程内容深度丰富,如果学生在课堂上没能理解,可以通过观看课程回放进行学习。有邀请网易公司的资深专家为学生们带来前沿报告。

此外,课程中的三个大作业都有相应的开源资料。老师不点名。

然后,GPA4.3

 

 

 

2024年3月12日 09:05 1 0 复制链接
匿名用户 2023秋
  • 课程难度:中等
  • 作业多少:很少
  • 给分好坏:超好
  • 收获大小:很多
  • 难度:中等
  • 作业:很少
  • 给分:超好
  • 收获:很多

课程本身对于没有强化学习基础的同学来说有一定难度,但是收获很多,可以跟着吉老师了解到领域内前沿的一些知识。作业少且布置合理,难度不大,很容易入手(助教对于每次实验的讲解也很详细),给分很好!吉老师yyds

2024年3月12日 08:17 1 0 复制链接
匿名用户 2023秋
  • 课程难度:中等
  • 作业多少:很少
  • 给分好坏:超好
  • 收获大小:没有
  • 难度:中等
  • 作业:很少
  • 给分:超好
  • 收获:没有

虽然强化学习理论我啥也听不懂,但是作业不多(虽然相比22增加了一些),而且作业真的很好抄。上课也从不点名,听说最少时候一百多人只有30个人去上课。

2024年1月7日 17:10 1 0 复制链接
Landing 2024秋
  • 课程难度:中等
  • 作业多少:很少
  • 给分好坏:一般
  • 收获大小:很多
  • 难度:中等
  • 作业:很少
  • 给分:一般
  • 收获:很多

入门一波 RL,大作业以及大作业之后一段时间从 REINFORCE 开始学习了一波 PPO。只能说真难学……

学期中有一次点名,三次作业一次大作业,没有期末。因为只要求 coding,对原理要求不高所以都很简单(学期结束一个月,现在已经不会推导了` w `),最后大作业选了个 PPO 给自己难得绷不住了* ^*|||)

4 个学分可以精准反杀 计科学硕不得不学分溢出多学一门课满足要求的培养方案

给分一般,但是爵士毫克。最近图灵奖还颁给了 RL 的奠基学者,家人们快来学

2025年3月6日 13:39 0 0 复制链接
匿名用户 2024秋
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:杀手
  • 收获大小:一般
  • 难度:中等
  • 作业:中等
  • 给分:杀手
  • 收获:一般

三个实验+一个大作业,没有考试。

平时实验附加题都写了,最后没上90,感觉给分没之前的评课说的那么好。

2025年3月4日 05:57 (最后修改于 2025年3月4日 06:03 0 0 复制链接
winewood 2023秋
  • 课程难度:中等
  • 作业多少:很少
  • 给分好坏:超好
  • 收获大小:很多
  • 难度:中等
  • 作业:很少
  • 给分:超好
  • 收获:很多

给分超好,作业很好写。刚开始讲基础的部分会有点快,但是自己课下看看了解一下就问题不大了。冲,很好的。

 

2024年3月12日 05:42 0 3 复制链接
winewood另外如果课后想再看看的话,推荐一下【【强化学习的数学原理】课程:从零开始到透彻理解(完结)-哔哩哔哩】 https://b23.tv/QSQAfWC 2024年11月28日 11:07
φφ回复 @winewood: 课看完了,本科生可以选这个课吗 2024年12月18日 15:41
winewood回复 @φφ: 这个是研究生课,应该选不了? 2024年12月24日 04:14
立即登录,说说你的看法
oneway 2022秋
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:超好
  • 收获大小:很多
  • 难度:中等
  • 作业:中等
  • 给分:超好
  • 收获:很多

学期初据说要考试,但最后因为疫情原因没考,改独立完成大作业了,因此作为基础课十分推荐。

一共有两次编程作业和单人大作业,上课没有签到。

编程作业难度适中,没接触过强化学习也可以顺利入门,给了代码框架,往里面填代码即可。大作业是从一些选题里选一个进行调研,跑跑代码+阐述原理+分析,最后给分80+。

 

2023年3月31日 07:55 0 0 复制链接

吉建民

教师主页: 戳这里

其他老师的「强化学习」课

吉建民老师的其他课

机器人编程入门 10.0 (1) 2014夏
人工智能基础 10.0 (1) 2025春
数理逻辑 8.0 (1) 2021春
人工智能基础 7.6 (36) 2024春 2023春...
数理逻辑 2014春 2013春