| 选课类别:计划内与自由选修 | 教学类型:理论实验课 |
| 课程类别:本科计划内课程 | 开课单位:人工智能与数据科学学院 |
| 课程层次:专业核心 | 学分:4.0 |
本课程主要讨论机器学习的基础算法。具体内容包括线性回归与分类、性能评估、正则化、神经网络、无监督学习、决策树、降维方法、支持向量机、强化学习、逻辑、知识表示等。重点介绍机器学习算法的基本工作原理及其应用。该课程将理论与实践相结合,不仅夯实学生的理论分析能力还锻炼学生的动手能力,从应用问题出发理解机器学习算法的作用与价值,并力图反映机器学习研究的最新发展前沿。
考核方式基础,作业难度就不基础
Lab1出分,内心稍微有点崩溃,到评课社区写一篇小作文。内容为个人见解,仅供参考。
首先是这门课程,两位老师讲得都挺好的,整体感觉不是很难,部分数学内容可能会有些难度,不过似乎也没有那么重要,但是感觉仔细思考那些数学推导对于深入理解一些原理还是有帮助的。
然后,问题出现了,作为一门能够高替机器学习A的课,又没有考试,它的难点在哪呢?答案是HW和LAB!
先说HW,可以说是概统、线性代数、Python编程能力的综合考核吧,有些题目较为困难,可能需要想很久才能完全理解。不过如果你只是想把答案写出来,在现在AI的时代,这个再简单不过了。但是我本人非常想把这门课学好,因此每个题都会思考较长时间去把它完全弄清楚背后的数学原理,因此感觉比较费时间。不过我觉得也值了,毕竟真有所收获。
再说LAB,Lab3还没做,只说Lab1和Lab2。
首先Lab1,也就是出了分让我很崩溃的Lab,其实要做的事情很简单,就是基础线性回归。助教原话是“助教没有直接放效果的给分,本意就是大家不要过于卷效果而是回到实验本身,发现问题,定位原因,解决问题这种思路上,我认为更有意义。”我觉得出发点是好的,助教希望大家去回归实验本身寻找问题,但是一个线性回归模型真的会出现很多问题吗,如果没那么多,那么是不是简述一下我的调参过程,把要求的问题回答了,就可以作为一个合格的报告了。如果你是刚才那种思路,请思考一个问题,这门课不像隔壁数据结构、ICS那些,这门课没有最后的考试,所有的总评完全由Lab HW和大作业构成,那么如果你报告一般般,作业上面分析过了不管你以哪种方式,最终得分理论上大差不差,那你怎么拿高分呢?你只能从这个Lab和大作业上入手。
从另一个角度,作为一个机器学习的模型,我们要的是什么,肯定是较好的效果啊,而且线性回归的模型是可以有明确的优化方向的啊——特征值构造。因此本人花了大量时间在特征值构造上,最终效果也有明显提升。模型训练的差不多了,再写个报告大概描述一下自己特征值怎么构造的,同时写一些其它细节上的优化,整体上我个人认为还是很可以的。不论从模型表现上还是我的时间投入上,我都觉得我认真对待了。但现实就是,我这个Lab的得分比我预期的低了很多。准确地说,我觉得我的投入产出有些不成正比。
身边有同学似乎是大量AI辅助然后AI修饰了一个较为华丽的报告得了高分,我承认在报告方面我没有做更多的问题分析,我只是花了一些篇幅描述了我特征值构造的过程,因为我觉得这是重点,而其他的对模型的影响都是较为次要的,因此都稍微简单的写了一下就过去了。但是,可能正是这种想法导致了我最后得分较低。因此我觉得对于一个线性回归模型,为什么Performance反而不是一个重要参考指标是一个值的探讨的问题。
Lab2没有出分,不过写的过程中较为难受的点在于它的评测指标,在这个评测指标意义下模型的表现较为奇怪,包括但不限于初始化模型指标最好等。
最后就是我目前比较纠结的点,更多是关于这门课和给分的,我个人希望在这门课中有所收获,对机器学习等有一个较为好的理解,同时也希望能拿到高分,毕竟这是专业核心课,在成绩单上很低会令我很难受。然而从现在我的角度来看,给分可能并不能真实的反映你对于这门课的知识到底掌握的好不好。首先如果想有更好的理解,可以课后自己多思考,去把PPT的数学推导研究明白,去问AI更深入的知识。而对于HW和Lab更多应该自己独立思考完成,可以询问AI来加深自己的理解,而不是上来就让AI给你答案。Lab报告我会坚持自己写,自己去梳理逻辑,不会让AI直接生成,但这样又会限于语文表达能力和理解能力等不能完全把自己所想的表达出来,同时也不会想AI一样做那么全面的分析。但是如果这样就可能会导致Lab分数偏低的问题,包括实验过程分析以及思考题的回答,我觉得完全使用AI生成确实会比我们自己分析理解的更加深刻。
这个问题感觉非常的难以解决,AI是一个对我们学习非常有帮助的工具,但确实在某种程度上引入了不公平性。
目前我也只能调整自己的心态为,我是来学习知识的,最终的成绩随缘。
评分就先不打了,期末全讲完再说吧。
其实这门课老师讲的还是不错的,课程体验也还好,想学AI入门之类的可以考虑来听一听,如果不希望自己的成绩单上增加4学分不确定性因素同时培养方案不必修的话,可以考虑不选课来旁听。讲真,HW和Lab很多问题还是值的思考的(比如HW2的HMM模型,想清楚的感觉还是很舒服的),就是评分出来后心理不平衡感有点强,因此写一篇小作文……
12.2,二更。
中午看到群聊里也在讨论Lab1的问题,助教所说的“是作为一门实验学课的报告,你的所有话是有逻辑有证据的,不是只是你说个话就得了”,反思自己的报告可能确实存在一些断言没有给出充足的证据支撑,以及Readme中有些问题回答的过于简略了,大概是因为当时调出较好的performance后内心比较想开摆了吧。
至于说助教所说不过多纠结于lab1打分,我觉得大部分人所考虑的是如何在这门课评判标准下得到一个“高分”吧,而不仅仅是lab1的问题,毕竟这门课的总评完全由这种评判方式构成。现在的结论就是报告要尽量将所有证据和推理逻辑过程写清楚。
针对于使用AI完成的问题,HW3中似乎明确提到了“如果完全使用人工智能来完成这次基础作业,你将会得到一个不太高的分数。”Lab3还没有看,可能也有类似语句吧,但是问题在于目前没有什么较好的方式评判一份作业或者一份报告究竟是否是AI写的。我觉得这个问题主要就是看自己学习这门课的目标和态度了。还是和前面相同的观点,AI是一个非常有用的工具,可以帮助我们更好的理解很多内容,但是,如果仅仅是靠AI达到完成作业的目的,我觉得有一些本末倒置的感觉。
9.30 作业文档看破防了孩子们
10.1 孩子们我才想起来这课能高替机器学习A,这下好了大三的史放到大二赤了。还有信智学部的同学一定要赶紧学会科学上网,不然很麻烦。
10.20 HW1这周日交,用到了神经网络的反向传播,其中有一个非常难懂的跨层梯度计算,但下周一才讲。这个故事告诉我们AI的学生不自学只能死翘翘。(后来延了一周ddl)
想给这课评8.6分,因为我自己已经有1.4了
11.30 跪了孩子们,被Lab2肘击的时候被Lab1出的分后入了。
这课的同学赤石助教赤石,就连老师也有点赤石,感觉就是大家互相喂答辩吃()
不过老师讲课讲得很好,助教也挺负责的。只能说内卷过于严重了。
12.2 孩子们,不要怪罪助教。
实验及作业评价
LAB 1.线性回归和分类器。先验难度D(Lab1|t≤10.13)=9.5/10,后验难度D(Lab1|10.30≤t≤11.30)=6/10
LAB 2.PCA降维和GMM聚类。先验难度D(Lab2|t≤11.30)=9/10
HW 1.难度D=0.6,计算量大,证明度P=5,肉编器指数RBQ=4,自学需求度SL=2
HW 2.难度D=0.8,计算量超大,证明度P=5,肉编器指数RBQ=6,自学需求度SL=5
指标说明:
先验难度表示在特定时间段内的主观难度,随时间条件会出现较大变化
证明度表示作业中证明题和代数推导题的量
肉编器指数指需要人力模拟机器学习中具体步骤的题量
自学需求度用于衡量作业中没学过的知识量,与自学所需时长成正比
我们在高中时期就学过核反应的相关知识。在自然条件下,重核(如铀235等)会自发地衰变,即放出氦核(α粒子)或电子(β粒子)并释放能量(一般表现为γ射线)。这种高自发性且一般不可逆的现象表明重核本身具有相当高的能量,微量的放射性材料便可以穿透书本使得后面的胶片感光。然而这种能量的释放对于人类的需求来说还是过于温和,或者说过于少。我们渴望更高效的能量利用方式。
当核燃料本身的质量达到临界值或密度陡增时,便会发生链式反应。具体而言,重核裂解时往往变为原子量更小的核素并释放出一定量的中子,这些中子再轰击其他重核时便会使得能量的释放效率大幅提升。
为了更充分地引导这种能量,人类设计了两种截然不同的系统:反应堆与裂变武器。
反应堆系统代表着对高能物质的受控引导。其核心机制在于引入慢化剂(如轻水、重水或石墨)和控制棒(镉、硼等强中子吸收体)。慢化剂通过碰撞将裂变产生的高速中子减速为热中子,大幅提高其引发下一代裂变的概率,从而建立稳定、持续的受控链式反应。控制棒则如同精密的调节阀,通过插入深度实时吸收过剩中子,将反应速率严格维持在临界点以下某一设定值。在这种设计中,重核的能量以可预测的速率释放,转化为持续的热能驱动涡轮,其产出虽然强大,却是平稳、可度量且服务于长期稳定供能的。
当受控系统越过临界点,其释放模式将发生本质性改变。在失控的超临界状态下,先前用于维持平稳输出的链式反应将演变为自激式的中子风暴——每一代裂变产生的中子不再受控地激发更多裂变,形成指数增长的超临界脉冲。此时,约束容器内迅速积累的巨量能量不再以蒸汽形式有序导出,而是在微秒量级内转化为破坏性的机械能与热能。系统将经历从“能量转化装置”到“自毁装置”的相变:所有精心设计的结构材料在瞬间汽化,束缚能量的平衡被彻底撕裂,最终以不可控的能量喷发形式完成对自身结构及其存在意义的彻底否定。这种释放并非创造的升华,而是系统所有潜在价值在绝对无序中的一次性湮灭,其产物仅剩辐射尘与结构废墟——即系统自身存在过的唯一反证。
裂变武器系统则遵循截然相反的逻辑。其设计目标是使超临界状态在极短时间内形成并最大化能量释放。这通过两种主要方式实现:一是枪式结构,将两块低于临界的浓缩物质高速撞击结合,瞬间超越临界质量;二是更高效的内爆式结构,使用精密布置的常规炸药透镜,向心压缩处于次临界的球形核材料,使其密度骤增,达到超临界状态。两种结构均刻意移除任何形式的慢化与实时控制,并通常添加中子反射层以减少中子逃逸,从而令链式反应以指数级疯狂增长,在百万分之一秒内使绝大部分重核发生裂变。其能量释放不再是涓涓细流或稳定输出,而是一场将所有潜力在瞬间彻底引爆的、毁灭性的能量风暴。
当反应堆变成原子弹,重核分崩离析,人类也将遭受灭顶之灾。
实验出分扣分扣在哪也不说,想干啥?
LAB2的实验框架,大大小小的全是问题,初始代码每次数据处理完都读缓存去了,效果没变我还以为是我的问题呢。服了。
LAB1出分之后大家戾气好重啊(叠甲:没有说什么不好的意思,只是说这门课没有期末考试所以大家会认真做平时的实验也是合理的)
感觉选课的同学和助教们都很无力,助教舌战群儒.jpg(bushi)
打10分给这门课拉拉分,yysy两位老师讲得都很好,助教工作也很负责很辛苦,就是大家大多数都是第一次上这种不考期末的专业课显得有点过于纠结评分了()然后私以为看到自己的LAB没有得到预期的分数应该或私聊或在群里问助教评分规则而不是跑到pksq发一顿牢骚然后打低分(
LAB1 出分,并不是看到扣分就想骂,但总得大家一个交代吧,给大家的挑灯夜战一个合理的解释。扣分扣在哪,为什么扣,给分点是什么,评分标准是怎样的?成绩在 zkd 的重要性不言而喻,助教自己也知道国奖有多难拿吧。数据集就那么点大,用的模型还是最原始的线性回归和逻辑回归,能奢求跑成什么样的结果,怎么不拿这俩模型做出个 GPT 呢。
代码报告表现的成绩占比是明确公布的,助教给分标准是统一的,LAB1优秀率给满了,我也真不理解有什么好喷的…努力之后仍然比别人差一点在科大是件正常的事,不要太自信地认为别人比你得分高但真实实力不如你…
不过LAB2用db衡量performance确实是巨大槽点。
希望最后两位老师给分超好。
作为ai理论数批,可以看出在hw题目设置这块助教们已经非常尽力了,这课内容比较宽泛,在hw角度导致大家体验并不是那么的好。如果有想要加深理论部分的同学可以参考:
梯度下降收敛性:运筹学(陈士祥)数院开课
线性回归模型、逻辑回归模型、主成分分析、聚类分析:回归分析、多元统计分析(杨亚宁)管理学院统计系
先验(贝叶斯)、EM算法:贝叶斯分析(张伟平)管理学院统计系
模型误差:Roman Vershynin's high dimensional probability
占坑,开学后再详细评论