选课类别:计划内与自由选修 | 教学类型:理论课 |
课程类别:本科计划内课程 | 开课单位:统计与金融系 |
课程层次:专业选修 | 学分:2.0 |
《属性数据分析》主要涵盖了列联表、广义线性模型、Logistic模型、多类别Logistic模型、对数线性模型、配对数据模型、关联及聚簇响应的建模和广义线性混合模型。这门课基于《Categorical Data Analysis》教材,但内容有所删减和调整,PPT内容详细,适合复习。
张洪老师教学认真,PPT详尽,同时注重推导与分析的过程,但其平淡的声线和缺乏语调变化使得课堂有时难以集中注意。部分学生提到张洪老师鼓励提问,但具体加分细则尚不明晰。总体上,学生对老师的讲解和教学态度持正面评价,但建议学生主动提问以加深理解。
作业量较大,包括理论推导和编程操作,反映出作为一门两学分选修课的负担较重。建议提前掌握推导冗余参数检验统计量的方法。期末考试主要围绕数理统计基础知识展开,但题目灵活且难度不小,需要合理猜测出题者意图,考试内容对细节把握非常严格。
考试被多个学生认为难度较大,涉及复杂推导及概率题。题目容易造成对出题者意图的揣测,有时答案要求较苛刻,如部分题目定性与定量条件未明确,导致解答困难。总评计算上,可能包括期末考试和一定比例的平时作业成绩。部分学生表示对评分有所不满,认为调整分制度并不明晰,优秀率不高。
尽管课程的难度和负担较大,多数学生认为内容实用,能够学到新知识和统计方法,特别是推导和建模技巧。学生普遍认为结合所学知识可提升对大量统计概念的理解和应用,但认为理论背景需更深入学习。
这门课适合对统计有浓厚兴趣并且愿意投入时间和精力的学生,特别是需要修满学分的高年级学生。但是需要注意的是,准备充足,中途对应高难度测试有心理准备。对于追求较高 GPA 的同学,需慎重考量。
受不了了今天我必须狠狠的过来锐评一手。
先用我的心路历程来吸引读者阅读兴趣。
这课出总评很快,几乎是考完没几周就出总评了。我个人感觉老师并没有仔细检查过成绩,急匆匆就出分了。为何这么说呢?因为刚开始第一次出总评的时候,刚和女友约会玩,美美走在回学校的路上,结果一看成绩,没评教,看不了,一看自己绩点,至少掉了0.04,掐指一算,完蛋,搞了个六十一。一时间心如刀绞,通体发凉,我之前3.0即以下的课屈指可数的,来了个61,我i奶奶个腿。然后我晚上就给老师发邮件了,问为啥这么低,因为感觉自己考试除了一个证明McNymar等于CMH的大题(15分)胡乱写的以外,其他都蛮有把握的。老师回邮件倒是快,告诉我我期末考考了61,我心如死灰,好吧,原来真没考好。不过庆幸的是我的作业分漏登了,最后加上去好像也是3.0。
有趣的是好像第一次出分的时候大家都很低,估摸着大家都给老师上了点压力,然后老师调了调分。
在开喷之前,说一下我们推测的老师的调分公式。
大概是 总评=考试卷面分+0.2*平时分(我猜的)。平时分大概包括作业分,上课提问,小测什么的。我平时分只有80分,这个我认,因为我学期中拿两周复习托福没写作业,都是在期末补交上去的。平时分只有八十分我是心服口服的。
这个总评公式是因为刚开始老师没加我作业分,我成绩和卷面一样,然后后面调整的分数,再和我舍友一对,大概就这样。
但是你这期末考试是有点抽象了。怎么说呢,今天去查卷,和助教老师聊了聊,助教人特好,挺随和也挺阳光的。助教也认为,这次考试的很多题目都没有讲清楚,以至于同学们思维发散来写自己的想法(我考试的时候真的以为是思维发散题,言之有理即可),但是很多题目是老师改的,老师就觉得不行,得按他的想法来。
我可以举一堆例子。比如“….为指数分布族的一个条件是:”。我当时考试的时候认为,包括现在也认为,这是写一个可以导出指数分布族的条件就好了,比如我们寝室的都写了k=1,但是老师觉得不行,只有写k固定才得分
比如“把AR写成关于RR的函数:AR=f(RR),那么pi未知时候能不能利用这个关系式估计RR?”我粗鄙之见是,pi未知但是通过某种神奇的办法推测了AR,然后通过这个关系式估计RR,我算了算觉得如果是这样的话那好像可以,但是老师觉得不行,嘿嘿,您猜怎么着?答案是"AR不可以估计RR可以估计"。不过这题我的主观性确实有点强了,不过这题就四分,我跳过不细讲。
如果上面这个例子有点牵强,那我要开始喷最后一题了。最后一题就是一道求检验的LR,Wald,Score统计量的题目。听着很简单,求求似然函数,导一导算一算,轻轻松松25分入手。但是老师不喜欢,嘿嘿,检验问题是H0:f = 0, f是一个参数,老师在题目条件下搞了一个p,但不告诉你p是定值还是参数,嘿嘿,就是玩儿。考完大家分享考试感悟,都为认为p是定值而感到庆幸,但是觉得这个情况下太难算了,算的人昏昏。结果您猜怎么着,觉得p是定值的,白白您嘞,15分消失不见。
还记得出总评那天晚上,老师也发了试卷答案,有同学在群里真的给老师心平气和的提建议,就是和老师说建议老师以后出卷子,把东西都写清楚,比如最后一题说明了p是不是定值对我们真的非常重要,二者难度有若云泥。老师倒是也是义正言辞的,“如果认为p是已知的话,为什么不能认为f是已知的呢?”“无论什么场合下,有疑问都要提出来”。其实后者这个疑问提出我是赞同的,但是前者这个就有点傻逼了,如果f是已知的话我检验个毛啊大哥。
Anyway上面是大概喷了以下这考试。后面和助教聊了聊,助教告诉我其实大多数同学成绩分布在30-60分间,考在70以上的同学就是凤毛麟角了(他的原话是这试卷考70很牛很牛很牛了)。我其实错的题目也不是很多,15分没写出来的证明,15分没有成功揣摩对老师的意思,剩下9分基本上都是一些小细节上老师觉得我没有戳中他的心而扣的。
当然扣分归扣分,要是老师最后会调分,控制优秀率在30-40%,那我当然不会有怨言。但我觉得并不。
那在这种情况下,我的想法是:如果因为最后一题出卷人的缘故,导致很多知道怎么算,步骤都是对的同学,因为没有猜对你的意思没有戳中你的心巴,而扣了15分,是不是不那么合理呢?您美其名曰的区分度,是为了区分我们猜您想法的能力吗?
好笑的是,这老师上课的时候说优秀率不设限,原来是那40%上限达不到的意思,怪我没揣摩对您的想法。
选这课的原因是试听了金融建模之后觉得,与其选一个学自己可能未来都用不到的excel,不如学一个和统计知识相关的东西。有收获吗?我觉得是有的,我其实觉得自己学到的蛮多的,对很多东西都有了更深层次的理解。(不过听到金融建模给分更好之后我也还是有点后悔的)
当然,大三了,成绩波动也不会很大,也不会说通过一门课我就4+了飞黄腾达了,这当然不现实。我个人的出发点也不是gpa至上的,我更希望我可以学到东西,并且我所学有所得,这个“得”除了未来看不见摸不着的东西当然也包括gpa。我扪心自问,我有认真在学这门课,我也觉得自己掌握的比较好,我花了很多时间在这上面,我其他课成绩也不差,我也不相信自己单单属性数据分析没天赋,我也希望能通过gpa认可我的学习成果,但我并不想为老师您出卷语义不明的失误买单,而且这单一买就是二十多分,我是真不爽。
总之,这是个主观性很强的评价,各位看官爱看便看,如果看官老爷们有不同意见,您也别争,反正我被这老师气死了。
因为这是第一年开给本科生的属性数据分析的课程,所以基本没有什么人评价,我就来稍微介绍下这门课的基本情况吧
课程大概是分为以下内容:
列联表
广义线性模型
Logistic模型
多类别Logistic模型
列联表的对数线性模型
配对数据的模型
关联、聚簇响应的建模
广义线性混合模型
可以看出还是有不少新内容的,这门课也基本算是我这学期在管院学的课程中学到新的常用统计名词最多的课了吧(但是仔细一想好像后半学期一直在上各种花式的Logistic模型,好像也没有多少新名词)
张洪老师的讲课也优缺点十分鲜明:
优点
老师的PPT写的非常详细,上课也基本就按PPT上,对于复习非常友好;
内容也基本没什么难度,都是上过初等概率论就能计算的,对于这学期有很多事情无心上课的同学比较舒适;
考试题基本中规中矩,没什么难度(由于没有往届题目大家在答疑课上疯狂问助教玄学问题把助教也弄的很崩溃hhh好在最后都没考)
缺点
老师上课声线非常之平淡,连上三节课真的让人困意朦胧;
接上一条,因为老师的声音毫无起伏你没办法知道老师突然从分析例子转移到了一个十分重要的概念或者定理上,经常一走神就跟不上老师(真的,老师讲什么都一个调调,完全不知道那块是重点)
接上一条,老师后半学期还有十分迷惑的习惯:课堂小测。想象一下你在走神跟不上老师,然后决定放弃这堂课回去自己看,结果老师突然随堂小测检验一下这节课你学得怎么样是怎样的绝望场景(不过老师好像喜欢作业和小测都通过BB系统提交,大概是网上没有纸质好看吧助教基本都放弃仔细看,直接给个满分就完事了,所以小测最后也没有怎么影响总评)
最后说一下张老师本人的特点吧:十分严谨细致
具体指期末开卷考试允许带课本,于是老师在群里跟大家说只能带正版课本,课本尺寸大小要达到标准,也不允许页面边距空白过大,不许用修正带涂掉课本上的字或者携带纸张等等迷惑的规定也不知道有啥用
其次反映在老师每节课都签到,某节课还突然在大家猝不及防地时候拍张照片声称回去后会核对照片上的人数和签到人数是否一致(可惜老师也不认识同学,谁没来也不知道2333)
我本人之前旁听过张老师开的高等数理统计,那门课老师甚至规定每个同学每节课必需记笔记,下课会要求上传笔记检查,好在这门课没有干这种事情,不然我可能第一节课就退了
以及这门课虽然只有2学分,但经常有上机作业,任务量我个人感觉甚至跟3..5学分的多元差不多
可能也是因为作业多吧这门课老师说总评按平时:期末=4:6来算
结果老师直接期末出了60分满分的卷子,摆明自己不调分的态度(想象下自己期末试卷扣多少总评就会扣多少的刺激场景)
但是这门课还是值得一上的,其中介绍的很多内容还是挺有用的
省流:对自己实力自信且对属性数据分析感兴趣的同学可选,必须在大三下修满学分的同学可选。
对老师和课程内容没什么评价的,前人之述备矣。但老师每年应该会调整讲义的内容,不是完全相同的,基本上就是Categorical Data Analysis那本书的大部分章节。
作业,实际上讲作为一门两学分的选修课是有点多的,不仅有理论部分,还有上机实践,比同学期开的几门必修课加起来还多,不过考虑到这门的内容含量比较多,知识点比较细碎,也能理解,建议来年变成一门3学分的课。
最后就是考试,前面的同学都简述了本次考试的大部分内容。但我想说的是,从他们的语气也能知道,这考试根本就不是难以动笔,而是变成了一门揣摩出题者意图的考试,并且这样的题不止一道,不仅在填空题,后面的每道大题都有这样的一问,并且不是言之有理即可,而是满足答案才行,我无意置喙这样的出题方式,但这种考试体验除了成功猜对的同学,谁能说自己心里好受呢?
给分,结合往年的经验,大致就是卷面分加上部分的作业分。
我多一嘴,关于最后一问冗余参数的假设检验,我相信几乎所有同学都不是第一时间认为p是已知量,而是算完极大似然估计,发现是检验另一个参数f,从而认为p应该是已知的,然后划掉了自己的答案。结合这样的表意不清,那我为什么不能认为p是已知的呢,因为题干也不标注已知未知,为什么只有未知算对(气抖冷),于是还是回到需要揣测出题的思路上。
好吧,昨天刚刚做完大作业,就发现zgy大佬已经把大部分内容都说完了……所以我只做一点补充吧。
这门课感觉就是学了一堆模型,举了一堆例子,然后知道了很多奇奇怪怪的R函数。课本应该是从英文版翻译过来的,但是感觉删掉了好多公式和推导,留下来的部分就是一堆文字说(口)明(糊),以至于从课本几乎完全看不出这些模型的理论背景,一个学期下来几乎只会用软件拟合模型,然后解释。但其实我觉得这门课程的理论是非常重要非常值得学的,而且期末也会考(我曾经不止一次跟老师说一定要重点讲一下各种模型的似然函数和条件似然函数,结果这些东西出现在了期末考试题里……
总的来说,广义线性模型的核心思想就是用线性模型表示概率函数的参数,然后用优化算法求系数的极大似然估计。比如对于正态分布,我们可以把均值用线性函数替换:μ=α+βx,则似然函数的自变量变成α和β,求α和β的极大似然估计就转化为一个二元函数的优化问题,常用的求解方法是Newton-Raphson算法和Fisher Scoring算法,具体细节凸优化应该会讲,就不赘述。所以这门课的关注点应该放在如何正确写出(条件)似然函数上面。指数族的似然函数在数理统计里面都有讲过,但实际问题中经常会碰到冗余参数过多的情形。为了使似然函数只含有感兴趣的参数,可以对冗余参数的充分统计量取条件,这个条件似然函数就与冗余参数无关了(期末考试考了这个)。我个人感觉如果能把条件似然学明白,那这门课应该就没有什么困难了。
最后推荐一本参考书——《Categorical Data Analysis》英文第三版,很多老师上课略过的或者教材上没写的理论推导都能在这上面找到,如果对模型不理解的可以翻一下这本书。
占坑首评,由于考试还没结束,忙完再回来改。由于这学期第一次给本科生开这门课,因此个人觉得还是有必要给后人排一下雷(高情商:18级永远都是第一个吃螃蟹的人。 低情商:我们又被当小白鼠。)
比较幸运的是老师并没有在考试和给分上为难我们,考试没有什么偏怪难的题,也给满了40%优秀率,算是仁至义尽了。比例是作业40+期末60(老师说由于期末占比60%所以就只出60分的卷子,有点迷,然后卷面扣的分就直接扣到总评里面),作业认真写应该都给满,即使迟交或者有些题不会也没扣很多,所以作业分拿满并不难。
虽然一周只有一节课,但内容很多,要拎好多以前的知识,考试和作业都要耗不少精力。况且考试似乎比往年难了一些,一上来有点手足无措了
老师的材料还挺不错的,条理比较清楚,我看其他评课也写得比较完整了
总而言之十分吃力,学会那些东西其实是很好的,但是从给分角度看确实无法匹配平时的付出。有这个时间不如选其他课
刚刚考完期末,时间紧要去干别的,故意识流评课:
作业难度<<考试难度。考试就像是加难版的数理统计:
也没有往年一样的案例分析题了,总之期末考试的体验不是很好。
考前说可以随身带一张A4纸,我建议其实什么都不用带,带了等于没带,你把他的ppt全手推一遍就记在脑子里了,多准备一张小抄的时间不如去想一下辛普森悖论是怎么出来的。
一边考一边心里嘀咕:张洪老师出卷子真的有质量,但是我真的菜,不知道其他人怎么样,只能求老师捞捞了。
学列联表的时候最重要的是要搞清楚到底什么是随机的什么是人为设计的有偏抽样,感觉张洪老师应该先从回溯性研究和前瞻性研究和横断面研究的区别开始讲起,再来讲列联表,因为不同的抽样方式得到的列联表会有不一样的概率结构,后续写似然做统计推断的方式也完全不一样。
学logistic模型的时候搞清楚各个参数怎么interpret就行了,类似回归分析那一套来说。
这门课之所以说是加难版的数理统计,是因为数理统计里要推断的参数就是这个分布的所有参数,但是这门课要推断的参数只是似然里的一部分参数,冗余参数的处理方法往往很烦人。
Wald, Score, LRT怎么造的,极限分布怎么证明的也要熟悉(虽然考试应该不考)。
这课讲的是真的好,但你如果不提问单看ppt会很难学明白这门课的思想,张洪老师说提问有加分,但其实这门课你学的过程中真的不得不会需要提问。。
额嗯,总之考期末给我一种,被张洪老师的清风点穴手的活活点死的感觉。怎么大三下了,第一门考完后面就还得打逆风局
———————————————————————————————————————————————————————
总评出来了,考得挺好的,卷面应该是班里最高的,应该是助教改卷放洪水了
先说以下这门课的考核方式:期末考试:60%,平时作业:30%,签到和小测:5%,课堂提问:5%
感觉统计人还是有必要来上一下这门课的,毕竟Logistic回归相关知识在以往统计课程中基本没有进行非常细致的研究,我估计大多数人应该也是停留在只是知道模型的形式。
今年课程内容对比以往应该是有所缩减,主要内容为:
(1)属性数据简要介绍与三大统计推断方法
(2)列联表
(3)广义线性模型、
(4)Logistic回归模型
(5)配对数据的模型
老师没有严格按照课本上的内容去讲解,不仅仅局限于统计方法本身,而是更加注重推导与分析的过程,甚至后者所用的时间更多。PPT十分详细,非常适合巩固与复习,一学期下来还是可以学到不少的统计思想(所以完全 没有必要买书,我买的书一学期都没翻,巨亏)。
作为一门两个学分的课,作业是较多的,既有推导又有编程,有几次编程作业所花的时间还是比较多的,一些推导的题目也很有难度。强烈建议大家在前几节课就掌握含冗余参数情况下求三大检验统计量的方法,后面有几次作业基本都会用,但是像得分统计量的情形老师是最后一节课才会讲,之前因为这样一直被卡,花费了不少时间。
不得不说,张洪老师真的是一位好老师,可能是我本科阶段见过的最为认真负责的老师了,对待教学也十分认真,有次去咨询老师一件事,他真的非常热心的给我解答了好久,真的十分感动~~,彻底被张老师圈粉了。
这门课助教中规中矩吧,总体来说比较负责,回答问题也很及时,就是作业的解答很明显就是Copy同学的,而且还有不少的错误,特别是第二次作业,有一题的答案有点口胡。
考试内容较为简单,小题质量不错,比较能反映对概念的理解(我就基本被薄纱了),大题难度小且基本,总体来说,大概是课程难度\(\approx\)作业难度>>考试难度。最后从分布来看确实有点爆炸,基本大家成绩都集中在80-90。
最后说一下关于提问的事,不知道之前这门课有没有,这学期老师要求必须进行提问,具体要求如下:
我刚开始还以为老师是鼓励大家多提问,最后应该不至于扣分吧,这波确实是决策失误,希望之后大家可以引以为戒,我其实有过几次提问,甚至都没找助教记录。今天出总评后挺多人应该被扣了,有人在群里问和助教提问可不可以加分,老师说可以,我应该是找助教问了非常多次问题,当时还挺开心,感觉不会被扣了,结果询问助教后发现自己问助教那么多次,结果根本一点没加,虽然老师问题的初心是好的,但是为什么不和助教协商好具体的加分措施呢,老师就是想鼓励问题,而且跟助教也算,为什么不事先沟通好,反正现在已经出成绩了,感觉也没啥要纠缠的想法了,反正2学分的课,之后请务必和老师沟通好具体的加分方式。
至于给分,刚开始老师意思好像是会调分,但是大家真的都考得太高了,不用调分优秀率也远超了,从我个人的感觉来看,我应该就是3-4个小题错了,大题基本答得差不多,拿了3.7,估计是没调分,而且没问题的直接扣了总评。
总之,这门课除去一些特殊因素,我认为还是非常不错的,感觉不像之前评论说的和多元内容差不多(我认识有些同学就是被之前评课社区劝退了),非常推荐大家选修。
老规矩,出分之后来评一下课,2学分的课听课的时候感觉东西很多很杂,其实复习的时候发现也就那点东西,主要内容还是列联表和广义线性模型(尤其是logistic模型)。老师上课基本上是根据PPT,然后部分内容会在黑板推导(这部分建议掌握,很可能成为考点)。这门课以应用为主,所以内容我本人感觉不是很系统,哪怕复习完也还是感觉很零散,没有整体上一个好的把握。看的出来老师水平很高,而且对这门课准备也充分,上课期间也会有一些统计思想的渗透,但老师的语调和语速实在让人难以集中,所以认真听课的人可能寥寥无几。一学期下来能学到东西,但是学到的东西也不多。作业量对得起2学分的,一周基本就三个题,有理论题也会有编程题,编程题用的函数基本上都能看老师发的代码自学,每周完成作业还是比较轻松。考试是开卷,基本上和上课没啥关系,考的就是最基本的数理统计,把老师上课写黑板的东西抄到书上弄明白就行。给分目测还行,不像去年一样完全不调分,但是调分力度应该也不大。
这个课程时间安排很微妙,他的考试与出分时间可以控制在毕业审查学分之前,所以大四下还未修满专业学分的可以修读该课程,以满足毕业学分要求。
考试和作业相差很多,期末试卷总分60分,一个大题就占20分,压力还是有点大,最后肯定有调分。这门课本身还是有用的,而且每周一次课,每周3道作业题,也没有耽误太多时间,下一届的同学好像这门课不是必修了,根据自己的情况选择吧,毕竟熟悉一下logit模型也不算啥坏事