大数据算法(丁虎) 2025春 2021春 2020春  课程号:01118601
2025春 2021春 2020春  课程号:01118601
8.3(7人评价)
8.3(7人评价)
  • 课程难度:中等
  • 作业多少:很少
  • 给分好坏:一般
  • 收获大小:一般
选课类别:计划内与自由选修 教学类型:理论课
课程类别:本科计划内课程 开课单位:计算机科学与技术系
课程层次:专业选修   学分:3.0
课程主页:暂无(如果你知道,劳烦告诉我们!)
简介 最后更新:2025年1月17日 08:48

算法与理论是计算机科学的核心领域之一。随着大数据时代的来临,传统的算法理论已经不能很好地解决人工智能、物联网、工业制造等领域所遇到的实际问题。本门课程主要介绍基于大数据的新型算法技术,如随机采样、数据降维、数据压缩、分布式计算、流数据计算、聚类、分类、随机优化等,以及相关的理论和数学技巧,如概率计算方法、vc维、通信复杂度、机器学习学习理论等。作为一门理论方向课程,帮助学生掌握解决大数据问题所需的理论和算法工具,为相关领域的工程实践打好基础。

AI 总结 AI 总结为根据点评内容自动生成,仅供参考

教学水平

丁虎老师有海外教学经验,授课风格偏向小班研讨,通过引导学生思考与推导代替机械灌输,课堂内容启发性高。上课内容较多偏理论证明,需要扎实的数学基础。

课程内容

课程内容较难,部分内容创新性强,涉及复杂的大数据算法和数学推导。课程没有指定教材,依赖老师板书和助教整理的笔记,且笔记跟不上进度,建议务必认真做笔记。虽然部分同学认为内容有趣,但整体难度普遍较高。

作业

作业总共三次,难度较高,大多题目需要良好的数学基础及算法理解。部分作业题甚至难以下手。总体而言,作业更注重启发性而非巩固知识。

考试

考试方面,期中期末两次考试均有大量人不及格,期中考内容较难,有60%为课程内容,40%为算法理解与运用;期末考试相对简单,全是课程内容。出分较慢,有时期中成绩甚至到期末前几天才出。

给分

给分总体上相对慷慨,尽管考试难度较大,最后会调分,优秀率较高。但由于有大量人可能不及格,选课需慎重。课堂体验整体分化较大,务必要高度重视复习,否则成绩可能不理想。

总评

尽管某些评语对教学速度和出分时间有批评,整体上,此课程适合对大数据算法有浓厚兴趣并具备扎实数学基础的同学。课堂体验普遍评价较好,但若重视成绩需慎重考虑是否选课。

排序 学期

评分 评分 7条点评

Traceback 2021春
  • 课程难度:困难
  • 作业多少:很少
  • 给分好坏:一般
  • 收获大小:很多
  • 难度:困难
  • 作业:很少
  • 给分:一般
  • 收获:很多

本课程难度较大,但收获也确实很多,请慎选。

丁虎老师在美国做过几年短期助理教授,目前是中科大的特聘教授。

授课风格比较偏向于小班研讨。上课的时候会带着大家思考与推导,而不是机械性的灌输,跟着老师的思路走下来能学到不少。

老师上课是没有教材的,但是有助教整理出来的笔记,老师在课后也会发上课的板书。不过还是建议听课的时候做笔记,不然复习的时候会很痛苦。

去年的整理笔记:http://staff.ustc.edu.cn/~huding/data%20course.html

作业一共有三次,难度比较高,大部分题目都要求良好的数学基础以及对算法思想的理解。

期中考试的难度较大,有60分是上课或者习题课上直接讲过的内容,40分是算法的理解和运用;

期末难度降低了一些(可能是因为期中成绩比较惨烈),全部都是上课讲过的内容。

期中期末成绩分布:

(不是我截漏了,是期末最高分只有90,可能是因为最后一题的fast-JL大家都没背)

黑点主要集中在两方面:

  1. 如你所见,我上面发的整理笔记是去年的,今年的上课内容和去年有所不同,而助教只整理了一部分笔记。老师的板书也十分意识流。加上没有教材,因此自学是行不通的,上课的时候一定要做笔记
  2. 改卷、出分太慢。期中考完快一个月才出分,期末三星期左右出分,又过了两星期才出总评。

主观上,我个人的上课体验是很不错的,可以说是我大学期间一字一句认真听完的唯一一门课。

给分上还算不错,期中期末改卷都放了大洪水,最后总评也调了分。本人期中期末都只有八十几分,最后调到了九十几。

2021年8月4日 11:34 (最后修改于 2022年1月14日 03:10 3 0 复制链接
justwe 2021春
  • 课程难度:简单
  • 作业多少:很少
  • 给分好坏:超好
  • 收获大小:很多
  • 难度:简单
  • 作业:很少
  • 给分:超好
  • 收获:很多

这课真的很好,一点都不难,老师讲得好,本着好课一起分享的原则,我建议大家都来选这个课

2021年6月29日 13:00 3 3 复制链接
lolol真的假的呀_(:з」∠)_ 2021年6月30日 02:34
RabbitWhite说的太对了!期末考就考了证明半平面的VC DIMENSION,感知机算法及其证明,流数据最高频值算法及其证明,Count-min-sketch 算法及其证明,coreset的传递性质,Fast-JL 及其时间复杂度。可简单了(((( 2021年6月30日 13:46
也西湖摸鱼哈人,幸好当初这课和数据隐私冲了,我直接没选( 2021年8月4日 08:03
立即登录,说说你的看法
w 2020春
  • 课程难度:简单
  • 作业多少:很少
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:简单
  • 作业:很少
  • 给分:一般
  • 收获:一般

.这个笔太不好用了.

2020年4月18日 15:58 3 1 复制链接
Ens我对这个笔真是无语了!!! 2020年4月30日 03:44
立即登录,说说你的看法
H_101 2020春
  • 课程难度:中等
  • 作业多少:很少
  • 给分好坏:一般
  • 收获大小:很多
  • 难度:中等
  • 作业:很少
  • 给分:一般
  • 收获:很多

大三所有课里最值得上课听的,可能有没有对应教材的原因,但是老师讲得也很好。讲的东西启发性蛮大的。课不怎么文科,和webInfo这种有点差别。考试内容基本都在老师笔记里有,复习基本把笔记都过一遍 不用看什么题。 比较烦的点:作业奇难无比,不是巩固作用的,以启发为主,虽然最后一般也没被启发;发课堂笔记和出分都很能拖。

2021年8月4日 12:54 2 0 复制链接
zxr001119 2020春
  • 课程难度:困难
  • 作业多少:很少
  • 给分好坏:一般
  • 收获大小:没有
  • 难度:困难
  • 作业:很少
  • 给分:一般
  • 收获:没有

丁虎老师是从密歇根州立大学回来的老师,这门课也是2020年疫情期间第一次开设。

(注:17级计算机专业的专业选修课有调整,增加了大数据算法这门课以及张兰老师的数据隐私课程。即使这样,cs的专业选修课依然乏善可陈)

丁老师上课会用板书讲各种大数据算法,偏理论证明,牵扯到很多数学上的内容。这个时候数理基础不扎实的问题就暴露无遗,而且上课不认真的话,课下看板书也看不懂。课下的话助教会总结丁老师上课讲的内容,整理成notes的形式发给大家以供复习参考。这点体验是相当好的。

这门课(2020春)没有作业,只有最后的一个小组答辩(可以单人答辩,也可以双人答辩):从丁老师给的5个主题中挑1个进行深入研究,然后实现算法并改进,最后总结成标准的论文格式。从这一点上看,其实和课程整体内容的关联性并不强。

 

2020年9月17日 07:23 1 0 复制链接
sF 2021春
  • 课程难度:困难
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:很多
  • 难度:困难
  • 作业:中等
  • 给分:一般
  • 收获:很多

内容挺难的,不过丁老师是完全板书,讲得很认真,听课的话跟上还是没问题,而且挺有意思的。但是作业和考试、给分太一言难尽了,只有三次作业,每次几道题,难度不小,有一部分甚至是无从下手的那种,甚至还有老师随口一说的那种题,什么求矩形的VC-Dim(答案是7,反正我是做不出来……);考试成绩分布有同学贴上去了,期中考试的成绩直到期末前几天才出,最后肯定是调分了,但具体怎么折腾的我们都不大清楚,但是如果新同学估摸着自己考试大概在50%左右又重视成绩就还是别上了……

总结的话就是听课体验很好,丁老师讲得也很清楚,内容也很有意思,但是如果选课了就一定要好好学多复习,不然分数会很难看

2021年9月29日 12:58 0 0 复制链接
从点到点 2021春
  • 课程难度:困难
  • 作业多少:中等
  • 给分好坏:一般
  • 收获大小:一般
  • 难度:困难
  • 作业:中等
  • 给分:一般
  • 收获:一般

老师讲义和改卷速度奇慢,上课体验极差。个人感觉老师对教学不上心,也没有正规教材,自学都学得很痛苦。也不知道是助教鸽子还是老师鸽子。

开学时候本来有快100个人,期末只剩下30个人了。

有期中期末,本来各占40%,但是因为两次考试都有很多人不及格,也不知道最后怎么瞎调的。优秀率应该是给满了。但反正也就30个人…

2021年8月4日 07:24 0 0 复制链接

丁虎

教师主页: 戳这里

其他老师的「大数据算法」课

彭攀 9.3 (17) 2025春 2023春...
未知 3.0 (1) 2022春
丁虎, 宋骐 3.8 (16) 2024春

丁虎老师的其他课

离散数学 9.3 (15) 2022秋 2021秋...
大数据算法 3.8 (16) 2024春
离散数学 2024秋
计算机数学 2023秋 2022春