| 选课类别:计划内与自由选修 | 教学类型:理论实验课 |
| 课程类别:本科计划内课程 | 开课单位:计算机科学与技术系 |
| 课程层次:专业选修 | 学分:3.5 |
数据是信息与智能学科科研和应用中十分重要的资源,对数据隐私安全的保护应贯穿于数据采集、传输、处理、存储、应用、销毁等各个环节,因此数据隐私的相关理论和技术是信息与智能学科同学知识体系的重要组成部分之一。本课程介绍了数据隐私安全相关的主要理论、方法、伦理和应用技术,包括同态加密、安全多方计算、多类型隐私的定义、数据可用性度量、数据脱敏机制和算法、隐私攻击方法、差分隐私的理论和方法、数据隐私相关的伦理和法律条例、各类型数据的隐私保护技术,以及保护隐私的机器学习等内容。同时课程实验将面向实际应用和真实数据,实现并分析安全多方计算和数据脱敏的相关算法,以及保护隐私的机器学习模型。
课程评价总结
教学与课堂表现 张兰老师的《数据隐私的方法伦理和实践》课程主要依赖PPT讲授,虽然有时会补充板书,但课堂内容较为抽象,部分同学认为上课体验不佳。虽然课程较为专业和认真,但因PPT内容源自参考书和文献截图,排版不佳,显得略枯燥。而且,全英文PPT和抽象的内容让一些学生难以跟上。此外,学生反馈老师有时在课堂互动中故作幽默但效果不佳。
课程内容 课程涵盖范围广泛,包括K-anonymity、l-diversity、t-closeness等传统隐私保护方法,以及差分隐私、密码学基础等。但由于内容复杂,学生需要自学能力较强,助于理解抽象的概念和算法。
作业与实验 作业和实验在课程中期开始布置,数量和难度较大。作业多需查阅外部资料或原论文,尤其是第二次作业要求探讨复杂的概念。实验方面,提供的框架不完善,学生普遍对其不满,需要自行查阅大量资料完成。总体而言,作业和实验安排集中在学期后段,对学生时间管理能力挑战较大。
给分与收获 许多学生认为课程给分慷慨,总评按签到、作业和实验进行计算,无期末考试,作业和实验完成得好的同学可拿高分。一些学生表示老师给分有可能因为宽松标准而较高。本课程因涉及隐私保护的前沿技术,对数据隐私感兴趣的学生能有所收获,但课程安排的批量任务和非标准化的材料,可能使得部分学生无法充分体验课程内容的深层次学习。
结论 尽管课程内容和教学安排存在不完善之处,但从收获和给分来看,还是具有选课价值的,尤其是对数据隐私方向感兴趣的学生。但对那些偏向课堂学习而非自主学习的学生,以及希望在期末前完成学业任务的学生,选择需谨慎。
实验框架写的好抽象啊
2024.12.30
怎么今天还布置实验啊。。。
2025.1.2
怎么今天又来个作业啊😭
2025.2.25
怎么还没出分
2025.2.26
出分了,给分还行,适合摆烂
今年应该是张兰老师第一次开这门课,这里先上一个课程大纲(图源张兰老师ppt),供大家了解这门课大概包括哪些内容:

首先是课程难度,个人认为有以下几点:
1. 有一定难度:
2. 没有想象中困难:
其次是作业和实验:

再者是给分:
总的来说,对于数据隐私方向感兴趣的同学,非常建议选(其实也没有别的数据隐私的本科课了,算是弥补了一个方向的空缺),就算不是特别感兴趣,作为一门专业方向课也是挺好的选择,确实能学到不少东西,张兰老师上课也是比较认真负责的,一些概念会讲的比较清楚。作为本课的第一个评论,给10分!
目前看来助教似乎不打算公布作业答案和评分?实验框架又挺抽象。想好好学这课得自己去找资料学,PPT一言难尽。总之这课感觉更像一门科普课?而不是一门专业课。
出分了,作业实验都有公布分数,似乎是按照PPT的比例给分,给分是真的不错。没有考试只有作业和实验,感觉还是可以选的。
2.14 出分
这个任务量和给分我只能说远超预期(喜)
学期中点评
本学期选的课,学期中开始写作业的时候略感折磨,于是点评一下
折磨感主要来自ppt,ppt有很多内容(甚至是章节的主要内容)是来自论文,一些公式是来自论文的直接截图,并且完全没有做出前置定义……这就给阅读带来了相当的障碍。
所以如果你跟我一样不怎么听课的话,建议看ppt之前或者看不懂的时候先看看每一个知识点前列出的论文,甚至直接去读论文,里面会有更完整的逻辑链和更严谨的演绎,这也能省去无头苍蝇搜索的时间……评课社区已经有前辈整理好了
悲: 差分隐私的ppt没有给参考文献,而且公式依然是没有前置定义说给就给……数学部分很多来自 The Algorithmic Foundation of Differential Privacy
结课点评
刚开始布置的作业是有一些难度的,最起码需要查阅一定的文献;不过后面的作业就轻松一些。实验工作量不大,不过实验二的任务要求有点过于宽泛了。
作业允许迟交,迟到两个小时内不扣分,迟交一周扣10%,最多扣20%,最多推迟到最后一次作业。
利益相关: 94分,作业迟交一次,实验迟交两次(极限卡ddl;一次是在学期最终ddl之后三个小时提交,看来助教大度地放过了我),实验课只去过一次(至今不知道有没有签到)
又来晚了(。•﹃•。)感觉前面的同学已经介绍的很全面了,在此就简单补充几点吧:
首先,这门课是在2024秋进行的全面实验“改进”(雾),确实有不少不完善的地方,比如ppt介绍、实验框架、实验报告内容等等,不少同学进行了相关吐槽,就不再进一步介绍了,不过按理说后续还会进一步的修改,应该不用太担心(作业是每年都会变的,不过会有相似之处)
此外,这门课是没有期末考试的(那么,代价是什么),但是它会在后半学期疯狂布置实验(前半学期摸鱼),搭配算法基础、计网、编译原理实验一起食用致郁效果更佳 ´ᯅ`,大家最好有一定的心理预期
课堂方面,张兰老师上课讲的还是蛮清晰的,比较容易听懂。但是全英文ppt确实不太友好,一跟不上追进度都费劲了(英语太差的后果QAQ)
最后,这门课的分数真的冒奶(大爱老师),成功刷新了我的成绩上限(不过孩子还是没能拿到心心念念的满分),不过想拿高分一定一定要保证作业全对(错两三题估计就再见了),实验做完后可以加一些个性化的小优化、提升之类的,当然报告也要认真完成
教室人好多,做不下了:|
2025.3.7
空闲点评一下:
大四上学期缺学分选的,签到分估计扣完了,几个室友也都选了,平时作业实验互相借鉴()
实验正常完成,作业尽量写,最后给分82.
这是学习过程遇到不错的学习资源,感觉比PPT清楚多了:
动手学差分隐私
总之,凑个学分问题不大,拿高分可能需要自身能力较强或者有个大佬抱大腿
数据隐私没有期末考试,根据作业,实验和到课率给分。24秋学期的课程经过改革后实验很多,其中几个实验也很难,万幸的是最后给分不错。不过这是因为助教改作业实验太仁慈了,下一届给分可能就没这么好了。
上课时间大家都喜欢摸鱼(),课后认真完成实验和作业即可。
2.26(开学后第一周周三) 出分了。签到全到,bb总分457/604,喜提3.3
12.30 出 lab5,1.2 结课后出 hw3。今年实验和理论作业都比去年多。有点抽象了,还好我是大四人。
老师很漂亮,大加分(bushi)
授课内容几乎全部来自于论文,几乎没有textbook会涵盖这些内容,某些作业题来自论文里的conclusion,证明则留作习题(恼)。ppt全英,让鼠鼠知道咱英语水平确实烂,ppt内容有点精简,example会比较少,做作业的时候啃ppt得啃很久,全靠听课估计没啥用,内容量忒大了
这课和作业是真的又多又难啊,鼠鼠hw1做吐了
省流:课很难,能学明白估计收获不小,不过建议好好掂量掂量
出分了,来评个课~
利益相关:目测今年的总评是严格按照开学给出的公式计算的:签到10%+作业50%+实验40%,其中签到是随机的,一学期3-4次的样子;作业一共3次,实验两次。在妮可卷王丛生的环境下,没有期末考试没有大作业的课程一般给分都很难令大多数人满意,所以说这课给分还是很好并且客观的~
上课:一共有18次课,内容覆盖范围可以说是非常广泛了,具体内容主要包括K-匿名、l-diversity、t-closeness、(α-β)-privacy等一系列传统的经典隐私保护方法;隐私检测;DP与LDP;密码学基础以及在隐私保护领域的应用;基于机器学习的隐私保护(联邦学习,GAN等)。(其实张老师开始应该是想再讲讲大模型安全的,估计课时实在不够了就没有讲~)总体来说课程的性质比较偏导论(毕竟内容太多了hhh),在传统的经典隐私保护方法、DP与LDP、密码学这几个部分上相对更技术细节一点。相比于机器学习相关的经典书籍一大堆,隐私保护相关的经典书籍可就太少了。张老师一开始会给出4-5本参考书,其实个人认为课程内容是相当全面的,听课过程中如果对哪个问题比较感兴趣再去翻一下书就够了,没啥必要从头到尾看那几本书( 最后,个人认为这门课比较适合有基础密码学(或者初等数论)和机器学习基础,且对数据隐私保护比较感兴趣的同学选,否则可能在听密码学和联邦学习部分会比较蒙圈~
作业:三次作业分别对应课程中的三个重点:传统的经典隐私保护方法、DP与LDP、密码学。个人感觉作业出的还是比较与论文接轨的,尤其是第二次作业(最后一题好像还在原论文基础上做了一点小改动?)。作业比较考验数学(概统、数论等)功底,比较擅长数学推导的童鞋应该写起来舒适一点~
实验:第一次实验是使用DP-SGD的技术实现Logistics Regression+ElGamal 加密算法;第二次实验是VFL下的Logistics Regression。总体来说不算困难,实验报告的给分点也在实验发布的时候一并给出,很好地防止了大家嗯卷实验报告(对于大四摆烂党可能是弊端,因为不得不把要求的点都写在报告里?反正个人感觉写报告的时间是大于实验的~)个人感觉实验框架给的有点过多了,导致需要自己写的部分少之又少。建议像第一个实验那样的可以不给框架,明年第二个实验可以给今年的框架仿照着写SecureBoost,难度直接升级(狗头保命
总的来说这课作为计科为数不多的隐私安全方向的课,还是很值得选的,强烈推荐(同时也很适合大四人水学分hhh
辅修人,大概只有开学前两个月去过三四次,签了两次到吧(每次还帮好几个同学代签),作业/实验全部 gpt 直出 latex 源码,最后 89。没料到会占优秀率 = =
最近在想的一个问题是,如果一门课作业/实验要求清晰、给出的指引明确,那么其被现在的 AI 工具( cc、codex 之类的)解决的难度就会降低;而如果很模糊的话学生自己做起来就会很恶心。以后(甚至现在已经)学习课程的范式也许会转变成靠 AI 迅速完成平时的任务,考前再依靠 notebooklm 之类的工具快速拟合,学生与课程之间活出了一种 GAN 的美感。挺想看看后续这门课会往什么方向发展。
给分是不错的,作业翻ppt和往年作业一般可以得满分,实验靠ai也能大差不差,实验有部分开放题可能用来区分分数,不过总体影响不大,但是实验和作业往往在课程中期才开始布置,形成的超长战线导致我放假回家都还在写实验,这可能会是这门课程比较受诟病的一点吧。
给分超好,课程也不难,实验可能有点多,部分实验有点繁琐,总体而言体验很好,老师人超级好
课程没有统一的教材,ppt做得也非常抽象,所以建议后面要选的同学们还是要听一下课的(尤其是每个模块开始的几节课,大都介绍基础概念,和作业题相关性较大),不然纯纯靠自己上网搜索也挺痛苦的。当然对自学能力比较自信的随意啦~
实验任务量其实很轻,不过布置时间临近考试周且实验文档略显抽象,导致整个完成过程不太愉快
给分应该是完全按照期初给的比例算的,作业实验占比九十,作业实验每迟交一周扣当次10%的分数。按时认真完成应该就能拿比较高的分数
总得来说如果上课都有认真听的话这门课算是轻松愉快事少给分好的了
出分了,很高兴当初选了这门课!没有考试,而且给分真的太太太好了!
因为没有考试,所以如果仅仅想拿到高分,只用把作业和实验涉及到的地方研究明白就够了(卷的方向很明确)。完全不用像其它课一样,期末复习时还要考虑各种细枝末节orz
因为宿舍里还有2个人也选了这门课,因此作业&实验都有人讨论。个人感觉助教给分标准比较宽松
唯一让人感觉不好的点是这学期每周的两次课全都是早八!这真是对大三壬的折磨......
然而后来发现签到真的很水,9点20下课后再过去都能签上
张兰姐姐yyds
老师上课很好,主线很清晰,如果上课跟着老师可以节省很多时间,但是因为这门课前后知识关联比较多,建议全程不要上课摸鱼,不然后来可能不止所云qaq。张兰老师一看就知道对这门课有着很深的理解,看得出来备课很用心,建议每堂课前增加一个对之前内容的回顾效果更加(当然我觉得课下回顾也是学生的必修课
课程内容还是挺有意思的,如果用矛盾论分析,这门课讨论的是数据可用性和隐私性之间的矛盾,为了解决这个问题,主要提出了加噪音和加密两个算法,其中加噪音提出了一个重要的概念:差分隐私,加密则提出了同态加密这个重要的性质。这门课重要的一点是告诉我们怎么从主观上对某种性质的认识抽象出数学严格定义,以及如何从数学严格定义中具象化实际物体的性质。
课程设计值得点赞,摆脱了科大计算机许多课程无聊的考试背多分以及低端内卷。设计的实验比较有难度,如果能够完成收获很大,助教设计实验看得出花了时间,尽管实验文档不是很完善,但是对于一门刚刚开的课还是非常不错的。
学习这门课,还是需要课下花时间,建议阅读老师课件后面提出的资料,阅读原汁原味的定义并结合上下文理解效果更佳~
没有考试,作业不多。上课内容很科普,当故事听的。作业实验不多,ai都能搞定。适合摸鱼。
作为没有考试考核的专业选修课程,这门课对于我这样的考试畏惧星人来说真的是福报啊(真的不擅长也不想考前突击捏)。
课程主题非常有趣也和我们每个人的生活息息相关,最后一节课讲的是大模型安全相关内容,属于是非常跟进时代了(可惜最后一节课莫得PPT)。
这学期签到比较多,大概每个月都至少有一次?这几个实验难度不是特别大,框架也写的特别好,就是文档(PPT)有点不太好理解。尤其是第二次实验的实验文档确实有些意义不明了,虽然是要基于第一次实验自己开放的完成,但是感觉至少需要有比较明确的任务要求啊喂。但是总体来说老师和助教都是很好很好滴,我只是吐槽一下,完全没有啥不好的意思QAQ
因为一些特殊原因(嗯,确实很特殊了)没怎么听过课(实在是很遗憾QAQ),实验和作业也做的很水,最后得分90分,感觉给分确实很好了。