选课类别:核心通识 | 教学类型:理论课 |
课程类别:核心通识 | 开课单位:科技传播系 |
课程层次:通修 | 学分:2.0 |
袁家宏老师在语言学领域有扎实的背景和丰富的研究经验,上课表现突出,引人入胜。评价中提到:“老师讲的很好很用心,对语言学感兴趣的大佬欢迎来。”总体来看,袁老师的教学方法能够有效地引导学生理解语言学的基本知识和现今的热点研究。
《语言科学》涵盖了语言学的基础知识,并延伸至语言演化、社会语言学、自然语言处理(NLP)等现代应用。“课程会整体介绍语言学,并且介绍一些当下应用”,如NLP和LLM(大语言模型)。点评中还指出,课程有助于理解语言的规律、人类语言的感知与学习,以及自动翻译和情感分析等实际应用,适合对语言学及其跨学科研究感兴趣的学生。
本课程的加分作业设计丰富,内容包括制作模型和语言调查等。部分学生认为任务适量且具有挑战性,能有效促进学习:“加分作业也蛮有意思的,第一次体验制作模型和语言调查,收获很多。”不过,也有学生提到作业量较大,特别是对时间紧张或基础较弱的同学来说,可能会感到压力:“加分小作业并不少,而且炸鱼大佬疑似也挺多。”
涉及考试和评分方面的具体信息较少。从整体评价来看,学生的反响主要集中在对课程内容和老师教学水平的认可。虽然点评中没有具体提及评分标准和难度,但从一位同学“含泪收下3.0力”推测,评分可能较为严格,学生需认真对待。
课堂上,师生互动活跃,尤其是对语言学和其应用有深入了解的同学,会与老师频繁进行学术交流。有学生表示,一些同学的积极参与影响了其他学生的听课体验:“班里有位小语种社团的e人学姐,e到严重影响听课体验。”
本课程特别适合对语言学及其现代应用感兴趣的学生。点评中反复强调了课程的专业性和深度,建议时间和基础较弱的同学慎重选择:“像我这种时间少,水平低的彩笔,建议慎入。”
总体而言,袁家宏老师的《语言科学》课程内容丰富、教学优质,能够让学生深入理解语言学的基本知识和现代应用。但也需要学生具备较好的时间管理和基础知识,以应对不小的作业量和相对严格的评分标准。如果你对语言学有浓厚兴趣且愿意投入时间精力,选修这门课将有很大的收获。
看到评课社区这么热闹,加上我自己也选了这门课,也跟着袁老师做了不短时间计算语言学和历史语言学的研究了(先叠个甲,这个不代表老师观点,老师也不知道,估计袁老师还不知道评课社区是啥),还是挺感慨的。虽然我还在赶论文投稿,中午抽空也来写点东西,来聊一聊我对这门课程的看法,也希望给更多人一些启发。
先聊聊课程的设置。众所周知,科大本科其是没有太多适合本科生的人文社科课程,这其实是非常可惜而且不太正常的一件事情。不过近几年也有努力改善的趋势,例如像梁永安老师的课程,以及中国纸墨笔砚等,能够在大学生活中选修一些这样的课程对我而言非常宝贵。但这些课程更侧重于“通修”,而据我所知像语言学这类更专业的课程是很难开起来的,因为科大并没有这样的老师。袁老师是前年才来到科大语言交叉中心的,其实稍微翻看一下老师之前的学习与工作经历,包括老师的上课表现,应该能够看出袁老师是相当相当正统的语言学方向的研究者。能够有这样一个机会去上这门课我觉得首先应该感到珍惜。而且袁老师对这门课准备的很用心,而且毕竟是一门专业课但是面向科技大学的同学,袁老师之前开组会时候经常问我,即从一个本科生的视角,给出课程、作业的一些建议,从而让尽可能让大家多了解语言学的基本知识并减轻负担,而且从最后的开课地点放在五教而不是高新,就能看出是希望让更多专业以及低年级的同学来了解语言学的。
再来聊一聊语言学本身,首先我自己并非语言专业、也没有参加过语言学社,甚至英语都不太好,或许更符合科大同学的认知。其实开课查询的介绍很好说明了这一点,由于课程才开始,大家或许会有一些对语言学认识的误区,认为会很多外语、特别是小语种就是语言学家的标配,但其实不是这样的。语言学内部的研究方向经历了多轮演变、也分成了不同的子方向,我们目前课程还在介绍基础知识,后面一些语言演化、社会语言学、NLP、LLM才是现在大家在泛语言框架下研究更多的话题。
顺着这个角度,我们来讨论一下语言学,这或许对大家的研究都有帮助。语言学家希望去了解语言,其实有至少以下三个视角
1. 语言本身有什么规律性,特别是不同的语言有没有一些一致性?
2. 人是怎么说出语言的,人是怎么感受语言的,人是怎么学习语言的?语言是如何产生并且演化的呢?
3. 我们应该怎么使用语言,例如我们可以自动的翻译语言吗?可以解析语言的情感因素吗?可以自动产生语言来解决我们的实际问题吗?
可以看到学会很多外语并不能直接回答其中的任何一个问题,换言之,是在应用语言而非研究语言。第一个问题,对应句法、词法等研究方向,这在任何一个大学的语言学系都有老师在研究,杰出代表便是乔姆斯基,然而这个方向对我而言更像是相当纯粹的数学理论构建,如果没有相当的知识背景与智力水平作为铺垫,其实不太适合在正式场合随意发表自己的观点; 第二个问题,目前我们可以通过结合医学、社会学等学科,例如观察神经元的传递与活动来一窥语言的如何被感知,这个方向相当的火,是一个很好的研究方向,这意味着对人类的进一步了解,Nature,Science,PNAS 在这方面有很多的研究,例如近期哈佛医学院这篇"Single-neuronal elements of speech production in humans"(附在下面),我读完觉得很有意思。而对于语言演化,以往的研究是通过考古学、语言学记录和人类学活动来综合考虑,但这种研究范式由于人类处理数据的制约已经停滞了很久。一个比较有意思、而且比较有前景的方式是通过计算的方式来构建演化,例如复旦大学的这篇Nature(国内首篇语言学nature),用贝叶斯方式构建汉藏语系起源,"Phylogenetic evidence for Sino-Tibetan origin in northern China in the Late Neolithic age", 我之前和袁老师多次讨论过汉藏语系的语言演化,我们这边也有一些初步的结果。
对于第三个问题,正好借此来聊一聊NLP, Speech, LLM, AI4Science, Science4AI这件事。其实 AI这个概念并非凭空产生的,而是在不断的追问与求索下逐渐发展起来的。一个非常重要、引领了现今LLM大潮的便是来自 Linguistic上的贡献——一种自动的回答第三个问题的方式。语言本身不仅是严密组织的,而且是一种简单的拓扑顺序(只有前后概念)的连接(相比于image, speech, graph…),这意味着文字很适用于无监督的训练,提取有意义的表示——某种层次上意味着智慧,当然近期也有不少用图、Video来构建某种程度“智能”的work。另一个证据是,NLP、Speech现今的杰出研究者,很大一部分本身就是语言学家。他们在研究中对于第三个问题的追问,发现可以用计算的方式来进行回答,例如Jurafsky(袁老师的博后老师),我相信稍微了解过一点NLP的都不太可能不知道他,稍微多说一点,Dan的这本NLP和Speech的入门书写的真的非常棒,而且才出最新版(Link在末尾)。袁老师本科时候辅修了CS,包括在Upenn任教和在百度时候,以及论文发表,做的也都是用Machine Learning来构建一个automatic system,例如ASR,这其实是Science分支推动了AI,仔细了解会是一段相当波澜壮阔的故事,或许不亚于一百年前的物理学。
转回现实,我们现在越来越能看到AI4Science的趋势。而且不像大家认知的只有大数据、高算力才能够解决。袁老师昨天在课程讲了声调的转写,而我们的一篇投稿论文也与此相关,即给出了一套自动声调转写与归类的方案,而且只需要很少的训练数据(对于濒危语言区)和训练成本,这其实就是一个直接的反映。包括正在进行的一些语言感知和演化的工作,都是可以用AI来完成。特别是现在LLM已经有了相当的记忆与推理能力,用一些in-context learning的trick,包括搭一些RAG的系统,可以很好的解决诸多问题。
但一个更与我们有关的问题是——我们如何尝试做AI研究、Science研究以及AI4Science研究呢?这其实是我一直在尝试的事情,我自己是少统+辅修传播,做AI+现在带一些Computational Linguistic的研究。AI、Science研究的概念相对清晰、有明确的范式和边界,找到一个nice的老师(虽然这个很难),你只要做好某一块即可,你需要花费一个博士周期的时间来学会怎么讲故事、做实验、写文章、体验被审稿人狂喷,往往能成为一个领域的专家。AI4Science的一个大的问题是,知识的不对齐与边界的不清晰,因为一个人往往只能懂AI或者懂Science,你得确保用合适的模型(AI)解决别人真正关心的问题(Science),例如Alphafold,因此从某种程度上来说这更依赖于资源。而Science已有的数据往往是利好人而非模型的,例如在语言演化中,你会有很多研究观点、诗歌记录、语言信号、文字信息,异质且不均衡。但另一个好处是,只要你能找到一个稍微合适的切入口,例如借助大量诗歌的押韵来构建表征,往往能够得到传统Science领域得不到的结果,有比较大的影响力。在我的研究过程中,我往往是先根据我的了解构建出一个模型,然后和袁老师讨论得到了一些Science以及技术上的建议,如此迭代。另一方面,其他学科带来的思考,例如机器的责任性、安全性、可控性,也为AI来带来了新的研究话题,这其实对应我以往的一些研究,显而易见这方面越来越重要,不过目前貌似还是一个蓝海。
最后,科大有相当一部分同学未来希望去做研究、甚至把其作为自己的职业,我觉得最重要的事情应该是在本科期间了解什么是科研、不断求索中找到自己喜欢的研究方向(往往是交叉的) 并enjoy it, 而不是 “waste time being meaningless.”(强烈建议去看看这篇科研入门blog)
最后的最后,希望这门课能给我们带来一些有意义的思考。We can only see a short distance ahead, but we can see plenty there that needs to be done.
一些有用的Link
http://catalog.ustc.edu.cn/query/lesson?eqid=d6a402ac00016aa20000000464267556#showcourse
https://www.nature.com/articles/s41586-023-06982-w
https://pubmed.ncbi.nlm.nih.gov/31019300/
https://web.stanford.edu/~jurafsky/slp3/
https://www.thesavvyscientist.com/tips-for-new-phd-students/
先留坑,课是好课。
班里有位小语种社团的e人学姐,e到严重影响听课体验。鼠鼠想重拳出击了。
听了两节课了,部分同学给我的观感实在是不佳,最后还是退课了。老师挺有学问的,五星是给老师的
老师讲的很好很用心,对语言学感兴趣的大佬欢迎来。
像我这种时间少,水平低的彩笔,建议慎入,本身这门课的加分小作业并不少,而且炸鱼大佬疑似也挺多的,课上不少大佬同学和老师频频进行学术交流。像我这种又懒又菜的废物只能含泪收下3.0力,悲