选课类别:通识 | 教学类型:理论课 |
课程类别:核心通识 | 开课单位:科技传播系 |
课程层次:通修 | 学分:2.0 |
袁家宏老师在《语言科学》课程中展现出深厚的学术背景和对课程的精心准备。课程从基础知识出发,逐步深入到语言演化、社会语言学、自然语言处理(NLP)、大语言模型(LLM)等现代应用领域,涵盖了语言学的多个子方向,力求让学生了解语言学全景。同时,袁老师的课堂幽默风趣、充满互动,注重学生的参与和反馈。
课程包括多项加分小作业,这些作业设计旨在增加学生的实际动手能力,如制作模型和进行语言调查。然而,对于那些时间有限或者自认为专业水平不高的学生而言,作业数量可能增加了一定的负担。因此,需要充分衡量时间和能力,再决定是否选修这门课程。
课程的评分起点较高,但要求学生积极参与课堂和完成作业,一些学生反馈称课上有不少具有较强背景的同学,这也可能加剧一些普通学生的压力。如果对语言学的兴趣不够强烈,或在时间安排上较为紧张,学生可能需要在选课前更为慎重考虑。
总的来说,袁老师的课程获得了学生的高度评价,很多同学称赞课程具有启发性,并且从中学到了很多。也有学生提到班上个别同学的表现影响了听课体验。尽管如此,对于热爱语言学且有余力进行课外扩展的同学,这门课无疑是一个极佳的选择。
如果你是对语言学及其在现代科技中的应用感兴趣的学生,这门课将是丰富且有挑战的探索。如果担心学习压力,可以考虑旁听以获取课程精华。在做决策时,建议结合自身空闲时间和学习能力,确保能够从课程中获得最大收获。
看到评课社区这么热闹,加上我自己也选了这门课,也跟着袁老师做了不短时间计算语言学和历史语言学的研究了(先叠个甲,这个不代表老师观点,老师也不知道,估计袁老师还不知道评课社区是啥),还是挺感慨的。虽然我还在赶论文投稿,中午抽空也来写点东西,来聊一聊我对这门课程的看法,也希望给更多人一些启发。
先聊聊课程的设置。众所周知,科大本科其是没有太多适合本科生的人文社科课程,这其实是非常可惜而且不太正常的一件事情。不过近几年也有努力改善的趋势,例如像梁永安老师的课程,以及中国纸墨笔砚等,能够在大学生活中选修一些这样的课程对我而言非常宝贵。但这些课程更侧重于“通修”,而据我所知像语言学这类更专业的课程是很难开起来的,因为科大并没有这样的老师。袁老师是前年才来到科大语言交叉中心的,其实稍微翻看一下老师之前的学习与工作经历,包括老师的上课表现,应该能够看出袁老师是相当相当正统的语言学方向的研究者。能够有这样一个机会去上这门课我觉得首先应该感到珍惜。而且袁老师对这门课准备的很用心,而且毕竟是一门专业课但是面向科技大学的同学,袁老师之前开组会时候经常问我,即从一个本科生的视角,给出课程、作业的一些建议,从而让尽可能让大家多了解语言学的基本知识并减轻负担,而且从最后的开课地点放在五教而不是高新,就能看出是希望让更多专业以及低年级的同学来了解语言学的。
再来聊一聊语言学本身,首先我自己并非语言专业、也没有参加过语言学社,甚至英语都不太好,或许更符合科大同学的认知。其实开课查询的介绍很好说明了这一点,由于课程才开始,大家或许会有一些对语言学认识的误区,认为会很多外语、特别是小语种就是语言学家的标配,但其实不是这样的。语言学内部的研究方向经历了多轮演变、也分成了不同的子方向,我们目前课程还在介绍基础知识,后面一些语言演化、社会语言学、NLP、LLM才是现在大家在泛语言框架下研究更多的话题。
顺着这个角度,我们来讨论一下语言学,这或许对大家的研究都有帮助。语言学家希望去了解语言,其实有至少以下三个视角
1. 语言本身有什么规律性,特别是不同的语言有没有一些一致性?
2. 人是怎么说出语言的,人是怎么感受语言的,人是怎么学习语言的?语言是如何产生并且演化的呢?
3. 我们应该怎么使用语言,例如我们可以自动的翻译语言吗?可以解析语言的情感因素吗?可以自动产生语言来解决我们的实际问题吗?
可以看到学会很多外语并不能直接回答其中的任何一个问题,换言之,是在应用语言而非研究语言。第一个问题,对应句法、词法等研究方向,这在任何一个大学的语言学系都有老师在研究,杰出代表便是乔姆斯基,然而这个方向对我而言更像是相当纯粹的数学理论构建,如果没有相当的知识背景与智力水平作为铺垫,其实不太适合在正式场合随意发表自己的观点; 第二个问题,目前我们可以通过结合医学、社会学等学科,例如观察神经元的传递与活动来一窥语言的如何被感知,这个方向相当的火,是一个很好的研究方向,这意味着对人类的进一步了解,Nature,Science,PNAS 在这方面有很多的研究,例如近期哈佛医学院这篇"Single-neuronal elements of speech production in humans"(附在下面),我读完觉得很有意思。而对于语言演化,以往的研究是通过考古学、语言学记录和人类学活动来综合考虑,但这种研究范式由于人类处理数据的制约已经停滞了很久。一个比较有意思、而且比较有前景的方式是通过计算的方式来构建演化,例如复旦大学的这篇Nature(国内首篇语言学nature),用贝叶斯方式构建汉藏语系起源,"Phylogenetic evidence for Sino-Tibetan origin in northern China in the Late Neolithic age", 我之前和袁老师多次讨论过汉藏语系的语言演化,我们这边也有一些初步的结果。
对于第三个问题,正好借此来聊一聊NLP, Speech, LLM, AI4Science, Science4AI这件事。其实 AI这个概念并非凭空产生的,而是在不断的追问与求索下逐渐发展起来的。一个非常重要、引领了现今LLM大潮的便是来自 Linguistic上的贡献——一种自动的回答第三个问题的方式。语言本身不仅是严密组织的,而且是一种简单的拓扑顺序(只有前后概念)的连接(相比于image, speech, graph…),这意味着文字很适用于无监督的训练,提取有意义的表示——某种层次上意味着智慧,当然近期也有不少用图、Video来构建某种程度“智能”的work。另一个证据是,NLP、Speech现今的杰出研究者,很大一部分本身就是语言学家。他们在研究中对于第三个问题的追问,发现可以用计算的方式来进行回答,例如Jurafsky(袁老师的博后老师),我相信稍微了解过一点NLP的都不太可能不知道他,稍微多说一点,Dan的这本NLP和Speech的入门书写的真的非常棒,而且才出最新版(Link在末尾)。袁老师本科时候辅修了CS,包括在Upenn任教和在百度时候,以及论文发表,做的也都是用Machine Learning来构建一个automatic system,例如ASR,这其实是Science分支推动了AI,仔细了解会是一段相当波澜壮阔的故事,或许不亚于一百年前的物理学。
转回现实,我们现在越来越能看到AI4Science的趋势。而且不像大家认知的只有大数据、高算力才能够解决。袁老师昨天在课程讲了声调的转写,而我们的一篇投稿论文也与此相关,即给出了一套自动声调转写与归类的方案,而且只需要很少的训练数据(对于濒危语言区)和训练成本,这其实就是一个直接的反映。包括正在进行的一些语言感知和演化的工作,都是可以用AI来完成。特别是现在LLM已经有了相当的记忆与推理能力,用一些in-context learning的trick,包括搭一些RAG的系统,可以很好的解决诸多问题。
但一个更与我们有关的问题是——我们如何尝试做AI研究、Science研究以及AI4Science研究呢?这其实是我一直在尝试的事情,我自己是少统+辅修传播,做AI+现在带一些Computational Linguistic的研究。AI、Science研究的概念相对清晰、有明确的范式和边界,找到一个nice的老师(虽然这个很难),你只要做好某一块即可,你需要花费一个博士周期的时间来学会怎么讲故事、做实验、写文章、体验被审稿人狂喷,往往能成为一个领域的专家。AI4Science的一个大的问题是,知识的不对齐与边界的不清晰,因为一个人往往只能懂AI或者懂Science,你得确保用合适的模型(AI)解决别人真正关心的问题(Science),例如Alphafold,因此从某种程度上来说这更依赖于资源。而Science已有的数据往往是利好人而非模型的,例如在语言演化中,你会有很多研究观点、诗歌记录、语言信号、文字信息,异质且不均衡。但另一个好处是,只要你能找到一个稍微合适的切入口,例如借助大量诗歌的押韵来构建表征,往往能够得到传统Science领域得不到的结果,有比较大的影响力。在我的研究过程中,我往往是先根据我的了解构建出一个模型,然后和袁老师讨论得到了一些Science以及技术上的建议,如此迭代。另一方面,其他学科带来的思考,例如机器的责任性、安全性、可控性,也为AI来带来了新的研究话题,这其实对应我以往的一些研究,显而易见这方面越来越重要,不过目前貌似还是一个蓝海。
最后,科大有相当一部分同学未来希望去做研究、甚至把其作为自己的职业,我觉得最重要的事情应该是在本科期间了解什么是科研、不断求索中找到自己喜欢的研究方向(往往是交叉的) 并enjoy it, 而不是 “waste time being meaningless.”(强烈建议去看看这篇科研入门blog)
最后的最后,希望这门课能给我们带来一些有意义的思考。We can only see a short distance ahead, but we can see plenty there that needs to be done.
一些有用的Link
http://catalog.ustc.edu.cn/query/lesson?eqid=d6a402ac00016aa20000000464267556#showcourse
https://www.nature.com/articles/s41586-023-06982-w
https://pubmed.ncbi.nlm.nih.gov/31019300/
https://web.stanford.edu/~jurafsky/slp3/
https://www.thesavvyscientist.com/tips-for-new-phd-students/
先留坑,课是好课。
班里有位小语种社团的e人学姐,e到严重影响听课体验。鼠鼠想重拳出击了。
听了两节课了,部分同学给我的观感实在是不佳,最后还是退课了。老师挺有学问的,五星是给老师的
上完第一节课记录一下下,期待后面的课(搓手)
课程时间安排忘记记了,感觉有意思的是有一节课是关于手语的。老师问有没有会手语的同学结果没有,有点点意外呜呜。
老师讲的很好很用心,对语言学感兴趣的大佬欢迎来。
像我这种时间少,水平低的彩笔,建议慎入,本身这门课的加分小作业并不少,而且炸鱼大佬疑似也挺多的,课上不少大佬同学和老师频频进行学术交流。像我这种又懒又菜的废物只能含泪收下3.0力,悲
因为害怕被炸鱼大佬橄榄所以选择旁听。
第一节课已经让我印象十分深刻!老师的课堂活泼生动有趣,而且充满互动。
这课我跟定了!
详细评课待学期结束再来细补。