回顾|国际与公共事务学院第十届“暑期社会科学方法班”——政治学与国际关系

发布时间:2024-09-12 浏览量:578

上海交通大学国际与公共事务学院第十届“暑期社会科学方法班”正式开班。本届方法班分“政治学与国际关系”“公共管理与公共政策”两个方向,以线下线上相结合方式,分别组织了为期六天课程。

“政治学与国际关系”的具体课程汇集18位海内外知名高校的专家共同授课,主要涉及因果推断的基础和前沿7讲,文本分析从词典法到大语言模型4讲,为了“让方法落地”,还邀请专家分享论文选题、数据发掘、理论提升、论文投稿的经验,以亲身经历示范高水平研究的生产过程。来自北京大学、清华大学、上海交通大学、复旦大学、浙江大学、南京大学、中国人民大学、牛津大学、芝加哥大学、加州大学圣地亚哥分校、伦敦政治经济学院、香港大学、香港中文大学等单位的50位线下同学和150位线上同学参加了课程学习。

哥伦比亚大学政治学系助理教授蒋俊彦老师带来暑期社会科学方法班的第一节课“跨国比较研究与社会科学理论”。蒋俊彦老师首先探讨了社会科学是否是科学,继而提出了社会科学的几个功能:标准与认同的生产工具、欣赏简约与论述的艺术品、对某些群体感受的系统回应的消费品,并指明社会科学的研究很多时候是在讲一个寓言。在跨国比较研究的背景下,蒋俊彦老师介绍了社会科学功能的进一步发展,特别是如何将中国的过去与未来放在世界视野中,以及中国的特殊性问题,鼓励大家开展跨国研究。蒋俊彦老师还为跨国研究提供了许多实用建议,包括怎样开始一项跨国研究,如何获得跨国数据,以及跨国研究的几个注意事项。

上海交通大学国际与公共事务学院副教授季程远老师详细介绍了“因果推断的方法与案例”。季程远老师开宗明义,强调因果推断的目的在于科学地确认变量间的因果联系,并指出,混淆变量给因果关系的识别带来困难。接着,季程远老师相继介绍了潜在结果模型、随机对照实验、内生性问题、观察性研究中的准实验研究,为学员们展示了学者为解决上述困难、在不同情形下使用的不同方法。季程远老师环环相扣的推导让学员们得以对因果推断的各个方法有了深入的认知。

斯坦福大学政治学系助理教授徐轶青老师从“什么是好的观察性研究”这一问题切入,通过两节课的时间详细为方法班学员介绍了“基于可观测变量选择”(selection on observables,SOO)的非实验数据因果推断方法。在第一讲中,徐轶青老师介绍了SOO在因果推断知识体系中的位置,明确了识别与估计的区别,强调了“非混杂性”(unconfoundedness)和“共同区间”(overlap)两个重要识别假定的意义,并通过4篇经典研究回顾了近40年来非实验数据因果推断方法的发展演进,以及其与诺贝尔经济学奖得主Guido Imbens最新的研究论文。在第二讲中,徐轶青老师介绍了SOO背景下观察性研究的估计方法,主要讲解了“匹配”和“回归”两种基本工具,并结合具体实例为大家展示了研究设计何以落地。通过两次课程的讲解,徐轶青老师希望学员们通过仔细审视干预分配机制、认真检查共同区间假设、尝试采取多种验证方法等途径完善非实验数据的因果推断设计,为大家进一步开展“好的观察性研究”打开了通往方法前沿的大门,打下了开展扎实研究的基础。

复旦大学社会科学高等研究院青年研究员王宇老师主讲了“大语言模型在政治科学的应用”,带领学员们探索计算社会科学的最新进展。讲座伊始,王宇老师概述了大规模语言模型在政治科学研究中的发展历程。接着,他重点阐述了大规模语言模型的几种应用:Embedding、Pretrain-Finetune、Prompting (zero-shot prompting, few-shot prompting),并推荐了与各应用相关的前沿论文,鼓励学员们深入研读。王宇老师还对学员们提出的问题进行了细致解答,使大家对大语言模型的强大功能有了深刻体会。

新加坡国立大学政治学系助理教授徐简老师带来了主题为“司法政治研究中的测量与推断”的课程,他首先介绍了司法政治这一正在快速发展的政治学领域与传统的实证法学的区别,之后徐简老师介绍了法院作为一个政治机构,如何突破传统的规范性角色,作为政治系统中的实际行为体,在不同的国际政治和国内政治环境中的互动及其策略。随后,他分享了司法政治领域的杰出研究成果,揭示了该领域的前沿动态。最后,徐简老师还为有兴趣关注司法政治的老师与同学们提供了当前司法政治研究中广泛采用的研究方法与数据资源。

清华大学社会科学学院政治学系教授孟天广老师主讲了“自动文本分析”课程,他从文本分析在社会科学中的历史传统出发,深入浅出地为学员们介绍了文本分析的定义与目标、方法与路径、功能与挑战等基本内容。孟天广老师结合丰富多样的研究实例——例如测量社交媒体中的政治极化、分析美国国会记录中的党派叙事、展现新闻联播中的地域关注等——讲授了分词与停词、信息(实体)抽取、词频统计、词云分析、文本表示模型等文本数据分析的基本应用,帮助学员勾勒出了一幅文本分析方法的基本图景,为后续的文本分析学习打下了坚实基础。

清华大学社会科学学院政治学系副教授胡悦老师在回顾孟老师已有课程的基础上再往前一步,讲解了文本分析中如何突破词基限制,找回有用信息,并从三个层级进行分析。他从词汇层级、概念层级和语义层级出发,介绍了文本分析的技术。在词汇层级,文本分析主要介绍了Keyness,即从关键词定位攫取信息的技术。在概念层级,主要介绍了主题模型,如何纳入研究意图,并介绍了主题模型的具体步骤。在语义层级主要介绍了Word embedding方法,来分析词汇之间的语义关联,并介绍了具体的论文范例。在座的同学对于文本分析的技术与局限有了进一步的了解。

普林斯顿大学政治学系助理教授于泽洋老师主讲了“随机化检验:基础理论和前沿进展”。课程伊始,于泽洋老师深度介绍了潜在结果(potential outcome)和假设检验这两个因果推断的基本概念,为学员们的后续理解打下良好基础。之后,于泽洋老师介绍了随机化检验中的零假设:费雪假设(Fisher’s sharp null hypothesis)。于泽洋老师对该假设的具体内容,以及在该前提下如何进行假设检验,进行了细致的数学推导。于泽洋老师生动的讲解与清晰的板书,为学员们解开了随机化检验的神秘面纱。

北京大学国家发展研究院助理教授刘诗尧老师以“随机试验的样本量及预调查的作(无)用”为主题,用数学推导引发学员们思考。刘诗尧老师首先指出,进行随机试验应减少犯第二类错误的概率,即,应提高统计功效(statistical power)。之后,刘诗尧老师带领同学们进行了数学推导,得出了用样本量表达统计功效的函数。最后,刘诗尧老师分享了他最新研究成果,指出用预调查方法确定样本量的做法难以奏效。刘诗尧老师循循善诱,用简单的数学推导展示了最新研究成果,让学员们深刻领会了确定样本量的思路。

北京大学国际关系学院教授庞珣老师主讲了“动态同侪效应:纵向社会网络数据和贝叶斯多因子时空模型”课程,为方法班学员介绍了其与合作者开发的前沿计量方法。庞珣老师从全球化时空中的复杂扩散机制和社会网络效应中的互为因果难题切入,深入浅出地向方法班同学展示了其开发的模型如何扩展了时空计量模型的传统设定,并对“近朱者赤、近墨者黑”的同侪效应和“物以类聚、人以群分”的自我选择进行了更严格的区分。随后,庞珣老师运用“国际移民网络是否扩散了恐怖主义袭击风险”以及“贸易自由化政策的全球扩散”两个具体研究实例化繁为简,向同学们展示了贝叶斯多因子时空模型的研究应用,极大地拓宽了方法班学员对于前沿计量方法的学习。

哈佛大学政府系助理教授刘乃嘉老师的授课主题是“非实验因果推断里的缺失数据”。首先刘乃嘉老师以丰富的实例展示了缺失数据问题是一个政治学和社会科学重视不足的问题,接着通过实例介绍了缺失数据的三种假定类型:MCAR(完全随机缺失)、MAR(条件性随机缺失),与MNAR(非随机缺失),以及当前研究中对数据缺失的应对方案,同时指明不同的应对方案将对实证结果产生重大影响。接下来的部分,刘乃嘉老师将缺失值问题置于观察性研究与潜在结果模型中,比较深入地介绍了缺失值对于因果关系估计的影响,然后介绍了刘乃嘉老师及其合作者开发的two step projection estimator方法的改进及其应用。刘乃嘉老师的授课由简入深,强调了缺失值问题应对的意义。

复旦大学经济学院教授陈硕老师带来了“社会科学中的跨学科研究”为主题的报告。陈硕老师首先结合个人经历,分享了开展跨学科研究的历程。接着,陈老师详细介绍了几个趣味性很强的研究,是如何受益于跨学科,而启发新思路、升华研究层次和拓宽研究选题,例如和亲与承诺问题、复仇与国家能力问题、中国名画与产权流动问题等,这些都表明跨学科的理论或数据进行拼接将产生很好的研究。之后,陈硕老师又讨论了跨学科研究需要注意的事项,特别是回归学科的理论、回归学科的方法。最后,陈硕老师分享了相关的数据搭建工作和跨学科研究范例。

上海交通大学国际与公共事务学院助理教授付舒老师主讲了“量化文本分析与因果推断”,为学员们展示了文本分析如何应用于因果推断。首先,付舒老师介绍了文本分析中的基本概念,为学员们展示了文本分析的前期处理(pre-processing)是如何进行的。之后,付舒老师结合实例,介绍了文本分析在政治学的常用方法,第一种方法为探索,研究者可以通过文本分析发现文本主题,第二种方法为测量,研究者可以通过文本分析对文本打分。最后,付舒老师指出,在因果推断中,文本可以作为干预变量,也可以作为结果变量,从而搭建了文本分析与因果推断的桥梁。付舒老师讲课深入浅出,让学员们切身感受了文本分析的具体应用。

经过多天因果推断和文本分析方法的学习,芝加哥大学政治学系助理教授罗兆天老师为学员们带来了“问责与选拔:博弈论与美国选举政治的逻辑谬误”课程,将形式模型(formal modeling)方法引入了本次方法班的课堂。罗兆天老师从“联邦党人”关于选举之基本功能——问责与选拔——的认识切入,循循善诱地带领同学们学习博弈模型的设定,推导博弈模型的均衡,延伸博弈模型的应用。罗兆天老师的授课不仅帮助方法班学员掌握了形式模型方法的分析路径与研究应用,而且通过聚焦问责与选拔的研究实例,进一步帮助大家了解了美国选举政治的逻辑谬误与制度缺陷,认识了政治学研究方法中的“模型之美”。

Pitzer College政治学系助理教授刘含章老师以自己发表在American Political Science Review的论文为例,带来了“论文的台前幕后”第一课,整个分享包括文章内容和撰写过程两个部分,刘含章老师的论文主要关注不平等与政治稳定命题,通过差分模型和工具变量方法等,基于CGSS调查数据,证明了中国公务员考试制度有利于受教育且低于35岁的公众向上流动感知的提高和再分配需求的下降。在论文的幕后部分,刘含章老师首先提出存在theory driven、data driven和story driven三种类型的研究,并详细介绍了论文故事的缘起和之后经历的漫长历程,为同学们提出一些实际建议,在座的听众受益匪浅。

北京大学国家发展研究院副教授席天扬老师分享了“研究论文中的理论叙事”。讲座开始,席天扬老师指出,现有的研究中国的英文论文经常受困于“一般理论意义”的问题,解决这一问题需要研究者更为关注论文中的理论叙事。之后,席天扬老师详细介绍了理论的概念,并剖析了西方主流政治学的理论特点。此外,席天扬老师结合其他学者与自身的研究,为大家展示了何为有影响力的中国理论叙事,讲述了他根据实证结果拔高文章理论层次,最终发表于《公共管理学报》和Journal of Politics,化腐朽为神奇的经验。席天扬老师理论积淀深厚,学员们收获颇丰。

上海交通大学国际与公共事务学院副教授雷镇环老师带来了本次方法班的收官之作,在“论文的台前幕后”第三节课中,雷镇环老师以自己发表在Comparative Political Studies上的论文为例,展现了在多元学术审美下,如何转变论文的理论建构与主题叙事,应对论文发表的市场偏好的经验。之后雷镇环老师详细回顾了这篇论文的投稿过程,从完成到修改再到见刊的历程,展现了学术生涯的酸甜苦辣,让在场的老师们也深有共鸣。老师们分享了对于论文发表的经验,在座的同学们深受启发,真诚地交流了自己作为初学者对于学术道路的困惑。

Back to Top