日前,复旦大学现代语言学研究院、复旦大学智能复杂体系基础理论与关键技术实验室张梦翰研究团队(POPLANG)携手生命科学学院徐书华教授团队及金力院士团队在《自然-人类行为》(Nature Human Behaviour)发表题为《大规模词汇和遗传比对支持汉族人口扩张和文化传播的混合模式》(“Large-scale lexical and genetic alignment supports a hybrid model of Han Chinese demic and cultural diffusions”)的重要研究成果。
该研究系统整合语言学、群体遗传学和生态学等多学科的理论和方法,深入解析汉语方言内部的精细化结构和地理分布规律,同时结合现有的群体遗传数据,系统分析中国各地语言和群体遗传结构之间的关系,透视汉文化传播和融合的多重模式,为探究汉族人群的人口活动与语言文化交融的复杂历史提供全新视角。
通过定量分析
解析汉语方言内部结构和地理分布规律
在研究中,团队首先通过对926个方言点的1018个词汇特征进行量化分析和空间投影,并发现汉语方言的多样性与地理分布密切相关(见图 1),其词汇差异呈现明显的南北梯度分布,而大型山川河流作为地理屏障,进一步促进方言群体之间的分化。 其中,长江成为南北方言群体的地理分界线,长江以南的多种方言,如闽语、粤语、吴语等,各具独特的词汇特点,显示出显著的差异;秦岭-淮河则进一步区分北方官话和南方官话,秦岭-淮河线以北的北方官话内部一致性较高,而其以南的江淮官话和西南官话则展现出方言连续体的特点,其方言差异随地理距离而逐渐累积。 在此之上,汉语方言邻接网络(图 1b)的结构表明,这些方言变体的形成不仅与地理分布有关,还与区域间广泛的语言横向交流密切相关。 ▲ 图1 汉语方言主成分分析、网络分析及祖源构成推断 为进一步揭示汉族人群人口活动与方言融合历史,研究团队通过基于贝叶斯祖源推断方法,解析了各汉语方言的内部祖先成分(见图 1c)。柱形图中不同颜色区块对应的成分代表了汉语方言发展历程中通过谱系分化或深度交融而形成的共有词汇特征,体现了方言群体间的分化和接触历史。另一方面,研究团队利用词汇特征频率数据构建了最大似然谱系树,在此基础上建模重构方言融合事件,推断了参与融合的方言群体、融合发生的方向以及对被融合方言词汇系统的影响比例(见图 2)。 ▲图2 汉语方言融合模式推断 综合多种方法分析的结果,研究团队发现中国中部地区方言呈现出多重来源的语言接触痕迹,形成了所谓“方言熔炉”,特别是江淮官话、西南官话和赣语的使用地区,方言的特征显示了多样的语言成分集成,从而构成了复杂的方言体系。如此深度的语言接触和融合反映了不同方言群体长期共存以及互相作用的结果。 这一系列定量分析所揭示的语言融合模式与汉族历史上自北向南的大规模迁徙以及“江西填湖广,湖广填四川”等历史事件密切相关。 据团队介绍,人群迁徙与融合不仅改变了人口分布,也促成了语言的深度交融。早在西晋(公元265-316年)时期,由于战乱导致的“衣冠南渡”使得大量北方人口迁居江淮地区,与当地语言相互作用,引起南北方言融合。而作为自人群自北向南迁徙的主要通道之一,江西地区在唐朝之后人口和经济快速发展,并在南方经济贸易交流中扮演重要角色。当地赣语人群为满足农业发展需要向湖广地区发展,极大地促进了赣语与湘语和西南官话之间的交流。同样,后续经济得到发展的湖广地区也向饱受战乱的川渝地区输出了大量移民,使得西南官话传播到川渝地区。 由此可见,历史上复杂的人口活动驱动了方言的传播和融合,而这些语言变异的证据在研究中均得到精细化的定量解读。 比对语言和遗传结构 发现汉语方言传播与融合模式 为探究方言传播与融合背后的驱动力,研究团队对比中国汉族人群的语言结构和遗传结构之间的关系,发现语言、基因、地理距离三者间分别存在两两强相关性。但当基因距离保持不变时,语言和地理分布之间的相关性变得不显著,这表明语言差异的形成伴随着人群遗传结构的变化即人口扩张模式(demic diffusion)在汉语方言演化中起到主要作用。 图3 汉族遗传与语言跨学科对证 通过进一步的线性回归分析(图3),团队还揭示了各省份南北方基因成分和语言成分的比例,反映出汉语方言传播的复杂地区性模式。 在中国中部地区,人群扩张模式尤为显著,北方基因流与北方语言成分对中部地区具有相似的影响程度,对应着大规模人群迁徙造成的语言-基因同步融合。 在云南、四川、贵州和重庆的西南官话地区,文化传播模式(cultural diffusion)的影响更为明显。在有限的北方基因流之下,北方方言特征在这些地区得以快速传播,与明清时期的驻军和屯田带来的社会文化影响密不可分。 在浙江和上海的吴语区、福建的闽语区等,语言同化 (language assimilation) 在方言演变中也发挥重要作用,表现为在显著的南北基因融合背景下,当地词汇系统却仍然保持高比例的南方特征。这一现象体现吴语、闽语等地区性强势方言对于外来的北方移民语言的同化作用。 多学科交叉融合 新文科领域的又一重要探索 作为汉文化的重要载体之一,汉语方言在全球拥有超过14亿的母语人口,其传播与演化的机制一直是人类学界与群体遗传学界关注的焦点。 此前,对汉语方言传播模式的研究大多依赖于历史材料和语言调查材料的比较总结,并辅以遗传证据为佐证。然而,由于缺乏对汉语方言内部精细结构的定量分析,以及对于汉族人群中语言差异和遗传差异间的一致性检验,目前尚难以全面刻画汉族人群语言演化的全貌。 此次的研究过程中,量化分析方法与多学科交叉融合是贯穿全程的鲜明特征。 为建立具有代表性的词汇数据集,团队专门开发特定软件工具,从三卷《汉语方言地图集》中进行特征数据的快速提取,速度相较传统方法提升三倍。与此同时,团队还花费一年多的时间,整合语言学、群体遗传学和生态学等多学科的理论和方法,设计一套多学科集成的计算框架,对大规模语言数据和遗传数据进行深入分析和对证。 最终,团队成功解析了汉语方言的精细化结构,并探讨了影响汉语方言形成的潜在驱动力,强调了人口扩张模式之外,社会和文化因素在语言演化中的关键作用,这一发现为了解汉族人群的活动历史提供了关键的跨学科依据,并为进一步研究中国语言的演化及“语言-遗传-文化”共演化提供重要参考。 近年来复旦大学持续布局新文科建设,大力推动研究方法创新。此次团队在汉语方言传播模式研究的重要突破,成为学校在新文科领域的又一重要探索。 团队表示,期待更多对文理交叉研究领域感兴趣的同学加入课题组,共同探索多学科融合创新,为新文科科研添砖加瓦。 复旦大学人类表型组研究院博士生杨承坤、复旦大学生命科学学院科研助理张晓曦为共同第一作者;中央民族大学严实副教授、复旦大学生命科学学院人类遗传学与人类学系博士生杨思哲、吴佰慧,复旦大学中文系博士生王之艺、硕士生游丰硕,复旦大学文物与博物馆学系崔越同学,香港大学语言学与现代语言系谢霓同学对该文做出重要贡献;复旦大学现代语言学研究院、复旦大学智能复杂体系实验室张梦翰研究员、复旦大学生命科学学院徐书华教授、金力院士为共同通讯作者。项目得到国家自然科学基金委、国家重点研发计划等项目的支持。


【论文链接】
https://www.nature.com/articles/s41562-024-01886-9
8月2日,由上海科技馆、上海市奉贤区博物馆、上海科普教育发展基金会联合主办的第227期上海科普大讲坛在上海市奉贤区博物馆举行。讲堂现场,复旦大学科技考古研究院、文物与博物馆学系教授胡耀武开讲《古人吃什......
近日,复旦大学公布一批政府采购意向,预算4314.9万元,包括多维度能量代谢测定仪、三重四极杆液质联用仪、傅立叶变换红外光谱仪及显微成像等。为便于供应商及时了解信息,现将复旦大学6月至12月政府采购意......
据复旦大学官方微信发布,著名物理学家,中国科学院院士,复旦大学物理学系教授、博士生导师孙鑫,因病医治无效,于2025年5月27日下午15:18在新华医院逝世,享年87岁。孙鑫据介绍,孙鑫,1938年7......
2005年5月,复旦大学生物医学研究院揭牌运行,今年5月,研究院(以下简称研究院)迎来建院二十周年。“研究院从诞生起就是创新的产物,是综合性大学办医学院的创新载体,是‘不拘一格降人才、突破传统建机制’......
5月20日,在复旦大学主办的第二届复旦-新加坡国立大学-高丽大学S3可持续论坛上,复旦大学灾害风险综合研究(IRDR)极端天气气候与健康风险互联和治理国际卓越中心发布《气候变化-大气环境-健康全因图谱......
5月17日,距离复旦大学建校120周年纪念日还有10天,复旦大学附属医院发展基金(以下简称“基金”)成立,重点支持复旦大学附属医院在医疗、教学、科研及管理等方面的持续发展。基金启动资金1亿元人民币,由......
5月10日,复旦大学化学学科百年启动仪式暨校友“智汇”高峰论坛在江湾校区化学楼举行。复旦大学校长、中国科学院院士金力出席启动仪式并致辞。1984级化学系无机化学专业校友、复旦大学校董谭瑞清捐赠人民币1......
2025年7月23-26日,陶术特邀 复旦大学药学院人工智能药物设计团队 授课的第四期药物设计培训班将在上海丽昂豪生大酒店正式开班!培训班师资队伍内容强大,三位老师均为药物分子设计......
复旦大学附属华山医院2025年4至12月政府采购意向为便于供应商及时了解政府采购信息,根据《财政部关于开展政府采购意向公开工作的通知》(财库〔2020〕10号)等有关规定,现将复旦大学附属华山医院20......
7日,记者从复旦大学附属肿瘤医院获悉,该院院长虞先濬教授联合北京大学肿瘤医院、中国科学院上海药物研究所、上海长海医院等单位的研究团队,历时5年成功绘制全球首张无功能性胰腺神经内分泌瘤多组学全景图谱,并......