中国少数民族语言研究论坛第57讲成功举行
作者:赵妍 日期:2021-10-14 浏览次数:1133

2021年10月13日(周三)下午,由中国社会科学院中国少数民族语言研究中心主办、中国社会科学院民族学与人类学研究所承办的中国少数民族语言研究论坛第57讲在我所成功举办。本期讲座邀请中国社会科学院民族学与人类学研究所研究员、中国社会科学院研究生院教授、博士生导师江荻讲授藏系语言和方言的分类研究的相关问题,讲座题目为“藏系语言自动分类方法”,由民族学与人类学研究所龙从军副研究员主持。江荻研究员曾任中国社会科学院民族学与人类学研究所语音学与计算语言学研究室主任,兼任教育部语言文字信息化专业委员会委员,中国民族语言学会副会长,常务理事,汉藏语言学评奖委员会秘书长,中文信息学会理事,中国科学院《中文信息学报》编委,中国社会科学院《民族语文》编委,上海高校比较语言学E-研究院《东方语言学》期刊编委,西南民族大学客座教授、上海师范大学特聘教授。主要研究方向为汉藏语言学、现代藏语语法和计算语言学。

讲座围绕什么是藏系语言及其分类、自动分类方法及初步结果、藏语各地材料、词汇差异和语音差异、词项之间相似数据与比较、自动分类带来的新知以及尚存不足等内容展开。

江荻研究员首先通过一种自动重建语言/方言谱系(相似)关系的数学方法研究藏系语言和方言的分类,收集了中国、不丹、尼泊尔、印度、巴基斯坦的藏语方言材料和源自古藏语的其他藏系语言材料,共计75种。并利用数学上的编辑距离算法对藏系语言材料的相似性进行远近关系计算和自动分类实验,得出分类结果与传统分类获得的结论基本一致。

之后,根据比较法语音对应关系和语言接触引起的词汇借用,剖析了本项实验与传统分类之间的异同。通过基本词汇的具体语音距离案例深入分析了词项相似的算法过程,从中辨析同源词和借词的差异。

最后,得出编辑距离计算是可行的语言/方言自动分类方法的结论。(1)数据化,即两两方言之间具体相似/差异距离转化为精细的数据。(2)可视化,可以通过相似数据的作图实现方言关系的图形化。(3)便捷性,简化研究者堆砌卡片、绘制表格、以及高强度比较工作的时间和人力成本。(4)可信度,通过多方言大数据的不断摸索,编制和修订计算机软件,实现分类的高可信度,从而对任何增加的陌生方言都可加以判断。

本期有民族学与人类学研究所和中央民族大学几十位师生参与此次讲座,提问讨论踊跃热烈。此项研究适用于对新发现藏系语言或方言进行分类,为进一步深入研究提供了参考和借鉴。


 

文章来源:原创
版权所有:中国社会科学院中国少数民族语言研究中心
地址:北京市海淀区中关村南大街27号院6号楼     邮政编码:100081
E-mail:zgmzyyx@163.com