2012年12月27日下午1点30分,应上海外国语大学俄语系邀请,南京国际关系学院许汉成教授在虹口校区图书馆六楼会议厅为上外师生做题为《俄语语料库与俄文文本关键词抽取》的学术讲座。本次讲座由俄语系副主任许宏教授主持,讲座不仅得到了俄语系硕士、博士研究生的大力支持,还吸引了新闻等其他专业的老师到场,与许汉成教授共同探讨学术问题。
讲座围绕语料库展开。许老师首先介绍了语料库的基本概念,由浅入深地列举了不同学者为其下的五个定义,指出了语料库的特点及其对于当代语言文化研究的重要意义。讲座中若涉及到难以理解的专业名词,许教授就会列举大家耳熟能详的例子来使其易于理解,如谈到“语言工程”这一概念时,许教授以谷歌、百度等搜索引擎和搜狗、腾讯等输入法为例,令同学们对该抽象概念产生具体的理解,进而使其易于接受。其次许教授介绍了语料库关键词,若干常用术语(corpus、word、type、token、hapax、legomenon等),语料库的抽取方法与语料库语言学的性质。还对比以乔姆斯基所提出形式语法为中心的“理性主义”与侧重语例、数据、田野调查的“经验主义”,指出二者的优缺点与兼容性,并与在座师生分享了莫大20世纪报刊语料库、俄语国家语料库等四个语料库的部分资料。最后,许教授为同学们详细介绍了减缩语料库的使用方法,这为同学们繁重的资料搜集工作提供了很大的便利。讲座结束后,许教授还与大家积极互动,简明扼要地回答了老师和同学们提出的问题,承诺与俄语系师生分享若干俄语语料库,并向系里赠送自己所著图书。此次讲座丰富了大家的语言学知识,让同学们了解到语料库对语言处理自动化与机器翻译这两大当代语言研究的重要任务具有非比寻常的意义与价值,加深了同学们对世界图景中语料库现状的认识。(俄语系 孙名蕊)