科学家获得稀有语言翻译资助

2019-12-16

根据 约翰霍普金斯新闻通讯中的一篇文章,约翰霍普金斯语言和语音处理中心的计算机科学家近从国家情报总监办公室(DNI)获得了1070万美元的联邦拨款,用于开发翻译晦涩语言的技术。该授权旨在帮助翻译界面扩展其语言功能。目前,他们只翻译了100种常用的语言。

稀有语言赠款中包含的语言被认为是“资源匮乏”的语言,发言者在世界范围内分布广泛,书面材料很少。其中一些语言包括库尔德语,塞尔维亚 - 克罗地亚语,高棉语,苗族语和索马里语。

DNI希望这个项目能够扩大他们的情报资源,以便更快地帮助国家安全工作。

拥有超过20年机器翻译经验的计算机科学教授Philipp Koehn将领导该研究小组。根据Koehn的说法,主要挑战之一是为通常不用于写作的语言构建翻译系统。

他说:“翻译的文字或转录的文字很少,因此为这些语言构建任何东西都比较困难。” “这是我们项目的难点。”

一旦获得数据,科学家将能够使用分析语言的结构,变形和其他方面的算法来开发翻译。这些技术已经很成熟,因此一旦他们收到语言数据,他们就可以快速开发翻译。但是,每种语言都有自己特定的细微差别,算法并不总能识别。