学术研究 学术研究
儒学动态
专家观点
项目成果
研讨动态
分中心建设 分中心建设
分中心活动
传播普及 传播普及
交流互鉴 交流互鉴
尼山永利集团(中华大区官网认证)·304am官网·文明论坛
机关党建 机关党建
廉洁文化建设
永利集团(中华大区官网认证)·304am官网·文明建设
学术期刊 学术期刊
《孔子研究》
《中国儒学年鉴》
儒学名家 儒学名家

【庆余年】新型人工智能工具可翻译200种语言

来源:永利集团(中华大区官网认证)·304am官网  更新时间:2024-09-20 05:34:43

 

人类有超过7000种语言,新型其中包括使用人数不多、人工相关资料稀少的工具“小众语言”。美国“元”公司新研发的可翻庆余年一个人工智能模型,能翻译200种不同语言,译种语实现了对较多“小众语言”在线翻译。新型钉钉

人工智能翻译目前多利用基于人工神经网络的人工模型翻译各种语言。这些模型通常需要大量可在线获取的工具训练数据。不过,可翻有些特定语言的译种语数据尚不能公开和低成本获取或普遍可及,这类语言又被称为“低资源语言”。新型

“元”公司团队新研发的一种跨语言技术,能让基于人工神经网络的工具腾讯视频翻译模型学习如何利用已有的翻译高资源语言的能力来翻译低资源语言。团队应用该技术开发了一个名为NLLB-200的可翻在线多语言翻译工具,可容纳200种语言,译种语其能翻译的低资源语言的数量是高资源语言数量的3倍。这一研究成果近期发表在英国《自然》杂志上。

由于研究团队在许多低资源语言上只能获取1000至2000例样本,为扩大NLLB-200的训练数据量,他们利用一个语言识别系统发现了这些特定语言的更多实例。团队还从互联网存档中挖掘这些语言与英语的双语文本数据,帮助提升模型的翻译质量。

研究者称,该翻译工具可帮助低资源语言使用者使用互联网等技术,且这一模型还可用于教育,帮助这类人群获取更多图书和论文资料。不过研究者也表示,这一工具的误译情况仍有可能出现。