translate推广(translate是什么意思)

 网络   2022-10-03 19:25   51

正在往昔的十年里,谷歌翻译(Google Translate)从最初仅支柱多少种语言繁华到此日的 103 种,每天翻译的字词逾越 1400 亿个。为了做到这一点,正在随便两种语言之间,谷歌翻译都要运行多个翻译系统,这带来辽阔的算计老本。如今,许多范畴都在被神经收集本领颠覆。谷歌置信他们也许运用神经收集进一步选拔翻译质量。这要求谷歌从新思虑谷歌翻译的算法架构。

本年九月,谷歌宣布证实,基于神经呆板翻译的谷歌翻译全新上线。(GNMT,Google Neural Machine Translation)。神经呆板翻译是端到真个练习架构,它能从数百万的实例中练习,供给大幅选拔的翻译动机。虽然功能失去了改善,不过让谷歌翻译把当下支柱的 103 种语言全数选择神经呆板翻译本领,却是一项辽阔的寻衅。

一周前,谷歌的工程师门宣布了一篇论文 “谷歌的多语言神经呆板翻译系统:使 Zero-Shot 翻译成为大概”(“Google’s Multilingual Neural Machine Translation System: Enabling Zero-Shot Translation”),雷锋网正在论文宣布后第临时间做了揭开。个中,Zero-Shot 翻译是指正在告竣语言 A 到语言 B 的翻译锻炼之后,语言 A 到语言 C 的翻译没有须要再颠末一切练习。 它能主动把以前的练习结果转化到翻译随便一门语言,即便工程师们向来没有施行过相干锻炼。

经过 Zero-Shot,谷歌束缚了把神经呆板翻译系统扩充到全数语言的难题。有了它,一套系统就也许告竣一切语言的互翻。畴前两种语言之间都须要多个翻译系统的状况,从此成为了史乘。这套架构正在翻译其他语言时,没有须要正在下层 GNMT 系统做一切改革。只需正在输入语句的初步插入一个输出语种符号,就也许把了局翻译为随便语言。

上面这幅动图对于该 Zero-Shot 系统的运作做了提示。

假定谷歌锻炼该系统做日语英语、韩语英语的互译,图中用蓝色实线来代表。 GNMT 系统就也许瓜分这四组翻译(日英,英日,韩英,英韩)的参数。这禁止它把随便一组语言的翻译体味转到其他语言上去。练习结果转化以及多语言翻译的要求,唆使该系统更好地利用建模的才略。

translate推广(translate是什么意思)

这启发了工程师们假想:咱们可否让系统翻译一组它向来没有翻译过的语言?这也许用韩语日语互译的例子来讲明。虽然该系统从未处置过韩日互译,但它运用以前的韩英、日英翻译练习结果,能施行水平没有错的韩日互译。谷歌把这个历程称为 “zero-shot” 翻译,图中用黄虚线示意。谷歌传颂,这是天下上首例利用正在呆板翻译上的练习结果转化。

Zero-shot 翻译的乐成带来了其它一个主要课题:这个系统是否正在练习语言的通用表达(没有管是翻译成甚么语种,不异寄义的语句都被系统利用如同的表达办法)?——一致于“国际语”大概中介语言?工程师们利用了 3D 图像揭示系统的内部收集数据,以领会它正在处置日、韩、英的随便互译配合时是若何运作的。

上方图片a全体(左)揭示了这些翻译的多少何组织。意思统一的语句用神采不异的点代表。例如说,英译韩以及日译英的两句话假设道理统一,就会是图上神采不异的两个点。经过这种办法,咱们也许很轻易地带分分歧神采(寄义)的点。b 全体夸大了白色区的点,c 全体则对于源语言施行识别。正在统一组神采的点里,咱们看到寄义不异但隶属分歧语种的句子。这意味着该系统一定对于句子的语义施行了编码,而没有是记忆一个短语到另一个短语的翻译。谷歌的工程师把这看作是系统中生存中介语言的记号。

谷歌正在论文里面揭示了更多的分解了局。他们指望这些发明没有但对于呆板练习以及呆板翻译的争论人员们实用处,也能对于语言学家以及对于简单系统怎样处置多语言练习感趣味的人有价值。

今日 (美国时光 11 月 22 日),基于 Zero-Shot 的多语言神经呆板练习系统正式登岸谷歌翻译。它今朝被利用于新推广的 16 个语言组中的 10个,带来更高的翻译质量以及简化的系统架构。咱们也许等待正在没有久的将来,该系统会渐渐支柱更多的谷歌翻译语种。(三川)

本文地址:http://yz.ziyouea.com/p/15419.html
版权声明:本站文章来自网络,如有违规侵权请联系我们下架。