您的当前位置:首页>科技咨询>资讯详情

一手实测通义 APP翻译新功能,当理解小众语言不

发表于:2025-06-22 23:00:07 浏览:1次 发布者: 网易互联网


作者 商迪安

最近,通义APP 翻译能力全面升级。官方信息显示,本次通义APP攻克了文字翻译、同传翻译、文档翻译、图片翻译四大核心场景,打造面向个人与专业用户的“最强翻译综合体”。

针对本次升级的诸多功能,「电厂」选取多个实际用例、分多角度进行实测。

结果显示,不论是小众语言文本翻译,还是在同声传译、跨语言文档翻译、图片翻译等生产力场景下,升级后的通义APP都能精准理解翻译指令,以及有效处理专业术语、上下文语义一致性等复杂语言问题,在专业性表达、语义一致性等方面表现突出。


支持119种语言/方言翻译,让出游不再难行

据官方信息,升级后的通义APP新版本支持多达119种语言与方言的文字互译,涵盖印欧、亚非、南亚等多语种体系,并且着力打磨复杂语义处理能力。

提升语言覆盖密度,在大模型应用领域并不是一个容易的选择。究其原因,作为世界第一大语言的英语既是当下互联网及科研领域的主流语言,又有丰富充足的训练语料,因此是各大AI翻译应用积累用户规模、形成数据飞轮的最好选择。

但在日常使用场景下,“小众”语言无疑同样存在用户市场。通义APP选择“看见”这部分人的需求,不仅事涉回报比,更意味着对技术的极大挑战。

以隶属印欧语系的葡萄牙语为例,其是拥有约2.6亿母语或官方使用者的世界第六大语言,也是在巴西、葡萄牙等旅游胜地广泛应用的“区域性热门语言”。即便如此,葡语翻译在大模型应用领域也绝非热门功能。

为了测评通义APP在小众语言翻译领域的语义准确度,本次「电厂」也以葡萄牙语为例,准备了葡语版本的机场问询台常用问答、机场广播素材,并将其输入通义APP进行翻译为中文。

结果显示,通义APP准确地捕捉和翻译出了地名、指引路线、登机口变更、登机时间等关键信息,足以满足旅客的基本对话需求。


接下来,电厂还测试了通义APP对隶属壮侗语系的老挝语的翻译能力。

公开信息显示,老挝语的语序、表达均与汉语差异极大。比如不同于中文常用的“形容词+名词”的语法结构、老挝语通常将形容词放在名词之后;由于文化背景不同,许多老挝语表达在中文中并没有直接可对照的词汇……

「电厂」预设了一个旅行中常见的车站问答情景,将对话输入通义APP。翻译结果显示,在对问答语气的理解、翻译的准确性、金钱单位等专有名词的理解方面,通义APP的表现同样优秀。


特别指出的是,不只是日常场景,在强专业性、高难度的翻译场景下,通义APP的表现也较为优异。

以马来语为例,这是一门属于南岛语系的语言,目前广泛应用于马来西亚、新加坡、印度尼西亚、文莱等热带国家。

我们将流行于马来语地区的谚语“air yang tenang jangan disangka tiada buaya”输入通义APP及其他多个模型进行翻译。

通义APP给出的答案为“静水莫当无鳄鱼”,兼顾了精炼、准确两大要素;其他模型给出的答案则大多局限于字面意思理解,如“别以为平静的水中没有鳄鱼”“风平浪静,别以为没有鳄鱼”。


打造专属随身的免费同传服务,不限时间及次数

除了文本翻译,升级后的通义APP更支持10大语种同传翻译。

具体来说,通义APP可以识别包含中文(普通话)、英语、日语、韩语、粤语、德语、法语、俄语、意大利语、西班牙语这10大语言,并能够翻译出中文、英语、日语、韩语这4大语言。

同声传译,又称为同步口译,是一种高级翻译形式,要求译员在讲话者发言的同时、几乎同步地将其所说内容翻译成另一种语言。当前世界上95%的国际高端会议都采用同声传译的方式翻译,由于难度极高,同传有“翻译之王”“翻译皇冠之上的明珠”之称,同传师也供不应求、日薪也高达万元之上。

这样的背景下,通义APP同传功能的推出,意味着每个用户都可以拥有一个专属、随身的同传师。

针对同传功能,「电厂」选取了最为常用的中、英文场景,分别测试了通义APP的英传中、中传英功能。

在英传中场景下,「电厂」选取了斯坦福大学首位红杉讲席教授、美国国家工程院院士、华裔人工智能科学家李飞飞的TED演讲《有了空间智能,AI将会理解现实世界》。

在整个同传过程中,通义APP精准地捕捉到了演讲者的语气、对演讲内容进行合理分段,并实时将英文转化为符合中文语序的译文,同传的中文内容阅读流畅、相较英文原文十分准确。


在中传英场景下,「电厂」让通义APP翻译了2025年6月21日晚间新闻联播天气预报的内容。

结果显示,在总时长约1分钟50秒的主持人口播过程中,通义APP几乎一字不差地识别了播报内容,在顿挫的语气中准确完成了长句识别等任务。

同传翻译过程中,通义APP 几乎不存在启动延迟,也能够合理翻译长句和准确预判译文结构。


特别要指出的是,相较同类型产品,通义APP同传功能不限时、不限次、完全免费,完全摆脱了时间限制与付费门槛。


告别DeepL,一个APP实现专业级文档/图片翻译

在生产力场景中,通义APP全新升级的翻译能力也能派上用场。针对跨语言文档处理需求,可以提供专业级的文档翻译体验。

以英文文本阅读为例,「电厂」将一份索尼NEX-7 微单相机英文版快速使用说明输入了通义APP。后者在不到一分钟的时间内完成了全部64页内容的翻译处理。

可以看到,翻译文档不仅实现了用词的精准,而且还保持了和原文档一致的排版。此外通义APP还完成了文中表格内容的翻译处理。

在全文翻译完毕后,通义APP还自动生成了全文总结与脑图,帮助用户高效掌握文档核心信息。


同时,本次通义APP全面升级了图像场景下的多语言理解与生成能力,其图片翻译体验同样达到了专业级别。在菜单、图文海报等应用场景下,中英互译、一键出图不再是难题。

以一张英文摄像机功能使用说明图为例,在图片翻译页面将其输入后,点击“对照原图查看译文”按钮,即可生成一张中文版本的实用功能说明图。

可以看到,区别于传统OCR(XXX)工具仅完成“翻译单词”的任务,通义APP还保留了图片原本的排版结构。


左-英文原图,右-中文翻译图片结果

2023年7月,通义APP上正式上架应用市场,并在经历了一年多时间的稳定更新后,于2024年末从阿里云分拆、并入阿里智能信息事业群。

为了更加贴近用户,通义APP也悄然完成了一系列“改头换面”,比如其在上半年完成了交互设计的全面改版、只为打造更加易用的用户界面,曾引起市场广泛关注。但这或许只是第一步。

翻译功能的上线,折射出通义APP不止要“好看易用”,还希望在用户深度使用的诸多生活和生产力场景中提供价值。随着底层模型技术能力升级和产品打磨深入,通义APP的“进化”远未停止,未来有望为AI智能应用服务市场带来更多新鲜感。

猜你喜欢

三只羊风波之后:有人炒作复播,有人晒 “退一赔三”到账截屏
三只羊风波之后:有人炒作复播,有人晒 “退一赔三”到账截屏
发表于:2024-10-29 浏览:44 发布者: 市场资讯
回顾2024:AI和新硬件,开始改变我们的生活方式
回顾2024:AI和新硬件,开始改变我们的生活方式
发表于:2024-12-30 浏览:29 发布者: 网易科技
AR商业化的“AI转身”
AR商业化的“AI转身”
发表于:2024-11-27 浏览:33 发布者: 网易科技
谷歌与三星合作开发头显设备 第一款产品预计将
谷歌与三星合作开发头显设备 第一款产品预计将
发表于:2024-12-18 浏览:35 发布者: 网易科技
支付宝上线好友语音通话功能,转账前可打电话确
支付宝上线好友语音通话功能,转账前可打电话确
发表于:2025-05-12 浏览:12 发布者: 网易互联网
快手一季度毛利率同比微降,可灵AI营收超1.5亿
快手一季度毛利率同比微降,可灵AI营收超1.5亿
发表于:2025-05-28 浏览:13 发布者: 网易互联网
新电脑配置明明够高了!为什么还是会卡顿?
新电脑配置明明够高了!为什么还是会卡顿?
发表于:2024-11-14 浏览:49 发布者: ZOL中关村在线
饿了么宣布:再投入超10亿元支持优质商家!
饿了么宣布:再投入超10亿元支持优质商家!
发表于:2025-06-16 浏览:5 发布者: 网易互联网
网易云音乐将接入领克车机
网易云音乐将接入领克车机
发表于:2025-04-24 浏览:14 发布者: 网易互联网
腾讯混元深度思考模型T1正式版来了,吐字快、能
腾讯混元深度思考模型T1正式版来了,吐字快、能
发表于:2025-03-22 浏览:17 发布者: 网易互联网