TransBench发布,重新定义AI翻译测评

[复制链接]
周大 发表于 2025-5-23 15:34:53 | 显示全部楼层 |阅读模式
首个应用型AI翻译测评榜单TransBench正式上线,由阿里国际AI Business团队联合多方发布。该榜单从通用标准、电商文化、文化特性三大维度重新定义翻译测评,新增幻觉率、文化禁忌词等关键指标。首期测评结果显示,GPT-4o在综合得分和通用标准中领先,DeepL Translate表现亮眼,而Qwen系列在文化特性方面优势显著。TransBench基于真实场景需求设计,数据集已全面开源,旨在推动大模型翻译技术的实用化发展。
来源:https://mp.weixin.qq.com/s/R2E_nv6yjYtQVCVkOWf-uA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-6 23:08 , Processed in 0.287082 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表