周大 发表于 2025-5-23 15:34:53

TransBench发布,重新定义AI翻译测评

首个应用型AI翻译测评榜单TransBench正式上线,由阿里国际AI Business团队联合多方发布。该榜单从通用标准、电商文化、文化特性三大维度重新定义翻译测评,新增幻觉率、文化禁忌词等关键指标。首期测评结果显示,GPT-4o在综合得分和通用标准中领先,DeepL Translate表现亮眼,而Qwen系列在文化特性方面优势显著。TransBench基于真实场景需求设计,数据集已全面开源,旨在推动大模型翻译技术的实用化发展。
来源:https://mp.weixin.qq.com/s/R2E_nv6yjYtQVCVkOWf-uA
页: [1]
查看完整版本: TransBench发布,重新定义AI翻译测评