Cohere开源多语言模型Aya-23,刷新SOTA成绩

[复制链接]
周大 发表于 2024-5-31 16:10:22 | 显示全部楼层 |阅读模式
Cohere公司最新开源的多语言大模型Aya-23,旨在打破以英语为中心的现状,支持23种语言,包括8B和35B两个版本。Aya-23-35B在多语言任务中表现出色,尤其是在资源有限的语言上,优于同类模型。该模型采用了一系列先进技术,如并行注意力层和SwiGLU激活函数,以提升效率和性能。在MMLU、MGSM和翻译、摘要任务中,Aya-23系列模型展现出强大的多语言理解和生成能力。
来源:https://mp.weixin.qq.com/s/MqDrNXwH3T67BjLw2jujpQ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-19 22:36 , Processed in 0.303390 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表