Cohere开源多语言模型Aya-23,刷新SOTA成绩
Cohere公司最新开源的多语言大模型Aya-23,旨在打破以英语为中心的现状,支持23种语言,包括8B和35B两个版本。Aya-23-35B在多语言任务中表现出色,尤其是在资源有限的语言上,优于同类模型。该模型采用了一系列先进技术,如并行注意力层和SwiGLU激活函数,以提升效率和性能。在MMLU、MGSM和翻译、摘要任务中,Aya-23系列模型展现出强大的多语言理解和生成能力。来源:https://mp.weixin.qq.com/s/MqDrNXwH3T67BjLw2jujpQ
页:
[1]