Mistral AI两连发:开源7B数学推理专用模型与Mamba2架构代码模型
法国科技公司Mistral AI推出了一款名为Mathstral的大规模数学推理模型,旨在解决复杂数学问题,弥补现有大语言模型在数字理解上的不足。Mathstral在MMLU和MATH基准测试中刷新了记录,表现出优秀的推理性能。同时,Mistral还发布了代码生成模型Codestral Mamba,其Mamba2架构提供了线性时间推理能力,超越了其他开源代码生成模型。来源:https://mp.weixin.qq.com/s/fFB0A0vv_2Deb0rWd4tagw
页:
[1]