Mistral、AI2 发布新的开源 LLMs:更小,更便宜
Mistral AI 和 Allen 人工智能研究所分别发布了新的开源大型语言模型。Mistral Small 3 拥有240亿参数,尽管参数量较少,但在性能上可媲美参数量更大的 Llama 3.3 70B,并且可以在某些 MacBook 上运行。Allen 人工智能研究所发布的 Tülu 3 405B 则是基于 Llama 3.1 405B 定制,通过多种训练方法优化,性能优于原版。两款模型均在各自领域展示了卓越的性能和灵活性,适用于不同应用场景。来源:https://www.chinaz.com/2025/0131/1666735.shtml
页:
[1]