10人明星团队炼出首个微调Llama 3.1 405B！角色扮演一秒入戏，代码全开源

周大发表于 2024-8-16 15:43:50

初创公司Nous Research发布Hermes 3, 该模型基于Llama 3.1 405B微调而成，使用FP8量化技术后性能依然强劲，降低了50%的内存和磁盘需求，使得更多开发者可以部署使用。Hermes 3在对话能力和指令遵循方面表现出色，拥有长期上下文记忆、多轮对话等能力，并具备智能体相关的函数调用功能。此外，模型在多个基准测试中取得优异成绩，成为开放权重模型的新标杆。
来源：https://mp.weixin.qq.com/s/gsGmtdcbM-slANYfuHzZGA

页: [1]

靠浦ai课堂's Archiver

10人明星团队炼出首个微调Llama 3.1 405B！角色扮演一秒入戏，代码全开源