10人明星团队炼出首个微调Llama 3.1 405B!角色扮演一秒入戏,代码全开源
初创公司Nous Research发布Hermes 3, 该模型基于Llama 3.1 405B微调而成,使用FP8量化技术后性能依然强劲,降低了50%的内存和磁盘需求,使得更多开发者可以部署使用。Hermes 3在对话能力和指令遵循方面表现出色,拥有长期上下文记忆、多轮对话等能力,并具备智能体相关的函数调用功能。此外,模型在多个基准测试中取得优异成绩,成为开放权重模型的新标杆。来源:https://mp.weixin.qq.com/s/gsGmtdcbM-slANYfuHzZGA
页:
[1]