10人明星团队炼出首个微调Llama 3.1 405B!角色扮演一秒入戏,代码全开源

[复制链接]
周大 发表于 2024-8-16 15:43:50 | 显示全部楼层 |阅读模式
初创公司Nous Research发布Hermes 3, 该模型基于Llama 3.1 405B微调而成,使用FP8量化技术后性能依然强劲,降低了50%的内存和磁盘需求,使得更多开发者可以部署使用。Hermes 3在对话能力和指令遵循方面表现出色,拥有长期上下文记忆、多轮对话等能力,并具备智能体相关的函数调用功能。此外,模型在多个基准测试中取得优异成绩,成为开放权重模型的新标杆。
来源:https://mp.weixin.qq.com/s/gsGmtdcbM-slANYfuHzZGA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-18 20:38 , Processed in 0.274815 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表