Meta科学家最新采访,揭秘Llama 3.1是如何炼成的

[复制链接]
周大 发表于 2024-7-28 15:17:25 | 显示全部楼层 |阅读模式
Meta AI科学家Thomas Scialom在播客节目中介绍了Llama 3.1的研发细节及Llama 4的发展方向。Llama 3.1采用15T token数据集训练,参数规模达405B,但通过量化技术,用户可在单节点上运行。Scialom还讨论了模型规模选择、模型架构、合成数据应用和模型评估等问题。他还透露,Meta已开始训练Llama 4,将重点发展agent技术。
来源:https://mp.weixin.qq.com/s/2q3jTMM45AJAZjF5AdXzow

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-19 02:50 , Processed in 0.281369 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表