清华刘知远团队提出大模型“密度定律”:模型能力密度100天翻番

[复制链接]
周大 发表于 2024-12-9 15:40:26 | 显示全部楼层 |阅读模式
清华大学NLP实验室提出大模型的密度定律,模型能力密度每3.3个月翻一倍,揭示了AI时代电力、算力与智力的快速密度增长趋势。研究团队引入能力密度作为衡量大模型性价比的新指标,预计2024年年底只需8B参数即可实现与GPT-4相同的效果。自ChatGPT发布以来,大模型能力密度加速增强,推理开销大幅下降。芯片电路密度和模型能力密度的持续增强,揭示了端侧智能的巨大潜力。然而,现有模型压缩技术未必能提高模型密度,且模型高性价比有效期不断缩短。未来AI计算将实现从中心端到边缘端的分布式协同发展,推动“AI无处不在”的愿景实现。
来源:https://mp.weixin.qq.com/s/gK-egZSKFtzk9ZdlemtiQw

学员登陆|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2024-12-23 19:54 , Processed in 0.280267 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表