推理模型新路线开源!抛弃思维链不用人类语言思考

[复制链接]
周大 发表于 2025-2-11 15:05:47 | 显示全部楼层 |阅读模式
开源推理大模型新架构Huginn发布,抛弃长思维链和人类语言,在高维潜空间用隐藏状态推理。该模型具有自适应思考时间、无需专门训练数据等优势。研究使用Frontier超算及4096块AMD GPU完成。Huginn由Prelude、Recurrent Block、Coda三部分组成,3.5B参数模型训练量等效于传统32B模型,且性能不输更大参数量模型。此研究已引起业内广泛关注。
来源:https://mp.weixin.qq.com/s/HK6fjolKDcHG6MD_cVgifg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-21 00:15 , Processed in 0.288770 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表