OpenAI前CTO创办实验室Thinking Machines Lab再发新成果,推“模块流形”新范式

[复制链接]
周大 发表于 2025-9-28 15:00:01 | 显示全部楼层 |阅读模式
Thinking Machines Lab 提出“模块流形”新范式,通过将权重约束于Stiefel等子流形并结合谱范数度量,实现大模型训练中的预防式优化。该方法利用切空间优化与回缩映射,提升训练稳定性和可解释性,并支持层间学习率的合理分配,为深度网络提供更具理论支撑的优化框架。
来源:https://tech.ifeng.com/c/8mzQBje9FGY

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-10-9 23:54 , Processed in 0.296670 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表