LongRoPE扩展LLM上下文窗口至2048k

[复制链接]
周大 发表于 2024-4-29 17:10:40 | 显示全部楼层 |阅读模式
Microsoft Research的研究人员提出了LongRoPE模型,将LLM的上下文窗口扩展到2048k个token,并通过高效搜索发现非均匀位置插值优化方法。实验证明LongRoPE在不进行微调情况下能有效扩展模型性能,保持原有架构并提供更好的初始化。
来源:https://mp.weixin.qq.com/s/8V4yGzXBsFfGwCZ4VJDE1g

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-20 02:52 , Processed in 0.274915 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表