Meta开源创新大模型架构AU-Nets

[复制链接]
周大 发表于 2025-7-23 14:11:00 | 显示全部楼层 |阅读模式
Meta研究人员开源新型语言模型架构AU-Net,采用源自医学图像领域的U-Net结构,突破传统固定分词方法的限制。该模型可直接从原始字节动态组合生成多尺度文本单元,通过收缩路径提取层次化语义信息,并由扩张路径融合细节恢复序列。其自回归生成机制在保证文本连贯性的同时提升推理效率,为大模型在多语言、复杂文本场景下的应用提供了新思路。
来源:https://tech.ifeng.com/c/8lCQCoaDypY

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-23 11:42 , Processed in 0.281993 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表