Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人

[复制链接]
周大 发表于 2024-8-13 15:19:56 | 显示全部楼层 |阅读模式
TII技术创新研究所开源了Falcon Mamba 7B,这是全球首个基于Mamba架构的通用大型模型,采用SSLM架构,克服了Transformer架构在处理长文本时的限制。该模型在多项测试中表现出色,超越了同级别模型Llama 3.1 8B和Mistral 7B。Falcon Mamba 7B能够在单张A10 24GB GPU上高效运行,处理任意长度的序列,展示了SSLM架构在大规模序列处理方面的显著优势。
来源:https://mp.weixin.qq.com/s/7Ojw4QJved6UmJ0PHRU2xg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-18 17:23 , Processed in 0.291546 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表