LLaSO 横空出世:逻辑智能推出全球首个完全开源语音大模型框架,定义 LSLM 研究新基准

[复制链接]
周大 发表于 前天 14:37 | 显示全部楼层 |阅读模式
北京深度逻辑智能推出首个开源语音语言模型框架LLaSO,包含LLaSO-Align、LLaSO-Instruct和LLaSO-Eval三大组件,提供1200万语音-文本对、1350万指令样本及15,044个测试样本。基于LLaSO训练的38亿参数模型LLaSO-Base在多项语音任务中表现领先,尤其在ASR、AQA及副语言任务中优于现有模型。该框架旨在推动LSLM领域标准化与社区协作,提升模型可复现性与任务泛化能力,降低研究与开发门槛。
来源:https://mp.weixin.qq.com/s/JvFzf-UkRJz3Cv-h8Er1yw

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-9-16 08:42 , Processed in 0.295423 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表