LLaSO 横空出世:逻辑智能推出全球首个完全开源语音大模型框架,定义 LSLM 研究新基准
北京深度逻辑智能推出首个开源语音语言模型框架LLaSO,包含LLaSO-Align、LLaSO-Instruct和LLaSO-Eval三大组件,提供1200万语音-文本对、1350万指令样本及15,044个测试样本。基于LLaSO训练的38亿参数模型LLaSO-Base在多项语音任务中表现领先,尤其在ASR、AQA及副语言任务中优于现有模型。该框架旨在推动LSLM领域标准化与社区协作,提升模型可复现性与任务泛化能力,降低研究与开发门槛。来源:https://mp.weixin.qq.com/s/JvFzf-UkRJz3Cv-h8Er1yw
页:
[1]