周大 发表于 2024-10-18 14:54:09

北大发布全模态对齐框架“Align Anything”

北京大学对齐小组开发了全球首个全模态对齐框架「Align Anything」,支持文本、图像、音频、视频等多种模态的输入和输出对齐,并实现了超过6种对齐算法。使用该框架,北大团队对 Llama 3.2 进行了微调,得到了性能优于 Meta 官方版本的 Beaver-Vision-11B 模型。该框架和数据集已开源,有望推动全模态大模型的发展和应用。
来源:https://mp.weixin.qq.com/s/OFOvkp5STkD4n5rllai39A
页: [1]
查看完整版本: 北大发布全模态对齐框架“Align Anything”