北大发布全模态对齐框架“Align Anything”

周大发表于 2024-10-18 14:54:09

北京大学对齐小组开发了全球首个全模态对齐框架「Align Anything」，支持文本、图像、音频、视频等多种模态的输入和输出对齐，并实现了超过6种对齐算法。使用该框架，北大团队对 Llama 3.2 进行了微调，得到了性能优于 Meta 官方版本的 Beaver-Vision-11B 模型。该框架和数据集已开源，有望推动全模态大模型的发展和应用。
来源：https://mp.weixin.qq.com/s/OFOvkp5STkD4n5rllai39A

页: [1]

靠浦ai课堂's Archiver

北大发布全模态对齐框架“Align Anything”