靠浦ai课堂's Archiver
版块
›
靠浦ai资讯
› 苹果新模型4M-21,一款能处理21种模态的多任务视觉模型
周大
发表于 2024-6-25 15:40:13
苹果新模型4M-21,一款能处理21种模态的多任务视觉模型
EPFL和苹果的研究者合作创建了一款单一模型4M-21,能处理21种模态和数十种任务,打破了现有多模态模型的局限。该模型通过特定模态的离散tokenization进行训练,实现了任意到任意模态的转换,增强了多模态生成、检索和任务执行能力,且在各种视觉任务和迁移实验中表现出色。
来源:https://mp.weixin.qq.com/s/OI4bAYrxATFP20BFrlqSog
页:
[1]
查看完整版本:
苹果新模型4M-21,一款能处理21种模态的多任务视觉模型