周大 发表于 2024-10-13 14:11:35

苹果推出300亿参数多模态AI大模型MM1.5:拥有图像识别、自然语言推理能力

苹果发布多模态AI大模型MM1.5,参数规模达300亿,具备图像识别和自然语言推理能力。新版本改进了数据混合策略,引入高质量OCR数据,显著提升了文本图像理解水平,并推出专门用于视频理解和移动设备UI处理的模型,未来有望集成于iOS系统中。
来源:https://www.chinaz.com/2024/1013/1646980.shtml
页: [1]
查看完整版本: 苹果推出300亿参数多模态AI大模型MM1.5:拥有图像识别、自然语言推理能力