微软发布Phi-3-vision:视频AI新秀,图文理解利器

[复制链接]
周大 发表于 2024-5-26 15:49:21 | 显示全部楼层 |阅读模式
微软发布新款AI模型Phi-3-vision,这是一款专长于视觉理解和图文解析的多模态模型,可在移动设备上高效运行。Phi-3-vision具备强大的图文识别功能,特别是在解读图表和方块图方面,对办公环境尤为适用。微软表示,该模型在多项指标上超越了其他同类产品,如字节跳动的Llama3-Llava-Next和微软与高校合作的LlaVA-1.6,展现了其在办公辅助上的潜力。
来源:https://tech.ifeng.com/c/8ZtKfeSPIie

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-8 20:26 , Processed in 0.278872 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表