微软发布Phi-3-vision：视频AI新秀，图文理解利器

周大发表于 2024-5-26 15:49:21

微软发布新款AI模型Phi-3-vision，这是一款专长于视觉理解和图文解析的多模态模型，可在移动设备上高效运行。Phi-3-vision具备强大的图文识别功能，特别是在解读图表和方块图方面，对办公环境尤为适用。微软表示，该模型在多项指标上超越了其他同类产品，如字节跳动的Llama3-Llava-Next和微软与高校合作的LlaVA-1.6，展现了其在办公辅助上的潜力。
来源：https://tech.ifeng.com/c/8ZtKfeSPIie

页: [1]

靠浦ai课堂's Archiver

微软发布Phi-3-vision：视频AI新秀，图文理解利器