微软发布Phi-3-vision:视频AI新秀,图文理解利器
微软发布新款AI模型Phi-3-vision,这是一款专长于视觉理解和图文解析的多模态模型,可在移动设备上高效运行。Phi-3-vision具备强大的图文识别功能,特别是在解读图表和方块图方面,对办公环境尤为适用。微软表示,该模型在多项指标上超越了其他同类产品,如字节跳动的Llama3-Llava-Next和微软与高校合作的LlaVA-1.6,展现了其在办公辅助上的潜力。来源:https://tech.ifeng.com/c/8ZtKfeSPIie
页:
[1]