智谱宣布开源视觉推理模型GLM-4.5V正式上线并开源
8月11日,智谱AI发布开源视觉推理模型GLM-4.5V,总参数达106B,激活参数12B,具备出色的多模态处理能力,在41个公开榜单中达到同级别模型最优水平。该模型基于GLM-4.5-Air开发,支持图像、视频、文档理解及GUI代理任务,能精准定位图像目标。API调用成本低至每百万token输入2元、输出6元。视觉-语言模型作为多模态推理核心,被视为通向通用人工智能的重要路径。来源:https://tech.ifeng.com/c/8ljwZ7Y4SVk
页:
[1]