DeepSeek等秒变操控电脑AI智能体,微软开源工具OmniParser V2.0发布
微软发布了OmniParser V2.0,该工具可将多个AI模型(如OpenAI、DeepSeek等)转变为能够操控计算机的智能体。新版本通过更大规模的数据训练,在检测较小UI元素时准确率和推理速度显著提升,延迟降低了60%。在高分辨率Agent基准测试ScreenSpot Pro中,V2+GPT-4o的准确率从0.8%提升至39.6%。此外,微软还开源了OmniTool,帮助开发者更快地实验不同的智能体设置。来源:https://tech.ifeng.com/c/8h2c20uabxy
页:
[1]