字节Seed开源多模态智能体UI-TARS-1.5

[复制链接]
周大 发表于 2025-4-18 15:17:57 | 显示全部楼层 |阅读模式
字节跳动Seed团队正式开源UI-TARS-1.5,该多模态智能体基于视觉-语言框架,可精准操作电脑、手机系统等复杂任务,在7个GUI评测中表现领先,并具备游戏长时推理能力。通过强化学习与“行动前思考”功能,模型实现高阶推理与多步骤任务决策,同时在视觉感知和跨平台交互方面显著提升。
来源:https://tech.ifeng.com/c/8ie4244rmQG

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-30 07:26 , Processed in 0.285298 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表