吉林大学研发ScreenExplorer智能体:AI可自主探索操作电脑界面
吉林大学人工智能学院近期发布研究成果《ScreenExplorer》,提出一种可在真实桌面图形界面(GUI)中自主探索的视觉语言模型智能体。通过在线强化学习框架结合好奇心机制与GRPO算法,有效解决了环境反馈稀疏难题,并引入“经验流蒸馏”技术实现模型持续进化。实验显示,原本探索能力较弱的Qwen2.5-VL-3B模型经训练后显著提升,甚至能完成加购物车等复杂操作。研究还发现,世界模型驱动的好奇心奖励对冷启动阶段探索至关重要。该成果为减少人工标注依赖、推动智能体迈向通用人工智能(AGI)提供了新路径。来源:https://tech.ifeng.com/c/8kWaNqJSi3U
页:
[1]