用多模态LLM超越YOLOv3!强化学习突破多模态感知极限

[复制链接]
周大 发表于 6 天前 | 显示全部楼层 |阅读模式
华中科技大学等高校联合开发的Perception-R1(PR1),是首个在COCO2017 val set上突破30AP的纯多模态开源LLM。该框架通过基于规则的强化学习优化MLLM的视觉感知策略,在物体检测、计数和OCR等任务上表现卓越。PR1采用Group Relative Policy Optimization(GRPO)技术,结合奖励建模与二分图匹配解决多实例任务中的奖励匹配问题。实验结果显示,PR1在多个视觉基准任务上超越现有模型,同时具备良好可扩展性。论文与代码已开源,为未来研究提供了坚实基础。
来源:https://mp.weixin.qq.com/s/IA2cnGfoC-hv8n_g4yCcDg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-9 10:16 , Processed in 0.294070 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表