开源复现o3图像思考!快手让AI不再被动看图,模型自主生成代码调用工具

[复制链接]
周大 发表于 昨天 13:56 | 显示全部楼层 |阅读模式
Kwai Keye团队推出多模态新范式Thyme,通过代码生成与执行实现“超越图像思考”,具备图像处理与复杂计算能力。采用SFT+RL两阶段训练策略,结合约50万样本与1万高难度标注数据,训练耗时超1200 GPU小时。Thyme在近20项基准测试中表现优异,尤其在高分辨率图像与复杂推理任务中显著优于现有模型,并有效减少幻觉现象。所有数据与代码已开源,推动多模态领域发展。
来源:https://mp.weixin.qq.com/s/qCrM-7yrTELVEszc7AAFUg

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-22 04:16 , Processed in 0.300994 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表