开源复现o3图像思考！快手让AI不再被动看图，模型自主生成代码调用工具

周大发表于 2025-8-21 13:56:43

Kwai Keye团队推出多模态新范式Thyme，通过代码生成与执行实现“超越图像思考”，具备图像处理与复杂计算能力。采用SFT+RL两阶段训练策略，结合约50万样本与1万高难度标注数据，训练耗时超1200 GPU小时。Thyme在近20项基准测试中表现优异，尤其在高分辨率图像与复杂推理任务中显著优于现有模型，并有效减少幻觉现象。所有数据与代码已开源，推动多模态领域发展。
来源：https://mp.weixin.qq.com/s/qCrM-7yrTELVEszc7AAFUg

		自动登录	找回密码
密码			立即注册

课程导航

开源复现o3图像思考！快手让AI不再被动看图，模型自主生成代码调用工具