Meta“分割一切”模型强势升级!“听懂人话”,处理含上百物体一张图仅需30毫秒

[复制链接]
周大 发表于 2025-11-20 15:02:23 | 显示全部楼层 |阅读模式
美东时间19日,Meta发布第三代图像分割模型SAM 3,首次实现通过自然语言或图像示例对视频中任意物体进行识别与追踪。其核心创新“可提示概念分割”打破传统标签限制,在SA-Co基准上性能翻倍,LVIS准确率达47.0。模型处理百物图像仅需30毫秒,接近实时。配套发布的SAM 3D在3D重建方面树立新标准,Objects模型重建质量胜率5:1,Body模型在复杂姿态下表现优异。借助人机协作数据引擎,标注效率提升最高5倍,构建超400万概念训练集。该技术将集成至Instagram Edits、Meta AI及Facebook Marketplace,并推动野生动物与海洋保护研究,相关数据集已向公众开放。
来源:https://tech.ifeng.com/c/8oQCfmxXkuE

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-28 00:44 , Processed in 0.260505 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表