Meta发布Sapiens视觉模型,让AI分析和理解图片、视频中人类动作

[复制链接]
周大 发表于 2024-8-25 14:17:22 | 显示全部楼层 |阅读模式
Meta Reality实验室发布AI视觉模型Sapiens,涵盖二维姿势预估、身体部位分割、深度估计及表面法线预测四大功能。该模型参数规模大,采用视觉转换器架构,能在1K分辨率下运行并轻松调整。经过大规模预训练后,在有限或合成数据条件下依然保持出色的泛化性能。
来源:https://tech.ifeng.com/c/8cJDW9budjo

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-18 17:46 , Processed in 0.297494 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表