Meta发布Sapiens视觉模型，让AI分析和理解图片、视频中人类动作

周大发表于 2024-8-25 14:17:22

Meta Reality实验室发布AI视觉模型Sapiens，涵盖二维姿势预估、身体部位分割、深度估计及表面法线预测四大功能。该模型参数规模大，采用视觉转换器架构，能在1K分辨率下运行并轻松调整。经过大规模预训练后，在有限或合成数据条件下依然保持出色的泛化性能。
来源：https://tech.ifeng.com/c/8cJDW9budjo

页: [1]

靠浦ai课堂's Archiver

Meta发布Sapiens视觉模型，让AI分析和理解图片、视频中人类动作