周大 发表于 2024-8-25 14:17:22

Meta发布Sapiens视觉模型,让AI分析和理解图片、视频中人类动作

Meta Reality实验室发布AI视觉模型Sapiens,涵盖二维姿势预估、身体部位分割、深度估计及表面法线预测四大功能。该模型参数规模大,采用视觉转换器架构,能在1K分辨率下运行并轻松调整。经过大规模预训练后,在有限或合成数据条件下依然保持出色的泛化性能。
来源:https://tech.ifeng.com/c/8cJDW9budjo
页: [1]
查看完整版本: Meta发布Sapiens视觉模型,让AI分析和理解图片、视频中人类动作