周大 发表于 2024-7-6 15:17:12

多所高校联合发布学术视听数据集M3AV

多所高校联合发布学术视听数据集M3AV,一个包含367小时学术演讲视频的多模态数据集,涵盖了广泛的学科领域。这个数据集以其丰富的标注和多样性,推动了AI在语音识别、语音合成和学术知识理解的边界。实验结果证明,它能有效提升模型性能,尤其是在处理复杂的学术内容时。
来源:https://mp.weixin.qq.com/s/UQ2P5AFm7yhjFm2lc70O8g
页: [1]
查看完整版本: 多所高校联合发布学术视听数据集M3AV