多所高校联合发布学术视听数据集M3AV

[复制链接]
周大 发表于 2024-7-6 15:17:12 | 显示全部楼层 |阅读模式
多所高校联合发布学术视听数据集M3AV,一个包含367小时学术演讲视频的多模态数据集,涵盖了广泛的学科领域。这个数据集以其丰富的标注和多样性,推动了AI在语音识别、语音合成和学术知识理解的边界。实验结果证明,它能有效提升模型性能,尤其是在处理复杂的学术内容时。
来源:https://mp.weixin.qq.com/s/UQ2P5AFm7yhjFm2lc70O8g

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-9 03:04 , Processed in 0.274665 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表