合成数据成AI热点,模型崩溃待解

[复制链接]
周大 发表于 2025-1-19 15:43:59 | 显示全部楼层 |阅读模式
随着训练数据即将耗尽,合成数据成为AI领域的热点话题。尽管面临“模型崩溃”的挑战——少量合成数据可能导致模型性能严重下降,但微软、Meta等领先机构仍采用合成数据训练旗舰模型。合成数据具备大规模生成、可定制等优势,但也存在污染训练集的风险。2024年多项研究表明,即使1%的合成数据也可能引发模型崩溃,阻碍其广泛应用。未来6-12个月内,合成数据有望在AI发展中发挥重要作用,但仍需克服模型崩溃问题。
来源:https://mp.weixin.qq.com/s/LPxWCCwETxBTrN8gMYE14Q

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-21 12:53 , Processed in 0.302396 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表