博弈论助力提升大模型性能

[复制链接]
周大 发表于 2024-5-12 16:52:04 | 显示全部楼层 |阅读模式
麻省理工学院的研究团队为解决大模型回答问题的不一致性,创新性地引入了博弈论思想,设计出「共识博弈」策略。该方法通过让模型的生成器和判别器在游戏中相互对抗,以提升模型的准确性和内部一致性。实验结果显示,这种方法使LLaMA-7B模型的表现超越了更大规模的LLaMA-65B,并接近PaLM-540B的性能。这一研究为改进大模型提供了一种高效且低成本的新途径。
来源:https://mp.weixin.qq.com/s/Am7N1CF5miK4vOcrf1-igA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-19 22:28 , Processed in 0.288070 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表