博弈论助力提升大模型性能
麻省理工学院的研究团队为解决大模型回答问题的不一致性,创新性地引入了博弈论思想,设计出「共识博弈」策略。该方法通过让模型的生成器和判别器在游戏中相互对抗,以提升模型的准确性和内部一致性。实验结果显示,这种方法使LLaMA-7B模型的表现超越了更大规模的LLaMA-65B,并接近PaLM-540B的性能。这一研究为改进大模型提供了一种高效且低成本的新途径。来源:https://mp.weixin.qq.com/s/Am7N1CF5miK4vOcrf1-igA
页:
[1]