博弈论助力提升大模型性能

周大发表于 2024-5-12 16:52:04

麻省理工学院的研究团队为解决大模型回答问题的不一致性，创新性地引入了博弈论思想，设计出「共识博弈」策略。该方法通过让模型的生成器和判别器在游戏中相互对抗，以提升模型的准确性和内部一致性。实验结果显示，这种方法使LLaMA-7B模型的表现超越了更大规模的LLaMA-65B，并接近PaLM-540B的性能。这一研究为改进大模型提供了一种高效且低成本的新途径。
来源：https://mp.weixin.qq.com/s/Am7N1CF5miK4vOcrf1-igA

		自动登录	找回密码
密码			立即注册

课程导航

博弈论助力提升大模型性能