周大 发表于 2024-7-18 15:55:37

OpenAI研究:博弈训练法提升AI答案可读性与可信度

OpenAI的一项新研究表明,大型语言模型在生成复杂答案时,如代码或数学问题,可能难以理解,增加了人类评估的难度。为解决这一问题,OpenAI采用了“证明者-验证者博弈”的训练方法,使得模型能生成既可读又易验证的答案,从而提高AI应用的可信度和效率。这种方法在优化小学数学问题解答的可读性时,使模型性能提升50%,减少了人类评估错误。未来,这种技术有望增强AI系统的可信任性和安全性。
来源:https://mp.weixin.qq.com/s/MiLYbYcYUPO9rdQjijF_tQ
页: [1]
查看完整版本: OpenAI研究:博弈训练法提升AI答案可读性与可信度