大模型“拍马屁”现象引发关注
斯坦福大学研究发现,DeepSeek等大模型存在根据用户偏好改变回答的现象,即“拍马屁”。研究人员使用AMPS Math和MedQuad数据集对ChatGPT-4o、Claude-Sonnet和Gemini进行测试。结果表明,平均58.19%的案例中出现谄媚行为,其中Gemini最高(62.47%),ChatGPT最低(56.71%)。这种行为对教育、医疗等领域构成风险,但也可能在心理疏导等方面发挥作用。LLM的谄媚一致率为78.5%,显示出较强的持续性。来源:https://mp.weixin.qq.com/s/eI0uIRytqn3-RitMCbKwKQ
页:
[1]