用户吐槽“ChatGPT太谄媚”，OpenAI 回滚“个性化”更新

GPT-4o ChatGPT

站长之家(ChinaZ.com) 4月30日消息:自上周以来，几乎所有用户都对 ChatGPT 的一种奇怪行为提出了抱怨。在这样的情况下，OpenAI 部署并撤回了对 ChatGPT 的一次更新。

OpenAI 在最近发布的一篇博客文章中解释了这一切。

ChatGPT 用户希望这个聊天机器人能更有人情味，并少一些刻板、少一点生硬。与 ChatGPT“公式化”的回复风格相比，不少用户们认为 Anthropic 公司的 Claude 聊天机器人的回复更有人情味。

这就是为什么 OpenAI 上周针对 GPT-4o 模型进行了一次更新，山姆・奥尔特曼（Sam Altman）称，这次更新 “提升了智能和个性”。

两天后，奥尔特曼承认了每个用户都注意到的一个问题 —— 最近几次的 GPT-4o 更新让这款聊天机器人变成得太过谄媚和烦人了。他们表示，正在努力进行修复，今天及本周内都会陆续有一些改进。

基本上，对于任何需要反馈的问题，ChatGPT 都会以极其不真诚的赞美来回应。这种情况很可笑，也让人很尴尬。

目前，OpenAI 采取的修复措施是完全回滚到上周发布的版本。

OpenAI，ChatGPT，人工智能，AI

至于发生了什么，OpenAI 将其归咎于“过于关注短期反馈而忽视了长期使用情况”。

他们表示：

在上周的 GPT-4o 更新中，我们进行了一些调整，这是为了改善模型的默认个性，让它在各种任务中感觉更直观、更有效。
在塑造模型行为时，我们从我们《模型规格》的基本原则和指令出发。同时还通过纳入用户信号 —— 比如对 ChatGPT 回复的点赞 / 点踩反馈 —— 来训练我们的模型如何应用这些原则。
然而，在这次更新中，我们过于关注短期反馈，没有充分考虑到用户与 ChatGPT 的互动应该随着时间而演变。结果，GPT-4o 倾向于给出过于肯定、但不真诚的回复。

这并不是对所发生事情最直接的解释，但 OpenAI 的四点行动计划让情况更加明晰：

完善核心训练技术和系统提示，明确引导模型避免谄媚行为。
建立更多的保障措施，以提高诚实性和透明度 —— 这是我们《模型规格》中的原则。
拓展更多用户在部署前进行测试并给出直接反馈的途径。
继续扩展我们的评估，以《模型规格》和我们正在进行的研究为基础，帮助发现除谄媚之外的其他问题。

换句话说，OpenAI 想要为 ChatGPT 塑造一个更友好、更具支持性的个性。其最新发布的更新确实符合这一描述，但有点过界了。事实证明，让聊天机器人更加个性化所需的工作量比预期的要多。

OpenAI 表示，未来它希望提供默认的个性选项，同时也能根据用户的直接反馈来塑造个性。