返回
科技

用户吐槽“ChatGPT太谄媚”,OpenAI 回滚“个性化”更新

2025-04-30 13:08465

GPT-4o ChatGPT

站长之家(ChinaZ.com) 4月30日 消息:自上周以来,几乎所有用户都对 ChatGPT 的一种奇怪行为提出了抱怨。在这样的情况下,OpenAI 部署并撤回了对 ChatGPT 的一次更新。

OpenAI 在最近发布的一篇博客文章中解释了这一切。

ChatGPT 用户希望这个聊天机器人能更有人情味,并少一些刻板、少一点生硬。与 ChatGPT“公式化”的回复风格相比,不少用户们认为 Anthropic 公司的 Claude 聊天机器人的回复更有人情味。

这就是为什么 OpenAI 上周针对 GPT-4o 模型进行了一次更新,山姆・奥尔特曼(Sam Altman)称,这次更新 “提升了智能和个性”。

两天后,奥尔特曼承认了每个用户都注意到的一个问题 —— 最近几次的 GPT-4o 更新让这款聊天机器人变成得太过谄媚和烦人了。他们表示,正在努力进行修复,今天及本周内都会陆续有一些改进。

基本上,对于任何需要反馈的问题,ChatGPT 都会以极其不真诚的赞美来回应。这种情况很可笑,也让人很尴尬。

目前,OpenAI 采取的修复措施是完全回滚到上周发布的版本。

OpenAI,ChatGPT,人工智能,AI

至于发生了什么,OpenAI 将其归咎于“过于关注短期反馈而忽视了长期使用情况”。

他们表示:

在上周的 GPT-4o 更新中,我们进行了一些调整,这是为了改善模型的默认个性,让它在各种任务中感觉更直观、更有效。

在塑造模型行为时,我们从我们《模型规格》的基本原则和指令出发。同时还通过纳入用户信号 —— 比如对 ChatGPT 回复的点赞 / 点踩反馈 —— 来训练我们的模型如何应用这些原则。

然而,在这次更新中,我们过于关注短期反馈,没有充分考虑到用户与 ChatGPT 的互动应该随着时间而演变。结果,GPT-4o 倾向于给出过于肯定、但不真诚的回复。

这并不是对所发生事情最直接的解释,但 OpenAI 的四点行动计划让情况更加明晰:

  • 完善核心训练技术和系统提示,明确引导模型避免谄媚行为。

  • 建立更多的保障措施,以提高诚实性和透明度 —— 这是我们《模型规格》中的原则。

  • 拓展更多用户在部署前进行测试并给出直接反馈的途径。

  • 继续扩展我们的评估,以《模型规格》和我们正在进行的研究为基础,帮助发现除谄媚之外的其他问题。

换句话说,OpenAI 想要为 ChatGPT 塑造一个更友好、更具支持性的个性。其最新发布的更新确实符合这一描述,但有点过界了。事实证明,让聊天机器人更加个性化所需的工作量比预期的要多。

OpenAI 表示,未来它希望提供默认的个性选项,同时也能根据用户的直接反馈来塑造个性。

打赏
  • 0人打赏
    举报
关闭
同类新闻