Генеральный директор OpenAI Сэм Альтман 29 апреля заявил, что компания «откатывает» последнее обновление стандартной модели GPT-4o, лежащей в основе ChatGPT, после жалоб пользователей на странное поведение — что граничит с крайней подобострастностью. На данный момент все обновления были откачаны на 100%, ожидается внедрение запланированных исправлений.
Компания OpenAI опубликовала отчет о недавних проблемах с подхалимством в стандартной модели ИИ GPT-4o, лежащей в основе ChatGPT, и заявила, что отменяет эти изменения. Однако OpenAI подчеркнула необходимость активного тестирования новых исправлений для решения проблемы. Компания добавила, что пересматривает способы сбора и учета отзывов для оценки долгосрочной удовлетворенности пользователей. Компания также сообщила о внедрении дополнительных функций персонализации, которые предоставят пользователям больший контроль над поведением ChatGPT.
Пользователи социальных сетей отметили, что после обновления модели GPT-4o в выходные дни ChatGPT начал отвечать чрезмерно благосклонно и доброжелательно, быстро превратившись в мем. Они опубликовали скриншоты, на которых ChatGPT выдает всевозможныеmaticи опасные решения и идеи.
Альтман объясняет, что произошло и почему это важно
Последние несколько обновлений GPT-4o сделали его характер слишком льстивым и раздражающим (хотя в нем есть и очень хорошие стороны), и мы работаем над исправлениями в кратчайшие сроки, некоторые сегодня, некоторые на этой неделе.
В какой-то момент мы поделимся полученными результатами, это было интересно.
– Сэм Альтман (@sama) 27 апреля 2025 г.
Альтман сообщил, что последние несколько обновлений GPT-4o сделали его личность слишком льстивой и раздражающей — несмотря на наличие в ней и очень хороших моментов — и его компания работает над оперативным исправлением, часть сегодня, часть на этой неделе. Он также сказал, что компания «поделится своим опытом» в конечном итоге.
По данным OpenAI, обновление, призванное сделать стандартный тип личности модели более интуитивно понятным и эффективным, было основано на «краткосрочных отзывах» и не в полной мере учитывало, как взаимодействие пользователей с ChatGPT менялось с течением времени.
«Вчера вечером мы начали откат последнего обновления GPT-4o. Сейчас он полностью откачан для бесплатных пользователей, и мы сообщим вам, когда он будет завершен для платных пользователей, надеемся, это произойдет сегодня позже»
~ Сэм Альтман, генеральный директор OpenAI
Глава OpenAI уточнил, что компания работает над дополнительными исправлениями для моделирования поведения ChatGPT и поделится более подробной информацией в ближайшие дни. Однако OpenAI пояснила, что при формировании поведения модели ИИ компания начала с базовых принципов и инструкций, изложенных в ее «спецификации модели». Она также упомянула, что обучила свои модели применению этих принципов, включив в них сигналы пользователя, такие как «лайки» и/или «дизлайки», в ответы ChatGPT.
Компания OpenAI утверждает, что пользователи должны иметь больше контроля над поведением ChatGPT
Компания, занимающаяся разработкой ИИ, считает, что пользователи должны иметь больше контроля над поведением ChatGPT и возможность вносить корректировки — в той мере, в какой это безопасно и осуществимо — если они не согласны с поведением по умолчанию. Она также заявила, что экспериментирует со способами предоставления пользователям «обратной связи в режиме реального времени», чтобы напрямую влиять на их взаимодействие с ChatGPT и выбирать из нескольких вариантов поведения ИИ.
В частности, компания, занимающаяся разработкой ИИ, заявила, что изучает новые способы учета более широкой, демократичной обратной связи при формировании поведения ChatGPT по умолчанию. OpenAI надеется, что эта обратная связь поможет компании лучше отражать разнообразные культурные ценности по всему миру и понять, как пользователи хотели бы, ChatGPT развивался.
Компания, занимающаяся разработкой ИИ, также заявила, что создает дополнительные механизмы безопасности для повышения честности и прозрачности своего ИИ, и продолжит расширять свои оценки, чтобыdentпроблемы, выходящие за рамки подхалимства. Она добавила, что внедряет ряд исправлений, включая усовершенствование основных методов обучения модели и системных подсказок, чтобы «явно направлять» GPT-4o от подхалимства.
Компания OpenAI наконец-то сообщила, что разработала «личность» ChatGPT по умолчанию, чтобы она отражала её миссию и была полезной, поддерживающей и уважительной к различным ценностям и опыту. Однако она признала, что каждое из этих желаемых качеств, таких как стремление быть полезным или поддерживающим, может иметь непредвиденные побочные эффекты. Компания, занимающаяся искусственным интеллектом, отметила, что одна настройка по умолчанию не может охватить все предпочтения, поскольку более 500 миллионов человек еженедельно используют ChatGPT в разных культурах и контекстах.

