Das KI-Unternehmen OpenAI hat angekündigt, sein Team für Modellverhalten umzustrukturieren. Berichten zufolge handelt es sich dabei um eine kleine, aber einflussreiche Gruppe von Forschern, die maßgeblich prägt, wie die KI-Modelle des Unternehmens mit Menschen interagieren.
In einem im August veröffentlichten Memo teilte Mak Chen, Forschungsleiter von OpenAI, mit, dass das Team, bestehend aus etwa 14 Forschern, in das Post-Training-Team integriert wurde. Dieses Forschungsteam ist für die Verbesserung der KI-Modelle des Unternehmens nach dem anfänglichen Vortraining zuständig. Im Zuge der Umstrukturierung berichtet das Team „Model Behavior“ nun an Max Schwarzer, den Leiter des Post-Training-Teams von OpenAI.
Berichten zufolge wechselt Joanne Jang, die Gründerin und Leiterin des Model Behavior Teams, zu OpenAI, um dort ein neues Projekt zu starten. In einem kürzlich geführten Interview erwähnte Jang, dass sie ein neues Forschungsteam namens OAI Labs aufbaut. Sie fügte hinzu, dass das Team für die „Entwicklung und den Prototypenbau neuer Schnittstellen für die Zusammenarbeit von Menschen mit KI“ verantwortlich sein wird
OpenAI reorganisiert sein Team für Modellverhalten
Das Team für Modellverhalten zählt zu den wichtigsten Forschungsgruppen von OpenAI und unterstützt das Unternehmen dabei, die Persönlichkeit seiner KI-Modelle zu formen und die sogenannte „Sycophantie“ zu reduzieren. Diese tritt auf, wenn KI-Modelle die Überzeugungen ihrer Nutzer einfach bestätigen und bestärken. Dies ist schädlich, da es Nutzern hilft, sogar ungesunde und schädliche Überzeugungen zu bestätigen, anstatt eine ausgewogene Antwort zu erhalten.
Das Team hat sich auch mit der Vermeidung politischer Voreingenommenheit in den Modellantworten befasst und OpenAI dabei unterstützt, seine Position zum Thema KI-Bewusstsein zu defi. In einer internen Mitteilung an die Mitarbeiter erwähnte Chen, dass jetzt der ideale Zeitpunkt sei, die Arbeit des OpenAI-Teams für Modellverhalten enger mit der Kernmodellentwicklung zu verknüpfen. Damit unterstreicht das Unternehmen, dass die Persönlichkeit seiner KI nun als wichtiger Faktor für die Weiterentwicklung der Technologie angesehen wird.
In den vergangenen Monaten geriet OpenAI aufgrund des Verhaltens seiner KI-Modelle in die Kritik. Nutzer protestierten heftig gegen die Persönlichkeitsänderungen an GPT-5, das laut Unternehmen zwar weniger Schmeichelei zeigte, von einigen Nutzern aber kälter wahrgenommen wurde. Die Beschwerden veranlassten OpenAI, tron Zugriff auf einige ältere Modelle, darunter GPT-40, wiederherzustellen. Zudem veröffentlichte das Unternehmen ein Update, das die Reaktionen von GPT-5 freundlicher gestalten soll, ohne die Schmeichelei zu erhöhen.
KI-Firmen sehen sich Kritik wegen Modell-Schmeichelei ausgesetzt
OpenAI und andere Entwickler von KI-Modellen müssen einen schmalen Grat beschreiten, um sicherzustellen, dass ihre Chatbots zwar freundlich, aber nicht zu unterwürfig sind. Letzten Monat verklagten die Eltern eines 16-jährigen Jungen OpenAI wegen der mutmaßlichen Rolle von ChatGPT beim Selbstmord ihres Sohnes. Laut Gerichtsakten vertraute sich der Teenager Adam Raine ChatGPT (genauer gesagt einer auf GPT-4o basierenden Version) in den Monaten vor seinem Tod bezüglich seiner Suizidpläne und -gedanken an. Die Klage wirft dem Modell vor, seine Suizidgedanken nicht widerlegt zu haben.
Das Team für Modellverhalten war seit GPT-4 an allen OpenAI-Modellen beteiligt, darunter auch GPT-5. Bevor Jang die Forschungseinheit gründete, arbeitete sie unter anderem an Dall-E 2, dem frühen Bildgenerierungstool von OpenAI. Letzte Woche gab sie auf X bekannt, dass sie das Team verlässt, um „etwas Neues bei OpenAI zu beginnen“. Die ehemalige Leiterin der Einheit für Modellverhalten war rund vier Jahre im Unternehmen.
🧪 Ich gründe OAI Labs: eine forschungsorientierte Gruppe, die sich auf die Entwicklung und das Prototyping neuer Schnittstellen für die Zusammenarbeit von Menschen mit KI konzentriert.
— Joanne Jang (@joannejang) 5. September 2025
Ich freue mich darauf, Muster zu erforschen, die uns über Chat oder sogar Agenten hinausführen – hin zu neuen Paradigmen und Instrumenten des Denkens, Gestaltens usw.
Berichten zufolge soll die Geschäftsführung der OAI Labs übernehmen, die vorerst direkt Chen unterstellt sein wird. Sie fügte jedoch hinzu, dass es noch zu früh sei und unklar sei, wie die neuartigen Schnittstellen aussehen werden. „Ich freue mich sehr darauf, Muster zu erforschen, die uns über das Chat-Paradigma hinausführen, das derzeit eher mit sozialer Interaktion verbunden ist, oder sogar über Agenten, bei denen die Autonomie im Vordergrund steht“, sagte Jang.
Jang fügte hinzu, dass sie KI-Systeme als Instrumente für vielfältige Aufgaben betrachte, darunter Vernetzung, Lernen und Denken. Auf die Frage, ob OAI Labs mit Jony Ive, dem ehemaligen Apple-Designchef, der kürzlich zu OpenAI für eine Reihe von KI-Hardwaregeräten wechselte, an neuartigen Schnittstellen zusammenarbeiten werde, erklärte Jang, sie sei offen für alle Ideen. Sie fügte jedoch hinzu, dass sie voraussichtlich mit der Forschung beginnen werde, da sie sich in diesem Bereich besser auskenne.
Foto von 