OpenAI, ein renommiertes Unternehmen für künstliche Intelligenz, hat kürzlich sein neuestes Tool, den „GPTBot“, vorgestellt, der für Web-Crawling-Zwecke entwickelt wurde und möglicherweise den Weg für Verbesserungen in zukünftigen Iterationen seiner ChatGPT-Modelle ebnet.
In einem kürzlich erschienenen Blogbeitrag kündigte OpenAI die Einführung des GPTBot an und hob dessen Potenzial zur Verbesserung zukünftiger Versionen von ChatGPT hervor. Die Hauptfunktion des Tools besteht im Web-Crawling, einem Prozess, bei dem ein Bot, oft auch Web-Spider genannt, Website-Inhalte im gesamten Internet indexiert. Dies ermöglicht es Suchmaschinen wie Google und Bing, relevante Websites in ihren Suchergebnissen anzuzeigen.
OpenAI erklärte , dass GPTBot so konzipiert ist, dass es öffentlich zugängliche Informationen aus verschiedenen Webquellen sammelt. Es ist jedoch so programmiert, dass Inhalte hinter Bezahlschranken, Quellen mit personenbezogenen Daten und Texte, die gegen die Richtlinien von OpenAI verstoßen, ausgeschlossen werdendentWebsite-Betreiber können die Crawling-Aktivitäten von GPTBot weiterhin unterbinden, indem sie einen „Disallow“-Befehl in eine Standarddatei auf ihren Servern einfügen.
Eilmeldung 🚨
— Shubham Saboo (@Saboo_Shubham_) 7. August 2023
OpenAI hat soeben GPTBot veröffentlicht, einen Webcrawler, der automatischmaticaus dem gesamten Internet sammelt.
Diese Daten werden zum Trainieren zukünftiger KI-Modelle wie GPT-4 und GPT-5 verwendet!
GPTBot stellt sicher, dass datenschutzverletzende und kostenpflichtige Quellen ausgeschlossen werden. pic.twitter.com/oR3kY4buaU
Dieses neue Web-Crawling-Projekt folgt auf OpenAIs kürzlich eingereichte Markenanmeldung für „GPT-5“, den voraussichtlichen Nachfolger des bestehenden GPT-4-Modells. Die am 18. Juli beim US-Patent- und Markenamt eingereichte Anmeldung umfasst die Verwendung des Begriffs „GPT-5“ für verschiedene KI-basierte Anwendungen, darunter Text- und Sprachkonvertierung, Audio-zu-Text-Übersetzung und Spracherkennung.
OpenAI plant das nächste Modell
Trotz der hohen Erwartungen an GPT-5 warnte Sam Altman, Gründer und CEO von OpenAI, davor, dass das Unternehmen noch weit von einem Trainingsbeginn entfernt sei. Er betonte die Notwendigkeit umfassender Sicherheitsprüfungen vor Beginn des Trainingsprozesses.
OpenAI hat eine Markenanmeldung für
— YK aka CS Dojo 📺🐦 (@ykdojo) 1. August 2023
„GPT-5“
. Diese umfasst Software für:
„die künstliche Erzeugung von menschlicher Sprache und Text“
, „die Umwandlung von Audiodateien in Text“
, „Sprach- und Spracherkennung“ sowie
„maschinelles Lernen zur Sprach- und Sprachverarbeitung“.
👀 pic.twitter.com/54aJBovDNB
Unterdessen sieht sich OpenAI zunehmenden Bedenken hinsichtlich seiner Datenerfassungspraktiken ausgesetzt, insbesondere in Bezug auf Urheberrechts- und Einwilligungsfragen. Im Juni erteilte die japanische Datenschutzbehörde OpenAI wegen der Erhebung sensibler Daten ohne entsprechende Genehmigung. Auch Italien verhängte ein vorübergehendes Nutzungsverbot für ChatGPT und warf Verstöße gegen EU-Datenschutzgesetze vor. Diese Fälle verdeutlichen die wachsende Kritik an Datenschutz und KI-Technologie.
OpenAI sah sich kürzlich einer Sammelklage von 16 Klägern gegenüber, die dem Unternehmen vorwarfen, auf private Informationen aus Nutzerinteraktionen mit ChatGPT zugegriffen zu haben. In dieser Klage, in der auch Microsoft als Beklagter genannt wird, wird argumentiert, dass beide Unternehmen, sollten sich die Vorwürfe als begründet erweisen, gegen den Computer Fraud and Abuse Act verstoßen könnten – ein Rechtsrahmen, der in der Vergangenheit häufig bei Fällen von Web-Scraping Anwendung fand.
Mit GPTBot und dem damit verbundenen Einstieg ins Web-Crawling eröffnet OpenAI neue Möglichkeiten zur Weiterentwicklung seiner KI-Modelle. Diese Entwicklungen gehen jedoch mit rechtlichen und ethischen Überlegungen einher, da die KI-Branche den Balanceakt zwischen Innovation, Datenschutz und verantwortungsvoller Datennutzung meistern muss.
OpenAI