OpenAI, une entreprise renommée dans le domaine de l'intelligence artificielle, a récemment présenté son dernier outil, le « GPTBot », conçu pour l'exploration du Web, ouvrant potentiellement la voie à des améliorations dans les futures versions de ses modèles ChatGPT.
Dans un récent article de blog, OpenAI a annoncé le lancement de GPTBot, soulignant son potentiel pour améliorer les futures versions de ChatGPT. La fonction principale de cet outil est l'exploration du Web, un processus par lequel un robot, souvent appelé « araignée », indexe le contenu des sites Web sur l'immensité d'Internet. Cela permet aux moteurs de recherche comme Google et Bing d'afficher les sites Web pertinents dans leurs résultats de recherche.
OpenAI a expliqué que GPTBot est conçu pour collecter des informations accessibles au public provenant de diverses sources web. Cependant, il est programmé pour exclure les contenus payants, les sources contenant des informations personnelles identifiablesdentles textes qui contreviennent aux politiques établies par OpenAI. Il est important de noter que les propriétaires de sites web peuvent empêcher l'exploration de leur site par GPTBot en insérant une commande « disallow » dans un fichier standard sur leurs serveurs.
Information importante 🚨
– Shubham Saboo (@Saboo_Shubham_) 7 août 2023
OpenAI vient de lancer GPTBot, un robot d'exploration web conçu pour collecter automatiquementmaticdonnées sur l'ensemble d'Internet.
Ces données serviront à entraîner de futurs modèles d'IA comme GPT-4 et GPT-5 !
GPTBot garantit l'exclusion des sources portant atteinte à la vie privée et de celles accessibles uniquement par abonnement. pic.twitter.com/oR3kY4buaU
Ce nouveau projet d'exploration du Web fait suite au dépôt récent par OpenAI d'une demande de marque pour « GPT-5 », le successeur pressenti du modèle GPT-4. Cette demande, déposée auprès de l'Office américain des brevets et des marques le 18 juillet, couvre l'utilisation du terme « GPT-5 » pour diverses d'intelligence artificielle , notamment la conversion de texte et de parole, la traduction audio-texte et la reconnaissance vocale.
OpenAI prévoit un prochain modèle
Malgré l'engouement suscité par GPT-5, Sam Altman, fondateur et PDG d'OpenAI, a tenu à préciser que l'entreprise est encore loin de pouvoir entamer l'entraînement de GPT-5. Il a insisté sur la nécessité de réaliser des audits de sécurité approfondis avant de se lancer dans ce processus.
OpenAI a déposé une demande d'enregistrement de marque pour
— YK alias CS Dojo 📺🐦 (@ykdojo) 1er août 2023
« GPT-5 »
, qui inclut un logiciel permettant :
la production artificielle de parole et de texte humains
, la conversion de fichiers audio en texte,
la reconnaissance vocale
et le traitement du langage et de la parole par apprentissage automatique.
👀 pic.twitter.com/54aJBovDNB
Parallèlement, OpenAI fait face à des inquiétudes croissantes concernant ses pratiques de collecte de données, notamment en matière de droits d'auteur et de consentement. En juin, l'autorité japonaise de protection des données a adressé un avertissement à OpenAI concernant la collecte de données sensibles sans autorisation. De même, l'Italie a imposé une interdiction temporaire d'utilisation de ChatGPT, invoquant des violations du droit européen de la protection des données. Ces cas soulignent la surveillance accrue qui entoure la protection des données et les technologies d'intelligence artificielle.
OpenAI a récemment fait l'objet d'une action collective intentée par 16 plaignants qui l'accusent d'avoir accédé à des informations privées issues des interactions des utilisateurs avec ChatGPT. Cette action, qui vise également Microsoft, soutient que si les allégations sont avérées, les deux entreprises pourraient être reconnues coupables d'infraction à la loi américaine sur la fraude et les abus informatiques (Computer Fraud and Abuse Act), un cadre juridique historiquement appliqué aux affaires d'extraction de données web.
Avec GPTBot, OpenAI s'aventure dans le domaine de l'exploration du Web, ouvrant ainsi de nouvelles perspectives pour le perfectionnement de ses modèles d'IA. Toutefois, ces développements s'accompagnent de considérations juridiques et éthiques, le secteur de l'IA devant trouver un équilibre délicat entre innovation, respect de la vie privée et utilisation responsable des données.
OpenAI