OpenAI, una rinomata azienda di intelligenza artificiale, ha recentemente introdotto il suo ultimo strumento, "GPTBot", progettato per scopi di web crawling, aprendo potenzialmente la strada a miglioramenti nelle future iterazioni dei suoi modelli ChatGPT.
In un recente post sul blog, OpenAI ha annunciato il lancio di GPTBot, evidenziandone il potenziale per migliorare le prossime versioni di ChatGPT. La funzione principale dello strumento ruota attorno al web crawling, un processo in cui un bot, spesso definito web spider, indicizza i contenuti dei siti web nell'immensa distesa di Internet. Questo consente ai motori di ricerca come Google e Bing di visualizzare i siti web pertinenti nei loro risultati di ricerca.
OpenAI ha spiegato che GPTBot è progettato per raccogliere informazioni accessibili al pubblico da diverse fonti web. Tuttavia, è programmato per escludere i contenuti a pagamento, le fonti che contengonodente i testi che violano le politiche stabilite da OpenAI. È importante sottolineare che i proprietari dei siti web mantengono la possibilità di impedire l'attività di crawling di GPTBot inserendo un comando "disallow" in un file standard sui propri server.
Ultime notizie 🚨
— Shubham Saboo (@Saboo_Shubham_) 7 agosto 2023
OpenAI ha appena lanciato GPTBot, un web crawler progettato permaticdati da tutta Internet.
Questi dati verranno utilizzati per addestrare futuri modelli di IA come GPT-4 e GPT-5!
GPTBot garantisce l'esclusione delle fonti che violano la privacy e di quelle a pagamento. pic.twitter.com/oR3kY4buaU
Questa nuova iniziativa di web crawling fa seguito al recente deposito da parte di OpenAI di una domanda di registrazione del marchio "GPT-5", il successore designato dell'attuale modello GPT-4. Tale domanda, depositata presso l'Ufficio brevetti e marchi degli Stati Uniti il 18 luglio, riguarda l'utilizzo del termine "GPT-5" per diverse basate sull'intelligenza artificiale , tra cui la conversione di testo e parlato, la traduzione da audio a testo e il riconoscimento vocale.
OpenAI pianifica il prossimo modello
Tuttavia, nonostante l'attesa che circonda GPT-5, il fondatore e CEO di OpenAI, Sam Altman, ha avvertito che l'azienda è ancora lontana dall'avvio della formazione su GPT-5. Ha sottolineato la necessità di approfonditi audit di sicurezza prima di intraprendere il processo di formazione.
OpenAI ha depositato una domanda di registrazione del marchio per:
— YK aka CS Dojo 📺🐦 (@ykdojo) 1 agosto 2023
"GPT-5"
che include "software per":
"la produzione artificiale di parlato e testo umano"
"la conversione di file di dati audio in testo"
"il riconoscimento vocale e del parlato"
"l'elaborazione del linguaggio e del parlato basata sull'apprendimento automatico"
👀 pic.twitter.com/54aJBovDNB
Nel frattempo, OpenAI ha dovuto affrontare crescenti preoccupazioni in merito alle sue pratiche di raccolta dati, in particolare per quanto riguarda il diritto d'autore e le questioni relative al consenso. A giugno, l'autorità garante della privacy giapponese ha emesso un avvertimento a OpenAI in merito alla raccolta di dati sensibili senza la dovuta autorizzazione. Analogamente, l'Italia ha imposto un divieto temporaneo all'utilizzo di ChatGPT, sostenendo violazioni delle leggi sulla privacy dell'Unione Europea. Questi episodi mettono in luce il crescente controllo che circonda la privacy dei dati e la tecnologia dell'intelligenza artificiale.
In particolare, OpenAI ha recentemente dovuto affrontare una class action intentata da 16 querelanti che sostenevano che l'azienda avesse avuto accesso a informazioni private derivanti dalle interazioni degli utenti con ChatGPT. Questa causa, che coinvolge anche Microsoft come imputata, sostiene che, se le accuse fossero fondate, entrambe le aziende potrebbero essere ritenute colpevoli di violazione del Computer Fraud and Abuse Act, un quadro giuridico storicamente applicato ai casi di web scraping.
Con l'ingresso di OpenAI nel mondo del web crawling con GPTBot, si aprono nuove possibilità per perfezionare i propri modelli di intelligenza artificiale. Tuttavia, questi sviluppi sono accompagnati da un contesto di considerazioni legali ed etiche, mentre il settore dell'intelligenza artificiale si muove nel delicato equilibrio tra innovazione, privacy e utilizzo responsabile dei dati.
OpenAI