Nell’attuale contesto di notizie false, fatti alternativi, fonti non verificate e semplici bugie, può essere estremamente difficile fidarsi di ciò che viene pubblicato. Tuttavia, questo problema va ben oltre le notizie politiche o le storie di campagna pubblicitaria. Ci troviamo in un ambiente in cui disponiamo di più dati che mai, ci affidiamo a più dati che mai, ma la nostra capacità di verificare che i dati sia estesa ben oltre i suoi limiti.
La promessa e il problema con i dati
Il settore dell’intelligenza artificiale, in particolare, ha aumentato notevolmente la nostra voglia di dati. Anche se potremmo sempre utilizzare l’analisi statistica sui dati per ottenere determinate informazioni, l’intelligenza artificiale ci ha dato quello che sembra un potere illimitato, se solo avessimo i dati giusti per addestrare un algoritmo. Dato il corretto insieme di dati di addestramento, un algoritmo di intelligenza artificiale può classificare diverse categorie di dati, comedentun prodotto in base a una foto. Può utilizzare i dati per prevedere cose che sarebbero impossibili da scoprire per gli esseri umani: prevedere comportamenti fraudolenti sul tuo conto bancario, quanto tempo impiegherà un pacco ad arrivare e se un'altra macchina si scontrerà con il tuo veicolo a guida automatica. Può ottimizzare un problema in base ai dati, ad esempio razionalizzando una fabbrica, adattando tutti gli appuntamenti in base ai vincoli del programma e uniformando i movimenti di un robot. Con dati sufficienti, un algoritmo AI come un modello linguistico di grandi dimensioni, come quello presente in ChatGPT e modelli simili, può rispondere ad un’ampia gamma di domande, spesso con una precisione sorprendentemente elevata. In pochi anni ci siamo ritrovati completamentedent dall’intelligenza artificiale perché ne stiamo ancora scoprendo le capacità (e i limiti).
Come hai notato, il denominatore comune qui sono i dati . Il problema, tuttavia, è che disporre semplicemente di dati non è sufficiente per costruire un algoritmo di intelligenza artificiale adeguato. Creare un modello di IA efficace è in realtà molto più complesso e difficile di quanto possa sembrare. È necessaria molta esperienza per selezionare l'algoritmo giusto, modificare le manopole e le leve giuste (chiamate iperparametri) e addestrare/testare il modello per garantire che si comporti come dovrebbe. Affinché tutto ciò funzioni, lo sviluppatore deve creare o raccogliere il giusto tipo di dati da utilizzare per la formazione, etichettarli dove necessario e convalidare che siano corretti. La quantità di dati necessari varia ma può essere piuttosto ampia, soprattutto se il modello deve prendere decisioni complesse, scegliendo tra molte categorie diverse o se ha bisogno di identificare dent molto piccoli (come trovare difetti microscopici in un prodotto, ad esempio).
Il fatto è che essere in grado di creare i giusti algoritmi di intelligenza artificiale sta diventando sempre più facile, mentre trovare (o creare) i dati giusti per addestrare il modello sta diventando sempre più difficile man mano che i problemi che vogliamo risolvere diventano più complessi, i dati richiesti sono ampio e complesso, oppure abbiamo i dati ma la loro validità è dubbia. Cosa si può fare per raccogliere e convalidare questi trilioni e trilioni di dati? Diamo un'occhiata a questo problema ed esploriamo perché gli attributi chiave della blockchain possono offrire una soluzione, con piattaforme come Synesis One che già mostrano una promessa significativa nel mobilitare una grande forza di persone utilizzando la decentralizzazione.
Il settore della raccolta dati
Per raccogliere correttamente i dati necessari per un modello di intelligenza artificiale, devi prima capire quale problema stai cercando di risolvere. Da un lato di questo settore ci sono aziende, organizzazioni e persino individui con problemi da risolvere. Per trovare o creare i dati giusti, devono essere in grado di articolare ciò che stanno cercando di risolvere con dettagli sufficienti affinché gli esperti di dati possano capire quale tipo di dati, quale tipo di etichettatura o convalida e quanto di essi è necessario. Idealmente, queste entità comunicherebbero il loro problema e il tipo di dati di cui hanno bisogno. Se si trattasse di qualcosa come un rapporto o un’analisi, potresti utilizzare la consolidata gig economy per trovare qualcuno qualificato per il lavoro. La sfida è che con i set di dati necessari per l’intelligenza artificiale, spesso si tratta di un lavoro molto più grande di quanto una persona possa gestire. Tuttavia, i singoli elementi di solito non sono difficili, nella maggior parte dei casi non richiedono formazione e possono essere suddivisi in incrementi di un singolo punto dati. Questo è l'ideale per diffondere il lavoro a molte persone diverse. Se molte persone riescono ciascuna a raccogliere o creare un piccolo numero di punti dati in modo affidabile, quindi eventualmente etichettare i dati se necessario utilizzando alcune linee guida di base, l'entità che cerca di risolvere il problema avrà tutto ciò di cui ha bisogno per iniziare.
Decentralizzazione al lavoro
È qui che la blockchain, e in particolare la decentralizzazione, è perfetta. Come accennato in precedenza, Synesis One e altre aziende Web3 emergenti stanno creando un intero settore di creazione, raccolta e convalida dei dati. La Blockchain è perfetta perché consente aitracintelligenti di automatizzare il processo, permette ai partecipanti di essere quasi ovunque in tutto il mondo (aumentando le probabilità che le persone risolvano il problema) e consente persino il pagamento sotto forma di criptovaluta, che è in gran parte senza confini. Il risultato? Molte persone diverse seguono le istruzioni di base per creare o trovare i dati giusti, convalidarli, eseguire alcune revisioni tra pari se necessario (per garantire che tutti stiano svolgendo correttamente il lavoro) e impacchettarli in un set di dati gradevole e pronto all'uso.
Sebbene il concetto possa sembrare abbastanza elementare, per la comunità dell’intelligenza artificiale è, in effetti, rivoluzionario. Le limitazioni dei dati sono state a lungo una maledizione per gli sviluppatori di intelligenza artificiale in tutto il mondo, con gli sviluppatori spesso incapaci di creare questi set di dati da soli e senza le risorse per assumere direttamente le persone per portare a termine il lavoro. Solo attraverso un sistema ultra efficiente come il decentramento è possibile reclutare molte persone diverse che possono contribuire ciascuna con una piccola somma, essere ricompensate per i loro sforzi e tutte aggiungere alla pila che alla fine diventa dati utilizzabili.
La popolazione generale, compresi coloro che lavorano nel settore tecnologico, non capisce quanto lavoro umano e quanto input siano necessari sul lato dei dati dell’intelligenza artificiale affinché i grandi modelli funzionino così bene come fanno ora. @Lempheter fa un ottimo lavoro in questo thread abbattendo alcuni colli di bottiglia nel... https://t.co/FFO3sAO3fr
— Synesis One (@synesis_one) 2 maggio 2024
Qual è il prossimo?
Con uno dei principali colli di bottiglia del progresso dell’IA potenzialmente risolto, il mercato dei dati decentralizzati servirà ad accelerare l’accelerazione dell’IA nella nostra vita quotidiana, rendendo allo stesso tempo l’AI utilizzabile e personalizzata più accessibile alle piccole imprese e persino ai singoli individui. Vedremo sicuramente questo settore espandersi, se non esplodere, nel prossimo futuro, fornendo un importante caso d'uso nel Web3 completamente separato da DeFi, NFT o qualsiasi altro utilizzo "hype" a cui il grande pubblico pensa quando sente il termine “blockchain”. Con un po’ di fortuna, potrebbero iniziare a pensare alla blockchain come al maggiore impulso di cui ha bisogno il settore dell’intelligenza artificiale.