ULTIME NOTIZIE

Ethereum Foundation prolunga la serie di vendite di ETH mentre Bitmine continua ad acquistare sui ribassi

2 ore fa Notizie
Hong Kong promuove le stablecoin con licenza lanciando una piattaforma antifrode basata sull'intelligenza artificiale

2 ore fa Notizie
Perché le azioni di GameStop sono improvvisamente aumentate del 13%?

4 ore fa Attività commerciale
L'utilizzo delle stablecoin è in forte espansione, ma JPMorgan afferma che le dimensioni non sono tutto

5 ore fa Economia

SELEZIONATO PER TE

SETTIMANALE

RIMANI AL TOP

Le migliori analisi sul mondo delle criptovalute, direttamente nella tua casella di posta.

Tecnologia

Un innovativo sistema di intelligenza artificiale si dimostra promettente nella verifica di software senza bug

Brenda Kanana

Tempo di lettura: 2 minuti. 10 gennaio 2024.

Baldur, un sistema di intelligenza artificiale sviluppato in collaborazione con Google, automatizza le dimostrazioni matematiche per ridurre i bug del software e migliorarne la precisione.
Grazie alla messa a punto di modelli linguistici di grandi dimensioni, Baldur e Thor raggiungono un tasso di successo del 65,7% nella generazione di dimostrazioni.
Questa innovazione promette di semplificare la verifica del software e di migliorarne l'affidabilità, segnando un progresso significativo nello sviluppo di software privo di bug.

Tradizionalmente, la verifica del codice software è stata un processo laborioso che prevedeva revisioni manuali del codice o l'esecuzione del codice per identificaredent. Sebbene preziosi, questi metodi sono soggetti a errori umani e poco pratici per sistemi complessi.

Ecco Baldur, una soluzione meticolosamente progettata che sfrutta la potenza dei Large Language Model (LLM) per generarematicdimostrazionimatic. Ottimizzando gli LLM su un ampio contenutomatice sul linguaggio Isabelle/HOL utilizzato per le dimostrazioni, Baldur compie un passo da gigante verso l'automazione di quello che un tempo era un compito arduo. Il risultato? Un sistema che lavora in tandem con i dimostratori di teoremi per verificare la correttezza del codice, riducendo significativamente il margine di errore.

Al centro del successo di Baldur c'è la partnership con Thor, lo strumento responsabile della generazionematicdi prove. Thor vanta un tasso di successo del 57%, ma se abbinato a Baldur, i due raggiungono una notevole precisione del 65,7% nella generazione di prove. Questo duo dinamico, ispirato alla mitologia norrena, dimostra il potenziale della verifica del software basata sull'intelligenza artificiale.

Sfide negli LLM

Una delle principali sfide che si incontrano quando si lavora con LLM, come ChatGPT, è la loro occasionale mancanza di correttezza. Invece di destare sospetti, possono "fallire silenziosamente", fornendo risultati errati che sembrano validi. Affrontare questo problema è fondamentale per garantire l'affidabilità delle dimostrazioni generate dall'intelligenza artificiale.

Lo sviluppo di Baldur non è stata un'impresa da poco, richiedendo diversi mesi e una collaborazione con Google. Emily First, autrice principale del progetto, ha utilizzato Minerva, un modello linguistico basato su un vasto corpus di testo in linguaggio naturale. Successivamente, Minerva è stata perfezionata su un consistente dataset di 118 GB dimaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticdimostrazioni

L'approccio di Baldur alla correzione degli errori è ingegnoso. Quando ildentdi teoremi identifica un errore in una dimostrazione generata, restituisce questa informazione a Baldur, consentendo al sistema di imparare dai propri errori. Questo processo iterativo migliora l'accuratezza e l'affidabilità delle dimostrazioni, rendendolo uno strumento altamente efficace per la verifica del codice.

Un futuro promettente per il software senza bug

Sebbene ci siano margini di miglioramento, Baldur rappresenta una strada promettente per la verifica formale del software. Gli ingegneri sono ancora responsabili dello sviluppo del software, ma ora hanno un potente alleato in Baldur, in grado di automatizzare la creazione di dimostrazionimatic.

Yuriy Brun, professore presso il Manning College of Information and Computer Sciences dell'UMass Amherst, ha osservato: "Il nostro lavoro si concentra sul tentativo di automatizzare la scrittura di queste dimostrazioni. Baldur utilizza modelli linguistici di grandi dimensioni per, dato un teoremamatic, generarematicuna dimostrazione di quel teorema che un dimostratore di teoremi può quindi verificare"

Il successo di Baldur è attribuito al team dedicato che ha lavorato instancabilmente a questo progetto. Oltre a Emily First, Markus Rabe, all'epoca impiegato da Google, e Talia Ringer, professoressa associata presso l'Università dell'Illinois a Urbana Champaign, hanno dato un contributo significativo. La Defense Advanced Research Projects Agency (DARPA) e la National Science Foundation (NSF) hanno sostenuto il progetto.

Soluzioni innovative come Baldur offrono speranza in un settore tecnologico alle prese con la crescente complessità dei sistemi software. Con le capacità dell'intelligenza artificiale in continua evoluzione e maturazione, il potenziale di Baldur per portare la correttezza del software a nuovi livelli rimane promettente.

Continui a lasciare che la banca si tenga la parte migliore? Guarda il nostro video gratuito su come diventare la tua banca.

Condividi questo articolo

Disclaimer. Le informazioni fornite non costituiscono consulenza finanziaria. Cryptopolitandi declina ogni responsabilità per gli investimenti effettuati sulla base delle informazioni contenute in questa pagina. Raccomandiamotrondentdentdentdentdentdentdentdent e/o di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.

Brenda Kanana

Brenda è una scrittrice con tre anni di esperienza, specializzata in criptovalute, intelligenza artificiale e tecnologie emergenti. Si è laureata in Sociologia presso la Technical University di Mombasa. Ha lavorato presso Zycrypto e Cryptopolitan.

INDICE

1. Sfide negli LLM

2. Un futuro promettente per il software senza bug

Condividi questo articolo

ALTRE NOTIZIE

MOSTRA TUTTO

5 ingegnose applicazioni di ChatGPT e cosa dovresti fare al riguardo

3 anni fa Tech John Palmer

Il 93% dei leader aziendali preferisce soluzioni basate sull'intelligenza artificiale per la gestione della sostenibilità del marchio, Reuters

3 anni fa Tech John Palmer

L'ecosistema dell'intelligenza artificiale in Francia

Ecco come Macron sostiene l'ecosistema di intelligenza artificiale francese, dinamico e produttivo

3 anni fa Tech Glory Kaburu

Bloomberg stima che il mercato dell'intelligenza artificiale generativa raggiungerà 1,3 trilioni di dollari entro il 2032

3 anni fa Tech Aamir Sheikh

Cos'è Base? La rete Ethereum Layer-2 lanciata da Coinbase

21 ottobre 2025 Impara le criptovalute: guide per principianti
Dogecoin vs. Bitcoin: differenze tecniche chiave

20 ottobre 2025 Impara le criptovalute: guide per principianti
Cos'è il TVL (valore totale bloccato) nelle criptovalute?

14 ottobre 2025 Impara le criptovalute: guide per principianti
Come leggere un whitepaper sulle criptovalute?

13 ottobre 2025 Impara le criptovalute: guide per principianti
Ripple vs. XRP vs. XRP Ledger: qual è la differenza?

13 ottobre 2025 Impara le criptovalute: guide per principianti
Cos'è un portafoglio multisig in criptovaluta?

10 ottobre 2025 Impara le criptovalute: guide per principianti

INTENSIVO CRIPTOVALUTE
CORSO

Quali criptovalute possono farti guadagnare
Come rafforzare la sicurezza del tuo portafoglio digitale (e quali sono quelli davvero validi)
Strategie di investimento poco conosciute utilizzate dai professionisti
Come iniziare a investire in criptovalute (quali piattaforme di scambio utilizzare, le migliori criptovalute da acquistare, ecc.)