ULTIME NOTIZIE
SELEZIONATO PER TE
SETTIMANALE
RIMANI AL TOP

Le migliori analisi sul mondo delle criptovalute, direttamente nella tua casella di posta.

Un innovativo sistema di intelligenza artificiale si dimostra promettente nella verifica di software senza bug

DiBrenda KananaBrenda Kanana
Tempo di lettura: 2 minuti.
Sistema di intelligenza artificiale
  • Baldur, un sistema di intelligenza artificiale sviluppato in collaborazione con Google, automatizza le dimostrazioni matematiche per ridurre i bug del software e migliorarne la precisione.
  • Grazie alla messa a punto di modelli linguistici di grandi dimensioni, Baldur e Thor raggiungono un tasso di successo del 65,7% nella generazione di dimostrazioni.
  • Questa innovazione promette di semplificare la verifica del software e di migliorarne l'affidabilità, segnando un progresso significativo nello sviluppo di software privo di bug.

Tradizionalmente, la verifica del codice software è stata un processo laborioso che prevedeva revisioni manuali del codice o l'esecuzione del codice per identificaredent. Sebbene preziosi, questi metodi sono soggetti a errori umani e poco pratici per sistemi complessi.

Ecco Baldur, una soluzione meticolosamente progettata che sfrutta la potenza dei Large Language Model (LLM) per generarematicdimostrazionimatic. Ottimizzando gli LLM su un ampio contenutomatice sul linguaggio Isabelle/HOL utilizzato per le dimostrazioni, Baldur compie un passo da gigante verso l'automazione di quello che un tempo era un compito arduo. Il risultato? Un sistema che lavora in tandem con i dimostratori di teoremi per verificare la correttezza del codice, riducendo significativamente il margine di errore.

Al centro del successo di Baldur c'è la partnership con Thor, lo strumento responsabile della generazionematicdi prove. Thor vanta un tasso di successo del 57%, ma se abbinato a Baldur, i due raggiungono una notevole precisione del 65,7% nella generazione di prove. Questo duo dinamico, ispirato alla mitologia norrena, dimostra il potenziale della verifica del software basata sull'intelligenza artificiale.

Sfide negli LLM

Una delle principali sfide che si incontrano quando si lavora con LLM, come ChatGPT, è la loro occasionale mancanza di correttezza. Invece di destare sospetti, possono "fallire silenziosamente", fornendo risultati errati che sembrano validi. Affrontare questo problema è fondamentale per garantire l'affidabilità delle dimostrazioni generate dall'intelligenza artificiale.

Lo sviluppo di Baldur non è stata un'impresa da poco, richiedendo diversi mesi e una collaborazione con Google. Emily First, autrice principale del progetto, ha utilizzato Minerva, un modello linguistico basato su un vasto corpus di testo in linguaggio naturale. Successivamente, Minerva è stata perfezionata su un consistente dataset di 118 GB dimaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticdimostrazioni

L'approccio di Baldur alla correzione degli errori è ingegnoso. Quando ildentdi teoremi identifica un errore in una dimostrazione generata, restituisce questa informazione a Baldur, consentendo al sistema di imparare dai propri errori. Questo processo iterativo migliora l'accuratezza e l'affidabilità delle dimostrazioni, rendendolo uno strumento altamente efficace per la verifica del codice.

Un futuro promettente per il software senza bug

Sebbene ci siano margini di miglioramento, Baldur rappresenta una strada promettente per la verifica formale del software. Gli ingegneri sono ancora responsabili dello sviluppo del software, ma ora hanno un potente alleato in Baldur, in grado di automatizzare la creazione di dimostrazionimatic.

Yuriy Brun, professore presso il Manning College of Information and Computer Sciences dell'UMass Amherst, ha osservato: "Il nostro lavoro si concentra sul tentativo di automatizzare la scrittura di queste dimostrazioni. Baldur utilizza modelli linguistici di grandi dimensioni per, dato un teoremamatic, generarematicuna dimostrazione di quel teorema che un dimostratore di teoremi può quindi verificare"

Il successo di Baldur è attribuito al team dedicato che ha lavorato instancabilmente a questo progetto. Oltre a Emily First, Markus Rabe, all'epoca impiegato da Google, e Talia Ringer, professoressa associata presso l'Università dell'Illinois a Urbana Champaign, hanno dato un contributo significativo. La Defense Advanced Research Projects Agency (DARPA) e la National Science Foundation (NSF) hanno sostenuto il progetto.

Soluzioni innovative come Baldur offrono speranza in un settore tecnologico alle prese con la crescente complessità dei sistemi software. Con le capacità dell'intelligenza artificiale in continua evoluzione e maturazione, il potenziale di Baldur per portare la correttezza del software a nuovi livelli rimane promettente.

Continui a lasciare che la banca si tenga la parte migliore? Guarda il nostro video gratuito su come diventare la tua banca.

Condividi questo articolo

Disclaimer. Le informazioni fornite non costituiscono consulenza finanziaria. Cryptopolitandi declina ogni responsabilità per gli investimenti effettuati sulla base delle informazioni contenute in questa pagina. Raccomandiamotrondentdentdentdentdentdentdentdent e/o di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.

 

ALTRE NOTIZIE
INTENSIVO CRIPTOVALUTE
CORSO