ÚLTIMAS NOTICIAS

vivir Irán cancela las conversaciones de paz con Trump por los ataques israelíes contra el Líbano, lo que provoca una caída en los mercados

Actualizaciones en vivo del 19 de junio de 2026
El bot de sándwiches más popular de Ethereumfue estafado con 7,5 millones de dólares en una trampa contra MEV

Hace 3 horas Noticias
El director ejecutivo de Galaxy afirma que los recortes de tipos de interés de la Reserva Federal podrían reactivar Bitcoin y acallar a los críticos

Noticias de hace 9 horas
Los hackers de Nombreda asestan un nuevo golpe al ecosistema Cosmos

Noticias de hace 13 horas

SELECCIONADO PARA TI

SEMANALMENTE

MANTÉNGASE EN LA CIMA

Los mejores análisis sobre criptomonedas directamente en tu bandeja de entrada.

Un innovador sistema de IA se muestra prometedor en la verificación de software libre de errores

Por

Brenda Kanana

Lectura de 2 minutos. 10 de enero de 2024.

Baldur, un sistema de inteligencia artificial desarrollado con Google, automatiza las pruebas matemáticas para reducir errores de software y mejorar la precisión.
Al ajustar modelos de lenguaje grandes, Baldur y Thor logran una tasa de éxito del 65,7 % en la generación de pruebas.
Este avance promete agilizar la verificación de software y mejorar la confiabilidad, lo que marca un avance significativo en el desarrollo de software libre de errores.

Tradicionalmente, la verificación del código de software ha sido un proceso laborioso que implica revisiones manuales del código o su ejecución para identificardent. Si bien son valiosos, estos métodos son susceptibles a errores humanos y poco prácticos para sistemas complejos.

Presentamos Baldur, una solución meticulosamente diseñada que aprovecha el poder de los Modelos de Lenguaje Grande (LLM) para generar demostracionesmaticautomáticamente. Al optimizar los LLM con un amplio contenidomaticy el lenguaje Isabelle/HOL utilizado para las demostraciones, Baldur da un gran paso hacia la automatización de lo que antes era una tarea ardua. ¿El resultado? Un sistema que trabaja en conjunto conmaticde teoremas para verificar la corrección del código, lo que reduce significativamente el margen de error.

La clave del éxito de Baldur reside en su colaboración con Thor, la herramienta responsable de la generaciónmaticde pruebas. Thor presume de una tasa de éxito del 57 %, pero al combinarse con Baldur, ambos alcanzan una notable precisión del 65,7 % en la generación de pruebas. Este dúo dinámico, inspirado en la mitología nórdica, demuestra el potencial de la verificación de software basada en IA.

Desafíos en los LLM

Uno de los principales desafíos al trabajar con LLM, como ChatGPT, es su ocasional imprecisión. En lugar de alertar, pueden fallar silenciosamente, generando resultados erróneos que parecen válidos. Abordar este problema es crucial para garantizar la fiabilidad de las pruebas generadas por IA.

El desarrollo de Baldur no fue tarea fácil, requirió varios meses y un esfuerzo conjunto con Google. Emily First, la autora principal del proyecto, empleó Minerva, un modelo de lenguaje natural (LLM) entrenado con un vasto corpus de texto en lenguaje natural. Posteriormente, Minerva se perfeccionó con un conjunto de datos sustancial de 118 GB dematicartículos matemáticos y científicos, así como contenido web con expresiones matemáticasmaticembargo, el factor clave fue el perfeccionamiento del lenguaje Isabelle/HOL, sentando las bases para la generación de demostraciones matemáticasmatic.

El enfoque de Baldur para la corrección de errores es ingenioso. Cuando eldentde teoremas identifica un error en una prueba generada, retroalimenta esta información a Baldur, lo que permite que el sistema aprenda de sus errores. Este proceso iterativo mejora la precisión y la fiabilidad de las pruebas, convirtiéndolo en una herramienta muy eficaz para la verificación de código.

Un futuro prometedor para el software libre de errores

Si bien hay margen de mejora, Baldur representa una vía prometedora para la verificación formal de software. Los ingenieros siguen siendo responsables del desarrollo del software, pero ahora cuentan con un poderoso aliado en Baldur, capaz de automatizar la creación dematicmatemáticas.

Yuriy Brun, profesor de la Facultad Manning de Información y Ciencias de la Computación de la Universidad de Massachusetts Amherst, comentó: «Nuestro trabajo se centra en intentar automatizar la escritura de estas demostraciones. Baldur utiliza grandes modelos de lenguaje para, dado un teoremamatic, generarmaticuna demostración de dicho teorema que un demostrador de teoremas pueda verificar»

El éxito de Baldur se atribuye al dedicado equipo que trabajó incansablemente en este proyecto. Junto con Emily First, Markus Rabe, quien trabajaba para Google en aquel momento, y Talia Ringer, profesora adjunta de la Universidad de Illinois—Urbana Champaign, contribuyeron significativamente. La Agencia de Proyectos de Investigación Avanzada de Defensa (DARPA) y la Fundación Nacional de Ciencias (NSF) apoyaron el proyecto.

Soluciones innovadoras como Baldur ofrecen esperanza mientras la industria tecnológica se enfrenta a la creciente complejidad de los sistemas de software. Con la continua evolución y maduración de las capacidades de la IA, el potencial de Baldur para impulsar la precisión del software a nuevas cotas sigue siendo prometedor.

Las mentes más brillantes del mundo de las criptomonedas ya leen nuestro boletín. ¿Te apuntas? ¡ Únete!

Comparte este artículo

Aviso legal. La información proporcionada no constituye asesoramiento comercial. Cryptopolitanconsultar no se responsabiliza de las inversiones realizadas con base en la información proporcionada en esta página. Recomendamostronencarecidamente realizar una investigación independientedent un profesional cualificado antes de tomar cualquier decisión de inversión.

Brenda Kanana

Brenda cuenta con más de cuatro años de experiencia especializada en criptomonedas, inteligencia artificial y tecnologías emergentes. Ha trabajado en Zycrypto, Blockchain Reporter, The Coin Republic y ahora forma parte de Cryptopolitan . Su licenciatura en Sociología por la Universidad Técnica de Mombasa le permite estar al tanto de las necesidades de sus lectores.

ÍNDICE

1. Desafíos en los LLM

2. Un futuro prometedor para el software libre de errores

Comparte este artículo

MÁS… NOTICIAS

MOSTRAR TODO

5 ingeniosas aplicaciones de ChatGPT y qué debes hacer al respecto

Hace 3 años, el técnico John Palmer

El 93% de los líderes empresariales prefieren soluciones basadas en IA para la gestión de la sostenibilidad de la marca, según Reuters

Hace 3 años, el técnico John Palmer

El ecosistema de inteligencia artificial de Francia

Así apoya Macron el vibrante y productivo ecosistema de IA de Francia

Hace 3 años Tech Glory Kaburu

Bloomberg estima que el mercado de IA generativa alcanzará los 1,3 billones de dólares en 2032

Hace 3 años, Tech Aamir Sheikh

¿Qué es Base? La red de capa 2 Ethereum lanzada por Coinbase

21 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
Dogecoin vs. Bitcoin: Diferencias técnicas clave

20 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
¿Qué es TVL (valor total bloqueado) en criptomonedas?

14 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
¿Cómo leer un documento técnico sobre criptomonedas?

13 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
Ripple vs. XRP vs. XRP Ledger: ¿Cuál es la diferencia?

13 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
¿Qué es una billetera multifirma en criptomonedas?

10 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes

CURSO INTENSIVO DE CRIPTOMONEDAS PROFUNDAS

¿Qué criptomonedas pueden hacerte ganar dinero?
Cómo mejorar tu seguridad con una billetera (y cuáles realmente vale la pena usar)
Estrategias de inversión poco conocidas que utilizan los profesionales
Cómo empezar a invertir en criptomonedas (qué plataformas de intercambio usar, las mejores criptomonedas para comprar, etc.)