ÚLTIMAS NOTÍCIAS

ao vivo O Irã abandona as negociações de paz com Trump devido aos ataques israelenses ao Líbano, derrubando os mercados

Atualizações ao vivo de 19 de junho de 2026
O bot de sanduíche mais popular do Ethereumfoi atingido e faturou US$ 7,5 milhões em uma armadilha contra o MEV

Notícias de 3 horas atrás
O CEO da Galaxy afirma que os cortes nas taxas de juros do Fed podem revitalizar Bitcoin e silenciar as críticas

Notícias de 9 horas atrás
Hackers da Namada desferem novo golpe no ecossistema Cosmos

Notícias de 13 horas atrás

SELECIONADO PARA VOCÊ

Os Estados Unidos querem vencer a corrida da IA, mas suas próprias contradições continuam a atrapalhar

14 horas atrás Tecnologia
A MGX explora a aquisição multimilionária da operadora de data centers DayOne em uma tentativa de dominar a infraestrutura de IA

20 de junho de 2026 Tecnologia
Amazon abandona cinebiografia de Sam Altman após acordo de US$ 50 bilhões com a OpenAI

19 de junho de 2026 Tecnologia

SEMANALMENTE

MANTENHA-SE NO TOPO

As melhores informações sobre criptomoedas direto na sua caixa de entrada.

Sistema inovador de IA demonstra potencial na verificação de software livre de erros

Por

Brenda Kanana

Tempo de leitura: 2 minutos - 10 de janeiro de 2024

Baldur, um sistema de IA desenvolvido em parceria com o Google, automatiza demonstrações matemáticas para reduzir erros de software e aumentar a precisão.
Ao ajustar modelos de linguagem de grande porte, Baldur e Thor alcançam uma taxa de sucesso de 65,7% na geração de provas.
Essa inovação promete simplificar a verificação de software e melhorar a confiabilidade, representando um avanço significativo no desenvolvimento de software livre de erros.

Tradicionalmente, a verificação de código de software tem sido um processo trabalhoso que envolve revisões manuais de código ou a execução do código para identificardent. Embora valiosos, esses métodos são suscetíveis a erros humanos e impraticáveis para sistemas complexos.

Apresentamos Baldur, uma solução meticulosamente projetada que aproveita o poder dos Modelos de Linguagem de Grande Porte (LLMs) para gerar demonstraçõesmaticmatic. Ao otimizar os LLMs com base em extenso conteúdomatice na linguagem Isabelle/HOL usada para as demonstrações, Baldur dá um grande passo rumo à automatização do que antes era uma tarefa árdua. O resultado? Um sistema que trabalha em conjunto com provadores de teoremas para verificar a correção do código reduz significativamente a margem de erro.

No cerne do sucesso do Baldur está a parceria com o Thor, a ferramenta responsável pela geraçãomaticde provas. O Thor ostenta uma taxa de sucesso de 57%, mas, quando combinado com o Baldur, os dois alcançam uma precisão notável de 65,7% na geração de provas. Essa dupla dinâmica, inspirada na mitologia nórdica, demonstra o potencial da verificação de software orientada por IA.

Desafios nos Mestrados em Direito

Um dos principais desafios encontrados ao trabalhar com modelos de lógica de aprendizagem (LLMs), como o ChatGPT, é a sua ocasional falta de precisão. Em vez de emitir alertas, eles podem "falhar silenciosamente", fornecendo resultados errôneos que parecem válidos. Resolver esse problema é crucial para garantir a confiabilidade das provas geradas por IA.

O desenvolvimento do Baldur não foi tarefa fácil, levando vários meses e um esforço colaborativo com o Google. Emily First, a autora principal do projeto, utilizou o Minerva, um LLM treinado em um vasto corpus de texto em linguagem natural. Posteriormente, o Minerva foi ajustado em um substancial conjunto de dados de 118 GB dematicartigosmatic. No entanto, o principal diferencial foi o ajuste fino da linguagem Isabelle/HOL, preparando o terreno para a geração de demonstrações matemáticasmatic.

A abordagem do Baldur para correção de erros é engenhosa. Quando odentde teoremas identifica um erro em uma prova gerada, ele envia essa informação de volta para o Baldur, permitindo que o sistema aprenda com seus erros. Esse processo iterativo aprimora a precisão e a confiabilidade das provas, tornando-o uma ferramenta altamente eficaz para verificação de código.

Um futuro promissor para softwares sem erros

Embora haja espaço para melhorias, o Baldur representa uma via promissora para a verificação formal de software. Os engenheiros ainda são responsáveis pelo desenvolvimento do software, mas agora contam com um poderoso aliado na forma do Baldur, capaz de automatizar a criação de provasmatic.

Yuriy Brun, professor do Manning College of Information and Computer Sciences da UMass Amherst, comentou: “Nosso trabalho se concentra em tentar automatizar a escrita dessas provas. O Baldur usa grandes modelos de linguagem para, dado um teoremamatic, gerarmaticuma prova desse teorema que um provador de teoremas pode então verificar.”

O sucesso de Baldur's Gate é atribuído à equipe dedicada que trabalhou incansavelmente neste projeto. Além de Emily First, Markus Rabe, que trabalhava no Google na época, e Talia Ringer, professora assistente da Universidade de Illinois em Urbana-Champaign, contribuíram significativamente. A Agência de Projetos de Pesquisa Avançada de Defesa (DARPA) e a Fundação Nacional de Ciência (NSF) apoiaram o projeto.

Soluções inovadoras como o Baldur oferecem esperança enquanto a indústria de tecnologia enfrenta a crescente complexidade dos sistemas de software. Com as capacidades da IA em constante evolução e amadurecimento, o potencial do Baldur para elevar a correção de software a novos patamares permanece promissor.

As mentes mais brilhantes do mundo das criptomoedas já leem nossa newsletter. Quer participar? Junte-se a elas.

Compartilhe este artigo

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Brenda Kanana

Brenda possui mais de 4 anos de experiência especializada em criptomoedas, inteligência artificial e tecnologias emergentes. Ela trabalhou na Zycrypto, Blockchain Reporter, The Coin Republic e agora, na Cryptopolitan , é sua casa. Sua formação em Sociologia pela Universidade Técnica de Mombasa a mantém em sintonia com o que seus leitores desejam.

ÍNDICE

1. Desafios nos Mestrados em Direito

2. Um futuro promissor para softwares sem erros

Compartilhe este artigo

MAIS… NOTÍCIAS

MOSTRAR TUDO

5 aplicações engenhosas do ChatGPT e o que você deve fazer a respeito

Há 3 anos, John Palmer, da área de tecnologia

93% dos líderes empresariais preferem soluções baseadas em IA para a gestão da sustentabilidade da marca, segundo a Reuters

Há 3 anos, John Palmer, da área de tecnologia

Eis como Macron apoia o ecossistema de IA vibrante e produtivo da França

Há 3 anos, Tech Glory Kaburu

A Bloomberg estima que o mercado de IA generativa atingirá US$ 1,3 trilhão até 2032

3 anos atrás, Aamir Sheikh, da área de tecnologia

O que é Base? A rede Ethereum de camada 2 lançada pela Coinbase

21 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Dogecoin vs. Bitcoin: Principais Diferenças Técnicas

20 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
O que é TVL (Valor Total Bloqueado) em criptomoedas?

14 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Como ler um white paper de criptomoedas?

13 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Ripple vs. XRP vs. XRP Ledger: Qual a diferença?

13 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
O que é uma carteira multisig em criptomoedas?

10 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes

CURSO INTENSIVO DE CRIPTOMOEDAS AVANÇADAS

Quais criptomoedas podem te fazer ganhar dinheiro?
Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
Estratégias de investimento pouco conhecidas que os profissionais utilizam
Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)