NEUESTE NACHRICHTEN

Ethereum Foundation setzt den ETH-Abverkauf fort, während Bitmine weiterhin bei Kursrückgängen zukauft

vor 2 Stunden Nachrichten
Hongkong fördert lizenzierte Stablecoins mit der Einführung einer KI-gestützten Betrugsbekämpfungsplattform

vor 2 Stunden Nachrichten
Warum ist die GameStop-Aktie plötzlich um 13 % gestiegen?

Vor 4 Stunden Geschäft
Die Nutzung von Stablecoins boomt – aber JPMorgan sagt, Größe sei nicht alles

vor 5 Stunden Wirtschaft

FÜR SIE AUSGEWÄHLT

Metas Strategie im Bereich humanoider KI wird durch den Assured Robot-Deal weiter ausgebaut

Vor 8 Stunden Technik
Japans Rechenzentrumsboom und seine Engpässe

Vor 17 Stunden · Technik
YouTube testet KI-Suchfunktion mit schrittweisen, geführten Antworten

30. April 2026 Technologie

WÖCHENTLICH

BLEIBEN SIE AN DER SPITZE

Die besten Krypto-Einblicke direkt in Ihren Posteingang.

Technik

Innovatives KI-System zeigt vielversprechende Ergebnisse bei der fehlerfreien Softwareverifizierung

Von

Brenda Kanana

Lesezeit: 2 Minuten, 10. Januar 2024

Baldur, ein gemeinsam mit Google entwickeltes KI-System, automatisiert mathematische Beweise, um Softwarefehler zu reduzieren und die Genauigkeit zu erhöhen.
Durch die Feinabstimmung großer Sprachmodelle erreichen Baldur und Thor eine Erfolgsquote von 65,7 % bei der Generierung von Beweisen.
Dieser Durchbruch verspricht eine Vereinfachung der Softwareverifizierung und eine Verbesserung der Zuverlässigkeit und stellt einen bedeutenden Fortschritt in der fehlerfreien Softwareentwicklung dar.

Traditionell die Verifizierung von Softwarecode ein arbeitsintensiver Prozess, der manuelle Code-Reviews oder das Ausführen des Codes zur IdentifizierungdentAnomalien umfasste. Obwohl diese Methoden wertvoll sind, sind sie anfällig für menschliche Fehler und für komplexe Systeme unpraktisch.

Baldur ist eine sorgfältig entwickelte Lösung, die die Leistungsfähigkeit großer Sprachmodelle (LLMs) nutzt, ummaticBeweisematiczu generieren. Durch die Feinabstimmung von LLMs anhand umfangreichermaticInhalte und der für Beweise verwendeten Sprache Isabelle/HOL gelingt Baldur ein großer Schritt hin zur Automatisierung einer ehemals mühsamen Aufgabe. Das Ergebnis? Ein System, das Hand in Hand mit Theorembeweisern arbeitet, um die Korrektheit des Codes zu überprüfen und die Fehlerquote deutlich zu senken.

Baldurs Erfolg basiert maßgeblich auf der Partnerschaft mit Thor, dem Tool zurmaticBeweisgenerierung. Thor weist eine Erfolgsquote von 57 % auf, doch in Kombination mit Baldur erreichen die beiden eine bemerkenswerte Genauigkeit von 65,7 % bei der Beweisgenerierung. Dieses dynamische Duo, inspiriert von der nordischen Mythologie, demonstriert das Potenzial KI-gestützter Softwareverifizierung.

Herausforderungen in LLMs

Eine der größten Herausforderungen bei der Arbeit mit LLMs wie ChatGPT ist deren gelegentliche Unkorrektheit. Anstatt Warnsignale auszulösen, können sie „stillschweigend versagen“ und fehlerhafte Ergebnisse liefern, die jedoch gültig erscheinen. Die Behebung dieses Problems ist entscheidend für die Zuverlässigkeit KI-generierter Beweise.

Die Entwicklung von Baldur war eine anspruchsvolle Aufgabe, die mehrere Monate und die Zusammenarbeit mit Google erforderte. Emily First, die Hauptautorin des Projekts, setzte Minerva ein, ein LLM-System, das mit einem umfangreichen Korpus natürlichsprachlicher Texte trainiert wurde. Anschließend wurde Minerva anhand eines 118 GB großen Datensatzes mathematischer und wissenschaftlicher Artikel sowie Webinhalte mit mathematischen Ausdrücken feinabgestimmtmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticgeschaffen wurde.

Baldurs Ansatz zur Fehlerkorrektur ist genial. Sobald der Theorembeweiser einen Fehler in einem generierten Beweisdent, gibt er diese Information an Baldur zurück, sodass das System aus seinen Fehlern lernen kann. Dieser iterative Prozess verbessert die Genauigkeit und Zuverlässigkeit der Beweise und macht Baldur zu einem äußerst effektiven Werkzeug zur Codeverifizierung.

Eine vielversprechende Zukunft für fehlerfreie Software

Obwohl es noch Verbesserungspotenzial gibt, stellt Baldur einen vielversprechenden Ansatz für die formale Softwareverifikation dar. Die Entwickler sind weiterhin für die Softwareentwicklung verantwortlich, haben aber mit Baldur einen leistungsstarken Verbündeten an ihrer Seite, der die ErstellungmaticBeweise automatisieren kann.

Yuriy Brun, Professor am Manning College of Information and Computer Sciences der UMass Amherst, bemerkte: „Unsere Arbeit konzentriert sich darauf, das Schreiben dieser Beweise zu automatisieren. Baldur verwendet große Sprachmodelle, um zu einem gegebenenmaticTheoremmaticeinen Beweis für dieses Theorem zu generieren, den ein Theorembeweiser dann verifizieren kann.“

Baldurs Erfolg ist dem engagierten Team zu verdanken, das unermüdlich an diesem Projekt arbeitete. Neben Emily First leisteten Markus Rabe, damals bei Google angestellt, und Talia Ringer, Assistenzprofessorin an der University of Illinois in Urbana-Champaign, einen wesentlichen Beitrag. Die Defense Advanced Research Projects Agency (DARPA) und die National Science Foundation (NSF) förderten das Projekt.

Innovative Lösungen wie Baldur geben Hoffnung in einer Zeit, in der die Technologiebranche mit der stetig wachsenden Komplexität von Softwaresystemen zu kämpfen hat. Angesichts der kontinuierlichen Weiterentwicklung und Reife der KI-Fähigkeiten bleibt das Potenzial von Baldur, die Softwarekorrektheit auf ein neues Niveau zu heben, vielversprechend.

Überlassen Sie das Beste immer noch der Bank? Sehen Sie sich unser kostenloses Video zum Thema „ Ihre eigene Bank sein“.

Diesen Artikel teilen

Haftungsausschluss. Die bereitgestellten Informationen stellen keine Anlageberatung dar. Cryptopolitan/ übernimmt keine Haftung für Investitionen, die auf Grundlage der Informationen auf dieser Seite getätigt werden. Wirtrondentdentdentdentdentdentdentdent oder einen qualifizierten Fachmann zu konsultieren

Brenda Kanana

Brenda ist Autorin mit drei Jahren Berufserfahrung und spezialisiert auf Kryptowährungen, künstliche Intelligenz und Zukunftstechnologien. Sie hat an der Technischen Universität Mombasa Soziologie studiert und war bereits bei Zycrypto und Cryptopolitantätig.

INHALTSVERZEICHNIS

1. Herausforderungen in LLMs

2. Eine vielversprechende Zukunft für fehlerfreie Software

Diesen Artikel teilen

MEHR … NACHRICHTEN

ALLE ANZEIGEN

Was ist Base? Das von Coinbase ins Leben gerufene Ethereum Layer-2-Netzwerk

21. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Dogecoin vs. Bitcoin: Wichtigste technische Unterschiede

20. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Was ist TVL (Total Value Locked) bei Kryptowährungen?

14. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Wie liest man ein Krypto-Whitepaper?

13. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Ripple vs. XRP vs. XRP Ledger: Was ist der Unterschied?

13. Oktober 2025 Krypto lernen: Leitfaden für Anfänger
Was ist eine Multisig-Wallet im Kryptobereich?

10. Oktober 2025 Krypto lernen: Leitfaden für Anfänger

DEEP CRYPTO
CRASH-KURS

Mit welchen Kryptowährungen kann man Geld verdienen?
Wie Sie Ihre Sicherheit mit einer digitalen Geldbörse erhöhen können (und welche sich tatsächlich lohnen)
Wenig bekannte Anlagestrategien, die Profis anwenden
Wie man mit dem Investieren in Kryptowährungen beginnt (welche Börsen man nutzen sollte, welche Kryptowährung am besten zum Kauf geeignet ist usw.)

Innovatives KI-System zeigt vielversprechende Ergebnisse bei der fehlerfreien Softwareverifizierung

Herausforderungen in LLMs

Eine vielversprechende Zukunft für fehlerfreie Software

5 geniale Anwendungsmöglichkeiten von ChatGPT und was Sie damit anfangen sollten

93 % der Unternehmensführer bevorzugen KI-gestützte Lösungen für das Nachhaltigkeitsmanagement von Marken, Reuters

So unterstützt Macron Frankreichs dynamisches und produktives KI-Ökosystem

Bloomberg schätzt, dass der Markt für generative KI bis 2032 ein Volumen von 1,3 Billionen US-Dollar erreichen wird

Ein prägnanter Brief.
Jeden Tag.

Innovatives KI-System zeigt vielversprechende Ergebnisse bei der fehlerfreien Softwareverifizierung

Herausforderungen in LLMs

Eine vielversprechende Zukunft für fehlerfreie Software

5 geniale Anwendungsmöglichkeiten von ChatGPT und was Sie damit anfangen sollten

93 % der Unternehmensführer bevorzugen KI-gestützte Lösungen für das Nachhaltigkeitsmanagement von Marken, Reuters

So unterstützt Macron Frankreichs dynamisches und produktives KI-Ökosystem

Bloomberg schätzt, dass der Markt für generative KI bis 2032 ein Volumen von 1,3 Billionen US-Dollar erreichen wird

Ein prägnanter Brief.Jeden Tag.

Ein prägnanter Brief.
Jeden Tag.