Was ist Retrieval-Augmented Generation, oder RAG?

- Retrieval-augmented generation ist ein Prozess des Abrufens von Fakten aus externen Quellen.
- Es dient dazu, LLMs auf aktuellen und authentischen Wissensgrundlagen zu basieren und ermöglicht Benutzern die Querverifizierung.
- RAG ist hilfreich, um die Trainingskosten von KI-Modellen zu senken, da es den Bedarf an kontinuierlichem Training verringert.
Die Genauigkeit und Zuverlässigkeit von generativen KI-Modellen kann durch Fakten aus externen Quellen verbessert werden; die Technik, die zum Abrufen dieser Fakten verwendet wird, heißt Retrieval-Augmented Generation (RAG).
Vereinfacht gesagt, kann ein gutes großes Sprachmodell (LLM) eine Vielzahl menschlicher Anfragen beantworten. Für glaubwürdige Antworten müssen jedoch Quellenangaben enthalten sein. Hierfür muss das Modell recherchieren und benötigt daher Unterstützung. Dieser unterstützende Prozess wird der Einfachheit halber als Retrieval-Augmented Generation (RAG) bezeichnet.
Verständnis der abrufgestützten Generierung, oder RAG
Um RAG besser zu verstehen, schließt es die Lücken, die in den Arbeiten zu Sprachmodellen bereits bestehen. Die Qualität oder Leistungsfähigkeit eines Sprachmodells wird an der Anzahl seiner Parameter gemessen. Parameter sind im Grunde die allgemeinen Muster, wie wir Menschen Wörter verwenden, um Sätze zu bilden. Sprachmodelle können in ihren Antworten inkonsistent sein.
Manchmal liefern sie genau die Informationen, die der Nutzer benötigt, manchmal geben sie aber auch nur zufällige Fakten und Zahlen aus den Trainingsdatensätzen aus. Wenn LLMs mitunter vage Antworten geben, als wüssten sie selbst nicht, was sie sagen, liegt das daran, dass sie tatsächlich keine Ahnung haben, was sie sagen. Wie bereits erwähnt, können LLMs zwar Wörter statistisch verknüpfen, aber sie kennen deren Bedeutung nicht.
Die Integration von RAG in LLM-basierte Chatsysteme bietet zwei wesentliche Vorteile: Sie gewährleistet, dass das Modell auf aktuelle und verlässliche Fakten zugreifen kann, und sie stellt außerdem sicher, dass die Benutzer die Glaubwürdigkeit der Aussagen des Modells überprüfen können, da sie Zugriff auf die Quellen des Modells haben.
Luis Lastras, Direktor für Sprachtechnologien bei IBM Research, sagte:
„Man möchte die Antworten eines Modells mit dem Originalinhalt vergleichen, um zu sehen, worauf die Antwort basiert.“
Quelle: IBM.
Es ergeben sich weitere Vorteile: Da RAG sein Wissen auf externe Quellen stützen kann und somit nicht ausschließlich auf die Trainingsdaten angewiesen ist, verringert sich die Wahrscheinlichkeit von Fehlinterpretationen und Datenlecks. Zudem senkt RAG die finanziellen und Rechenkosten für den Betrieb von Chatbots, da weniger neue Trainingsdaten benötigt werden.
Vorteile von LAG
Traditionell nutzten digitale Konversationsmodelle einen manuellen Dialogansatz. Sie ermittelten zunächst die Absicht des Nutzers, beschafften daraufhin die benötigten Informationen und gaben Antworten gemäß einem von den Programmierern defiallgemeinen Skript. Dieses System war in der Lage, einfache, unkomplizierte Fragen zu beantworten. Es wies jedoch Einschränkungen auf.
Die Beantwortung aller potenziellen Kundenanfragen war zeitaufwendig. Fehlte dem Nutzer ein Schritt, konnte der Chatbot die Situation nicht bewältigen und improvisieren. Dank moderner Technologie können Chatbots Nutzern jedoch personalisierte Antworten geben, ohne dass neue Skripte von Menschen geschrieben werden müssen. RAG geht sogar noch einen Schritt weiter, indem es das Modell bei neuen Inhalten beibehält und den Trainingsaufwand reduziert. Wie Lastras sagte:
„Man kann sich das Modell wie einen übereifrigen Nachwuchsmitarbeiter vorstellen, der eine Antwort herausplatzt, ohne die Fakten zu prüfen. Die Erfahrung lehrt uns, innezuhalten und zu sagen, wenn wir etwas nicht wissen. Aber LLMs müssen explizit darin geschult werden, Fragen zu erkennen, die sie nicht beantworten können.“
Quelle: IBM.
Wie wir wissen, sind Nutzerfragen nicht immer einfach, sondern können komplex, vage und umständlich sein oder Informationen erfordern, die dem Modell fehlen oder die es nicht ohne Weiteres analysieren kann. In solchen Fällen können LLMs Fehlinterpretationen hervorrufen. Durch Feinabstimmung lassen sich diese Fälle verhindern, und LLMs können so trainiert werden, dass sie in solchen Situationen die Analyse abbrechen. Dazu müssen ihnen jedoch Tausende von Beispielen solcher Fragen gefüttert werden, um sie zu erkennen.
RAG ist derzeit das beste verfügbare Modell, um LLMs auf den aktuellsten und am besten bestätigbaren Daten zu basieren und gleichzeitig den Trainingsaufwand zu reduzieren. RAG wird zudem kontinuierlich weiterentwickelt und bedarf weiterer Forschung, um bestehende Unvollkommenheiten zu beheben.
Lesen Sie Krypto-News nicht nur, sondern verstehen Sie sie. Abonnieren Sie unseren Newsletter. Er ist kostenlos.
Haftungsausschluss: Die bereitgestellten Informationen stellen keine Anlageberatung dar. Cryptopolitanübernimmt keine Haftung für Investitionen, die auf Grundlage der Informationen auf dieser Seite getätigt werden. Wirtronempfehlen dringend, vor jeder Anlageentscheidung eigene Recherchen durchzuführendent /oder einen qualifizierten Fachmann zu konsultieren

Aamir Sheikh
Aamir ist Technologiejournalist mit fast sechs Jahren Erfahrung in der Krypto- und Technologiebranche. Er absolvierte die MAJ University mit einem MBA in Finanzen und Marketing. Derzeit arbeitet er für Cryptopolitan, wo er über die neuesten Entwicklungen auf den Kryptowährungsmärkten und Preisprognosen berichtet.
CRASH-KURS
- Mit welchen Kryptowährungen kann man Geld verdienen?
- Wie Sie Ihre Sicherheit mit einer digitalen Geldbörse erhöhen können (und welche sich tatsächlich lohnen)
- Wenig bekannte Anlagestrategien, die Profis anwenden
- Wie man mit dem Investieren in Kryptowährungen beginnt (welche Börsen man nutzen sollte, welche Kryptowährung am besten zum Kauf geeignet ist usw.)















