Angesichts der heutigen Flut an Fake News, alternativen Fakten, unbestätigten Quellen und schlichten Lügen ist es extrem schwierig, dem Veröffentlichten zu vertrauen. Dieses Problem betrifft jedoch weit mehr als nur politische Nachrichten oder reißerische Meldungen. Wir befinden uns in einer Zeit, in der uns mehr Daten denn je zur Verfügung stehen und wir uns mehr denn je auf sie verlassen, unsere Fähigkeit, diese Daten zu überprüfen, aber weit über ihre Grenzen hinausgeht.
Das Versprechen und das Problem der Daten
Insbesondere die KI-Branche hat unseren Datenhunger enorm gesteigert. Zwar konnten wir Daten schon immer statistisch analysieren, um Erkenntnisse zu gewinnen, doch KI bietet uns scheinbar unbegrenzte Möglichkeiten – vorausgesetzt, wir verfügen über die richtigen Trainingsdaten. Mit den passenden Trainingsdaten kann ein KI-Algorithmus verschiedene Datenkategorien klassifizieren, beispielsweise ein Produkt anhand eines Fotosdent. Er kann Daten nutzen, um Dinge vorherzusagen, die für Menschen unmöglich wären: betrügerisches Verhalten auf Ihrem Bankkonto, die Lieferzeit eines Pakets oder die Wahrscheinlichkeit einer Kollision mit Ihrem autonomen Fahrzeug. Er kann Probleme datenbasiert optimieren, etwa die Produktion in einer Fabrik effizienter gestalten, alle Termine unter Berücksichtigung Ihrer zeitlichen Vorgaben koordinieren und die Bewegungen eines Roboters glätten. Mit genügend Daten kann ein KI-Algorithmus, wie beispielsweise ein großes Sprachmodell (wie ChatGPT und ähnliche Modelle), ein breites Spektrum an Fragen beantworten, oft mit erstaunlich hoher Genauigkeit. Innerhalb weniger Jahre sind wir völlig von KIdent geworden, da wir ihre Fähigkeiten (und Grenzen) immer noch erforschen.
Wie Sie bemerkt haben, ist der gemeinsame Nenner hier Daten . Das Problem ist jedoch, dass Daten allein nicht ausreichen, um einen brauchbaren KI-Algorithmus zu entwickeln. Die Erstellung eines effektiven KI-Modells ist tatsächlich viel komplexer und schwieriger, als es zunächst scheinen mag. Es bedarf umfangreicher Expertise, um den richtigen Algorithmus auszuwählen, die richtigen Parameter (sogenannte Hyperparameter) anzupassen und das Modell zu trainieren und zu testen, damit es sich wie gewünscht verhält. Damit all dies funktioniert, muss der Entwickler die richtigen Trainingsdaten erstellen oder sammeln, sie gegebenenfalls kennzeichnen und ihre Korrektheit überprüfen. Die benötigte Datenmenge variiert, kann aber beträchtlich sein, insbesondere wenn das Modell komplexe Entscheidungen trifft, aus vielen verschiedenen Kategorien auswählt oder dent (z. B. mikroskopische Fehler in einem Produkt).
Tatsächlich wird die Entwicklung geeigneter KI-Algorithmen immer einfacher, während die Suche (oder Erstellung) der richtigen Trainingsdaten zunehmend schwieriger wird. Dies liegt daran, dass die zu lösenden Probleme komplexer werden, die benötigten Datenmengen umfangreich und komplex sind oder die Daten zwar vorhanden, aber deren Validität fragwürdig ist. Wie lassen sich diese Billionen von Datenpunkten sammeln und validieren? Betrachten wir dieses Problem genauer und untersuchen wir, warum die Kerneigenschaften der Blockchain eine Lösung bieten könnten. Plattformen wie Synesis One zeigen bereits vielversprechende Ansätze, indem sie mithilfe von Dezentralisierung eine große Anzahl von Menschen mobilisieren.
Die Datenerfassungsbranche
Um die für ein KI-Modell benötigten Daten korrekt zu erfassen, muss man zunächst das zu lösende Problem verstehen. In dieser Branche gibt es Unternehmen, Organisationen und sogar Einzelpersonen, die Probleme lösen möchten. Um die richtigen Daten zu finden oder zu erstellen, müssen sie ihr Problem so detailliert beschreiben können, dass Datenexperten verstehen, welche Art von Daten, welche Art von Kennzeichnung oder Validierung und in welcher Menge benötigt werden. Idealerweise würden diese Akteure ihr Problem und die benötigten Daten öffentlich kommunizieren. Handelt es sich beispielsweise um einen Bericht oder eine Analyse, könnte man die etablierte Gig-Economy nutzen, um qualifizierte Fachkräfte zu finden. Die Herausforderung besteht jedoch darin, dass die für KI benötigten Datensätze oft eine Aufgabe darstellen, die eine einzelne Person nicht bewältigen kann. Die einzelnen Elemente sind jedoch in der Regel nicht schwierig, erfordern meist keine Schulung und lassen sich in kleine Schritte von jeweils einem Datenpunkt unterteilen. Dies ist ideal, um die Arbeit auf mehrere Personen zu verteilen. Wenn viele Personen jeweils eine kleine Anzahl von Datenpunkten auf zuverlässige Weise sammeln oder erstellen und diese Daten gegebenenfalls anhand einiger grundlegender Richtlinien kennzeichnen können, dann verfügt diejenige Organisation, die versucht, ihr Problem zu lösen, über alles, was sie für den Einstieg benötigt.
Dezentralisierung in der Praxis
Hier spielt die Blockchain, insbesondere die Dezentralisierung, ihre Stärken aus. Wie bereits erwähnt, etablieren Synesis One und andere aufstrebende Web3-Unternehmen eine ganze Branche für die Erstellung, Sammlung und Validierung von Daten. Die Blockchain ist ideal, da sie intelligentetraczur Automatisierung des Prozesses ermöglicht, die Teilnehmer nahezu weltweit ortsunabhängig agieren lässt (wodurch die Wahrscheinlichkeit steigt, dass sich mehrere Personen mit dem Problem befassen) und sogar Zahlungen in Form von Kryptowährung erlaubt, die weitgehend grenzenlos ist. Das Ergebnis? Viele verschiedene Personen folgen einfachen Anweisungen, um die richtigen Daten zu erstellen oder zu finden, sie zu validieren, bei Bedarf Peer-Reviews durchzuführen (um sicherzustellen, dass alle die Aufgabe korrekt ausführen) und sie in einem übersichtlichen, sofort nutzbaren Datensatz zusammenzustellen.
Das Konzept mag zwar recht simpel erscheinen, ist aber für die KI-Community revolutionär. Datenknappheit war lange Zeit ein Problem für KI-Entwickler weltweit. Oftmals konnten sie die benötigten Datensätze nicht selbst erstellen und hatten nicht die Ressourcen, um die nötigen Fachkräfte direkt einzustellen. Nur durch ein hocheffizientes System wie die Dezentralisierung lassen sich viele verschiedene Personen gewinnen, die jeweils einen kleinen Beitrag leisten, für ihren Einsatz belohnt werden und so gemeinsam den Datenpool vergrößern, der schließlich nutzbar wird.
Die breite Bevölkerung, einschließlich derjenigen, die im Technologiebereich arbeiten, versteht nicht, wie viel menschliche Arbeit und Input im Bereich der Datenverarbeitung für KI-Modelle nötig ist, damit diese so gut funktionieren wie heute. @Lempheter leistet in diesem Thread hervorragende Arbeit, indem er einige Engpässe aufzeigt… https://t.co/FFO3sAO3fr
— Synesis One (@synesis_one) 2. Mai 2024
Wie geht es weiter?
Da einer der größten Engpässe des KI-Fortschritts möglicherweise überwunden ist, wird der dezentrale Datenmarkt die Verbreitung von KI im Alltag beschleunigen und gleichzeitig nutzbare und personalisierte KI für kleine Unternehmen und sogar Privatpersonen zugänglicher machen. Wir werden in naher Zukunft mit Sicherheit ein starkes Wachstum dieser Branche erleben, wenn nicht gar eine Explosion. Dies wird einen wichtigen Anwendungsfall im Web3 darstellen, der völlig unabhängig von DeFi, NFTs oder den vielen anderen Anwendungen ist, die die breite Öffentlichkeit mit dem Begriff „Blockchain“ verbindet. Mit etwas Glück wird die Blockchain bald als der dringend benötigte Impuls für die KI-Branche wahrgenommen werden.

