En el contexto actual de noticias falsas, hechos alternativos, fuentes no verificadas y mentiras descaradas, resulta extremadamente difícil confiar en lo que se publica. Sin embargo, este problema va mucho más allá de las noticias políticas o las historias sensacionalistas. Nos encontramos en un entorno donde disponemos de más datos que nunca, dependemos de más datos que nunca, pero nuestra capacidad para verificarlos está al límite.
La promesa y el problema de los datos
La industria de la IA, en particular, ha aumentado enormemente nuestra necesidad de datos. Si bien siempre pudimos usar el análisis estadístico para obtener información valiosa, la IA nos ha brindado un poder aparentemente ilimitado, siempre y cuando contemos con los datos adecuados para entrenar un algoritmo. Con el conjunto de datos de entrenamiento apropiado, un algoritmo de IA puede clasificar diferentes categorías de datos, comodentun producto a partir de una fotografía. Puede usar datos para predecir cosas que serían imposibles para los humanos: predecir comportamientos fraudulentos en tu cuenta bancaria, cuánto tardará en llegar un paquete y si otro automóvil chocará con tu vehículo autónomo. Puede optimizar un problema basándose en datos, como agilizar una fábrica, ajustar todas tus citas según tus restricciones de horario y suavizar los movimientos de un robot. Con suficientes datos, un algoritmo de IA, como un modelo de lenguaje grande, como el que se encuentra en ChatGPT y modelos similares, puede responder a una amplia gama de preguntas, a menudo con una precisión sorprendentemente alta. En tan solo unos pocos años, nos hemos vuelto completamentedent de la IA porque aún estamos descubriendo sus capacidades (y limitaciones).
Como habrás notado, el denominador común aquí son los datos . Sin embargo, el problema es que simplemente tener datos no basta para crear un algoritmo de IA adecuado. Crear un modelo de IA eficaz es, en realidad, mucho más complejo y difícil de lo que parece. Se requiere mucha experiencia para seleccionar el algoritmo correcto, ajustar los parámetros adecuados (llamados hiperparámetros) y entrenar/probar el modelo para asegurar que se comporte como debe. Para que todo esto funcione, el desarrollador debe crear o recopilar el tipo de datos correcto para el entrenamiento, etiquetarlos cuando sea necesario y validar su exactitud. La cantidad de datos necesarios varía, pero puede ser bastante grande, especialmente si el modelo toma decisiones complejas, elige entre muchas categorías diferentes o necesita identificar dent muy pequeños (como encontrar defectos microscópicos en un producto, por ejemplo).
Lo cierto es que crear algoritmos de IA adecuados es cada vez más fácil, mientras que encontrar (o generar) los datos correctos para entrenar el modelo se vuelve más difícil a medida que los problemas que queremos resolver se vuelven más complejos, los datos requeridos son extensos y complejos, o disponemos de los datos pero su validez es dudosa. ¿Qué se puede hacer para recopilar y validar estos billones de puntos de datos? Analicemos este problema y exploremos por qué los atributos clave de blockchain pueden ofrecer una solución, con plataformas como Synesis One que ya demuestran un gran potencial para movilizar a un gran número de personas mediante la descentralización.
La industria de la recopilación de datos
Para recopilar correctamente los datos necesarios para un modelo de IA, primero debe comprender qué problema intenta resolver. En este sector, existen empresas, organizaciones e incluso particulares con problemas que resolver. Para encontrar o generar los datos adecuados, deben poder articular con suficiente detalle su problema para que los expertos en datos comprendan qué tipo de datos, qué tipo de etiquetado o validación, y qué cantidad se necesita. Idealmente, estas entidades comunicarían su problema y el tipo de datos que necesitan. Si se tratara de un informe o análisis, se podría recurrir a la consolidada economía colaborativa para encontrar a alguien cualificado. El reto reside en que, con los conjuntos de datos necesarios para la IA, suele ser una tarea mucho mayor de la que una sola persona puede gestionar. Sin embargo, los elementos individuales no suelen ser difíciles, no requieren formación en la mayoría de los casos y pueden dividirse en incrementos de un único punto de datos. Esto resulta ideal para distribuir el trabajo entre varias personas. Si muchas personas pueden recopilar o crear una pequeña cantidad de datos de forma fiable, y si es necesario etiquetarlos siguiendo algunas pautas básicas, entonces la entidad que intenta resolver su problema tendrá todo lo que necesita para empezar.
Descentralización en acción
Aquí es donde la tecnología blockchain, y la descentralización en particular, resulta perfecta. Como se mencionó anteriormente, Synesis One y otras empresas emergentes de Web3 están creando toda una industria de creación, recopilación y validación de datos. Blockchain es ideal porque permite que lostracinteligentes automaticen el proceso, que los participantes se encuentren prácticamente en cualquier lugar del mundo (lo que aumenta las probabilidades de que haya personas trabajando en el problema) e incluso permite el pago con criptomonedas, que en gran medida no tienen fronteras. ¿El resultado? Muchas personas diferentes siguen instrucciones básicas para crear o encontrar los datos correctos, validarlos, realizar revisiones por pares si es necesario (para garantizar que todos hagan bien su trabajo) y empaquetarlos en un conjunto de datos listo para usar.
Aunque el concepto pueda parecer bastante básico, para la comunidad de IA es, de hecho, revolucionario. Las limitaciones de datos han sido durante mucho tiempo un gran obstáculo para los desarrolladores de IA en todo el mundo, ya que a menudo no pueden crear estos conjuntos de datos por sí mismos ni cuentan con los recursos para contratar directamente a las personas que realicen el trabajo. Solo mediante un sistema ultraeficiente como la descentralización se puede reclutar a muchas personas diferentes que pueden contribuir con una pequeña cantidad, ser recompensadas por sus esfuerzos y, en conjunto, aportar datos que finalmente se convierten en datos utilizables.
La población en general, incluyendo a quienes trabajan en tecnología, no comprende la cantidad de trabajo humano y aportación necesaria en el procesamiento de datos para que los modelos de IA funcionen tan bien como lo hacen actualmente. @Lempheter hace un trabajo increíble en este hilo al desglosar algunos cuellos de botella en… https://t.co/FFO3sAO3fr
— Synesis One (@synesis_one) 2 de mayo de 2024
¿Que sigue?
Con la posible solución de uno de los principales obstáculos para el progreso de la IA, el mercado de datos descentralizado impulsará la IA en nuestra vida cotidiana, al tiempo que hará que la IA útil y personalizada sea más accesible para pequeñas empresas e incluso particulares. Sin duda, veremos cómo esta industria se expande, si no explota, en un futuro próximo, proporcionando un caso de uso importante en Web3 completamente independiente de DeFi, NFT o cualquier otro uso de moda que el público en general asocia con el término «blockchain». Con un poco de suerte, podrían empezar a considerar blockchain como el gran impulso que necesita la industria de la IA.

