ÚLTIMAS NOTICIAS
SELECCIONADO PARA TI
SEMANALMENTE
MANTÉNGASE EN LA CIMA

Los mejores análisis sobre criptomonedas directamente en tu bandeja de entrada.

La IA no puede prosperar sin el conocimiento humano: es imprescindible compensar a los creadores originales

PorAamir SheikhAamir Sheikh
3 minutos de lectura
Conocimiento humano
  • El entrenamiento de modelos de IA requiere grandes conjuntos de datos, y es mejor si se basan en el conocimiento humano.
  • Los periódicos y las organizaciones de investigación, junto con los portales web, gastan sus recursos en recopilar y publicar información.
  • La compensación para los creadores originales de contenido es imprescindible, ya que ahora las empresas de IA están licenciando contenido de otras empresas.

El entrenamiento de modelos de IA requiere grandes cantidades de conjuntos de datos, y su capacidad para producir buenos resultados depende directamente de los datos que se le suministran al sistema. La información no es gratuita, y estamos hablando de muchos derechos de propiedad intelectual. 

Pero las empresas de IA no piensan de esa manera; dan por sentado todo el conocimiento producido por generaciones de escritores; su concepto de uso justo también es diferente de cómo se percibía en primer lugar; y no les gusta pagar a los creadores de contenido que crearon sus modelos de lo que son capaces de hacer hoy.

Robo de conocimiento humano

Se necesita mucho trabajo duro y sudor para producir el contenido que vemos en periódicos, revistas, libros, archivos en línea y artículos de investigación, pero eso no es posible sin escritores, editores, investigadores y publicadores que lo llevan al público en diferentes formas.

Ese reconocimiento y ese conocimiento ganados con tanto esfuerzo no deberían quedar libres para que una empresa los explote, como hizo una de ellas.

“Información que está disponible públicamente en Internet”

Fuente: OpenAI.

Sí, eso es lo que OpenAI tiene que decir cuando se le pregunta sobre el contenido que utilizó para entrenar sus sistemas de IA, junto con la información que obtuvo bajo licencia de terceros y la información que brindan sus usuarios y entrenadores humanos. 

Hablando del contenido licenciado, las empresas lo están buscando ahora, pero desconocemos si OpenAI licenció información de algún proveedor antes de lanzar su modelo GPT inicial. El modelo debió haber sido entrenado con materiales protegidos por derechos de autor que no eran de libre uso con fines comerciales.

Fuente: Statista.

Compensación para los creadores originales

Hasta hace un año, la mayor parte del texto escrito, tanto online como offline, se creaba con esfuerzo humano. A pesar del clickbait, también se mezclaba contenido de baja calidad, pero al menos era creado por personas que comprendían la psique y el proceso de pensamiento humanos, y las aplicaciones de IA generativa se basaban en dicha información. 

Pero hoy en día, las empresas se enfrentan a un nuevo problema para entrenar sus modelos de IA: el contenido generado por máquinas, que prevalece en internet y que no se considera de calidad. Este contenido está saturando los recursos disponibles para entrenar modelos de IA, ya que no pueden producir resultados de calidad cuando se entrenan con contenido inútil, que es como estos modelos suelen generar contenido. La producción de IA sobre IA es un proceso a menudo denominado canibalismo o clonación de IA.

Para evitar que esto suceda, las empresas de IA deben limitar su material fuente a fuentes fiables, que no son otras que periódicos, revistas y foros públicos que albergan una gran cantidad de conocimiento generado por humanos. Cabe mencionar algunos más, como se mencionó anteriormente, pero esta necesidad y las demandas de los periódicos las han obligado a licenciar el contenido y a pagar por la explotación que realizaban.

Empresas como Reddit, un gran foro público alojado en la web, también están considerando licenciar su contenido a empresas de IA. En un comunicado, afirmaron que preferirían los negocios a las demandas, pero no descartaron demandas si las conversaciones comerciales fracasan. Si no se permite incluir unatracen un vídeo de YouTube, ¿por qué debería permitirse que una empresa de IA la use para entrenar sus modelos con fines comerciales?

La propiedad intelectual es un problema en este caso, ya que las empresas de IA la siguen violando. Por otro lado, la IA no es capaz de recopilar nuevas noticias por sí sola; se requiere esfuerzo humano para recopilarlas y confirmarlas con diferentes fuentes antes de publicarlas. Solo entonces un modelo de IA puede usar esa información. En este caso, no compensar al recurso humano constituye una explotación. 

Si estás leyendo esto, ya llevas ventaja. Mantente al día con nuestro boletín informativo.

Comparte este artículo

Descargo de responsabilidad: La información proporcionada no constituye asesoramiento financiero. Cryptopolitanno se responsabiliza de las inversiones realizadas con base en la información de esta página. Recomendamostronencarecidamente realizar una investigación independientedent o consultar con un profesional cualificado antes de tomar cualquier decisión de inversión.

MÁS… NOTICIAS
INTENSIVO CRIPTOMONEDAS
CURSO