ÚLTIMAS NOTICIAS

vivir EN DIRECTO: La Reserva Federal mantiene los tipos de interés sin cambios en la primera reunión de Kevin Warsh

Actualizaciones en vivo del 17 de junio de 2026
CZ sostiene que los agentes de IA llevarán las finanzas basadas en criptomonedas a miles de millones de personas en todo el mundo

Noticias de hace 2 horas
Solana lidera el ranking de blockchains en cuanto a poseedores de activos reales, reconfigurando el panorama competitivo de la tokenización

Hace 3 horas Noticias
OpenAI implementa tracde crédito y los límites de gasto para ChatGPT Enterprise

Hace 5 horas Tecnología

SELECCIONADO PARA TI

SEMANALMENTE

MANTÉNGASE EN LA CIMA

Los mejores análisis sobre criptomonedas directamente en tu bandeja de entrada.

Las empresas de IA dependen de editores premium para obtener datos de entrenamiento, según un nuevo estudio

Por

Brenda Kanana

Lectura de 2 minutos. 9 de noviembre de 2024.

Robot de inteligencia artificial y logotipos de grandes empresas de medios de comunicación al fondo

OpenAI y Google, importantes empresas de IA, están utilizando artículos de los principales canales de publicación para entrenar modelos lingüísticos.
Según un estudio realizado por Ziff Davis, las fuentes se filtran en función de las clasificaciones de búsqueda.
Los editores están preocupados porque las empresas de inteligencia artificial están utilizando su contenido sin permiso.

Las principales empresas de tecnología, incluidas OpenAI, Google, Meta y Anthropic, dependen de material protegido por derechos de autor de alta calidad de editoriales destacadas para entrenar sus modelos de lenguaje grandes (LLM).

Según un estudio realizado por Ziff Davis, la empresa matriz de CNET, IGN y Mashable, esto demuestra el papel fundamental que desempeña el contenido de alta calidad en el entrenamiento de estos modelos de IA. El estudio revela que las empresas de IA prefieren las fuentes autorizadas para los conjuntos de datos de entrenamiento con el fin de mejorar el rendimiento del modelo, pero a menudo se subestima la contribución de estas fuentes.

En la investigación, el abogado de IA de Ziff Davis, George Wukoson, y el director de tecnología, Joey Fortuna, afirmaron que las empresas de IA seleccionan los datos de entrenamiento basándose en la clasificación de sitios web de prestigio con un alto posicionamiento en buscadores. Se eligieron sitios web populares y de alta calidad para mejorar los modelos, ya que gozan de buena reputación. Esta estrategia, según el estudio, permite a los desarrolladores de IA perfeccionar el modelo de lenguaje.

Ziff Davis ha señalado que proveedores de contenido de primer nivel como Axel Springer, Future PLC, Hearst, News Corp y The New York Times, entre otros, han contribuido al desarrollo de conjuntos de datos de entrenamiento. En particular, se hadentque el 12,04 % de OpenWebText2, utilizado para la creación de GPT-3 de OpenAI, provino de estos editores de confianza.

Mark Zuckerberg también se pronunció sobre el debate en torno al uso de contenido en el entrenamiento de la IA. En una entrevista reciente con The Verge, Zuckerberg reconoció que la extracción de datos para la IA es compleja, pero también señaló que el contenido de creadores o editores individuales podría no ser tan relevante. Afirmó: «Creo que los creadores o editores individuales tienden a sobreestimar el valor de su contenido específico en el contexto general».

Los editores presentan demandas contra empresas de inteligencia artificial

El secretismo en torno a las fuentes de datos de entrenamiento ha generado preocupación tanto entre editores como entre consumidores. The New York Times y The Wall Street Journal presentaron recientemente demandas contra empresas de inteligencia artificial, alegando que han violado las leyes de derechos de autor al usar su contenido.

Si bien OpenAI ha avanzado en sus esfuerzos por obtener licencias de contenido de organizaciones de medios como el Financial Times y DotDash Meredith, varias empresas de IA aún operan sin las licencias adecuadas. El informe también señala que «los principales desarrolladores de LLM ya no divulgan sus datos de entrenamiento como lo hacían antes».

Mientras el valor de las empresas de IA aumenta, la brecha entre los gigantes tecnológicos y las empresas de medios convencionales sigue siendo enorme. Gigantes tecnológicos como Google y Meta, con un valor estimado de 2,2 y 1,5 billones de dólares, respectivamente, se mantienen a la vanguardia de la IA generativa, mientras que startups como OpenAI y Anthropic están valoradas en 157 000 millones de dólares y 40 000 millones de dólares, respectivamente.

Por otro lado, las editoriales aún lidian con despidos y reestructuraciones, lo que evidencia la presión financiera que supone adaptarse a un entorno cada vez más defipor la IA. Como resultado de la competencia con el contenido generado por el usuario y basado en IA, numerosas editoriales se enfrentan a retos en cuanto a la reducción de costes y personal.

Si estás leyendo esto, ya llevas ventaja. Mantente al día con nuestro boletín informativo.

Meta OpenAI de Google

Comparte este artículo

Aviso legal. La información proporcionada no constituye asesoramiento comercial. Cryptopolitanconsultar no se responsabiliza de las inversiones realizadas con base en la información proporcionada en esta página. Recomendamostronencarecidamente realizar una investigación independientedent un profesional cualificado antes de tomar cualquier decisión de inversión.

Brenda Kanana

Brenda cuenta con más de cuatro años de experiencia especializada en criptomonedas, inteligencia artificial y tecnologías emergentes. Ha trabajado en Zycrypto, Blockchain Reporter, The Coin Republic y ahora forma parte de Cryptopolitan . Su licenciatura en Sociología por la Universidad Técnica de Mombasa le permite estar al tanto de las necesidades de sus lectores.

ÍNDICE

1. Los editores presentan demandas contra empresas de inteligencia artificial

Comparte este artículo

MÁS… NOTICIAS

MOSTRAR TODO

5 ingeniosas aplicaciones de ChatGPT y qué debes hacer al respecto

Hace 3 años, el técnico John Palmer

El 93% de los líderes empresariales prefieren soluciones basadas en IA para la gestión de la sostenibilidad de la marca, según Reuters

Hace 3 años, el técnico John Palmer

El ecosistema de inteligencia artificial de Francia

Así apoya Macron el vibrante y productivo ecosistema de IA de Francia

Hace 3 años Tech Glory Kaburu

Bloomberg estima que el mercado de IA generativa alcanzará los 1,3 billones de dólares en 2032

Hace 3 años, Tech Aamir Sheikh

¿Qué es Base? La red de capa 2 Ethereum lanzada por Coinbase

21 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
Dogecoin vs. Bitcoin: Diferencias técnicas clave

20 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
¿Qué es TVL (valor total bloqueado) en criptomonedas?

14 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
¿Cómo leer un documento técnico sobre criptomonedas?

13 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
Ripple vs. XRP vs. XRP Ledger: ¿Cuál es la diferencia?

13 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
¿Qué es una billetera multifirma en criptomonedas?

10 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes

CURSO INTENSIVO DE CRIPTOMONEDAS PROFUNDAS

¿Qué criptomonedas pueden hacerte ganar dinero?
Cómo mejorar tu seguridad con una billetera (y cuáles realmente vale la pena usar)
Estrategias de inversión poco conocidas que utilizan los profesionales
Cómo empezar a invertir en criptomonedas (qué plataformas de intercambio usar, las mejores criptomonedas para comprar, etc.)