¿Cuál es la postura de YouTube sobre la capacitación Sora y ChatGPT de OpenAI?

Por

Aamir Sheikh

Lectura de 2 minutos. 6 de abril de 2024.

¿Cuál es la postura de YouTube sobre la capacitación Sora y ChatGPT de OpenAI?

Al expresar su preocupación por las fuentes de datos de Sora y ChatGPT, el director ejecutivo de YouTube, Neal Mohan, advierte a OpenAI contra el uso de su plataforma para el entrenamiento de modelos.
La incertidumbre en torno a los datos de entrenamiento de Sora, especialmente su dependencia de los videos de YouTube, se revela en una entrevista con The Wall Street Journal realizada por la CTO de OpenAI, Mira Murati.
Debido a que cumple con la política de uso de YouTube con respecto al material de video, el proyecto de IA multimodal de Google, Gemini, sirve como modelo para el desarrollo de IA en la plataforma.

Recientemente, OpenAI recibió unatronadvertencia del CEO de YouTube, Neal Mohan, sobre el uso de su plataforma para entrenar los innovadores modelos de IA Sora y ChatGPT. Esta advertencia se emite ante posibles infracciones de las condiciones de servicio de YouTube, así como ante la preocupación por la fuente de los datos de entrenamiento. El debate sobre la investigación ética en IA y las obligaciones de las empresas tecnológicas se ha visto impulsado por el problema de la fuente de los datos de entrenamiento para estos sistemas de IA de vanguardia.

Explorando las preocupaciones de YouTube

La reciente entrevista de Mira Murati añade otra capa de incertidumbre al panorama ya de por sí confuso de las prácticas de entrenamiento de IA. Lo que posiblemente fue aún más preocupante fue que, en una entrevista con The Wall Street Journal realizada hace apenas un mes, la directora de tecnología de OpenAi, Mira Murati, expresó incertidumbre y falta de claridad sobre la fuente de los datos de entrenamiento de Sora. Aunque no está claro si se utilizaron o se están utilizando vídeos de YouTube para el entrenamiento, Neal Mohan, el director ejecutivo de la empresa, posiblemente ha lanzado una advertencia al informar a OpenAI que el uso de vídeos en su plataforma está prohibido.

Prohíbe la descarga de materiales como transcripciones o videoclips, lo que constituye una flagrante violación de nuestros términos de servicio, declaró Mohan en una entrevista con Emily Chang para Bloomberg Originals. Estas son las directrices para el contenido de nuestra plataforma. Si bien Google, la empresa matriz de YouTube, ha estado desarrollando su propia IA multimodal, llamada Gemini, que también utiliza datos de entrenamiento, Mohan afirmó que Google sigue eltracúnico de cada creador con YouTube al determinar si utiliza contenido de la plataforma.

Mohan afirmó:

No permite descargar cosas como transcripciones o fragmentos de video, lo cual constituye una clara violación de nuestros términos de servicio. Esas son las normas de contenido de nuestra plataforma
Fuente: Bloomberg

Mohan también añadió:

“Google se adhiere atracindividuales de YouTube con los creadores antes de decidir si utilizará videos de la plataforma”
Fuente: Bloomberg

Navegando por el desarrollo ético de la IA

Un análisis más detallado de los comentarios de Murati pone de manifiesto la gravedad del problema de los derechos de autor y la atribución. Es posible que Sora, de OpenAI, recopile todo lo que hay en internet, incluyendo vídeos de YouTube y publicaciones en redes sociales, dada la frase "datos disponibles públicamente". Por ejemplo, es muy improbable que las condiciones de licencia de todo el contenido publicado en YouTube permitan este tipo de uso.

Mantener los derechos de autor en internet es, de por sí, una tarea difícil. Al mismo tiempo, Sora, de OpenAI, tendrá acceso a ellos y podrá beneficiarse de ellos, además de usarlos con fines educativos.

No solo el director de tecnología de OpenAI se muestra reacio a hablar sobre los conjuntos de datos que se utilizan en el aprendizaje de Sora. En general, la empresa no menciona las fuentes que utiliza. Ni siquiera se menciona claramente en el documento técnico de Sora que se necesite una cantidad significativa de películas con subtítulos para entrenar los sistemas de creación de texto a vídeo.

Debido a que estas empresas no tienen el derecho legal de utilizar los datos, su falta de transparencia a este respecto puede ser el primer indicio de que están intentando evitar problemas legales.

Las mentes más brillantes del mundo de las criptomonedas ya leen nuestro boletín. ¿Te apuntas? ¡ Únete!

Comparte este artículo

Aviso legal. La información proporcionada no constituye asesoramiento comercial. Cryptopolitanconsultar no se responsabiliza de las inversiones realizadas con base en la información proporcionada en esta página. Recomendamostronencarecidamente realizar una investigación independientedent un profesional cualificado antes de tomar cualquier decisión de inversión.

Aamir Sheikh

Aamir es periodista especializado en tecnología con casi seis años de experiencia en los sectores de criptomonedas y tecnología. Se graduó de la Universidad MAJ con un MBA en Finanzas y Marketing. Actualmente trabaja en Cryptopolitan, donde informa sobre las últimas novedades en los mercados de criptomonedas y realiza predicciones de precios.

ÍNDICE

1. Explorando las preocupaciones de YouTube

2. Navegando por el desarrollo ético de la IA

Comparte este artículo