Las empresas de IA navegan por zonas grises legales para los datos de entrenamiento

Por

Brian Koome

4 minutos de lectura 6 de abril de 2024

OpenAI y Google están en la mira por recopilar datos de entrenamiento. OpenAI transcribe vídeos de YouTube y Google utiliza el contenido con permiso.
Meta está considerando comprar una editorial importante para recopilar datos para IA en medio de preocupaciones sobre la privacidad.
La industria de la IA enfrenta escasez de datos y está explorando soluciones como los datos sintéticos, pero persisten preocupaciones legales y éticas.

Al analizar el reciente debate sobre cómo Open y Google logran que sus datos se ajusten al modelo, se observará que dos términos predominan: Open y Google. Los artículos publicados recientemente en The Wall Street Journal y The New York Times ilustran que la forma en que las empresas de IA recopilan datos no es la adecuada y genera un gran revuelo sobre qué datos son verdaderos y qué perspectiva ética se utilizó para crear el sistema de IA.

Las tácticas cuestionables de OpenAI

Sin embargo, en su momento álgido, el New York Times destacó los importantes resultados de Open AI con Whisper. Este modelo de transcripción de audio a texto se desarrolló como complemento a la tecnología LP-4 del procesador de lenguaje de Open AI. De hecho, el vehículo autónomo de OpenAI no se basa en la recopilación de información, un problema complejo que la empresa aborda; más bien, esta última entra en juego en tales circunstancias.

Si bien la popularidad inicial de las leyes de recopilación de datos se relacionó con consideraciones de derechos de autor sobre el uso legítimo, estas últimas también se convirtieron en la base legal para estas leyes. Como lo expresó Brockman, uno de los miembros fundadores y director ejecutivo de OpenAI proporcionó información necesaria para la transcripción. Sin embargo, añade que el historiador también contribuyó a la transcripción.

Sin embargo, Google Corporation está tomando protagonismo incluso en estos pequeños problemas en empresas más grandes como esta, es decir, una función de recopilación de datos como OpenAI es una organización más pequeña y participa en proyectos que están orientados al gigante de la industria, y el usuario solo fue advertido y no se le dijo a quién debía culpar YouTube.

Además de este enfoque, Facebook también abordó el cumplimiento de las Condiciones de Servicio y prohibió las acciones no autorizadas, en particular el llamado «scraping» de datos. En el caso de John Conly (portavoz de YouTube), respondió a la pregunta de si los modelos se utilizaban para el entrenamiento de IA basado en contenido tras recopilar datos de los creadores de contenido.

Al contrario. Además de entrenar máquinas, en qué lado Meta es un problema actual que lleva a su inviabilidad. El de IA de la empresa, que tuvo éxito en la rivalidad con OpenAI, consideró que ambos equipos emplearon todos los medios disponibles para lograr un mejor resultado para sus empresas, incluyendo ideas originales sin considerar ningún aspecto a favor de la parte rechazada.

Meta parece haber preparado preguntas para obtener respuestas sobre qué trabajo delegado se realizará, quién estará a cargo de la compra de libros y qué editoriales especializadas en campos específicos. Si bien la experiencia de usuario de la red es excepcional, las políticas gubernamentales establecidas han tomado la iniciativa de inmiscuirse en la privacidad individual, como se puso de manifiesto en 2018 con el caso Cambridge Analytica.

El panorama general del entrenamiento de IA se enfrenta a un dilema acuciante: por un lado, la escasez de datos se ha agudizado en los últimos años, y por otro, la escasez de datos. Si bien la conexión entre ambos persiste, los investigadores insisten en contar con datos adecuados para mejorar la precisión y el rendimiento.

Además, la predicción del Wall Street Journal despierta entusiasmo, proyectando aumentos que superan todos los objetivos para principios de 2020 y cruzando el cierre del año con el punto más alto del mercado. Este método se basa en dos factores: la confianza en los modelos, que pueden sintetizarse en una matriz externa estatal, y un currículo de procesos de toma de decisiones, donde los modelos aprenden de sus decisiones. No espere que produzcan resultados, sino que sean observables.

Implicaciones legales y éticas

La ausencia de la normativa antipiratería podría generar problemas, ya que nada permite a los usuarios acceder a los elementos protegidos por derechos de autor, y podría surgir una comprensión de la misión en torno a la ley, la ética, etc. ¿Se convierten los datos en un bien intangible y en la base para saber y afirmar qué es propio y qué no, en el que se sabe que los datos y el usuario son la fuente del negocio cuando el uso de esos datos es injustificado? Este riesgo obligaría a los responsables del programa del equipo de I+D a concentrarse en revisarlos y encontrar soluciones.

La relación entre el propósito de las demandas colectivas implicaría que la privacidad y el uso de datos son respuestas que la organización desconoce para legitimar sus operaciones. De hecho, los desafíos (como las cuestiones éticas relacionadas con el proceso de minería de datos utilizado para la investigación y el desarrollo de IA) se complican al considerar las restricciones regulatorias y la privacidad de los datos (ya que la naturaleza de estos se encuentra en el contexto de su procesamiento y uso).

La competencia más dura de la IA en el futuro radica endentlos mejores datos para el entrenamiento de los sistemas de IA, y más aún, en si dichos datos se someterán a marcos regulatorios éticos o legales comunes. Todo lo que rodea a la IA, por su propia naturaleza, enfatiza y amplía conceptos como la innovación y la implementación mediante filtros de conjuntos de datos para las empresas.

Ser una Inteligencia Artificial Tecnológica Nunca Es Estático, Por Lo Que El Problema Principal Siempre Será El Uso De Los Datos, Y Seguirá Siendo Una De Las Prioridades De Los Miembros De La Comunidad Que Toman Forma A Través Del Uso De La Inteligencia Artificial, Los Mejores.

Artículo original de: https://www.nytimes.com/2024/04/06/technology/tech-giants-harvest-data-artificial-intelligence.html?smid=nytcore-ios-share&sgrp=c-cb

Las mentes más brillantes del mundo de las criptomonedas ya leen nuestro boletín. ¿Te apuntas? ¡ Únete!

Comparte este artículo

Aviso legal. La información proporcionada no constituye asesoramiento comercial. Cryptopolitanconsultar no se responsabiliza de las inversiones realizadas con base en la información proporcionada en esta página. Recomendamostronencarecidamente realizar una investigación independientedent un profesional cualificado antes de tomar cualquier decisión de inversión.

Brian Koome

Brian Koome cuenta con más de siete años de experiencia en periodismo sobre blockchain y criptomonedas, y ha estado activo en el sector desde 2017. Ha colaborado con publicaciones destacadas, como BlockToday.com. Además, desarrolló el curso Ethereum 101 para BitDegree.org antes de unirse Cryptopolitan como redactor a tiempo completo. Brian se especializa en guías permanentes, análisis en profundidad, entrevistas y análisis de precios. Su enfoque en DeFi, la innovación blockchain y los proyectos emergentes de criptomonedas resulta muy atractivo para los lectores.

ÍNDICE

1. Las tácticas cuestionables de OpenAI

2. Implicaciones legales y éticas

Comparte este artículo