COMING SOON: A New Way to Earn Passive Income with DeFi in 2025 LEARN MORE

Google Trains AI Search Tools en el contenido del editor a pesar de las opciones de exclusión

En esta publicación:

  • Google está utilizando el contenido de editor para capacitar sus herramientas de búsqueda de IA, incluso cuando los editores optan por no participar.
  • El Departamento de Justicia está presionando por los cambios importantes en el negocio de Google, incluida la venta de su tecnología publicitaria.
  • Los editores y reguladores están preocupados por cómo Google usa datos para la capacitación de IA.

Google enfrenta un nuevo escrutinio después de que un alto ejecutivo testificó que los productos de inteligencia artificial (IA) específica de búsqueda de la compañía, como las descripciones de IA, están capacitados en el contenido de los editores, incluso cuando esos editores han optado explícitamente por la capacitación de IA.

Eli Collins, vicepresidente dent Google Deepmind, reconoció en un tribunal federal el viernes que, si bien los editores pueden evitar que su contenido se utilice para capacitar a los modelos de IA desarrollados por Deepmind, tales opciones no se aplican a la organización de búsqueda más amplia de Google.

"Una vez que tomas el Géminis [modelo AI] y lo pones dentro de la organización de búsqueda, la organización de búsqueda tiene la capacidad de entrenar en los datos que los editores habían optado por no ser capacitación, ¿correcto?" preguntó Diana Aguilar, abogada del Departamento de Justicia de los Estados Unidos (DOJ).

Collins confirmó que los datos aún podrían usarse "para usar en la búsqueda".

Esta revelación se produce en medio de un ensayo antimonopolio fundamental que determina cómo la empresa de tecnología debe reestructurar sus operaciones después de ser declarado culpable el año pasado de monopolizar ilegalmente el mercado de búsqueda en línea. El Departamento de Justicia ahora está presionando para remedios estructurales, incluida la obligación de la empresa a desinvertir su navegador Chrome y prohibir acuerdos que lo convierten en el motor de búsqueda predeterminado en todos los dispositivos, un movimiento que también afectaría los productos de IA , incluido Gemini.

Google Powers AI Herramientas con contenido que los editores dicen que no lo permitieron

La función de resumen de la IA de Google , que resume las respuestas en la parte superior de los resultados de búsqueda utilizando el texto generado por IA, ya ha alarmado a los editores del sitio web. Muchos argumentan que reduce los clics de los usuarios a los sitios web originales y perjudica sus ingresos, sin embargo, la empresa de tecnología continúa utilizando datos de estas fuentes.

Ver también  Builder respaldado por Microsoft.ai Hit por la sonda estadounidense sobre ventas falsas

En un documento presentado por el DOJ con fecha del 26 de agosto de 2024, titulado "Search Genai <> Gemini V3", los datos internos mostraron que Google había filtrado alrededor de 80 mil millones de tokens, esencialmente fragmentos de texto, desde su corpus de entrenamiento de 160 mil millones de tokens en respuesta a las opciones editoriales. Sin embargo, los 80 mil millones de tokens restantes aún podrían incluir contenido que alimente las características de Google Search AI.

El mismo documento también enumeró los "datos de las sesiones de búsqueda" y los videos de YouTube como fuentes adicionales para mejorar la capacitación de IA, lo que aumenta las preocupaciones sobre el alcance de los datos de los usuarios que se alimentan a los modelos de IA de la empresa tecnológica.

Cuando el juez Amit Mehta preguntó si la mitad del conjunto de datos fue eliminado debido a las opciones de recopilación del editor, Collins confirmó: "Eso es correcto".

El DOJ destaca el interés interno en aprovechar los datos de búsqueda para AI

El DOJ destacó además discusiones internas dentro de Google que sugieren ambiciones de capacitar a los modelos de IA utilizando sus vastas torates de datos de búsqueda: marcos, consultas y comportamiento del usuario.

Una de esas instancias incluyó una sesión informativa preparada para el CEO de Deepmind, Demis Hassabis, en el que reflexionó sobre la idea de capacitar a un modelo de Google AI utilizando datos de búsqueda integrales para evaluar las ganancias de rendimiento resultantes.

Aguilar le preguntó a Collins si Google había creado un modelo utilizando datos de búsqueda. Collins respondió que no estaba al tanto de que ese modelo se estaba desarrollando, aunque reconoció que Hassabis había mostrado interés en el concepto.

El equipo legal de Google trató de minimizar las preocupaciones sobre el dominio de la IA, argumentando que otras compañías de IA pueden prosperar sin aprovechar su índice de búsqueda. Por ejemplo, los chatbots deportivos pueden acceder a datos en tiempo real a través de asociaciones comerciales con proveedores de puntajes, no contenido de gastado web.

Ver también  EE. UU. Y Japón en conversaciones para inversiones de tecnología e infraestructura a gran escala

Aún así, el DOJ sostiene que el dominio de larga data de Google en la búsqueda le da una ventaja injusta en el espacio de IA, particularmente cuando integra Gemini en su infraestructura de búsqueda.

Google enfrenta un mayor escrutinio en su negocio publicitario

Google de Alphabet también enfrentará un juicio en septiembre por las propuestas de los ejecutores antimonopolio para obligar a la compañía a vender partes de su negocio de tecnología publicitaria. Los cambios propuestos tienen como objetivo abordar el dominio de la empresa sobre las herramientas utilizadas por los editores en línea para vender anuncios digitales.

La jueza de distrito estadounidense Leonie Brinkema en Alexandria, Virginia, estableció la fecha del juicio después de escuchar a Google y al Departamento de Justicia sobre posibles remedios. Se espera que ambas partes presenten propuestas detalladas para el lunes.

El Departamento de Justicia está tratando de que la empresa tecnológica desintegue su intercambio de anuncios y negocios de servidores de publicidad de editores, según un proceso que lleva varios años, según la abogada del DOJ, Julia Tarver Wood.

La abogada de Google, Karen Dunn, respondió que la compañía apoya los remedios de comportamiento, como permitir que las ofertas en tiempo real estén disponibles para los competidores. Sin embargo, argumentó que el Departamento de Justicia no puede forzar legalmente a la compañía a vender partes de su negocio. Dunn afirmó además que tal movimiento dañaría a los usuarios de Internet y enfrentaría desafíos debido a la falta de compradores interesados.

Cable de diferencia de clave : la herramienta secreta que los proyectos de cifrado utilizan para obtener cobertura de medios garantizada

Compartir enlace:

Descargo de responsabilidad. La información proporcionada no es un consejo comercial. Cryptopolitan.com no asume ninguna responsabilidad por las inversiones realizadas en función de la información proporcionada en esta página. Recomendamos tron dent independiente y/o la consulta con un profesional calificado antes de tomar cualquier decisión de inversión.

Mas leido

Cargando los artículos más leídos...

Manténgase al tanto de las noticias sobre criptomonedas y reciba actualizaciones diarias en su bandeja de entrada

elección del editor

Cargando artículos elegidos por el editor...

- El boletín de cifrado que te mantiene por delante -

Los mercados se mueven rápidamente.

Nos movemos más rápido.

Suscríbase a Cryptopolitan diariamente y obtenga ideas criptográficas oportunas, agudas y relevantes directamente a su bandeja de entrada.

Únete ahora y
nunca te pierdas un movimiento.

Entra. Obtén los hechos.
Adelantarse.

Suscríbete a CryptoPolitan