OpenAI, una reconocida empresa de inteligencia artificial, ha presentado recientemente su última herramienta, “GPTBot”, diseñada para fines de rastreo web, lo que podría allanar el camino para mejoras en futuras iteraciones de sus modelos ChatGPT.
En una publicación reciente de su blog, OpenAI anunció el lanzamiento de GPTBot, destacando su potencial para mejorar las próximas versiones de ChatGPT. La función principal de la herramienta se centra en el rastreo web, un proceso en el que un bot, a menudo conocido como araña web, indexa el contenido de sitios web en la vasta extensión de internet. Esto permite que motores de búsqueda como Google y Bing muestren sitios web relevantes en sus resultados de búsqueda.
OpenAI explicó que GPTBot está diseñado para recopilar información de acceso público de diversas fuentes web. Sin embargo, está programado para excluir contenido de pago, fuentes con información personal identificabledenttexto que infrinja las políticas establecidas por OpenAI. Cabe destacar que los propietarios de sitios web pueden impedir el rastreo de GPTBot insertando un comando de exclusión en un archivo estándar de sus servidores.
Última hora 🚨
—Shubham Saboo (@Saboo_Shubham_) 7 de agosto de 2023
OpenAI acaba de lanzar GPTBot, un rastreador web diseñado para extraer automáticamentematicde toda internet.
¡Estos datos se utilizarán para entrenar futuros modelos de IA como GPT-4 y GPT-5!
GPTBot garantiza que se excluyan las fuentes que violan la privacidad y aquellas con contenido de pago. pic.twitter.com/oR3kY4buaU
Este nuevo proyecto de rastreo web surge tras la reciente solicitud de registro de marca de OpenAI para "GPT-5", el sucesor previsto del modelo GPT-4. Esta solicitud, presentada ante la Oficina de Patentes y Marcas de los Estados Unidos el 18 de julio, abarca el uso del término "GPT-5" para diversas basadas en inteligencia artificial , como la conversión de texto a voz, la traducción de audio a texto y el reconocimiento de voz.
OpenAI planea el próximo modelo
Sin embargo, a pesar de la expectación generada por el GPT-5, el fundador y director ejecutivo de OpenAI, Sam Altman, advirtió que la empresa aún está muy lejos de comenzar la capacitación en GPT-5. Enfatizó la necesidad de realizar auditorías de seguridad exhaustivas antes de iniciar el proceso de capacitación.
OpenAI ha presentado una solicitud de registro de marca para:
— YK también conocido como CS Dojo 📺🐦 (@ykdojo) 1 de agosto de 2023
“GPT-5”
, que incluye “software para”:
“la producción artificial de habla y texto humanos”
, “la conversión de archivos de datos de audio a texto”
, “reconocimiento de voz y habla”
, “procesamiento de lenguaje y habla basado en aprendizaje automático”
👀 pic.twitter.com/54aJBovDNB
Mientras tanto, OpenAI se ha enfrentado a crecientes preocupaciones respecto a sus prácticas de recopilación de datos, en particular en lo que respecta a los derechos de autor y el consentimiento. En junio, el organismo de control de la privacidad de Japón advirtió a OpenAI sobre la recopilación de datos sensibles sin la debida autorización. De manera similar, Italia impuso una prohibición temporal al uso de ChatGPT, alegando violaciones de las leyes de privacidad de la Unión Europea. Estos casos ponen de manifiesto el creciente escrutinio en torno a la privacidad de los datos y la tecnología de IA.
Cabe destacar que OpenAI se enfrentó recientemente a una demanda colectiva interpuesta por 16 demandantes que afirmaban que la empresa accedió a información privada de las interacciones de los usuarios con ChatGPT. Esta demanda, que también implica a Microsoft como demandado, sostiene que, de comprobarse las acusaciones, ambas empresas podrían infringir la Ley de Fraude y Abuso Informático, un marco legal que se ha aplicado históricamente a los casos de raspado web.
A medida que OpenAI se adentra en el mundo del rastreo web con GPTBot, abre nuevas posibilidades para perfeccionar sus modelos de IA. Sin embargo, estos avances vienen acompañados de consideraciones legales y éticas, ya que la industria de la IA se debate entre la innovación, la privacidad y el uso responsable de los datos.
OpenAI