OpenAI anunció que su modelo estrella, GPT-4.1, se implementará en ChatGPT. El modelo estará disponible para todas las cuentas de pago y usuarios de equipo en el menú desplegable del selector de modelos. OpenAI reveló que los usuarios gratuitos están excluidos del lanzamiento, pero los usuarios de Enterprise y Edu tendrán acceso.
GPT-4.0 mini será reemplazado por GPT-4.1 mini para todos los usuarios, incluidas las cuentas gratuitas. Los usuarios con opciones de pago también verán el modelo GPT-4.1 mini en su menú desplegable.
Según OpenAI, GPT-4.1 mini y GPT-4.1 están optimizados para tareas de codificación y respuesta de instrucciones mejorada, superando a GPT-4.0.
El GPT-4.1 de OpenAI supera al GPT-4.0 en todos los ámbitos
Según OpenAI, el modelo GPT-4.1 ofrece una ventana de contexto más amplia, compatible con hasta un millón de tokens de contexto y que permite un mejor uso del contexto con una comprensión extensa. La empresa de IA añadió que los ingenieros de software se beneficiarán del uso del modelo para desarrollar aplicaciones web.
Las notas de lanzamiento de OpenAI revelaron que los ingenieros pueden usar el modelo para ejecutar consultas diarias, preguntas de seguimiento, codificación y otras tareas complejas.
La empresa de inteligencia artificial dirigida por Sam Altman afirmó que el modelo GPT-4.1 puede procesar cantidades masivas de texto, imágenes y vídeos en el prompt, en comparación con el límite de 128.000 tokens de GPT-4.0. Según OpenAI , GPT-4.1 obtuvo una puntuación del 54,6% en SWE-bench Verified, una mejora del 21,4% respecto a GPT-4.0 y del 26,6% respecto a GPT-4.5, lo que lo convierte en el modelo líder para tareas de programación.
En la prueba MultiChallenge de Scale, que mide la capacidad de seguir instrucciones, GPT-4.1 obtuvo un 38,3 %, un aumento del 10,5 % con respecto a GPT-4.0. Además, en Video MME, una prueba para la comprensión de contextos largos multimodales, GPT-4.1 obtuvo una puntuación muy alta del 72,0 % en la categoría de contextos largos sin subtítulos, una mejora del 6,7 % con respecto a GPT-4.0.
OpenAI reveló que los benchmarks proporcionan información valiosa y que entrenaron los modelos con un enfoque en aplicaciones del mundo real. La compañía expresó su agradecimiento a la comunidad de desarrolladores por optimizar los modelos para tareas complejas.
GPT-4.1 viene sin un informe de seguridad
La comunidad de investigación de IA criticó a OpenAI por publicar el modelo GPT-4.1 sin el informe de seguridad, alegando que se redujeron los estándares de transparencia de los modelos de OpenAI.
La empresa de inteligencia artificial argumentó que, a pesar de ofrecer un rendimiento y una velocidad mejorados respecto de GPT-4.0, el modelo no requiere informes de seguridad como los modelos más avanzados, ya que no es el modelo de frontera.
GPT-4.1 no introduce nuevas modalidades ni formas de interactuar con el modelo, y no supera al modelo 03 en inteligencia. Esto significa que las consideraciones de seguridad, si bien sustanciales, difieren de las de los modelos de frontera
– Johannes Heidecke , Director de Seguridad de Open AI
La empresa de tecnología de inteligencia artificial publicó más información sobre GPT-4.1 en respuesta a las afirmaciones de seguridad. El miércoles, la compañía se comprometió a publicar con prontitud los resultados de las evaluaciones de seguridad de sus modelos internos como parte de un esfuerzo por aumentar la transparencia.
La compañía reveló que se esfuerza por destacar en un sector cada vez más competitivo. Según informes, la firma de IA está a punto de anunciar la adquisición por 3000 millones de dólares de Windsurf, una de las herramientas de programación de IA más conocidas. Windsurf compite con Cursor, otra popular herramienta de programación de IA, y con las funciones de programación de IA existentes de empresas como Microsoft y Anthropic.
Andrej Karpathy, exfundador de OpenAI, afirmó que Windsurf es una herramienta a la que los desarrolladores han recurrido en masa en los últimos meses para compilar código de nuevo software rápidamente. Entre los inversores de la startup se encuentran Founders Fund, General Catalyst, Greenoaks y Kleiner Perkins.
Google, por otro lado, actualizó su chatbot Gemini para conectarlo más fácilmente a proyectos de GitHub. La integración con GitHub se produce después de que OpenAI lanzara un conector de GitHub para de ChatGPT . Esta herramienta busca en la web y otras fuentes para compilar un informe de investigación exhaustivo sobre un tema.
El martes, OpenAI también dio la bienvenida a los conectores de SharePoint y Microsoft OneDrive a la investigación profunda de ChatGPT.
Fotografía de Focal Foto vía Flickr.