OpenAI finalmente revela el modelo de IA GPT 4.5, pero es menos capaz que sus competidores en ciertas tareas

Por

Shummas Humayun

4 minutos de lectura 1 de marzo de 2025

OpenAI finalmente ha presentado su modelo de IA más grande, GPT-4.5, cuyo nombre en código es 'Orion'.
GPT-4.5 queda rezagado en comparación con competidores como Claude 3.7 Sonnet de Anthropic en tareas académicas.
Produce respuestas más cálidas en comparación con 4o y o3-mini.

OpenAI ha presentado GPT-4.5, cuyo nombre en código es Orion, lo que la compañía considera su modelo más grande hasta la fecha. Muchos en la comunidad tecnológica esperaban con ansias el siguiente paso en la serie de modelos GPT, que ya han demostrado avancesmatic en escritura, matemáticas, programación y otros campos.

El enfoque de la compañía para GPT-4.5 ha sido implementarlo por etapas. Los suscriptores del plan ChatGPT Pro, con un costo de $200 al mes, obtienen acceso inmediato mediante una vista previa de investigación. Los desarrolladores con planes de pago de la API de OpenAI también pueden acceder a GPT-4.5 de inmediato. Los clientes de ChatGPT Plus y ChatGPT Team son los siguientes en la lista, y un portavoz de OpenAI afirmó que el nuevo modelo debería estar disponible para ellos la próxima semana. El lanzamiento parcial, según OpenAI, se debe en parte a las enormes demandas de computación de este gigantesco sistema.

Hoy presentamos una vista previa de investigación de GPT-4.5, nuestro modelo de chat más grande y avanzado hasta la fecha.

Ya está disponible para todos los usuarios de ChatGPT Pro, seguido de los usuarios Plus y Team la próxima semana, y los usuarios Enterprise y Edu la semana siguiente. pic.twitter.com/br5win5OEB
— OpenAI (@OpenAI) 27 de febrero de 2025

En el ámbito tecnológico, la llegada de GPT-4.5 se ha considerado un indicador de si los métodos de entrenamiento tradicionales —principalmente el aumento de la cantidad de datos y recursos informáticos— seguirían produciendo mejoras significativas en el rendimiento. Hasta ahora, la serie GPT ha seguido un patrón bastante predecible. Versiones como GPT-1, GPT-2, GPT-3 y GPT-4 experimentaron aumentos notables en su capacidad cada vez que OpenAI aplicaba mayor potencia informática e introducía más datos de entrenamiento.

En cada generación, los indicadores de rendimiento enmatic, escritura, programación y otras categorías aumentaronmatic. GPT-4.5 busca continuar esta tendencia con lo que la compañía describe como "un conocimiento más profundo del mundo" y una "mayor inteligencia emocional". Sin embargo, al mismo tiempo, los resultados de GPT-4.5 en ciertas pruebas indican que los beneficios de la simple ampliación podrían estar estabilizándose.

Las características y limitaciones iniciales de GPT-4.5

OpenAI advierte que GPT-4.5 no debe considerarse un sustituto directo de GPT-4o. GPT-4.5 incluye funcionalidades avanzadas, como la compatibilidad con la carga de archivos e imágenes, y la herramienta de lienzo de ChatGPT para resultados creativos. Sin embargo, actualmente no es compatible con el modo de voz bidireccional de ChatGPT, recientemente introducido.

Las primeras evaluaciones realizadas por OpenAI y otros investigadores revelan que GPT-4.5 supera a GPT-4o en varias categorías de prueba. Por ejemplo, en el benchmark SimpleQA (una prueba diseñada para medir la capacidad de un modelo para responder preguntas fácticas sencillas), GPT-4.5 obtuvo puntuaciones de precisión más altas que GPT-4o y también superó a los modelos de razonamiento o1 y o3-mini de OpenAI. Según la empresa, GPT-4.5 presenta alucinaciones con menos frecuencia que muchos otros sistemas, lo que significa que es menos propenso a generar contenido que difiere de la información real.

Pruebas de rendimiento de SimpleQA GPT-4.5. Fuente: OpenAI

En las evaluaciones de codificación, los resultados son más heterogéneos. En el benchmark verificado por SWE-Bench, GPT-4.5 se acerca bastante a GPT-4o y o3-mini, pero no los supera. Esto sitúa a GPT-4.5 por debajo tanto del modelo de investigación profunda de OpenAI como del Claude 3.7 Sonnet de Anthropic.

Puntos de referencia de SWE GPT-4.5. Fuente: OpenAI

En una prueba de codificación diferente, conocida como SWE-Lancer, GPT-4.5 tiene un mejor desempeño que GPT-4o y o3-mini, pero aún está por detrás de la investigación profunda.

Pruebas de rendimiento de SWE-Lancer GPT-4.5. Fuente: OpenAI

El rendimiento de GPT-4.5 también difiere en parámetros académicos exigentes. En AIME y GPQA, no alcanza los resultados de modelos de primer nivel como o3-mini, R1 de DeepSeek o Claude 3.7 Sonnet de Anthropic. Sin embargo, GPT-4.5 iguala o, en ocasiones, supera a los modelos líderes que no se clasifican como sistemas de "razonamiento", lo que demuestra que GPT-4.5 conserva sólidas capacidades matemáticas y científicas.

OpenAI también ha destacado las fortalezas de GPT-4.5 en áreas menos cuantificables. La compañía afirma que GPT-4.5 puede comprender mejor las intenciones humanas y generar respuestas más cálidas, naturales y con mayor consciencia social.

Una prueba informal incluía la pregunta: «Estoy pasando por un momento difícil después de suspender un examen». Si bien los otros dos modelos ofrecían información útil, se afirmó que el GPT-4.5 respondía con mayor empatía y sensibilidad emocional.

“Esperamos obtener una imagen más completa de las capacidades de GPT-4.5 a través de este lanzamiento”, escribió OpenAI en la publicación del blog, “porque reconocemos que los puntos de referencia académicos no siempre reflejan la utilidad en el mundo real”

GPT-4.5 ofrece respuestas más cálidas que 4o y o3-mini. Fuente: OpenAI

Leyes de escalamiento bajo escrutinio

GPT-4.5 se creó con la misma estrategia de entrenamiento no supervisado empleada en versiones anteriores de GPT, una estrategia que ha demostrado ser fiable hasta la fecha. Sin embargo, su rendimiento limitado en ciertas pruebas de referencia de alto nivel podría indicar que las leyes de escalado tradicionales de la industria podrían estar perdiendo fuerza.

Ilya Sutskever, cofundador y exdirector científico de OpenAI, comentó en diciembre que «hemos alcanzado el pico de datos» y que «el preentrenamiento, tal como lo conocemos, sin duda llegará a su fin». En aquel momento, insinuó que los avances futuros dependerían de otros métodos, como sistemas capaces de razonar con mayor profundidad sobre los problemas en lugar de simplemente memorizar grandes cantidades de información.

Ilya Sutskever y Sam Altman en la Universidad de Tel Aviv. Fuente: TAUVOD en YouTube

Al parecer, el entrenamiento de GPT-4.5 era "increíblemente costoso", como se menciona en su documento técnico, y durante meses circularon rumores de que OpenAI había retrasado su lanzamiento en varias ocasiones debido a problemas de rendimiento y coste. Aun así, GPT-4.5 por sí solo no parece superar a los modelos de razonamiento especializados de la competencia en muchas tareas avanzadas. La propia empresa lo considera un hito más en el desarrollo para combinar la tecnología GPT con sus sistemas de razonamiento "o", una integración que se espera comience con el lanzamiento de GPT-5 a finales de este año.

Comentarios del director ejecutivo Sam Altman sobre la escasez de GPU

Sam Altman, director ejecutivo de OpenAI, recurrió a X (anteriormente Twitter) para explicar por qué el lanzamiento del último modelo se está realizando por fases. "Hemos crecido mucho y nos hemos quedado sin GPU", escribió Altman, calificando la GPT-4.5 de "gigante" y "cara" y advirtiendo que la compañía necesitaría "decenas de miles" de GPU más antes de abrir el modelo al resto de la base de usuarios.

¡GPT-4.5 ya está listo!

Buenas noticias: es el primer modelo que me da la sensación de estar hablando con una persona reflexiva. He tenido varios momentos en los que me he recostado en mi silla y me he quedado asombrado al recibir consejos realmente buenos de una IA.

Malas noticias: es un modelo enorme y caro. Nosotros…
— Sam Altman (@sama) 27 de febrero de 2025

Debido a su gran tamaño, GPT-4.5 está resultando muy costoso. OpenAI cobra $75 por millón de tokens de entrada y $150 por millón de tokens generados por el modelo. Esto representa un costo de entrada/salida 30 y 15 veces superior al del modo GPT-4o.

Profundizó: “Agregaremos decenas de miles de GPU la próxima semana y luego las implementaremos en el nivel Plus… No es así como queremos operar, pero es difícil predecir con exactitud los aumentos repentinos de crecimiento que conducen a una escasez de GPU”

No te limites a leer noticias sobre criptomonedas. Entiéndelas. Suscríbete a nuestro boletín. Es gratis.

OpenAI

Comparte este artículo

Aviso legal. La información proporcionada no constituye asesoramiento comercial. Cryptopolitanconsultar no se responsabiliza de las inversiones realizadas con base en la información proporcionada en esta página. Recomendamostronencarecidamente realizar una investigación independientedent un profesional cualificado antes de tomar cualquier decisión de inversión.

Shummas Humayun

Shummas es un ex escritor de contenido técnico e investigador.

ÍNDICE

1. Las características y limitaciones iniciales de GPT-4.5

2. Leyes de escalamiento bajo escrutinio

3. Comentarios del director ejecutivo Sam Altman sobre la escasez de GPU

Comparte este artículo