Operai ha presentado GPT-4.5, con el código de código de código, que marca lo que la compañía llama su modelo más grande hasta el momento. Muchos en la comunidad tecnológica han esperado ansiosamente el siguiente paso en la serie de modelos GPT, que previamente han demostrado saltos de dramatic en escritura, matemáticas, codificación y otros campos.
El enfoque de la compañía para GPT-4.5 ha sido lanzarlo en etapas. Los suscriptores de los $ 200 al mes ChatGPT Pro de nivel obtienen acceso inmediato bajo una vista previa de investigación. Los desarrolladores en niveles pagados de la API de OpenAI también pueden acceder a GPT-4.5 de inmediato. Los clientes del equipo ChatGPT Plus y ChatGPT son los siguientes en la fila, con un portavoz de OpenAI que dice que el nuevo modelo debería estar disponible en algún momento de la próxima semana. El lanzamiento en parte, según OpenAI, se debe en parte a las demandas informáticas masivas detrás de este sistema "gigante".
Hoy estamos lanzando una vista previa de investigación de GPT-4.5, nuestro mayor y mejor modelo para chat hasta ahora.
— OpenAI (@OpenAI) 27 de febrero de 2025
Llegando ahora a todos los usuarios de ChatGPT Pro, seguidos de los usuarios de Plus y Team la próxima semana, luego los usuarios de Enterprise y EDU la semana siguiente. pic.twitter.com/br5win5oeb
Entre los círculos tecnológicos, la llegada de GPT-4.5 se ha visto como un indicador de si los métodos de entrenamiento tradicionales, principalmente ampliando la cantidad de datos y recursos informáticos, continuarían produciendo grandes ganancias de rendimiento. Hasta ahora, la serie GPT ha seguido un patrón bastante predecible. Versiones como GPT-1, GPT-2, GPT-3 y GPT-4 vieron saltos notables en la capacidad cada vez que OpenAI aplicó más potencia informática y se alimentó con más datos de entrenamiento.
En cada generación, los puntos de referencia a través de Mathematics, la competencia de escritura, la codificación y otras categorías subieron aliados de Dramatic. GPT-4.5 tiene como objetivo continuar esta tendencia con lo que la compañía describe como "un conocimiento mundial más profundo" y "mayor inteligencia emocional". Pero al mismo tiempo, los resultados de GPT-4.5 en ciertas pruebas indican que los retornos de simplemente escalar pueden estar nivelando.
Las características y limitaciones iniciales de GPT-4.5
Operai tiene cuidado de señalar que GPT-4.5 no debe verse como un sustituto directo de GPT-4O. GPT-4.5 incluye funcionalidades avanzadas, como soporte para cargas de archivos e imágenes y la herramienta de lienzo de ChatGPT para salidas creativas. Sin embargo, actualmente no admite el modo de voz bidireccional recientemente introducido de ChatGPT.
Las evaluaciones tempranas administradas por OpenAI y otros investigadores revelan que GPT-4.5 supera a GPT-4O en varias categorías de pruebas. Por ejemplo, en el punto de referencia SimpleQA, una prueba diseñada para medir qué tan bien un modelo puede responder preguntas fácticas sencillas: GPT-4.5 publicó puntajes de precisión más altos que GPT-4O y también superó a los modelos de razonamiento O1 y O3-Mini de OpenAI. Según la compañía, GPT-4.5 "alucina" con menos frecuencia que muchos otros sistemas, lo que significa que es menos propenso a generar contenido que diverge de información real.
En las evaluaciones de codificación, los resultados son más mixtos. En el punto de referencia verificado SWE-Bench, GPT-4.5 coincide aproximadamente con GPT-4O y O3-Mini pero no los supera. Esto coloca GPT-4.5 por debajo del modelo de investigación profunda de Openai y el soneto Claude 3.7 de Anthrope.
En una prueba de codificación diferente conocida como Swe-Lancer, GPT-4.5 funciona mejor que GPT-4O y O3-Mini, pero aún se queda atrás de una investigación profunda.
El desempeño de GPT-4.5 también diverge en desafíos de referencia académica. En AIME y GPQA, no logra los resultados vistos por modelos de primer nivel como O3-Mini, Deepseek's R1 o el soneto Claude 3.7 de Anthrope. Sin embargo, GPT-4.5 coincide o, a veces, supera a los modelos principales que no se clasifican como sistemas de "razonamiento", lo que destaca que GPT-4.5 conserva capacidades sólidas de matemáticas y ciencias.
Operai también ha promocionado las fortalezas de GPT-4.5 en áreas menos cuantificables. La compañía dice que GPT-4.5 puede comprender mejor las intenciones humanas y producir respuestas que se sientan más cálidas, más naturales y más conscientes socialmente.
Una prueba informal incluyó el aviso: "Estoy pasando por un momento difícil después de fallar una prueba". Si bien los otros dos modelos ofrecían información útil, se dijo que GPT-4.5 respondía con mayor empatía y sensibilidad emocional.
"[Esperamos obtener una imagen más completa de las capacidades de GPT-4.5 a través de este lanzamiento", escribió Openii en la publicación del blog, "porque reconocemos los puntos de referencia académicos no siempre reflejan la utilidad del mundo real".
Leyes de escala bajo escrutinio
GPT-4.5 se construyó con la misma estrategia de entrenamiento no supervisada utilizada para versiones anteriores de GPT, una estrategia que hasta ahora ha demostrado ser confiable. Sin embargo, su rendimiento limitado en ciertos puntos de referencia de alto nivel podría ser una señal de que las "leyes de escala" tradicionales de la industria pueden estar perdiendo vapor.
Ilya Sutskever, cofundadora y ex científica jefe de OpenAi, comentó en diciembre que "hemos logrado datos máximos" y que "la capacitación previa como sabemos sin duda terminará". En ese momento, insinuó que las ganancias futuras dependerían de otros métodos, como los sistemas que pueden razonar más profundamente sobre problemas en lugar de simplemente memorizar franjas masivas de información.
GPT-4.5 fue aparentemente "increíblemente caro de entrenar", como se mencionó en su libro blanco , y los rumores circularon durante meses que OpenAi había retrasado el lanzamiento varias veces debido a los obstáculos de rendimiento y los costos. Aun así, GPT-4.5 solo no parece superar los modelos de razonamiento especializados de los competidores en muchas tareas avanzadas. La compañía misma lo considera como otro hito de desarrollo en el camino para combinar la tecnología GPT con sus sistemas de razonamiento "O", se espera que una integración comience con el lanzamiento de GPT-5 a finales de este año.
Comentarios del CEO Sam Altman sobre la escasez de GPU
El CEO de Operai, Sam Altman, llevó a X (anteriormente Twitter) para explicar por qué el despliegue del último modelo está sucediendo en fases. "Hemos estado creciendo mucho y estamos fuera de las GPU", escribió Altman, llamando a GPT-4.5 "gigante" y "caro" y advirtiendo que la compañía necesitaría "decenas de miles" más GPU antes de abrir el modelo al resto de la base de usuarios.
¡GPT-4.5 está listo!
— Sam Altman (@sama) 27 de febrero de 2025
Buenas noticias: es el primer modelo que se siente como hablar con una persona reflexiva para mí. He tenido varios momentos en los que me he recuperado en mi silla y me sorprendió obtener un buen consejo de una IA.
Malas noticias: es un modelo gigante y costoso. nosotros…
Debido a su gran tamaño, GPT-4.5 está demostrando ser muy costoso. Operai cobra $ 75 por millón de tokens por la entrada y $ 150 por millón de tokens generados por el modelo. Eso es 30x y 15x el costo de entrada/salida en comparación con el modo GPT-4O.
Él elaboró aún más: "Agregaremos decenas de miles de GPU la próxima semana y lo lanzaremos al nivel más ... así no es así como queremos operar, pero es difícil predecir perfectamente las oleadas de crecimiento que conducen a la escasez de GPU".
Academia Cryptopolitan: Próximamente, una nueva forma de obtener ingresos pasivos con DeFi en 2025. Obtenga más información