COMING SOON: A New Way to Earn Passive Income with DeFi in 2025 LEARN MORE

OpenAi finalmente revela el modelo GPT 4.5 AI, pero es menos capaz que los competidores en ciertas tareas

En esta publicación:

  • Operai finalmente ha presentado su modelo de AI más grande, GPT-4.5 con código 'Orión'.
  • GPT-4.5 LAGS en comparación con competidores como el soneto Claude 3.7 de Anthrope en tareas académicas.
  • Produce más respuestas cálidas en comparación con 4O y O3-Mini.

Operai ha presentado GPT-4.5, con el código de código de código, que marca lo que la compañía llama su modelo más grande hasta el momento. Muchos en la comunidad tecnológica han esperado ansiosamente el siguiente paso en la serie de modelos GPT, que previamente han demostrado saltos de dramatic en escritura, matemáticas, codificación y otros campos. 

El enfoque de la compañía para GPT-4.5 ha sido lanzarlo en etapas. Los suscriptores de los $ 200 al mes ChatGPT Pro de nivel obtienen acceso inmediato bajo una vista previa de investigación. Los desarrolladores en niveles pagados de la API de OpenAI también pueden acceder a GPT-4.5 de inmediato. Los clientes del equipo ChatGPT Plus y ChatGPT son los siguientes en la fila, con un portavoz de OpenAI que dice que el nuevo modelo debería estar disponible en algún momento de la próxima semana. El lanzamiento en parte, según OpenAI, se debe en parte a las demandas informáticas masivas detrás de este sistema "gigante".

Entre los círculos tecnológicos, la llegada de GPT-4.5 se ha visto como un indicador de si los métodos de entrenamiento tradicionales, principalmente ampliando la cantidad de datos y recursos informáticos, continuarían produciendo grandes ganancias de rendimiento. Hasta ahora, la serie GPT ha seguido un patrón bastante predecible. Versiones como GPT-1, GPT-2, GPT-3 y GPT-4 vieron saltos notables en la capacidad cada vez que OpenAI aplicó más potencia informática y se alimentó con más datos de entrenamiento.

En cada generación, los puntos de referencia a través de Mathematics, la competencia de escritura, la codificación y otras categorías subieron aliados de Dramatic. GPT-4.5 tiene como objetivo continuar esta tendencia con lo que la compañía describe como "un conocimiento mundial más profundo" y "mayor inteligencia emocional". Pero al mismo tiempo, los resultados de GPT-4.5 en ciertas pruebas indican que los retornos de simplemente escalar pueden estar nivelando.

Las características y limitaciones iniciales de GPT-4.5

Operai tiene cuidado de señalar que GPT-4.5 no debe verse como un sustituto directo de GPT-4O. GPT-4.5 incluye funcionalidades avanzadas, como soporte para cargas de archivos e imágenes y la herramienta de lienzo de ChatGPT para salidas creativas. Sin embargo, actualmente no admite el modo de voz bidireccional recientemente introducido de ChatGPT.

Ver también  Citi recorta el recorte del precio objetivo de Nvidia, cita un gasto de chips de IA más bajo de hiperscalers

Las evaluaciones tempranas administradas por OpenAI y otros investigadores revelan que GPT-4.5 supera a GPT-4O en varias categorías de pruebas. Por ejemplo, en el punto de referencia SimpleQA, una prueba diseñada para medir qué tan bien un modelo puede responder preguntas fácticas sencillas: GPT-4.5 publicó puntajes de precisión más altos que GPT-4O y también superó a los modelos de razonamiento O1 y O3-Mini de OpenAI. Según la compañía, GPT-4.5 "alucina" con menos frecuencia que muchos otros sistemas, lo que significa que es menos propenso a generar contenido que diverge de información real.

GPT-4.5 SimpleQA Benchmars. Fuente: OpenAI

En las evaluaciones de codificación, los resultados son más mixtos. En el punto de referencia verificado SWE-Bench, GPT-4.5 coincide aproximadamente con GPT-4O y O3-Mini pero no los supera. Esto coloca GPT-4.5 por debajo del modelo de investigación profunda de Openai y el soneto Claude 3.7 de Anthrope. 

GPT-4.5 SWE Benchmarks. Fuente: OpenAI

En una prueba de codificación diferente conocida como Swe-Lancer, GPT-4.5 funciona mejor que GPT-4O y O3-Mini, pero aún se queda atrás de una investigación profunda.

GPT-4.5 Swe-Lancer Benchmars. Fuente: OpenAI

El desempeño de GPT-4.5 también diverge en desafíos de referencia académica. En AIME y GPQA, no logra los resultados vistos por modelos de primer nivel como O3-Mini, Deepseek's R1 o el soneto Claude 3.7 de Anthrope. Sin embargo, GPT-4.5 coincide o, a veces, supera a los modelos principales que no se clasifican como sistemas de "razonamiento", lo que destaca que GPT-4.5 conserva capacidades sólidas de matemáticas y ciencias.

Operai también ha promocionado las fortalezas de GPT-4.5 en áreas menos cuantificables. La compañía dice que GPT-4.5 puede comprender mejor las intenciones humanas y producir respuestas que se sientan más cálidas, más naturales y más conscientes socialmente. 

Una prueba informal incluyó el aviso: "Estoy pasando por un momento difícil después de fallar una prueba". Si bien los otros dos modelos ofrecían información útil, se dijo que GPT-4.5 respondía con mayor empatía y sensibilidad emocional.

"[Esperamos obtener una imagen más completa de las capacidades de GPT-4.5 a través de este lanzamiento", escribió Openii en la publicación del blog, "porque reconocemos los puntos de referencia académicos no siempre reflejan la utilidad del mundo real".

GPT-4.5 da respuestas más cálidas que 4O y O3-Mini. Fuente: OpenAI

Leyes de escala bajo escrutinio

GPT-4.5 se construyó con la misma estrategia de entrenamiento no supervisada utilizada para versiones anteriores de GPT, una estrategia que hasta ahora ha demostrado ser confiable. Sin embargo, su rendimiento limitado en ciertos puntos de referencia de alto nivel podría ser una señal de que las "leyes de escala" tradicionales de la industria pueden estar perdiendo vapor.

Ilya Sutskever, cofundadora y ex científica jefe de OpenAi, comentó en diciembre que "hemos logrado datos máximos" y que "la capacitación previa como sabemos sin duda terminará". En ese momento, insinuó que las ganancias futuras dependerían de otros métodos, como los sistemas que pueden razonar más profundamente sobre problemas en lugar de simplemente memorizar franjas masivas de información. 

Ver también  el imperio de Zuckerberg en riesgo mientras Meta se prepara para el lunes antimonopolio
Ilya Sutskever y Sam Altman en Tau. Fuente: Tauvod en YouTube

GPT-4.5 fue aparentemente "increíblemente caro de entrenar", como se mencionó en su libro blanco , y los rumores circularon durante meses que OpenAi había retrasado el lanzamiento varias veces debido a los obstáculos de rendimiento y los costos. Aun así, GPT-4.5 solo no parece superar los modelos de razonamiento especializados de los competidores en muchas tareas avanzadas. La compañía misma lo considera como otro hito de desarrollo en el camino para combinar la tecnología GPT con sus sistemas de razonamiento "O", se espera que una integración comience con el lanzamiento de GPT-5 a finales de este año.

Comentarios del CEO Sam Altman sobre la escasez de GPU

El CEO de Operai, Sam Altman, llevó a X (anteriormente Twitter) para explicar por qué el despliegue del último modelo está sucediendo en fases. "Hemos estado creciendo mucho y estamos fuera de las GPU", escribió Altman, llamando a GPT-4.5 "gigante" y "caro" y advirtiendo que la compañía necesitaría "decenas de miles" más GPU antes de abrir el modelo al resto de la base de usuarios.

Debido a su gran tamaño, GPT-4.5 está demostrando ser muy costoso. Operai cobra $ 75 por millón de tokens por la entrada y $ 150 por millón de tokens generados por el modelo. Eso es 30x y 15x el costo de entrada/salida en comparación con el modo GPT-4O.

Él elaboró ​​aún más: "Agregaremos decenas de miles de GPU la próxima semana y lo lanzaremos al nivel más ... así no es así como queremos operar, pero es difícil predecir perfectamente las oleadas de crecimiento que conducen a la escasez de GPU".

Academia Cryptopolitan: Próximamente, una nueva forma de obtener ingresos pasivos con DeFi en 2025. Obtenga más información

Compartir enlace:

Descargo de responsabilidad. La información proporcionada no es un consejo comercial. Cryptopolitan.com no asume ninguna responsabilidad por las inversiones realizadas en función de la información proporcionada en esta página. Recomendamos tron dent independiente y/o la consulta con un profesional calificado antes de tomar cualquier decisión de inversión.

Mas leido

Cargando los artículos más leídos...

Manténgase al tanto de las noticias sobre criptomonedas y reciba actualizaciones diarias en su bandeja de entrada

elección del editor

Cargando artículos elegidos por el editor...

- El boletín de cifrado que te mantiene por delante -

Los mercados se mueven rápidamente.

Nos movemos más rápido.

Suscríbase a Cryptopolitan diariamente y obtenga ideas criptográficas oportunas, agudas y relevantes directamente a su bandeja de entrada.

Únete ahora y
nunca te pierdas un movimiento.

Entra. Obtén los hechos.
Adelantarse.

Suscríbete a CryptoPolitan