OpenAI GPT-5 recibe críticas mixtas en su primer día

- OpenAI lanzó GPT-5 después de meses de publicidad, prometiendo grandes avances en razonamiento, codificación y velocidad.
- Las primeras críticas son mixtas: algunas elogian sus capacidades y otras señalan errores matemáticos, ortográficos y de razonamiento.
- Los usuarios se mostraron indignados por la reducción de la transparencia y la pérdida de modelos más antiguos como GPT-4o.
El director ejecutivo de OpenAI, Sam Altman, había estado insinuando GPT-5 durante meses. Afirmaba que se trataba de un modelo avanzado: más inteligente, más rápido y capaz de pensar a nivel de doctorado. La compañía presentó este lanzamiento como un gran avance para ChatGPT, destinado a impulsar mejoras de inteligencia en la codificación, el razonamiento y la precisión.
Pero las primeras reacciones no son tan claras. Los desarrolladores elogiaron el modelo por comprender instrucciones complejas y generar código bien estructurado. Simon Willison, uno de los primeros evaluadores, describió GPT-5 como "competente" y "a veces impresionante", pero no un gran salto con respecto a GPT-4. Otros se mostraron menos impresionados.
Varias publicaciones en redes sociales rápidamente se convirtieron en quejas sobre numerosos errores factuales, deficiencias en las habilidades matemáticas y, en algunos casos, incluso errores ortográficos básicos. Noah Giansiracusa, profesor de matemáticas de la Universidad de Bentley, calificó el comunicado de "decepcionante" y señaló que las actualizaciones en cuestión parecían "más marginales de lo que esperaba"
Parte de la confusión se debía a la arquitectura del modelo. GPT-5 incluía un selector automático para los distintos tamaños de modelo, según la tarea. Esto ahorraba procesamiento y evitaba tener que acceder a la versión completa de GPT-5, lo que generó vulnerabilidades. Al responder incorrectamente a una pregunta del sistema, el agente con el que interactuaba le indicaba que pensara más detenidamente cuántas letras "b" tiene la palabra "blueberry". Tras esta retroalimentación, acertó la respuesta al ser consultado.
Los usuarios se resisten y OpenAI responde
La frustración podría extenderse a Reddit y X para el viernes. Y si bien algunos usuarios odiaban el hecho de no saber quién o incluso de qué modelo provenía el texto, muchos sentían que el infierno era solo una inferencia, y GPT-5 reemplazó a sus antiguos favoritos en los que confiaban. Algunos dijeron que la calidad se ha visto afectada, que la escritura no es tan buena como con GPT-4.5, algo que ustedes coincidieron en que debería ser, y que algunos aspectos creativos y técnicos se sintieron peor.
Esta charla llevó al director ejecutivo de OpenAI a participar en una sesión de preguntas y respuestas en Reddit para abordar las críticas. Explicó que un error en el selector automático impidió que GPT-5 funcionara por debajo de su máximo potencial desde el primer día. Prometió mayor transparencia en futuras transiciones de modelos: «A partir de hoy, GPT-5 debería ser cada vez más inteligente». OpenAI también prometió reimplementar modelos anteriores, como GPT-4o, para quienes expresaron su preferencia, en un esfuerzo por apaciguar a las críticas más enérgicas.
El hecho de que necesitara actuar con tanta rapidez pone de manifiesto lo mucho que había en juego. Hoy en día, OpenAI se encuentra en una carrera vertiginosa con competidores como Anthropic, Google DeepMind e incluso xAI de Elon Musk. Con tanta competencia, un pequeño desliz y pronto tu competidor te llevará ventaja.
La competencia se intensifica en la carrera de la IA
A pesar de estas diferencias, la acogida de GPT-5 fue tibia, pero eso no impidió que alcanzara el primer puesto en LMArena, una clasificación de modelos de entrenamiento impulsada por los usuarios. Si bien no era lo que hoy consideraríamos programable, era extremadamente rápido y expresivo, capaz de gestionar consultas grandes y complejas. Sin embargo, otras pruebas de rendimiento mostraron un panorama de problemas diferente y más desafiante. Grok 4, de xAI (la empresa de Musk), obtuvo una puntuación tan alta en ARC-AGI-2 (un conjunto de pruebas de razonamiento avanzado) que supuso un desafío significativo para la supremacía de OpenAI.
Algunos analistas del sector especulan que pasará al menos un día antes de que se comprendan plenamente los efectos de GPT-5, similar a avances anteriores de la empresa, como GPT-3. GPT-5 y GPT-4 recibieron una reacción negativa significativa antes de ver mejoras en actualizaciones y otros casos de uso. El modelo tiene el potencial de tener éxito (o fracasar) dependiendo de su utilidad para el flujo de trabajo diario, y hay casi 700 millones de usuarios semanales de ChatGPT en todo el mundo.
En palabras del profesor de Wharton Ethan Mollick: «El GPT-5 simplemente hace cosas, a veces asombrosas, a veces desconcertantes, por sí solo. Eso es lo que lo hace tan intrigante. Sigue siendo un enfoque tecnocrático y un tanto inquietante calificar de «interesantes» este tipo de cuestiones de la esfera de la salud pública»
No te limites a leer noticias sobre criptomonedas. Entiéndelas. Suscríbete a nuestro boletín. Es gratis.
CURSO
- ¿Qué criptomonedas pueden hacerte ganar dinero?
- Cómo mejorar tu seguridad con una billetera (y cuáles realmente vale la pena usar)
- Estrategias de inversión poco conocidas que utilizan los profesionales
- Cómo empezar a invertir en criptomonedas (qué plataformas de intercambio usar, las mejores criptomonedas para comprar, etc.)















