Recientemente, Open AI lanzó una versión más sofisticada del modelo o1reasoning, denominada o1 pro mode. El chatbot se presentó el jueves y tiene un precio de 200 dólares al mes. Sin embargo, la comunidad no está segura de cómo interpretarlo.
El nuevo plan ChatGPT Pro de la empresa brinda acceso al “modo o1 pro”, que utiliza potencia informática adicional para brindar las respuestas más completas y confiables a las consultas más desafiantes relacionadas con la ciencia, las matemáticas y la codificación.
Bob McGrew, ex director de Open AI, consideró que el modo o1 pro es un ejemplo de “exceso de inteligencia”, que se refiere a la incapacidad de los usuarios (y potencialmente de los creadores del modelo) de obtener valor de cualquier “inteligencia adicional” como resultado de las limitaciones inherentes de una interfaz simple basada en texto.
ChatGPT es el único método de interacción con el modo o1 pro, al igual que con los demás modelos de OpenAI. Bob McGrew señaló que ChatGPT no es perfecto. Añadió que es cierto que $200 genera expectativas elevadas. Además, ChatGPT Pro no es una tarea fácil, como lo demuestra su recepción inicial en redes sociales.
Así se ha ponderado el nuevo asistente de IA abierto
Según informes , el modo pro de o1 será la suscripción de chatbot más cara del mundo, ya que la cuota mensual de $200 se traducirá en una anual de $2400. Sin embargo, el servicio ofrece otras ventajas, como la eliminación de los límites de velocidad y acceso ilimitado a otros modelos de OpenAI.
El científico informático británico Simon Willison preguntó: "¿OpenAI ha compartido ejemplos concretos de indicaciones que fallan en el o1 normal pero tienen éxito en el o1-pro?"
Por el contrario, ya se han documentado fallos. El sudoku es un desafío para el modo profesional o1, y se ve obstaculizado por una comedia de ilusiones ópticas fácilmente evidente para cualquier persona.
Un ingeniero de IA, Tibor Blaho, escribió en X : «tanto o1 como o1-pro fallaron aquí, probablemente debido a las limitaciones visuales (lo mismo ocurre con los sudokus)». Tibor Blaho también señaló que tanto o1 como o1-pro fallaron en cuanto a capacidades visuales.
Tanto o1 como o1-pro fallaron aquí, probablemente debido a las limitaciones de visión (lo mismo ocurre con los sudokus) https://t.co/mAVK7WxBrq pic.twitter.com/O9boSv7ZGt
— Tibor Blaho (@btibor91) 5 de diciembre de 2024
El código o1-pro no pudo comprender/leer el rompecabezas correctamente.
Según los puntos de referencia internos de OpenAI, el o1 estándar tiene un rendimiento apenas superior al del modo o1 pro en problemas de codificación y matemáticas.
Para demostrar la consistencia del modo o1 pro, OpenAI realizó una evaluación más rigurosa de los mismos parámetros. Se consideró que el modelo solo había resuelto una pregunta sidentcorrectamente la respuesta cuatro de cuatro veces. Sin embargo, las mejoras no fueron sustanciales en estas evaluaciones.
El jueves, el director ejecutivo de OpenAI, Sam Altman, se vio obligado a reiterar que ChatGPT Pro no es adecuado para la mayoría de las personas, a pesar de su afirmación anterior de que OpenAI estaba progresando hacia una inteligencia que era "demasiado barata para medir"
Dijo: “¡La mayoría de los usuarios estarán muy contentos con el o1 en el nivel [ChatGPT] Plus!”
Bob McGrew dijo que la confiabilidad mejorada puede ser el factor más importante para o1 pro, especialmente para el campo médico.
Opiniones sobre el coste
Ameet Talwalkar, profesor asociado de aprendizaje automático en Carnegie Mellon y socio de riesgo en Amplify Partners, dijo: "Me parece un gran riesgo aumentar el precio diez veces ", agregó. "Creo que tendremos una idea mucho mejor en unas pocas semanas en cuanto al apetito por esta funcionalidad".
Guy Van den Broeck, científico informático de la UCLA, dijo: "No sé si el precio tiene sentido y si los modelos de razonamiento costosos serán la norma".
A los consumidores potenciales no se les proporciona una cantidad significativa de información cuando el modo o1 pro se describe como el más eficaz para resolver “los problemas más difíciles”
Es difícil justificar un mayor pago en ausencia de ejemplos específicos de las capacidades supuestamente mejoradas del modelo, que incluyen la capacidad de “pensar más” y exhibir “inteligencia”

