ÚLTIMAS NOTICIAS
SELECCIONADO PARA TI
SEMANALMENTE
MANTÉNGASE EN LA CIMA

Los mejores análisis sobre criptomonedas directamente en tu bandeja de entrada.

El agente operador de OpenAI recibe un impulso con un nuevo modelo de IA

PorCollins J. OkothCollins J. Okoth
3 minutos de lectura
El agente operador de OpenAI recibe un impulso con un nuevo modelo de IA
  • OpenAI actualizó Operator, su agente de IA que utiliza la web para realizar tareas, a un modelo basado en o3 después de usar previamente una versión personalizada de GPT-4o.
  • El operador o3 fue perfeccionado con datos de seguridad adicionales para uso informático, incluidos conjuntos de datos de seguridad diseñados para enseñar los límites de decisión del modelo.
  • Mike Knoop, cofundador de la Fundación Arc Prize, cree que ejecutar el modelo o3 podría ser más costoso de lo esperado.

OpenAI actualizó el modelo de IA que impulsa a Operator, de la versión personalizada anterior de GPT-4o, a un modelo basado en o3, uno de los modelos de razonamiento más recientes de la serie o de OpenAI. Operator o3 se perfeccionó con datos de seguridad adicionales para su uso informático e incluyó conjuntos de datos de seguridad diseñados para enseñar los límites de decisión del modelo.

OpenAI actualizó el Operador en ChatGPT con un nuevo modelo de Agente de Uso de Computadora (CUA) basado en una versión de OpenAI o3. Con este nuevo modelo, el Operador se volvió más persistente y preciso al interactuar con el navegador, lo que mejoró la tasa general de éxito de las tareas. Además, ofrece respuestas mejor estructuradas, más claras y completas.

Según OpenAI, el nuevo modelo CUA mostró untronal de la industria, alcanzando la puntuación SOTA en OSWorld y WebArena. También mostró untronal de la versión anterior, tanto en los benchmarks establecidos como en las evaluaciones de preferencias humanas.

OpenAI reemplaza el modelo basado en GPT‑4o con una versión basada en o3

OpenAI reemplazó el modelo existente basado en GPT‑4o para Operator con una versión basada en OpenAI o3, aunque la versión API seguirá basada en 4o. La empresa de IA también afirmó que Operator o3 utiliza el mismo enfoque de seguridad multicapa empleado para la versión 4o.

Sin embargo, en comparación con otros modelos de la familia o3, el operador o3 fue perfeccionado con datos de seguridad adicionales para uso informático, incluidos conjuntos de datos de seguridad diseñados para enseñar al modelo los límites de decisión sobre confirmaciones y rechazos.

OpenAI publicó un informe técnico que muestra el rendimiento del operador o3 en evaluaciones de seguridad específicas. En comparación con el modelo operador GPT-4o, el operador o3 fue menos propenso a negarse a realizar actividades "ilícitas" y a buscar datos personales sensibles, y menos susceptible a un tipo de ataque de IA conocido como "inyección instantánea". 

“o3 Operator utiliza el mismo enfoque multicapa para la seguridad que usamos para la versión 4o de Operator… Si bien o3 Operator hereda las capacidades de codificación de o3, no tiene acceso nativo a un entorno de codificación ni a una terminal”

OpenAI

La empresa de inteligencia artificial también reveló que el nuevo modelo basado en o3 superó las evaluaciones de seguridad estándar y que Operator seguía estando disponible como versión preliminar para investigación para los usuarios de ChatGPT Pro a nivel mundial. Sin embargo, este modelo actualizado solo estaba disponible en Operator en ChatGPT.

Knoop sospecha que ejecutar el modelo o3 de OpenAI podría ser más costoso de lo esperado

La semana pasada, la Fundación Arc Prize, encargada del mantenimiento y la administración de ARC-AGI, actualizó sus costos computacionales aproximados para o3. La organización estimó inicialmente que la configuración de o3 con mejor rendimiento que probó (o3 high) costaba alrededor de $3,000 para resolver un solo problema de ARC-AGI. Sin embargo, la Fundación ahora cree que el costo podría ser diez veces mayor de lo estimado previamente, posiblemente alrededor de $30,000 por tarea.

Además, si bien OpenAI aún no ha anunciado el precio de o3 ni lo ha lanzado por completo, Mike Knoop, uno de los cofundadores de la Fundación Arc Prize, cree que el precio del modelo o1-pro es un indicador razonable y una comparación más precisa del costo real de o3. Sin embargo, añadió que o3 seguiría apareciendo como una versión preliminar en la clasificación para reflejar la incertidumbre hasta que se anuncie el precio oficial.

Según la Arc Prize Foundation, no estaría fuera de cuestión un precio alto para o3 high, dada la cantidad de recursos computacionales que supuestamente utiliza el modelo. o3 high utilizó 172 veces más recursos computacionales que o3 low, la configuración de menor capacidad computacional de o3, para abordar ARC-AGI.

rumores circulan sobre los costosos planes que OpenAI estaba considerando ofrecer a sus clientes empresariales. Según la información, la compañía podría cobrar hasta 20 000 dólares al mes por "agentes" de IA especializados, como agentes para desarrolladores de software.

Sin embargo, aunque algunos argumentaron que incluso los modelos más costosos de OpenAI costarían mucho menos de lo que untraco empleado humano típico solicitaría, el investigador de IA Toby Ord señaló que los modelos podrían no ser tan eficientes. Por ejemplo, o3 high necesitó 1024 intentos en cada tarea en ARC-AGI para lograr su mejor puntuación.

Si estás leyendo esto, ya llevas ventaja. Mantente al día con nuestro boletín informativo.

Comparte este artículo
Collins J. Okoth

Collins J. Okoth

Collins Okoth es periodista y analista de mercados con 8 años de experiencia cubriendo criptomonedas y tecnología. Es analista financiero certificado y licenciado enmaticactuariales. Anteriormente trabajó como redactor y editor en Geek Computer y CoinRabbit.

MÁS… NOTICIAS
INTENSIVO CRIPTOMONEDAS
CURSO