OpenAI es ahora la mala de la IA. GPT-5.4 tendrá que ser muy bueno para cambiar eso

El culebrón que se ha montado con el Departamento de Defensa ha hecho que en los últimos días la percepción sea clara para dos de las empresas punteras en IA. De repente Anthropic es la buena de la película y OpenAI es la mala. Y sea precisamente por eso o no, el equipo de Sam Altman ha decidido que este era el momento para lanzar un nuevo y prometedor modelo de IA: GPT-5.4.
Hola, GPT-5.4. En el anuncio oficial de OpenAI explican cómo este nuevo modelo estará disponible de momento en dos variantes: GPT-5.4 Thinking y, para los que quieren "el máximo rendimiento en tareas complejas", GPT-5.4 Pro. Estamos ante un modelo fundacional que es mejor que nunca en su razonamiento, capacidad de programación y sobre todo en una cosa muy de moda: los "flujos agénticos". O lo que es lo mismo: hacer cosas por nosotros.
El modo "Usa Mi Ordenador", protagonista. Es una traducción libre, pero es más o menos lo que OpenAI destaca con la que es probablemente la gran novedad de este modelo. Como dicen en el anuncio, este es su primer modelo "con capacidades nativas de uso de ordenador". Es capaz de tomar el control de nuestra máquina y hacer cosas por nosotros de forma autónoma, completando ciclos complejos de acción y solucionando los problemas que se vanpresentando. No solo eso: según sus creadores GPT-5.4 "es nuestro modelo de razonamiento más eficiente en tokens, usando significativamente menos tokens para resolver problemas que GPT-5.2". O lo que es lo mismo: que la IA haga cosas por nosotros será más barato además de que las resuelva aún mejor.
Usa el ordenador mejor que nosotros. Los benchmarks desde luego parecen apuntar a un rendimiento fantástico en estas tareas. En la prueba OSWorld-Verified, que mide la capacidad de un modelo para navegar por un entorno de escritorio mediante capturas de pantallas y acciones virtuales con ratón y teclado, GPT-5.4 logra un 75% de éxito. Eso no es ya solo mejor que el 47,3% de GPT-5-2: es que incluso supera el rendimiento humano, que es del 72,4% según los creadores de este benchmark. Otras pruebas de este tipo que evalúan la habilidad de un modelo de IA para navegar también dejan claro que GPT-5.4 está claramente por encima de sus predecesores.

Lo de ARC-AGI asusta. Se suponía que las máquinas deberían tener muchos problemas para resolver problemas de razonamiento abstracto en los que los humanos sí somos fantásticos de forma natural, pero qué va. En los últimos tiempos hemos visto como el test ARC-AGI 2, que parecía todo un reto para los modelos de IA, ha ido siendo cada vez más asumible para dichos modelos. GPT-5.4 le da una nueva dentellada a esa realidad, y en su versión Pro ya logra resolver el 83,3% de las tareas (73,3% en el modelo estándar) cuando en GPT-2 la tasa era del 52,9%. Es un salto sencillamente brutal, y aunque en otras tareas ese salto no es tan notable (programa algo mejor según SWE-Bench Pro, pero no mucho), está claro que estamos ante un modelo extraordinario.
¿Perfecto para OpenClaw? Esa capacidad parece venirle que ni pintada a OpenClaw, el agente de IA que se ha convertido en un fenómeno en este ámbito en las últimas semanas. OpenAI acabó fichando a su creador y es de algún modo el "dueño" del proyecto, y se espera que este rendimiento en tareas agénticas sea muy útil para todo lo que hace OpenClaw, que es básicamente eso: manejar tu máquina por ti. Ahí es donde GPT-5.4 realmente puede dar el do de pecho.
Y te puedes fiar más de él. Según los responsables de OpenAI, GPT-5.4 es mejor ahora a la hora de responder preguntas que requieren buscar información de múltiples fuentes, e "identificar las más relevantes, particularmente para preguntas del tipo "una aguja en un pajar" y sintentizarlas en una respuesta clara y bien razonada". Es más: lo califican como el modelo más enfocado a responder basado en hechos y hablan de que es un 33% menos probable que conteste algo que es falso en comparación con GPT-5.2.

Pero cuidado: es muy, muy caro. Estas capacidadees, eso sí, no saldrán baratas. Con este lanzamiento OpenAI ha actualizado sus precios, y lo ha hecho dejando claro que si quieres lo mejor, tendrás que pagarlo. El modelo GPT-5.4 "estándar" cuesta 2,50 dólares por millón de tokens de entrada y 15 dólares por los de salida, mientras que el Pro cuesta la friolera de 30 dólares y 180 dólares respectivamente. Claude Opus 4.6, que era hasta ahora considerado como el mejor modelo de IA, cuesta 10 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida: ya era caro, pero GPT-5.4 Pro le deja casi como un modelo de IA "chollo".
Intentando detener la sangría. El modelo aparece en un momento delicado. Según diversas fuentes, ChatGPT ha perdido 1,5 millones de usuarios desde que anunció que habían llegado a un acuerdo con el Departamento de Defensa. Esa decisión provocó muchas críticas, un movimiento en redes que hablaba de "cancelar ChatGPT" y tensiones internas. Antes del escándalo ya se hablaba de la potencial aparición de GPT-5.4, pero está claro que el lanzamiento cobra ahora un doble sentido. No solo tiene que ser mejor que los demás: tiene que redimir a OpenAI.
Y sobre todo necesita una victoria. La percepción pública parece clara: OpenAI ha estado sufriendo últimamente, ya sea por dramas internos, fugas de talento o por quedarse temporalmente atrás en el rendimiento de sus modelos. GPT-5.4 no es una simple evolución de su modelo fundacional, porque lo que necesita OpenAI es que este modelo triunfe y convenza a la gente de "volver a amar" (en sentido figurado, ya nos entendéis) ChatGPT. Veremos si lo consigue.
-
La noticia OpenAI es ahora la mala de la IA. GPT-5.4 tendrá que ser muy bueno para cambiar eso fue publicada originalmente en Xataka por Javier Pastor .
Fuente: Xataka
Enlace: OpenAI es ahora la mala de la IA. GPT-5.4 tendrá que ser muy bueno para cambiar eso

Comentarios
Publicar un comentario