GPT-5.4 aterriza con control nativo del equipo de computo y supera a los humanos en tareas de escritorio ¿será?

  • 06 Mar 2026 02:43 PM

OpenAI ha lanzado GPT-5.4, su modelo más avanzado hasta la fecha, que introduce por primera vez la capacidad nativa de operar directamente un ordenador. Con 1 millón de tokens de contexto y un nuevo sistema de "búsqueda de herramientas", el modelo promete reducir errores y automatizar flujos de trabajo complejos, superando a los humanos en pruebas de navegación de escritorio.

La madrugada del 6 de marzo, OpenAI presentó oficialmente GPT-5.4, un modelo que integra en un solo sistema las capacidades de razonamiento, programación avanzada y, por primera vez, control directo de un equipo de computo. Apenas dos días después del lanzamiento de GPT-5.3 Instant, la compañía da un salto cualitativo hacia los agentes autónomos.

El equipo de computo, ahora bajo control de la IA

La novedad más disruptiva de GPT-5.4 es su capacidad para manipular directamente la interfaz gráfica de un equipo de computo. El modelo puede analizar capturas de pantalla y, a partir de ellas, ejecutar movimientos de ratón y pulsaciones de teclas para navegar entre aplicaciones, rellenar formularios o realizar tareas complejas sin intervención humana.

Los resultados en las pruebas comparativas son contundentes. En el benchmark OSWorld-Verified, que evalúa la capacidad de navegación en entornos de escritorio, GPT-5.4 alcanzó un 75% de éxito, superando ampliamente el 47,3% de su predecesor (GPT-5.2) y también el rendimiento humano, situado en el 72,4%. En pruebas de navegación web, como Online-Mind2Web, el modelo logró un 92,8% de acierto basándose únicamente en capturas de pantalla, muy por encima del 70,9% de sistemas anteriores.

Más contexto, menos errores y herramientas optimizadas

GPT-5.4 incorpora una ventana de contexto de 1 millón de tokens, lo que le permite procesar bibliotecas de código completas o documentos extensos de una sola vez. Pero el avance no es solo en cantidad, sino en calidad: según datos de OpenAI, el nuevo modelo reduce los errores factuales en un 33% en comparación con GPT-5.2, y la probabilidad de que una respuesta completa contenga fallos disminuye un 18%.

Para desenvolverse en entornos con decenas de herramientas disponibles, GPT-5.4 estrena el sistema "tool search" (búsqueda de herramientas). En lugar de cargar todas las definiciones de herramientas en el contexto -lo que consumía miles de tokens-, el modelo consulta una lista ligera y recupera solo las que necesita. En pruebas internas, esta técnica redujo el consumo de tokens en un 47% sin pérdida de precisión.

Dos versiones y precios al alza

OpenAI comercializa GPT-5.4 en dos sabores:

Versión Disponibilidad Precio API (por millón de tokens)
GPT-5.4 Thinking Usuarios Plus, Team y Pro (ChatGPT) Entrada: $2,50 / Salida: $15,00
GPT-5.4 Pro Usuarios Pro y Enterprise Entrada: $30,00 / Salida: $180,00

Existe una particularidad en la facturación: las solicitudes que superen los 272.000 tokens (aproximadamente el 27% del límite máximo) tienen un recargo del doble en la tarifa, reflejando el coste computacional adicional.

Impacto en entornos profesionales

Las primeras reacciones de la industria destacan su aplicación práctica. En un test interno de modelado financiero que simula el trabajo de un analista de banca de inversión, GPT-5.4 alcanzó un 87,3% de acierto, frente al 68,4% de la versión anterior. La compañía de tecnología inmobiliaria Mainstay reportó que, en pruebas con portales de impuestos sobre propiedades, GPT-5.4 completó correctamente el 95% de las tareas al primer intento, tres veces más rápido que modelos previos y con un 70% menos de consumo de tokens.

Las sombras del lanzamiento

Sin embargo, no todo son alabanzas. Matt Shumer, CEO de HyperWrite, señaló tras probar el modelo que persisten tres problemas significativos: la interfaz frontal es inferior a la de competidores como Claude Opus 4.6 y Gemini 3.1 Pro; el modelo ignora contextos del mundo real (por ejemplo, planifica viajes a destinos masificados en fechas punta); y en pruebas con OpenClaw, el sistema se detiene abruptamente antes de completar las tareas. Sam Altman, CEO de OpenAI, respondió prometiendo soluciones rápidas.

Además, el precio supone un incremento respecto a GPT-5.2, lo que, unido a la nueva tarifa por contexto largo, hace que el ahorro en tokens no siempre se traduzca en un menor coste final.

Disponibilidad y futuro

GPT-5.4 Thinking ya está disponible para los suscriptores de pago en ChatGPT y para desarrolladores a través de API y Codex. La versión anterior, GPT-5.2 Thinking, permanecerá accesible hasta el 5 de junio de 2026, fecha en que será definitivamente retirada.