Saltar al contenido principal

El runtime ya es commodity. El moat es el workflow.

Anthropic cobra $0.08 la hora por runtime de agente y borra 30 startups de infra. McKinsey: 80% no captura valor porque no rediseña el flujo.

El runtime ya es commodity. El moat es el workflow.

Ricardo Argüello

Ricardo Argüello
Ricardo Argüello

CEO & Fundador

Estrategia Empresarial 9 min de lectura

El 8 de abril Anthropic publicó precio para una cosa que, hasta la semana anterior, era la tesis central de entre 30 y 50 startups de agentes. Le puso $0.08 por hora de sesión y le cambió el nombre a Claude Managed Agents. InfoQ lo resumió directo: sandbox, estado de sesión, manejo de credenciales, orquestación de tools, observabilidad. Todo detrás de una API. Todo al mismo precio para Notion, para Rakuten, para Asana y para tu empresa.

Ocho centavos por hora, medidos al milisegundo. Idle time no cuenta. El precio se redondea hacia abajo en la demo que corre SiliconANGLE en su cobertura del lanzamiento: una sesión de una hora con Opus 4.6, 50 mil tokens de input, 15 mil de output, sale en $0.705 totales.

Lo que eso borra en cuatro semanas es la tesis de inversión de una cohorte completa de startups. Si tu presentación a VCs en 2024 decía “le resolvemos a las empresas la parte dura de correr agentes en producción”, esta semana ese deck pasa a ser historia. No porque el trabajo haya sido malo. Porque el precio de referencia acaba de ser puesto por el proveedor del modelo y no hay cómo competirle sin subsidiar.

Qué pasó con la capa que se suponía iba a ser negocio

La promesa de “infraestructura para agentes como servicio” se construyó sobre cinco pedazos concretos. Cada uno era un problema real en 2024. Cada uno se vendió como un negocio separado. Cada uno acaba de quedar empacado en un solo SKU:

  • Sandbox. Contenedores efímeros donde el agente ejecuta código sin tocar tu prod. Hace dos trimestres era un pitch técnico con Firecracker, gVisor y mil detalles de aislamiento. Hoy es una primitiva de la API.
  • Persistencia de sesión. ¿Qué pasa cuando el agente se cae a la mitad de una tarea de seis horas? ¿Qué pasa cuando el cliente vuelve el lunes? Lo resolvían startups con storage, checkpoints, y replay. Hoy el estado vive en el servicio.
  • Vault de credenciales. ¿Cómo le das al agente acceso a tu Salesforce, tu Gmail, tu Stripe sin pegarle el secret en el prompt? Startups como WorkOS y varias más empujaron este problema durante año y medio. Ahora es parte del mismo paquete de Anthropic.
  • Orquestación de tools. Decidir cuándo el modelo llama a web search, cuándo llama a tu API interna, cuándo escala a un humano. Aquí viven LangChain, LlamaIndex, CrewAI. Siguen existiendo y siguen siendo útiles, pero ya no son la diferencia entre “corre en laptop” y “corre en producción”.
  • Observabilidad de agentes. Logs estructurados, trazas, replay de sesiones, debug visual. Arize, LangSmith, Helicone. El servicio gestionado te lo da como parte del mismo precio.

Radhika Menon, de NTT DATA, lo resumió en la nota de InfoQ con una frase que cualquier CEO entiende: “a 8 centavos por hora vas de idea a producción en días, no en meses”. Esa frase es el punto. No es que la infra mejoró; es que el tiempo que tu competidor necesitaba para ponerla arriba se colapsó.

La otra mitad del dato viene de McKinsey

El 2 de abril, antes del lanzamiento de Anthropic, McKinsey publicó “The agentic organization: Contours of the next paradigm for the AI era”. El dato central del paper es incómodo: 78% de las empresas encuestadas dice estar usando IA y más del 80% no ve todavía impacto medible en utilidad operativa.

El paper es directo sobre por qué. No es que la IA no funcione. Es que la mayoría la trata como herramienta que se enchufa al flujo existente y se aprieta el botón. Ese flujo fue diseñado hace cinco o diez años para humanos haciendo cada paso. La IA mete velocidad en un paso suelto y el cuello de botella se mueve al paso siguiente. El resultado en el P&L es neto cero, o peor: costos de licencia IA que no bajan headcount porque el workflow no cambia.

McKinsey lo dice con la frase que cada líder debería pegar en la pared: “los ganadores no van a simplemente adoptar herramientas de IA; van a reconfigurar los workflows para que nazcan con IA primero”. El 75% de los roles actuales necesita reconfiguración. No upgrade de skills; reconfiguración.

Las dos noticias del mes se leen una sobre otra. Anthropic te quita la excusa de que rediseñar el workflow es imposible porque la infra era muy cara. McKinsey te quita la excusa de que comprar IA ya es la solución.

Por qué el workflow pasa a ser el moat

“Moat” (ventaja competitiva) es una palabra que se sobreusa. Casi todo lo que las empresas llaman moat es en realidad una ventaja temporal de uno a dos años. Lo que sobrevive diez años es una de tres cosas: una red, una marca, o un conocimiento codificado que el competidor no puede reproducir barato. El diseño del workflow entra en la tercera.

Pienso en estas tres cosas específicas, no genéricas.

Uno: el workflow es la única capa donde tu contexto de negocio queda codificado. Un flujo de aprobación de crédito en una cooperativa costarricense tiene reglas que vienen de la SUGEF, de la historia de morosidad del portafolio específico, de cómo el comité decide caso por caso desde hace quince años. Nada de eso está en Claude ni en Anthropic. Se codifica cuando alguien se sienta a diseñar el workflow. Si ese workflow vive dentro de un agente genérico que cualquier competidor puede comprar por $0.08 la hora, perdiste el único activo que era defendible.

Dos: el workflow es la capa que tiene que absorber el cambio de generación de modelo cada seis meses. Claude Sonnet 4.5 de octubre 2025, Opus 4.6 de enero 2026, Opus 4.7 de marzo. Cada uno cambia qué funciona en el prompt, qué tools vale la pena llamar, cuándo el modelo se desvía. El workflow bien diseñado sobrevive a cinco cambios de modelo. El pegote de prompts y scripts que la mayoría tiene hoy se rompe en cada actualización. Esa capacidad de absorber el cambio sin que se rompa la operación es caro de construir y barato de copiar solo si lo ve el competidor, cosa que no pasa.

Tres: el workflow es lo que un socio técnico puede entregar y un vendor de IA no. Anthropic no va a ir a Liberia o a Alajuela a entender por qué tu equipo de operaciones hace la reconciliación bancaria a las seis de la mañana en lugar de al mediodía. Tampoco el harness o el modelo base resuelven eso. Lo resuelve alguien que se sienta con el equipo, entiende el caso de uso, lo modela en un workflow, lo conecta al runtime commodity que ahora cuesta ocho centavos, e itera cuando el siguiente Opus llegue.

Qué hacemos en IQ Source sobre este nuevo reparto de valor

Para este movimiento tenemos dos piezas que se complementan.

La primera es AI Maestro, la línea de descubrimiento. Antes de proponer agente, runtime o arquitectura, mapeamos con el equipo del cliente el trabajo real (no el del wiki, el real) e identificamos dónde la IA tiene sentido y dónde no. Este es precisamente el paso que McKinsey dice que el 80% de las empresas se salta. Salir de ese paso con un mapa escrito del workflow a rediseñar cambia la conversación del comité de gasto por completo.

La segunda pieza es Socio Tecnológico, que la llegada del runtime commodity puso bajo un reflector. Hay empresas de software con dominio fuerte (automatización industrial, EdTech con AR, plataformas verticales de fintech en LatAm) que no quieren convertir a su equipo interno en especialistas de agentes, runtime, sandboxes y observabilidad. Ese conocimiento lo compran por hora, como ahora compran AWS o Cloudflare. Lo que quieren mantener adentro es el diseño del producto y del workflow que monta encima.

Ahí entramos nosotros. No como staff augmentation que mete manos en el código, sino como co-diseñadores del workflow. La conversación empieza mapeando los procesos donde el cliente cree que la IA tiene que entrar, dibujando qué se automatiza y qué no, y terminando con una implementación sobre runtime commodity que los tres equipos (el cliente, nosotros, el modelo) pueden operar sin que uno sea cuello de botella del otro.

La posición se nota más cuando hay una decisión de “build versus buy” sobre la mesa. Antes, buena parte del argumento “build” era que el equipo interno podía controlar la infra y la calidad de los agentes. Ese argumento ya no existe con la misma fuerza. El nuevo argumento “build” es que el equipo interno puede rediseñar el workflow de manera que nadie más entienda el negocio igual. Para llegar ahí sin gastar dos años aprendiendo de qué va el runtime, se contrata a un socio que ya aprendió.

Lo que te conviene hacer en las próximas dos semanas

Si estás en el lado del comprador, hay tres conversaciones que vale la pena tener antes de fin de mes.

La primera es con tu equipo de infra o con el integrador que te vendió agentes el año pasado. Hay que revisar contratos y ver cuánto estás pagando hoy por sandbox, observabilidad y orquestación comparado con el precio de lista de Anthropic. Si el diferencial está por encima de 3x para un caso de uso estándar, tienes palanca de negociación inmediata o hay que empezar a planear migración.

La segunda es con tu CFO. El $0.08 por hora no es un costo fijo, es variable por uso. Eso cambia cómo se presenta el business case de IA internamente. Los casos que antes no pasaban el filtro por tener costos fijos altos ahora sí caben. Pero también los casos que dependen del viejo proveedor caro acaban de subir de visibilidad en el comité de gasto.

La tercera es con quien sea dueño del rediseño del workflow dentro de tu empresa. Si la respuesta a “¿quién es dueño?” es “nadie en específico”, ese es el cuello de botella real. No el runtime.

En esa tercera conversación podemos ayudar sin que sea un compromiso grande de entrada. Es el primer paso de AI Maestro: revisamos uno de tus workflows candidatos junto con tu equipo, dibujamos qué de eso se convierte en agente sobre Managed Agents y qué queda como código tradicional o decisión humana. Una sesión de dos horas, sin cotización atada. Si el mapa queda bien, después conversamos formato. El correo es el que siempre: info@iqsource.ai.

Preguntas Frecuentes

Anthropic Managed Agents McKinsey agentic organization workflow design socio tecnológico moat

Artículos Relacionados

OpenAI dobló el precio mientras la inferencia cayó 35x
Estrategia Empresarial
· 15 min de lectura

OpenAI dobló el precio mientras la inferencia cayó 35x

GPT-5 lanzó a $1.25 por millón de tokens en agosto. GPT-5.5 cuesta $5.00 hoy. 4x acumulado mientras Nvidia Blackwell bajó la inferencia 35x.

OpenAI GPT-5.5 pricing power
Meta graba a sus empleados para entrenar su reemplazo
Estrategia Empresarial
· 13 min de lectura

Meta graba a sus empleados para entrenar su reemplazo

El 21 de abril Meta instaló MCI para grabar mouse y teclado de empleados US. El 20 de mayo despide a 8,000. La cláusula llega a tu contrato SaaS.

Meta vigilancia laboral Model Capability Initiative