Saltar al contenido principal

Un tope de $1,500 no cura tu factura de IA descontrolada

Uber limitó el gasto de IA a $1,500 por persona y una empresa quemó $500 millones en un mes. El tope trata el síntoma. La causa es soltar agentes sin alcance.

Un tope de $1,500 no cura tu factura de IA descontrolada

Ricardo Argüello

Ricardo Argüello
Ricardo Argüello

CEO & Fundador

Estrategia Empresarial 6 min de lectura

En la misma semana pasaron dos cosas. Uber le puso un tope de $1,500 por persona al gasto en cada herramienta de IA, después de quemar el presupuesto de todo 2026 en cuatro meses. Y se supo que una empresa gastó más de $500 millones en Claude en un solo mes, por no tener ningún límite.

La reacción de medio internet fue la misma: ponle un tope. Tiene sentido como freno de emergencia. Pero como estrategia, trata el síntoma.

La tesis de este post en una línea: el tope no es la cura. La enfermedad no es el precio del token, es soltar agentes sobre trabajo que nadie midió. Nadie definió cuánto retorno produce cada proceso por token gastado, así que cuando la factura llega, lo único que queda es cortar a ciegas. La salida no es presupuestar después. Es definir el alcance antes.

El mes que costó $500 millones

La historia de los quinientos millones de dólares es la que más asusta, así que vale empezar por ahí. Según un reporte de Axios, una empresa quemó más de $500 millones en Claude en treinta días. No por un contrato firmado, sino por darle acceso sin restricciones a sus empleados: sin presupuestos, sin cuotas, sin monitoreo. Un consultor lo bautizó tokenmaxxing, el uso maximizado que se descontrola cuando la gente genera prompts sin supervisión.

El caso de Uber es menos dramático pero más instructivo, porque es una empresa disciplinada que igual se estrelló. Agotó su presupuesto de IA de todo 2026 en los primeros cuatro meses. Antes del tope, ingenieros individuales generaban facturas de entre $500 y $2,000 al mes en consumo de tokens. La respuesta fue un tope de $1,500 por persona por cada herramienta de programación agéntica, un tablero de uso para cada empleado, y un proceso para pedir más cuando se necesita.

Es una buena medida de contención. Uber hizo lo correcto para frenar la hemorragia. Pero fíjate en lo que un tope no puede hacer.

Un tope no sabe qué tokens servían

Un tope es un instrumento ciego. Corta el gasto, pero no distingue el token que cerró un problema del token que se desperdició dando vueltas. Le pone el mismo techo al ingeniero que resolvió tres incidentes y al que dejó un agente corriendo en círculos todo el fin de semana.

Alguien en la conversación de esta semana lo dijo mejor que cualquier consultor: nadie le pone tope al gasto en algo que puede medir. El tope de $1,500 no es un veredicto sobre el valor de la IA. Es la confesión de que la empresa no podía ver cuáles tokens estaban funcionando.

Y ahí está el punto que casi nadie quiere decir en voz alta. El problema de fondo no es el precio por token, que de hecho lleva años cayendo. El problema es que la mayoría de las empresas soltó agentes sobre procesos que nunca dimensionó. Nunca se preguntaron, antes de arrancar, cuánto trabajo útil debería producir este proceso por cada dólar de tokens. Sin esa cifra, no hay forma de saber si una factura de $1,800 es un robo o una ganga. Solo queda el reflejo de cortar.

El gasto de tokens ya parece gasto de nube

Arvind Jain, el CEO de Glean, viene insistiendo en algo que conviene escuchar: el gasto de tokens es un problema de arquitectura, no solo de modelo. Su empresa reporta clientes cuyo presupuesto anual de IA se agota en uno o dos meses, y su tesis es que la pregunta correcta no es cuántos tokens consume un sistema, sino cuánto trabajo útil produce por token. Lo llama rendimiento por token, y depende de cómo está armado todo lo que rodea al modelo: cómo se recupera el contexto, cómo se enrutan los modelos, cómo se reutiliza el trabajo ya hecho.

Es la misma transición que vivió la nube hace quince años. Cuando un agente puede reintentar solo, explorar la web y lanzar sub-agentes por su cuenta, el gasto deja de parecer una licencia mensual fija y empieza a parecerse a una factura de nube: variable, sin techo natural, y peligrosa si nadie le pone presupuestos y trazas por proceso. La diferencia es que en la nube aprendimos a medir el costo por servicio antes de dejarlo correr. Con la IA, demasiadas empresas saltaron ese paso.

Ya escribí antes que el costo era el guardarraíl que no sabías que tenías, y que los tokens por funcionalidad enviada son el KPI que importa. Lo que cambió esta semana no es la tesis. Es que el mercado por fin reaccionó, y reaccionó con el instrumento equivocado. El tope llega después del gasto. El alcance llega antes.

Lo que hacemos en IQ Source con esto

Cuando una empresa nos pide meter IA en un proceso, no empezamos preguntando qué modelo ni cuánto presupuesto. Empezamos preguntando cuánto trabajo útil debería producir ese proceso, y cuánto estaríamos dispuestos a pagar en tokens por ese resultado. Esa cifra, definida antes de construir, es la que vuelve innecesario el tope de pánico.

AI Maestro es el discovery donde se hace esa cuenta. Dos meses mapeando la operación real para decidir, proceso por proceso, cuáles vale la pena automatizar y cuál es el rendimiento por token esperado de cada uno. De ahí sale un Score de Oportunidad de IA y una compuerta Go/No-Go que, más de una vez, recomienda no soltar el agente todavía, justamente porque la cuenta no cierra. No es austeridad. Es dimensionar el gasto antes de firmarlo.

Un tope te dice cuánto puedes gastar. No te dice si vale la pena gastarlo. Esas son dos preguntas distintas, y la segunda se responde antes de construir, no cuando llega la factura. La próxima vez que alguien proponga ponerle un tope al gasto de IA del equipo, haz primero la otra pregunta: ¿sabemos, por proceso, cuánto trabajo útil nos da cada dólar de tokens? Si la respuesta es no, el tope no te va a salvar. Solo te va a esconder el problema un mes más.

Dimensiona el gasto de IA antes de firmarlo

Preguntas Frecuentes

tope de gasto IA costos de IA tokens Uber gobernanza de IA AI Maestro FinOps de IA

Artículos Relacionados

El pico de confianza con la IA y la bajada sin dueño
Estrategia Empresarial
· 7 min de lectura

El pico de confianza con la IA y la bajada sin dueño

Construir IA es más barato que nunca, así que la apuesta es construir. Pero el 95% de los pilotos no mueve el P&L, y nadie cuida la bajada de la curva.

Dunning-Kruger adopción de IA transformación con IA
El agente autónomo es un pasivo, no una ventaja
Estrategia Empresarial
· 8 min de lectura

El agente autónomo es un pasivo, no una ventaja

Cognition levantó mil millones a 26 mil millones de valoración por un agente autónomo. En producción, la autonomía es justo lo que primero falla. La pregunta es cuánta darle.

agentes de IA agente autónomo arquitectura de software