Saltar al contenido principal

El harness es el moat: el modelo ya es commodity

Cursor, Devin y Replit corren los mismos tres modelos frontera. Cambias el modelo y los productos siguen. Cambias el harness y se rompen. Ese es el moat.

El harness es el moat: el modelo ya es commodity

Ricardo Argüello

Ricardo Argüello
Ricardo Argüello

CEO & Fundador

IA y Automatización 8 min de lectura

Hay un puesto nuevo en la página de empleos de Box que ningún reclutador de LatAm sabe explicar todavía: AI Business Automation Engineer. La descripción literal, en palabras de Aaron Levie: “sentarse hombro con hombro con la gente que hace el trabajo, entender sus flujos, y diseñar, prototipar y entregar las soluciones técnicas que transforman cómo opera ese equipo”. Una semana metiéndole un agente al cierre de Finanzas. La siguiente, rediseñando el flujo de admisión del área Legal como un sistema agéntico. La siguiente, levantando un flujo de datos para que GTM automatice inteligencia de cliente. Levie cierra diciendo que la mayoría de empresas terminará con varias variantes de este rol. Es el rol que construye y mantiene una pieza nueva que ningún laboratorio te puede entregar empaquetada.

Esa pieza tiene nombre. Aakash Gupta la bautizó el mismo fin de semana: el harness. La capa operativa que envuelve al modelo de IA (la ingeniería de contexto, las skills, los evals, la orquestación, la disciplina) y donde se acumula toda la ventaja competitiva que no se puede copiar en 2026. La tesis de IQ Source en este post es directa: si tu empresa va a ganar algo con IA en los próximos doce meses, no lo va a ganar eligiendo bien el modelo. Lo va a ganar construyendo y manteniendo el harness alrededor del modelo. Box está contratando a tiempo completo para construirlo adentro. IQ Source lo opera como servicio externo para empresas B2B en LatAm desde hace meses.

El modelo es commodity. El harness es la empresa.

Cursor, Devin, Replit y Windsurf corren los mismos tres modelos frontera (Claude, GPT-5, Gemini). Cambias el modelo y los productos siguen funcionando, casi sin perder calidad. Cambias el harness y se rompen. Ahí vive el moat (ventaja competitiva) en 2026. Nada del harness se vuelve más barato cuando los modelos se abaratan, ni mejora cuando los modelos mejoran. Todo hay que ganarlo. La ventaja de las empresas que llevan meses construyéndolo se mide en iteración real contra clientes reales, no en suscripciones a un modelo nuevo.

Llevo 36 años en computación, desde 1990, a mis 15 años, en una Commodore 64, y este patrón se repite cada vez que aparece una plataforma nueva. La base de datos relacional se volvió commodity en los noventa y el moat se subió al ORM. El servidor se volvió commodity con la nube y el moat se subió al despliegue y a la observabilidad. Lo que cambia con IA es la velocidad: la capa que se comprimió esta vez es la del razonamiento general, y la capa que queda encima — la operativa, la que se ajusta a tu empresa — es donde se concentra todo el valor que no se puede copiar.

La prueba cuantitativa la publicó Mnimiy con un análisis que cruzó los 2,5 millones de vistas el fin de semana. Forrest Chang armó hace meses un CLAUDE.md de 4 reglas siguiendo el hilo de queja que Andrej Karpathy publicó en enero; el repo lleva 120 000 estrellas en GitHub. Mnimiy lo probó en 30 codebases distintos durante 6 semanas: los errores bajaron de 41% a 11% con las 4 reglas y a 3% al agregar 8 más (presupuesto de tokens, tests que verifican intención, checkpoints, fallar ruidosamente). Misma versión del modelo. Mismo Claude. La diferencia entera viene de un archivo de texto de menos de doscientas líneas que el equipo escribió contra sus errores reales.

El telón de fondo está medido. RAND reporta que más del 80% de proyectos de IA fallan, el doble que los de IT no-IA. El estudio NANDA del MIT midió que solo el 5% de los pilotos de GenAI empresarial extrae valor mayor. S&P Global mide que el 42% de empresas están abandonando la mayoría de sus iniciativas. La diferencia entre el 5% que extrae valor y el 95% que no, no es el modelo. Es lo que hay alrededor del modelo. Steve Nouri lo resume con una prueba que sirve para cualquier piloto que tengas corriendo hoy: apágalo. Si nadie se da cuenta esta semana, no era transformación. Era teatro.

Qué es el harness, concretamente

El harness no es una metáfora abstracta. Tiene cinco piezas específicas, cada una con dueño, mantenimiento y costo.

Ingeniería de contexto. Decidir qué tokens ve el modelo en cada llamada, qué se carga por adelantado, qué se trae bajo demanda. Lo cubrimos como práctica concreta en un post anterior: en pruebas internas, rediseñar el contexto de un agente de soporte bajó tokens activos de ~45K a ~12K y subió precisión de ~72% a ~91%, sin cambiar de modelo.

Skills. Archivos reutilizables que el agente ejecuta cuando aparece un disparador concreto. Una skill que toma una transcripción y extrae pendientes. Una skill que prepara una propuesta a partir de cinco proyectos comparables. Son la unidad de reutilización del harness: cada cliente nuevo no empieza desde cero.

Evals. Cómo mides que el agente acertó. Si tu medida de calidad es “el output se ve razonable”, todavía no tienes evals — tienes opinión. Los evals son conjuntos de casos con respuesta esperada, ejecutados después de cada cambio, con métrica reportada.

Orquestación. Cuándo invocar un subagente con ventana limpia, cuándo paralelizar, cuándo caer al humano, cuándo aceptar la respuesta parcial. La lógica que decide cómo se compone una respuesta cuando el problema no cabe en una sola llamada.

Disciplina operativa. La regla por la que mueren la mayoría de implementaciones de Team OS: la funcionalidad no sale hasta que el repo del harness está actualizado. Sin esta regla, las otras cuatro capas se llenan de polvo en seis semanas.

Las cinco se ajustan a tu empresa. El cierre financiero de Box no se parece al cierre financiero de tu empresa B2B en LatAm. Por eso el harness es donde se acumula la ventaja: cada empresa termina con su propia versión y la versión no es portable.

Lo que ya corremos en IQ Source

El brain de IQ Source es el harness de nuestro equipo, ajustado todos los días durante el último mes con dos clientes activos en paralelo. Importa transcripciones de llamadas en el momento, extrae pendientes y los propaga a los proyectos correspondientes. Cualquiera del equipo le pregunta en lenguaje natural: “¿qué precio cotizamos en febrero a una empresa de tamaño parecido?”, “¿qué se decidió en la llamada del lunes con el prospecto X?”. La regla operativa: una propuesta no se cotiza si la información del prospecto no está donde el brain la encuentra; un traspaso entre dos personas solo cuenta cuando lo transferido quedó por escrito.

Cuando un cliente nos contrata AI Maestro, no instalamos nada todavía. En dos meses de consultoría, educación y entrenamiento, mapeamos cómo opera la empresa en realidad (no cómo lo dice el manual), formamos al equipo en fluidez de IA e identificamos en cuál de las cinco capas del harness está la oportunidad real. La etapa cierra con tres entregables (un mapa de procesos reales, un puntaje de oportunidad de IA y una recomendación priorizada) y una compuerta Go/No-Go. Si avanza, una segunda etapa diseña e implementa la solución recomendada (un agente cuando aplica, automatización o integración cuando no) y la opera hasta que el equipo del cliente la asume. Si no avanza, los entregables quedan suyos sin compromiso. Es el equivalente externo del rol interno que está contratando Levie: el outsider con criterio que diagnostica antes de tocar nada.

Cuando además necesita que sigamos construyéndole producto mientras esto se monta, ahí entra Socio Tecnológico. El harness opera dentro del proceso de desarrollo: un PR no se cierra si la decisión técnica que lo motivó no quedó escrita en el repo, una publicación a producción lleva amarrada una bitácora que el siguiente equipo puede leer sin reconstruir el cómo y el porqué. Es el moat de flujo de trabajo que cubrí en abril, operativo.

Las tres pruebas de tu harness

La primera es la de existencia. ¿Cuál es el harness que usa tu equipo hoy y dónde vive? Si la respuesta es “está en la cabeza de” o “lo manejamos por Slack”, el harness no existe como sistema. Existe como individuos. Y los individuos se van.

La segunda es la de propiedad. ¿Quién, con nombre y apellido, mantiene el harness vivo? No “todos”. No “el equipo de IA”. Una persona, con tiempo asignado, con autoridad para devolver una funcionalidad a la cola de pendientes si no actualizó la documentación correspondiente. Sin esa figura, las otras cuatro capas se atrofian.

La tercera es la del agente. Cuando un agente de IA en tu empresa intente contestar la próxima pregunta de un cliente, lo que encuentre adentro del harness define la respuesta. No el modelo. No la versión. Lo que tu equipo escribió esta semana en el lugar donde el agente lo va a leer.

Si las tres respuestas son sólidas, no necesitas a IQ Source para esta pieza. Si dos o tres se quedan en silencio, escríbenos y lo miramos juntos: una conversación inicial sirve para diagnosticar en cuál de los cinco componentes está el cuello de botella.

El equipo que se ganó el harness antes que el tuyo paga un año en 2027. El equipo que cree que el problema es elegir mejor el modelo paga tres, y se entera tarde de cuál era el moat.

Preguntas Frecuentes

harness ingeniería de contexto Aakash Gupta Aaron Levie AI Maestro Socio Tecnológico moat

Artículos Relacionados

El equipo cuyo razonamiento se puede buscar
IA y Automatización
· 13 min de lectura

El equipo cuyo razonamiento se puede buscar

Aakash Gupta nombró esta semana el sistema que ya corremos en IQ Source: tres capas que hacen buscable el razonamiento del equipo en 15 segundos.

Team OS memoria de equipo Aakash Gupta
Karpathy: una bóveda. Nosotros: un sistema nervioso.
IA y Automatización
· 11 min de lectura

Karpathy: una bóveda. Nosotros: un sistema nervioso.

Karpathy publicó una bóveda de markdown con 17M+ vistas. Llevamos 18 días corriendo el sistema nervioso completo: sentidos, nervios, sistema inmune.

segundo cerebro Karpathy gestión del conocimiento