La adopción de herramientas de inteligencia artificial para la programación sigue un patrón predecible: primero funciona de maravilla, luego se complica, y finalmente es necesario construir una infraestructura más sofisticada para mantener la calidad. Un desarrollador ha documentado este recorrido en cinco niveles claramente diferenciados, cada uno nacido de la frustración que genera el anterior.
El viaje comienza de forma engañosamente simple. En el primer nivel, los programadores abren Claude Code, describen lo que necesitan y el agente lo construye. Para proyectos pequeños funciona sorprendentemente bien, pero el techo llega rápido: cuando el proyecto crece más allá de lo que cabe en una única conversación, el agente olvida las convenciones establecidas, introduce patrones inconsistentes y consume más tiempo en correcciones que en creación.
El segundo nivel introduce disciplina mediante un archivo CLAUDE.md en la raíz del proyecto. Este documento actúa como una brújula para el agente, especificando la pila tecnológica, la estructura de archivos, convenciones de nombres, patrones recomendados y aquellos que deben evitarse. El impacto es inmediato. Sin embargo, existe un límite crítico: experimentadores han descubierto que cuando el documento supera las 77 líneas, la adherencia del agente a las instrucciones degrada significativamente, aunque Anthropic recomienda un máximo de 200 líneas. El problema se intensifica cuando las sesiones se alargan; la calidad cae, las decisiones anteriores se olvidan, las respuestas se vuelven superficiales y repetitivas.
El tercer nivel introduce las "skills": archivos de protocolo markdown que enseñan al agente procedimientos especializados paso a paso. Cada skill define un flujo de trabajo para un tipo específico de tarea. Se cargan bajo demanda y no consumen tokens mientras están inactivos. En lugar de re-explicar cómo construir componentes en cada sesión, el programador simplemente apunta al agente hacia el archivo de skill correspondiente. Pero aquí emerge otro techo: el agente sigue los protocolos, pero nadie valida automáticamente su trabajo. El desarrollador permanece como guardián de la calidad.
El cuarto nivel introduce hooks, scripts de ciclo de vida que se ejecutan en momentos específicos durante una sesión. Un hook PostToolUse puede ejecutar verificaciones de tipo después de cada edición, en lugar de inundar al agente con cientos de errores de validación. Los stop hooks establecen controles de calidad antes de completar tareas. Los SessionStart hooks cargan contexto antes de que el agente toque nada. Esta es la fase donde los desarrolladores dejan de decirle al agente que valide y comienzan a construir infraestructura que valida automáticamente. El límite nuevamente surge inevitable: un único agente en una única sesión no puede manejar proyectos que superan lo que cabe en una ventana de contexto.
El quinto nivel, raramente necesario, es la orquestación: múltiples agentes en paralelo trabajando en árboles de trabajo aislados, archivos de campaña persistentes que mantienen estado entre sesiones, capas de coordinación que evitan que los agentes editen los mismos archivos simultáneamente. Un desarrollador reporta haber operado 198 agentes a través de 32 sesiones de flota con una tasa de conflictos de fusión del 3,1%. Este es el punto donde un único desarrollador opera a escala institucional.
La progresión no es una elección: es una imposición. No se asciende porque se decida hacerlo, sino porque se golpea un techo y la fricción obliga la evolución. Cada nivel existe porque el anterior se rompió. Saltarse niveles es tentador pero catastrófico; los intentos de saltar directamente al nivel 5 sin haber construido sólidos hooks resultan en caos. La infraestructura de cada nivel es lo que hace posible el siguiente.
Esta progresión refleja una realidad más amplia en la adopción de IA generativa para desarrollo de software: las herramientas funcionan bien en escala pequeña pero requieren cada vez más estructura y disciplina a medida que crecen los proyectos. No es un defecto del agente, sino una característica inevitable de cualquier sistema que intenta escalar. El sistema que emergió de esta metodología ha sido liberado como código abierto, permitiendo que otros desarrolladores se beneficien del aprendizaje.