Los cinco niveles de Claude Code: cómo los desarrolladores escalan desde prompts simples hasta orquestación con múltiples agentes

La adopción de herramientas de inteligencia artificial para la programación sigue un patrón predecible: primero funciona de maravilla, luego se complica, y finalmente es necesario construir una infraestructura más sofisticada para mantener la calidad. Un desarrollador ha documentado este recorrido en cinco niveles claramente diferenciados, cada uno nacido de la frustración que genera el anterior. El viaje comienza de forma engañosamente simple. En el primer nivel, los programadores abren Claude Code, describen lo que necesitan y el agente lo construye. Para proyectos pequeños funciona sorprendentemente bien, pero el techo llega rápido: cuando el proyecto crece más allá de lo que cabe en una única conversación, el agente olvida las convenciones establecidas, introduce patrones inconsistentes y consume más tiempo en correcciones que en creación. El segundo nivel introduce disciplina mediante un archivo CLAUDE.md en la raíz del proyecto. Este documento actúa como una brújula para el agente, especificando la pila tecnológica, la estructura de archivos, convenciones de nombres, patrones recomendados y aquellos que deben evitarse. El impacto es inmediato. Sin embargo, existe un límite crítico: experimentadores han descubierto que cuando el documento supera las 77 líneas, la adherencia del agente a las instrucciones degrada significativamente, aunque Anthropic recomienda un máximo de 200 líneas. El problema se intensifica cuando las sesiones se alargan; la calidad cae, las decisiones anteriores se olvidan, las respuestas se vuelven superficiales y repetitivas. El tercer nivel introduce las "skills": archivos de protocolo markdown que enseñan al agente procedimientos especializados paso a paso. Cada skill define un flujo de trabajo para un tipo específico de tarea. Se cargan bajo demanda y no consumen tokens mientras están inactivos. En lugar de re-explicar cómo construir componentes en cada sesión, el programador simplemente apunta al agente hacia el archivo de skill correspondiente. Pero aquí emerge otro techo: el agente sigue los protocolos, pero nadie valida automáticamente su trabajo. El desarrollador permanece como guardián de la calidad. El cuarto nivel introduce hooks, scripts de ciclo de vida que se ejecutan en momentos específicos durante una sesión. Un hook PostToolUse puede ejecutar verificaciones de tipo después de cada edición, en lugar de inundar al agente con cientos de errores de validación. Los stop hooks establecen controles de calidad antes de completar tareas. Los SessionStart hooks cargan contexto antes de que el agente toque nada. Esta es la fase donde los desarrolladores dejan de decirle al agente que valide y comienzan a construir infraestructura que valida automáticamente. El límite nuevamente surge inevitable: un único agente en una única sesión no puede manejar proyectos que superan lo que cabe en una ventana de contexto. El quinto nivel, raramente necesario, es la orquestación: múltiples agentes en paralelo trabajando en árboles de trabajo aislados, archivos de campaña persistentes que mantienen estado entre sesiones, capas de coordinación que evitan que los agentes editen los mismos archivos simultáneamente. Un desarrollador reporta haber operado 198 agentes a través de 32 sesiones de flota con una tasa de conflictos de fusión del 3,1%. Este es el punto donde un único desarrollador opera a escala institucional. La progresión no es una elección: es una imposición. No se asciende porque se decida hacerlo, sino porque se golpea un techo y la fricción obliga la evolución. Cada nivel existe porque el anterior se rompió. Saltarse niveles es tentador pero catastrófico; los intentos de saltar directamente al nivel 5 sin haber construido sólidos hooks resultan en caos. La infraestructura de cada nivel es lo que hace posible el siguiente. Esta progresión refleja una realidad más amplia en la adopción de IA generativa para desarrollo de software: las herramientas funcionan bien en escala pequeña pero requieren cada vez más estructura y disciplina a medida que crecen los proyectos. No es un defecto del agente, sino una característica inevitable de cualquier sistema que intenta escalar. El sistema que emergió de esta metodología ha sido liberado como código abierto, permitiendo que otros desarrolladores se beneficien del aprendizaje.

🎙️ Quick Summary

Escuchad, lo que más me llama la atención de esto es que el desarrollador está describiendo exactamente lo que muchos de vosotros habéis experimentado pero no sabéis cómo nombrar. Es esa sensación de que Claude funciona perfectamente el primer día, luego comienza a olvidar cosas, introduce inconsistencias, y de repente os encontráis corrigiendo más que creando. Y aquí viene lo interesante: no es un fallo de la herramienta. Es simplemente que habéis superado el nivel en el que estabais operando sin daros cuenta. Lo que me fascina es la disciplina requerida. La mayoría de desarrolladores vemos un CLAUDE.md con 77 líneas, pensamos "eso es ridículo, necesito más detalles", lo ampliamos a 150 líneas... y luego nos quejamos de que el agente no sigue instrucciones. Pero resulta que hay un límite cognitivo real: cuando sobrecargamos el contexto, el agente elige qué priorizar y silenciosamente ignora el resto. Es como hablar con alguien que solo escucha lo que le interesa. Y ese quinto nivel, la orquestación... eso no es programación, eso es gestión de proyectos a escala industrial. 198 agentes trabajando en paralelo con un 3,1% de conflictos de fusión. Pensadlo un momento: eso significa que la mayoría de nuestros proyectos nunca necesitarán esto, pero para aquellos que sí, la diferencia entre trabajar con un único agente y toda una flota es como la diferencia entre ser un artesano y dirigir una fábrica. ¿Cuántos de vosotros creéis que eventualmente necesitaréis llegar a ese nivel?

🤖 Classification Details

Detailed framework of five progressive levels for Claude Code usage with concrete examples, constraints at each level, and open-sourced system. Highly actionable with real-world experience.

💭 Claude's Take

🎙️ Quick Summary

🤖 Classification Details