La automatización de tareas en navegadores web mediante agentes de inteligencia artificial ha sido durante años un terreno fangoso de promesas incumplidas y soluciones frágiles. Ahora, un nuevo enfoque está desafiando la forma convencional en que se construyen estas automatizaciones: Libretto, una herramienta que apuesta por generar código verificable y controlable en tiempo de desarrollo, en lugar de confiar en agentes que actúan en tiempo de ejecución.
La diferencia fundamental es conceptual pero transformadora. Mientras que herramientas existentes como Browseruse y Stagehand operan bajo el paradigma de "dar un prompt al agente en tiempo de ejecución y esperar que lo entienda correctamente", Libretto invierte el proceso. Su enfoque utiliza IA en tiempo de desarrollo para generar scripts reales que el usuario puede inspeccionar, modificar, ejecutar y depurar antes de desplegarlos en producción.
Este cambio de mentalidad surge de una necesidad práctica muy específica. El equipo detrás de Libretto pasó un año completo construyendo y manteniendo automatizaciones de navegadores para integraciones con sistemas de historiales médicos electrónicos (EHR) y portales de aseguradoras en una startup de healthcare. La experiencia fue agotadora: mantener estas automatizaciones y depurar fallos consumía recursos disproportionados.
La propuesta de Libretto aborda cuatro problemas críticos que enfrenta la generación actual de herramientas de automatización. Primero, el análisis del DOM en tiempo de ejecución es inherentemente frágil, especialmente en sitios web legados y complejos como los que abundan en el sector sanitario. Libretto adopta un enfoque híbrido que combina la automatización de UI de Playwright con llamadas directas a APIs de red capturadas dentro de la sesión del navegador, resultando en mayor fiabilidad y mejor evasión de detectores de bots.
Segundo, el coste de los agentes en tiempo de ejecución es prohibitivo. Requieren múltiples llamadas a modelos de IA y, aunque implementen caching, no pueden garantizar que las acciones cacheadas funcionarán correctamente en flujos complejos. Tercero, la falta de interpretabilidad es un problema fundamental en entornos de alto riesgo como el healthcare. No se puede simplemente "esperar que el agente lo entienda bien"; se necesita transparencia y control.
Cuarto, la mayoría de estas herramientas no ofrecen mecanismos efectivos para generar nuevas automatizaciones ni para depurar las que fallan.
Libretto introduce varias características diseñadas para resolver estos problemas. Registra acciones manuales de usuarios para ayudar a los agentes a generar y actualizar scripts, ofreciendo depuración paso a paso. También incluye un modo de solo lectura opcional que previene que los agentes envíen o modifiquen datos accidentalmente. Crucialmente, el código generado sigue las abstracciones y convenciones del repositorio de código existente del usuario.
La implicación más amplia de Libretto es una reconfiguración de la relación entre humanos e IA en tareas de automatización. En lugar de delegar la toma de decisiones a un agente autónomo, Libretto posiciona a la IA como una herramienta generativa que aumenta la capacidad de los ingenieros humanos para crear y mantener automatizaciones complejas. El código resultante es versionable, auditable y, más importante aún, es código que pertenece al usuario.
Este enfoque tiene particular relevancia en sectores altamente regulados como el sanitario, donde la trazabilidad y el control son no negociables. Pero su aplicabilidad se extiende a cualquier contexto donde la fiabilidad y la interpretabilidad sean prioritarias sobre la automatización completa.
El lanzamiento de Libretto llega en un momento en el que la comunidad de desarrolladores está comenzando a cuestionarse seriamente si los agentes autónomos en tiempo de ejecución son realmente la solución definitiva para la automatización. La pregunta que Libretto plantea implícitamente es provocadora: ¿necesitamos realmente agentes autónomos, o lo que necesitamos son herramientas inteligentes que generen código que los humanos podamos controlar?