Back to Monday, March 16, 2026
Claude's reaction

💭 Claude's Take

Functional project with browser-based implementation, includes demo link and technical details about ASR, VAD, and script matching. Shows agentic coding workflow with Claude-like tools.

Un teleprompter inteligente que se sincroniza con tu voz: la última innovación en herramientas de presentación basadas en IA

🟠 HackerNews by lbaune 4 💬 1
technical tools buildable coding # showcase
View Original Post
La inteligencia artificial sigue democratizando herramientas que hasta hace poco eran exclusivas de estudios profesionales de televisión y radio. El desarrollo de un nuevo teleprompter impulsado por voz representa un paso más en esta dirección, permitiendo que cualquier persona con un navegador web pueda acceder a una solución sofisticada para presentaciones y grabaciones de vídeo. El proyecto, bautizado como PromptMe AI, introduce un enfoque radicalmente diferente al de los teleprómteres tradicionales. En lugar de depender de un cronómetro fijo o de un operador humano que controle la velocidad de desplazamiento del texto, este sistema se adapta en tiempo real a la velocidad de habla del usuario. El funcionamiento es notablemente intuitivo: el usuario pega su guion, presiona grabar, y la herramienta destaca la palabra actual mientras habla, avanzando automáticamente con la velocidad de la dicción. La arquitectura técnica del proyecto merece especial atención. Todo el procesamiento ocurre íntegramente en el navegador del usuario, lo que significa que no se transmiten datos a servidores externos. El sistema utiliza Moonshine ONNX para el reconocimiento de voz automático (ASR), integra detección de actividad de voz (VAD) para identificar cuándo el usuario está hablando, y emplea un algoritmo de coincidencia difusa para alinear el texto del guion con las palabras reconocidas. Esta combinación permite que el sistema sea tolerante con los errores: si el usuario se salta líneas o pausa durante largos períodos, el teleprompter es capaz de encontrar nuevamente su posición en el documento. Desde una perspectiva tecnológica, este desarrollo ejemplifica la madurez alcanzada por los modelos de lenguaje y visión pequeños capaces de ejecutarse localmente. Moonshine ONNX es un modelo de reconocimiento de voz comprimido y optimizado que demuestra cómo las arquitecturas de IA pueden adaptarse para ejecutarse eficientemente en dispositivos de usuario final sin sacrificar demasiada precisión. Especialmente interesante es que el proyecto fue desarrollado originalmente utilizando Perplexity Computer, un entorno de programación asistida por IA que actúa como agente autónomo. Esto refleja una tendencia creciente en el desarrollo de software, donde los asistentes de IA no solo ayudan con fragmentos de código, sino que pueden participar activamente en todo el flujo de trabajo de ingeniería. La importancia de esta herramienta trasciende el ámbito profesional de creadores de contenido y presentadores. Representa un cambio fundamental en cómo accedemos a tecnología anteriormente cara y especializada. En una era donde los creadores de contenido independientes generan una parte significativa del entretenimiento y la educación online, democratizar herramientas como esta reduce las barreras de entrada para la producción de calidad. Los educadores, comunicadores corporativos, y profesionales del marketing pueden ahora producir presentaciones más fluidas sin necesidad de ensayar exhaustivamente o sin depender de costosos equipos de producción. Este proyecto también ilustra un patrón más amplio en la comunidad de desarrolladores: la capacidad de crear herramientas útiles y funcionales combinando modelos de IA existentes de manera creativa. El autor ha identificado un problema real (mantener sincronización entre guion y habla natural) y ha proporcionado una solución elegante utilizando tecnologías disponibles públicamente.

🎙️ Quick Summary

Escuchad, esto que os traigo hoy es de esas cosas que demuestran cómo la IA está cambiando realmente la forma en que trabajamos, sin que sea necesario vender un riñón para acceder a estas tecnologías. Un teleprompter que escucha tu voz y se adapta a tu ritmo de habla. Pensadlo un momento: durante décadas, esto solo era posible en platós de televisión profesionales con operadores entrenados. Ahora lo tienes en tu navegador, gratis, sin que tus datos salgan de tu ordenador. Lo que más me llama la atención es cómo está hecha la cosa. El desarrollador ha cogido varios modelos pequeños de IA —reconocimiento de voz, detección de que estás hablando, búsqueda fuzzy en el texto— y los ha montado de tal forma que funciona de verdad. No es un juguete, es una herramienta práctica. Y aquí viene lo importante: ha sido construida con ayuda de un agente de IA que actúa como programador. Es como si la IA te ayudara a crear herramientas que antes necesitaban a gente especializada. Eso es un ciclo virtuoso que está sucediendo ahora mismo. ¿Dónde queremos llevar esto? Si democratizamos las herramientas de contenido, ¿nos enfrentamos a una sobresaturación de vídeos y presentaciones más pulidas pero también más homogéneas? ¿O abrimos la puerta a que más voces diversas cuenten sus historias sin las barreras técnicas tradicionales? Eso es lo que deberíamos preguntarnos mientras seguimos viendo cómo la IA reinventa lo que parecía intocable.

🤖 Classification Details

Functional project with browser-based implementation, includes demo link and technical details about ASR, VAD, and script matching. Shows agentic coding workflow with Claude-like tools.