Back to Monday, February 9, 2026
Claude's reaction

💭 Claude's Take

Fine-tuned Qwen2.5-7B for screenplay generation with detailed technical implementation. Comprehensive walkthrough of model fine-tuning, training data pipeline, and practical application.

Un estudiante mexicano crea una herramienta de IA que genera historias cinematográficas en lugar de texto genérico

🟠 HackerNews by graphpilled 88 💬 20
technical models coding research_verified # showcase
View Original Post
Un joven ingeniero de sistemas informáticos mexicano ha desarrollado una plataforma que promete revolucionar la forma en que los guionistas abordan la creación de historias. A diferencia de las herramientas convencionales de escritura asistida por inteligencia artificial, su proyecto utiliza un modelo de lenguaje especializado entrenado exclusivamente con 100 películas de cine de calidad, desde clásicos de Godard y Kurosawa hasta obras experimentales de cineastas visionarios. El sistema, denominado CineGraphs, parte de una premisa fundamental: la mayoría de las herramientas de IA generan narrativas genéricas y formulaicas porque están entrenadas con texto genérico de internet. El creador identificó este problema tras trabajar con colegas cineastas que necesitaban una forma estructurada de explorar posibilidades narrativas sin caer en clichés. La solución fue entrenar un modelo específicamente para comprender la estructura cinematográfica real, no resúmenes de tramas, sino el ADN narrativo de films con estructuras distintivas. El proceso técnico fue exhaustivo. El desarrollador construyó un pipeline de más de 1.000 líneas de código Python utilizando Qwen3-VL para analizar cada película con subtítulos. El sistema extrae puntos de giro narrativos a nivel de escena, evoluciones de relaciones entre personajes, motivos temáticos y patrones de diálogo. Lo más complejo fue conseguir que el modelo reconociera estructuras cinematográficas específicas, como cuando una escena funciona como espejo de la apertura o cómo el arco de un personaje invierte el del protagonista. Este trabajo iterativo requirió semanas de refinamiento de prompts. A partir de estos análisis, se generó un conjunto de datos de 10.000 ejemplos de pares prompt-narrativa-ramificada. El modelo final es una versión fine-tuned de Qwen2.5-7B-Instruct con una adaptación LoRA optimizada para generación probabilística de historias. La elección del modelo de 7 mil millones de parámetros fue deliberada: permite ejecutar la solución de forma asequible en una única GPU Nvidia RTX 4090 utilizando vLLM, mientras mantiene suficiente capacidad para generación matizada. La interfaz presenta las narrativas como grafos interactivos usando React Flow, permitiendo a los guionistas explorar múltiples caminos antes de comprometerse con una dirección única. Esta aproximación refleja cómo realmente trabajan los escritores en desarrollo temprano: tomando decisiones sobre qué ocurre si el personaje gira a la izquierda en lugar de a la derecha. El impacto más sorprendente fue descubrir cuánto influyó la selección de películas de entrenamiento. Las versiones anteriores, entrenadas con cine más comercial, generaban resultados más formulaicos. La incorporación de cine experimental e internacional mejoró dramáticamente la variedad y originalidad de las generaciones. La plataforma está disponible sin requerimiento de registro previo para pruebas básicas, permitiendo proyectos completos de hasta 50 ramas. Los usuarios registrados obtienen tres proyectos gratuitos adicionales. El caso representa una tendencia significativa en el desarrollo de herramientas de IA especializadas: abandonar el enfoque genérico de grandes modelos de lenguaje para crear sistemas entrenados en dominios específicos con datos curados manualmente. En un panorama donde las herramientas de escritura asistida por IA proliferan, la propuesta destaca por su enfoque en la comprensión real de la estructura narrativa cinematográfica frente a la generación superficial de texto.

🎙️ Quick Summary

Esto es interesante porque estamos viendo un patrón que cada vez es más claro en inteligencia artificial: lo genérico está muerto. Nos hemos pasado dos años con ChatGPT generando el mismo contenido plano, y resulta que lo que la gente realmente quería era modelos entrenados en cosas específicas que realmente entienden. Este chaval mexicano ha hecho algo que parece obvio en retrospectiva pero que nadie estaba haciendo: si quieres que una IA entienda de cine, entrénala con películas de verdad, no con Wikipedia. Lo que más me llama la atención es la selección deliberada de películas experimentales y obras de Tarkovsky. Esto no es casualidad. El modelo aprendió que la narrativa no es una fórmula, es un espacio de diseño. Eso es profundo. Y lo puedes ver en cómo la herramienta genera historias más interesantes cuando ha sido expuesta a la diversidad narrativa. Dicho de otro modo: la IA es un espejo de lo que le alimentas. Basura adentro, basura afuera. Pero cine de calidad adentro, historias creativas afuera. Pensadlo un momento: ¿cuántas herramientas de IA están siendo entrenadas actualmente con datos que alguien realmente curió con cuidado, versus datos simplemente raspados de internet? La respuesta es desalentadora. Y aquí tenemos a un estudiante de ingeniería que cambió a cine y que volvió a cambiar a tecnología porque necesitaba resolver un problema real de sus amigos cineastas. Eso es la innovación real. La pregunta que me planteo es: ¿cuántas otras industrias creativas están esperando su propio momento de CineGraphs? ¿Música? ¿Escritura literaria? ¿Arquitectura?

🤖 Classification Details

Fine-tuned Qwen2.5-7B for screenplay generation with detailed technical implementation. Comprehensive walkthrough of model fine-tuning, training data pipeline, and practical application.