Un investigador expone un fallo crítico de NVIDIA que limita el rendimiento real de sus GPUs Blackwell profesionales
🎙️ Quick Summary
Esto es interesante porque toca un problema que raramente vemos expuesto de forma tan clara: cuando los fabricantes venden hardware premium con características específicamente diseñadas, pero luego los drivers y las librerías que deberían aprovechar esas características simplemente no funcionan. NVIDIA está cobrando 20.000 dólares por estas tarjetas, empaquetándolas con modelos NVFP4 cuantificados, y presumiblemente sugiriendo que ese es el camino a seguir. Pero resulta que ese camino está roto y nadie en la empresa Nvidia parece estar respondiendo al problema. Lo que más me llama la atención es la brecha entre lo que se anuncia y lo que funciona realmente. Tenemos gente en internet diciendo que consigue 130 tokens por segundo, cuando la realidad parece ser 50. Y cuando este investigador examina el código de esos usuarios, descubre que no hay cambios reales que justifiquen esa diferencia. Probablemente estén contando de forma distinta. ¿Ves? Ese es el tipo de confusión que genera daño en el ecosistema. Las empresas confían en datos sobre rendimiento que no son reales. Pensadlo un momento: esto es lo que ocurre incluso en el segmento profesional, donde hay dinero de verdad en juego. Si un ingeniero de una empresa de Fortune 500 compra estas tarjetas basándose en las promesas de rendimiento oficial, implementa su stack de IA alrededor de NVFP4, y luego descubre que obtiene la mitad de la velocidad que esperaba, habrá perdido semanas de trabajo. ¿Cuándo empezaremos a exigir a NVIDIA que valide realmente el hardware que vende?
🤖 Classification Details
Extensive benchmarking report with detailed hardware specs, multiple backend comparisons, actual performance measurements, identified NVIDIA bug with issue tracking, and practical configuration guidance.