NVIDIA y Hugging Face anunciaron hoy la disponibilidad de Cosmos 3, un omni‑modelo para ‘physical AI’ que viene en dos tamaños: Cosmos 3 Nano (8B parámetros) y Cosmos 3 Super (32B parámetros) y se publica con tarjetas de modelo y licencia en Hugging Face (según el blog de Hugging Face, 1/6/2026).
¿Qué trae de nuevo Cosmos 3?
Cosmos 3 cambia la lógica de pila que muchos desarrolladores venían usando: en lugar de encadenar varias redes especializadas, esta versión combina generación de mundos, razonamiento físico y generación de acciones en una misma arquitectura Mixture‑of‑Transformers (MoT). El modelo procesa cinco modalidades —texto, imagen, video, audio y acción— mediante encoders dedicados y proyecta todo a un espacio compartido, alternando entre una subsecuencia autorregresiva para razonamiento y una subsecuencia de difusión para generación (según el blog oficial). La integración con Diffusers y las plantillas de prompt facilitan usarlo para text‑to‑video o policy generation sin montar pipelines complejos. Para equipos de investigación esto reduce la fricción; para producción plantea la pregunta de cómo medir robustez y seguridad cuando una única red hace tareas múltiples.
¿Cómo impacta esto en el mercado argentino?
Que Cosmos 3 esté disponible en Hugging Face facilita el acceso inicial: la release incluye además seis datasets sintéticos para physical AI y scripts de post‑entrenamiento en GitHub (según el anuncio). La versión Nano está diseñada para ‘workstation‑grade compute’ como la RTX PRO 6000, mientras que la Super apunta a infraestructuras con GPUs Hopper y Blackwell, lo que implica distintas barreras de entrada. En la práctica eso significa que equipos de I+D y startups con acceso a estaciones de trabajo potentes podrán experimentar con cargas más livianas, mientras que la generación masiva de datos sintéticos y entrenamiento a escala seguirá concentrado en centros con GPUs de alto rendimiento. Para el ecosistema argentino esto puede acelerar prototipos en robótica y logística, pero el paso a despliegues comerciales dependererá de disponibilidad de hardware, costos operativos y de la calidad de la documentación en nuestro idioma.
Riesgos, transparencia y qué exigimos antes de usarlo en producción
Cosmos 3 incluye model cards y licencias, y publica datasets y recetas de post‑entrenamiento; eso es positivo, pero no alcanza. Los riesgos concretos son el sim‑to‑real gap (lo que funciona en simulación no siempre se traduce al mundo físico), la trazabilidad de los datos sintéticos y la posible automatización de decisiones de acción en entornos peligrosos. Por eso exigimos tres cosas: 1) métricas públicas y reproducibles que midan fracaso seguro, tasa de error en cola larga y desempeño en escenarios de borde; 2) documentación completa en español para equipos técnicos y responsables de cumplimiento; 3) gobernanza con revisión humana antes de despliegues comerciales, incluyendo auditorías externas. Cosmos 3 es técnicamente ambicioso —y viene en 8B y 32B parámetros según la nota— pero la ambición técnica no sustituye a la responsabilidad operativa (según Hugging Face, 1/6/2026).
Conclusión práctica
Vemos a Cosmos 3 como un avance relevante: simplifica experimentación y pone a disposición datasets y herramientas útiles. Al mismo tiempo, su adopción responsable exige transparencia técnica y operacional. Pedimos a NVIDIA y a la comunidad que publiquen benchmarks abiertos, guías en español y protocolos de gobernanza con revisión humana antes de que estos modelos se incorporen a productos que operen en la calle, en fábricas o en vehículos.