Hugging Face informa 11 millones de usuarios, más de 2 millones de modelos públicos y alrededor de 500.000 datasets en su Hub, cifras que muestran que la actividad open source no es sólo ruido: es volumen y uso real (según Hugging Face, 17/3/2026). Observamos que ese crecimiento viene acompañado de una dinámica dual: por un lado hay fragmentación y participación masiva de individuos; por el otro, una concentración fuerte en unos pocos modelos que absorben casi la mitad del tráfico. Este informe obliga a preguntarnos qué significa la palabra “abierto” cuando la mayoría de proyectos recibe muy poca tracción y cuando la adopción masiva se centra en familias de modelos muy concretas.
¿Qué cambia en el ecosistema open source?
Vemos una aceleración clara en 2025: el Hub creció hasta 11 millones de usuarios y más de 2 millones de modelos (según Hugging Face, 17/3/2026), pero la distribución es desigual: aproximadamente la mitad de los modelos tiene menos de 200 descargas y los 200 modelos más descargados (0,01% del total) concentran el 49,6% de todas las descargas (según Hugging Face, 17/3/2026). Además, la composición geográfica cambió: China logró la pluralidad de descargas con 41% del total en 2025 (según Hugging Face, 17/3/2026), mientras que la participación de la industria en desarrollo cayó de ~70% antes de 2022 a ~37% en 2025 y los desarrolladores independientes subieron de 17% a 39% en el mismo periodo (según Hugging Face, 17/3/2026). Estos datos muestran que la competencia existe, pero que la influencia práctica sigue concentrada en unas pocas familias y actores.
¿Cómo impacta esto en Argentina?
Para Argentina y la región la buena noticia es que la tendencia favorece modelos más pequeños y desplegables: la mediana de parámetros subió solo marginalmente (de 326M a 406M entre 2023 y 2025), mientras que la media saltó de 827M a 20.8B por el efecto de modelos gigantes (según Hugging Face, 17/3/2026). Eso significa que hay opciones ejecutables en hardware local y en entornos con recursos limitados, una condición útil para gobiernos y pymes locales. Pero hay riesgos: los modelos tienden a usarse más en las regiones donde se desarrollan (según Hugging Face, 17/3/2026), y la falta de documentación en español y métricas públicas limita la adopción segura en LATAM. Además, la brecha de infraestructura persiste: el informe remarca debates sobre inversión pública en centros de cómputo (según Hugging Face, 17/3/2026), algo que en Argentina implicaría definir prioridades de política pública para reducir dependencia de la nube extranjera.
Qué exigir: métricas, documentación y gobernanza
A partir de estos números exigimos tres condiciones mínimas antes de recomendar despliegues masivos: métricas públicas reproducibles (descargas, benchmarks, costos de inferencia) citadas por la plataforma; documentación en español que incluya limitaciones, sesgos y requisitos de hardware; y reglas claras de gobernanza sobre datos, licencias y revisión humana. El Hub muestra además sub-ecosistemas emergentes —por ejemplo, robótica pasó de 1.145 datasets en 2024 a 26.991 en 2025 (según Hugging Face, 17/3/2026)— que requieren estándares propios para datos y pruebas en el mundo real. También observamos que familias como Qwen ya generan decenas de miles de derivados (más de 113.000 modelos derivados solo de Qwen, y >200.000 si se incluyen etiquetas relacionadas) (según Hugging Face, 17/3/2026), lo que subraya la necesidad de trazabilidad y gobernanza de la cadena de valor. En resumen: valoramos el impulso técnico del open source, pero pedimos transparencia, documentación en español y gobernanza clara sobre datos y revisión humana antes de confiar en estos modelos para tareas críticas.