DeepSeek-V4-Pro es, en pocas palabras, un modelo más económico que sus rivales y con la intención explícita de alimentar una industria china de hardware independiente de Nvidia: la empresa anunció mantener de forma permanente un recorte de precio del 75% y publica sus pesos abiertos, según la nota de Xataka publicada el 25/5/2026. Esto convierte tareas agénticas con alto consumo de tokens en mucho más asequibles.

¿Qué ofrece DeepSeek y por qué importa?

DeepSeek-V4-Pro destaca por precio y por una estrategia técnica pensada para reducir coste de ejecución. Según Xataka (25/5/2026), el coste por 1M tokens de entrada es 0,435 y por 1M tokens de salida 0,87 (DeepSeek-V4-Pro), frente a 5/30 para GPT-5.5 y 1,5/9 para Gemini 3.5 Flash en la tabla citada. Artificial Analysis, citado por la misma nota, indica que el rendimiento está cerca de los mejores modelos aunque algo más lento en latencia. Para tareas que consumen millones de tokens, esta diferencia de precio puede traducirse en ahorros multiplicativos y viabilizar proyectos que antes eran prohibitivos económicamente.

¿Cómo le saca jugo DeepSeek al hardware chino?

La apuesta técnica es explícita: usar arquitecturas que activan menos parámetros y comprimen la KV Cache. Xataka (25/5/2026) detalla que DeepSeek adapta Mixture of Experts (MoE) y Multi-head Latent Attention (MLA) y presenta un módulo llamado Engram para búsqueda de memoria en LLMs. Según el analista GDP en X (relatado por Xataka), DeepSeek-V4-Pro necesita solo 5,48 GB de HBM para 1M tokens, mientras que GLM5 requeriría 60 GB y Qwen 3 necesitaría 89 GB para el mismo contexto. Esa reducción permite prescindir en muchos casos de módulos HBM de alta velocidad y experimentar con NAND o SSDs fabricados por empresas como YMTC, y con DRAM de CXMT, lo que abre la puerta a ejecutar modelos en chips locales menos potentes pero mucho más baratos.

¿Cómo impacta esto en el mercado argentino?

Vemos tres efectos concretos. Primero, la caída de costos cambia el umbral de viabilidad económica: si un proyecto agente consumía 10M tokens, la diferencia entre pagar 30 USD por 1M (GPT-5.5 salida) y 0,87 USD con DeepSeek es de decenas de veces; 30/0,87 ≈ 34,5 veces más caro el primero, según la tabla citada por Xataka (25/5/2026). Segundo, publicar pesos abiertos facilita auditoría, adaptación y despliegue local, algo relevante para empresas y universidades en Argentina que necesitan documentación en español y control sobre datos. Tercero, para pymes y startups locales, los modelos baratos reducen barreras de entrada para agentes de atención al cliente, automatización documental o analítica de texto a gran escala. Sin embargo, la compatibilidad y soporte en español serán decisivos para la adopción regional.

¿Es sostenible la estrategia y cuáles son los riesgos?

La jugada de DeepSeek es industrial y de largo plazo: según Xataka (25/5/2026) la startup busca levantar 10.000 millones de dólares en una ronda que la valoraría entre 45.000 y 50.000 millones. Publicar pesos abiertos y empujar estándares como MoE/MLA busca que fabricantes de hardware adapten sus diseños. Pero hay riesgos claros: dependencia de la cadena de suministro china, posibles represalias regulatorias o comerciales, y la necesidad de garantizar seguridad y robustez cuando los modelos corren en hardware no estándar. Además, la presión competitiva de gigantes con billonarias valoraciones puede forzar iteraciones rápidas. Desde nuestra perspectiva apoyamos evaluaciones abiertas, métricas públicas, documentación en español y gobernanza con revisión humana para mitigar riesgos y medir impactos reales.

Conclusión rápida: DeepSeek-V4-Pro no gana la carrera de benchmarks de un día para otro, pero su combinación de precios, arquitectura y apertura técnica puede ser el catalizador para que una industria local de hardware y servicios de IA en China prospere. Eso, a su vez, redistribuye fuerza en la cadena global de valor de la IA y plantea nuevas preguntas regulatorias y de soberanía tecnológica.