DeepSeek v4: modelo abierto, contexto de 1 millón de tokens y precios muy bajos

DeepSeek acaba de publicar DeepSeek v4: un modelo de pesos abiertos que, según la propia compañía, viene en una versión Pro de 1,6 billones de parámetros (con 49.000 millones activos) y una Flash de 248.000 millones (13.000 activos). La firma anuncia además una ventana de contexto de 1.000.000 de tokens y mejoras de eficiencia importantes; los precios oficiales citados por el analista Simon Willinson son de 1,74 USD/ millón de tokens de entrada y 3,48 USD/ millón de salida para la Pro, y 0,14/0,28 USD para la Flash. Si todo eso se confirma en la práctica, hablamos de un salto cuantitativo en capacidad y un cambio en la relación precio-rendimiento.

Qué anunció DeepSeek y por qué importa

DeepSeek v4 combina Mixture-of-Experts (MoE) con optimizaciones para reducir coste por token: la compañía dice que ahora requiere el 27% de las operaciones por token y usa el 10% de la caché KV comparado con v3, lo que explica parte del ahorro, según el anuncio oficial. La ventana de contexto creció desde 128.000 tokens en la generación anterior hasta 1.000.000 ahora, lo que permite alimentar novelas completas o grandes bases documentales en una sola pasada, según DeepSeek. Además, la compañía adaptó el modelo para correr tanto en GPUs NVIDIA como en los Ascend de Huawei; Huawei confirmó soporte en Baidu y The Information señaló que esa adaptación fue clave en el calendario del lanzamiento. Vemos aquí dos efectos: potencia técnica y apuesta por interoperabilidad hardware.

¿Es tan bueno como dicen los benchmarks?

Los resultados que comunica DeepSeek son llamativos pero provisionales: la firma publica un 93,5% en LiveCodeBench para v4 Pro-Max frente a 88,8% que atribuye a Opus 4.6, y menciona paridad o superioridad frente a GPT-5.4 xHigh y Gemini 3.1 Pro en varias pruebas internas. Es importante subrayar que esos benchmarks son internos y no han sido verificados por terceros independientes, por lo que pueden existir diferencias por configuración, prompts o selección de tareas. En precio, el analista Simon Willinson calcula hasta siete veces menos que Opus 4.7 y casi nueve veces menos que GPT-5.5 según los listados oficiales citados; si la calidad se mantiene, el golpe al modelo de negocio de proveedores cerrados sería real. Sin ver auditorías externas, sin embargo, no podemos dar por sentado que el rendimiento se traduce en la experiencia real.

¿Cómo impacta esto en el mercado argentino?

Que DeepSeek publique pesos abiertos y soporte hardware alternativo tiene potencial democratizador: precios anunciados bajos y disponibilidad de pesos pueden reducir barreras para startups y universidades en la región. Pero hay una trampa práctica: correr modelos MoE a escala sigue requiriendo infraestructura y know‑how; no es lo mismo acceder a pesos que poder desplegarlos eficientemente. Además, la firma busca levantar unos 300 millones de dólares y una valoración cercana a 20.000 millones, según The Wall Street Journal, mientras pierde talento clave hacia ByteDance y Xiaomi, lo que añade incertidumbre operativa. Para empresas y gobiernos argentinos la pregunta no es solo «podemos usarlo», sino «cómo lo hacemos seguro, en español y con soporte local».

Qué pedimos: métricas públicas, documentación en español y gobernanza

Apoyamos la llegada de modelos optimizados como DeepSeek v4 por su potencial, pero exigimos transparencia: métricas públicas, benchmarks reproducibles por terceros y documentación técnica en español antes de una adopción amplia. También pedimos claridad sobre datos de entrenamiento, mitigaciones de sesgos y un mecanismo de gobernanza que incluya revisión humana en despliegues sensibles, especialmente en salud, educación y seguridad. Si DeepSeek cumple lo que anuncia y además abre auditorías independientes, puede confirmar el «momento DeepSeek» de continuidad; si no, el bajo precio será irrelevante frente a riesgos operativos y de calidad. Vemos oportunidades concretas, pero las acompañamos con condiciones claras.

Qué anunció DeepSeek y por qué importa

¿Es tan bueno como dicen los benchmarks?

¿Cómo impacta esto en el mercado argentino?

Qué pedimos: métricas públicas, documentación en español y gobernanza

Segui leyendo

Hugging Face describe datos sintéticos 'task‑seeded' que mejoran Nemotron en 100B tokens

Qué es Gemini Spark, qué puede hacer y quién podrá usarlo

Apple relanza Siri con Gemini: segunda oportunidad y muchas dudas