La hora de cómputo en GPUs NVIDIA B200 se duplicó: pasó de US$2,31 a US$4,95 en seis semanas, un aumento del 114% que comparten los gráficos publicados por el analista Tomasz Tunguz con datos del índice Ornn. Vemos una correlación casi perfecta entre cada lanzamiento de modelos frontera de OpenAI y Anthropic y saltos en la demanda de cómputo; eso está marcando precios y creando un nuevo piso de costos para quienes no tienen contratos previos.
En la práctica, esto significa que acceder “a lo último” dejó de ser solo caro y se volvió volátil, con efectos estratégicos para startups, compradores corporativos y los propios hiperescaladores.
¿Qué muestran los datos?
Los gráficos que compartió Tomasz Tunguz en X usan el índice Ornn para rastrear precios por hora de B200. Ahí aparecen las cifras clave: US$2,31 a principios de marzo versus US$4,95 la semana del reporte — un incremento del 114% en seis semanas (Tomasz Tunguz, datos del índice Ornn). También se ve que la prima entre las B200 y las H200 se disparó: la media histórica del ‘spread’ era US$1,06 y ahora está en US$2,09 (Ornn/Tunguz), prácticamente el doble.
Además, Tunguz cita operaciones en el mercado secundario: según el analista Jack Minor, algunas B200 se están negociando alrededor de US$500.000 en ese mercado. La concatenación de lanzamientos (GPT-5 Codex, Claude 4.5, GPT-5.3, Claude Opus 4.7, GPT-5.5 en la línea del tiempo que muestra Tunguz) coincide con picos de inferencia y con la escasez puntual de inventario.
¿Cómo impacta esto en el mercado argentino?
El aumento no es teórico para equipos que quieren probar o desplegar modelos grandes. Si tomamos la tarifa de US$4,95/h (Tunguz/Ornn) y la multiplicamos por un mes calendario de 30 días (30 x 24 = 720 horas), el coste por una sola B200 sería aproximadamente US$3.564 al mes —un cálculo directo para dimensionar el impacto operativo. Para startups argentinas con presupuestos limitados, esos números elevan la barrera de entrada y aceleran la concentración hacia quienes firmaron capacidad a largo plazo o cuentan con acceso directo a hiperescaladores.
Vemos además un riesgo de competitividad: empresas que cerraron contratos antes del salto operan ahora con menos de la mitad del coste horario que sus rivales, según el análisis de Tunguz. La consecuencia local es doble: o se negocian contratos multianuales y reservas, o se opta por optimizar modelos y usar alternativas menos caras, con el trade-off en precisión y latencia.
¿Qué pueden hacer las startups y los reguladores?
A corto plazo, la receta práctica es conocida: diversificar proveedores, negociar contratos a largo plazo y optimizar inferencia (quantization, distillation). También recomendamos evaluar modelos open source que permiten correr en hardware menos exigente, y considerar opciones alternativas que mencionó el análisis —TPU de Google, Trainium de Amazon o Ascend de Huawei— como palancas para reducir exposición (Tunguz/Ornn).
A mediano plazo, la solución estructural pasa por más transparencia en el mercado del cómputo. Exigimos, como postura editorial coherente con notas previas, métricas públicas sobre consumo por modelo, documentación en español y procesos de gobernanza con revisión humana antes de adopciones masivas de nuevos modelos. Sin esas herramientas la volatilidad seguirá beneficiando a los hiperescaladores y a quienes pueden acaparar inventario; la llegada de más B200 en la segunda mitad de 2026 aliviará algo la presión, pero no elimina la dinámica de demanda creciente (Tunguz).
En resumen, la lección es clara: la frontera de modelos redefine también la economía del hardware. No alcanza con el avance técnico; hace falta que el mercado tenga reglas, información y alternativas para que la adopción de IA sea competitiva y democrática.