¿Por qué los precios de la GPU se disparan fuera de control?
Título original: La gran escasez de GPU – Capacidad de alquiler – Lanzamiento de nuestro índice de precios de alquiler de 1 año H100
Autores originales: Daniel Nishball, Jordan Nanos, Cheang Kang Wen, etc.
Traducción: Peggy, BlockBeats
Nota del editor: A medida que la IA pasa de ser una "herramienta" a una "infraestructura de flujo de trabajo", los precios de alquiler de las GPU han entrado en una fase de aumento acelerado, con una oferta que continúa restringiéndose.
Desde un aumento de casi el 40% en el precio del H100 a un año, pasando por el bloqueo de la energía hash hasta la segunda mitad de 2026, y además de que los laboratorios de IA bloquean continuamente el suministro a través de contratos a largo plazo y mecanismos de renovación, la lógica operativa del mercado de las GPU ha experimentado cambios significativos: los precios ya no están determinados principalmente por los costos de hardware, sino que están conformados colectivamente por el consumo de tokens, las capacidades del modelo y la eficiencia de producción.
Los cambios en el lado de la demanda son particularmente cruciales. Nuevos paradigmas como los sistemas multiagente, la generación de contenido nativo, las herramientas de programación de IA, etc., están llevando el uso de tokens a una fase de crecimiento exponencial. La conclusión central del informe también está quedando clara: se ha validado el retorno de la inversión de las herramientas de IA, con un rendimiento de 5 a 10 veces, lo que dificulta que los precios de la electricidad restrinjan efectivamente la demanda durante bastante tiempo.
La tensión resultante es cada vez más clara: el mercado real de la energía de hash está experimentando una escasez completa y un cambio al alza en el poder de fijación de precios, mientras que el mercado de capitales aún persiste con la expectativa de un "eventual exceso de oferta y mercantilización". Esta desconexión entre la expectativa y la realidad está remodelando la lógica de valoración de la carrera de infraestructura de IA.
A medida que la energía de hash se convierte en un nuevo medio de producción, su mecanismo de precios, estructura de oferta y rendimiento de capital están experimentando una profunda reestructuración.
El texto original es el siguiente:
El Claude 4.6 Opus y el Claude Code de Anthropic han experimentado un aumento significativo de la demanda. Sus ingresos recurrentes anuales (ARR) han aumentado de 9.000 millones de dólares a finales del año pasado a más de 25.000 millones de dólares en solo un trimestre, logrando un crecimiento de casi el triple. Al mismo tiempo, los modelos de código abierto representados por GLM y Kimi K2.5 también han impulsado la rápida expansión de las aplicaciones relacionadas con los modelos de código abierto. La financiación continua de empresas como Anthropic, OpenAI y múltiples Neolabs está intensificando de manera similar la demanda de recursos de la GPU.
Este punto de inflexión significa un rápido aumento de la demanda en un corto período de tiempo, con hiperescaladores y proveedores de nube emergentes (Neoclouds) que experimentan una ola de compras de GPU.
Esta nueva demanda está elevando los precios en toda la cadena de suministro, desde almacenamiento DRAM y NAND hasta cables de fibra óptica, alojamiento de centros de datos e incluso infraestructura como turbinas de gas. Prácticamente todos los productos y servicios relacionados están experimentando aumentos.
Los precios del alquiler de GPU se han convertido en la última esfera de una gama de productos y servicios relacionados con la informática para ver las limitaciones de la oferta y los aumentos de precios. El precio de un contrato de alquiler de GPU de un año para una GPU H100 ha aumentado de un punto bajo de 1,70 dólares por GPU por hora en octubre de 2025 a 2,35 dólares en marzo de 2026, casi un 40% de aumento.
La capacidad de alquiler de GPU bajo demanda se agota casi en su totalidad en todos los modelos: los usuarios que han asegurado instancias bajo demanda son reacios a liberar potencia informática de nuevo al mercado incluso después de los aumentos de precio. A principios de 2026, encontrar energía informática en la GPU es similar a tratar de obtener el último asiento en un vuelo: los precios son altos y la disponibilidad es escasa. Una analogía más adecuada podría ser menos acerca de tomar un asiento en un vuelo y más acerca de "tratar de encontrar una fuente de medicina".

En SemiAnalysis, hemos estado rastreando varias tendencias y problemas clave en Neocloud y el ecosistema de nube hiperescala, incluidos los precios de alquiler de GPU. Esta capacidad se deriva de nuestra investigación y práctica en proyectos como ClusterMAX, InferenceX y AI Cloud Total Cost of Property (TCO).
Simultáneamente, hemos dedicado un esfuerzo significativo a ayudar a varios laboratorios de IA a conectarse con proveedores de servicios Neocloud, obtener recursos de alquiler de GPU en el mercado y mantener una comunicación continua con casi todas las partes interesadas en el ecosistema con respecto a los cambios en los precios de alquiler de GPU.
Desde 2023, hemos establecido y mantenido un sistema de índice de precios de alquiler de GPU para clientes, que cubre los principales modelos de GPU como H100, H200, B200, B300, GB200, GB300, MI300, MI325, MI355, en diferentes términos de arrendamiento, desde alquileres a corto plazo de un mes a pedido hasta contratos de 5 años extendidos. Este índice se basa en datos de investigación de múltiples proveedores de servicios Neocloud y compradores de cómputo, validados de forma cruzada a través de datos de transacciones reales y resultados de negociación que hemos facilitado.

Hoy, estamos abriendo el índice de precios de alquiler de GPU H100 a un año al público, con el objetivo de proporcionar a la industria más datos e información. Este índice se actualizará mensualmente y seguiremos publicando los últimos análisis de tendencias y observaciones de mercado a través de X y LinkedIn. En cuanto a los datos exhaustivos de precios que cubren diferentes estructuras de arrendamiento y otros modelos de GPU convencionales, esta información solo está disponible actualmente para los usuarios institucionales suscritos a nuestro modelo de TCO de nube de IA.
Este informe se centrará en las últimas tendencias en el mercado de alquiler de GPU, observaciones de primera línea del mercado y datos clave para analizar cómo entendemos la estructura general del mercado y hacer un juicio preliminar sobre las tendencias futuras de los precios de alquiler.
El mercado de alquiler de GPU entra en la etapa de "precios dinámicos"
Basta con mirar la curva de precios de alquiler de un año del H100, para mostrar completamente el nivel de tensión del mercado: la experiencia real de adquirir potencia informática en primera línea y los comentarios de los participantes del mercado reflejan una situación más severa.
La demanda actual proviene de múltiples escenarios de uso altamente heterogéneos, casi sin una "solución única para todos". Por ejemplo, en el lado de la inferencia, los modelos de mezcla de expertos (MoE) a gran escala son más adecuados para ejecutarse en los últimos sistemas a gran escala como la GB300 NVL72; y en el lado de la capacitación, la H100 aún mantiene su ventaja en cuanto a rentabilidad, por lo que incluso para una GPU relativamente de "mayor generación", la demanda sigue siendo alta.
Los clientes están pagando hasta $14 por GPU por hora por instancias preferentes de AWS p6-b200; algunos de los principales proveedores de servicios Neocloud han dejado de vender nodos individuales; algunos precios de renovación H100 son los mismos que cuando se firmaron hace dos o tres años; y algunos contratos H100 se han renovado directamente hasta 2028, con un período de arrendamiento de hasta 4 años. Ahora, no es fácil encontrar ni siquiera un clúster H100 o H200 de 8 nodos (64-GPU), la mitad de los proveedores de servicios que preguntamos se han agotado por completo, y la respuesta de la mayoría de los proveedores de servicios es que no habrá GPU de arquitectura Hopper que expiren y se lancen pronto.
Incluso escuchamos que algunos inquilinos de potencia informática están comenzando a subdividir y subarrendar los clusters que han alquilado, al igual que dividir y subarrendar un apartamento durante el Gran Premio de Mónaco. ¿Veremos el surgimiento de los llamados "subterratenientes de la neonube" a continuación? Probablemente ya no es sólo una broma.
El suministro de Blackwell también es extremadamente escaso. Hemos aprendido que, debido a la fuerte demanda de modelos de ponderación de código abierto y a la continua demanda explosiva de inferencia, el ciclo de despliegue y entrega de un nuevo lote de agrupaciones de Blackwell se ha ampliado ahora hasta junio y julio. Además, la mayoría de estos próximos grupos ya se han reservado por adelantado. De hecho, mirando a todo el mercado, la capacidad adicional que no estará en línea hasta agosto a septiembre de 2026 está casi completamente reservada.
Precios de alquiler GPU: Haciendo un regreso
Pero, ¿cómo llegó el mercado a este punto? Hace apenas 6 meses, la mayoría de los observadores del mercado todavía mantenían una actitud escéptica hacia el "valor terminal" de las GPU y creían en general que los precios de alquiler de las GPU seguirían disminuyendo inevitablemente con el tiempo. En ese momento, si un proveedor de nube Neocloud o hiperescala adoptara un ciclo de depreciación de 6 años para los activos informáticos de la GPU en su modelo financiero, incluso serían criticados por los analistas financieros. Antes de discutir las tendencias futuras, revisemos rápidamente cómo han evolucionado las cosas hasta este punto.
Hasta el segundo semestre de 2025, la expectativa general en todo el ecosistema siempre había sido que con el despliegue generalizado de Blackwell y su costo de computación unitario significativamente más bajo, los precios de arrendamiento de Hopper (es decir, H100 y H200) caerían abruptamente. Sin embargo, la realidad resultó ser la opuesta. Para el segundo semestre de 2025, la demanda de H100 no solo no se debilitó, sino que se fortaleció aún más en muchos escenarios. La rápida adopción de modelos de ponderación abierta y la aceleración continua de la demanda de inferencia en ese momento fueron las primeras señales de esta ola casi interminable de demanda de potencia informática.
En enero de 2026, el mercado de la potencia informática fue testigo del siguiente punto de inflexión: después de varios trimestres de rápido aumento, los precios del almacenamiento DRAM y NAND comenzaron a entrar en una fase de aumento casi "parabólico". De acuerdo con nuestro modelo de almacenamiento, en el primer trimestre de 2026, los precios contractuales de LPDDR5 y DDR5 se multiplicaron casi por cuatro y cinco interanuales, respectivamente.
Para abordar el fuerte aumento de los costos de los componentes y los riesgos del margen de beneficio que trajo consigo, los fabricantes de OEM comenzaron a aumentar los precios de los servidores de IA, y los aumentos de precios fueron significativamente más altos que los de los propios componentes subyacentes. Esto hizo más complejas las decisiones sobre gastos de capital en clúster: los mayores costos de adquisición de servidores comprimieron los rendimientos esperados de los proyectos, lo que obligó a algunos operadores a ralentizar el despliegue o incluso abandonar directamente los proyectos planificados. Como resultado, parte del suministro adicional previsto inicialmente que podría haberse puesto en línea se pospuso o archivó, lo que agravó aún más la restricción del mercado de arrendamiento financiero.

En este caos de adquisiciones provocado por "precios descontrolados de servidores de IA", la demanda de arrendamiento de GPU se aceleró significativamente, y la potencia informática restante en el mercado se absorbió casi en su totalidad en enero y febrero. En marzo, ya fuera H100, H200 o B200, apenas había capacidad disponible bajo ningún plazo de arrendamiento. El precio de arrendamiento a un año ya había superado los $2 por GPU por hora a fines de enero y aumentó nuevamente entre un 15% y un 20% en la segunda mitad de febrero en comparación con fines de enero, con un aumento adicional esperado de entre un 15% y un 20% mes a mes a fines de marzo.
Uno de los principales impulsores de la demanda de principios de año este año provino de la generación de medios nativos. Aplicaciones como Seedance y Nano Banana están impulsando a los usuarios a generar e iterar imágenes y videos a escala, aumentando significativamente el rendimiento de tokens. Sin embargo, la fuente de demanda más crítica y visible es el aumento de las cargas de trabajo de múltiples agentes, sistemas que ejecutan procesos de varios pasos, iteran continuamente en entornos de alta concurrencia e impulsan el consumo de tokens y los requisitos de potencia informática para mostrar un crecimiento "exponencial".
Esta tendencia es particularmente evidente en los datos relacionados con el Código Claude, como hemos mencionado en varios artículos anteriormente. Tomando como ejemplo SemiAnalysis, en solo los últimos 7 días, la compañía consumió internamente decenas de miles de millones de tokens, con un costo promedio de alrededor de $5 por millón de tokens. Sin embargo, el tiempo ahorrado, la expansión del flujo de trabajo y las capacidades mejoradas superan con creces el costo en sí. Hoy en día, SemiAnalysis ha integrado un conjunto completo de herramientas de IA en múltiples flujos de trabajo, ya no se limita a la búsqueda y el resumen simples, sino que se extiende a los paneles de datos, el scraping automatizado, el procesamiento de datos a gran escala y los escenarios de modelado financiero basados en agentes.
También hacemos un seguimiento del crecimiento explosivo de esta demanda a través de métricas como Daily Commits de Claude para monitorear esta tendencia. Al ritmo actual, esperamos que para finales de 2026, el Código Claude represente más del 20% de todos los compromisos de código. Se puede decir que, sin que usted lo sepa, la IA ya ha comenzado a "devorar" todo el proceso de desarrollo de software. Para clientes institucionales interesados en acceder a este conjunto de datos, comuníquese con nuestro equipo de API. Un pequeño spoiler: este volumen de commit ya es significativamente mayor que cuando iniciamos.

En nuestro círculo, casi todo el mundo es un gran usuario de Claude Code. Pero también entendemos que este círculo en sí mismo está profundamente inmerso en el campo de la IA y los semiconductores, esencialmente solo "un pequeño grupo a la vanguardia".
Para muchas compañías Fortune 500 y el público en general, Claude Code y el "mundo de los agentes" son solo un tema algo novedoso, que ocasionalmente aparece en el feed de Facebook o podcasts de NPR. Apenas se han dado cuenta de que se acerca una ola de productividad y un choque estructural impulsado por los agentes.

A medida que más participantes de la economía real se den cuenta gradualmente del asombroso retorno de la inversión del uso de herramientas de IA y se unan a esta "onda de poder computacional", el consumo de tokens continuará mostrando un crecimiento gradual. De hecho, el debate sobre el retorno de la inversión en IA se ha resuelto: el valor creado por el uso de herramientas de IA a menudo excede su costo en un orden de magnitud. En este contexto, el actual desplazamiento hacia la derecha de la curva de demanda de fichas está formando una fuerza fuerte y (en esta etapa) relativamente inelástica, que impulsa continuamente al alza los precios del alquiler de la GPU.
En términos simples, si el ROI del uso de herramientas de IA puede alcanzar de 5 a 10 veces, entonces los precios de alquiler de GPU todavía tienen un margen considerable para aumentar antes de limitar realmente la demanda. Tampoco descartamos que nuevos aumentos en los precios del alquiler sigan aumentando, lo que aumentará los costos de los servidores y los componentes básicos.
Publicado el índice de precios de arrendamiento de un año de SemiAnalysis H100
Hoy en día, estamos poniendo a disposición del público el índice de precios de contratos de arrendamiento de un año H100 de SemiAnalysis, con el objetivo de mejorar la conciencia del mercado y la transparencia de las tendencias de precios de arrendamiento de GPU.
Este índice se basa en datos de encuestas mensuales de más de 100 participantes del mercado, incluidos proveedores de servicios Neocloud, compradores de hashpower y vendedores, para establecer un rango representativo (percentil 25 a 75) de precios de arrendamiento de GPU. Además, realizamos una validación cruzada con los datos reales de las transacciones, facilitamos las operaciones dentro de nuestra red para calibrar aún más los niveles de precios.

Desde 2023, hemos estado monitoreando los precios de los contratos de las GPU, incluidas las H100, H200, B200, B300, GB200 y GB300, en plazos de arrendamiento que van desde 3 meses hasta 5 años; también hemos incluido datos sobre la serie AMD (MI300, MI325, MI355).
En comparación con los índices de GPU existentes en el mercado, el índice de precios de contratos de arrendamiento a un año H100 de SemiAnalysis tiene varias diferencias clave:
En primer lugar, muchos índices de arrendamiento de GPU se basan en cotizaciones al contado/bajo demanda o precios de lista pública, pero en realidad, la mayoría de las transacciones de arrendamiento de GPU se realizan a través de contratos a largo plazo, a menudo con plazos de 6 meses o más. Estos precios suelen establecerse mediante negociaciones bilaterales y no cotizan en bolsa. La mayoría de los principales proveedores de servicios de Neocloud prefieren firmar contratos de arrendamiento de al menos 1 año, siendo más comunes de 2 a 3 años, e idealmente asegurar un acuerdo mayorista a gran escala de 5 años. El índice de arrendamiento a un año H100 de SemiAnalysis se centra en este "mercado contractual", la parte más líquida del mercado. Al dirigirse explícitamente a un plazo de arrendamiento específico, este índice es más fácil para los usuarios de entender el segmento de mercado que cubre y compararlo con sus propias observaciones.
En segundo lugar, los precios públicos no representan los precios reales de transacción. Los precios compartidos por los proveedores de nube de hiperescala y Neocloud son más indicativos de las tendencias que de los niveles reales de negociación. Estos precios suelen ir a la zaga de los cambios en el mercado de contratos y se ajustan normalmente después de que se hayan producido cambios en la demanda de hashpower. Especialmente en el mercado a la carta, los precios suelen fijarse a niveles relativamente fijos, y los cambios reales de la oferta y la demanda se reflejan en la utilización o utilización de los recursos, y los ajustes se hacen de manera irregular sólo cuando es necesario. Más detalles sobre este mecanismo de mercado se tratarán en las secciones posteriores de este artículo.
Además, aunque hay muchos índices en el mercado que pueden manejar datos de cotización, precios y comercio a gran escala, y tienen una ventaja en el análisis de tendencias, nuestro enfoque enfatiza la interacción directa con los participantes del mercado. Detrás de cada cotización y cada operación se esconde su contexto específico y su lógica de decisión. Esperamos presentar datos cuantitativos, complementando al mismo tiempo esta información cualitativa y observaciones de primera mano, con el fin de describir más exhaustivamente la verdadera estructura del mercado de arrendamiento de GPU.
Para los usuarios de suscripción institucionales, también proporcionamos datos de estructura a plazo completo que cubren casi todos los mercados de arrendamiento de GPU convencionales.

Junto con la publicación del índice de precios contractuales de un año para el H100, también hemos lanzado el panel de control de SemiAnalysis Tokenomics para usuarios de suscripciones a modelos de Tokenomics a nivel institucional para rastrear y comprender el panorama de modelos de IA de frontera. Este panel apoya a los usuarios en comparaciones personalizadas en múltiples dimensiones, como código, inferencia, matemáticas y evaluación de agentes de IA, comparando los precios de API de diferentes modelos y proveedores de servicios y viendo los datos clave divulgados por los principales laboratorios de IA, incluido el uso de tokens, los ingresos, la valoración y la base de clientes.
Estructura actual del mercado de arrendamiento de GPU
Hasta el segundo semestre de 2025, el entorno de precios del mercado de arrendamiento de GPU era relativamente más competitivo. En ese momento, los operadores tenían a mano un inventario de GPU más abundante, mientras que la demanda final apenas comenzaba a acelerarse. Por lo tanto, la competencia entre varios proveedores de servicios Neocloud fue feroz, generalmente compitiendo por los clientes al ofrecer precios más atractivos. El objetivo principal era aumentar la utilización y "exprimir" completamente el valor de los activos de potencia informática existentes antes de que llegara el próximo ciclo de iteración de la GPU.
Sin embargo, desde entonces el panorama del mercado ha dado un giro de 180 grados. Hoy en día, los proveedores de nube de Neocloud e hiperescala han tomado el control total: su objetivo principal es aumentar la utilización tanto como sea posible antes del próximo ciclo de iteración de la GPU y extraer el valor de sus activos de potencia informática existentes. Pueden exigir pagos anticipados más altos, mejores precios, plazos contractuales más largos e incluso elegir los tiempos de inicio y finalización de los contratos para que coincidan con sus arreglos de inventario y capacidad. Al mismo tiempo, el tiempo también está del lado de la oferta: pueden desplegarse a su propio ritmo, seleccionando gradualmente la mejor combinación de clientes en un entorno de precios crecientes.
Estructuralmente, el mercado de arrendamiento de GPU puede dividirse aproximadamente en tres segmentos principales, correspondiendo cada segmento a diferentes tipos de demandas de los clientes:
Arrendamiento a corto plazo: bajo demanda, al contado y contratos de menos de 3 meses
Contratos a medio plazo: contratos de 3 meses a más de 3 años
Acuerdo de despegue: Un contrato de 4-5 años, siendo 5 años la duración más común
Arrendamiento a corto plazo: Contratos bajo demanda, al contado y de menos de 3 meses
El arrendamiento a corto plazo se encuentra al comienzo de toda la estructura del arrendamiento y a menudo corresponde a "capacidad excedentaria". Sin embargo, algunos proveedores de servicios (como Runpod, Lambda) se centran en proporcionar energía de cómputo sustancial y flexible bajo demanda o al contado.
Es importante señalar que el mecanismo de fijación de precios en el mercado bajo demanda es significativamente diferente de otros mercados contractuales. Por lo general, los proveedores de servicios establecen un nivel de precios relativamente fijo para los recursos bajo demanda y lo ajustan solo en muy pocos casos. En otras palabras, el precio en el mercado a corto plazo no depende totalmente de la oferta y la demanda en tiempo real, sino que refleja la restricción del mercado a través de cambios en la utilización de los recursos.

Los proveedores de servicios suelen ajustar los precios en función de la utilización de los recursos de una sola vez: cuando la utilización es baja, bajarán los precios para estimular la demanda, y cuando la utilización está cerca de la plena capacidad, subirán los precios porque la demanda sigue siendo alta incluso a un nivel de precios más alto.
Esto también explica por qué, en una vista de serie temporal, los precios a pedido de Neocloud a menudo permanecen sin cambios durante un largo período y luego experimentan repentinamente un aumento o disminución de "cambio de paso". Para el mercado bajo demanda, lo que refleja verdaderamente los cambios de la demanda con una frecuencia elevada no es el precio sino la tasa de utilización de los recursos.

Fuente: Lambda Labs, Semianálisis
Contratos a medio plazo
Desde un punto de vista económico, lo que es más crítico es el "mercado contractual" porque la gran mayoría del valor de transacción de arrendamiento de GPU se produce en este segmento. Entre ellos, el contrato de 1 año es particularmente importante, ya que refleja tanto la demanda marginal de clientes que no pertenecen al laboratorio de IA como la demanda desbordada de los grandes clientes, lo que lo convierte en el indicador más sensible del ajuste del mercado.
Las empresas nativas de IA y los laboratorios de IA pequeños y medianos son principalmente activos en el rango de 1 a 3 años. Sin embargo, una tendencia notable reciente es que estas instituciones también están comenzando a tratar de bloquear los recursos informáticos a través de contratos a más largo plazo, muchos de los cuales se han extendido a más de 4 años e incluso están dispuestos a pagar más del 20% por adelantado, lo que no era común en contratos de más de 4 años en el pasado.
Tomas a largo plazo
En el mercado a largo plazo de 4-5 años, los actores dominantes son los grandes laboratorios de IA que aseguran recursos informáticos a gran escala desde el principio. Estas transacciones suelen corresponder a clústeres de 50 MW, 100 MW o incluso más grandes, lo que equivale aproximadamente a entre 24.000 y 48.000 unidades de GPU GB300 NVL72. En general, tales acuerdos de adquisición a largo plazo han capturado una parte significativa del mercado de arrendamiento de GPU de Neocloud.
Los laboratorios de IA favorecen estos contratos porque pueden asegurar recursos informáticos a gran escala de una sola vez para satisfacer una demanda de usuarios finales en rápido crecimiento. Al mismo tiempo, estas instituciones a menudo participan profundamente en el diseño de clústeres, incluidos aspectos clave como almacenamiento, redes, configuración de CPU y más. Estas transacciones a menudo se entregan en forma de **metal desnudo**, ya que los laboratorios de IA tienen suficientes capacidades de ingeniería para personalizar la pila tecnológica a un nivel más bajo, logrando así el costo total de propiedad (TCO) y el rendimiento óptimos.
Para los proveedores de servicios Neocloud, estas transacciones también son atractivas. Por un lado, pueden concentrar los recursos de ventas en unos pocos pedidos grandes sin tratar con numerosos clientes a pequeña escala, pero aún así generan los mismos ingresos. Por otro lado, los contratos a largo plazo también facilitan mejores condiciones de financiamiento de la deuda: al alinear el plazo de financiamiento con la duración del contrato, pueden reducir efectivamente el desajuste de la tenencia y los riesgos de fluctuación de precios, y en la mayoría de los casos bloquear la Tasa Interna de Retorno (TIR) del proyecto en puntos porcentuales de dos dígitos.
Además, los hiperescaladores a menudo actúan como un "respaldo" en este proceso: al servir como compradores directos, adquieren poder de cálculo de Neocloud y lo revenden a los laboratorios de IA. Esta estructura es beneficiosa para todas las partes: Neocloud puede obtener mejores condiciones de financiamiento basadas en compradores calificados por AAA, mientras que los hiperescalares pueden participar en los retornos de proyectos al proporcionar endosos de crédito sin expandir sus balances.
En el cuadro que figura a continuación se describen algunos de los grandes acuerdos de participación que estamos siguiendo. Realizaremos análisis en profundidad de estas transacciones para deducir su precio horario implícito de GPU ($/hr/GPU), así como métricas de rentabilidad clave como la TIR del proyecto y el margen de EBIT.

En el entorno actual del mercado, la gran mayoría de las agrupaciones de IA grandes en expansión son en realidad "consumidas internamente" por los laboratorios de IA. Sin embargo, estas instituciones siguen entrando en el mercado de contratos subcuatrienales para complementar la potencia de cálculo, al tiempo que impiden indirectamente que la oferta vuelva a entrar en el mercado mediante la renovación de los grupos de H100 y H200 existentes. A medida que se lancen gradualmente los clústeres supergrandes GB200 y GB300, la evolución de la relación oferta-demanda en el mercado contractual de 1 a 3 años será una variable clave a observar en el futuro cercano.
「Hacia dónde va el disco」
El acontecimiento más interesante actualmente es la aparente desconexión entre la realidad subyacente y el sentimiento de mercado. A pesar de las claras señales de restricciones de la oferta, los aumentos de precios (todos positivos para Neocloud – expansión del margen y extensión de la vida útil de los activos), los mercados públicos se han vuelto cada vez más pesimistas con empresas como CoreWeave, Nebius, Iris Energy, con sus precios de las acciones todavía languideciendo cerca de los mínimos de los últimos 6-12 meses.
El mercado sigue dominado por una narrativa de "sobreoferta definitiva, mercantilización de la fuerza de hash", con los cambios mencionados que no alivian las preocupaciones de los inversores sobre el valor a largo plazo de las GPU. Sin embargo, sobre el terreno, la restricción sostenida de la oferta y el aumento del poder de fijación de precios significan que casi toda la fuerza del hachís está en un estado de absorción de la demanda, incluso con discrepancias de rendimiento, todavía hay un caso claro de demanda superior a la oferta en el entorno de escasez extrema actual.
Tres observaciones clave para el futuro
Para evaluar si los precios de arrendamiento de la GPU seguirán siendo elevados, concéntrese en tres variables clave:
1. Ritmo de expansión del clúster GB300 (2026)
El aspecto crucial es la velocidad relativa entre el nuevo hashpower y la demanda de fichas, ya sea que la oferta alivie la escasez o que la demanda continúe superando a la oferta. Esto afectará directamente si los laboratorios de IA continúan participando en el mercado de menos de 4 años y la trayectoria de precios dentro de este rango.
2. Mayor deterioro de la escasez de chips
Esto incluye la capacidad de proceso TSMC N3, HBM, DRAM, NAND y otros enlaces críticos donde cualquier fluctuación en el nivel de ejecución de la fabricación podría restringir aún más el suministro.
3. Ingresos periódicos anuales (ARR) y tasa de crecimiento del consumo de tokens de AI Lab
La comercialización de la IA y la escala de uso determinarán la intensidad de la demanda final, que es una variable fundamental que impulsa la demanda de hashpower.
Movimiento unidireccional con rendimientos mejorados
En general, una conclusión relativamente clara es que la probabilidad de que los precios de arrendamiento de la GPU continúen aumentando es mayor que la probabilidad de un retroceso.
Este proceso presenta una clara característica de autorefuerzo: a medida que Neocloud observa la restricción de la oferta y el aumento de los precios, bloquea más hardware por adelantado, comprimiendo aún más la oferta del mercado e impulsando los precios más altos. Esto es similar al ciclo de escasez de GPU de 2023–2024, donde las restricciones de oferta impulsaron una expansión significativa del margen para los OEM y aumentos sustanciales en los precios de los servidores (aunque en este ciclo, con una mayor madurez del mercado, este proceso puede no repetirse por completo).
Al mismo tiempo, el nuevo aumento de los precios de alquiler de la GPU también está mejorando el retorno del capital invertido (ROIC) de Neocloud:
Por un lado, ha aumentado el margen de beneficio de los activos desplegados
Por otro lado, ha extendido la vida económica de las GPU, permitiendo que el capital genere flujo de caja por un período más largo
¿Quién es el mayor beneficiario actual?
Los beneficiarios más directos actualmente son los proveedores de energía hash con las siguientes características:
· Centrado principalmente en contratos a corto plazo (permitiendo un rápido cambio de precios)
· Poseer una gran cantidad de inventario H100
· Tener una nueva capacidad en línea a corto plazo
La estructura de arrendamiento corto de Neocloud permite la liberación rápida de contratos antiguos y su renegociación a precios más altos, lo que conduce a una rápida expansión de los beneficios. Al mismo tiempo, los proveedores de nube a gran escala que han bloqueado la energía hash de próxima generación (contratos multianuales) también se beneficiarán en el ciclo futuro.
Así que la pregunta es: esta vez, ¿será realmente "diferente"?
[Enlace del artículo original]
Te puede gustar

¿Cómo dominar Claude Cowork por completo?

Una carta confidencial de 70 páginas alega la primera acusación de "mentiras", y Altman le dice a la junta: "No puedo cambiar mi personalidad".

¿Comienza la temporada de altcoins en 2026? Qué deben observar ahora los operadores
Las señales que indican la temporada de altcoins se están volviendo más claras en 2026 a medida que se acelera la rotación de capital en los mercados de criptomonedas. Esto es lo que los operadores deben tener en cuenta y cómo está evolucionando la participación basada en estrategias en el ciclo de mercado actual.

Flujos de ETF de Bitcoin en 2026: Impacto en el precio de BTC y tendencias del mercado cripto
Los flujos de ETF de Bitcoin están remodelando las tendencias de precios de BTC y la liquidez del mercado cripto en 2026. Observa cómo el capital institucional está influyendo en la volatilidad, el comportamiento de trading y las estrategias de asignación de cartera en los mercados cripto.

La estrategia de Visa con las stablecoins: Cartas, acuerdos y el futuro

División del mercado de valores

¿Cómo aprovechar la próxima oportunidad clave en el contexto de los mercados predictivos?

¿Esquema Ponzi "legal"? Desvelando el préstamo circular de Gemini Exchange y su fundador.

Circle, la primera empresa de monedas estables, ha lanzado oficialmente el nuevo sistema de puntos de la cadena pública ARC; aquí tienes la guía interactiva

Los precios del petróleo se acercan a un punto crítico. ¿Qué ocurrirá a mediados de abril?

El precio del petróleo se acerca a un punto crítico, ¿qué sucederá a mediados de abril?

El mecanismo impulsa el valor, la deflación marca el rumbo del futuro: MIAU se lanzará oficialmente en PancakeSwap el 13 de abril

Zhou Hang, fundador de Yidao Yongche: Finalmente, ha llegado el momento de brillar para las criptomonedas.

¿Quién más no puede ser reducido a una habilidad?

¿Quién más no puede ser destilado en habilidad?

El enorme impacto en el mercado de criptomonedas de Corea del Sur: ¿Cómo deberían los traders verlo?

Del «Kimchi Premium» a la rectificación de Bithumb: Una interpretación de la situación actual del mercado de las criptomonedas en Corea del Sur

Cómo automatizar tu flujo de trabajo con IA (sin necesidad de código)
¿Cómo dominar Claude Cowork por completo?
Una carta confidencial de 70 páginas alega la primera acusación de "mentiras", y Altman le dice a la junta: "No puedo cambiar mi personalidad".
¿Comienza la temporada de altcoins en 2026? Qué deben observar ahora los operadores
Las señales que indican la temporada de altcoins se están volviendo más claras en 2026 a medida que se acelera la rotación de capital en los mercados de criptomonedas. Esto es lo que los operadores deben tener en cuenta y cómo está evolucionando la participación basada en estrategias en el ciclo de mercado actual.
Flujos de ETF de Bitcoin en 2026: Impacto en el precio de BTC y tendencias del mercado cripto
Los flujos de ETF de Bitcoin están remodelando las tendencias de precios de BTC y la liquidez del mercado cripto en 2026. Observa cómo el capital institucional está influyendo en la volatilidad, el comportamiento de trading y las estrategias de asignación de cartera en los mercados cripto.
