- Volver al menú
- Volver al menúPrecios
- Volver al menúInvestigación
- Volver al menúConsenso
- Volver al menú
- Volver al menú
- Volver al menú
- Volver al menúWebinars y Eventos
Los proyectos de IA Cripto necesitarían comprar chips por valor de toda su capitalización de mercado para cumplir sus ambiciones
Apoyar la economía de los creadores con videos generados por IA requerirá más GPU que las que operan todas las grandes empresas tecnológicas.
- La posibilidad de generar texto a video entusiasma al mercado de Cripto , y los tokens de IA aumentaron cuando OpenAI presentó por primera vez una demostración de Sora.
- Pero para generalizar esto, la potencia de procesamiento será asombrosa. Se requerirán más GPU H100 de nivel de servidor que las que Nvidia produce en un año, o las que sus clientes más grandes utilizan en sus centros de datos en conjunto.
¿Cuántas unidades de procesamiento gráfico (GPU) se necesitarán para generalizar la generación de texto a vídeo? Cientos de miles, y más de las que utilizan actualmente Microsoft, Meta y Google juntos.
La primera demostración del generador de texto a video Sora de OpenAI sorprendió al mundo, y esto renovó el interés en los tokens de Inteligencia Artificial (IA), conmuchos surgiendodespués de la manifestación.
En las semanas siguientes, surgieron muchos proyectos de IA Cripto que también prometían generar texto a video y texto a imagen, y la categoría de tokens de IA ahora tiene una capitalización de mercado de $25 mil millones. según datos de CoinGecko.
Detrás de la promesa de vídeos generados por IA hay ejércitos de unidades de procesamiento gráfico (GPU), procesadores de empresas como Nvidia y AMD, que hacen posible la revolución de la IA gracias a su capacidad para calcular grandes volúmenes de datos.
Pero, ¿cuántas GPU se necesitarán para que el vídeo generado por IA se generalice? Más de las que tenían las grandes tecnológicas en su arsenal en 2023.
Un ejército de 720.000 GPU Nvidia H100
A informe de investigación recienteFactorial Funds estima que se necesitan 720.000 GPU Nvidia H100 de alta gama para respaldar a la comunidad de creadores de TikTok y YouTube.
Sora, escribe Factorial Funds, requiere hasta 10.500 GPU potentes durante un mes para entrenarse, y puede generar solo alrededor de 5 minutos de video por hora por GPU para inferencia.

Como demuestra el gráfico anterior, este entrenamiento requiere significativamente más potencia computacional que GPT4 o la generación de imágenes fijas.
Con una adopción generalizada, la inferencia superará al entrenamiento en el uso de recursos computacionales. Esto significa que, a medida que más personas y empresas comiencen a usar modelos de IA como Sora para generar videos, la potencia computacional necesaria para crear nuevos videos (inferencia) será mayor que la necesaria para entrenar el modelo de IA inicialmente.
Para poner las cosas en perspectiva,Nvidia enviado550.000 GPU H100 en 2023.
Los datos de Statista muestran que los doce clientes más grandes que utilizan las GPU H100 de Nvidia tienen en conjunto 650.000 de estas tarjetas, y los dos más grandes (Meta y Microsoft) tienen 300.000 entre ellos.

Suponiendo un costo de 30.000 dólares por tarjeta, se necesitarían 21.600 millones de dólares para que los sueños de Sora de texto a video generado por IA se generalicen, lo que es casicapitalización total del mercado de tokens de IA en este momento.
Eso si puedes adquirir físicamente todas las GPU para hacerlo.
Nvidia no es el único juego en la ciudad
Si bien Nvidia es sinónimo de la revolución de la IA, es importante recordar que no es la única empresa en la ciudad.
Su eterno rival en materia de chips, AMD, fabrica productos competitivos, y los inversores también han recompensado generosamente a la empresa, impulsando sus acciones desde el rango de los 2 dólares en el otoño de 2012 a más de 175 dólares en la actualidad.
También existen otras formas de externalizar la potencia de procesamiento a granjas de GPU. Render (RNDR) ofrece computación distribuida en GPU, al igual que Akash Network (AKT). Sin embargo, la mayoría de las GPU en estas redes son GPU para juegos de gama baja, considerablemente menos potentes que las H100 de Nvidia para servidores o las de la competencia de AMD.
En cualquier caso, la promesa de la conversión de texto a vídeo, que Sora y otros protocolos prometen, requerirá un enorme esfuerzo de hardware. Si bien es una premisa intrigante y podría revolucionar el flujo de trabajo creativo de Hollywood, no esperen que se generalice pronto.
Vamos a necesitar más patatas fritas.