Hogar Noticias La asequibilidad de Deepseek es un mito: la IA revolucionaria en realidad costó $ 1.6 mil millones para desarrollarse

La asequibilidad de Deepseek es un mito: la IA revolucionaria en realidad costó $ 1.6 mil millones para desarrollarse

Autor : Harper Feb 21,2025

El modelo de IA sorprendentemente económico de Deepseek desafía las normas de la industria. La compañía afirma haber capacitado a su poderosa red neuronal Deepseek V3 por solo $ 6 millones utilizando 2048 GPU, competidores significativamente socavadores. Sin embargo, esta cifra solo refleja los costos de GPU previos al entrenamiento, omitiendo la investigación sustancial, el refinamiento, el procesamiento de datos y los gastos de infraestructura.

DeepSeek TestImagen: Ensigame.com

La arquitectura innovadora de Deepseek V3 es clave para su eficiencia. Utiliza:

  • Predicción de múltiples token (MTP): Predecir múltiples palabras simultáneamente para mejorar la precisión y la velocidad.
  • Mezcla de expertos (MOE): Empleando 256 redes neuronales, activando ocho para cada token, acelerando la capacitación y mejorando el rendimiento.
  • Atención latente de múltiples cabezas (MLA): Extraiga repetidamente detalles clave para minimizar la pérdida de información y capturar matices cruciales.

DeepSeek V3Imagen: Ensigame.com

A pesar del bajo reclamo de costos de capacitación, el semianálisis reveló la infraestructura sustancial de Deepseek: aproximadamente 50,000 GPU de la tolva NVIDIA (incluidas 10,000 H800, 10,000 H100 y GPU H20 adicionales) se extienden en múltiples centros de datos. Esto representa una inversión de servidor total de aproximadamente $ 1.6 mil millones, con costos operativos estimados en $ 944 millones. Esto contrasta fuertemente con el costo de pre-entrenamiento publicitado de $ 6 millones.

DeepSeekImagen: Ensigame.com

Deepseek, una subsidiaria de High-Flyer, un fondo de cobertura chino, posee sus centros de datos, proporcionando control e implementación de innovación más rápida. Su naturaleza autofinanciada mejora la agilidad. La compañía atrae a los mejores talentos chinos, y algunos investigadores ganan más de $ 1.3 millones anuales. Si bien la rentabilidad de Deepseek es relativa, su éxito proviene de una inversión sustancial, avances tecnológicos y un equipo altamente calificado.

DeepSeekImagen: Ensigame.com

La inversión general de la compañía en desarrollo de IA supera los $ 500 millones. Su estructura simplificada facilita la innovación eficiente en comparación con las organizaciones más grandes y burocráticas. Si bien la narrativa del "presupuesto revolucionario" está posiblemente inflada, los costos de capacitación modelo de Deepseek ($ 5 millones para R1) todavía socavan significativamente a los competidores como ChatGPT4O ($ 100 millones). En última instancia, Deepseek demuestra el potencial de una compañía de IA independiente bien financiada para competir de manera efectiva con los gigantes establecidos.

Últimos artículos
Últimos juegos
Crucigrama en español

Palabra  /  1.7.1  /  19.2 MB

Descargar
Kelime Şöleni

Palabra  /  1.6.0  /  65.3 MB

Descargar
Blue Monster Playground

Simulación  /  1.8.1.0  /  113.0 MB

Descargar