Deepseek'in şaşırtıcı derecede ucuz AI modeli endüstri normlarına meydan okuyor. Şirket, güçlü Deepseek V3 sinir ağını 2048 GPU kullanarak sadece 6 milyon dolar için eğittiğini ve rakipleri önemli ölçüde azalttığını iddia ediyor. Bununla birlikte, bu rakam yalnızca GPU öncesi maliyetleri, önemli araştırmaları, arıtma, veri işleme ve altyapı giderlerini yansıtır.
%İmgp%resim: ensigame.com
Deepseek V3'ün yenilikçi mimarisi verimliliğinin anahtarıdır. Kullanır:
- Çoklu atak tahmini (MTP): Geliştirilmiş doğruluk ve hız için aynı anda birden fazla kelimeyi tahmin etmek.
- Uzmanların Karışımı (MOE): 256 sinir ağı istihdam etmek, her jeton için sekiz etkinleştirme, eğitimi hızlandırma ve performansı artırma.
- Çok Başlı Gizli Dikkat (MLA): Bilgi kaybını en aza indirmek ve önemli nüansları yakalamak için tekrar tekrar temel ayrıntıları çıkarma.
%İmgp%resim: ensigame.com
Düşük eğitim maliyet iddiasına rağmen, Semanaliz Deepseek'in önemli altyapısını ortaya çıkardı: yaklaşık 50.000 NVIDIA Hopper GPU'ları (10.000 H800, 10.000 H100 ve ek H20 GPU'lar dahil) birden fazla veri merkezine yayıldı. Bu, yaklaşık 1,6 milyar dolarlık toplam sunucu yatırımını temsil eder ve operasyonel maliyetlerin 944 milyon dolar olduğu tahmin edilmektedir. Bu, genel olarak 6 milyon dolarlık eğitim öncesi maliyetiyle keskin bir tezat oluşturuyor.
%İmgp%resim: ensigame.com
Bir Çin Hedge Fonu olan High-Flyer'in bir yan kuruluşu olan Deepseek, veri merkezlerinin sahibi, kontrol ve daha hızlı inovasyon uygulaması sağlıyor. Kendini finanse eden doğası çevikliği artırır. Şirket, en iyi Çin yeteneklerini çekiyor ve bazı araştırmacılar yıllık 1,3 milyon doların üzerinde. Deepseek'in maliyet etkinliği göreceli olsa da, başarısı önemli yatırım, teknolojik gelişmeler ve yüksek vasıflı bir ekipten kaynaklanmaktadır.
%İmgp%resim: ensigame.com
Şirketin AI gelişimine genel yatırımı 500 milyon doları aşıyor. Aracı yapısı, daha büyük, daha bürokratik organizasyonlara kıyasla verimli yeniliği kolaylaştırır. "Devrimci bütçe" anlatısı tartışmalı olarak şişirilirken, Deepseek'in model eğitim maliyetleri (R1 için 5 milyon dolar) hala ChatGPT4O (100 milyon dolar) gibi rakipleri önemli ölçüde azaltıyor. Nihayetinde, Deepseek, iyi finanse edilmiş, bağımsız bir AI şirketinin yerleşik devlerle etkili bir şekilde rekabet etme potansiyelini gösterir.