Deepseeks überraschend kostengünstige KI -Modell stellt die Branchennormen heraus. Das Unternehmen behauptet, sein leistungsstarkes Neuralnetz aus Deepseek V3 für nur 6 Millionen US -Dollar mit 2048 GPUs ausgebildet zu haben und die Wettbewerber deutlich zu unterbinden. Diese Abbildung spiegelt jedoch nur die GPU-Kosten vor dem Training wider und lässt wesentliche Forschung, Verfeinerung, Datenverarbeitung und Infrastrukturaufwendungen weg.
Bild: Ensigame.com
Die innovative Architektur von Deepseek V3 ist der Schlüssel zu ihrer Effizienz. Es verwendet:
- Mehrfache Vorhersage (MTP): Mehrere Wörter gleichzeitig für eine verbesserte Genauigkeit und Geschwindigkeit vorhersagen.
- Mischung von Experten (MOE): Mit 256 neuronalen Netzwerken, aktiviert acht für jedes Token, beschleunigt das Training und die Verbesserung der Leistung. .
Bild: Ensigame.com
Trotz der günstigen Ausbildungskosten ergab die semianalyse die erhebliche Infrastruktur von Deepseek: ungefähr 50.000 NVIDIA Hopper -GPUs (einschließlich 10.000 H800, 10.000 H100 und zusätzliche H20 -GPUs), die über mehrere Rechenzentren verteilt sind. Dies entspricht einer gesamten Serverinvestition von rund 1,6 Milliarden US -Dollar, wobei die Betriebskosten auf 944 Mio. USD geschätzt werden. Dies steht im scharfen Kontrast zu den publizierten 6-Millionen-Dollar-Kosten vor dem Training.
Bild: Ensigame.com
Deepseek, eine Tochtergesellschaft von High-Flyer, einem chinesischen Hedgefonds, besitzt seine Rechenzentren und bietet Kontrolle und schnellere Innovationsimplementierung. Seine selbstfinanzierte Natur verbessert die Beweglichkeit. Das Unternehmen zieht erstklassiges chinesisches Talent an, wobei einige Forscher jährlich über 1,3 Millionen US -Dollar verdienen. Während Deepseeks Kosteneffizienz relativ ist, beruht der Erfolg auf erhebliche Investitionen, technologische Fortschritte und ein hochqualifiziertes Team.
Bild: Ensigame.com
Die Gesamtinvestition des Unternehmens in die KI -Entwicklung beträgt 500 Millionen US -Dollar. Die optimierte Struktur erleichtert effiziente Innovationen im Vergleich zu größeren, bürokratischeren Organisationen. Während die Erzählung "revolutionärer Budget" wohl aufgeblasen ist, untergraben Deepseeks Modellschulungskosten (5 Millionen US -Dollar für R1) Wettbewerber wie ChatGPT4O (100 Millionen US -Dollar) immer noch deutlich. Letztendlich demonstriert Deepseek das Potenzial eines gut finanzierten, unabhängigen KI-Unternehmens, effektiv mit etablierten Riesen zu konkurrieren.
