DeepSeek

Modelle

DeepSeek ist ein chinesisches KI-Labor, dessen Open-Source-Modelle durch Effizienz und starke Benchmark-Ergebnisse international aufhorchen ließen.

Zuletzt aktualisiert: Juni 2026 · Quelle: HostSpezial GmbH – ki·spezial

Was ist DeepSeek?

DeepSeek ist ein 2023 gegründetes chinesisches KI-Forschungsunternehmen mit Sitz in Hangzhou, das zur Hedgefond-Gruppe High-Flyer gehört. Mit der Veröffentlichung von DeepSeek-R1 Anfang 2025 erlangte das Unternehmen internationale Aufmerksamkeit: Das Modell erreichte bei mathematischen und Reasoning-Benchmarks vergleichbare Ergebnisse wie GPT-4o und Claude 3.5 – bei deutlich niedrigerem Trainingsaufwand.

DeepSeek veröffentlicht Modellgewichte unter Open-Source-Lizenzen (MIT-Lizenz für R1), was den weltweiten Einsatz und das Fine-Tuning ermöglicht. Die Modellreihe umfasst verschiedene Größen von 1,5 Mrd. bis 671 Mrd. Parametern (MoE-Architektur).

Besonderheiten und Stärken

DeepSeek-Modelle zeichnen sich durch mehrere technische Eigenschaften aus:

  • Mixture-of-Experts (MoE): Nur ein Bruchteil der Parameter wird pro Token aktiviert – effizient in Inferenz und Training
  • Chain-of-Thought-Reasoning: DeepSeek-R1 zeigt Rechenschritte explizit, was Nachvollziehbarkeit verbessert
  • Open Weights: freie Verfügbarkeit auf Hugging Face ermöglicht On-Premise-Betrieb
  • Kosteneffizienz: Trainingskosten deutlich unter vergleichbaren US-Modellen
  • Mehrsprachigkeit: gute Leistung in Chinesisch und Englisch, ausbaufähig in anderen Sprachen

Sicherheitshinweis

DeepSeek-Cloud-Dienste unterliegen chinesischem Datenschutzrecht. Für datenschutzsensible Anwendungen empfiehlt sich der Betrieb der Open-Source-Modelle auf eigener Infrastruktur.

Relevanz für den Mittelstand

Für KMU bieten die Open-Source-Varianten von DeepSeek eine attraktive Option: Leistungsstarke Reasoning-Fähigkeiten on-premise, ohne Nutzungsentgelt und ohne Datenweitergabe. Besonders für Aufgaben wie Code-Generierung, mathematische Berechnungen und strukturierte Analyse eignen sich die R1-Modelle. IT-seitig sind GPU-Ressourcen (mind. 24 GB VRAM für kleinere Varianten) oder Managed Hosting über europäische Anbieter erforderlich.

← Zurück zum Glossar