Deepseek-R1
Deepseek-R1 Modell-Übersicht
DeepSeek-R1 ist das erste Reasoning-Modell, das auf Basis von DeepSeek-V3 entwickelt wurde. Deepseek-R1 wurde mittels Reinforcement Learning (RL) auf Chain-of-Thought Output optimiert und liefert damit beeindruckende Benchmark Ergebnisse im Vergleich zu Non-Thinking-LLMs. Die Version R1-0528 ist ein Upgrade der ursprünglichen Version, das Halluzinationen reduziert, Funktion-Call Unterstützung mitbringt und viele Benchmark Scores deutlich verbesserte.
Features
Tools
Websuche, Bildgenerierung, Computer Use und MCP-Server.
Multimodalität
Das Modell kann Text, Bilder, Audio und PDFs als Input verarbeiten.
Finetuning
Finetuning des Modells ist aktuell nicht möglich.
Details zum Modell
Deepseek-R1 Benchmark Scores
Im KI-Kontext bezeichnet Performance die Leistungsfähigkeit eines Modells in Bereichen wie Sprachverständnis, Logik oder Programmierung – gemessen anhand standardisierter Benchmarks zur objektiven Vergleichbarkeit.
Technologie & Daten
Technische Spezifikationen
| Architektur | Decoder-only Transformer |
|---|---|
| Input Kontextlänge | 163,84k |
| Output Kontextlänge | 163,84k |
| Tokenizer | SentencePiece |
Besonderheiten
| Besonderheit 1 | Direkter Zugriff auf CoT-Output |
|---|---|
| Besonderheit 2 | JSON-Output |
| Besonderheit 3 | Distillierte Versionen und Quantisierungsgrade |
Vorteile & Nachteile
Vorteile
- Open-SourceDeepSeek-R1 wurde als Open-Source Modell mit MIT-Lizenz veröffentlicht.
- Lokal ausführbarDas Modell lässt sich herunterladen und über Programme wie LM Studio oder OpenLlama lokal ausführen.
- Viele Versionen verfügbarNeben dem Hauptmodell sind viele kleinere, distillierte Modelle verfügbar.
- Reasoning-KapazitätenDeepSeek-R1 ist ein Reasoning-LLM, das den vollständigen
<think> Prozess ausgibt.</think>
Nachteile
- Modell-BiasDas Modell wurde nicht mit neutralen Daten trainiert und verschleiert dunkle Episoden chinesischer Geschichte.
- Kein Datenschutz beim ChatbotWer DeepSeek-R1 über die offizielle Website oder App verwendet, gibt seine Daten preis.
- Fehlende MultimodalitätDas Modell kann nur mit Text- und nicht mit Bild- oder Audio-Daten umgehen.
Vergleiche Deepseek-R1 mit anderen LLMs
Vergleiche Deepseek-R1 mit anderen Sprachmodellen anhand wichtiger Metriken wie Kontextgröße, Parameteranzahl, Preisen und Benchmark-Leistung.
Provider & APIs
Du kannst DeepSeek AI Deepseek-R1 über die API folgender Anbieter nutzen.
Das Modell ist derzeit bei keinen Anbietern verfügbar.