LLM
Vergleich
Vergleiche die besten aktuellen LLMs anhand ihrer technischen Daten, Kosten und Benschmark-Scores.
LLM Vergleichstabelle
Es sind keine Modelle zum Vergleich verfügbar. Bitte passe die Filter an oder versuche es später erneut.
Benchmark Chart
Wähle einen Benchmark über das Auswahlmenü, um die Ergebnisse der verschiedenen LLMs zu vergleichen.
ARC-AGI-2 Scores nach Veröffentlichungsdatum
| Modell | Veröffentlichungsdata | Score |
|---|---|---|
| Claude Opus 4.6 | Feb. 2026 | 14 % |
| Claude Sonnet 4.6 | Feb. 2026 | 12 % |
| Gemini 3.1 Pro | Feb. 2026 | 33 % |
| GLM-5 | Feb. 2026 | -1 % |
| GPT-5.3-Codex | Feb. 2026 | 10 % |
| GPT-5.4 | März 2026 | 6 % |
| Kimi K2.5 (Thinking) | Jan. 2026 | -8 % |
| MiniMax M2.5 | Feb. 2026 | -40 % |
| MiniMax M2.7 | März 2026 | 1 % |
| Qwen3.5-397B-A17B | Feb. 2026 | -36 % |
| Modell | Veröffentlichungsdata | Score |
|---|---|---|
| Claude Sonnet 4.5 | Sept. 2025 | 78,8 % |
| DeepSeek-R1-0528 | Mai 2025 | 71,6 % |
| Gemini 2.5 Flash | Juni 2025 | 56,7 % |
| Gemini 2.5 Flash-Lite | Juli 2025 | 27,1 % |
| Gemini 2.5 Pro | Juni 2025 | 82,2 % |
| GPT-5 | Aug. 2025 | 88 % |
| GPT-5 mini | Aug. 2025 | 71,6 % |
| GPT-5 nano | Aug. 2025 | 48,4 % |
| GPT-5 Pro | Aug. 2025 | 88 % |
| OpenAI o3 | Apr. 2025 | 79,6 % |
| OpenAI o3-mini | Jan. 2025 | 60,4 % |
| OpenAI o4-mini | Apr. 2025 | 58,2 % |
| Qwen3 30B A3B Instruct 2507 | Juli 2025 | 35,6 % |
| Modell | Veröffentlichungsdata | Score |
|---|---|---|
| Claude 3.7 Sonnet | Feb. 2025 | 54,8 % |
| Claude Haiku 4.5 | Okt. 2025 | 80,7 % |
| Claude Opus 4 | Mai 2025 | 75,5 % |
| Claude Opus 4.1 | Aug. 2025 | 78 % |
| Claude Sonnet 4 | Mai 2025 | 70,5 % |
| Claude Sonnet 4.5 | Sept. 2025 | 87 % |
| DeepSeek-R1-0528 | Mai 2025 | 87,5 % |
| DeepSeek-v3.2 Speciale | Dez. 2025 | 96 % |
| DeepSeek-v3.2 Thinking | Dez. 2025 | 93,1 % |
| Gemini 2.5 Flash | Juni 2025 | 72 % |
| Gemini 2.5 Flash-Lite | Juli 2025 | 63,1 % |
| Gemini 2.5 Pro | Juni 2025 | 88 % |
| Gemini 3 Pro | Nov. 2025 | 95 % |
| Gemini Diffusion | Mai 2025 | 23,3 % |
| GLM-4.6 | Sept. 2025 | 93,9 % |
| GLM-4.7 | Dez. 2025 | 95,7 % |
| GPT-4o (2024-11-20) | Nov. 2024 | 5,8 % |
| GPT-5 | Aug. 2025 | 99,6 % |
| GPT-5 mini | Aug. 2025 | 91,1 % |
| GPT-5 nano | Aug. 2025 | 85,2 % |
| GPT-5 Pro | Aug. 2025 | 96,7 % |
| GPT-5.1 | Nov. 2025 | 94 % |
| GPT-5.2 | Dez. 2025 | 100 % |
| GPT-5.2 Pro | Dez. 2025 | 100 % |
| GPT-5.4 mini | März 2026 | 90,83 % |
| GPT-5.4 nano | März 2026 | 98,33 % |
| Grok-4 | Juli 2025 | 98,8 % |
| Grok-4 Heavy | Juli 2025 | 100 % |
| Kimi K2 (0905) | Sept. 2025 | 49,5 % |
| Kimi K2 Thinking | Nov. 2025 | 94,5 % |
| Kimi K2.5 (Thinking) | Jan. 2026 | 96,1 % |
| MiniMax M2.1 | Dez. 2025 | 83 % |
| MiniMax M2.5 | Feb. 2026 | 86,3 % |
| MiniMax-M2 | Okt. 2025 | 78 % |
| Nemotron 3 Super | März 2026 | 90,21 % |
| OpenAI o3 | Apr. 2025 | 88,9 % |
| OpenAI o3-mini | Jan. 2025 | 86,5 % |
| OpenAI o4-mini | Apr. 2025 | 92,7 % |
| Qwen3 235B A22B Thinking 2507 | Juli 2025 | 92,3 % |
| Qwen3 30B A3B Instruct 2507 | Juli 2025 | 61,3 % |
| Modell | Veröffentlichungsdata | Score |
|---|---|---|
| Claude Opus 4.5 | Nov. 2025 | 37,6 % |
| Claude Opus 4.6 | Feb. 2026 | 68,8 % |
| Claude Sonnet 4.6 | Feb. 2026 | 58,3 % |
| Gemini 3 Deep Think | Nov. 2025 | 45,1 % |
| Gemini 3 Pro | Nov. 2025 | 31,1 % |
| Gemini 3.1 Pro | Feb. 2026 | 77,1 % |
| GPT-5.2 | Dez. 2025 | 52,9 % |
| GPT-5.2 Pro | Dez. 2025 | 54,2 % |
| Grok-4 | Juli 2025 | 15,9 % |
| Modell | Veröffentlichungsdata | Score |
|---|---|---|
| Claude Opus 4.1 | Aug. 2025 | 4,17 % |
| Claude Opus 4.5 | Nov. 2025 | 4,17 % |
| Claude Opus 4.6 | Feb. 2026 | 22,9 % |
| Claude Sonnet 4.6 | Feb. 2026 | 8,3 % |
| DeepSeek-v3.2 Thinking | Dez. 2025 | 2,1 % |
| Gemini 3 Pro | Nov. 2025 | 18,75 % |
| Gemini 3.1 Pro | Feb. 2026 | 16,7 % |
| GLM-5 | Feb. 2026 | 2,1 % |
| GPT-5 | Aug. 2025 | 12,5 % |
| GPT-5 Pro | Aug. 2025 | 14,6 % |
| GPT-5.1 | Nov. 2025 | 12,5 % |
| GPT-5.2 | Dez. 2025 | 18,8 % |
| GPT-5.2 Pro | Dez. 2025 | 31,3 % |
| GPT-5.4 | März 2026 | 27,1 % |
| Grok-4 Heavy | Juli 2025 | 2,08 % |
| Kimi K2.5 (Thinking) | Jan. 2026 | 4,2 % |
| OpenAI o3 | Apr. 2025 | 2,08 % |
| OpenAI o4-mini | Apr. 2025 | 6,25 % |
| Modell | Veröffentlichungsdata | Score |
|---|---|---|
| MiniMax-M2 | Okt. 2025 | 75,7 % |
| Modell | Veröffentlichungsdata | Score |
|---|---|---|
| Claude 3.7 Sonnet | Feb. 2025 | 78,2 % |
| Claude Haiku 4.5 | Okt. 2025 | 73 % |
| Claude Opus 4 | Mai 2025 | 79,6 % |
| Claude Opus 4.1 | Aug. 2025 | 80,9 % |
| Claude Opus 4.5 | Nov. 2025 | 87 % |
| Claude Opus 4.6 | Feb. 2026 | 91,3 % |
| Claude Sonnet 4 | Mai 2025 | 79,6 % |
| Claude Sonnet 4.5 | Sept. 2025 | 83,4 % |
| Claude Sonnet 4.6 | Feb. 2026 | 89,9 % |
| DeepSeek-R1-0120 | Jan. 2025 | 71,5 % |
| DeepSeek-R1-0528 | Mai 2025 | 81 % |
| DeepSeek-v3.2 Speciale | Dez. 2025 | 85,7 % |
| DeepSeek-v3.2 Thinking | Dez. 2025 | 82,4 % |
| Gemini 2.5 Flash-Lite | Juli 2025 | 82,8 % |
| Gemini 2.5 Pro | Juni 2025 | 86,4 % |
| Gemini 3 Deep Think | Nov. 2025 | 93,8 % |
| Gemini 3 Pro | Nov. 2025 | 91,9 % |
| Gemini 3.1 Flash-Lite | März 2026 | 86,9 % |
| Gemini 3.1 Pro | Feb. 2026 | 94,3 % |
| Gemini Diffusion | Mai 2025 | 40,4 % |
| GLM-4.7 | Dez. 2025 | 85,7 % |
| GLM-5 | Feb. 2026 | 86 % |
| GPT-5 | Aug. 2025 | 87,3 % |
| GPT-5 mini | Aug. 2025 | 82,3 % |
| GPT-5 nano | Aug. 2025 | 71,2 % |
| GPT-5 Pro | Aug. 2025 | 88,4 % |
| GPT-5.1 | Nov. 2025 | 88,1 % |
| GPT-5.2 | Dez. 2025 | 92,4 % |
| GPT-5.2 Pro | Dez. 2025 | 93,2 % |
| GPT-5.4 | März 2026 | 92,8 % |
| GPT-5.4 mini | März 2026 | 81,57 % |
| GPT-5.4 nano | März 2026 | 82,83 % |
| Kimi K2 (0905) | Sept. 2025 | 75,1 % |
| Kimi K2.5 (Thinking) | Jan. 2026 | 87,6 % |
| MiniMax M2.1 | Dez. 2025 | 83 % |
| MiniMax M2.5 | Feb. 2026 | 85,2 % |
| MiniMax-M2 | Okt. 2025 | 78 % |
| OpenAI o3 | Apr. 2025 | 83,3 % |
| OpenAI o3-mini | Jan. 2025 | 77 % |
| OpenAI o3-pro | Juni 2025 | 84 % |
| OpenAI o4-mini | Apr. 2025 | 81,4 % |
| Modell | Veröffentlichungsdata | Score |
|---|---|---|
| Claude Opus 4.6 | Feb. 2026 | 40 % |
| Claude Sonnet 4.6 | Feb. 2026 | 33,2 % |
| DeepSeek-R1-0528 | Mai 2025 | 17,7 % |
| DeepSeek-v3.2 Speciale | Dez. 2025 | 30,6 % |
| DeepSeek-v3.2 Thinking | Dez. 2025 | 25,1 % |
| Gemini 2.5 Flash | Juni 2025 | 11 % |
| Gemini 2.5 Pro | Juni 2025 | 21,6 % |
| Gemini 3 Deep Think | Nov. 2025 | 41 % |
| Gemini 3 Pro | Nov. 2025 | 37,5 % |
| Gemini 3.1 Flash-Lite | März 2026 | 16 % |
| Gemini 3.1 Pro | Feb. 2026 | 44,4 % |
| GLM-4.5 | Juli 2025 | 14,4 % |
| GLM-4.5 Air | Aug. 2025 | 10,6 % |
| GLM-4.6 | Sept. 2025 | 17,2 % |
| GLM-4.7 | Dez. 2025 | 24,8 % |
| GLM-5 | Feb. 2026 | 30,5 % |
| GPT-5 | Aug. 2025 | 35,2 % |
| GPT-5 mini | Aug. 2025 | 16,7 % |
| GPT-5 nano | Aug. 2025 | 8,7 % |
| GPT-5 Pro | Aug. 2025 | 30,7 % |
| GPT-5.2 | Dez. 2025 | 45,5 % |
| GPT-5.2 Pro | Dez. 2025 | 50 % |
| GPT-5.4 mini | März 2026 | 18,32 % |
| GPT-5.4 nano | März 2026 | 24,26 % |
| Grok-4 | Juli 2025 | 38,6 % |
| Grok-4 Heavy | Juli 2025 | 44,4 % |
| Kimi K2 Thinking | Nov. 2025 | 23,9 % |
| Kimi K2.5 (Thinking) | Jan. 2026 | 30,1 % |
| MiniMax M2.1 | Dez. 2025 | 22,2 % |
| MiniMax M2.5 | Feb. 2026 | 19,4 % |
| MiniMax-M2 | Okt. 2025 | 12,5 % |
| Nemotron 3 Super | März 2026 | 18,26 % |
| OpenAI o3 | Apr. 2025 | 24,9 % |
| OpenAI o3-mini | Jan. 2025 | 13,4 % |
| OpenAI o4-mini | Apr. 2025 | 17,7 % |
| Qwen3 235B A22B Thinking 2507 | Juli 2025 | 18,2 % |
| Qwen3.5-397B-A17B | Feb. 2026 | 28,7 % |
| Modell | Veröffentlichungsdata | Score |
|---|---|---|
| Qwen3.5-397B-A17B | Feb. 2026 | 92,6 % |
| Modell | Veröffentlichungsdata | Score |
|---|---|---|
| Claude Sonnet 4 | Mai 2025 | 55,9 % |
| DeepSeek-R1-0528 | Mai 2025 | 73,3 % |
| DeepSeek-v3.2 Speciale | Dez. 2025 | 88,7 % |
| DeepSeek-v3.2 Thinking | Dez. 2025 | 83,3 % |
| Gemini 2.5 Flash | Juni 2025 | 59,3 % |
| Gemini 2.5 Flash-Lite | Juli 2025 | 34,3 % |
| Gemini 2.5 Pro | Juni 2025 | 74,2 % |
| Gemini 3.1 Flash-Lite | März 2026 | 72 % |
| Gemini 3.1 Pro | Feb. 2026 | 2.887 % |
| Gemini Diffusion | Mai 2025 | 30,9 % |
| Gemma 3 | März 2025 | 29,7 % |
| GLM-4.5 | Juli 2025 | 72,9 % |
| GLM-4.5 Air | Aug. 2025 | 70,7 % |
| GLM-4.6 | Sept. 2025 | 82,8 % |
| GLM-4.7 | Dez. 2025 | 84,9 % |
| GPT-4o (2024-11-20) | Nov. 2024 | 29,5 % |
| Grok-4 | Juli 2025 | 79,3 % |
| Grok-4 Heavy | Juli 2025 | 79,4 % |
| Kimi K2 (0905) | Sept. 2025 | 53,7 % |
| Kimi K2 Thinking | Nov. 2025 | 83,1 % |
| Kimi K2.5 (Thinking) | Jan. 2026 | 85 % |
| MiniMax M2.1 | Dez. 2025 | 81 % |
| MiniMax-M2 | Okt. 2025 | 83 % |
| Nemotron 3 Super | März 2026 | 81,19 % |
| Qwen3 235B A22B Thinking 2507 | Juli 2025 | 74,1 % |
| Qwen3 30B A3B Instruct 2507 | Juli 2025 | 43,2 % |
| Qwen3.5-397B-A17B | Feb. 2026 | 83,6 % |
| Modell | Veröffentlichungsdata | Score |
|---|---|---|
| Kimi K2.5 (Thinking) | Jan. 2026 | 90,1 % |
| Modell | Veröffentlichungsdata | Score |
|---|---|---|
| DeepSeek-R1-0528 | Mai 2025 | 85 % |
| Gemma 3 | März 2025 | 67,5 % |
| GLM-4.5 | Juli 2025 | 84,6 % |
| GLM-4.5 Air | Aug. 2025 | 81,4 % |
| GLM-4.7 | Dez. 2025 | 84,3 % |
| Grok-4 | Juli 2025 | 86,6 % |
| Kimi K2 Thinking | Nov. 2025 | 84,6 % |
| Kimi K2.5 (Thinking) | Jan. 2026 | 87,1 % |
| MiniMax M2.1 | Dez. 2025 | 88 % |
| MiniMax-M2 | Okt. 2025 | 82 % |
| Nemotron 3 Super | März 2026 | 83,73 % |
| Qwen3 235B A22B Thinking 2507 | Juli 2025 | 84,4 % |
| Qwen3 30B A3B Instruct 2507 | Juli 2025 | 78,4 % |
| Qwen3.5-397B-A17B | Feb. 2026 | 87,8 % |
| Modell | Veröffentlichungsdata | Score |
|---|---|---|
| Claude Haiku 4.5 | Okt. 2025 | 73,2 % |
| Claude Opus 4.5 | Nov. 2025 | 80,7 % |
| GPT-5 Pro | Aug. 2025 | 84,2 % |
| GPT-5.1 | Nov. 2025 | 85,4 % |
| Modell | Veröffentlichungsdata | Score |
|---|---|---|
| Claude Haiku 4.5 | Okt. 2025 | 50,7 % |
| Claude Opus 4.5 | Nov. 2025 | 66,3 % |
| Claude Opus 4.6 | Feb. 2026 | 72,7 % |
| Claude Sonnet 4.6 | Feb. 2026 | 72,5 % |
| GPT-5.3-Codex | Feb. 2026 | 64,7 % |
| GPT-5.4 | März 2026 | 75 % |
| GPT-5.4 mini | März 2026 | 42 % |
| Modell | Veröffentlichungsdata | Score |
|---|---|---|
| Claude 3.7 Sonnet | Feb. 2025 | 62,3 % |
| Claude Haiku 4.5 | Okt. 2025 | 73,3 % |
| Claude Opus 4 | Mai 2025 | 72,5 % |
| Claude Opus 4.1 | Aug. 2025 | 74,5 % |
| Claude Opus 4.5 | Nov. 2025 | 80,9 % |
| Claude Opus 4.6 | Feb. 2026 | 80,8 % |
| Claude Sonnet 4 | Mai 2025 | 64,93 % |
| Claude Sonnet 4.5 | Sept. 2025 | 77,2 % |
| Claude Sonnet 4.6 | Feb. 2026 | 79,6 % |
| DeepSeek-R1-0120 | Jan. 2025 | 49,2 % |
| Gemini 2.5 Flash | Juni 2025 | 48,9 % |
| Gemini 2.5 Flash-Lite | Juli 2025 | 27,6 % |
| Gemini 2.5 Pro | Juni 2025 | 59,6 % |
| Gemini 3 Pro | Nov. 2025 | 76,2 % |
| Gemini 3.1 Pro | Feb. 2026 | 80,6 % |
| Gemini Diffusion | Mai 2025 | 22,9 % |
| GLM-4.5 | Juli 2025 | 64,2 % |
| GLM-4.5 Air | Aug. 2025 | 57,6 % |
| GLM-4.6 | Sept. 2025 | 68 % |
| GLM-4.7 | Dez. 2025 | 73,8 % |
| GLM-5 | Feb. 2026 | 77,8 % |
| GPT-4o (2024-11-20) | Nov. 2024 | 21,62 % |
| GPT-5 | Aug. 2025 | 74,9 % |
| GPT-5 mini | Aug. 2025 | 71 % |
| GPT-5 nano | Aug. 2025 | 54,7 % |
| GPT-5 Pro | Aug. 2025 | 74,9 % |
| GPT-5.1 | Nov. 2025 | 76,3 % |
| GPT-5.2 | Dez. 2025 | 80 % |
| Kimi K2 | Juli 2025 | 65,8 % |
| Kimi K2 (0905) | Sept. 2025 | 69,2 % |
| Kimi K2 Thinking | Nov. 2025 | 71,3 % |
| Kimi K2.5 (Thinking) | Jan. 2026 | 76,8 % |
| MiniMax M2.1 | Dez. 2025 | 74 % |
| MiniMax M2.5 | Feb. 2026 | 80,2 % |
| MiniMax-M2 | Okt. 2025 | 69,4 % |
| OpenAI o3 | Apr. 2025 | 69,1 % |
| OpenAI o3-mini | Jan. 2025 | 49,3 % |
| OpenAI o4-mini | Apr. 2025 | 68,1 % |
| Qwen3.5-397B-A17B | Feb. 2026 | 76,4 % |
| Modell | Veröffentlichungsdata | Score |
|---|---|---|
| Claude Opus 4.5 | Nov. 2025 | 59,3 % |
| Claude Opus 4.6 | Feb. 2026 | 65,4 % |
| Claude Sonnet 4.6 | Feb. 2026 | 59,1 % |
| DeepSeek-v3.2 Thinking | Dez. 2025 | 46,4 % |
| Gemini 3.1 Pro | Feb. 2026 | 68,5 % |
| GLM-4.7 | Dez. 2025 | 41 % |
| GLM-5 | Feb. 2026 | 56,2 % |
| GPT-5.3-Codex | Feb. 2026 | 77,3 % |
| GPT-5.4 | März 2026 | 75,1 % |
| GPT-5.4 mini | März 2026 | 38,2 % |
| GPT-5.4 nano | März 2026 | 46,3 % |
| Kimi K2 Thinking | Nov. 2025 | 47,1 % |
| Kimi K2.5 (Thinking) | Jan. 2026 | 50,8 % |
| MiniMax M2.1 | Dez. 2025 | 47,9 % |
| MiniMax M2.5 | Feb. 2026 | 51,7 % |
| MiniMax-M2 | Okt. 2025 | 46,3 % |
| Nemotron 3 Super | März 2026 | 31 % |
| Qwen3.5-397B-A17B | Feb. 2026 | 52,5 % |
| Modell | Veröffentlichungsdata | Score |
|---|---|---|
| Claude Haiku 4.5 | Okt. 2025 | 76,6 % |
| Claude Opus 4.5 | Nov. 2025 | 93,55 % |
| Claude Opus 4.6 | Feb. 2026 | 95,6 % |
| Claude Sonnet 4.5 | Sept. 2025 | 84,7 % |
| Claude Sonnet 4.6 | Feb. 2026 | 94,8 % |
| DeepSeek-v3.2 Thinking | Dez. 2025 | 80,3 % |
| Gemini 3 Pro | Nov. 2025 | 85,4 % |
| Gemini 3.1 Pro | Feb. 2026 | 95,1 % |
| GLM-4.6 | Sept. 2025 | 75,9 % |
| GLM-4.7 | Dez. 2025 | 87,4 % |
| GLM-5 | Feb. 2026 | 89,7 % |
| GPT-5 | Aug. 2025 | 80,1 % |
| GPT-5 mini | Aug. 2025 | 70,8 % |
| GPT-5 nano | Aug. 2025 | 46,3 % |
| GPT-5.1 | Nov. 2025 | 80,2 % |
| GPT-5.2 | Dez. 2025 | 90,35 % |
| GPT-5.4 mini | März 2026 | 74,1 % |
| GPT-5.4 nano | März 2026 | 88,38 % |
| Kimi K2 (0905) | Sept. 2025 | 66,1 % |
| MiniMax M2.1 | Dez. 2025 | 87 % |
| MiniMax-M2 | Okt. 2025 | 77,2 % |
| Nemotron 3 Super | März 2026 | 61,15 % |
| Qwen3.5-397B-A17B | Feb. 2026 | 86,7 % |
ARC-AGI-2 Übersicht
Gemini 3.1 Pro
77,1 %1 / 9
Claude Opus 4.6
68,8 %2 / 9
Claude Sonnet 4.6
58,3 %3 / 9
GPT-5.2 Pro
54,2 %4 / 9
GPT-5.2
52,9 %5 / 9
Gemini 3 Deep Think
45,1 %6 / 9
Claude Opus 4.5
37,6 %7 / 9
Gemini 3 Pro
31,1 %8 / 9
Grok-4
15,9 %9 / 9