Übersicht
Gemini 2.5 Flash wurde im April von Google DeepMind als günstige Version zu Gemini 2.5 Pro vorgestellt. Mit Gemini 2.5 Flash bietet Google das günstige LLM an, das im GPQA Benchmark Ergebnisse im Bereich von menschlicher Intelligenz erzielt.
Websuche
JaKann das Modell auf relevante Informationen aus dem Web zugreifen?
Multimodalität
JaKann das Modell verschiedene Medienarten verarbeiten?
Finetuning
JaKann das Modell finetuned werden?
Performance
Gemini 2.5 Flash Benchmark Übersicht
Provider
Du kannst Gemini 2.5 Flash über die API folgender Anbieter nutzen:
Google Vertex AI
Fehler gefunden? Kontaktiere uns!
Wir legen großen Wert auf die Genauigkeit unserer Modelldaten. Falls dir Unstimmigkeiten oder veraltete Informationen auffallen, lass es uns bitte wissen. Dein Feedback hilft uns, die Qualität unserer Plattform stetig zu verbessern.
Technische Details
Architektur
Architektur-Typ | Transformer |
Input Kontextlänge | 1M Token |
Output Kontextlänge | 65,5k Token |
Inferenzoptimierung | Unbekannt |
Trainingsmethode | Unsupervised Pretraining, Supervised Fine-Tuning, Reinforcement Learning |
Tokenizer & Attention
Tokenizer Modell | Unbekannt |
BOS Token | |
EOS Token | |
Padding Token | |
Attention Heads | N/A |
KV Heads | N/A |
Quantisierung | Keine |
Vor- & Nachteile
Vorteile
Dynamisches "Thinking-Budget"
Für Gemini 2.5 Flash lässt sich ein dynamisches Budget für Reasoning-Tokens definieren. Das Limit gilt als Obergrenze und muss nicht bei jedem Prompt vollständig ausgenutzt werden.
Großes Token-Input Fenster
Gemini 2.5 Flash kann bis zu 1. Mio. Input-Tokens als Kontext verarbeiten.
Google Suche
Gemini 2.5 Flash kann auf Suchergebnisse aus der Google Suche zugreifen und hat damit bzgl. aktueller Daten einen Vorteil seinen Mitstreitern gegenüber.
Großer Funktionsumfang
Gemini 2.5 unterstützt viele Funktionen wie strukturierte Ausgaben, Function-Calling, Codeausführung und mehr.
(Kostenlos) Nutzbar
Wer sich bereit erklärt, seine Daten mit den Entwicklern zu teilen, kann Gemini 2.5 Flash kostenlos über die Website ai.dev verwenden.
Sehr günstiger API-Zugang
Gemini 2.5 Flash ist bei Veröffentlichung eines der günstigsten Modelle, das SOTA-Benchmark Scores erreicht. Deaktivieren des "Thinking" Modus reduziert die Preise erneut.
Nachteile
Kein Bild- oder Audio-Output
Gemini 2.5 Flash kann weder Bilder noch Audio-Ausgabe generieren.
Kein Caching
Aktuell gibt es keine Caching-Funktionalität für Gemini 2.5 Pro.