Google DeepMind Logo

Gemini 2.5 FlashGoogle DeepMind

NeuProprietär

Release Date
April 2025
Knowledge Cutoff
Januar 2025
Parameter
Unbekannt
Modellfamilie
Gemini 2.5

Übersicht

Gemini 2.5 Flash wurde im April von Google DeepMind als günstige Version zu Gemini 2.5 Pro vorgestellt. Mit Gemini 2.5 Flash bietet Google das günstige LLM an, das im GPQA Benchmark Ergebnisse im Bereich von menschlicher Intelligenz erzielt.

Websuche

Ja

Kann das Modell auf relevante Informationen aus dem Web zugreifen?

Multimodalität

Ja

Kann das Modell verschiedene Medienarten verarbeiten?

Finetuning

Ja

Kann das Modell finetuned werden?

Max. Input
1M Token
Max. Output
65,5k Token
Trainingsdaten
Unbekannt
Parameter
Unbekannt
Input Preis
$0,15
Output Preis
$3,50
Vokabular
Unbekannt
Dateigröße
Unbekannt

Performance

Gemini 2.5 Flash Benchmark Übersicht

Wissen & SprachverständnisMathematikCoding

GPQA Benchmark

Daten werden geladen...

Provider

Du kannst Gemini 2.5 Flash über die API folgender Anbieter nutzen:

Google Vertex AI logo

Google Vertex AI

Token (in)1M
Token (out)65,5k
USD/1M Input$0,15
USD/1M Output$3,50
Latency1,22ms
Throughput121,8t/s
Datenqualität

Fehler gefunden? Kontaktiere uns!

Wir legen großen Wert auf die Genauigkeit unserer Modelldaten. Falls dir Unstimmigkeiten oder veraltete Informationen auffallen, lass es uns bitte wissen. Dein Feedback hilft uns, die Qualität unserer Plattform stetig zu verbessern.

Technische Details

Architektur

Architektur-Typ
Transformer
Input Kontextlänge
1M Token
Output Kontextlänge
65,5k Token
Inferenzoptimierung
Unbekannt
Trainingsmethode
Unsupervised Pretraining, Supervised Fine-Tuning, Reinforcement Learning

Tokenizer & Attention

Tokenizer Modell
Unbekannt
BOS Token
EOS Token
Padding Token
Attention Heads
N/A
KV Heads
N/A
Quantisierung
Keine

Vor- & Nachteile

Vorteile

  • Dynamisches "Thinking-Budget"

    Für Gemini 2.5 Flash lässt sich ein dynamisches Budget für Reasoning-Tokens definieren. Das Limit gilt als Obergrenze und muss nicht bei jedem Prompt vollständig ausgenutzt werden.

  • Großes Token-Input Fenster

    Gemini 2.5 Flash kann bis zu 1. Mio. Input-Tokens als Kontext verarbeiten.

  • Google Suche

    Gemini 2.5 Flash kann auf Suchergebnisse aus der Google Suche zugreifen und hat damit bzgl. aktueller Daten einen Vorteil seinen Mitstreitern gegenüber.

  • Großer Funktionsumfang

    Gemini 2.5 unterstützt viele Funktionen wie strukturierte Ausgaben, Function-Calling, Codeausführung und mehr.

  • (Kostenlos) Nutzbar

    Wer sich bereit erklärt, seine Daten mit den Entwicklern zu teilen, kann Gemini 2.5 Flash kostenlos über die Website ai.dev verwenden.

  • Sehr günstiger API-Zugang

    Gemini 2.5 Flash ist bei Veröffentlichung eines der günstigsten Modelle, das SOTA-Benchmark Scores erreicht. Deaktivieren des "Thinking" Modus reduziert die Preise erneut.

Nachteile

  • Kein Bild- oder Audio-Output

    Gemini 2.5 Flash kann weder Bilder noch Audio-Ausgabe generieren.

  • Kein Caching

    Aktuell gibt es keine Caching-Funktionalität für Gemini 2.5 Pro.

Loading model comparison data...