Gemini 2.5 FlashGoogle DeepMind

Neu • Proprietär

Zum Modell

Release Date

April 2025

Knowledge Cutoff

Januar 2025

Parameter

Unbekannt

Modellfamilie

Gemini 2.5

Übersicht

Gemini 2.5 Flash wurde im April von Google DeepMind als günstige Version zu Gemini 2.5 Pro vorgestellt. Mit Gemini 2.5 Flash bietet Google das günstige LLM an, das im GPQA Benchmark Ergebnisse im Bereich von menschlicher Intelligenz erzielt.

Playground

Blog

API Reference

Websuche

Kann das Modell auf relevante Informationen aus dem Web zugreifen?

Multimodalität

Kann das Modell verschiedene Medienarten verarbeiten?

Finetuning

Kann das Modell finetuned werden?

Max. Input

1M Token

Max. Output

65,5k Token

Trainingsdaten

Unbekannt

Parameter

Unbekannt

Input Preis

$0,15

Output Preis

$3,50

Vokabular

Unbekannt

Dateigröße

Unbekannt

Performance

Gemini 2.5 Flash Benchmark Übersicht

GPQA Benchmark

Daten werden geladen...

Provider

Du kannst Gemini 2.5 Flash über die API folgender Anbieter nutzen:

Google Vertex AI

Token (in)1M

Token (out)65,5k

USD/1M Input$0,15

USD/1M Output$3,50

Latency1,22ms

Throughput121,8t/s

Zu Google Vertex AI

Datenqualität

Fehler gefunden? Kontaktiere uns!

Wir legen großen Wert auf die Genauigkeit unserer Modelldaten. Falls dir Unstimmigkeiten oder veraltete Informationen auffallen, lass es uns bitte wissen. Dein Feedback hilft uns, die Qualität unserer Plattform stetig zu verbessern.

Feedback senden

Technische Details

Architektur

Architektur-Typ	Transformer
Input Kontextlänge	1M Token
Output Kontextlänge	65,5k Token
Inferenzoptimierung	Unbekannt
Trainingsmethode	Unsupervised Pretraining, Supervised Fine-Tuning, Reinforcement Learning

Tokenizer & Attention

Tokenizer Modell	Unbekannt
BOS Token
EOS Token
Padding Token
Attention Heads	N/A
KV Heads	N/A
Quantisierung	Keine

Vor- & Nachteile

Vorteile

Dynamisches "Thinking-Budget"
Für Gemini 2.5 Flash lässt sich ein dynamisches Budget für Reasoning-Tokens definieren. Das Limit gilt als Obergrenze und muss nicht bei jedem Prompt vollständig ausgenutzt werden.
Großes Token-Input Fenster
Gemini 2.5 Flash kann bis zu 1. Mio. Input-Tokens als Kontext verarbeiten.
Google Suche
Gemini 2.5 Flash kann auf Suchergebnisse aus der Google Suche zugreifen und hat damit bzgl. aktueller Daten einen Vorteil seinen Mitstreitern gegenüber.
Großer Funktionsumfang
Gemini 2.5 unterstützt viele Funktionen wie strukturierte Ausgaben, Function-Calling, Codeausführung und mehr.
(Kostenlos) Nutzbar
Wer sich bereit erklärt, seine Daten mit den Entwicklern zu teilen, kann Gemini 2.5 Flash kostenlos über die Website ai.dev verwenden.
Sehr günstiger API-Zugang
Gemini 2.5 Flash ist bei Veröffentlichung eines der günstigsten Modelle, das SOTA-Benchmark Scores erreicht. Deaktivieren des "Thinking" Modus reduziert die Preise erneut.

Nachteile

Kein Bild- oder Audio-Output
Gemini 2.5 Flash kann weder Bilder noch Audio-Ausgabe generieren.
Kein Caching
Aktuell gibt es keine Caching-Funktionalität für Gemini 2.5 Pro.

Loading model comparison data...

Gemini 2.5 FlashGoogle DeepMind

Übersicht

Websuche

Multimodalität

Finetuning

Performance

Gemini 2.5 Flash Benchmark Übersicht

GPQA Benchmark

Provider

Google Vertex AI

Fehler gefunden? Kontaktiere uns!

Technische Details

Architektur

Tokenizer & Attention

Vor- & Nachteile

Vorteile

Dynamisches "Thinking-Budget"

Großes Token-Input Fenster

Google Suche

Großer Funktionsumfang

(Kostenlos) Nutzbar

Sehr günstiger API-Zugang

Nachteile

Kein Bild- oder Audio-Output

Kein Caching