Das ist eine der am wenigsten offensichtlichen, aber kostentreibendsten Erkenntnisse bei der Arbeit mit modernen Modellen. „Denkend“ klingt besser als „Instruct“ — aber falsch eingesetzt kann es langsamer, teurer und… leerer sein.
Was ist „Denken“ bei einem Modell
#Ein denkendes Modell (Reasoning) generiert vor der Antwort einen internen Gedankengang — es zerlegt das Problem, prüft Varianten. Dieser Prozess ist verborgen (wird dem Nutzer nie angezeigt) und kostet Token sowie Zeit. Dafür erhältst du eine präzisere Antwort auf schwierige Fragen.
Ein Instruct-Modell antwortet direkt: ohne verborgene Logik, schneller und günstiger. Für Gespräche, Übersetzungen, Code und Zusammenfassungen ist das die richtige Wahl.
Fallstrick: Leere Antwort
#Die wichtigste Warnung aus unseren Messungen: Ein denkendes Modell, das „erzwungen“ in einem normalen Chat eingesetzt wird, kann das gesamte Token-Budget für Logik verbrauchen und leeren Inhalt zurückgeben. Deshalb aktivieren wir den Denkmodus (Parameter think) nur für Aufgaben, die ihn wirklich benötigen — für den Rest bleibt er deaktiviert.
Wann welches Modell
#| Kriterium | Denkend (Reasoning) | Instruct (nicht-denkend) |
|---|---|---|
| Antwortgeschwindigkeit | langsam | schnell |
| Kosten | hoch | niedrig |
| Treffsicherheit bei schwierigen Entscheidungen | hoch | mittel |
| Risiko leerer Antwort im Chat | hoch | nicht vorhanden |
| Am besten geeignet für | Analyse, Planung, Agenten | Gespräche, Code, Übersetzungen, Zusammenfassungen |
| Wann aktivieren | nur wenn die Aufgabe Logik erfordert | standardmäßig |
In der Praxis stellst du das nicht manuell ein. Der Router OpenClaw aktiviert das Denken automatisch ausschließlich für Aufgaben vom Typ „Reasoning“ (z. B. schwierige Analyse, Schrittplanung eines Agenten), während er es für Gespräche, Code und Zusammenfassungen deaktiviert — schneller, günstiger und mit garantiertem Inhalt.
Welches Modell fürs Denken
#Unser Standard-Reasoning-Modell ist DeepSeek-V4 — zuverlässig und mit einem Kontextfenster von bis zu 1M Token. Für normale Gespräche wählen wir Mistral Large 3 (Instruct), für Zusammenfassungen Gemma 3.
Live ausprobieren
#Starte das Modell im Denkmodus über unseren sicheren Sandbox (Playground: PII maskiert, keine Speicherung) — stelle eine Frage, die Analyse erfordert.
FAQ
#Ist ein denkendes Modell besser als Instruct?
#Nicht „grundsätzlich besser“ — besser für unterschiedliche Aufgaben. Denkende Modelle sind überlegen bei schwierigen Entscheidungen und Analysen. Instruct ist besser für Gespräche, Code und Zusammenfassungen: schneller, günstiger und ohne Risiko leerer Antworten. Man wählt sie je nach Aufgabe, nicht „für immer“.
Warum gibt das Modell manchmal eine leere Antwort zurück?
#Weil es ein denkendes Modell ist, das im Reasoning-Modus für eine Aufgabe läuft, die das nicht erfordert — das gesamte Token-Budget wurde für die verborgene Logik verbraucht, für den eigentlichen Inhalt blieb nichts übrig. Lösung: Den Reasoning-Modus für normale Aufgaben deaktivieren (das übernimmt der Router für dich).
Woher weiß der Router, wann er Reasoning aktivieren soll?
#An der Art der Aufgabe. Für Aufgaben, die als „Reasoning“ markiert sind (schwierige Analyse, Planung), aktiviert er den Denkmodus; für Gespräche, Übersetzungen, Code und Zusammenfassungen bleibt er deaktiviert. Diese Entscheidung kann auch manuell überschrieben werden.