Denkmodus vs. Instruct: Wann KI logisch vorgehen soll

Das ist eine der am wenigsten offensichtlichen, aber kostentreibendsten Erkenntnisse bei der Arbeit mit modernen Modellen. „Denkend“ klingt besser als „Instruct“ — aber falsch eingesetzt kann es langsamer, teurer und… leerer sein.

Was ist „Denken“ bei einem Modell#

Ein denkendes Modell (Reasoning) generiert vor der Antwort einen internen Gedankengang — es zerlegt das Problem, prüft Varianten. Dieser Prozess ist verborgen (wird dem Nutzer nie angezeigt) und kostet Token sowie Zeit. Dafür erhältst du eine präzisere Antwort auf schwierige Fragen.

Ein Instruct-Modell antwortet direkt: ohne verborgene Logik, schneller und günstiger. Für Gespräche, Übersetzungen, Code und Zusammenfassungen ist das die richtige Wahl.

Fallstrick: Leere Antwort#

Die wichtigste Warnung aus unseren Messungen: Ein denkendes Modell, das „erzwungen“ in einem normalen Chat eingesetzt wird, kann das gesamte Token-Budget für Logik verbrauchen und leeren Inhalt zurückgeben. Deshalb aktivieren wir den Denkmodus (Parameter think) nur für Aufgaben, die ihn wirklich benötigen — für den Rest bleibt er deaktiviert.

Wann welches Modell#

Kriterium	Denkend (Reasoning)	Instruct (nicht-denkend)
Antwortgeschwindigkeit	langsam	schnell
Kosten	hoch	niedrig
Treffsicherheit bei schwierigen Entscheidungen	hoch	mittel
Risiko leerer Antwort im Chat	hoch	nicht vorhanden
Am besten geeignet für	Analyse, Planung, Agenten	Gespräche, Code, Übersetzungen, Zusammenfassungen
Wann aktivieren	nur wenn die Aufgabe Logik erfordert	standardmäßig

Die Größenordnung des Unterschieds ist nur orientierend, aber gut zu kennen. Der Denkmodus kann pro schwieriger Frage von einigen Hundert bis zu einigen Tausend verborgenen Token hinzufügen — das schlägt sich in höheren Kosten und einer längeren Zeit bis zum ersten Token (TTFT) nieder. Die genauen Werte hängen vom Modell und von der Aufgabe ab, behandle diese Zahlen also als Größenordnung und nicht als Benchmark: Jede Implementierung erfordert eigene Messungen. Umso weniger lohnt es sich, das Reasoning für Gespräche, Code oder Zusammenfassungen standardmäßig aktiviert zu lassen.

In der Praxis stellst du das nicht manuell ein. Der Router OpenClaw aktiviert das Denken automatisch ausschließlich für Aufgaben vom Typ „Reasoning“ (z. B. schwierige Analyse, Schrittplanung eines Agenten), während er es für Gespräche, Code und Zusammenfassungen deaktiviert — schneller, günstiger und mit garantiertem Inhalt.

Welches Modell fürs Denken#

Unser Standard-Reasoning-Modell ist DeepSeek-V4 — zuverlässig und mit einem Kontextfenster von bis zu 1M Token. Für normale Gespräche wählen wir Mistral Large 3 (Instruct), für Zusammenfassungen Gemma 3. Die vollständige Logik, wie wir ein Modell der jeweiligen Aufgabe zuordnen, beschreiben wir im Artikel zur Wahl des passenden LLM für die Aufgabe.

Live ausprobieren#

Starte das Modell im Denkmodus über unseren sicheren Sandbox (Playground: PII maskiert, keine Speicherung) — stelle eine Frage, die Analyse erfordert.

▶Stelle eine Frage, die logisches Vorgehen erfordertsandbox · reasoning

FAQ#

Ist ein denkendes Modell besser als Instruct?#

Nicht „grundsätzlich besser“ — besser für unterschiedliche Aufgaben. Denkende Modelle sind überlegen bei schwierigen Entscheidungen und Analysen. Instruct ist besser für Gespräche, Code und Zusammenfassungen: schneller, günstiger und ohne Risiko leerer Antworten. Man wählt sie je nach Aufgabe, nicht „für immer“.

Warum gibt das Modell manchmal eine leere Antwort zurück?#

Weil es ein denkendes Modell ist, das im Reasoning-Modus für eine Aufgabe läuft, die das nicht erfordert — das gesamte Token-Budget wurde für die verborgene Logik verbraucht, für den eigentlichen Inhalt blieb nichts übrig. Lösung: Den Reasoning-Modus für normale Aufgaben deaktivieren (das übernimmt der Router für dich).

Woher weiß der Router, wann er Reasoning aktivieren soll?#

An der Art der Aufgabe. Für Aufgaben, die als „Reasoning“ markiert sind (schwierige Analyse, Planung), aktiviert er den Denkmodus; für Gespräche, Übersetzungen, Code und Zusammenfassungen bleibt er deaktiviert. Diese Entscheidung kann auch manuell überschrieben werden.

Was ist „Denken“ bei einem Modell#

Ein Instruct-Modell antwortet direkt: ohne verborgene Logik, schneller und günstiger. Für Gespräche, Übersetzungen, Code und Zusammenfassungen ist das die richtige Wahl.

Fallstrick: Leere Antwort#

Wann welches Modell#

Kriterium	Denkend (Reasoning)	Instruct (nicht-denkend)
Antwortgeschwindigkeit	langsam	schnell
Kosten	hoch	niedrig
Treffsicherheit bei schwierigen Entscheidungen	hoch	mittel
Risiko leerer Antwort im Chat	hoch	nicht vorhanden
Am besten geeignet für	Analyse, Planung, Agenten	Gespräche, Code, Übersetzungen, Zusammenfassungen
Wann aktivieren	nur wenn die Aufgabe Logik erfordert	standardmäßig

Welches Modell fürs Denken#

Live ausprobieren#

Starte das Modell im Denkmodus über unseren sicheren Sandbox (Playground: PII maskiert, keine Speicherung) — stelle eine Frage, die Analyse erfordert.