// 00Technologie-Arsenal

Die schwersten Engines. Ausgewählt für das Projekt.

Kein einzelnes Framework — ein Arsenal. 145+ Technologien in 12 Schichten: vom LLM-Serving und Agentengraphen über Vektordatenbanken und Datenströme bis hin zu Rust, Kubernetes und CUDA. Wir wählen sie nach dem Problem aus, nicht nach dem Hype.

Wir beherrschen die gesamte Schicht: von Inference-Engines (vLLM, TensorRT-LLM) und Agenten-Graphen (LangGraph, MCP) über Vektordatenbanken (Qdrant, BGE-M3) und Datenströme (ClickHouse, Kafka) bis hin zu Systemsprachen (Rust, Go), Orchestrierung (Kubernetes, Terraform) und GPU (NVIDIA CUDA, H100).

Flagship-Engines sind die, die wir am häufigsten produktiv einsetzen — den Rest wählen wir nach der konkreten Aufgabe aus, nicht nach Trends. Diese Breite ermöglicht es, Lösungen für das Problem des Kunden zu entwerfen, statt das Problem an ein einziges, bevorzugtes Tool anzupassen.

Modelle wählen wir per Messung, nicht per Datenblatt. Der OpenClaw-Router betreibt heute Dutzende Modelle — DeepSeek-V4, Mistral Large 3, Qwen3.5/Coder, GLM-5, Gemma 3/4, Devstral-2 und mehr — jedes mit gemessenem TTFT, Durchsatz und Kontextfenster. Frontier-Modelle (Claude Opus 4, GPT-5, Gemini 3) integrieren wir, wenn ein Projekt es erfordert. PII maskieren wir, bevor etwas die Cloud erreicht, und BGE-M3-Embeddings berechnen wir lokal — sensible Daten verlassen Ihre Infrastruktur nie.

vLLM · TensorRT-LLMLLM-Serving mit maximalem Durchsatz und niedriger Latenz

LangGraph · MCPAgentengraphen mit Zustandskontrolle und Werkzeugen

Qdrant · BGE-M3semantische Suche in Produktionsqualität

ClickHouse · KafkaEchtzeit-Analytik und Streaming

Rust · Godort, wo Leistung und Zuverlässigkeit zählen

Kubernetes · TerraformInfrastruktur als Code, skalierbar gebaut

NVIDIA CUDA · B200/H200Training und Inferenz auf eigener Hardware

Three.js · WebGPUVisualisierungen und Präsentation im Browser

// //Fleet · was wir gerade betreiben

…

// //Benchmark · Modellstufen

OpenClaw-Routing-Stufen — GPU-Kostenproxy und Aufgabenabdeckung (Quelle: Routing-Matrix)
Modellstufe
Flaggschiff	3	9 (bester)	Cloud	maskiert
Mittel	1.5	6	Cloud	maskiert
Klein	1	3	Cloud	maskiert
BGE-M3 (local)	0.15 (bester)	1	lokal	bleibt lokal

// //Story · warum dieses Routing

Warum dieses Modell-Routing

Kosten steigen mit der Modellstufe

Der OpenClaw-GPU-Kostenproxy je Routing-Stufe. Lokale BGE-M3-Embeddings sind ~20× günstiger als Flaggschiff-Modelle.

Flaggschiff3.00 proxy
Mittel1.50 proxy
Klein1.00 proxy
BGE-M30.15 proxy

Aufgabentyp-Abdeckung

Wie viele Aufgabentypen jede Stufe bedient. Der Router wählt die günstigste tragfähige Stufe.

Flaggschiff9 Typen
Mittel6 Typen
Klein3 Typen
BGE-M31 Typen

Flaggschiff-Engines (▣) sind diejenigen, die wir am häufigsten in der Produktion einsetzen. Die vollständige Auswahl hängt vom Problem ab — Leistungen ansehen →

OpenClaw-Routing-Stufen — GPU-Kostenproxy und Aufgabenabdeckung (Quelle: Routing-Matrix)

Modellstufe

Flaggschiff

9 (bester)

Cloud

maskiert

Mittel

1.5

Cloud

maskiert

Klein

Cloud

maskiert

BGE-M3 (local)

0.15 (bester)

lokal

bleibt lokal