// 00Arsenał technologiczny

Najcięższe silniki. Dobierane do projektu.

Nie jeden framework — arsenał. 145+ technologii w 12 warstwach: od serwowania LLM i grafów agentów, przez bazy wektorowe i strumienie danych, po Rust, Kubernetes i CUDA. Dobieramy je pod problem, nie pod modę.

Władamy całą warstwą: od inference engine (vLLM, TensorRT-LLM) i grafów agentów (LangGraph, MCP), przez bazy wektorowe (Qdrant, BGE-M3) i strumienie danych (ClickHouse, Kafka), po języki systemowe (Rust, Go), orkiestrację (Kubernetes, Terraform) i GPU (NVIDIA CUDA, H100).

Flagowe silniki to te, których używamy produkcyjnie najczęściej — resztę dobieramy do konkretnego zadania, nie do mody. Taka szerokość pozwala projektować rozwiązanie pod problem klienta, zamiast naginać problem do jednego, ulubionego narzędzia.

Modele dobieramy pomiarem, nie deklaracją. Router OpenClaw serwuje dziś dziesiątki modeli — DeepSeek-V4, Mistral Large 3, Qwen3.5/Coder, GLM-5, Gemma 3/4, Devstral-2 i inne — każdy ze zmierzonym TTFT, przepustowością i oknem kontekstu. Modele frontier (Claude Opus 4, GPT-5, Gemini 3) integrujemy, gdy projekt tego wymaga. PII maskujemy przed wysłaniem do chmury, a embeddingi BGE-M3 liczymy lokalnie — dane wrażliwe nie wychodzą poza Twoją infrastrukturę.

vLLM · TensorRT-LLMserwowanie LLM z maks. przepustowością i niską latencją

LangGraph · MCPgrafy agentów z kontrolą stanu i narzędziami

Qdrant · BGE-M3wyszukiwanie semantyczne klasy produkcyjnej

ClickHouse · Kafkaanalityka i strumienie w czasie rzeczywistym

Rust · Gotam, gdzie liczy się wydajność i niezawodność

Kubernetes · Terraforminfrastruktura jako kod, skalowalna

NVIDIA CUDA · B200/H200trening i inference na własnym żelazie

Three.js · WebGPUwizualizacje i prezentacja w przeglądarce

// //fleet · co serwujemy teraz

…

// //benchmark · poziomy modeli

Poziomy routingu OpenClaw — proxy kosztu GPU i pokrycie zadań (źródło: macierz routingu)
Poziom modelu
Flagowe	3	9 (najlepszy)	chmura	maskowane
Średnie	1.5	6	chmura	maskowane
Małe	1	3	chmura	maskowane
BGE-M3 (local)	0.15 (najlepszy)	1	lokalnie	zostaje lokalnie

// //narracja · dlaczego ten routing

Dlaczego taki routing modeli

Koszt rośnie z poziomem modelu

Proxy kosztu GPU per poziom routingu OpenClaw. Lokalne embeddingi BGE-M3 są ~20× tańsze od modeli flagowych — dlatego trzymamy retrieval lokalnie, a chmurę odpalamy tylko gdy zadanie tego wymaga.

Flagowe3.00 proxy
Średnie1.50 proxy
Małe1.00 proxy
BGE-M30.15 proxy

Pokrycie typów zadań

Ile typów zadań (chat, rozumowanie, kod, tłumaczenie, streszczanie…) obsługuje każdy poziom. Router wybiera najtańszy poziom, który udźwignie dane zadanie.

Flagowe9 typów
Średnie6 typów
Małe3 typów
BGE-M31 typów

Flagowe (▣) to silniki, których używamy produkcyjnie najczęściej. Pełny dobór zależy od problemu — zobacz usługi →

Poziomy routingu OpenClaw — proxy kosztu GPU i pokrycie zadań (źródło: macierz routingu)

Poziom modelu

Flagowe

9 (najlepszy)

chmura

maskowane

Średnie

1.5

chmura

maskowane

Małe

chmura

maskowane

BGE-M3 (local)

0.15 (najlepszy)

lokalnie

zostaje lokalnie