cashcrown // wiedza
KI-Begriffe ohne Jargon: RAG, Embeddings, Agenten, DSGVO und Infrastruktur — mit Definitionen, Verknüpfungen und Suche.
46 Begriffe
Ein Modell, das die nächsten Text-Tokens vorhersagt — die Basis moderner KI.
LLM uczy się statystyki języka z ogromnych korpusów i generuje tekst token po tokenie. Sam w sobie nie zna Twoich danych — wiedzę dziedzinową dokłada się przez RAG lub fine-tuning.
Verwandt:TokenInferenzRAG (retrieval-augmented generation)Fine-Tuning
Die kleinste Texteinheit, die ein Modell verarbeitet.
Modele liczą koszt i limity w tokenach, nie znakach. ~1 token to średnio 4 znaki tekstu; rozliczenia i okno kontekstu mierzy się właśnie w tokenach.
Die maximale Anzahl von Tokens, die ein Modell auf einmal sieht.
Gdy rozmowa lub dokumenty przekraczają okno, trzeba je skracać lub wyszukiwać najtrafniejsze fragmenty — to jeden z powodów, dla których stosuje się RAG zamiast wrzucania całej bazy do promptu.
Die Anweisung und der Kontext, die ein Modell steuern.
Dobry prompt to rola, zasady, kontekst (np. źródła z RAG) i format wyjścia. Wstrzyknięcie złośliwej instrukcji do promptu to prompt injection — bronią przed nim guardraile.
Ausführen eines trainierten Modells zur Antwortgenerierung.
Inferencja to koszt operacyjny systemu AI — mierzony latencją i przepustowością. Można ją uruchamiać w chmurze lub lokalnie (self-hosting), co decyduje o rezydencji danych.
Weitertraining eines Modells mit eigenen Beispielen.
Fine-tuning zmienia wagi modelu i jest kosztowny; do wnoszenia świeżej wiedzy faktograficznej zwykle lepszy jest RAG (tańszy, aktualizowalny bez retreningu). Oba podejścia bywają łączone.
Verwandt:Großes Sprachmodell (LLM)RAG (retrieval-augmented generation)Inferenz
Erst Fakten abrufen, dann das Modell darauf gestützt antworten lassen.
RAG ogranicza halucynacje: model dostaje konkretne źródła i cytuje je. To fundament rzetelnej obsługi klienta — odpowiedź jest ugruntowana, a przy słabym dopasowaniu system eskaluje do człowieka zamiast zmyślać.
Verwandt:Embedding (Vektor)VektordatenbankHybride SucheHalluzinationLLM-Router
Text als Zahlenliste, wobei Nähe = ähnliche Bedeutung.
Embeddingi pozwalają wyszukiwać po znaczeniu, nie po słowach kluczowych. Cashcrown liczy je lokalnie modelem BGE-M3 (1024 wymiary), więc treść do osadzenia nie opuszcza infrastruktury.
Ein Speicher für Embeddings, der nächste Vektoren in Millisekunden findet.
Serce wyszukiwania semantycznego w RAG. Cashcrown używa Qdranta uruchomionego lokalnie jako natywna usługa — wektory i metadane zostają na własnym serwerze.
Suche nach Bedeutung statt wörtlicher Übereinstimmung.
Pytanie i dokumenty zamieniane są na embeddingi i porównywane wektorowo, więc „jak chronić dane” znajdzie tekst o RODO nawet bez wspólnych słów.
Verwandt:Embedding (Vektor)VektordatenbankHybride SucheFAQ-Explorer
Kombination aus semantischer und klassischer Stichwortsuche.
Semantyka łapie sens, a wyszukiwanie pełnotekstowe — dokładne nazwy i kody. Łączenie obu (np. wektory + FTS Postgresa) daje trafniejsze wyniki niż każde z osobna.
Ein zweiter Durchlauf, der Treffer nach Relevanz neu ordnet.
Po szybkim wyszukaniu kandydatów dokładniejszy model ocenia każdy względem pytania i podnosi najlepsze na górę — poprawia jakość kontekstu trafiającego do LLM.
Ein einziger Zugang zu Modellen: wählt Modell, maskiert PII, erzwingt Limits.
Cały ruch AI w Cashcrown idzie przez router OpenClaw — żaden kod nie woła dostawcy bezpośrednio. Dzięki temu maskowanie PII, fallback modeli i telemetria są egzekwowane w jednym miejscu.
Verwandt:Großes Sprachmodell (LLM)PII (personenbezogene Daten)Strukturierte AusgabeObservabilityModellauswahl (Routing)Thinking-Modus (Reasoning)
Mehr:Modell-Atlas →
Ein KI-System, das Schritte plant und Werkzeuge nutzt.
Agent nie tylko odpowiada — działa: wyszukuje, woła API, rezerwuje termin. Bezpieczeństwo wymaga barierek i potwierdzeń przy akcjach nieodwracalnych, by działanie nie wymknęło się spod kontroli.
Die Fähigkeit eines Modells, Funktionen/APIs aufzurufen.
Model dostaje katalog narzędzi z opisem argumentów i decyduje, które wywołać. Akcje nieodwracalne (np. rezerwacja) wymagają serwerowego tokenu potwierdzenia, nie samej deklaracji modelu.
Regeln, die Modell-Ein- und -Ausgaben einschränken.
Na wejściu odrzucają prompt injection, na wyjściu kwalifikują obietnice (np. ceny widełkami, terminy z zastrzeżeniem). Barierki sprawiają, że asystent nie obieca rzeczy, których nie powinien.
Eine selbstbewusst klingende, aber erfundene Antwort.
Modele uzupełniają luki prawdopodobnym tekstem, nawet gdy nie znają faktu. RAG z cytowaniem i progiem pewności (eskalacja do człowieka przy słabym dopasowaniu) to główna obrona.
Verwandt:RAG (retrieval-augmented generation)GuardrailsGroßes Sprachmodell (LLM)
Erzwingen von schema-konformem JSON aus dem Modell.
Bez tego odpowiedź modelu trudno bezpiecznie sparsować. Cashcrown używa promptu opartego o JSON z walidacją schematu i jedną naprawą — to stabilniejsze niż wolne tryby „json_schema” u części dostawców.
Verwandt:PromptTool-NutzungLLM-Router
Informationen, die eine Person identifizieren.
Przed wysłaniem czegokolwiek do chmury router maskuje PII tokenami, a po odpowiedzi je przywraca — model w chmurze nigdy nie widzi prawdziwych danych osobowych.
Verwandt:DSGVOLLM-RouterDatenresidenz
EU-Datenschutzrecht: Einwilligung, Minimierung, Löschrecht.
W praktyce: zgoda przed śledzeniem, przechowywanie tylko niezbędnego, oraz realne usunięcie danych na żądanie. W Cashcrown te zasady są wbudowane w pipeline, nie doklejone później.
Verwandt:PII (personenbezogene Daten)DatenresidenzSelf-Hosting
Wo Daten physisch liegen und verarbeitet werden.
Lokalne embeddingi (BGE-M3) i lokalny Qdrant oznaczają, że wrażliwe treści nie wychodzą poza serwer. Do chmury trafia tylko zamaskowany prompt — to świadomy wybór rezydencji.
Modelle und Dienste auf eigener Infrastruktur betreiben.
Daje kontrolę nad danymi i kosztami oraz niezależność od jednego dostawcy. Cashcrown hostuje lokalnie embeddingi, wektorową bazę i wyszukiwanie, a do chmury sięga tylko po generację — z maskowaniem.
Verwandt:DatenresidenzInferenzVektordatenbank
Ein mehrsprachiges Embedding-Modell, lokal betrieben (1024 Dim.).
Zamienia tekst w wielu językach na wektory bez wysyłania go do chmury — fundament prywatnego RAG w Cashcrown.
Verwandt:Embedding (Vektor)VektordatenbankSelf-HostingModellauswahl (Routing)
Metriken, Logs und Traces, die zeigen, was ein KI-System tut.
Bez pomiaru nie da się rządzić kosztem ani jakością. Cashcrown wystawia metryki (Prometheus), korelowane logi i ślady, więc każde wywołanie modelu jest policzalne i diagnozowalne.
Verwandt:LatenzLLM-RouterInferenz
Zeit von Frage bis Antwort; niedrige Latenz = flüssige Interaktion.
Streaming odpowiedzi po tokenie skraca odczuwaną latencję — użytkownik widzi tekst, zanim model skończy. To dlatego asystent „pisze na żywo”.
Verwandt:InferenzDurchsatzObservability
Wie viele Anfragen/Tokens pro Zeiteinheit verarbeitet werden.
Razem z latencją opisuje wydajność serwowania modeli. Limity współbieżności i backpressure chronią przepustowość przed przeciążeniem.
Verwandt:LatenzInferenzObservability
Ein RAG-Assistent, der mit Quellen antwortet und eskaliert.
Concierge Cashcrown łączy RAG, guardraile, wielojęzyczność i strumieniowanie — odpowiada na żywo z przypisami, a gdy nie wie, łączy z człowiekiem zamiast zmyślać.
Verwandt:RAG (retrieval-augmented generation)KI-AgentGuardrailsLatenz
FAQ-Suche nach Bedeutung statt nur Stichwörtern.
Semantyczne FAQ podpowiada najtrafniejszą odpowiedź, nawet gdy pytanie sformułowano inaczej niż w bazie — wykorzystuje te same embeddingi co RAG.
Verwandt:Semantische SucheRAG (retrieval-augmented generation)Concierge (Assistent)
Ein Modus, in dem das Modell intern überlegt, bevor es antwortet.
Thinking-Modelle überlegen verborgen — gut für schwere Entscheidungen, aber langsamer und teurer. In normalen Chat erzwungen können sie leer antworten, daher nur für Reasoning aktiviert (Parameter think).
Verwandt:Großes Sprachmodell (LLM)InferenzModellauswahl (Routing)Latenz
Das richtige Modell pro Aufgabe wählen — das günstigste, das es trägt.
Es gibt kein „bestes” Modell; der OpenClaw-Router wählt es pro Aufgabe nach gemessenem Durchsatz, TTFT und Kontextfenster — nicht nach dem Namen. Der Modell-Atlas zeigt die Flotte mit Messwerten.
Verwandt:LLM-RouterDurchsatzTTFT (Zeit bis zum ersten Token)Thinking-Modus (Reasoning)Kontextfenster
Zeit vom Senden der Frage bis zum ersten Antwort-Token.
TTFT bestimmt, wie „schnell” ein Modell wirkt — beim Streaming sieht der Nutzer danach Text. Wir messen es live, da Namen täuschen.
Verwandt:LatenzDurchsatzModellauswahl (Routing)
Mehr:Modell-Atlas →
EU-Verordnung, die KI-Systeme nach Risiko klassifiziert und Pflichten auferlegt.
AI Act dzieli systemy na poziomy ryzyka. Dla ograniczonego ryzyka (chatboty, asystenci) kluczowa jest transparentność — użytkownik musi wiedzieć, że rozmawia z AI. Dla wysokiego ryzyka dochodzą nadzór ludzki, dokumentacja techniczna, rejestry logów i ocena zgodności. Egzekwowany od sierpnia 2026.
Verwandt:DSGVODSFA (Datenschutz-Folgenabschätzung)Menschliche Aufsicht (Human-in-the-Loop)Guardrails
Risikobewertung, wenn die Verarbeitung ein hohes Risiko für Rechte bergen kann.
DPIA wynika z RODO i jest wymagana typowo przy profilowaniu na dużą skalę, danych wrażliwych albo automatycznych decyzjach o ludziach. Asystent, który tylko odpowiada z bazy wiedzy, zwykle jej nie wymaga; system, który profiluje lub decyduje — prawdopodobnie tak.
Die Anforderung, dass ein Mensch wesentliche oder unumkehrbare KI-Entscheidungen überwacht.
Nadzór ludzki to filar zgodności i bezpieczeństwa: akcje nieodwracalne przechodzą przez potwierdzenie (human-gate), a system działa autonomicznie tylko w wąskim, opisanym zakresie. RODO daje też prawo do niebycia przedmiotem wyłącznie zautomatyzowanej decyzji.
Verwandt:KI-AgentGuardrailsAI Act
Ein Modell, das ein Dokument oder eine Nachricht einer von mehreren Kategorien zuordnet.
Klasyfikacja to jedno z zadań o najszybszym ROI: dekretacja faktur, kategoryzacja zgłoszeń, ocena leadów. Wynik jest mierzalny z definicji (procent poprawnych przypisań), a proces zwykle już istnieje ręcznie — dlatego to dobry kandydat na pierwsze wdrożenie.
Verwandt:DatenextraktionStrukturierte AusgabeGroßes Sprachmodell (LLM)
Das Herausziehen konkreter Felder aus Text — Rechnungsnummer, Betrag, USt-ID, Datum.
Ekstrakcja zamienia nieustrukturyzowany tekst w pola gotowe do systemu. Razem z klasyfikacją rozwiązuje dużą część pierwszych pomysłów na AI w polskich firmach. Najlepiej działa z wymuszonym schematem ([structured output](/pl/wiedza/slownik#structured-output)), który gwarantuje poprawny format.
Verwandt:KlassifikatorStrukturierte AusgabeRAG (retrieval-augmented generation)
Nahtlose Übergabe eines Gesprächs vom KI-Assistenten an einen Menschen, wenn nötig.
Handoff to dowód dojrzałości systemu, nie porażki: przy niskiej pewności, frustracji klienta albo sprawie wymagającej decyzji asystent eskaluje do człowieka zamiast zgadywać. To także wymóg transparentności z AI Act — użytkownik zawsze może rozmawiać z człowiekiem.
Verwandt:Menschliche Aufsicht (Human-in-the-Loop)Concierge (Assistent)HalluzinationAI Act
Einführung eines schmalen Prozesses zu Festkosten, um den Wert vor der Skalierung zu messen.
Pilotaż obniża ryzyko po obu stronach: zamiast wielkiego kontraktu pokazujemy działający system na jednym mierzalnym procesie. Jeśli dowiezie liczby (odzyskane godziny, % spraw zamkniętych bez człowieka), poszerzamy zakres; jeśli nie — kosztował niewiele.
Verwandt:KlassifikatorObservabilityRAG (retrieval-augmented generation)
Automatisches Bewerten und Priorisieren von Anfragen nach Passung zum idealen Kundenprofil (ICP).
Scoring to klasyfikacja zastosowana do sprzedaży: lead z formularza dostaje wynik (budżet, dopasowanie, gotowość), a najcenniejsze trafiają do człowieka jako pierwsze. Kryteria są jawne i logowane, a nie ukryte profilowanie — co ma znaczenie przy RODO i AI Act.
Das Lesen von Text aus einem Bild oder Scan — der erste Schritt vor der Feldextraktion.
OCR zamienia skan faktury czy umowy w tekst, który model może dalej zaklasyfikować i z którego wyciągnie pola (NIP, kwota, data). W połączeniu z ekstrakcją i structured output daje pełny pipeline „skan → gotowe pola w systemie”.
Automatisierung wiederkehrender Schritte in bestehenden Apps; mit KI wird sie „intelligent“.
Klasyczne RPA klika i przepisuje wg sztywnych reguł. Połączone z AI (klasyfikacja, ekstrakcja, decyzje) radzi sobie z wariancją — np. odczyta fakturę w dowolnym układzie zamiast wymagać jednego szablonu. U nas tę rolę pełnią agenci z allow-listą narzędzi i human-gate.
Verwandt:KI-AgentTool-NutzungDatenextraktion
Gestaltung der Modellanweisungen: Rolle, Regeln, Kontext, Ausgabeformat.
Dobry prompt to nie magiczne zaklęcie, lecz inżynieria: jasna rola, ograniczenia, kontekst (np. z RAG) i wymuszony format. W produkcji prompt wersjonuje się i testuje jak kod — nie zgaduje.
Verwandt:PromptGroßes Sprachmodell (LLM)Strukturierte Ausgabe
Künstlich erzeugte Daten für Training oder Tests, wenn echte fehlen oder sensibel sind.
Dane syntetyczne pomagają, gdy prawdziwych jest mało, są drogie albo objęte RODO — np. do testów i edge-case'ów. Trzeba pilnować, by odwzorowywały realny rozkład, inaczej model uczy się fikcji.
Verwandt:Fine-TuningKlassifikatorPII (personenbezogene Daten)
Regeln, Rollen und Kontrollen, wie ein Unternehmen KI baut und nutzt — wer verantwortet, was erlaubt ist, wie geprüft wird.
Governance spina rozproszone wdrożenia w jeden ład: rejestr systemów AI, właściciele, zasady danych, ślad i przeglądy. To warunek zgodności z AI Act i kontroli ryzyka przy skali.
Verwandt:AI ActMenschliche Aufsicht (Human-in-the-Loop)ObservabilityGuardrails
Die vollen Kosten eines KI-Systems: nicht nur Einrichtung, sondern Inferenz, Wartung, Monitoring und Updates.
Cena wdrożenia to wierzchołek góry lodowej. TCO obejmuje koszt inferencji (chmura vs lokalnie), utrzymanie, obserwowalność i aktualizacje. Przy skali to one decydują, czy własne bije API.
Verwandt:InferenzSelf-HostingPilotprojekt
Die Fähigkeit zu zeigen, warum ein KI-System eine Antwort oder Entscheidung lieferte — das Gegenteil einer Blackbox.
Wyjaśnialność budujemy praktycznie: cytaty źródeł (RAG), log każdego kroku i guardrails — żeby dało się wykazać, skąd wzięła się odpowiedź. To wymóg zaufania i rozliczalności (RODO/AI Act).
Verwandt:HalluzinationGuardrailsMenschliche Aufsicht (Human-in-the-Loop)AI Act