cashcrown // wiedza
Поняття AI без жаргону: RAG, ембединги, агенти, GDPR та інфраструктура — з визначеннями, звʼязками й пошуком.
46 понять
Модель, що передбачає наступні токени тексту — основа сучасних систем AI.
LLM uczy się statystyki języka z ogromnych korpusów i generuje tekst token po tokenie. Sam w sobie nie zna Twoich danych — wiedzę dziedzinową dokłada się przez RAG lub fine-tuning.
Повʼязані:ТокенІнференсRAG (генерація з пошуком)Тонке налаштування
Найменша одиниця тексту, яку обробляє модель.
Modele liczą koszt i limity w tokenach, nie znakach. ~1 token to średnio 4 znaki tekstu; rozliczenia i okno kontekstu mierzy się właśnie w tokenach.
Максимальна кількість токенів, які модель бачить одночасно.
Gdy rozmowa lub dokumenty przekraczają okno, trzeba je skracać lub wyszukiwać najtrafniejsze fragmenty — to jeden z powodów, dla których stosuje się RAG zamiast wrzucania całej bazy do promptu.
Повʼязані:ТокенRAG (генерація з пошуком)Промпт
Інструкція та контекст, що скеровують відповідь моделі.
Dobry prompt to rola, zasady, kontekst (np. źródła z RAG) i format wyjścia. Wstrzyknięcie złośliwej instrukcji do promptu to prompt injection — bronią przed nim guardraile.
Запуск навченої моделі для генерації відповіді.
Inferencja to koszt operacyjny systemu AI — mierzony latencją i przepustowością. Można ją uruchamiać w chmurze lub lokalnie (self-hosting), co decyduje o rezydencji danych.
Повʼязані:ЛатентністьСамостійний хостингВелика мовна модель (LLM)
Донавчання моделі на власних прикладах для зміни стилю чи поведінки.
Fine-tuning zmienia wagi modelu i jest kosztowny; do wnoszenia świeżej wiedzy faktograficznej zwykle lepszy jest RAG (tańszy, aktualizowalny bez retreningu). Oba podejścia bywają łączone.
Повʼязані:Велика мовна модель (LLM)RAG (генерація з пошуком)Інференс
Спочатку знайди факти, потім хай модель відповість лише на їх основі.
RAG ogranicza halucynacje: model dostaje konkretne źródła i cytuje je. To fundament rzetelnej obsługi klienta — odpowiedź jest ugruntowana, a przy słabym dopasowaniu system eskaluje do człowieka zamiast zmyślać.
Повʼязані:Ембединг (вектор)Векторна база данихГібридний пошукГалюцинаціяLLM-роутер
Текст у вигляді чисел, де близькість = схожість значення.
Embeddingi pozwalają wyszukiwać po znaczeniu, nie po słowach kluczowych. Cashcrown liczy je lokalnie modelem BGE-M3 (1024 wymiary), więc treść do osadzenia nie opuszcza infrastruktury.
Сховище ембедингів, що знаходить найближчі вектори за мілісекунди.
Serce wyszukiwania semantycznego w RAG. Cashcrown używa Qdranta uruchomionego lokalnie jako natywna usługa — wektory i metadane zostają na własnym serwerze.
Пошук за значенням, а не за дослівним збігом слів.
Pytanie i dokumenty zamieniane są na embeddingi i porównywane wektorowo, więc „jak chronić dane” znajdzie tekst o RODO nawet bez wspólnych słów.
Повʼязані:Ембединг (вектор)Векторна база данихГібридний пошукFAQ-провідник
Поєднання семантичного та класичного пошуку за словами.
Semantyka łapie sens, a wyszukiwanie pełnotekstowe — dokładne nazwy i kody. Łączenie obu (np. wektory + FTS Postgresa) daje trafniejsze wyniki niż każde z osobna.
Другий прохід, що впорядковує результати за релевантністю.
Po szybkim wyszukaniu kandydatów dokładniejszy model ocenia każdy względem pytania i podnosi najlepsze na górę — poprawia jakość kontekstu trafiającego do LLM.
Повʼязані:Гібридний пошукRAG (генерація з пошуком)
Єдиний вхід до моделей: добирає модель, маскує PII, контролює ліміти.
Cały ruch AI w Cashcrown idzie przez router OpenClaw — żaden kod nie woła dostawcy bezpośrednio. Dzięki temu maskowanie PII, fallback modeli i telemetria są egzekwowane w jednym miejscu.
Повʼязані:Велика мовна модель (LLM)PII (персональні дані)Структурований вивідСпостережуваністьДобір моделі (роутинг)Режим міркування (thinking)
Більше:Атлас моделей →
Система AI, що планує кроки й використовує інструменти.
Agent nie tylko odpowiada — działa: wyszukuje, woła API, rezerwuje termin. Bezpieczeństwo wymaga barierek i potwierdzeń przy akcjach nieodwracalnych, by działanie nie wymknęło się spod kontroli.
Повʼязані:Використання інструментівЗапобіжникиКонсьєрж (асистент)
Здатність моделі викликати функції/API, а не лише писати текст.
Model dostaje katalog narzędzi z opisem argumentów i decyduje, które wywołać. Akcje nieodwracalne (np. rezerwacja) wymagają serwerowego tokenu potwierdzenia, nie samej deklaracji modelu.
Повʼязані:AI-агентСтруктурований вивідЗапобіжники
Правила, що обмежують вхід і вихід моделі.
Na wejściu odrzucają prompt injection, na wyjściu kwalifikują obietnice (np. ceny widełkami, terminy z zastrzeżeniem). Barierki sprawiają, że asystent nie obieca rzeczy, których nie powinien.
Повʼязані:ПромптГалюцинаціяAI-агентВикористання інструментів
Впевнена, але вигадана відповідь моделі.
Modele uzupełniają luki prawdopodobnym tekstem, nawet gdy nie znają faktu. RAG z cytowaniem i progiem pewności (eskalacja do człowieka przy słabym dopasowaniu) to główna obrona.
Повʼязані:RAG (генерація з пошуком)ЗапобіжникиВелика мовна модель (LLM)
Примус моделі повертати валідний JSON за схемою.
Bez tego odpowiedź modelu trudno bezpiecznie sparsować. Cashcrown używa promptu opartego o JSON z walidacją schematu i jedną naprawą — to stabilniejsze niż wolne tryby „json_schema” u części dostawców.
Інформація, що ідентифікує особу.
Przed wysłaniem czegokolwiek do chmury router maskuje PII tokenami, a po odpowiedzi je przywraca — model w chmurze nigdy nie widzi prawdziwych danych osobowych.
Повʼязані:GDPRLLM-роутерРезидентність даних
Закон ЄС про захист даних: згода, мінімізація, право на стирання.
W praktyce: zgoda przed śledzeniem, przechowywanie tylko niezbędnego, oraz realne usunięcie danych na żądanie. W Cashcrown te zasady są wbudowane w pipeline, nie doklejone później.
Повʼязані:PII (персональні дані)Резидентність данихСамостійний хостинг
Де фізично зберігаються й обробляються дані.
Lokalne embeddingi (BGE-M3) i lokalny Qdrant oznaczają, że wrażliwe treści nie wychodzą poza serwer. Do chmury trafia tylko zamaskowany prompt — to świadomy wybór rezydencji.
Запуск моделей і сервісів на власній інфраструктурі.
Daje kontrolę nad danymi i kosztami oraz niezależność od jednego dostawcy. Cashcrown hostuje lokalnie embeddingi, wektorową bazę i wyszukiwanie, a do chmury sięga tylko po generację — z maskowaniem.
Багатомовна модель ембедингів, локально (1024 виміри).
Zamienia tekst w wielu językach na wektory bez wysyłania go do chmury — fundament prywatnego RAG w Cashcrown.
Повʼязані:Ембединг (вектор)Векторна база данихСамостійний хостингДобір моделі (роутинг)
Більше:BGE-M3 в атласі моделей →
Метрики, логи й трейси, що показують роботу системи AI.
Bez pomiaru nie da się rządzić kosztem ani jakością. Cashcrown wystawia metryki (Prometheus), korelowane logi i ślady, więc każde wywołanie modelu jest policzalne i diagnozowalne.
Повʼязані:ЛатентністьLLM-роутерІнференс
Час від запиту до відповіді; низька латентність = плавна взаємодія.
Streaming odpowiedzi po tokenie skraca odczuwaną latencję — użytkownik widzi tekst, zanim model skończy. To dlatego asystent „pisze na żywo”.
Скільки запитів/токенів система обробляє за одиницю часу.
Razem z latencją opisuje wydajność serwowania modeli. Limity współbieżności i backpressure chronią przepustowość przed przeciążeniem.
Повʼязані:ЛатентністьІнференсСпостережуваність
Асистент на RAG, що відповідає з цитатами й ескалює до людини.
Concierge Cashcrown łączy RAG, guardraile, wielojęzyczność i strumieniowanie — odpowiada na żywo z przypisami, a gdy nie wie, łączy z człowiekiem zamiast zmyślać.
Повʼязані:RAG (генерація з пошуком)AI-агентЗапобіжникиЛатентність
Пошук питань і відповідей за значенням.
Semantyczne FAQ podpowiada najtrafniejszą odpowiedź, nawet gdy pytanie sformułowano inaczej niż w bazie — wykorzystuje te same embeddingi co RAG.
Повʼязані:Семантичний пошукRAG (генерація з пошуком)Консьєрж (асистент)
Режим, у якому модель спершу міркує внутрішньо, перш ніж відповісти.
Мислячі моделі міркують приховано — добре для складних рішень, але повільніше й дорожче. Примусово в звичайному чаті можуть повернути порожньо, тож вмикаємо лише для міркування (параметр think).
Повʼязані:Велика мовна модель (LLM)ІнференсДобір моделі (роутинг)Латентність
Вибір правильної моделі під задачу — найдешевшої, що її витягне.
Немає одного «найкращого» моделя; роутер OpenClaw добирає його під задачу за виміряною пропускною, TTFT і вікном контексту — не за назвою. Атлас моделей показує весь флот із вимірами.
Повʼязані:LLM-роутерПропускна здатністьTTFT (час до першого токена)Режим міркування (thinking)Контекстне вікно
Час від надсилання питання до появи першого токена відповіді.
TTFT визначає, наскільки «швидко» здається модель — при стрімінгу користувач бачить текст після нього. Вимірюємо наживо, бо назви оманливі.
Повʼязані:ЛатентністьПропускна здатністьДобір моделі (роутинг)
Більше:Атлас моделей →
Регламент ЄС, що класифікує системи ШІ за ризиком і накладає обов'язки.
AI Act dzieli systemy na poziomy ryzyka. Dla ograniczonego ryzyka (chatboty, asystenci) kluczowa jest transparentność — użytkownik musi wiedzieć, że rozmawia z AI. Dla wysokiego ryzyka dochodzą nadzór ludzki, dokumentacja techniczna, rejestry logów i ocena zgodności. Egzekwowany od sierpnia 2026.
Повʼязані:GDPRDPIA (оцінка впливу на захист даних)Людський нагляд (human-in-the-loop)Запобіжники
Оцінка ризику, потрібна, коли обробка може створювати високий ризик для прав осіб.
DPIA wynika z RODO i jest wymagana typowo przy profilowaniu na dużą skalę, danych wrażliwych albo automatycznych decyzjach o ludziach. Asystent, który tylko odpowiada z bazy wiedzy, zwykle jej nie wymaga; system, który profiluje lub decyduje — prawdopodobnie tak.
Повʼязані:GDPRAI ActPII (персональні дані)
Вимога, щоб людина наглядала й підтверджувала суттєві чи незворотні рішення ШІ.
Nadzór ludzki to filar zgodności i bezpieczeństwa: akcje nieodwracalne przechodzą przez potwierdzenie (human-gate), a system działa autonomicznie tylko w wąskim, opisanym zakresie. RODO daje też prawo do niebycia przedmiotem wyłącznie zautomatyzowanej decyzji.
Повʼязані:AI-агентЗапобіжникиAI Act
Модель, що читає документ чи повідомлення й відносить його до однієї з категорій.
Klasyfikacja to jedno z zadań o najszybszym ROI: dekretacja faktur, kategoryzacja zgłoszeń, ocena leadów. Wynik jest mierzalny z definicji (procent poprawnych przypisań), a proces zwykle już istnieje ręcznie — dlatego to dobry kandydat na pierwsze wdrożenie.
Повʼязані:Екстракція данихСтруктурований вивідВелика мовна модель (LLM)
Витягання конкретних полів із тексту — номер рахунку, сума, податковий номер, дата.
Ekstrakcja zamienia nieustrukturyzowany tekst w pola gotowe do systemu. Razem z klasyfikacją rozwiązuje dużą część pierwszych pomysłów na AI w polskich firmach. Najlepiej działa z wymuszonym schematem ([structured output](/pl/wiedza/slownik#structured-output)), który gwarantuje poprawny format.
Повʼязані:КласифікаторСтруктурований вивідRAG (генерація з пошуком)
Плавне передавання розмови від ШІ-асистента людині, коли цього вимагає випадок.
Handoff to dowód dojrzałości systemu, nie porażki: przy niskiej pewności, frustracji klienta albo sprawie wymagającej decyzji asystent eskaluje do człowieka zamiast zgadywać. To także wymóg transparentności z AI Act — użytkownik zawsze może rozmawiać z człowiekiem.
Повʼязані:Людський нагляд (human-in-the-loop)Консьєрж (асистент)ГалюцинаціяAI Act
Впровадження одного вузького процесу за фіксованою вартістю, щоб виміряти цінність до масштабу.
Pilotaż obniża ryzyko po obu stronach: zamiast wielkiego kontraktu pokazujemy działający system na jednym mierzalnym procesie. Jeśli dowiezie liczby (odzyskane godziny, % spraw zamkniętych bez człowieka), poszerzamy zakres; jeśli nie — kosztował niewiele.
Повʼязані:КласифікаторСпостережуваністьRAG (генерація з пошуком)
Автоматична оцінка та пріоритезація запитів за відповідністю профілю клієнта (ICP).
Scoring to klasyfikacja zastosowana do sprzedaży: lead z formularza dostaje wynik (budżet, dopasowanie, gotowość), a najcenniejsze trafiają do człowieka jako pierwsze. Kryteria są jawne i logowane, a nie ukryte profilowanie — co ma znaczenie przy RODO i AI Act.
Повʼязані:КласифікаторAI-агентСтруктурований вивід
Зчитування тексту із зображення чи скана — перший крок перед екстракцією полів.
OCR zamienia skan faktury czy umowy w tekst, który model może dalej zaklasyfikować i z którego wyciągnie pola (NIP, kwota, data). W połączeniu z ekstrakcją i structured output daje pełny pipeline „skan → gotowe pola w systemie”.
Автоматизація повторюваних кроків у наявних застосунках; зі ШІ стає «розумною».
Klasyczne RPA klika i przepisuje wg sztywnych reguł. Połączone z AI (klasyfikacja, ekstrakcja, decyzje) radzi sobie z wariancją — np. odczyta fakturę w dowolnym układzie zamiast wymagać jednego szablonu. U nas tę rolę pełnią agenci z allow-listą narzędzi i human-gate.
Проєктування інструкцій моделі: роль, правила, контекст, формат виводу.
Dobry prompt to nie magiczne zaklęcie, lecz inżynieria: jasna rola, ograniczenia, kontekst (np. z RAG) i wymuszony format. W produkcji prompt wersjonuje się i testuje jak kod — nie zgaduje.
Повʼязані:ПромптВелика мовна модель (LLM)Структурований вивід
Штучно згенеровані дані для навчання чи тестів, коли реальних бракує або вони чутливі.
Dane syntetyczne pomagają, gdy prawdziwych jest mało, są drogie albo objęte RODO — np. do testów i edge-case'ów. Trzeba pilnować, by odwzorowywały realny rozkład, inaczej model uczy się fikcji.
Повʼязані:Тонке налаштуванняКласифікаторPII (персональні дані)
Правила, ролі та контроль над тим, як компанія будує й використовує ШІ — хто відповідає, що дозволено, як аудиюється.
Governance spina rozproszone wdrożenia w jeden ład: rejestr systemów AI, właściciele, zasady danych, ślad i przeglądy. To warunek zgodności z AI Act i kontroli ryzyka przy skali.
Повʼязані:AI ActЛюдський нагляд (human-in-the-loop)СпостережуваністьЗапобіжники
Повна вартість системи ШІ: не лише впровадження, а й інференс, обслуговування, моніторинг і оновлення.
Cena wdrożenia to wierzchołek góry lodowej. TCO obejmuje koszt inferencji (chmura vs lokalnie), utrzymanie, obserwowalność i aktualizacje. Przy skali to one decydują, czy własne bije API.
Повʼязані:ІнференсСамостійний хостингПілот
Здатність показати, чому система ШІ дала певну відповідь чи рішення — протилежність «чорної скриньки».
Wyjaśnialność budujemy praktycznie: cytaty źródeł (RAG), log każdego kroku i guardrails — żeby dało się wykazać, skąd wzięła się odpowiedź. To wymóg zaufania i rozliczalności (RODO/AI Act).
Повʼязані:ГалюцинаціяЗапобіжникиЛюдський нагляд (human-in-the-loop)AI Act