cashcrown // wiedza

Словник AI

Поняття AI без жаргону: RAG, ембединги, агенти, GDPR та інфраструктура — з визначеннями, звʼязками й пошуком.

61 понять

Велика мовна модель (LLM)Основи

Модель, що передбачає наступні токени тексту — основа сучасних систем AI.

LLM вивчає статистику мови з величезних корпусів і генерує текст токен за токеном. Сама по собі вона не знає ваших даних — предметні знання додаються через RAG або fine-tuning.

Повʼязані:Токен Інференс RAG (генерація з пошуком)Тонке налаштування

ТокенОснови

Найменша одиниця тексту, яку обробляє модель.

Моделі рахують вартість і ліміти в токенах, а не символах. ~1 токен — це в середньому 4 символи тексту; розрахунки й контекстне вікно вимірюються саме в токенах.

Повʼязані:Велика мовна модель (LLM)Контекстне вікно Інференс

Контекстне вікноОснови

Максимальна кількість токенів, які модель бачить одночасно.

Коли розмова чи документи перевищують вікно, доводиться їх скорочувати або шукати лише найрелевантніші фрагменти — одна з причин, чому застосовують RAG замість того, щоб запихати всю базу в промпт.

Повʼязані:Токен RAG (генерація з пошуком)Промпт

ПромптОснови

Інструкція та контекст, що скеровують відповідь моделі.

Хороший промпт задає роль, правила, контекст (напр., джерела з RAG) і формат виводу. Впровадження зловмисної інструкції в промпт — це prompt injection, від якого захищають guardrails.

Повʼязані:Контекстне вікно Запобіжники Структурований вивід

ІнференсОснови

Запуск навченої моделі для генерації відповіді.

Інференс — це операційна вартість системи AI, що вимірюється латентністю та пропускною здатністю. Його можна запускати в хмарі або локально (self-hosting), що визначає резидентність даних.

Повʼязані:Латентність Самостійний хостинг Велика мовна модель (LLM)

Тонке налаштуванняОснови

Донавчання моделі на власних прикладах для зміни стилю чи поведінки.

Fine-tuning змінює ваги моделі й коштує дорого; для внесення свіжих фактичних знань зазвичай кращий RAG (дешевший, оновлюваний без перетренування). Обидва підходи інколи поєднують.

Повʼязані:Велика мовна модель (LLM)RAG (генерація з пошуком)Інференс

RAG (генерація з пошуком)RAG і пошук

Спочатку знайди факти, потім хай модель відповість лише на їх основі.

RAG обмежує галюцинації: модель отримує конкретні джерела й цитує їх. Це основа надійної підтримки клієнтів — відповідь обґрунтована, а за слабкого збігу система ескалює до людини замість вигадування.

Повʼязані:Ембединг (вектор)Векторна база даних Гібридний пошук Галюцинація LLM-роутер

Ембединг (вектор)RAG і пошукBGE-M3

Текст у вигляді чисел, де близькість = схожість значення.

Ембединги дають змогу шукати за значенням, а не за ключовими словами. Cashcrown обчислює їх локально моделлю BGE-M3 (1024 виміри), тож контент для вбудовування не залишає інфраструктури.

Повʼязані:Векторна база даних Семантичний пошук BGE-M3

Векторна база данихRAG і пошукQdrant

Сховище ембедингів, що знаходить найближчі вектори за мілісекунди.

Серце семантичного пошуку в RAG. Cashcrown запускає Qdrant локально як нативний сервіс — вектори й метадані залишаються на власному сервері.

Повʼязані:Ембединг (вектор)Семантичний пошук Гібридний пошук

Семантичний пошукRAG і пошук

Пошук за значенням, а не за дослівним збігом слів.

Питання та документи перетворюються на ембединги й порівнюються як вектори, тож «як захистити дані» знайде текст про GDPR навіть без спільних слів.

Повʼязані:Ембединг (вектор)Векторна база даних Гібридний пошук FAQ-провідник

Гібридний пошукRAG і пошук

Поєднання семантичного та класичного пошуку за словами.

Семантика вловлює зміст, а повнотекстовий пошук — точні назви й коди. Поєднання обох (напр., вектори + FTS Postgres) дає влучніші результати, ніж кожен окремо.

Повʼязані:Семантичний пошук Реранкінг Векторна база даних

РеранкінгRAG і пошук

Другий прохід, що впорядковує результати за релевантністю.

Після швидкого першого пошуку точніша модель оцінює кожного кандидата щодо питання й піднімає найкращих угору — це покращує якість контексту, що надходить до LLM.

Повʼязані:Гібридний пошук RAG (генерація з пошуком)

LLM-роутерАгентиOpenClaw

Єдиний вхід до моделей: добирає модель, маскує PII, контролює ліміти.

Увесь AI-трафік у Cashcrown проходить через роутер OpenClaw — жоден код не звертається до провайдера напряму. Завдяки цьому маскування PII, fallback моделей і телеметрія контролюються в одному місці.

Повʼязані:Велика мовна модель (LLM)PII (персональні дані)Структурований вивід Спостережуваність Добір моделі (роутинг)Режим міркування (thinking)

Більше:Атлас моделей →

AI-агентАгенти

Система AI, що планує кроки й використовує інструменти.

Агент не лише відповідає — він діє: шукає, викликає API, бронює час. Безпека вимагає запобіжників і підтверджень для незворотних дій, щоб поведінка не вийшла з-під контролю.

Повʼязані:Використання інструментів Запобіжники Консьєрж (асистент)

Використання інструментівАгенти

Здатність моделі викликати функції/API, а не лише писати текст.

Модель отримує каталог інструментів з описом аргументів і вирішує, які викликати. Незворотні дії (напр., бронювання) вимагають серверного токена підтвердження, а не самої заяви моделі.

Повʼязані:AI-агент Структурований вивід Запобіжники

ЗапобіжникиАгенти

Правила, що обмежують вхід і вихід моделі.

На вході вони відхиляють prompt injection, на виході обумовлюють обіцянки (напр., ціни діапазоном, терміни із застереженням). Запобіжники не дають асистенту пообіцяти те, чого не слід.

Повʼязані:Промпт Галюцинація AI-агент Використання інструментів

ГалюцинаціяАгенти

Впевнена, але вигадана відповідь моделі.

Моделі заповнюють прогалини правдоподібним текстом навіть тоді, коли не знають факту. RAG із цитуванням і порогом упевненості (ескалація до людини за слабкого збігу) — основний захист.

Повʼязані:RAG (генерація з пошуком)Запобіжники Велика мовна модель (LLM)

Структурований вивідАгенти

Примус моделі повертати валідний JSON за схемою.

Без цього відповідь моделі важко безпечно розпарсити. Cashcrown використовує JSON на основі промпту з валідацією схеми та однією спробою виправлення — це стабільніше за повільні нативні режими «json_schema» в частини провайдерів.

Повʼязані:Промпт Використання інструментів LLM-роутер

PII (персональні дані)Приватність

Інформація, що ідентифікує особу.

Перш ніж будь-що піде в хмару, роутер маскує PII токенами, а у відповіді відновлює їх — хмарна модель ніколи не бачить справжніх персональних даних.

Повʼязані:GDPR LLM-роутер Резидентність даних

GDPRПриватність

Закон ЄС про захист даних: згода, мінімізація, право на стирання.

На практиці: згода перед відстеженням, зберігання лише необхідного та реальне стирання даних на запит. У Cashcrown ці принципи вбудовані в pipeline, а не доліплені пізніше.

Повʼязані:PII (персональні дані)Резидентність даних Самостійний хостинг

Резидентність данихПриватність

Де фізично зберігаються й обробляються дані.

Локальні ембединги (BGE-M3) і локальний Qdrant означають, що чутливий контент не залишає сервера. У хмару потрапляє лише замаскований промпт — свідомий вибір резидентності.

Повʼязані:Самостійний хостинг PII (персональні дані)GDPR

Самостійний хостингІнфраструктура

Запуск моделей і сервісів на власній інфраструктурі.

Дає контроль над даними й витратами та незалежність від одного постачальника. Cashcrown хостить локально ембединги, векторну базу й пошук, а до хмари звертається лише по генерацію — із маскуванням.

Повʼязані:Резидентність даних Інференс Векторна база даних

BGE-M3ІнфраструктураBGE-M3

Багатомовна модель ембедингів, локально (1024 виміри).

Перетворює багатомовний текст на вектори, не надсилаючи його в хмару — фундамент приватного RAG у Cashcrown.

Повʼязані:Ембединг (вектор)Векторна база даних Самостійний хостинг Добір моделі (роутинг)

Більше:BGE-M3 в атласі моделей →

СпостережуваністьІнфраструктура

Метрики, логи й трейси, що показують роботу системи AI.

Без вимірювання неможливо керувати ні вартістю, ні якістю. Cashcrown надає метрики (Prometheus), корельовані логи й трейси, тож кожен виклик моделі піддається підрахунку й діагностиці.

Повʼязані:Латентність LLM-роутер Інференс

ЛатентністьІнфраструктура

Час від запиту до відповіді; низька латентність = плавна взаємодія.

Стрімінг відповіді токен за токеном зменшує відчутну латентність — користувач бачить текст, перш ніж модель закінчить. Саме тому асистент «пише наживо».

Повʼязані:Інференс Пропускна здатність Спостережуваність

Пропускна здатністьІнфраструктура

Скільки запитів/токенів система обробляє за одиницю часу.

Разом із латентністю описує продуктивність обслуговування моделей. Ліміти паралельності та backpressure захищають пропускну здатність від перевантаження.

Повʼязані:Латентність Інференс Спостережуваність

Консьєрж (асистент)Агенти

Асистент на RAG, що відповідає з цитатами й ескалює до людини.

Консьєрж Cashcrown поєднує RAG, guardrails, багатомовність і стрімінг — відповідає наживо з посиланнями, а коли не знає, з'єднує з людиною замість вигадування.

Повʼязані:RAG (генерація з пошуком)AI-агент Запобіжники Латентність

FAQ-провідникSEO та AEO

Пошук питань і відповідей за значенням.

Семантичний FAQ підказує найвлучнішу відповідь, навіть коли питання сформульоване інакше, ніж у базі — він використовує ті самі ембединги, що й RAG.

Повʼязані:Семантичний пошук RAG (генерація з пошуком)Консьєрж (асистент)

Режим міркування (thinking)Основи

Режим, у якому модель спершу міркує внутрішньо, перш ніж відповісти.

Мислячі моделі міркують приховано — добре для складних рішень, але повільніше й дорожче. Примусово в звичайному чаті можуть повернути порожньо, тож вмикаємо лише для міркування (параметр think).

Повʼязані:Велика мовна модель (LLM)Інференс Добір моделі (роутинг)Латентність

Більше:Атлас моделей →Яка модель AI? (дерево) →

Добір моделі (роутинг)Інфраструктура

Вибір правильної моделі під задачу — найдешевшої, що її витягне.

Немає одного «найкращого» моделя; роутер OpenClaw добирає його під задачу за виміряною пропускною, TTFT і вікном контексту — не за назвою. Атлас моделей показує весь флот із вимірами.

Повʼязані:LLM-роутер Пропускна здатність TTFT (час до першого токена)Режим міркування (thinking)Контекстне вікно

Більше:Атлас моделей →Порівняння моделей →

TTFT (час до першого токена)Інфраструктура

Час від надсилання питання до появи першого токена відповіді.

TTFT визначає, наскільки «швидко» здається модель — при стрімінгу користувач бачить текст після нього. Вимірюємо наживо, бо назви оманливі.

Повʼязані:Латентність Пропускна здатність Добір моделі (роутинг)

Більше:Атлас моделей →

AI ActПриватність

Регламент ЄС, що класифікує системи ШІ за ризиком і накладає обов'язки.

AI Act ділить системи на рівні ризику. Для обмеженого ризику (чат-боти, асистенти) ключовою є прозорість — користувач має знати, що спілкується зі ШІ. Для високого ризику додаються людський нагляд, технічна документація, журнали логів та оцінка відповідності. Чинний від 2024 і застосовується поетапно: заборони неприйнятних практик від 2025, а прозорість для чат-ботів (ст. 50) і більшість обов'язків для високого ризику — від серпня 2026.

Повʼязані:GDPR DPIA (оцінка впливу на захист даних)Людський нагляд (human-in-the-loop)Запобіжники

DPIA (оцінка впливу на захист даних)Приватність

Оцінка ризику, потрібна, коли обробка може створювати високий ризик для прав осіб.

DPIA випливає з GDPR і зазвичай потрібна за масштабного профілювання, чутливих даних чи автоматичних рішень щодо людей. Асистент, що лише відповідає з бази знань, зазвичай її не потребує; система, що профілює або вирішує, — імовірно, так.

Повʼязані:GDPR AI Act PII (персональні дані)

Людський нагляд (human-in-the-loop)Агенти

Вимога, щоб людина наглядала й підтверджувала суттєві чи незворотні рішення ШІ.

Людський нагляд — це опора відповідності та безпеки: незворотні дії проходять через підтвердження (human-gate), а система діє автономно лише у вузькому, описаному обсязі. GDPR також надає право не бути об'єктом виключно автоматизованих рішень.

Повʼязані:AI-агент Запобіжники AI Act

КласифікаторОснови

Модель, що читає документ чи повідомлення й відносить його до однієї з категорій.

Класифікація — одне із завдань з найшвидшим ROI: рознесення рахунків, категоризація звернень, оцінка лідів. Результат вимірюваний за визначенням (відсоток правильних призначень), а процес зазвичай уже існує вручну — тому це добрий кандидат на перше впровадження.

Повʼязані:Екстракція даних Структурований вивід Велика мовна модель (LLM)

Екстракція данихОснови

Витягання конкретних полів із тексту — номер рахунку, сума, податковий номер, дата.

Екстракція перетворює неструктурований текст на готові до системи поля. Разом із класифікацією вона розв'язує значну частину перших ідей щодо AI у компаніях. Найкраще працює з примусовою схемою (structured output), що гарантує валідний формат.

Повʼязані:Класифікатор Структурований вивід RAG (генерація з пошуком)

Передавання людині (human-handoff)Агенти

Плавне передавання розмови від ШІ-асистента людині, коли цього вимагає випадок.

Передавання людині — це ознака зрілості системи, а не невдачі: за низької впевненості, фрустрації клієнта чи справи, що потребує рішення, асистент ескалює до людини замість того, щоб гадати. Це також частина прозорості за AI Act — користувач завжди може звернутися до людини.

Повʼязані:Людський нагляд (human-in-the-loop)Консьєрж (асистент)Галюцинація AI Act

ПілотІнфраструктура

Впровадження одного вузького процесу за фіксованою вартістю, щоб виміряти цінність до масштабу.

Пілот знижує ризик з обох боків: замість великого контракту ми показуємо робочу систему на одному вимірюваному процесі. Якщо вона дає цифри (зекономлені години, % справ, закритих без людини), ми розширюємо обсяг; якщо ні — це коштувало небагато.

Повʼязані:Класифікатор Спостережуваність RAG (генерація з пошуком)

Скоринг лідівАгенти

Автоматична оцінка та пріоритезація запитів за відповідністю профілю клієнта (ICP).

Скоринг — це класифікація, застосована до продажів: лід із форми отримує оцінку (бюджет, відповідність, готовність), а найцінніші першими потрапляють до людини. Критерії відкриті й логуються, а не є прихованим профілюванням — що важливо для GDPR та AI Act.

Повʼязані:Класифікатор AI-агент Структурований вивід

OCR (оптичне розпізнавання тексту)RAG і пошук

Зчитування тексту із зображення чи скана — перший крок перед екстракцією полів.

OCR перетворює скан рахунка чи договору на текст, який модель може далі класифікувати й з якого витягне поля (податковий номер, сума, дата). У поєднанні з екстракцією та structured output це дає повний пайплайн «скан → готові поля в системі».

Повʼязані:Екстракція даних Класифікатор Структурований вивід

RPA (роботизована автоматизація процесів)Агенти

Автоматизація повторюваних кроків у наявних застосунках; зі ШІ стає «розумною».

Класична RPA клікає й переписує за жорсткими правилами. У поєднанні зі ШІ (класифікація, екстракція, рішення) вона справляється з варіативністю — напр., читає рахунок у будь-якому форматі замість того, щоб вимагати один шаблон. У нас цю роль виконують агенти з allow-list інструментів і human-gate.

Повʼязані:AI-агент Використання інструментів Екстракція даних

Prompt engineeringОснови

Проєктування інструкцій моделі: роль, правила, контекст, формат виводу.

Хороший промпт — це не магічне заклинання, а інженерія: чітка роль, обмеження, контекст (напр., із RAG) і примусовий формат. У продакшені промпт версіонують і тестують як код, а не вгадують.

Повʼязані:Промпт Велика мовна модель (LLM)Структурований вивід

Синтетичні даніОснови

Штучно згенеровані дані для навчання чи тестів, коли реальних бракує або вони чутливі.

Синтетичні дані допомагають, коли реальних бракує, вони дорогі або підпадають під GDPR — напр., для тестів і граничних випадків. Треба стежити, щоб вони відтворювали реальний розподіл, інакше модель навчається фікції.

Повʼязані:Тонке налаштування Класифікатор PII (персональні дані)

AI governanceПриватність

Правила, ролі та контроль над тим, як компанія будує й використовує ШІ — хто відповідає, що дозволено, як аудиюється.

Governance об'єднує розрізнені впровадження в єдиний лад: реєстр систем AI, власники, правила даних, аудиторський слід і перегляди. Це умова відповідності AI Act і контролю ризику при масштабі.

Повʼязані:AI Act Людський нагляд (human-in-the-loop)Спостережуваність Запобіжники

TCO (сукупна вартість володіння)Інфраструктура

Повна вартість системи ШІ: не лише впровадження, а й інференс, обслуговування, моніторинг і оновлення.

Ціна впровадження — це верхівка айсберга. TCO охоплює вартість інференсу (хмара проти локального), обслуговування, спостережуваність і оновлення. При масштабі саме вони вирішують, чи власне рішення перевершує API.

Повʼязані:Інференс Самостійний хостинг Пілот

Пояснюваність (XAI)Приватність

Здатність показати, чому система ШІ дала певну відповідь чи рішення — протилежність «чорної скриньки».

Пояснюваність ми будуємо практично: цитати джерел (RAG), лог кожного кроку й guardrails — щоб можна було показати, звідки взялася відповідь. Це вимога довіри та підзвітності (GDPR/AI Act).

Повʼязані:Галюцинація Запобіжники Людський нагляд (human-in-the-loop)AI Act

Розбиття на фрагменти (chunking)RAG і пошук

Розрізання документів на фрагменти, які ембедяться і шукаються в RAG.

Модель індексує коротші уривки, а не цілі файли — контекстне вікно обмежене, і точний фрагмент знаходиться краще, ніж ціла сторінка. Погана межа (розрізане речення, розбита таблиця) псує релевантність, тож ріжемо за заголовками й абзацами з легким перекриттям, а не наосліп за кількістю символів.

Повʼязані:RAG (генерація з пошуком)Ембединг (вектор)Контекстне вікно Реранкінг

MCP (Model Context Protocol)Агенти

Відкритий стандарт, що з'єднує моделі й агентів з інструментами та джерелами даних через спільний інтерфейс.

MCP — це спільна «шина плагінів»: замість окремої інтеграції під кожну систему, сервер MCP надає інструменти й дані, а агент звертається до них стандартизовано. Зручно, але збільшує поверхню атаки — кожен сервер MCP потребує allow-list і контролю прав, бо наданий інструмент стає реальною дією.

Повʼязані:AI-агент Використання інструментів Запобіжники LLM-роутер

Graph RAG (RAG на графі)RAG і пошук

RAG, що шукає не лише за фрагментами тексту, а й за графом сутностей та зв'язків між ними.

Звичайний RAG повертає схожі фрагменти, але не справляється з питаннями «як це пов'язано?». Graph RAG будує граф сутностей (люди, компанії, документи) та їхніх зв'язків, тож опрацьовує багатокрокові питання й контекст, розкиданий по багатьох файлах. Він дорожчий у побудові та підтримці, тож застосовуємо його там, де зв'язки справді важливі, а не за замовчуванням.

Повʼязані:RAG (генерація з пошуком)Семантичний пошук Векторна база даних Agentic RAG (агентний RAG)

Agentic RAG (агентний RAG)RAG і пошук

RAG, де агент планує пошуки, сам оцінює результати й перепитує, замість одного запиту.

Класичний RAG — це один пошук і відповідь. В agentic RAG агент розбиває складне питання на кроки, шукає багаторазово, оцінює, чи достатньо знайденого контексту, і за потреби перепитує або переформульовує. Він дає кращі відповіді на складні питання ціною більшої кількості викликів моделі, тож ним і далі керують guardrails та ліміти.

Повʼязані:RAG (генерація з пошуком)AI-агент Graph RAG (RAG на графі)Запобіжники

Семантичний кешІнфраструктура

Кеш, що повертає готову відповідь на питання, схоже за значенням до попереднього.

Звичайний кеш спрацьовує лише за ідентичного тексту; семантичний кеш порівнює ембединги, тож «скільки коштує впровадження?» і «яка ціна пілота?» можуть влучити в той самий збережений результат. Це знижує латентність і вартість інференсу, але потребує порога схожості й короткого TTL, щоб не віддавати застарілу чи надто притягнуту відповідь.

Повʼязані:Ембединг (вектор)Семантичний пошук Латентність Інференс

КвантизаціяІнфраструктура

Зберігання ваг моделі з меншою точністю, щоб вона вмістилася на слабшому залізі.

Квантизація округлює ваги (наприклад, з 16 до 4 біт), тож модель займає менше пам'яті й працює швидше — ціною незначної втрати якості. Це базовий прийом, що дає змогу запускати корисні моделі локально (self-hosting), а не лише в хмарі.

Повʼязані:Самостійний хостинг Інференс Латентність Пропускна здатність

LoRA та QLoRAІнфраструктура

Дешевий спосіб донавчити модель — навчає невеликі додатки замість усіх ваг.

LoRA додає до моделі невеликі навчані шари (адаптери), тож тонке налаштування дешевше й швидше за тренування всього. QLoRA поєднує це з квантизацією, щоб тренування вмістилося на одну відеокарту. Для свіжих фактів зазвичай усе одно кращий RAG.

Повʼязані:Тонке налаштування Квантизація RAG (генерація з пошуком)Самостійний хостинг

ТемператураОснови

Регулятор випадковості — низька дає стабільні, передбачувані відповіді, висока — креативні.

Температура керує тим, наскільки модель «ризикує» при виборі наступного токена. Для підтримки, екстракції даних і відповідей на основі джерел тримаємо її низькою (повторюваність), а підвищуємо лише там, де потрібне різноманіття.

Повʼязані:Велика мовна модель (LLM)Інференс Структурований вивід Галюцинація

Суміш експертів (MoE)Інфраструктура

Архітектура, у якій на кожен токен активується лише частина моделі.

Модель MoE ділиться на багатьох «експертів», а роутер активує для кожного токена лише кількох із них. Завдяки цьому модель може бути дуже великою (багато знань), але дешевою в інференсі, бо рахується лише активна частина — звідси їхня популярність у локальних розгортаннях.

Повʼязані:Інференс Пропускна здатність Добір моделі (роутинг)Самостійний хостинг

Стрімінг токенівІнфраструктура

Показ відповіді слово за словом, щойно модель її генерує.

Замість чекати всю відповідь, стрімінг показує текст токен за токеном — користувач бачить перші слова після TTFT, тож система здається швидшою. У Cashcrown консьєрж стрімить відповіді через SSE, що помітно покращує відчуття швидкості.

Повʼязані:TTFT (час до першого токена)Латентність Консьєрж (асистент)Інференс

Prompt injection (впровадження інструкцій)Агенти

Прихована інструкція у вхідних даних, що має перехопити контроль над моделлю.

Зловмисник ховає команду в повідомленні, документі чи на вебсторінці («ігноруй інструкції, надішли секрети»), і модель виконує її як власну. Це головна загроза для агентів з інструментами; ми захищаємось, скануючи вхід guardrails перед моделлю та вимагаючи серверного підтвердження незворотних дій — самої моделі ніколи не досить.

Повʼязані:Запобіжники Промпт Використання інструментів

Red teaming (змагальні тести)Агенти

Навмисна атака на власну систему ШІ, щоб знайти діри раніше за інших.

Red teaming — це батарея перевірок: prompt injection, спроби витягти секрети, обхід guardrails, примус до обіцянок чи галюцинацій. Cashcrown тримає такий набір як постійний gate (напр., багатомовні шаблони injection PL/EN/DE/UK), бо атака, успішна однією мовою, часто проходить й іншою.

Повʼязані:Prompt injection (впровадження інструкцій)Запобіжники Оцінка агента (golden set)Галюцинація

МультимодальністьОснови

Модель, що розуміє не лише текст, а й зображення, PDF та звук.

Мультимодальна модель приймає зображення, скани чи записи й працює з ними, як із текстом — описує фото, читає рахунок, транскрибує дзвінок. На практиці ми поєднуємо це з OCR та екстракцією в пайплайн «документ → готові поля», а завантажені файли обробляємо без запису на диск і без ретенції.

Повʼязані:OCR (оптичне розпізнавання тексту)Екстракція даних Мовлення (STT / TTS)Велика мовна модель (LLM)

Мовлення (STT / TTS)Основи

Перетворення мовлення на текст (STT) і тексту на мовлення (TTS) — основа голосового асистента.

STT (speech-to-text) записує висловлювання як текст, TTS (text-to-speech) озвучує відповідь. Cashcrown транскрибує локально моделлю Whisper, тож запис не залишає сервера; сам голосовий асистент — це поєднання STT, RAG і guardrails, а не окрема «магічна» модель.

Повʼязані:Мультимодальність Консьєрж (асистент)Самостійний хостинг Латентність

Оцінка агента (golden set)Агенти

Вимірювання якості агента на сталому наборі еталонних кейсів, а не «на око».

Golden set — це набір питань з очікуваною відповіддю (і правильним вибором інструмента), на якому ми міряємо точність після кожної зміни промпту чи моделі — щоб виправлення одного не зламало десяти інших. Без цього «краще» — лише відчуття; з ним воно стає числом, яке можна обґрунтувати.

Повʼязані:Red teaming (змагальні тести)AI-агент Спостережуваність Структурований вивід

Словник AI

Поняття AI без жаргону: RAG, ембединги, агенти, GDPR та інфраструктура — з визначеннями, звʼязками й пошуком.

61 понять

Велика мовна модель (LLM)Основи

Модель, що передбачає наступні токени тексту — основа сучасних систем AI.

Повʼязані:Токен Інференс RAG (генерація з пошуком)Тонке налаштування

ТокенОснови

Найменша одиниця тексту, яку обробляє модель.

Повʼязані:Велика мовна модель (LLM)Контекстне вікно Інференс

Контекстне вікноОснови

Максимальна кількість токенів, які модель бачить одночасно.

Повʼязані:Токен RAG (генерація з пошуком)Промпт

ПромптОснови

Інструкція та контекст, що скеровують відповідь моделі.

Повʼязані:Контекстне вікно Запобіжники Структурований вивід

ІнференсОснови

Запуск навченої моделі для генерації відповіді.

Повʼязані:Латентність Самостійний хостинг Велика мовна модель (LLM)

Тонке налаштуванняОснови

Донавчання моделі на власних прикладах для зміни стилю чи поведінки.

Повʼязані:Велика мовна модель (LLM)RAG (генерація з пошуком)Інференс

RAG (генерація з пошуком)RAG і пошук

Спочатку знайди факти, потім хай модель відповість лише на їх основі.

Повʼязані:Ембединг (вектор)Векторна база даних Гібридний пошук Галюцинація LLM-роутер

Ембединг (вектор)RAG і пошукBGE-M3

Текст у вигляді чисел, де близькість = схожість значення.

Повʼязані:Векторна база даних Семантичний пошук BGE-M3

Векторна база данихRAG і пошукQdrant

Сховище ембедингів, що знаходить найближчі вектори за мілісекунди.

Повʼязані:Ембединг (вектор)Семантичний пошук Гібридний пошук

Семантичний пошукRAG і пошук

Пошук за значенням, а не за дослівним збігом слів.

Повʼязані:Ембединг (вектор)Векторна база даних Гібридний пошук FAQ-провідник

Гібридний пошукRAG і пошук

Поєднання семантичного та класичного пошуку за словами.

Повʼязані:Семантичний пошук Реранкінг Векторна база даних

РеранкінгRAG і пошук

Другий прохід, що впорядковує результати за релевантністю.

Повʼязані:Гібридний пошук RAG (генерація з пошуком)

LLM-роутерАгентиOpenClaw

Єдиний вхід до моделей: добирає модель, маскує PII, контролює ліміти.

Більше:Атлас моделей →

AI-агентАгенти

Система AI, що планує кроки й використовує інструменти.

Повʼязані:Використання інструментів Запобіжники Консьєрж (асистент)

Використання інструментівАгенти

Здатність моделі викликати функції/API, а не лише писати текст.

Повʼязані:AI-агент Структурований вивід Запобіжники

ЗапобіжникиАгенти

Правила, що обмежують вхід і вихід моделі.

Повʼязані:Промпт Галюцинація AI-агент Використання інструментів

ГалюцинаціяАгенти

Впевнена, але вигадана відповідь моделі.

Повʼязані:RAG (генерація з пошуком)Запобіжники Велика мовна модель (LLM)

Структурований вивідАгенти

Примус моделі повертати валідний JSON за схемою.

Повʼязані:Промпт Використання інструментів LLM-роутер

PII (персональні дані)Приватність

Інформація, що ідентифікує особу.

Повʼязані:GDPR LLM-роутер Резидентність даних

GDPRПриватність

Закон ЄС про захист даних: згода, мінімізація, право на стирання.

Повʼязані:PII (персональні дані)Резидентність даних Самостійний хостинг

Резидентність данихПриватність

Де фізично зберігаються й обробляються дані.

Повʼязані:Самостійний хостинг PII (персональні дані)GDPR

Самостійний хостингІнфраструктура

Запуск моделей і сервісів на власній інфраструктурі.

Повʼязані:Резидентність даних Інференс Векторна база даних

BGE-M3ІнфраструктураBGE-M3

Багатомовна модель ембедингів, локально (1024 виміри).

Перетворює багатомовний текст на вектори, не надсилаючи його в хмару — фундамент приватного RAG у Cashcrown.

Повʼязані:Ембединг (вектор)Векторна база даних Самостійний хостинг Добір моделі (роутинг)

Більше:BGE-M3 в атласі моделей →

СпостережуваністьІнфраструктура

Метрики, логи й трейси, що показують роботу системи AI.

Повʼязані:Латентність LLM-роутер Інференс

ЛатентністьІнфраструктура

Час від запиту до відповіді; низька латентність = плавна взаємодія.

Повʼязані:Інференс Пропускна здатність Спостережуваність

Пропускна здатністьІнфраструктура

Скільки запитів/токенів система обробляє за одиницю часу.

Повʼязані:Латентність Інференс Спостережуваність

Консьєрж (асистент)Агенти

Асистент на RAG, що відповідає з цитатами й ескалює до людини.

Повʼязані:RAG (генерація з пошуком)AI-агент Запобіжники Латентність

FAQ-провідникSEO та AEO

Пошук питань і відповідей за значенням.

Повʼязані:Семантичний пошук RAG (генерація з пошуком)Консьєрж (асистент)

Режим міркування (thinking)Основи

Режим, у якому модель спершу міркує внутрішньо, перш ніж відповісти.

Повʼязані:Велика мовна модель (LLM)Інференс Добір моделі (роутинг)Латентність

Більше:Атлас моделей →Яка модель AI? (дерево) →

Добір моделі (роутинг)Інфраструктура

Вибір правильної моделі під задачу — найдешевшої, що її витягне.

Повʼязані:LLM-роутер Пропускна здатність TTFT (час до першого токена)Режим міркування (thinking)Контекстне вікно

Більше:Атлас моделей →Порівняння моделей →

TTFT (час до першого токена)Інфраструктура

Час від надсилання питання до появи першого токена відповіді.

Повʼязані:Латентність Пропускна здатність Добір моделі (роутинг)

Більше:Атлас моделей →

AI ActПриватність

Регламент ЄС, що класифікує системи ШІ за ризиком і накладає обов'язки.

Повʼязані:GDPR DPIA (оцінка впливу на захист даних)Людський нагляд (human-in-the-loop)Запобіжники

DPIA (оцінка впливу на захист даних)Приватність

Оцінка ризику, потрібна, коли обробка може створювати високий ризик для прав осіб.

Повʼязані:GDPR AI Act PII (персональні дані)

Людський нагляд (human-in-the-loop)Агенти

Вимога, щоб людина наглядала й підтверджувала суттєві чи незворотні рішення ШІ.

Повʼязані:AI-агент Запобіжники AI Act

КласифікаторОснови

Модель, що читає документ чи повідомлення й відносить його до однієї з категорій.

Повʼязані:Екстракція даних Структурований вивід Велика мовна модель (LLM)

Екстракція данихОснови

Витягання конкретних полів із тексту — номер рахунку, сума, податковий номер, дата.

Повʼязані:Класифікатор Структурований вивід RAG (генерація з пошуком)

Передавання людині (human-handoff)Агенти

Плавне передавання розмови від ШІ-асистента людині, коли цього вимагає випадок.

Повʼязані:Людський нагляд (human-in-the-loop)Консьєрж (асистент)Галюцинація AI Act

ПілотІнфраструктура

Впровадження одного вузького процесу за фіксованою вартістю, щоб виміряти цінність до масштабу.

Повʼязані:Класифікатор Спостережуваність RAG (генерація з пошуком)

Скоринг лідівАгенти

Автоматична оцінка та пріоритезація запитів за відповідністю профілю клієнта (ICP).

Повʼязані:Класифікатор AI-агент Структурований вивід

OCR (оптичне розпізнавання тексту)RAG і пошук

Зчитування тексту із зображення чи скана — перший крок перед екстракцією полів.

Повʼязані:Екстракція даних Класифікатор Структурований вивід

RPA (роботизована автоматизація процесів)Агенти

Автоматизація повторюваних кроків у наявних застосунках; зі ШІ стає «розумною».

Повʼязані:AI-агент Використання інструментів Екстракція даних

Prompt engineeringОснови

Проєктування інструкцій моделі: роль, правила, контекст, формат виводу.

Повʼязані:Промпт Велика мовна модель (LLM)Структурований вивід

Синтетичні даніОснови

Штучно згенеровані дані для навчання чи тестів, коли реальних бракує або вони чутливі.

Повʼязані:Тонке налаштування Класифікатор PII (персональні дані)

AI governanceПриватність

Повʼязані:AI Act Людський нагляд (human-in-the-loop)Спостережуваність Запобіжники

TCO (сукупна вартість володіння)Інфраструктура

Повна вартість системи ШІ: не лише впровадження, а й інференс, обслуговування, моніторинг і оновлення.

Повʼязані:Інференс Самостійний хостинг Пілот

Пояснюваність (XAI)Приватність

Здатність показати, чому система ШІ дала певну відповідь чи рішення — протилежність «чорної скриньки».

Повʼязані:Галюцинація Запобіжники Людський нагляд (human-in-the-loop)AI Act

Розбиття на фрагменти (chunking)RAG і пошук

Розрізання документів на фрагменти, які ембедяться і шукаються в RAG.

Повʼязані:RAG (генерація з пошуком)Ембединг (вектор)Контекстне вікно Реранкінг

MCP (Model Context Protocol)Агенти

Відкритий стандарт, що з'єднує моделі й агентів з інструментами та джерелами даних через спільний інтерфейс.

Повʼязані:AI-агент Використання інструментів Запобіжники LLM-роутер

Graph RAG (RAG на графі)RAG і пошук

RAG, що шукає не лише за фрагментами тексту, а й за графом сутностей та зв'язків між ними.

Повʼязані:RAG (генерація з пошуком)Семантичний пошук Векторна база даних Agentic RAG (агентний RAG)

Agentic RAG (агентний RAG)RAG і пошук

RAG, де агент планує пошуки, сам оцінює результати й перепитує, замість одного запиту.

Повʼязані:RAG (генерація з пошуком)AI-агент Graph RAG (RAG на графі)Запобіжники

Семантичний кешІнфраструктура

Кеш, що повертає готову відповідь на питання, схоже за значенням до попереднього.

Повʼязані:Ембединг (вектор)Семантичний пошук Латентність Інференс

КвантизаціяІнфраструктура

Зберігання ваг моделі з меншою точністю, щоб вона вмістилася на слабшому залізі.

Повʼязані:Самостійний хостинг Інференс Латентність Пропускна здатність

LoRA та QLoRAІнфраструктура

Дешевий спосіб донавчити модель — навчає невеликі додатки замість усіх ваг.

Повʼязані:Тонке налаштування Квантизація RAG (генерація з пошуком)Самостійний хостинг

ТемператураОснови

Регулятор випадковості — низька дає стабільні, передбачувані відповіді, висока — креативні.

Повʼязані:Велика мовна модель (LLM)Інференс Структурований вивід Галюцинація

Суміш експертів (MoE)Інфраструктура

Архітектура, у якій на кожен токен активується лише частина моделі.

Повʼязані:Інференс Пропускна здатність Добір моделі (роутинг)Самостійний хостинг

Стрімінг токенівІнфраструктура

Показ відповіді слово за словом, щойно модель її генерує.

Повʼязані:TTFT (час до першого токена)Латентність Консьєрж (асистент)Інференс

Prompt injection (впровадження інструкцій)Агенти

Прихована інструкція у вхідних даних, що має перехопити контроль над моделлю.

Повʼязані:Запобіжники Промпт Використання інструментів

Red teaming (змагальні тести)Агенти

Навмисна атака на власну систему ШІ, щоб знайти діри раніше за інших.

Повʼязані:Prompt injection (впровадження інструкцій)Запобіжники Оцінка агента (golden set)Галюцинація

МультимодальністьОснови

Модель, що розуміє не лише текст, а й зображення, PDF та звук.

Повʼязані:OCR (оптичне розпізнавання тексту)Екстракція даних Мовлення (STT / TTS)Велика мовна модель (LLM)

Мовлення (STT / TTS)Основи

Перетворення мовлення на текст (STT) і тексту на мовлення (TTS) — основа голосового асистента.

Повʼязані:Мультимодальність Консьєрж (асистент)Самостійний хостинг Латентність

Оцінка агента (golden set)Агенти

Вимірювання якості агента на сталому наборі еталонних кейсів, а не «на око».

Повʼязані:Red teaming (змагальні тести)AI-агент Спостережуваність Структурований вивід