Klient wchodzi na stronę sklepu B2B, przegląda osprzęt elektryczny i wychodzi bez zakupu. Następnego dnia dostaje e-mail z dokładnie tym produktem, który oglądał, uzupełniony o dwa akcesoria, które inni kupujący dodawali do tego samego zamówienia. Konwersja wynosi 18%. Bez tego e-maila byłoby 3%. Ta różnica nie pochodzi z intuicji handlowca, pochodzi z modelu rekomendacji zbudowanego na danych sesji i historii zamówień.
Personalizacja AI nie jest domeną wyłącznie dużych platform e-commerce. Firmy z kilkuset klientami B2B, portale usługowe i sklepy specjalistyczne wdrażają dziś systemy, które trzy lata temu wymagały dedykowanego zespołu data science. Poniżej opisuję, jak to działa od strony architektury, gdzie są pułapki i co realnie kosztuje.
Dwa różne problemy: rekomendacje i personalizacja
#Terminy są często używane zamiennie, ale opisują różne mechanizmy.
Silnik rekomendacji odpowiada na pytanie: „Co jeszcze może zainteresować tego klienta?". Dane wejściowe to historia interakcji (kliknięcia, zakupy, czas na stronie) i cechy produktów. Wyjście to ranking produktów lub treści posortowany malejąco według przewidywanej trafności dla konkretnej osoby lub segmentu.
Personalizacja oferty odpowiada na pytanie: „Jak dopasować komunikat, cenę widełkową lub kolejność kroków do profilu klienta?". Dane wejściowe to segment klienta (branża, rozmiar firmy, etap lejka zakupowego), historia kontaktów i kontekst sesji. Wyjście to zmieniony layout strony, priorytetyzacja sekcji, treść e-maila lub propozycja wartości dopasowana do roli osoby.
Oba systemy mogą działać razem: agent RAG z dostępem do katalogu produktów personalizuje treść rozmowy i jednocześnie pociąga silnik rekomendacji, żeby zaproponować konkretne produkty. Taki duet opisuję w sekcji o architekturze.
Trzy architektury: od najprostszej do pełnego agenta
#Istnieje spektrum rozwiązań różniących się kosztem, możliwościami i złożonością utrzymania.
| Architektura | Jak działa | Kiedy wystarczy | Ograniczenia |
|---|---|---|---|
| Reguły statyczne | Segmenty ręcznie zdefiniowane, dopasowanie if-then | Mało produktów, stabilny katalog, do 500 klientów | Nie skaluje, wymaga ręcznego utrzymania |
| Collaborative filtering | Macierz podobieństwa użytkownik-produkt (ALS, SVD) | E-commerce z historią zakupów, tysiące SKU | Zimny start (nowi klienci, nowe produkty), brak kontekstu sesji |
| Embeddingi + wyszukiwanie semantyczne | Produkty i zapytania jako wektory w przestrzeni BGE-M3, hybrid search | Katalogi z opisami, wyszukiwanie tekstowe, B2B | Wymaga indeksu wektorowego, brak sygnałów behawioralnych |
| Agent AI z pamięcią | LLM z tool-use, RAG na katalogu, historia klienta w kontekście | Złożone konfiguracje, B2B z konsultacją, oferty bespoke | Wyższe koszty tokenów, latencja, wymaga guardrails |
Dla większości firm polskich B2B startujących w 2026 roku optymalnym punktem wejścia są embeddingi z wyszukiwaniem semantycznym uzupełnione o prosty collaborative filtering na historii zakupów. Agent AI ze złożoną pamięcią wchodzi wtedy, gdy proces wymaga wyjaśnienia rekomendacji klientowi lub konfigurowania produktu na żywo.
Dane: co zbierać i jak nie naruszyć RODO
#Każdy silnik rekomendacji jest tak dobry jak dane, na których stoi. Jednocześnie dane behawioralne to obszar, w którym RODO i AI Act mają konkretne wymagania.
Dane jawne (explicit feedback) to oceny, kliknięcia „lubię", listy życzeń. Klient świadomie wyraża preferencję. Prawna podstawa to umowa lub uzasadniony interes, zależnie od kontekstu.
Dane niejawne (implicit feedback) to czas na stronie, głębokość przewijania, porzucone koszyki. Tu potrzebujesz zgody marketingowej lub wyraźnego uzasadnionego interesu udokumentowanego w rejestrze czynności przetwarzania. Zbieranie danych niejawnych bez podstawy prawnej to nie tylko ryzyko RODO, to materiał do audytu AI Act jeśli system podejmuje decyzje wpływające na cenę lub dostęp do oferty.
Dane transakcyjne (historia zamówień) mają najsilniejszą podstawę prawną (wykonanie umowy) i są najwartościowsze dla collaborative filtering. Pamiętaj o anonimizacji lub pseudonimizacji, zanim dane trafią do warstwy modelu, szczególnie jeśli model działa w chmurze.
PII masking przed wysłaniem do LLM jest obowiązkowy. Imię, adres e-mail, NIP klienta nie powinny trafiać do promptu generującego rekomendacje. Model potrzebuje tylko identyfikatora sesji, cech segmentu i historii interakcji. Szczegóły o maskowaniu opisuje artykuł anonimizacja PII przed AI.
Zimny start: co robić, gdy nie masz historii
#Zimny start to sytuacja, w której nowy klient, nowy produkt lub nowa firma zaczyna korzystać z systemu bez żadnej historii. Collaborative filtering tutaj odpada. Trzy podejścia działają w praktyce:
Fallback na popularność segmentową. Nowy klient z branży budowlanej dostaje rekomendacje oparte na tym, co kupowali inni klienci z branży budowlanej w podobnej wielkości firmy. Nie jest personalizowany indywidualnie, ale jest trafniejszy niż lista bestsellerów ogólnych.
Onboarding z pytaniami. Kilka pytań na wejściu (branża, rozmiar firmy, co planujesz rozwiązać) buduje profil startowy bez historii. System traktuje odpowiedzi jak jawne dane preferencji i od razu zwęża przestrzeń rekomendacji.
Content-based filtering na embeddingach. Jeśli klient pyta o konkretny produkt lub wpisuje frazę, system szuka produktów o podobnym znaczeniu semantycznym. Nie potrzebuje historii, bo opiera się na podobieństwie opisów. To podejście działa od pierwszej sesji i naturalnie współpracuje z wyszukiwaniem semantycznym w katalogu.
Guardrails dla rekomendacji: jakie cechy są zakazane
#Silnik rekomendacji może nauczyć się dyskryminować, jeśli dane historyczne odzwierciedlają nierówne traktowanie klientów. To nie jest scenariusz teoretyczny.
Jeśli historyczne dane pokazują, że klienci z pewnych regionów rzadziej dostawali oferty premium (bo handlowcy tak pracowali), model nauczy się tego wzorca i go utrwali. AI Act klasyfikuje systemy oceniające lub różnicujące dostęp do produktów i usług jako potencjalnie wysokiego ryzyka, szczególnie gdy stosują classifier na cechach demograficznych.
Guardrails dla silników rekomendacji obejmują cztery warstwy:
- Denylist cech chronionych. Model nie może używać płci, wieku, narodowości, religii ani podobnych atrybutów jako sygnałów rankingowych. Lista jest zakodowana w konfiguracji, nie zależy od uznania modelu.
- Audit równości wyjść. Co miesiąc sprawdzasz, czy różne segmenty demograficzne dostają porównywalną jakość rekomendacji i dostęp do podobnych ofert.
- Wyjaśnialność na żądanie. Klient lub inspektor może zapytać: „Dlaczego polecono mi ten produkt?". System musi odpowiedzieć przyczytalnymi przesłankami, nie tylko wektorem podobieństwa.
- Human-gate dla cen. Jeśli personalizacja wpływa na cenę (np. widełki oferty dopasowane do segmentu), każda zmiana cennika w silniku musi przejść przez zatwierdzenie człowieka z rolą handlową.
AI Act i RODO: co rekomendacje oznaczają dla compliance
#AI Act (w pełni stosowany od 2025) kategoryzuje systemy rekomendacji i personalizacji zależnie od kontekstu. Większość systemów e-commerce i B2B nie jest automatycznie systemem wysokiego ryzyka. Wyjątki:
- Personalizacja w obszarze finansów (scoring kredytowy, dostęp do produktów finansowych) — Załącznik III AI Act, wysokie ryzyko.
- Rekomendacje rekrutacyjne lub ocena pracowników — Załącznik III, wysokie ryzyko.
- Systemy wpływające na zachowania dużych grup użytkowników z mechanizmem uzależnienia (media społecznościowe, platformy video) — podlegają Art. 5 zakaz praktyk manipulacyjnych.
Dla standardowego e-commerce B2B i portali usługowych rekomendacje są poza kategorią wysokiego ryzyka, ale wymagają: ujawnienia, że rekomendacje są automatyczne (AI Act Art. 50 przejrzystość), dokumentacji procesu (DPIA jeśli dane wrażliwe), i prawa do rezygnacji z profilowania (RODO Art. 22 dla w pełni zautomatyzowanych decyzji).
Szczegółowe obowiązki firm na 2026 opisuje artykuł AI Act i RODO 2026.
Mierzenie skuteczności: KPI, które coś mówią
#Personalizacja bez mierzenia to kosztowny eksperyment bez wniosków. Trzy metryki, które warto śledzić od pierwszego dnia produkcyjnego:
Click-through rate (CTR) rekomendacji — ile procent wyświetlonych rekomendacji prowadzi do kliknięcia. Punkt odniesienia to CTR przed personalizacją lub CTR grupy kontrolnej (A/B test). Wzrost CTR o 20-40% po wdrożeniu embeddingów jest typowy dla pierwszego zakresu.
Uplift przychodów na sesję — różnica w wartości koszyka między sesjami z aktywną personalizacją a sesjami bez (lub z grupą kontrolną). To liczba dla zarządu. Przy poprawnym A/B teście z grupą kontrolną uplift 8-15% na sesję jest realnym celem po 6-8 tygodniach.
Coverage — procent produktów w katalogu, które pojawia się w rekomendacjach dla co najmniej jednego użytkownika w ciągu miesiąca. Niski coverage (poniżej 30%) sygnalizuje popularity bias: model rekomenduje te same bestsellery wszystkim, ignorując długi ogon katalogu.
Monitoring silnika rekomendacji ma podobną strukturę do monitoringu agenta AI opisanego w artykule o monitoringu KPI agenta AI — cztery warstwy, golden set i alerty na dryft.
Wypróbuj na żywo
#Opisz swój katalog produktów lub usług i obecny sposób segmentacji klientów, a model wskaże, od jakiej architektury warto zacząć i jakie dane są kluczowe (playground: PII maskowane, zero retencji):
FAQ
#Czy personalizacja AI nadaje się dla małej firmy B2B?
#Tak, ale punkt wejścia powinien być proporcjonalny do skali. Dla firmy z kilkuset klientami i stabilnym katalogiem często wystarczy wyszukiwanie semantyczne na embeddingach i prosta logika „klienci z Twojej branży kupowali też...". Pełny collaborative filtering z modelem rankingowym ma sens od kilku tysięcy klientów lub kilkuset tysięcy transakcji. Oceń swój stan wyjścia kalkulatorem ROI zanim zaangażujesz budżet na warstwę AI.
Jak długo trwa wdrożenie silnika rekomendacji?
#Zależy od jakości danych wyjściowych i wybranej architektury. Pilot oparty na embeddingach i wyszukiwaniu semantycznym na istniejącym katalogu: zwykle 3-5 tygodni od audytu danych do pierwszej wersji produkcyjnej. Pełny system z collaborative filtering, A/B testem i guardrails: 8-14 tygodni. Terminy przesuwają się najczęściej z powodu jakości danych źródłowych (brakujące opisy produktów, niespójne kategorie), nie z powodu modeli. Plan działania krok po kroku opisuje artykuł plan wdrożenia AI.
Jakie dane o klientach potrzebuję do personalizacji?
#Najbardziej wartościowe to historia transakcji (co kupiono, kiedy, w jakiej kombinacji) i dane behawioralne za zgodą (kliknięcia, czas na stronie, wyszukiwania). Możesz zacząć tylko od historii zamówień i cech produktów, bez żadnych danych behawioralnych. Collaborative filtering na danych transakcyjnych daje zaskakująco dobre wyniki przy stosunkowo ubogim zestawie danych wejściowych. Zanim cokolwiek wyślesz do modelu, zaplanuj masowanie PII zgodnie z wytycznymi anonimizacji.
Jak uniknąć popularyzacji bestselerów kosztem reszty katalogu?
#Popularity bias to najczęstszy problem pierwszych wdrożeń. Trzy korekty: (1) cap na częstotliwość bestsellera w rekomendacjach per sesja (np. maksymalnie 1 z top-10 popularności w zestawie 5 rekomendacji); (2) diversity penalty w funkcji rankingowej promującej produkty z różnych kategorii; (3) exploration quota rezerwująca jedno miejsce w zestawie na produkt, który klient nigdy nie oglądał, ale który jest semantycznie podobny. Coverage jako metryka miesięczna automatycznie ujawni, czy te mechanizmy działają.
Czy agent AI może zastąpić klasyczny silnik rekomendacji?
#Częściowo. Agent LLM z dostępem do katalogu przez RAG dobrze radzi sobie z wyjaśnianiem rekomendacji i konfigurowaniem produktów na żywo w rozmowie. Gorzej radzi sobie z przetwarzaniem setek tysięcy sygnałów behawioralnych potrzebnych do collaborative filtering. Optymalna architektura łączy oba: klasyczny model rankingowy generuje kandydatów, agent LLM wybiera spośród nich i formułuje uzasadnienie czytelne dla klienta. Artykuł agent AI vs chatbot opisuje granicę możliwości obu podejść.