// 00Tag · RAG

#RAG

16 Beiträge

RAG (Retrieval-Augmented Generation): wie ein Assistent aus Ihrem Wissen mit Quellenangabe antwortet, statt zu erfinden. Architektur, Qualität, Kosten.

01.06.2026

KI für Anwaltskanzleien: Wo sie hilft und wo nicht

Dokumente, Recherche und Kundenbetreuung machen 80 % der Arbeit in Kanzleien aus – und genau dort spart KI realistisch Zeit. Unter Wahrung der Vertraulichkeit.

01.06.2026

KI im E-Commerce: vom Support bis zu Empfehlungen und Inhalten

Wo KI den Umsatz wirklich steigert und das Team im Online-Shop entlastet – 24/7-Support, passende Angebote, Produktbeschreibungen. Ohne Blabla.

01.06.2026

Aktualisierung und Versionierung von Wissen in RAG

Wie man die Wissensbasis in RAG aktuell hält: Strategien für inkrementelle Reindizierung, Dokumentenversionierung und Erkennung von Wissensdrift in Produktionsumgebungen.

01.06.2026

KI-Chatbot für die Unternehmenswebsite: wie man es richtig umsetzt

Ein KI-Chatbot für die Unternehmenswebsite ist mehr als ein Antwortfenster. Wie man den Ansatz wählt, auf Daten aufbaut und typische Fallstricke bei der Implementierung vermeidet.

01.06.2026

Chunking von Dokumenten für RAG: Wie teilen, damit Retrieval funktioniert

Wie wählt man 2026 die richtige Chunking-Strategie für RAG: feste Größe, recursive, semantisch, Tabellen und Code. Konkrete Größen und Overlap.

01.06.2026

Embeddings für die polnische Sprache: Wie wählt man ein Modell für RAG aus

Wie wählt man ein Embedding-Modell für RAG mit polnischen Dokumenten im Jahr 2026 aus: Kriterien, Vergleich multilingualer und monolingualer Modelle, Evaluation auf eigenen Daten.

01.06.2026

Unternehmens-GPT: KI-Assistent auf Ihrer Wissensbasis

Ein Unternehmens-GPT auf Wissensbasis ist ein RAG-Assistent, der aus Ihren Dokumenten antwortet. Wie man ihn aufbaut, was in der Sicherheitsschicht zu gewährleisten ist und wann er sich rechnet.

01.06.2026

Hybride Suche: Wann BM25 mit Vektoren kombinieren

Hybride Suche BM25 + Vektoren 2026: Wann Semantik bei SKU versagt, wie RRF-Fusion funktioniert und wie man Hybrid Search in einem RAG-System konfiguriert.

01.06.2026

Wie man KI-Halluzinationen im Unternehmen begrenzt

Das Modell kann selbstbewusst erfinden. Wie man erreicht, dass Ihr KI-Assistent auf Fakten basiert antwortet und 'weiß ich nicht' sagt, statt zu erfinden.

01.06.2026

Wie man Unternehmensdaten für AI und RAG vorbereitet

Die Vorbereitung von Daten für AI ist das Fundament jeder Implementierung: Ohne saubere, strukturierte Daten liefert selbst das beste Modell falsche oder erfundene Antworten.

01.06.2026

Wann Fine-Tuning sinnvoll ist (und wann RAG ausreicht)

Fine-Tuning wann sinnvoll: Auswahlkriterien, Kosten und Fallstricke. Wann RAG das Problem günstiger löst und wann Modell-Training der einzige Weg ist.

01.06.2026

RAG oder Fine-Tuning: Wie man einem Modell Unternehmenswissen vermittelt

Zwei Wege zu einem Modell, das Ihr Unternehmen kennt. Wann RAG ausreicht, wann Fine-Tuning nötig ist – und warum meistens RAG.

01.06.2026

Reranking: Wie man die Suchqualität in RAG verbessert

Was ist Reranking in RAG, wann schlägt ein Cross-Encoder ANN und wie baut man eine Suchpipeline, die relevante Fragmente statt nur ähnliche liefert.

01.06.2026

Semantische Suche und Embeddings im Unternehmen

Was sind Embeddings und semantische Suche, wie funktionieren sie in der Praxis und wann lohnt es sich, sie in der Unternehmenswissensdatenbank oder im Produkt einzusetzen.

28.05.2026

Souveräne AI-Infrastruktur: eigene Modelle statt Überraschungsrechnung

Warum self-hosted LLM und RAG auf eigenem Wissen Kontrolle über Kosten, Datenschutz und Anbieter bieten.

18.05.2026

Self-hosted LLM und DSGVO: Wie man KI nutzt, ohne Daten nach außen zu senden

Warum ein eigenes Sprachmodell die DSGVO-Compliance vereinfacht und was sich konkret im Fluss personenbezogener Daten ändert.

← zum Blog