Die Rechtsabteilung eines mittleren Produktionsunternehmens erhält monatlich zwischen 40 und 120 Verträge zur Prüfung: NDAs, Verträge mit Lieferanten, Anhänge, Bestellungen. Die meisten sind Standarddokumente, in denen der Jurist Abweichungen vom firmeneigenen Muster sucht. Das seitenweise Lesen kostet monatlich mehrere Dutzend Stunden, die sich verkürzen lassen, wenn AI die erste Durchsicht übernimmt und Stellen markiert, die Aufmerksamkeit erfordern.
Wir bei Cashcrown analysieren diese Muster seit einigen Jahren. Im Folgenden beschreiben wir, was funktioniert, wo die harten Grenzen liegen und wie eine Architektur aussieht, die kein regulatorisches Risiko schafft.
Triage und Vertragsprüfung
#Triage ist der erste Schritt: Bevor der Jurist eine Datei öffnet, klassifiziert das System das Dokument nach Typ (NDA, Rahmenvertrag, Bestellung, Anhang), Priorität und Abweichungsgrad vom Muster.
Der Klassifikator ordnet das Dokument anhand des Inhalts einer Kategorie zu, nicht nach dem Dateinamen. Das ist wichtig, weil Lieferanten Verträge oft uneindeutig benennen oder als Scans ohne Titel hochladen.
Nach der Klassifizierung vergleicht das System die Klauseln mit dem firmeneigenen Vertragsmuster des jeweiligen Typs. Abweichungen landen auf einer Prüfliste mit Seitenzahl und Risikobewertung (niedrig / mittel / hoch nach zuvor definierten Kriterien). Der Jurist sieht zuerst das, was sich wirklich vom Standard unterscheidet, nicht den gesamten Text von Anfang an.
Die harte Grenze liegt hier: AI zeigt Abweichungen an, bewertet aber nicht, ob die Abweichung im Kontext dieser konkreten Geschäftsbeziehung, der Verhandlungsgeschichte und der Unternehmensprioritäten akzeptabel ist. Das ist eine rechtliche Einschätzung und obliegt dem Juristen.
Extraktion von Klauseln und Nachverfolgung von Verpflichtungen
#Die Datenextraktion aus Verträgen ist einer der ausgereiftesten Anwendungsfälle von AI im Recht. Verträge haben eine vorhersehbare Struktur, wiederholbare Klauseln und definierte Felder, die extrahiert werden müssen: Gültigkeitsdaten, Kündigungsfristen, Vertragsstrafen, Wertgrenzen, Vertragsparteien, Gerichtsstand.
Für die interne Rechtsabteilung ist das Verzeichnis der Verpflichtungen und Fristen am wertvollsten. Das System erstellt nach der Durchsicht des Vertragsportfolios eine Tabelle mit Ablaufdaten, Kündigungsfristen und wiederkehrenden Verpflichtungen (z. B. Berichtspflicht quartalsweise). Eine Warnung geht 30–60 Tage vor Fristablauf an den Juristen oder Prozessverantwortlichen.
Einige Einschränkungen, die wir in Piloten beobachten:
- Fristen, die wörtlich statt mit Daten angegeben sind (z. B. „sechs Monate ab Unterzeichnungstag“), erfordern eine separate Berechnungslogik und benötigen oft eine Überprüfung, da das Unterzeichnungsdatum möglicherweise nicht im digitalen Dokument enthalten ist.
- Verträge mit Klauseln zum bedingten Erlöschen (z. B. „der Vertrag erlischt, wenn Bedingung X erfüllt ist“) werden vom System markiert, statt selbst interpretiert zu werden. Dieses Verhalten ist korrekt.
- Anhänge ohne vollständigen Text des geänderten Dokuments führen zu unvollständiger Extraktion. Der Index muss den Hauptvertrag und alle Anhänge als ein Quelldokument verknüpfen.
Der Jurist überprüft die Extraktion für Klauseln mit „geringer Sicherheit“ und genehmigt das Verzeichnis, bevor die Daten in das Fristenüberwachungssystem übernommen werden.
RAG für Unternehmensdokumente: Assistent für interne Richtlinien
#Die interne Rechtsabteilung beantwortet auch interne Fragen: Darf ein NDA mit einem Unternehmen aus Jurisdiktion X unterzeichnet werden? Wie lautet die Unternehmensrichtlinie zum Wettbewerbsverbot? Was sagt die interne Beschaffungsordnung zu Genehmigungsschwellen?
Das ist repetitive und ablenkende Arbeit. RAG auf Unternehmensdokumenten (Richtlinien, Vertragsmuster, Compliance-Vorgaben) ermöglicht es Mitarbeitern und Managern, Antworten auf allgemeine Fragen zu erhalten, ohne den Juristen einzubinden – mit Verweis auf das konkrete Dokument und den Paragrafen.
Wesentliche technische Anforderungen:
Quellenangabe ist Pflicht. Eine Antwort ohne Verweis auf ein konkretes Dokument und einen Paragrafen signalisiert, dass das Modell allgemeines Wissen generiert, statt Unternehmensdokumente zu zitieren. Ein solches Ergebnis sollte in die Eskalationswarteschlange gehen, nicht zum Nutzer.
Guardrails blockieren Fragen zur rechtlichen Interpretation. Wenn die Frage lautet „Dürfen wir den Vertrag in dieser Situation kündigen?“, antwortet das System, was das Dokument besagt, und fügt eine Eskalation zum Juristen für Fragen hinzu, die eine rechtliche Einschätzung erfordern. RAG beantwortet „Was sagen unsere Dokumente?“, nicht „Was sollten wir tun?“.
Halluzinationen sind im rechtlichen Kontext besonders gefährlich. Eine Antwort, die wie ein Zitat aus einer Richtlinie aussieht, aber eine Erfindung des Modells ist, kann zu falschen Entscheidungen führen. Das Muster, das wir anwenden: Jede Antwort enthält ein wörtliches Zitat aus dem Originalfragment und ermöglicht dem Nutzer, zur Quelle zu springen. Existiert das Fragment nicht im Index, antwortet das System „Ich weiß es nicht“ und eskaliert.
Aufgabenvergleich: Was AI selbstständig erledigt, was den Juristen erfordert
#| Aufgabe | Rolle der AI | Rolle des Juristen |
|---|---|---|
| Klassifizierung und Triage von Dokumenten | selbstständig (mit Log) | stichprobenartige Überprüfung |
| Erkennung von Abweichungen vom Muster | selbstständig (mit Markierung) | Bewertung der Akzeptanz der Abweichung |
| Extraktion von Daten, Fristen, Strafen | selbstständig (mit Sicherheitseinschätzung) | Überprüfung bei geringer Sicherheit und Bedingungen |
| Verzeichnis der Verpflichtungen und Alerts | selbstständig | quartalsweise Genehmigung des Verzeichnisses |
| Antworten auf Fragen zu Richtlinien | selbstständig (mit Zitat) | Eskalation von Fragen zur Interpretation |
| Rechtliche Risikobewertung | nein | ja, immer |
| Rechtsberatung und Vertragsfreigabe | nein | ja, immer |
| Verhandlungen und Vertretung | nein | ja, immer |
Diese Tabelle beschreibt das Muster, das sich aus dem in unseren Piloten wiederholt angewandten Human-Oversight-Ansatz ergibt. AI liefert das Material; der Mensch entscheidet überall dort, wo die Entscheidung rechtliche oder finanzielle Bedeutung hat.
Live ausprobieren
#RODO und DPIA bei Dokumenten mit personenbezogenen Daten
#Firmenverträge enthalten personenbezogene Daten der Vertragsparteien: Namen, Positionen, PESEL-Nummern bei Arbeits- oder B2B-Verträgen, Kontaktdaten, manchmal Gehaltsinformationen in Anhängen. Die Verarbeitung dieser Daten durch ein AI-System erfordert eine Rechtsgrundlage und technische Maßnahmen.
Zwei Anforderungen, ohne die wir keinen Piloten starten:
PII-Maskierung vor der Indizierung. Personenbezogene Daten, die natürliche Personen identifizieren, werden maskiert oder tokenisiert, bevor Dokumentenfragmente in die Vektordatenbank gelangen. Das Modell sieht die Bezeichnung „NATÜRLICHE_PERSON_1“ statt eines konkreten Namens. Die Zuordnung von Tokens zu echten Daten wird außerhalb des Index gespeichert, mit Zugriffskontrolle und Operationslog.
Isolierung pro Vertrag oder Projekt. Der Index mit Verträgen eines bestimmten Kunden oder Projekts ist physisch von anderen getrennt. Eine Frage, die im Kontext eines Projekts gestellt wird, greift nicht auf Dokumente eines anderen Projekts zu.
Wenn das System Arbeitsverträge, medizinische Daten oder andere besondere Kategorien verarbeiten soll, ist vor dem Start eine DPIA erforderlich. Für Standard-Handelsverträge mit Kontaktdaten reicht ein Verzeichnis der Verarbeitungstätigkeiten und Informationsklauseln gegenüber den Personen, deren Daten in den Dokumenten enthalten sind.
Die detaillierten regulatorischen Pflichten für AI-Systeme, die Firmendokumente verarbeiten, behandelt der Artikel AI Act und RODO 2026. Technische Muster zur RODO-Konformität bei AI-Einführungen finden Sie in Daten-Governance für AI.
Pilot: Wie starten ohne Risiko
#Piloten, die wir als erfolgreicher beobachtet haben, begannen mit einem engen Anwendungsfall, statt zu versuchen, die gesamte Abteilung auf einmal zu automatisieren.
Ein guter Startpunkt ist ein Dokumententyp mit hoher Wiederholungsrate, z. B. NDAs von neuen Lieferanten. Pilotumfang: Klassifizierung (ob es sich um ein NDA handelt), Extraktion von 5–7 Feldern (Parteien, Datum, Gültigkeitsdauer, Vertraulichkeitsklauseln, Gerichtsstand), Vergleich mit dem firmeneigenen NDA-Muster und Erkennung von Abweichungen.
In den ersten 4–8 Wochen überprüft der Jurist 100 % der AI-Ergebnisse. Das ermöglicht die Kalibrierung der Sicherheitsschwellen, das Auffinden von Abweichungstypen, die das Modell nicht erkennt, und den Aufbau eines Goldstandards für die Qualitätsbewertung.
Der Artikel AI für Anwaltskanzleien beschreibt ein ähnliches Einführungsmuster für externe Umgebungen; viele Empfehlungen zu Vertraulichkeit und Pilotierung gelten direkt für interne Rechtsabteilungen. Eine breitere Architektur zur Dokumentenanalyse, einschließlich Due Diligence, behandelt AI zur Dokumentenanalyse.
Bei internen Piloten lohnt es sich, früh mit der IT-Abteilung das Zugriffsmodell abzustimmen: Wer hat Zugriff auf den Index, wie werden Operationen protokolliert und ob Auftragsverarbeitungsverträge mit Infrastruktur-Anbietern unterzeichnet sind. Ein Muster für Auftragsverarbeitungsverträge behandelt der Artikel Auftragsverarbeitungsvertrag für AI-Daten.
FAQ
#Kann AI Verträge selbstständig freigeben?
#Nein. Die Freigabe eines Vertrags ist eine rechtliche und geschäftliche Entscheidung, die dem Menschen obliegt. AI bereitet das Material vor: Sie klassifiziert das Dokument, extrahiert Klauseln, zeigt Abweichungen vom Muster an und markiert Risiken. Die endgültige Entscheidung über die Unterzeichnung oder Ablehnung eines Vertrags erfordert die Bewertung des Transaktionskontexts, der Beziehung zur Vertragspartei und der Unternehmensprioritäten – etwas, das AI nicht kennt und nicht bewerten kann.
Wie kommt AI mit polnischsprachigen Verträgen und juristischer Fachterminologie zurecht?
#Moderne mehrsprachige Modelle beherrschen die polnische Sprache ohne zusätzliches Fine-Tuning. Die Präzision der Extraktion für polnische Verträge ist höher, wenn die Vektordatenbank Dokumente aus derselben Domäne und firmeneigene Vertragsmuster enthält. Für sehr spezielle Klauseln (z. B. aus dem Vergaberecht oder Bankrecht) lohnt es sich, den Recall an einem Testset mit eigenen Dokumenten vor der produktiven Einführung zu bewerten.
Was tun, wenn AI eine Klausel nicht findet, die im Dokument steht?
#Dieses Risiko sollte als Recall an einem zuvor annotierten Testset gemessen werden. Fällt der Recall für kritische Klauseln (Fristen, Vertragsstrafen) unter 90–95 %, liegt das Problem meist in der Art der Dokumentenaufteilung (Chunking) oder darin, dass die Klausel eine nicht standardisierte Formulierung verwendet. Die Lösung besteht darin, das Trainingsbeispielset für den Klassifikator zu erweitern oder das Chunking an die Struktur Ihrer Dokumente anzupassen. Während des gesamten Systembetriebs sollte die Überprüfung von Klauseln mit kritischer Bedeutung beim Juristen bleiben.
Kann die interne Rechtsabteilung eine Cloud-API nutzen oder ist Self-Hosting erforderlich?
#Das hängt von der Sensibilität der Dokumente ab. Verträge, die personenbezogene Daten oder durch NDA und Geschäftsgeheimnisse geschützte Informationen enthalten, sollten lokal oder mit PII-Maskierung vor dem Versand an eine externe API verarbeitet werden. Für interne Dokumente ohne personenbezogene Daten ist eine Cloud-API zulässig, wenn der Anbieter einen Auftragsverarbeitungsvertrag unterzeichnet hat und keine Prompt-Retention deklariert. Die Entscheidung sollte vor dem Start mit dem Datenschutzbeauftragten (DPO) abgestimmt werden.
Wie lange dauert die Einführung eines Piloten für die interne Rechtsabteilung?
#Ein Pilot für einen Dokumententyp dauert in der Regel 3–6 Wochen: eine Woche für die Aufnahme und Indizierung eines Testsets (100–300 Verträge), eine Woche für die Konfiguration der Guardrails und Kalibrierung der Sicherheitsschwellen, 2–4 Wochen für die Überprüfung der Ergebnisse mit Juristen. Die Erweiterung auf weitere Dokumententypen und die Integration in ein Vertragsmanagement-System (CLM oder DMS) dauert je nach Umfang 2–3 Monate. Die Bewertung der Prozessreife für die Automatisierung führt das Tool Reifegradbewertung durch.