Die Rechtsabteilung eines polnischen Produktionsunternehmens erhält einen 200-seitigen Vertrag von einem japanischen Auftragnehmer zur Übersetzung. Frist: 48 Stunden. Ein externes Übersetzungsbüro veranschlagt dafür vier Wochen und mehrere tausend Zloty. Der interne Englisch-Übersetzer kommt mit dem Fließtext zurecht, aber die technische Terminologie der Branche und spezifische Vertragsklauseln liegen außerhalb seiner Kompetenzen.
Dieses Szenario wiederholt sich in Hunderten von Unternehmen. KI für Übersetzungen ersetzt Übersetzer nicht, sondern verändert den Umfang ihrer Arbeit: Das Modell übernimmt 80-90% der Vorübersetzung, der Spezialist prüft und korrigiert, und das Ganze ist in einem Bruchteil der ursprünglichen Zeit fertig.
Wodurch sich eine unternehmensinterne Übersetzungs-Pipeline von Google Translate unterscheidet
#Google Translate und DeepL sind allgemeine Tools. Sie funktionieren gut für Standardtexte, haben aber drei systematische Probleme im Unternehmenskontext.
Erstens: fehlende Kenntnis der internen Terminologie. Ein Produktionsunternehmen hat eigene Produktnamen, technologische Prozesse und Abkürzungen, die in keinem allgemeinen Wörterbuch existieren. Die Übersetzung von „Vormontage der Baugruppe C-27“ durch ein allgemeines Modell liefert ein zufälliges Ergebnis.
Zweitens: fehlende Konsistenz zwischen Dokumenten. Wenn zwei Abteilungen dieselbe Prozedur unabhängig voneinander mit Google Translate übersetzen, können sie unterschiedliche Versionen derselben Terminologie erhalten. In technischer Dokumentation oder Verträgen ist das ein Problem.
Drittens: DSGVO. Das Einfügen von Dokumenten mit Kundendaten, Mitarbeiterdaten oder Partnerdaten in eine externe API stellt potenziell einen Verstoß gegen Art. 28 DSGVO dar (fehlender Auftragsverarbeitungsvertrag). Die meisten Unternehmen tun dies unwissentlich.
Eine unternehmensinterne Übersetzungs-Pipeline löst diese drei Probleme durch eine Kombination aus: firmeneigenem Glossar in RAG, stilistischen und formatierungsbezogenen Anweisungen im System-Prompt sowie Self-Hosting von Modellen für sensible Dokumente.
Architektur eines unternehmensinternen KI-Übersetzungssystems
#Eingabedokument (PDF/DOCX/HTML/Text)
│
▼
[Parsing und Segmentierung — Chunks für die Übersetzung]
│
▼
[PII-Maskierung — lokal, vor dem Verlassen der Infrastruktur]
│
▼
[RAG-Lookup — firmeneigenes Glossar und domänenspezifische Terminologie]
│
▼
[LLM mit terminologischem Kontext und Stilanweisung]
│
▼
[Guardrails — Terminologiekonsistenz, fehlende Fragmente]
│
▼
[Zusammenführung und Formatierung des Ausgabedokuments]
│
▼
Übersetzung zur Prüfung durch einen Spezialisten
Der Schlüsselbestandteil ist das firmeneigene Glossar. Es speichert terminologische Paare (PL→EN, PL→DE usw.) zusammen mit dem Verwendungskontext. Vor der Übersetzung jedes Segments sucht das System relevante Begriffe durch semantische Suche und fügt sie dem Prompt als verbindliche Terminologie hinzu. Das Modell weiß dann, dass „C-27“ ein Eigenname des Produkts ist und kein chemischer Code.
Das Glossar ist lebendig: Jedes Mal, wenn ein Übersetzer einen Begriff korrigiert, fließt die Korrektur zurück in den Index. Das System lernt aus jeder Korrektur ohne erneutes Training des Modells.
Welche Dokumente und Inhalte eignen sich als Erstes
#Nicht alle Dokumente haben dasselbe Risiko- und Schwierigkeitsprofil. Die Implementierung sollte mit Kategorien beginnen, bei denen der ROI hoch und das Fehlerrisiko gering ist.
| Dokumenttyp | Übersetzungsschwierigkeit | Fehlerrisiko | Zeitersparnis | Empfehlung für den Start |
|---|---|---|---|---|
| FAQ, Wissensdatenbank, internes Wiki | Niedrig | Niedrig | 60-80% | Ja — höchste Priorität |
| Produktbeschreibungen und Marketingmaterialien | Niedrig-mittel | Niedrig-mittel | 50-70% | Ja — höchste Priorität |
| Technische Dokumentation (Anleitungen, Verfahren) | Mittel | Mittel | 40-60% | Ja — nach Stabilisierung des Glossars |
| Verträge und rechtliche Dokumente | Hoch | Hoch | 30-50% | Mit rechtlicher Prüfung — nicht als Start |
| Kundenkorrespondenz | Niedrig | Niedrig | 50-70% | Ja, mit Prüfung vor dem Versand |
| Finanzdokumentation und Berichte | Hoch | Hoch | 20-40% | Nur Vorübersetzung, Revision obligatorisch |
Rechtliche und finanzielle Dokumente erfordern unabhängig von der Qualität des Modells eine Prüfung durch einen Spezialisten. Human-Gate vor dem Versand ist hier eine Pflicht, keine Option.
Qualität von KI-Übersetzungen: wie man sie realistisch misst
#BLEU-Score und andere automatische Metriken sagen wenig über die Qualität im Unternehmenskontext aus. Zwei Unternehmen mit demselben BLEU-Score können völlig unterschiedliche Zufriedenheitsniveaus bei Übersetzern aufweisen.
Metriken, die praktische Bedeutung haben:
Post-Editing-Rate (PE rate): Wie viel Prozent der Sätze hat der Übersetzer nach Erhalt der Vorübersetzung geändert. Für ein gutes System mit firmeneigenem Glossar ist eine PE-Rate unter 20% für Standardtexte erreichbar. Über 40% ist ein Signal, dass entweder das Glossar unzureichend ist oder die stilistische Anweisung überarbeitet werden muss.
Terminologiekonsistenz: Wie viel Prozent der firmeneigenen Begriffe wurden gemäß dem Glossar übersetzt. Automatisch messbar durch Vergleich mit dem Glossar nach der Übersetzung.
Zeit bis zur Akzeptanz: Wie viel Zeit verbringt der Übersetzer mit einem von KI übersetzten Dokument im Vergleich zu einem von Grund auf übersetzten Dokument. Die reale Zeitersparnis, gemessen über mehrere Wochen, liefert die Grundlage für die ROI-Berechnung.
Ablehnungsrate: Wie viele Dokumente hat der Übersetzer zur erneuten Übersetzung durch das Modell zurückgeschickt (anstatt sie selbst zu bearbeiten). Eine hohe Ablehnungsrate signalisiert Probleme mit der Anpassung des Modells an den Stil oder das Sprachpaar.
Systeme mit Observability zeigen diese Metriken pro Sprachpaar, pro Dokumentkategorie und pro Datei an. Nach 3-4 Wochen wird sichtbar, wo die Investition in das Glossar den größten Effekt bringt.
Lokalisierung vs. Übersetzung: ein wichtiger Unterschied
#Übersetzung bedeutet die Übertragung von Inhalten in eine andere Sprache. Lokalisierung bedeutet die Anpassung von Inhalten an Kultur, rechtlichen Kontext und Erwartungen des Zielmarktes. Unternehmen, die diese beiden Prozesse verwechseln, erhalten eine technisch korrekte Übersetzung, die jedoch nicht verkauft und nicht engagiert.
Beispiele:
- Ein aus dem Polnischen ins Englische für den britischen Markt übersetztes Marketingmaterial kann Witze oder kulturelle Anspielungen enthalten, die für ein britisches Publikum nicht funktionieren.
- Eine auf Deutsch übersetzte Geschäftsbedingung kann sprachlich korrekt sein, berücksichtigt jedoch nicht die Besonderheiten des Verbraucherrechts in Deutschland.
- In PLN angegebene Preise, die mit einem Rechner in EUR umgerechnet werden, entsprechen möglicherweise nicht den realen Marktpreisen.
KI kommt mit der Übersetzung gut zurecht. Lokalisierung erfordert einen zusätzlichen Schritt: entweder eine systemische Anweisung mit kulturellen Richtlinien pro Markt oder eine Prüfung durch einen Muttersprachler mit Kenntnis des lokalen Marktes. Eine KI-Übersetzungs-Pipeline kann kulturelle Anweisungen für bekannte Märkte integrieren, aber die endgültige Entscheidung über die kulturelle Anpassung sollte beim Menschen liegen.
DSGVO, AI Act und personenbezogene Daten in Übersetzungen
#Die Übersetzung von Unternehmensdokumenten ist ein häufiger Vektor für unwissentliche Verstöße gegen die DSGVO. Dokumente enthalten personenbezogene Daten von Kunden, Mitarbeitern und Auftragnehmern. Das Senden dieser Daten an eine externe API ohne Auftragsverarbeitungsvertrag (Art. 28 DSGVO) ist ein Verstoß.
Vier technische Anforderungen für konforme Übersetzungssysteme:
PII-Maskierung vor der Übersetzung: Namen, Adressen, PESEL-Nummern, Ausweisnummern, E-Mail-Adressen werden vor dem Senden des Textes an das Modell durch Token ersetzt. Nach der Übersetzung werden die Token wieder ersetzt. Presidio oder spaCy NER können dies lokal erledigen.
Self-Hosting für sensible Dokumente: Verträge, HR-Dokumente, Kundenkorrespondenz sollten niemals ohne PII-Maskierung und Auftragsverarbeitungsvertrag an externe APIs gesendet werden. Lokale Modelle (über Ollama auf der eigenen Infrastruktur) eliminieren dieses Problem für Sprachpaare, bei denen die Qualität des lokalen Modells ausreichend ist.
Protokolle mit minimalem PII: Das System protokolliert Metadaten der Übersetzung (Sprachpaar, Zeit, Anzahl der Token, Ergebnis der Guardrails), nicht den Inhalt des Dokuments. Bei Anfragen auf Datenzugriff oder -löschung ist es möglich, die Übersetzungssitzung mit dem Benutzer zu verknüpfen, ohne den Inhalt zu speichern.
DPIA für sensible Kategorien: Medizinische Dokumente, Dokumente mit genetischen oder biometrischen Daten, Dokumente zu politischen Ansichten oder Glaubensbekenntnissen erfordern eine DPIA vor der Implementierung der Übersetzungs-Pipeline. Die Pflichten von Unternehmen im Jahr 2026 in Bezug auf AI Act und DSGVO behandelt der Artikel AI Act und DSGVO 2026.
Integration mit bestehenden Tools
#Eine unternehmensinterne Übersetzungs-Pipeline ist nur dann wertvoll, wenn sie in bestehende Prozesse integriert ist. Übersetzer sollten Texte nicht manuell in eine Oberfläche kopieren und zurück.
Typische Integrationspunkte:
Plugin für MS Word / Google Docs: Text markieren, auf „Firmenübersetzung“ klicken, das Ergebnis erscheint im Dokument mit der Möglichkeit zur Annahme oder Ablehnung. Integration über API, Plugin einfach zu erstellen.
Integration mit CMS: Für Unternehmen, die Inhalte auf der Website übersetzen, kann die Pipeline automatisch die Übersetzung nach der Veröffentlichung des Inhalts in der Basissprache starten. Nach menschlicher Prüfung wird der Inhalt in weiteren Sprachen veröffentlicht.
Webhook bei neuen Dokumenten: n8n oder ein ähnlicher Automatisierungsagent überwacht einen Ordner mit zu übersetzenden Dokumenten, startet die Pipeline und sendet das Ergebnis an den Übersetzer mit der Bitte um Prüfung.
Integration mit ERP- oder DMS-System: Für Unternehmen mit großen Dokumentenvolumina eliminiert eine direkte API zwischen dem Dokumentenmanagementsystem und der Übersetzungs-Pipeline manuelle Schritte.
Jede Integration sollte das Prinzip Human-Gate wahren: Die KI-Übersetzung ist eine Arbeitsversion, kein fertiges Dokument. Das automatische Versenden einer Übersetzung an den Kunden ohne Prüfung ist ein reputatives und rechtliches Risiko.
Kosten und Rentabilität
#Die Kosten hängen vom Dokumentenvolumen, den Sprachpaaren und der gewählten Architektur ab. Ein Pilotprojekt für ein Sprachpaar (z. B. PL→EN) und eine Dokumentkategorie (z. B. Produktbeschreibungen) dauert in der Regel 3-6 Wochen und hat eine deutlich niedrigere Einstiegshürde als ein vollwertiges mehrsprachiges System.
Orientierungshinweise für einen positiven ROI:
- Das Unternehmen lässt monatlich mehr als 50 Seiten extern oder intern übersetzen.
- Die Zeit von der Dokumentenannahme bis zur fertigen Übersetzung beträgt mehr als 3 Arbeitstage.
- Die Terminologie ist zwischen Abteilungen oder zwischen Sprachversionen desselben Dokuments inkonsistent.
- Übersetzer verbringen mehr als 30% ihrer Zeit mit der Suche und Vereinheitlichung von Terminologie statt mit Übersetzungen.
Der ROI-Rechner ermöglicht die Eingabe realer Zahlen und zeigt die geschätzte Amortisationszeit. Der Automatisierungsfinder zeigt, welche Übersetzungsprozesse im Unternehmen das höchste Automatisierungspotenzial haben.
Live ausprobieren
#Beschreiben Sie Ihren aktuellen Übersetzungsprozess und den Dokumenttyp, und das Modell schlägt die Pipeline-Architektur und Implementierungsprioritäten vor (Playground: PII maskiert, keine Speicherung):
FAQ
#Wird KI für Übersetzungen Übersetzer im Unternehmen ersetzen?
#Nicht in naher Zukunft, insbesondere nicht für Dokumente mit hohen rechtlichen oder finanziellen Konsequenzen. KI übernimmt die Vorübersetzung und Standardisierung der Terminologie, während sich der Übersetzer auf das Post-Editing, die kulturelle Lokalisierung und die inhaltliche Prüfung konzentriert. In Unternehmen mit regelmäßigem Übersetzungsvolumen bedeutet dies, dass ein Übersetzer ein Vielfaches des Volumens bewältigen kann. Bei einfachen Dokumenten (FAQ, Produktbeschreibungen, internes Wiki) kann sich die Rolle des Menschen auf eine schnelle Prüfung beschränken, anstatt eine vollständige Übersetzung von Grund auf zu erstellen.
Wie wird die Konsistenz der Terminologie bei KI-Übersetzungen sichergestellt?
#Durch ein firmeneigenes Glossar, das in die RAG-Pipeline integriert ist. Das Glossar enthält terminologische Paare mit Verwendungskontext (z. B. „Vormontage“ → „pre-assembly“, Kontext: Produktion) und wird vor jedem Übersetzungssegment semantisch durchsucht. Jede Korrektur des Übersetzers fließt als neues Beispiel in das Glossar zurück. Nach einigen Wochen arbeitet das System mit der Terminologie, die das Unternehmen tatsächlich verwendet, und nicht mit der aus einem allgemeinen Wörterbuch. Die Konsistenz zwischen Dokumenten verschiedener Abteilungen und aus unterschiedlichen Zeiträumen verbessert sich deutlich.
Sind KI-Übersetzungen DSGVO-konform?
#Das hängt von der Architektur ab. Das Senden von Dokumenten mit personenbezogenen Daten an externe APIs ohne Auftragsverarbeitungsvertrag (Art. 28 DSGVO) ist nicht konform. Eine konforme Pipeline erfordert: PII-Maskierung vor der Übersetzung, einen DPA-Vertrag mit dem API-Anbieter, wenn Cloud-Modelle genutzt werden, oder Self-Hosting von Modellen für sensible Dokumente. Für Dokumente mit besonderen Kategorien von Daten (medizinische, finanzielle, HR-Daten) ist vor der Implementierung eine DPIA erforderlich.
Welche Sprachpaare werden von KI am besten unterstützt?
#Die höchste Qualität von KI-Übersetzungen wird für Paare mit einer großen Menge an Trainingsdaten erreicht: Englisch, Spanisch, Französisch, Deutsch, Chinesisch, Arabisch, Italienisch, Portugiesisch. Polnische Übersetzungen in Paaren mit Englisch und Deutsch sind für die meisten verfügbaren Modelle auf hohem Niveau. Paare mit selteneren Sprachen oder sehr spezialisierter Terminologie erfordern mehr Arbeit am Glossar und erreichen häufiger eine höhere Post-Editing-Rate. Für Sprachpaare mit geringer Qualität allgemeiner Modelle lohnt es sich, spezialisierte Modelle in Betracht zu ziehen oder das Glossar mit Beispielen aus den relevanten Dokumenten anzureichern. Ein detaillierter Ansatz für Systeme, die mehrere Sprachen unterstützen, wird im Artikel Mehrsprachiger KI-Assistent beschrieben.
Wo sollte man mit der Implementierung von KI-Übersetzungen im Unternehmen beginnen?
#Mit einer Volumenprüfung: Wie viele Seiten übersetzt das Unternehmen monatlich, in welchen Sprachpaaren, welche Dokumenttypen dominieren. Anschließend eine Bewertung des Glossars: Hat das Unternehmen ein bestehendes Terminologie-Wörterbuch? Selbst eine Excel-Tabelle mit 200 Einträgen ist ein guter Ausgangspunkt für den Aufbau eines RAG auf der Terminologie. Der Pilot beginnt mit einem Sprachpaar und einer Dokumentkategorie mit geringem Risiko (FAQ, Produktbeschreibungen). Nach 4-6 Wochen liegen reale Daten zur Post-Editing-Rate und Amortisationszeit vor, bevor skaliert wird. Die Methodik des gesamten Implementierungsprozesses von KI im Unternehmen ist im Artikel Schritt-für-Schritt-Plan zur KI-Implementierung beschrieben.