Das größte DSGVO-Problem bei KI ist nicht das Modell selbst, sondern der Datenfluss. Wenn eine Anfrage mit personenbezogenen Daten an eine Cloud-API geht, verlässt sie Ihre Kontrolle: Es entsteht eine Auftragsverarbeitung, Fragen zur Serverstandort und dazu, was der Anbieter mit den Inhalten macht. Self-Hosting eliminiert diesen Schritt.
Was sich mit einem eigenen Modell konkret ändert
#- Kein Transfer an Dritte – Die Daten bleiben auf Ihren Servern oder in Ihrer privaten Cloud.
- Weniger Auftragsverarbeitungsverträge – Sie geben die Verarbeitung nicht an einen externen LLM-Anbieter ab.
- Volle Kontrolle über die Aufbewahrung – Sie entscheiden selbst, was und wie lange gespeichert wird, und setzen das Recht auf Löschung effektiv um.
- Standort der Verarbeitung – Sie wissen, wo sich die Daten physisch befinden, ohne Vermutungen über die API-Region.
Grundlage ist hier nicht nur das LLM selbst, sondern auch der Embedding-Server BGE-M3, dank dessen RAG auf Unternehmenswissen lokal funktioniert – semantische Suche in Ihren Dokumenten ohne externe Datenübermittlung.
Compliance-by-Design, nicht nachträglich
#Compliance wird von Anfang an entworfen, nicht am Ende angehängt. In der Praxis bedeutet das: Datenminimierung (das Modell erhält nur, was nötig ist), Maskierung von PII, bevor etwas zum Modell gelangt, Zugriffsprotokollierung und klare Grenzen, was das System mit den Daten tun darf.
Hybride Variante: Cloud, wo es erlaubt ist
#Nicht jeder Anwendungsfall erfordert Lokalität. Nicht-personenbezogene oder anonymisierte Daten können mit einem leistungsstärkeren Modell in der Cloud verarbeitet werden. Ein Router leitet sensible Anfragen an das lokale Modell weiter, den Rest in die Cloud – und maskiert PII vor jedem externen Versand. Sicherheit und DSGVO sind wichtiger als ein einzelnes Feature.
FAQ
#Bedeutet ein self-hosted LLM automatisch volle DSGVO-Compliance?
#Nein – aber es beseitigt das schwierigste Element, nämlich den Datentransfer aus der Organisation. Sie bleiben weiterhin verantwortlich für Rechtsgrundlage, Minimierung, Aufbewahrung und Betroffenenrechte. Self-Hosting gibt Ihnen volle Kontrolle darüber.
Brauche ich einen teuren GPU-Cluster, um ein Modell selbst zu hosten?
#Nicht unbedingt. Für viele Anwendungen reichen kleinere Modelle und angemessene Hardware; wir passen die Variante an die tatsächliche Auslastung und das Budget an. Entscheidend sind vorhersehbare Kosten, nicht maximale Hardware.
Was ist mit Daten, die trotzdem in die Cloud gehen?
#Wir maskieren PII vor dem Versand, begrenzen den Umfang auf das notwendige Minimum und leiten sensible Pfade an das lokale Modell weiter. Das ist der hybride Ansatz: lokal, wo es nötig ist, Cloud, wo es erlaubt ist.