„Ist Scraping legal?“ ist die falsche Frage – wie „Ist ein Messer legal?“. Entscheidend ist, was man sammelt, woher und wie. Dieselben Daten können in einem Kontext völlig legal sein und in einem anderen riskant. Vier Dimensionen, die man unterscheiden muss.
1. Datentyp: Handelt es sich um personenbezogene Daten?
#Wenn du personenbezogene Daten sammelst (auch öffentlich sichtbare – Namen, E-Mails, Profile), greift die RODO: Du brauchst eine Rechtsgrundlage, einen Zweck, Datenminimierung und Informationspflicht. Rein technische oder produktbezogene Daten sind in dieser Hinsicht einfacher. Das ist die erste und wichtigste Trennlinie.
2. Quelle: Nutzungsbedingungen und Datenbankrecht
#Die Nutzungsbedingungen (ToS) einer Website können automatisches Abrufen verbieten – ein Verstoß ist eine vertragliche Frage, manchmal mit realen Konsequenzen. Daneben gilt das Sui-generis-Recht auf Datenbanken: Das Herunterladen eines wesentlichen Teils einer geschützten Datenbank, für deren Erstellung der Hersteller Aufwand betrieben hat, kann auch bei nicht-personenbezogenen Daten eine Verletzung darstellen.
3. Methode: Störe die Website nicht
#Auch die Technik schafft rechtliche Risiken. Aggressives Abfragen, das den Server überlastet, kann als Störung des Systembetriebs gewertet werden. Best Practices: Respektiere robots.txt, begrenze die Abfragerate, identifiziere dich in den Headern und lade nur herunter, was du wirklich brauchst.
4. Bevorzuge offizielle Kanäle
#Bevor du zum Scraping greifst, prüfe APIs und offene Daten. Viele Institutionen stellen Daten offiziell bereit (z. B. öffentliche Register, Open-Data-Portale) – das ist eine rechtlich und technisch stabilere Quelle. Dieses Prinzip wenden wir auch im PropTech-Bereich an, wo wir z. B. dane.gov.pl nutzen, statt fremde Websites zu umgehen.
Die Beschaffung und Aufbereitung von Daten innerhalb dieser Grenzen ist Teil unserer Dienstleistungen im Datenbereich – wir gestalten die Datenerhebung von Anfang an rechtssicher, nicht erst im Nachhinein.
FAQ
#Ist das Scraping öffentlicher Daten legal?
#Öffentlich zugängliche Daten können grundsätzlich gescrapt werden, aber „öffentlich“ heißt nicht „ohne Einschränkungen“. Personenbezogene Daten unterliegen der RODO, Datenbanken sind oft geschützt, und die Nutzungsbedingungen einer Website können Automatisierung verbieten. Die Legalität hängt vom Kontext ab.
Darf ich E-Mails und Kontaktdaten von Websites sammeln?
#Das sind personenbezogene Daten, also greift die RODO – du brauchst eine Rechtsgrundlage, einen Zweck und eine Informationspflicht. Allein die Tatsache, dass eine Adresse öffentlich sichtbar ist, gibt dir nicht automatisch das Recht, sie zu sammeln und zu nutzen.
Wie sammle ich Daten sicher?
#Beginne mit offiziellen APIs und offenen Daten, respektiere robots.txt und Ratenlimits, erhebe keine personenbezogenen Daten ohne Rechtsgrundlage und überlaste keine Websites. Rechtliche Compliance sollte bereits in der Planungsphase des Datensammelns berücksichtigt werden, nicht erst nach einem Vorfall.