Datenschutz und Urheberrecht für KI

Die Erstellung von Web-Content (Texte, Bildmaterial) mithilfe von Künstlicher Intelligenz (KI) bringt sowohl datenschutzrechtliche als auch urheberrechtliche Herausforderungen mit sich, die in verschiedenen Ländern unterschiedlich gehandhabt werden. Datenschutzanforderungen basieren auf der DSGVO bzw. GDPR,  im Urheberrecht bleibt der menschliche Beitrag entscheidend. Die rechtliche Situation entwickelt sich jedoch weiter und wird voraussichtlich noch zusätzliche Klarstellungen erfahren.

Herausforderung und aktuelle Entwicklung

  • DSGVO und KI: Die DSGVO ist für KI-Anwendungen relevant, die personenbezogene Daten verarbeiten. Es gibt fortlaufende Diskussionen darüber, wie KI in Übereinstimmung mit der DSGVO eingesetzt werden kann, insbesondere wenn es um maschinelles Lernen auf Basis personenbezogener Daten geht. Wichtig sind hier Themen wie Anonymisierung, Pseudonymisierung und Datensparsamkeit.
  • KI und Urheberrecht in der EU: Die Urheberrechtsrichtlinie der EU aus dem Jahr 2019 enthält Bestimmungen zum Thema Text- und Data-Mining (Artikel 3 und 4), die eine gewisse Freiheit für das Training von KI-Modellen geben, solange es nicht kommerziellen Zwecken dient oder anderweitig rechtlich abgesichert ist.
  • Aktuelle Urteile und Diskussionen: In den USA und der EU gibt es laufende rechtliche Auseinandersetzungen, wie z. B. Klagen von Künstlern gegen KI-Unternehmen, die argumentieren, dass ihre Werke ohne Genehmigung verwendet wurden. Dies könnte in naher Zukunft neue Gesetze oder Urteile hervorbringen, die die Nutzung von KI-generierten Inhalten weiter regeln.

Durch die dynamische Entwicklung der KI-Technologie werden in den kommenden Jahren neue Richtlinien und Urteile erwartet, die diese Bereiche klarer regeln. Hier der  Stand meiner Recherche vom Oktober 2024:

1. Datenschutz

Datenschutzfragen bei KI-generierten Inhalten betreffen vor allem die Verwendung personenbezogener Daten während des Trainings von KI-Modellen und die potenzielle Verarbeitung solcher Daten in generierten Inhalten.

  • Verwendung personenbezogener Daten für das Training: KI-Modelle wie GPT-4 oder DALL-E werden oft mit großen Datensätzen trainiert, die aus öffentlich verfügbaren oder zugänglichen Daten bestehen. Wenn in diesen Trainingsdaten personenbezogene Informationen enthalten sind, könnte dies gegen Datenschutzgesetze wie die DSGVO (Datenschutz-Grundverordnung) in der EU verstoßen.
    Artikel 6 DSGVO (Rechtmäßigkeit der Verarbeitung) schreibt vor, dass personenbezogene Daten nur verarbeitet werden dürfen, wenn es eine rechtliche Grundlage dafür gibt.

    Beispiel:
    Wenn ein Modell mit Texten trainiert wird, die personenbezogene Daten enthalten, müssen diese Daten entweder anonymisiert oder mit Zustimmung der betroffenen Personen verarbeitet werden.
  • Risiken bei generierten Inhalten: Bei KI-generierten Texten oder Bildern besteht das Risiko, dass personenbezogene Informationen reproduziert oder im Kontext eines neuen Inhalts verwendet werden, der identifizierbare Personen betrifft. Hier stellt sich die Frage, ob die KI auf diese Informationen aus den Trainingsdaten zugreift und sie ungewollt preisgibt.
    Beispiel: Ein KI-generierter Text könnte fälschlicherweise sensible Informationen wiedergeben, die während des Trainings aufgenommen wurden, was einen Verstoß gegen Datenschutzregelungen darstellen würde.

2. Urheberrecht

Beim Urheberrecht stellen sich zwei zentrale Fragen: Wer ist der Urheber von KI-generierten Inhalten und welche Rechte haben Nutzer solcher Inhalte?

  • Urheberrecht für KI-generierte Inhalte: In vielen Rechtsordnungen, darunter die EU und die USA, gilt, dass das Urheberrecht menschliche Schöpfung voraussetzt. KI-generierte Inhalte werden somit nicht automatisch vom Urheberrecht geschützt, da keine menschliche Urheberschaft vorliegt. Allerdings könnte die Person oder das Unternehmen, das die KI trainiert und betreibt, ein gewisses Nutzungsrecht an den erzeugten Inhalten beanspruchen.
    Beispiel: In der EU gibt es bisher keine klaren Regelungen darüber, ob und wie KI-generierte Inhalte urheberrechtlich geschützt werden können. In den USA gibt es ähnliche Unsicherheiten, wie etwa ein bekanntes Urteil der US-Copyright-Behörde, die den Schutz für KI-generierte Kunst ablehnte.
  • Nutzung von urheberrechtlich geschützten Inhalten beim Training: Wenn KI-Modelle mit urheberrechtlich geschützten Materialien trainiert werden (z. B. Fotos, Texte, Kunstwerke), stellt sich die Frage, ob dies eine Verletzung des Urheberrechts darstellt. Dies hängt oft von der Auslegung der Fair-Use-Regelungen (USA) oder der Schrankenregelungen (EU) ab.
    Beispiel: Eine KI, die mit Millionen von urheberrechtlich geschützten Kunstwerken trainiert wird, könnte theoretisch daraus “abgeleitete Werke” erstellen. Ob dies jedoch als Urheberrechtsverletzung angesehen wird, ist rechtlich umstritten.

Urteil zur Nutzung von KI-Werken

Rein KI-generierte Inhalte, also ohne menschlichen kreativen Eingriff, können grundsätzlich nicht als schutzfähig gelten​. Ein prominentes Beispiel ist das Urteil eines Prager Gerichts, das festlegte, dass KI-erstellte Bilder nicht den Schutz des Urheberrechts genießen, da sie ohne menschliche Kreativität entstanden sind
Quelle: Heise Online

Quellen und weiterführende Informationen

  • Haufe Verlag/ Dr. Peggy Müller (Rechtanwältin):
    The future is now: Künstliche Intelligenz und das Urheberrecht
  • Europäische Datenschutz-Grundverordnung (DSGVO), insbesondere Artikel 6 zur Rechtsgrundlage der Datenverarbeitung. Mehr dazu auf offiziellen Seiten wie der EU-DSGVO-Webseite.
  • Urheberrechtsrichtlinie der EU (2019/790), Artikel 3 und 4 über Text- und Data-Mining. Volltext und Erläuterungen gibt es auf der EUR-Lex Plattform.
  • Klage gegen KI-Bildgeneratoren wegen Urheberrechtsverletzung, US-Fallbeispiel von Künstlern gegen KI-Unternehmen: Siehe Artikel auf The Verge und ähnliche Berichterstattung über aktuelle Fälle.
  • Diskussionen zu Datenschutz und KI, wie z. B. die Risiken der Re-Identifizierung aus KI-generierten Daten, erörtert in Artikeln der Datenschutzbehörden wie dem EDPB.