Künstliche Intelligenz und Urheberrecht: Foto­graf muss Nut­zung seines Bildes in KI-Daten­bank dulden

Gastbeitrag von Dr. Saskia Ostendorff

15.10.2024

Ein Urteil mit Signalwirkung, das vor allem die Open-Source Community interessieren dürfte: Die Erstellung von KI-Trainingsdatensätzen ist laut LG Hamburg urheberrechtlich unbedenklich. Saskia Ostendorff erläutert die Entscheidung.

Die Erstellung von KI-Trainingsdatensätzen ist nach § 60d Urheberrechtsgesetz (UrhG) als Text- und Datamining zulässig. Das entschied das Landgericht (LG) Hamburg (Urt. v. 27.09.2024, Az. 310 O 227/23). Das Urteil war mit Spannung erwartet worden, LTO hatte über das Verfahren bzw. die mündliche Verhandlung berichtet.  

Dem Fall lag eine Klage des Fotografen Robert Kneschke gegen den gemeinnützigen Verein LAION zugrunde. Dieser hat sich zum Ziel gesetzt, Forschung im Bereich Künstliche Intelligenz (KI) zu fördern, indem er offene Datensätze bereitstellt. Das Ergebnis: LAION 5B, ein Datensatz mit fast sechs Milliarden Bild-Text-Paaren.

Eines der Bilder stammte von Robert Kneschke. LAION hatte es für den Trainingsdatensatz verwendet. Gefunden hatte der Verein das Bild auf der Website Bigstock. Dort hatte der Fotograf sein Werk hochgeladen. In den Nutzungsbedingungen von Bigstock aber heißt es, dass die Bilder nicht für "automated programms" genutzt werden dürfen. War also die Nutzung des Fotos durch LAION unzulässig?

Text- und Datamining meint auch das Erstellen von Trainingsdatensätzen

Nein, entschied nun das LG Hamburg und wies Kneschkes Klage ab. Die Begründung des Gerichts: Die Vervielfältigung der Bilddaten fällt unter die Schrankenregelung des § 60d UrhG für wissenschaftliches Text- und Datamining (TDM). Gemeint ist damit die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen.

Die Kammer schloss sich mit ihrer Entscheidung der Argumentation des gemeinnützigen Vereins an. Das Besondere daran: Mit diesem Urteil hat nun erstmals ein Gericht festgestellt, dass es sich bei der Vervielfältigung zur Erstellung eines Traniningsdatensatzes um Text- und Datamining iSd. § 60d UrhG handelt.

Das Gericht stellte klar, dass die Vervielfältigungshandlung von Laion e.V. durch die Norm gedeckt war und das Herunterladen der Trainingsdaten als Text- und Datamining zu verstehen ist. Dafür sprachen aus Sicht des LG zwei Argumente. Zum einen die Gesetzesbegründung, in der hervorgehoben wurde, dass das maschinelle Lernen als Basis-Technologie für KI von besonderer Bedeutung sei (BT-Drs. 19/27426, S. 60).

Verweis auf KI-Verordnung der EU

Zum anderen begründete das LG die Einordnung als Text- und Datamining mit einem Verweis auf die im August 2024 eingeführte KI-Verordnung (EU-Verordnung 2024/1689). In dieser wird in Artikel 53 Abs. 1 betont, dass auch die Erstellung von Datensätzen für das Training künstlicher neuronaler Netze unter die Schrankenregelung des Text-und-Datamining fällt. Die Anbietenden von KI-Modellen sind dazu verpflichtet, sicherzustellen, dass ein geltend gemachter Rechtsvorbehalt beachtet wird.

In Art. 53 Abs. 1 lit. c der KI-Verordnung wird auf Art. 4 der DSM ("Digital Single Market") -Richtlinie verwiesen. Sie ist die europäische Regelung zur Schrankenregelung des Text- und Datamining, wonach zum Zwecke des Text und Data Mining vorgenommene Vervielfältigungen und Entnahmen von rechtmäßig zugänglichen Werken und sonstigen Schutzgegenständen die Mitgliedstaaten eine Ausnahme oder Beschränkung von den Rechten vorsehen.

Vor diesem Hintergrund überzeugt die Argumentation des Gerichts, dass durch den Verweis der KI-Verordnung auf Art. 4 DSM-Richtlinie die Anwendung der Schrankenregelung des Text- und Data-Mining begründet wird. Ein häufiges Gegenargument war nämlich bislang, dass das Text- und Datamining nicht auf die Erstellung von Trainingsdatensätzen anwendbar sei, weil der Gesetzgeber die KI bei der Schaffung der Schrankenregelung des § 44b UrhG und § 60d UrhG nicht berücksichtigt habe. Das dürfte spätestens durch den Verweis in der KI-Verordnung auf das Text- und Data-Mining in Art. 4 DSM-Richtlinie widerlegt sein.

Damit wurde auch geklärt, dass dies ebenfalls auf das Text- und Datamining nach § 44b UrhG zutrifft. Nach dieser im Jahr 2021 eingeführten Regelung sind Vervielfältigungen von rechtmäßig zugänglichen Werken für ​​​​das Text- und Datamining zulässig. Es sei denn, der Rechtsinhaber hat sich die Nutzung zum Text- und Datamining wirksam vorbehalten.

Im Ergebnis kam es aber auf die Schrankenregelung des § 44b UrhG im Fall Kneschke nicht an, weil bereits die Schrankenregelung des § 60d UrhG die Handlung abdeckte. Dennoch ließ es sich das LG nicht nehmen, zu § 44b UrhG Stellung zu nehmen.

Die Schrankenregelungen: § 60d UrhG und § 44b UrhG

LAION argumentierte, dass das Downloaden des Bildes des Klägers zum Zwecke der Erstellung eines Trainingsdatensatzes in jedem Fall durch § 60d UrhG gedeckt gewesen sei. Danach sind Vervielfältigungen für Text- und Data-Mining für Zwecke der wissenschaftlichen Forschung zulässig, sofern u.a. keine kommerziellen Zwecke verfolgt werden. Das Gericht sah dies verwirklicht, weil der Datensatz der Öffentlichkeit – und damit auch Forschenden auf dem Gebiet künstlicher neuronaler Netze – zur Verfügung gestellt wurde. Besonders interessant an dieser Argumentation: Damit wird die Frage aufgeworfen, ob Open-Source-Trainingsdatensätze dann grundsätzlich unter den § 60d UrhG fallen.

Des Weiteren argumentierte das Gericht, dass für den vorliegenden Fall zwar sowohl der § 60d UrhG, als auch der § 44b UrhG einschlägig seien. Im Unterschied zu § 60d UrhG, ist es bei § 44b UrhG jedoch erforderlich, dass der Rechteinhaber einen Nutzungsvorbehalt erklärt, sofern eine Vervielfältigungshandlung zum Text- und Datamining ausgeschlossen werden soll. Der Nutzungsvorbehalt muss in maschinenlesbarer Form erklärt werden.

Bislang war es hier umstritten, ob für einen maschinenlesbaren Nutzungsvorbehalt, der in § 44b UrhG und Art. 4 Abs. 3 DSM-Richtlinie gefordert ist, auch eine Erklärung in “natürlicher Sprache” ausreicht. Das LG Hamburg bejahte dies. Schließlich seien heute bereits KI-Anwendungen in der Lage, die natürliche Sprache zu verstehen und zu verarbeiten. Zudem wies das Gericht darauf hin, dass der europäische Gesetzgeber in der KI-Verordnung ausdrücklich verlangt, dass KI-Anbieter "modernste Technologien" einsetzen müssen, um Rechtsvorbehalte zu ermitteln und zu beachten. Hierzu gehören auch KI-Systeme, die in der Lage sind, in natürlicher Sprache formulierte Vorbehalte zu interpretieren.

Ob sich diese Auffassung durchsetzen wird, bleibt abzuwarten. Denn demgegenüber steht eine andere Rechtsauffassung. Danach sollen nur solche Nutzungsvorbehalte als maschinenlesbar gelten, die durch ein technisches Format wie robot.txt die Nutzung zu Trainingsdaten-Zwecken untersagen.

Richtungsweisendes Urteil

Das Urteil des LG Hamburg ist richtungsweisend und ein Schritt zu mehr Klarheit. Erstmals hat ein Gericht die Schrankenregelung zum Text- und Datamining auf Trainingsdatensätze anwendet.

Das Argument, dass die Veröffentlichung von Trainingsdatensätzen die "wissenschaftliche Forschung" befördert, könnte zudem die Erstellung von Open-Source-Trainingsdatensätzen stärken. Allerdings bleibt abzuwarten, ob sich diese Rechtsauffassung auch in einer möglichen nächsten Instanz durchsetzen wird.

Ein Kritikpunkt an der LG-Entscheidung bleibt jedoch: Aus der Sicht der Open-Source Community wäre eine klare Entscheidung zu einem maschinenlesbaren Nutzungsvorbehalt in einem technischen Format wie robot.txt in § 44b UrhG wünschenswert gewesen. Denn es braucht Gewissheit, ob der Nutzungsvorbehalt tatsächlich in “natürlicher Sprache” ausreicht oder ein technisches Format zu bevorzugen ist.

Dabei gebe ich zu bedenken: Es braucht mutige Schritte für eine starke Open-Source-Community im Bereich der KI-Modelle, die ein Gegengewicht zu den kommerziellen KI-Modellen bieten können. Der Weg dahin darf nicht weiter erschwert werden. Offene Trainingsdatensätze, die nachhaltig wiederverwendet werden können, sind unerlässlich.

Die Autorin Dr. Saskia Ostendorff ist General Counsel bei Wikimedia Deutschland e.V. und hat sich als Rechtsanwältin auf die Bereiche Urheberrecht und Persönlichkeitsrechte spezialisiert. Sie ist Mitgründerin der Plattform und Initiative Open Legal Data für Open Data und Open Access im juristischen Bereich und Mitglied der Nichtständigen Kommission Digitales des Deutschen Juristinnenbund e.V.. 

Zitiervorschlag

Künstliche Intelligenz und Urheberrecht: . In: Legal Tribune Online, 15.10.2024 , https://www.lto.de/persistent/a_id/55629 (abgerufen am: 16.10.2024 )

Infos zum Zitiervorschlag
Jetzt Pushnachrichten aktivieren

Pushverwaltung

Sie haben die Pushnachrichten abonniert.
Durch zusätzliche Filter können Sie Ihr Pushabo einschränken.

Filter öffnen
Rubriken
oder
Rechtsgebiete
Abbestellen