Generative Künstliche Intelligenz (KI) Modelle sind mit maschinellem Lernen auf Grundlage großer Datenmengen vortrainierte Systeme. Sie zerlegen Inhalte der Trainingsdaten in kleine Informationen, setzen diese neu zusammen und generieren darauf basierend neue Daten.
Eine der zentralen Fragen im Zusammenhang mit KI und dem Urheberrecht besteht darin, ob das Training von KI-Modellen mit urheberrechtlich geschützten Daten ohne Zustimmung der Rechteinhaber zulässig ist.
Es besteht Einigkeit darüber, dass die Erstellung von Datensätzen zu Trainingszwecken eine urheberrechtsrelevante Nutzungshandlung in Form einer Vervielfältigung darstellt, die dem Verwertungsmonopol des Urhebers unterliegt (§§ 15 ff. UrhG). Da das Training von KI-Modellen in der Regel ohne Zustimmung der Rechteinhaber erfolgt, hängt die Zulässigkeit der Nutzung davon ab, ob eine gesetzliche Ausnahme vom Urheberrechtsschutz (sog. Schrankenbestimmung) zugunsten der Betreiber von KI-Modellen vorliegt: Anders als in den USA gibt es in Deutschland keine allgemeine Fair-Use-Schranke. Zudem sieht das Urheberrecht – jedenfalls bislang – keine gesonderte „KI-Schranke“ vor. Die Nutzung urheberrechtlich geschützter Werke für das Training von KI-Modellen ist daher nur zulässig, wenn eine der im Urheberrechtsgesetz geregelten Schranken greift. Diskutiert wird insofern insbesondere die Anwendbarkeit der Schranken zum Text- und Data-Mining (TDM). Diese erlauben die automatisierte Analyse digitalisierter Werke, um daraus Muster und Korrelationen zu erkennen, sowohl zu wissenschaftlichen Zwecken (§ 60d UrhG) als auch zu anderen (auch kommerziellen) Zwecken (§ 44b UrhG).
Im September 2024 äußerte sich das Landgericht Hamburg als erstes deutsches und europäisches Gericht zu den urheberrechtlichen Implikationen der Nutzung von Trainingsdaten und zum Text- und Data-Mining zu KI-Trainingszwecken (Az. 310 O 227/23). Das Landgericht Hamburg entschied, dass die Erstellung von KI-Trainingsdatensätzen keine Urheberrechte Dritter verletze, sofern sie wissenschaftlichen Forschungszwecken im Sinne von § 60d UrhG diene. In dem zugrundeliegenden Fall hatte ein Fotograf gegen eine gemeinnützige Organisation geklagt, die Datensätze für die KI-Forschung öffentlich zugänglich bereitgestellt hatte. Einer der Datensätze beinhaltete ein Bild des Klägers.
Das Landgericht Hamburg bestätigt in dem Urteil die grundsätzliche Anwendbarkeit der TDM-Schranken auf die Datensatzerstellung zu KI-Trainingszwecken – und zwar über wissenschaftliche Forschungszwecke hinaus auch für kommerzielle Trainingszwecke. Dies begründete das Landgericht Hamburg u.a. mit der im August 2024 in Kraft getretenen KI-Verordnung (EU-Verordnung 2024/1689). Diese stellt in Artikel 53 Abs. 1 klar, dass die Erstellung von Datensätzen zum Training künstlicher neuronaler Netze unter die TDM-Schranken fällt. Die KI-Verordnung verpflichtet die Anbieter von KI-Modellen zudem sicherzustellen, dass die Nutzungsvorbehalte der Rechteinhaber digitaler Werke beachten werden. An diese Vorgabe knüpfte das Landgericht Hamburg an und betonte die Wichtigkeit von Nutzungsvorbehalten zum Schutz der Urheber öffentlich zugänglicher, digitaler Werke: Rechteinhaber können – und sollten! – auf der jeweiligen Website, etwa im Impressum, den Nutzungsbedingungen oder anderweitig in maschinenlesbarer Form, eine Ausschlusserklärung integrieren, in der sie bestimmen, auf welche Werke und welche Nutzungshandlungen sich der Nutzungsvorbehalt erstreckt.
Das Urteil bringt erste Klarheit und Ansätze von Rechtssicherheit in einen noch jungen Rechtsbereich. Es setzt sich eingehend mit den technischen Besonderheiten und den rechtlichen Auswirkungen von KI auseinander. Dabei legt das Gericht den Begriff des Text- und Datamining (TDM) weit aus, betont jedoch zugleich die Notwendigkeit, die Interessen der Rechteinhaber besonders zu berücksichtigen. Ein zentraler Aspekt des Urteils ist hierbei die strikte Unterscheidung zwischen wissenschaftlichem TDM, das unabhängig von Nutzungsvorbehalten zulässig ist, und gewerblichem TDM, das nur erlaubt ist, wenn kein wirksamer Nutzungsvorbehalt besteht. Dies ist insbesondere für den kommerziellen Bereich von Bedeutung, da die Erstellung von Trainingsdatensätzen erhebliche Ressourcen erfordert und großes Innovationspotenzial bietet.
Abzuwarten bleibt, wie sich andere Gerichte zu der Nutzung von urheberrechtlich geschützten Werken für das Training von KI-Modellen äußern werden. Gegen das Urteil des Landgerichts Hamburg wurde bereits Berufung eingelegt, sodass sich nun das Oberlandesgericht Hamburg mit der Zulässigkeit der Datensatzerstellung zu KI-Trainingszwecken befassen wird. Zudem hat die deutsche Musikverwertungsgesellschaft GEMA im November 2024 Klage gegen OpenAI und im Januar 2025 gegen Suno Inc. beim Landgericht München eingereicht. Sie wirft den Unternehmen die unbefugte Nutzung urheberrechtlich geschützter Songtexte und Musikkompositionen zu Trainingszwecken für KI vor. In diesen Verfahren werden insbesondere die Vergütung der Urheber digitaler Werke sowie in diesem Zusammenhang Fragen zu digitalen Nutzungsbeschränkungen und Lizenzierungen im Mittelpunkt stehen.