Dies ist der zweite Beitrag zu unserer Blogreihe „KI in der Hochschule“. Nachdem es im ersten Beitrag um KI-Detektoren ging, beschäftigten wir uns in diesem Beitrag mit KI und OER aus rechtlicher Sicht. Darauf folgt in Kürze ein Beitrag zu Prompt-Tipps für hochwertige OER. Mit den verpflichtenden KI-Kompetenzen in der Hochschule werden wir die Reihe dann abschließen.
In letzter Zeit hat in der Aufmerksamkeitsökonomie das Thema „KI“ im Hochschulkontext das Thema „OER“ nahezu verdrängt. KI ist in aller Munde: KI-Projekte werden gefördert, KI-Workshops sind ausgebucht. OER rückte auf der Prioritätenliste nach hinten. Diese Entwicklungen sind nachvollziehbar. Und dennoch sollte nicht vergessen werden, dass nicht nur KI, sondern auch OER ein großes Potential für die Lehre hat. Warum also nicht die beiden Themen kombinieren, um ihr Potential optimal auszunutzen?
Das Zusammenspiel von KI und OER kann erhebliche Mehrwerte für die Lehre mit sich bringen: KI kann offene Bildungsmaterialien didaktisch clever und ansprechend aufbereiten, strukturieren und vieles mehr. OER wiederum können dazu beitragen, dass KI-Programme mit qualitativ hochwertigen Materialien trainiert werden und so zuverlässigere Ergebnisse liefern.
Und was sagt das Gesetz zu dieser Beziehung? In wie weit ist ein rechtskonformer Einsatz von KI-Programmen in OER überhaupt möglich? Diese Frage versuchen wir hier zu beantworten. Dabei werden wir nur auf OER-relevante Aspekte eingehen (ohne Datenschutzaspekte). Beachten Sie bitte auch, dass rechtliche Entwicklungen im Bereich KI sehr dynamisch sind. Die Ausführungen in diesem Blogbeitrag beziehen sich auf die aktuelle Rechtslage (Oktober 2024).
Ist KI-Output urheberrechtlich geschützt?
Der KI-Output (z.B. Bilder, Texte, Infografiken usw.) ist nach dem deutschen Urheberrecht gemeinfrei, d.h. frei von Urheberrechten. Denn Schöpfende einer geistigen Leistung können nach dem eindeutigen Wortlaut des § 2 Abs.2 UrhG nur Menschen sein. Die KI kann folglich keine Urheberrechte am Output haben.
Auch Betreiber von KI-Programmen als juristische Person gelten nicht als Urhebenden. Die Urheberschaft am KI-Output liegt ebenso wenig bei den Programmierenden des KI-Programms, weil KI i.d.R. nicht steuerbar ist. Sie funktioniert autonom. Das Gleiche gilt für Nutzenden des Programms. Es ist zwar theoretisch denkbar, KI-Output mit sehr klugen Prompts (Befehlen) zu manipulieren. Es wird aber i.d.R. nicht gelingen, die KI gänzlich damit zu steuern. Dies hat zur Folge, dass zwar der kluge Prompt als Werk des Nutzenden urheberrechtlich geschützt ist, der Output aber gemeinfrei bleibt.
Etwas anderes kann gelten, wenn die KI im Kreativprozess lediglich als Werkzeug (also nur unterstützend) eingesetzt wird, die eigentliche Leistung aber einem Menschen objektiv zugeschrieben werden kann. Das kann mit der Benutzung eines Bildbearbeitungsprogramms verglichen werden. In diesem Fall liegen die Urheberrechte bei den Werkschaffenden.
Urheberrechtlicher Schutz kann auch dann entstehen, wenn das KI-Erzeugnis durch einen Menschen umfassend kreativ überarbeitet wird. Das Ergebnis der Bearbeitung muss dabei ausreichend individuell sein, d.h. persönliche Züge des Werkschaffenden annehmen. Das ist nicht der Fall, wenn lediglich Farben oder Größen angepasst oder Ergänzungen hinzugefügt werden. Ob die erforderliche Individualität und Kreativität (Schöpfungshöhe) gegeben sind, entscheidet sich immer nach dem konkreten Einzelfall. Mehr dazu erfahren Sie z.B. in dem Beitrag KI und OER: Wie gut passen sie zusammen? von Georg Fischer.
Darf KI-generierter Output in OER verwendet werden? Was gilt für Prompts?
Da der reine KI-Output gemeinfrei ist, kann er grundsätzlich in OER-Materialien verwendet werden. Das setzt allerdings voraus, dass durch den Output keine Rechte dritter Personen (z.B. Urheber‑, Persönlichkeits‑, Markenrechte usw.) verletzt werden.
Eine Veröffentlichung rechtsverletzender Inhalte unter einer offenen Lizenz kann abgemahnt werden. Denn im Urheberrecht wird der gute Glaube darin, dass der verwendete Inhalt keine Schutzrechte Dritter verletzt, nicht geschützt. Vielmehr trifft die Nutzenden eine Pflicht, verwendete Inhalte auf Rechtsverletzungen zu überprüfen, was bei KI-generierten Inhalten nicht einfach ist. Die Nutzenden können nämlich nicht wissen, mit welchen Quellen die KI trainiert wird und ob dabei Rechte Dritter verletzt wurden. Theoretisch ist es sogar möglich, dass die KI fremde Werke, mit denen sie trainiert wurde, im Output eins zu eins oder zum Teil wiedergibt, was aber eher eine Ausnahme darstellt.
Die meisten KI-Programme kopieren nicht fremde Werke, sondern erstellen Muster anhand von Trainingsdaten, ähnlich wie das menschliche Gehirn. Die Wahrscheinlichkeit, abgemahnt zu werden, ist also nicht besonders hoch. Dennoch ist es wichtig, das generierte Ergebnis nicht unreflektiert zu übernehmen, sondern z.B. mit Plagiatsoftware
oder Suchmaschinen-Rückwärtssuche Recherche im Markenregister usw. auf Rechtsverletzungen zu überprüfen. Nach Möglichkeit sollte das KI-generierte Ergebnis mit weiteren Prompts oder anderen Programmen mehrfach überarbeitet werden.
Die am 1.August 2024 in Kraft getretene europäische KI-Verordnung (AI-Act) sieht für Betreiber generativer KI-Programme eine Pflicht vor, eine Strategie zur Einhaltung des Urheberrechts zu entwickeln sowie detaillierte Zusammenfassungen über Trainingsdaten zu veröffentlichen (Erwägungsgründe 106 und 107). Es wird allerdings noch dauern, bis die KI-Betreiber diese Verpflichtung erfüllen, weil die Verordnung schrittweise umgesetzt wird.
Auch bei der Formulierung von Prompts ist Vorsicht geboten. Es sollten keine Prompts veröffentlicht werden, die urheberrechtlichen Werke oder Teile davon, fremde Marken, Personenfotos oder andere personenbezogene Daten enthalten. Denn das kann auch abgemahnt werden.
Darf die KI mit urheberrechtlich geschützten Werken trainiert werden? Kann ich verhindern, dass die KI mit meinen Werken trainiert wird?
Damit die KI selbst Inhalte generieren kann, muss sie zuerst mit offenen Quellen (also auch mit OER) trainiert werden. Rechtlich ist das in Deutschland wohl zulässig. Es wird überwiegend vertreten, dass die Urheberrechtsschranke für Text und Datamining in § 44 b UrhG das Training rechtfertigt.
Das Training von KI mit fremden Inhalten lässt sich nicht so einfach verhindern. Viele Leser:innen werden sich an den Fall mit Meta im Sommer 2024 erinnern. Die Verbraucherzentrale NRW hatte Meta abgemahnt, weil das Unternehmen Nutzerdaten auf Instagram und Facebook zum Training von KI verwenden wollte, ohne eine Einwilligung der Nutzenden. Letztendlich durften die Nutzenden dem Training widersprechen. Der Weg zum Widerspruch gestaltete sich allerdings einigermaßen komplex.
Für Inhalte auf Webseiten und Blogs gibt es die Möglichkeit, einen Nutzungsvorbehalt gegen das Training zu erklären, das sog. Opt-Out vom Data Mining. Dieser muss durch das Hinterlegen einer Datei im Stammverzeichnis der Domain, also in maschinenlesbarer Form erfolgen, damit er von Webcrawlern ausgelesen werden kann. Webcrawler sind Programme, die das Internet durchsuchen und Webseiten analysieren. Wie das genau funktioniert wird z.B. in dem Tutorial So sperrst Du OpenAIs ChatGPT, Googles Gemini und andere Bots aus, die deine Texte für ihre KI nutzen wollen von Kai Spriestersbach erklärt. Ein Opt-Out kann allerdings auch dazu führen, dass Inhalte der Webseite nicht als Suchergebnisse angezeigt werden.
Muss ich KI-generierte Inhalte als solche kennzeichnen?
Da KI-generierte Inhalte gemeinfrei sind, gibt es derzeit keine gesetzliche Pflicht zur Quellenangabe. Nichtsdestotrotz sollten mit KI erstellte Materialien immer als solche gekennzeichnet werden. So kann der Entstehungsvorgang und der Ursprung des Materials für die Nachnutzenden besser nachvollzogen werden. Außerdem wird klargestellt, dass das Material gemeinfrei ist, d.h. keinen urheberrechtlichen Beschränkungen unterliegt. Die Kennzeichnung könnte z.B. so erfolgen: „KI-generiert. Gemeinfrei. Erstellt mit dem Programm XY. Prompt: XY. Bearbeitungen: XY“.
Das OER-Material, in dem KI-generierte Inhalte verwendet werden, kann offen lizenziert werden. Dabei sind Lizenzen zu wählen, die die Nachnutzung am wenigsten einschränken, d.h. die CC Zero-Freigabe, CC BY und CC BY SA. Die gemeinfreien KI-Inhalte sind von der Lizenz auszunehmen: „Dieses OER-Material ist mit der Lizenz XY lizenziert. Von der Lizenz nicht umfasst sind die gekennzeichneten KI-generierten Bilder. Diese sind gemeinfrei.“
Etwas anderes gilt für den sog. Remix (Verschmelzung) von Materialien zu einem neuen Werk. Werden KI-generierte Inhalte und das OER-Material derart miteinander verschmolzen, dass daraus ein neues Werk entsteht (z.B. eine Bildkollage, ein Video), darf das neue Gesamtwerk offen lizenziert werden. Dies erklärt Till Kreutzer beispielhaft in dem Video Open Educational Resources, Urheberrecht und KI.
Fazit
KI-Programme können rechtskonform für die Erstellung von OER verwendet werden, wenn die o.g. Regeln beachtet werden. Wenn Sie mehr zu dem Thema erfahren bzw. das Gelesene vertiefen möchten, besuchen Sie unseren Workshop KI & OER im Einsatz: OER vielfältig und rechtskonform mit KI aufwerten. Für die Anmeldung und weitere Fragen wenden Sie sich bitte an info@twillo.de.