7. Sonderfall: Text und Data Mining

Wortwolke mit urheberrechtlichen Begriffen um das Thema Text und Data Mining

Text und Data Mining (§ 60d UrhG)

§ 60d UrhG ist der rechtliche Rahmen für nicht-kommerzielles Text und Data Mining. Fremde Werke dürfen automatisiert und systematisch vervielfältigt werden, um ein auszuwertendes Korpus zu erstellen.


I. Nutzung von Text und Data Mining für die wissenschaftliche Forschung (§ 60d UrhG)

§ 60d UrhG ist eine gesetzliche Schrankenbestimmung für Text und Data Mining im Rahmen von nicht-kommerzieller wissenschaftlicher Forschung. Fremde Werke dienen als Ursprungsmaterial und werden automatisiert und systematisch ausgewertet. Die ausschließlich manuelle Verarbeitung ist nicht zulässig. Die Schrankenbestimmung erlaubt, urheberrechtlich geschützte Werke zu vervielfältigen, um daraus durch Normalisierung, Strukturierung und Kategorisierung ein auszuwertendes Korpus zu erstellen. Ein Korpus ist eine Sammlung maschinenlesbarer Inhalte.

Das Korpus, aber nicht das Ursprungsmaterial, darf einem abgegrenzten Personenkreis für die gemeinsame wissenschaftliche Forschung sowie einzelnen Dritten zur Überprüfung der Qualität der Forschung öffentlich zugänglich gemacht werden (§ 60d Absatz 1 Nr. 2 UrhG). Nach Abschluss des Forschungsprojektes müssen alle bei den Forschern noch vorhandenen Kopien des Ursprungsmaterials sowie das Korpus gelöscht werden. Wenn das Korpus öffentlich zugänglich war, muss dies beendet werden.

Das Korpus und die Kopien des Ursprungsmaterials können aber Bibliotheken, Archiven, Museen und Bildungseinrichtungen zur dauerhaften Aufbewahrung übermittelt werden (§ 60d Absatz 3 UrhG).

Die gesetzliche Schrankenbestimmung § 60d UrhG gilt für jeden, der automatisierte Forschung in der Form des Text und Data Mining betreiben will. Die dafür notwendigen Nutzungshandlungen dürfen auch von Dritten ausgeführt werden, wie z.B. durch Mitarbeiter einer Bibliothek (siehe hierzu auch den Regierungsentwurf zum Urheberrechts-Wissenschaftsgesellschaftsgesetz - UrhWissG, BT-Drucksache 18/12329 vom 15.05.2017, Seite 41).

Die öffentliche Zugänglichmachung (z.B. Bereitstellung über das Internet / Intranet) ist für zwei Personengruppen erlaubt:

  • Ein bestimmt abgegrenzter Kreis von Personen. Gemeint sind kleine Forschungsteams, soweit der Kreis der Mitglieder bestimmt abgegrenzt ist und die Werke nicht allen Forschern einer Universität zugänglich gemacht werden. Die Abgrenzung kann z.B. durch technische Maßnahmen erfolgen, wie die Online-Bereitstellung von urheberrechtlich geschützten Materialien in geschlossenen Projektgruppen im hochschulinternen Intranet zur Nutzung innerhalb eines kleinen Forschungsteams. Es ist unerheblich, ob alle Personen an derselben Einrichtung tätig sind; auch innerhalb loser Forschungsverbünde dürfen die Materialien genutzt werden.
  • Einzelne Dritte zum Zweck der Überprüfung der Qualität wissenschaftlicher Forschung. Ein möglicher Anwendungsfall ist der Peer Review von Forschungsergebnissen durch Dritte. Auch hier muss durch geeignete Maßnahmen verhindert werden, dass unberechtigte Personen Zugriff auf das Korpus bekommen (siehe hierzu auch den Regierungsentwurf zum Urheberrechts-Wissenschaftsgesellschaftsgesetz - UrhWissG, BT-Drucksache 18/12329 vom 15.05.2017, Seite 39).

Die Nutzung eines Werkes im Rahmen von Text und Data Mining darf nur zu nicht-kommerziellen Zwecken erfolgen.

Entscheidend ist dabei nicht, ob die Institution, an der geforscht wird, gewinnorientiert oder gemeinnützig ist. Ausschlaggebend ist vielmehr, ob die Ausrichtung der Forschungstätigkeit kommerziell ist. Auf die Quelle der Finanzierung kommt es nicht an, sodass auch die Forschung, die an öffentlichen Hochschulen stattfindet und über private Drittmittel finanziert wird, unter die Erlaubnis des § 60c Absatz 2 UrhG fallen kann.

Auch die Veröffentlichung der Forschungsergebnisse über einen Verlag führt ebenfalls in der Regel nicht dazu, dass die zugrundeliegende Forschung als kommerziell einzuordnen ist. Dies gilt auch, wenn die Publikation des Wissenschaftlers vergütet wird.

Eine kommerzielle Forschung liegt hingegen dann vor, wenn ein Unternehmen Forschung betreibt und die Forschungsergebnisse kommerziell vermarktet (siehe hierzu den Regierungsentwurf zum Urheberrechts-Wissenschaftsgesellschaftsgesetz - UrhWissG, -BT-Drucksache 18/12329 vom 15.05.2017, Seite 39).

Die Nutzung von Datenbankwerken (§ 4 Absatz 2 UrhG) im Rahmen der gesetzlichen Schrankenbestimmung des Text und Data Mining (§ 60d Absatz 1 UrhG) gilt als übliche Benutzung nach § 55a Satz 1 UrhG. Sie bedarf deshalb keiner Zustimmung des Datenbankurhebers oder Rechteinhabers (§ 60d Absatz 3 UrhG).

Die Nutzung unwesentlicher Teile von Datenbanken (§§ 87a ff UrhG) im Rahmen der gesetzlichen Schrankenbestimmung des Text und Data Mining (§ 60d Absatz 1 UrhG) gilt als normale Auswertung der Datenbank und ist mit dem berechtigten Interesse des Datenbankherstellers im Sinne von § 87b Absatz 1 Satz 2 UrhG und § 87e UrhG vereinbar (§ 60d Absatz 2 UrhG).

Was ist ein wesentlicher Teil einer Datenbank? In der Regel werden Anteile von mehr als 50% des gesamten Datenvolumens als wesentlich angesehen. Einzelne Elemente einer Datenbank sind also nur ein unwesentlicher Teil.

Wenn technische Schutzmaßnahmen verhindern, dass urheberrechtlich geschützte Werke im Rahmen von Text und Data Mining genutzt werden können, besteht ein Anspruch gegen den Rechteinhaber, die für die Nutzungen notwendigen Mittel zur Verfügung zu stellen (§ 95b Absatz 1 Nr. 10 UrhG). Ein solcher Anspruch entfällt aber, wenn die Werke im Internet zum Download verfügbar sind und gegebenenfalls auch entgeltpflichtig heruntergeladen werden können (§ 95b Absatz 3 UrhG).

Es ist nicht erlaubt, die technischen Schutzmaßnahmen (z.B. Passwort- und Kopierschutz, Verschlüsselungen) ohne Zustimmung des Rechteinhabers zu umgehen (§ 95a UrhG).

Bei der Nutzung im Rahmen von Text und Data Mining muss die Quelle angegeben werden (§ 63 UrhG). Neben der Bezeichnung des Urhebers ist auch die Fundstelle anzugeben.

Wenn Texte verwendet werden, sollte die Quellenangabe die Urheberbezeichnung (Vor- und Nachname des Autors) und die genaue Fundstelle (Titel des Buches/der Zeitschrift, Erscheinungsjahr, Seitenzahl und ggf. auch Verlag) umfassen. Bei Quellen aus dem Internet ist neben der Urheberbezeichnung (Vor- und Nachnahme) auch die URL anzugeben, die direkt zu der Internetseite führt, von der der Text stammt. Empfehlenswert ist es, auch das Abrufdatum anzugeben.

Die Quellenangabe muss deutlich sein. Sie muss so platziert werden, dass der Urheber und die Fundstelle ohne Mühe zu erkennen sind.

Eine Ausnahme zur Quellenangabe besteht nur, wenn

  • die Quelle nicht genannt oder bekannt ist oder
  • im Rahmen von Prüfungen der Verzicht auf die Quellenangabe erforderlich ist (§ 63 Absatz 1 Satz 3 UrhG).

Eine Quelle kann unbekannt sein, wenn es sich um ein anonymes Werk handelt. Der Nutzer hat allerdings die Pflicht, sich im Rahmen des Zumutbaren zu bemühen, die Quelle in Erfahrung zu bringen. Es dürfen jedoch keinen zu hohen Anforderungen an die Mühen des Nutzers bei der Suche nach dem Quellennachweis gestellt werden.

Das übernommene Werk darf nicht geändert werden.

Änderungen sind nur ausnahmsweise zulässig (§ 62 Absatz 2 - 4 UrhG). Zulässig ist die Übersetzung von Texten, wenn es für den Forschungszweck erforderlich ist (§ 62 Absatz 2 UrhG). Bei Werken der bildenden Künste (z.B. Gemälde) und bei Lichtbildwerken (Fotografien) ist die Änderung der Größe (Formatänderung) zulässig. Zudem sind diejenigen Maßnahmen gestattet, die das jeweilige Vervielfältigungsverfahren mit sich bringt, z.B. die Reproduktion von Farbfotografien in Schwarz-Weiß-Fotografien (§ 62 Absatz 3 UrhG).

Die für die Nutzung für  Unterricht und Lehre (§ 60a UrhG) geltende weitergehende Änderungsbefugnis (§ 62 Absatz 4 UrhG) gilt nicht für die wissenschaftliche Forschung.

Weitergehende Änderungen erfordern generell die Zustimmung des Rechteinhabers.

Die Nutzung von Vervielfältigungen im Rahmen von Text und Data Mining ist angemessen zu vergüten (§ 60h Absatz 1 UrhG). Die Vergütung findet über das Pauschalvergütungssystem nach den §§ 54 bis 54c UrhG statt. Dies ist die sogenannte Geräte- und Leermedienabgaben für Scanner, CD- und DVD-Brenner, PCs, Drucker, CDs, DVDs usw. Die Verwertungsgesellschaften - wie z.B. die VG Wort - ziehen die Vergütung bei den Importeuren, Herstellern und Betreibern von Geräten und Speichermedien ein und schütten sie an die Rechteinhaber aus.

Für die öffentliche Zugänglichmachung über § 60d UrhG hat der Rechteinhaber ebenfalls Anspruch auf Zahlung einer angemessenen Vergütung (§ 60h Absatz 1 UrhG). Dieser wird durch eine Verwertungsgesellschaft geltend gemacht (§ 60h Absatz 4 UrhG) und zwar in Form einer pauschalen Vergütung bzw. einer nutzungsabhängige Berechnung der angemessenen Vergütung § 60h Absatz 3 UrhG. Eine Einzelerfassung der Nutzung kann nicht verlangt werden.

Für Studierende, Lehrende und Forscher einer Hochschule ist die Hochschule der Vergütungsschuldner (§ 60h Absatz 5 Satz 1 UrhG). Die Sonderregelungen für die pauschale Geräte- und Speichermedien- und Gerätebetreibervergütung (§§ 54 ff. UrhG) gehen dieser Bestimmung aber vor (§ 60h Absatz 5 Satz 2 UrhG). Aber auch hiernach ist nicht der unmittelbare Nutzer selbst Vergütungsschuldner, sondern Importeure, Hersteller und Betreiber von Geräten und Speichermedien.

Begriffserklärungen

Schranken des Urheberrechts

Das Urheberrechtsgesetz enthält Ausnahmen, die sogenannten Schrankenbestimmungen. Sie gestatten es, urheberrechtlich geschützte Werke auch ohne Einwilligung des Rechteinhabers zu nutzen. Mit den Schranken soll ein Ausgleich zwischen den Interessen des Urhebers und denen der Gesellschaft geschaffen werden. Die Voraussetzungen für die verschiedenen gesetzlichen Nutzungserlaubnisse sind in den Paragraphen § 44a ff. UrhG geregelt.

[Themen 2-7: Sonderfälle]

Lizenz

Als Lizenz wird in der Umgangssprache die Erlaubnis bezeichnet, ein urheberrechtlich geschütztes Werk zu nutzen. Bei einer Lizenz handelt es sich also um die Einräumung eines Nutzungsrechts für einen rechtlich geschützten Inhalt.

[Thema 10: Lizenzierung]

Nutzungsrechte

Der Urheber kann einem anderen das Recht einräumen, sein Werk auf einzelne oder alle Nutzungsarten zu nutzen. Nutzungsarten sind z.B. Vervielfältigung oder öffentliche Wiedergabe. Das Nutzungsrecht kann als einfaches oder ausschließliches Recht sowie räumlich, zeitlich oder inhaltlich beschränkt eingeräumt werden (§ 31 Absatz 1 UrhG).

[Thema 10: Lizenzierung]


Der Rechtsstand ist Mai 2018.