Urheberrechtliche Hindernisse beim Data Mining
Die wichtigsten Punkte
- Data Mining vereinfacht die Strukturierung und Analyse grosser Datenmengen.
- Ohne Rechteeinräumung durch den Urheber ist Data Mining bei urheberrechtlich geschützten Werken unter geltendem Schweizer Recht nur für den privaten oder (unter Umständen) für den betriebsinternen Gebrauch zulässig.
- Nach künftigem Schweizer Recht soll Data Mining bei urheberrechtlich geschützten Werken zudem zulässig sein, wenn dieses zum Zwecke der wissenschaftlichen Forschung betrieben wird.
Einleitung
"Daten sind das neue Öl, Informationen das neue Gold."
In den vergangenen Jahren hat die Zahl der verfügbaren, hochdimensionalen Daten und Informationen rapide zugenommen. Sei es in der Wirtschaft, der Medizin oder der Forschung – der steigende Wert und die wachsende Bedeutung von Daten ist unbestritten.
Doch nicht alles ist Gold, was glänzt. Die immensen, teilweise unstrukturierten Datenmengen bergen erhebliche Herausforderungen bei der Verwaltung, Erfassung, Speicherung und Analyse der einzelnen Daten. Während die Auslese potenziell nützlicher Daten früher manuell erfolgte, so ist dies heutzutage aufgrund der Grösse der verfügbaren Datenbanken meist nicht mehr möglich.
Abhilfe schafft das sogenannte Data Mining, ein Verfahren der intelligenten Datenanalyse und -interpretation. Data Mining ermöglicht es, computergestützt und algorithmisch bereits vorhandene Daten zu strukturieren und zu analysieren, um so neues Wissen und neue Erkenntnisse zu generieren. Durch den Einsatz künstlicher Intelligenz ermöglicht Data Mining zudem einen Blick in die Zukunft. Data Mining-Algorithmen können Hypothesen über mögliche Zusammenhänge, Muster oder Trends erstellen und diese gleichzeitig auf ihre Wahrscheinlichkeit überprüfen.
Auch wenn Data Mining breit genutzt und seine Fähigkeiten allseits geschätzt sind, dürfen die rechtlichen Risiken, die im Zusammenhang mit der automatisierten Datenanalyse und urheberrechtlich geschützten Werken bestehen, nicht unbeachtet bleiben.
Das vorliegende Legal Update gibt Auskunft darüber, um was es sich beim Data Mining handelt, welche urheberrechtlichen Brennpunkte bestehen und wie der Gesetzgeber auf die zurzeit bestehenden Unsicherheiten reagieren will.
Was ist Data Mining?
Data Mining bezeichnet die automatisierte, softwarebasierte Untersuchung, Analyse und Vernetzung grosser Datenmengen zwecks Entdeckung neuer Muster und Querverbindungen in bereits vorhandenen Daten bzw. der Gewinnung bisher unbekannter Informationen aus solchen Daten. Im Kern dient Data Mining somit der Erzeugung neuer Erkenntnisse und neuen Wissens.
Gegenstand des Data Mining können Daten jeglicher Art sein (bspw. Videos, Texte oder Bilder). Bilden einzig un- oder schwachstrukturierte, digitalisierte Textdaten Gegenstand des Data Mining, so wird gemeinhin von Text Mining gesprochen.
Wie funktioniert Data Mining?
Obwohl sich Data Mining in technischer Hinsicht mannigfach ausgestalten lässt, kann der Prozess des Data Mining grundsätzlich in die folgenden zwei Hauptschritte unterteilt werden.
In einem ersten Schritt ist die Grundlage eines jeden Data Mining-Prozesses zu erstellen: der Datensatz. Dieser Datensatz wird aufgrund von Selektionskriterien und unter Zuhilfenahme von Such- und Extraktionsprogrammen (sog. Crawling- und Scraping-Software) aus frei zugänglichen, digitalen Daten automatisch generiert. Die für den Datensatz relevanten Daten werden dabei von den entsprechenden Softwares heruntergeladen und fortlaufend und dauerhaft gespeichert. Falls notwendig erfolgt eine Transformation des Datensatzes in ein für die Data Mining-Software verarbeitbares Datenformat.
In einem zweiten Schritt erfolgt das eigentliche Data Mining, indem die Data Mining-Software auf den Datensatz angewendet wird. Bei dieser Anwendung werden die einzelnen im Datensatz enthaltenen Daten in einem Direktzugriffspeicher (sog. Random Access Memory) vorübergehend zwischengespeichert, auf die einschlägigen Informationen hin überprüft und anschliessend durch neue Daten überschrieben und damit gelöscht.
Worin liegt die urheberrechtliche Problematik beim Data Mining?
Im Rahmen des Data Mining-Prozesses werden Daten permanent (zwecks Erstellung des Datensatzes) sowie vorübergehend (zwecks Analyse des Datensatzes) gespeichert. Diese Speicherungen setzen in technischer Hinsicht voraus, dass die betroffenen Daten kopiert bzw. vervielfältigt werden.
Vor diesem Hintergrund kann die Nutzung von Daten im Data Mining-Prozess aus einer urheberrechtlichen Perspektive problematisch sein, wenn die von der Vervielfältigung betroffenen Daten urheberrechtlich geschützte Werke darstellen.
Nach der Legaldefinition geniesst ein Werk urheberrechtlichen Schutz, wenn es eine geistige Schöpfungen der Literatur und Kunst ist und einen individuellen Charakter aufweist (Art. 2 Abs. 1 URG). Diese Voraussetzungen sind bei unbearbeiteten Daten (sog. Rohdaten) selten erfüllt, weshalb diese kaum urheberrechtlich geschützt sind. Hingegen geniessen Texte mit literarischem, wissenschaftlichem und/oder technischem Inhalt sowie Bilder oder audiovisuelle Werke regelmässig Urheberrechtsschutz. Gleiches gilt für Datensammlungen, sofern sie bezüglich Auswahl und Anordnung der Daten individuellen Charakter aufweisen.
In Bezug auf solche Werke hat der Urheber das ausschliessliche Recht zu bestimmen, ob, wann und wie sein Werk verwendet wird (Art. 10 Abs. 1 URG). Teil dieses Ausschliesslichkeitsrechts bildet das Recht des Urhebers, sein Werk zu vervielfältigen (Art. 10 Abs. 2 lit. a URG; sog. Vervielfältigungsrecht) und dadurch eine weitere, von der Vorlage unabhängige Wahrnehmung des Werkes durch menschliche Sinne zu ermöglichen.
Weil es unbeachtlich ist, ob die hergestellte Vervielfältigung eine dauerhafte oder bloss vorübergehende ist, stellt im Data Mining-Prozess sowohl das Speichern der Daten zwecks Erstellung des Datensatzes als auch zwecks deren Analyse eine Vervielfältigung und damit eine dem Urheber vorbehaltene Nutzungshandlung des Werkes dar.
Das unautorisierte Vervielfältigen eines urheberrechtlich geschützten Werkes im Data Mining-Prozess durch einen Dritten begründet folglich grundsätzlich eine Urheberrechtsverletzung, welche sowohl zivil- als auch strafrechtlich geahndet werden kann.
Führt Data Mining per se zu Urheberrechtsverletzungen?
Das vorgenannte urheberrechtliche Verbotsrecht gilt nicht absolut. Das schweizerische Urheberrechtsgesetz kennt sachliche Schranken, welche bei Vorliegen bestimmter Voraussetzungen die Ausschliesslichkeitsrechte des Urhebers in Bezug auf bereits veröffentlichte Werke einschränken (Art. 19 ff. URG).
Im Zusammenhang mit Data Mining, bei welchen urheberrechtlich geschützte Werke Teil der zu analysierenden Daten sind, gilt es vordergründig die Schranke der Werkverwendung zum Eigengebrauch sowie die Schranke für vorübergehende Vervielfältigungen zu beachten. Die Anwendbarkeit der Schrankennormen ist in Bezug auf die zwei Hauptprozessschritte des Data Mining (vgl. Ziffer 3) je einzeln zu beurteilen.
Schranke des Eigengebrauchs
Von Gesetzes wegen dürfen veröffentlichte Werke zum Eigengebrauch verwendet werden, ohne dass hierfür eine Zustimmung des Rechteinhabers notwendig würde. Als Eigengebrauch gilt unter anderem jede Werkverwendung im persönlichen Bereich und im Kreis von Personen, die unter sich eng verbunden sind (Art. 19 Abs. 1 lit. a URG; sog. Privatgebrauch).
Weil zum Privatgebrauch grundsätzlich jede Werknutzung zulässig ist, sind sowohl permanente als auch vorübergehende Vervielfältigungen eines urheberrechtlich geschützten Werkes zugelassen. Erfolgt im Rahmen des Data Mining somit die Erstellung des Datensatzes und dessen Analyse einzig zu privaten Zwecken, so ist es natürlichen Personen erlaubt, eine automatisierte Datenanalyse vorzunehmen. Die Veröffentlichung der Ergebnisse aus dem Data Mining ist hingegen von der Privatgebrauchsschranke nicht gedeckt und daher ohne Einwilligung des Urhebers unzulässig.
Juristischen Personen kann die Werkverwendung zum Eigengebrauch im Rahmen des betriebsinternen Gebrauchs zustehen (Art. 19 Abs. 1 lit. c URG). Demnach dürfen urheberrechtlich geschützte, veröffentlichte Werke – unter Ausnahme der (weitgehend) vollständigen Vervielfältigung von im Handel erhältlichen Werkexemplaren – zu Informations- und Dokumentationszwecken in Betrieben, öffentlichen Verwaltungen, Institutionen, Kommissionen und ähnlichen Einrichtungen intern vervielfältigt, verbreitet und zugänglich gemacht werden.
Weil das Data Mining nicht einzig der betriebsinternen (zweckgebundenen) Wissensvermittlung dient, ist fraglich, ob und in welchem Umfang sich die vorgenannten Einrichtungen überhaupt auf die Schranke des betriebsinternen Gebrauchs berufen können. Zudem ist zu beachten, dass die Vervielfältigung (zwecks Erstellung des Datensatzes) zum betriebsinternen Gebrauch einer Kopiervergütungspflicht unterliegt (Art. 20 Abs. 2 URG).
Schranke der vorübergehenden Vervielfältigung
Die vorübergehende Vervielfältigung eines Werkes ist zulässig, wenn sie (i) flüchtig oder begleitend ist, (ii) einen integralen und wesentlichen Teil eines technischen Verfahrens darstellt, (iii) ausschliesslich der Übertragung in einem Netz zwischen Dritten durch einen Vermittler oder einer rechtmässigen Nutzung dient, und (iv) die Vervielfältigung keine eigenständige wirtschaftliche Bedeutung hat (Art. 24a URG).
Die Flüchtigkeit einer Vervielfältigung wird gemeinhin angenommen, wenn deren Lebensdauer auf das fehlerlose Funktionieren des technischen Vorgangs beschränkt ist. Die Speicherung urheberrechtlich geschützter Werke, die zur Erstellung des Datensatzes verwendet werden, können vor diesem Hintergrund nicht als flüchtig qualifiziert werden, weil sie dauerhaft gespeichert und mit Beendigung der Datenanalyse nicht gelöscht werden. Der Schrankennorm für vorübergehende Vervielfältigungen ist die Anwendung für die Erstellung des Datensatzes somit versagt.
Hingegen sind die Voraussetzungen der Schrankennorm nach Art. 24a URG in Bezug auf die eigentliche Datenanalyse (Schritt 2) erfüllt. Diese ist vom urheberrechtlichen Verbotsrecht ausgenommen und daher zulässig.
Schlussfolgerung
Zusammenfassend ist festzuhalten, dass unter geltendem Schweizer Recht Data Mining mit urheberrechtlich geschützten Werken ohne Rechteeinräumung durch den Urheber nur für den privaten oder (unter Umständen) für den betriebsinternen Gebrauch zulässig ist.
Dient die automatisierte Datenanalyse urheberrechtlich geschützter Werke hingegen nicht einzig privaten oder betriebsinternen Zwecken, so ist diese ohne Einwilligung des Rechteinhabers unzulässig, weil das Erstellen des Datensatzes als Grundlage eines jeden Data Mining-Prozesses durch keine urheberrechtliche Schrankennorm gerechtfertigt ist.
Die Einholung dieser erforderlichen Einwilligungen stellt in der Praxis regelmässig ein schwieriges, kosten- und zeitintensives Unterfangen dar. Oftmals ist unklar, ob und gegebenenfalls wo sich urheberrechtlich geschützte Werke in den zu analysierenden Daten befinden und wer der Inhaber dieser Rechte ist. Unter geltendem Recht ist die Gefahr folglich eine immanente, Data Mining ohne die notwendigen Einverständnisse allfälliger Rechteinhaber und damit in rechtlich unzulässiger Art und Weise zu betreiben.
Welche Änderungen bringt das revidierte Urheberrechtsgesetz?
In Anbetracht der grossen Bedeutung der Forschung in der Schweiz und der mit dieser Forschungstätigkeit verbundenen Unsicherheiten in Bezug auf die Zulässigkeit des Data Mining wird im revidierten Urheberrechtsgesetz eine neue Schrankennorm eingeführt.
Demgemäss soll es künftig zulässig sein, zum Zwecke der wissenschaftlichen Forschung ein Werk zu vervielfältigen, wenn die Vervielfältigung durch die Anwendung eines technischen Verfahrens bedingt ist und zu den zu vervielfältigenden Werken ein rechtmässiger Zugang besteht (Art. 24d Abs. 1 E-URG). Darüber hinaus soll es zulässig sein, die in diesem Rahmen angefertigten Vervielfältigungen nach Abschluss der wissenschaftlichen Forschung zu Archivierungs- und Sicherungszwecken aufzubewahren (Art. 24d Abs. 2 E-URG). Keine Anwendung findet die sog. Wissenschaftsschranke auf die Vervielfältigung von Computerprogrammen (Art. 24d Abs. 3 E-URG).
Der (Haupt-)Zweck der wissenschaftlichen Forschung, die als systematische Suche nach neuen Erkenntnissen innerhalb einer oder mehrerer wissenschaftlichen Disziplinen umschrieben wird, ist Voraussetzung für die Anwendbarkeit der Wissenschaftsschranke.
Sowohl die Grundlagenforschung als auch die angewandte Forschung werden umfasst. Im Unterschied zum Recht der europäischen Union soll auch die kommerzielle Forschung unter die neue Schrankennorm fallen, da eine Beschränkung auf nicht-kommerzielle Forschung zu unlösbaren Abgrenzungsproblemen führen würde.
Überdies soll die Wissenschaftsschranke für vorübergehende sowie permanente Vervielfältigungen (auch ganzer Werke) gelten, solange diese durch die Anwendung eines technischen Verfahrens (bspw. Algorithmen) zur Forschung bedingt sind. Letztlich soll es zulässig sein, die aus der Forschung resultierenden Ergebnisse zu veröffentlichen und zu vertreiben, solange sie als von den Ursprungswerken unabhängig zu betrachten sind.
Weil die Wissenschaftsschranke nur greift, wenn der Zugang zu den urheberrechtlichen Werken rechtmässig erfolgt (bspw. anzunehmen, wenn die Werke rechtmässig erworben worden oder im Internet frei zugänglich sind), erfordert die neue Schrankennorm keine explizite Zustimmung des Urhebers zur technischen Vervielfältigung des Werkes. Ein Nutzungsvorbehalt wie im Recht der europäischen Union steht diesem nicht zu. Darüber hinaus ist keine Vergütung geschuldet; die Wissenschaftsschranke ist im Gegensatz zur Schranke des betriebsinternen Gebrauchs vergütungsfrei.
Ausblick
Mit der neuen Wissenschaftsschranke wird auf die im Moment unbefriedigende Sachlage reagiert, dass beim Data Mining zu Forschungszwecken mit urheberrechtlich geschützten Werken sämtliche notwendigen Bewilligungen in Form von Lizenzen eingeholt und Vergütungen entrichtet werden müssen.
Obwohl die Wissenschaftsschranke bestehende Unsicherheiten und Unannehmlichkeiten in Bezug auf das Data Mining zu Forschungszwecken begegnet, beantwortet sie die übrigen Fragen rund um die automatisierte Datenanalyse ausserhalb der Forschung nicht.
Ausserhalb des privaten bzw. betriebsinternen Gebrauchs sind daher weiterhin sämtliche von den Rechteinhabern notwendigen Zustimmungen einzuholen und die hierfür notwendigen Vergütungen zu entrichten, sofern das Data Mining nicht zu eigentlichen Forschungszwecken erfolgt.
In zeitlicher Hinsicht ist zu beachten, dass die Urheberrechtsrevision nach wie vor in der parlamentarischen Beratung steckt; mit dem Inkrafttreten der neuen Regelungen ist somit frühestens im Jahre 2020 zu rechnen.
Beteiligte Autoren: Lorenza Ferrari (Partner), Nando Lappert (Associate), Luca Bossard (Junior Associate)