Fouille électronique de documents : le débat autour du projet de loi fait rage

Réflexions à l’approche du vote du Sénat le 27 septembre 2016

La fouille électronique de documents serait, selon ses partisans (dont notamment les laboratoires de recherche et les bibliothèques) une pratique incontournable, issue des technologies BIG DATA, permettant d’accélérer la recherche. Selon ses détracteurs, cette pratique mettrait en péril les droits de propriété littéraire et artistique…

Ce qu’il faut retenir : La fouille électronique de documents serait, selon ses partisans (dont notamment les laboratoires de recherche et les bibliothèques) une pratique incontournable, issue des technologies BIG DATA, permettant d’accélérer la recherche. Selon ses détracteurs, cette pratique mettrait en péril les droits de propriété littéraire et artistique. Les deux positions s’affrontent en ce moment même, devant le Parlement, dans le cadre de la discussion du projet de loi pour une république numérique, pour laquelle un vote du Sénat est prévu le 27 septembre prochain, avant promulgation (probablement) début octobre. Retour sur un débat passionné et passionnant, qui suscite des questions juridiques importantes, dont l’enjeu économique est d’envergure.

Pour approfondir :

De quoi s’agit-il ?

La fouille électronique de documents (en anglais « TDM » pour « Text and Data Mining ») correspond à « un processus de recherche automatisé qui porte sur un ensemble de données numériques, dans le but de découvrir de nouvelles connaissances ou de nouvelles idées » (CSPLA, Mission sur l’exploration des données « Text and Data Mining », juillet 2014). En pratique, il s’agit d’un procédé de recherche et d’analyse automatisé par lequel une machine (virtuelle, fonctionnant à partir d’algorithmes) consulte de grande quantités de documents/contenus numériques pour en extraire les informations pertinentes au regard des instructions de recherche paramétrées par l’utilisateur.

La pratique du TDM met en œuvre deux principales étapes : tout d’abord, la consultation des données sources et leur analyse (reconnaissance des mots, phrases et relations) ; ensuite, l’interprétation de cette analyse, permettant de sélectionner les informations pertinentes et d’en extraire la valeur informationnelle. Ces deux étapes sont automatisées, c’est à dire réalisées par une machine.

Cette technologie sert, par exemple, pour la recherche scientifique, afin de sélectionner plus rapidement la littérature utile pour un sujet. À titre d’exemple, c’est une technologie TDM  qui a permis de cartographier le génome humain en compilant automatiquement trois millions de publications (voir le Projet dit « Text2genome »).

Quelle est la problématique juridique ?

Au regard du droit de la propriété littéraire et artistique (droit d’auteur et droit de producteur de base de données – appelé « droit sui generis »), le TDM suscite les questions suivantes : cette technologie met-elle en œuvre l’une des prérogatives du titulaire ? Dans l’affirmative, le TDM entre-t-il dans l’une des exceptions légales prévues pour ces monopoles ?

Les arguments des partisans d’un libre usage

Selon les utilisateurs du TDM, cette technologie est la simple robotisation du processus de lecture et d’analyse de documents.

En absence de reproduction de la « forme » de l’information (dont seul le fond, c’est-à-dire la substance informationnelle, est reprise, tout comme la mémoire humaine qui permet, après avoir lu les documents, d’en mémoriser les idées essentielles), il n’y a ni acte de présentation / réutilisation (communication au public), ni acte de « reproduction / extraction » (reproduction ou transfert sur un autre support).

À supposer même que l’on soit en présence d’une « reproduction/extraction », celle-ci, si elle est, en principe, « temporaire », et devrait donc  bénéficier :

  • pour le droit sui generis : de l’exception permettant à l’utilisateur légitime de la base de données d’effectuer « l’extraction ou la réutilisation d’une partie non substantielle » de celle-ci (CPI, art. L.342-3, 1), sauf pour les opérations répétées et systématiques lorsqu’elles « excèdent manifestement les conditions d’utilisation normale de la base » (CPI, art. L.342-2).

Les arguments des partisans d’un usage soumis au monopole

Selon les éditeurs de contenus, le TDM impliqueraient des actes de reproduction (sans préciser s’il s’agit d’une reproduction provisoire ou non), de structuration, d’analyse et d’utilisation des résultats, parfois à des fins commerciales, qui relèveraient du droit d’auteur et nécessiterait leur autorisation.

Sur un plan pratique, les éditeurs font valoir que :

  • la fouille électronique de documents nécessite souvent la réalisation d’investissements importants, notamment pour la mise en place d’un environnement technique spécifique, qui justifierait une rémunération supplémentaire pour ce type d’usage ;
  • des utilisateurs mal intentionnés pourraient profiter de ces technologies TDM pour télécharger et diffuser des publications issues de ces bases de données, en dehors de tout contrôle.

Que faut-il retenir du projet de loi ?

Sans avoir véritablement approfondi l’analyse sur le fait de savoir si les technologies TDM pourraient – ou non – se prévaloir de l’une des deux exceptions légales précitées, le Gouvernement a tenté de faire inscrire, dans le projet de loi pour une république numérique, une nouvelle exception dédiée aux TDM, visant les « copies ou reproductions numériques réalisées (…) en vue de l’exploration de textes et de données incluses ou associées aux écrits scientifiques pour les besoins de la recherche publique, à l’exclusion de toute finalité commerciale ». Comprenant qu’il était impossible de faire inscrire une nouvelle exception dans le CPI, non prévue par la Directive communautaire DADVSI 2001/29, le Sénat avait précédemment adopté, dans sa version du texte adopté le 3 mai 2016, une disposition déclarant non valables les clauses qui, dans les contrats conclus entre les éditeurs et les organismes de recherche, interdisent « la fouille électronique de ces documents pour les besoins de la recherche publique, à l’exclusion de toute finalité (…) commerciale ».

Appréciation critique

On peut regretter que le débat parlementaire n’ait pas permis de répondre clairement à la question de fond posée par l’usage du TDM : la lecture et l’analyse par des machines de contenus informationnels mettent-ils en œuvre le droit d’auteur et le droit de producteur de base de données ? Les arguments de ceux qui le prétendent prêtent à discussion.

En effet :

(i) Soit les outils de TDM impliquent une véritable « reproduction/extraction », ou bien une véritable « représentation/réutilisation », et alors la sanction existe déjà : il y a contrefaçon ; nul besoin d’un texte législatif pour le préciser, et encore moins pour créer une exception au monopole, car une exception permettant des reproductions permanentes serait dangereuse ;

(ii) Soit ces outils effectuent une simple reproduction « provisoire » des contenus analysés, et ne concernent qu’une partie non substantielle de la base de données explorée, et alors ils devraient bénéficier de l’exception de copie « provisoire » (droit d’auteur) ainsi que de celle l’exception d’usage normal (droit sui generis). L’argument de certains éditeurs, faisant état des gains économiques que confère l’usage de ces technologies à leurs utilisateurs, ne résiste pas à l’analyse : il est entendu que seul un revenu direct tiré des reproductions écarte l’exception de copie provisoire, et non un simple gain de productivité sur une activité connexe (CJUE 17 janvier 2012, « Infopaq II », aff. c–302/10, point 52) ; décider le contraire aboutirait à interdire à des moteurs comme Google de « fouiller » les contenus du web (ce qu’ils font) pour permettre aux internautes de trouver des corrélations pertinentes sur la base de leurs requêtes, au seul motif que cet outil confère des gains de productivité aux utilisateurs…

(iii) Soit, enfin, ces outils n’impliquent aucune reproduction / extraction, ni aucune représentation / réutilisation, et alors on peine à comprendre pour quelle raison valable l’usage de ces technologies devrait être soumis au monopole des droits privatifs intellectuels.

En tout état de cause, ces producteurs peuvent parfaitement, nous semble-t-il, monnayer l’accès à leur base dans un format permettant l’utilisation de ces technologies, puisque les coûts de configuration technique sont un de leurs arguments pour plaider l’application du monopole à ces technologies. Pour finir, une réflexion d’ordre sémantique : la notion de « fouille » électronique rappelle la découverte d’un bien enfoui, d’un trésor par exemple. En mettant à jour des corrélations jusqu’alors insoupçonnées, car enfouies dans des documents, l’exploitant d’une technologie TDM ne devrait-il pas, à l’instar d’un chercheur de trésor,  bénéficier du fruit de sa découverte, ainsi que le prévoit d’ailleurs expressément l’article 716 du Code civil ?

Il est vrai, néanmoins, que ce dernier texte prévoit une répartition à parts égales entre l’inventeur du trésor et le propriétaire du fonds, ce qui plaide pour un partage de la valeur, appuyant en cela la position des producteurs de bases de données.

Mais ce fondement aurait alors le mérite, nous semble-t-il, d’être plus exact sur le plan juridique, que ceux qui s’appuient sur les droits de propriété intellectuelle de manière discutable.

Le débat devra être suivi de près, puisque le projet de loi sera prochainement soumis au vote parlementaire.

A rapprocher : Projet de loi pour une République numérique : Texte de la commission mixte paritaire (séance du 20 juillet 2016)

Sommaire

Autres articles

some
Publication d’un avis de la Commission Supérieure du Numérique et des Postes portant recommandations dans le domaine de la sécurité numérique
La CSNP a publié [...] un avis portant recommandations dans le domaine de la sécurité numérique, et plaidant notamment pour la création d’un parquet national consacré à la cybercriminalité et pour la création d’un dispositif dédié au paiement des rançons
some
Le Conseil d’Etat se prononce sur la conservation des données de connexion à des fins de sauvegarde de la sécurité nationale
Dans une décision en date du 21 avril 2021, le Conseil d’Etat s’est prononcé sur la conformité du droit français au droit européen en matière de conservation des données de connexion par les fournisseurs de services de communications électroniques.
some
La cour d’appel de Paris apporte des précisions sur le régime applicable en matière de violation de licence de logiciel
La cour d’appel de Paris a, dans un arrêt du 19 mars 2021, considéré que la violation d’un contrat de licence de logiciel ne relevait pas de la responsabilité délictuelle mais de la responsabilité contractuelle.
some
Le révolutionnaire avis client
À l’heure où le marketing traditionnel est remis en cause, l’importance de l’avis client est grandissante. 88 % des internautes consultent les avis clients avant un achat en ligne et 73 % avant un achat en boutique .
some
La Commission européenne apporte des éclaircissements concernant les transferts de données personnelles vers le Royaume Uni
La Commission européenne a annoncé avoir engagé des démarches pour autoriser de façon générale les transferts de données à caractère personnel vers le Royaume Uni en publiant le 19 février 2021 deux projets de décisions dites « d’adéquation ».
some
Blocage de sites proposant des produits contrefaisants
En cas d’atteinte à une marque, le titulaire de celle-ci peut solliciter des mesures de blocage d’accès à des sites internet auprès des FAI sur le fondement de l’article 6-I-8 de la LCEN.