Journée du 10 mars 2015 : « Maîtriser les droits et obligations »

Lieu : MESHS (espace Baïetto), 2 rue des Canonniers, 59000 Lille


   Les thèses de doctorat sont protégées par le droit d’auteur. Et qu’en est-il des données scientifiques ? Quels droits s’appliquent aux résultats de la recherche ? Quelles sont les obligations du chercheur ? Comment protéger des données personnelles ? Comment diffuser des tableaux et bases de données sur Internet ? Sous quelle licence ?

   La deuxième journée du séminaire « Les données de la recherche dans les humanités numériques » fera le point et répondra aux questions des chercheurs. Les conférences du matin donneront une vue d’ensemble des droits et obligations liés à la valorisation et diffusion des données de la recherche, avec des approches américaines et françaises. L’atelier de l’après-midi sera l’occasion d’aller plus loin dans l’analyse et la discussion de certains aspects, y compris à partir des cas concrets des participants.

   La journée s’adresse en particulier aux doctorants et jeunes chercheurs qui souhaitent diffuser et valoriser leurs résultats et/ou qui sont obligés de préparer un plan de gestion des données (data management plan) dans le cadre d’un projet H2020, ANR etc.


   Doctoral theses are protected by copyright. And what about the research data? What rights apply to the scientific results? What are the obligations of the researcher? How to protect personal data (privacy)? How to publish spreadsheets and databases on the Internet? Under which license?

   The second day of the seminar "The research data in digital humanities" will assess the situation and answer questions from the researchers. The morning keynotes will give an overview of the rights and obligations related to the use and dissemination of research data, with US and French perspectives. The workshop in the afternoon will be the opportunity to go further in the analysis and discussion of aspects, including from real cases of participants.

   The event is scheduled for PhD students and young researchers who wish to disseminate and exploit their results and/or who have to prepare a data management plan as part of a project in the H2020 program or for the French National Research Agency ANR.

 

Coordination : Joachim Schöpfel, maître de conférences en SIC, directeur ANRT

Retrouvez son intervention sur la Web-Tv de l'université Lille 3 : http://live3.univ-lille3.fr/video-recherche/les-donnees-de-la-recherche-droits-et-obligations.html


Synthèse de la journée 2

   La seconde journée du séminaire « Les données de la recherche dans les humanités numériques » a orienté son débat, ses réflexions et ses approches sur la question des droits, des obligations et  des dispositions juridiques à prendre en considération par les chercheurs en sciences humaines et sociales, lors de la collecte et de la réutilisation des données. L'accès, l'ouverture, la diffusion, le choix des jeux de données, les conditions de collecte, les restrictions et les exceptions juridiques de leur réutilisation, les différents types de licences, la définition et l'étude des critères de distinction entre une donnée de recherche, une donnée sensible et une donnée personnelle ont été les principaux axes d'intervention des conférencières invitées.


Matinée : conférences

Suzanne Vergnolle (Etalab, Secrétariat Général pour la Modernisation de l'action publique) : La politique d'ouverture des données publiques


Présentation

   Dans sa présentation, l'intervenante met l'accent sur l'ouverture des données publiques qui figurent comme l'un des principaux objectifs de création de la mission Etalab. Elle démontre que la volonté de rendre les données administratives transparentes et accessibles au public n'est pas récente. C'est une disposition abordée dans l'article 15 de la déclaration des droits de l'homme (1789) et sur laquelle se fonde la loi du 17 juillet 1978, visant l'organisation d'accès du public aux documents administratifs. L'innovation de la recherche et la modernisation de l'action publique, ciblant le décloisonnement de l’administration, sont les seconds pendants de l'Open Data. Suzanne Vergnolles définit par la suite le document administratif à travers la définition de la Commission d'accès aux documents administratifs. Elle insiste sur la notion du service public quelle que soit la forme du support, la date et le lieu du stockage. Elle cherche par ailleurs à démontrer que la démocratisation d'accès préserve aussi certaines libertés et principes dont celle du secret de la défense nationale mais permet aussi des dérogations d'accès aux institutions de la recherche, de l'enseignement et les établissements à caractère culturel. Pour conclure elle justifie le choix de la licence libre Etalab inspirée des Creative Commons qui permet la gratuité, la protection des données, l'accès, la large diffusion et la souplesse dans la réutilisation des données. Elle insiste surtout sur le fait que cette licence est parfaitement compatible avec le droit français, ce qui figure comme un atout non négligeable.


Discussion

   L'enrichissement, la protection des données, le modèle économique (donnée gratuite ou propriétaire), les exceptions du droit d'auteur, le format des données sont les principales questions posées lors du débat. Pour répondre, l'intervenante a bien précisé que les données qui se trouvent sur la plateforme data.gouv.fr sont des données publiques, gratuites, réutilisable sous différents types de formats. Elle précise que seuls les détenteurs des jeux de données sont en mesure de convertir le type format de publication de leurs données et qu'ils pourraient très bien les publier en RDF s'ils le souhaitent. En ce qui concerne le format propriétaire de certaines données, Suzanne Vergnolles mentionne que la mission Etalab cherche à amoindrir les redevances réglementées par le CADA pour certains types de données en faisant la promotion de la gratuité.


Retrouvez son intervention sur la Web-Tv de l'université Lille 3 : http://live3.univ-lille3.fr/video-recherche/la-politique-douverture-des-donnees-publiques.html


Nathalie Morcrette (INRA, Directrice de l’Unité Contrats et Propriété Intellectuelle) : Production, diffusion et utilisation des données de la recherche


Présentation

   Cette intervention s'est focalisée dans un premier temps sur la définition de la donnée de la recherche selon l'OCDE et l'Association des Archivistes Français. Par la suite, l'intervenante a mis l'accent sur le processus de création, de traitement, de diffusion et de réutilisation des données. On part de données brutes pour aboutir à une nouvelle donnée, différente de celle du départ. Elle précise aussi que les données en soi ne bénéficient pas du droit de propriété intellectuelle quand elles sont générées par une machine. Ce qui est réellement protégé, se sont les bases de données. Par ailleurs, toute donnée originale (dans sa forme ou l'idée qu'elle présente) est soumise au droit d'auteur. À cette règle, on relève certaines exceptions comme le droit à la courte citation. Dans le cadre du textmining, il est indispensable de recourir aux autorisations des auteurs des textes afin de procéder à la fouille et l'analyse des données de manière légale. L'accès aux données à caractère personnel, permettant l'identification de personnes physiques, n'est pas autorisé. Pour y parvenir, il faudrait une double autorisation, de la personne concernée et de la CNIL. La présentation a distingué les différents cas de propriété intellectuelle pour les chercheurs et l'agent public. L'intervenante précise que lorsqu'il y a invention de processus, le droit de propriété est attribué au chercheur mais si ce dernier développe un dispositif la loi CADA relègue le droit de propriété à l'institution. Durant sa présentation, elle évoque la notion du secret et mentionne les nouveaux types de données qu'on pourrait bien exploiter, dont celles de l'environnement comme les données géographiques (gérées par la directive européenne INSPIRE) et environnementales. Vers la fin de son intervention, Nathalie Morcrette évoque les précautions à prendre lors de la réutilisation des données. Elle insiste sur la provenance et la nature de la donnée. Elle évoque aussi les types de licences permettant la protection et la réutilisation des données comme l'Open Data Base Licence et Etalab (qui est plus adaptée au droit français contrairement à ODBL).


Discussion

   Le débat a été très riche. On a évoqué la question de l'exploitation des données recueillis lors du textmining sur des personnages politiques et l'intervenante a précisé qu'il ya un double problème, celui du droit d'auteur des textes et l'autorisation d'accès aux données personnelles. Elle précise que, même si ces données sont rendues publiques, cela ne veut pas forcément dire qu'elles sont libres de droit et c'est la raison pour laquelle elle invite la personne à vérifier les conditions d'utilisation. D'autres questions sur le secret d'affaires, la non-identification des personnes dans une base de données, le droit de propriété des données de corpus ont été abordées. À ces questions, l'intervenante a précisé qu'il est difficile de se prononcer sur le secret d'affaires contrairement à ce qui se passe aux États-Unis, dans la mesure où il n’existe pas encore en France une véritable réglementation gérant une telle problématique. En ce qui concerne la réexploitation des corpus d'enquêtes et leur libre exploitation par un laboratoire de recherche, elle précise qu'il faudra procéder au cas par cas en fonction afin de déterminer la gratuité ou non de chaque type de donnée.

 

Retrouvez son intervention sur la Web-Tv de l'université Lille 3 : http://live3.univ-lille3.fr/video-recherche/production-diffusion-et-utilisation-des-donnees-de-la-recherche.html

 

Après-midi : Ateliers pratiques

Modérateur : Joachim Schöpfel


Audrey Ego (juriste, CRDP, Université de Lille 2) : Propriété intellectuelle et données de la recherche


Présentation

   La propriété intellectuelle, sa définition, sa réglementation, son contexte d'utilisation, les critères de son attribution et la manière selon laquelle elle permet la protection des données, sont les principaux axes de cette présentation. Lors de cet atelier, l'intervenante précise que le droit de la propriété intellectuelle français s'appuie sur la directive européenne de 2001, en cours de révision. Elle relève l'existence d'une double problématique à laquelle sont confrontés les chercheurs et les réutilisateurs des données : le libre accès et la protection des données. Pour définir cette propriété intellectuelle, l'intervenante précise qu’il s’agit de l’« l'ensemble des droits exclusifs octroyés à l'auteur pour une création intellectuelle ». Elle précise que la propriété intellectuelle est formée d'une « propriété artistique » qui ne nécessite aucun dépôt légal puisqu'elle est régie par le droit d'auteur et une « propriété industrielle » nécessitant ce dépôt auprès de l'INPIE afin d'assurer la protection de la marque déposée. Elle rappelle la définition du droit d'auteur en insistant sur les droits moraux permettant la divulgation des données et les droits patrimoniaux favorisant leur protection et leur réexploitation. Elle revient sur les exceptions, dont la notion de courte citation et l'exception pédagogique et de recherche, permettant la réutilisation d’œuvres protégées par le droit d'auteur dans le cadre de l'enseignement et de la recherche. Cette prérogative a été signée dans le cadre de trois accords sectoriels entre le ministère de l'enseignement supérieur, le CFC (pour le droit de la copie), le CNC (pour les œuvres   cinématographiques) et le CCN (pour les œuvres musicales). Pour conclure, elle évoque le droit des bases de données et insiste sur le fait que si la base de données n'est pas soumise au droit d’auteur faute d'originalité, elle serait  protégée par le droit « Sui Generis » qui attribue le droit d'auteur au producteur.


Discussion

   Le débat s'est centré sur la question du dépôt légal pour la protection de l’authenticité d'une base de données et sur la propriété intellectuelle du doctorant pour ses travaux de recherche ; si oui ou non ce dernier pouvait être titulaire de la paternité de ses œuvres ou si c'est le laboratoire de recherche auquel il est affecté qui bénéficie de ce droit. La réponse c'est qu'un doctorant est considéré comme le principal auteur de son œuvre sauf s'il est soumis à des conditions spécifiques de diffusion de son travail dans le cadre d'un cahier des charges. La protection du logiciel a aussi été évoquée et l'intervenante précise que cette protection s'effectue par le biais du code source et de la documentation adéquate. Enfin on a posé une question sur la brevetabilité d'un code source et la réponse a été qu'en France on n'attribue pas de brevet pour un logiciel dans un environnement de création mais si vous êtes dans un environnement numérique c'est le droit du pays de l’hébergement qu'on applique.


Retrouvez son intervention sur la Web-Tv de l'université Lille 3 : http://live3.univ-lille3.fr/video-recherche/propriete-intellectuelle-et-donnees-de-la-recherche.html


Émilie Masson (juriste, service Informatique et Libertés, CNRS) : La protection des données personnelles


Présentation

   La dernière présentation a mis en exergue les lois permettant le libre accès aux documents administratifs (loi CADA 1978) et celle permettant la protection des personnes physiques et non morales à savoir la loi informatique et libertés. Elle précise que dans le cadre de la transparence et de la protection des données, la CNIL a désigné un « Correspondant informatique » chargé de traiter les enregistrements de l’institution en la matière. Puis l'intervenante définit les données personnelles et les données sensibles en mentionnant que les premières ne se limitent pas aux noms et aux prénoms des individus mais les dépassent pour tout indice permettant l'identification d'une personne physique y compris les avatars. Elle mentionne que les données sensibles sont relatives aux opinions, à l'appartenance ethnique, aux croyances, etc. La notion de fichier est importante dans la mention de la donnée personnelle. Tant que cette dernière n'est pas archivée dans un fichier de manière chronologique, alphabétique, etc. on ne peut pas la considérer comme personnelle, elle le serait, dans le cas contraire. Elle revient aussi sur la notion d'exception pour la mention des données à caractère personnel en déclarant que ces dernières peuvent être dévoilées dans un cadre professionnel, par exemple lorsqu'on soumet ses congés à l'avance pour assister à certaines fêtes religieuses. Elle précise que le numéro de sécurité sociale est par excellence la donnée à ne jamais dévoiler car il fait partie des données sensibles. Elle mentionne par ailleurs quelques précautions à prendre lors du traitement des données personnelles. Deux critères sont mentionnés, l'objectif et la finalité, c'est à dire qu'il faudrait justifier la collecte de telles données en mentionnant leur adéquation avec la recherche. Le second critère est la durée limitée de sauvegarde des données. En effet, si la recherche est publiée, il faudrait supprimer toutes les données personnelles car on estime que leur existence n'est plus pertinent en dehors du cadre de la recherche.


Discussion

   Lors des débats, on s'est demandé si la loi de la préservation des données personnelles s'appliquait aux personnes décédées et la réponse était de dire que si votre corpus est composé uniquement de personnes décédées alors la loi ne peut pas s'appliquer. Par ailleurs, si dans ce corpus vous êtes confrontés à des auteurs décédés et d'autres vivants, alors la loi s'applique. On a aussi abordé la question de la date de naissance, sujet très polémique dans le milieu des bibliothèques car certains auteurs exigent son retrait. Certains professionnels ne comprennent pas cette attitude des auteurs alors que ces derniers affichent ce critère dans les réseaux sociaux ou leur curriculum vitae et la réponse est que si les auteurs mettent en ligne leur date de naissance, cela ne veut pas dire qu'elle soit exploitable et libre de droit. Dans ce cas, on applique l'exception de la pertinence des données pour l'expression littéraire et scientifique du signalement et les notices bibliographiques rentrent dans cette exception. On ne peut pas mettre l'année de naissance mais l'institution de rattachement. Enfin, pour les problèmes que pourraient poser les contenus de certaines thèses en ligne, il serait prudent de retirer la thèse en question et de rediriger les personnes qui réclament ce droit de retrait aux auteurs.


Synthèse par Kaouther Azouz, Doctorante en SIC. Laboratoire GERiiCO. Université de Lille 3