FAQ-Données
Cette page n’est plus mise à jour. Rendez-vous ici : https://gtso.couperin.org/gtdonnees/definitions-et-bonnes-pratiques/
Je manque de temps pour gérer mes données, est-ce que je peux m’en occuper juste avant le partage ?
Le temps passé en amont du projet à organiser les fichiers produits dans le cadre du projet permet une gestion plus fluide au quotidien, sans compter qu’il facilite grandement la rédaction d’un DMP. Dans la perspective d’un partage des données, l’anticipation est indispensable : il est pratiquement impossible de partager un jeu de données correctement structuré si on ne l’a pas pensé dès sa création. De plus, il permet d’envisager les éventuels coûts de stockage bien en amont.
Je ne pense pas que mes données seront réutilisées, est-il utile de les partager ?
Témoignage d’une archéologue : “on est capable de lire un carnet de fouille du siècle dernier, on ne peut plus lire nos CD-ROM des années 1990.” La conservation pérenne des données est nécessaire dans de nombreuses disciplines. Leur partage peut permettre de faire émerger des pistes de recherche par le moissonnage de plusieurs jeux et la réagrégation de ceux-ci, comme de sauver des bases de données “historiques”.
Puis-je refuser de partager mes données ?
Tout dépend du régime juridique auquel sont soumises les données produites. Contrairement aux autres catégories de personnels, les enseignants-chercheurs conservent la propriété intellectuelle des œuvres qu’ils produisent.
Dans la plupart des cas, les données de la recherche ne sont pas considérées comme des œuvres, qui sont caractérisées par leur originalité. Les photographies, les textes sont considérés comme des œuvres. En revanche, un tableau de mesures ne l’est pas. Juridiquement, l’idée, ou le temps passé, ne sont pas protégés.
Cela dit, un partage effectué dans des bonnes conditions peut donner des garanties aux auteurs du jeu de données. Partager les données dans un entrepôt de données permet de les protéger : munies d’un DOI, elles seront citées correctement. Une licence de réutilisation permet également de définir ce qui est autorisé dans le cadre du partage.
Je n’ai pas de données
Il arrive pour certains projets que le terme « données » paraisse inadapté. En mathématiques ou en philosophie, par exemple, on peut avoir l’impression de ne pas en produire. Pour autant, il existe dans ces disciplines de nombreux matériaux produits préalablement à la publication d’un article. Voici quelques questions à se poser pour rédiger son plan de gestion de données. Quels matériaux produisez-vous avant d’écrire un article ? Sur quoi vous appuyez-vous pour le réaliser ? Vous pouvez penser à tous les matériaux auxquels vous tenez vraiment et qui seraient irremplaçables ou très longs à recréer, s’ils n’étaient pas sauvegardés ou conservés en sécurité. Les notes, les brouillons, les logiciels, les flux de travail, les protocoles, les modèles et les algorithmes peuvent former ensemble un jeu ou des jeux de données, à partir de laquelle un plan de gestion des données pourrait être rédigé.
Réutiliser des données extérieures consiste aussi en de la manipulation de données. La sélection de données que vous allez faire pour un projet et sur lesquelles il y aura peut-être des droits de réutilisation ou des contraintes de sécurité, aura contribué au résultat scientifique. Lorsque vous utilisez des données préexistantes (qu’elles fassent partie de bases « ouvertes » ou « fermées »), pensez à vous renseigner et à communiquer sur les licences qui encadrent ces données, notamment en matière de droit de réutilisation et diffusion. Vous devez aussi vous assurer que la pérennité d’accès aux données est garantie. Les codes produits dans le cadre de votre recherche peuvent aussi être considérés comme des données de recherche. Pour le partage pérenne du code, privilégiez Software Heritage. Ce type de dépôt peut-être doublé dans HAL grâce à un partenariat entre les deux archives.
Toutes ces données ne seront pas nécessairement partagées, mais elles constituent la matière première de votre recherche, qui peut être décrite dans votre plan de gestion des données.