DataLabo 2017 - Gérer les données de la recherche : Partage de bonnes pratiques

28 mars 2017

bandeau_datalabo2017_v2.jpg

Comment gérer et échanger à la fois des données d'expériences, des images numérisées et des données d’enquêtes ? Le cycle de vie des données de la recherche, de leur création à leur diffusion en passant par leur analyse, au sein de la communauté interdisciplinaire nous amène à questionner les pratiques autour de celles-ci. Comment rassembler, valoriser et rendre accessibles des données produites par des acteurs différents utilisant des méthodes elles aussi très différentes ? Ces questions liées à la gestion des données de la recherche se posent de façon de plus en plus prégnante aux chercheurs et sont un véritable défi.

Le contexte local favorable (création de Grenoble Alpes Data Institute et les missions de l’UMS GRICAD), le contexte national et international en évolution (l'application prochaine en mai 2018 du règlement général européen sur la protection des données et la libre circulation des données, l'adoption récente de la loi sur la République Numérique et les directives européennes sur l'Open Research Data et l'Open Access dans le cadre du programme européen Horizon 2020) constituent un terrain favorable pour la prise en compte de ces nouvelles dispositions en organisant une réflexion collective autour des données de la recherche.

DataLabo2017 : Introduction

Alain RIVET

Retouvez l'intégrale des vidéos du DataLabo2017

PerSCiDO_Grenoble_Alpes : Principes et fonctionnalités d'une plateforme ouverte et interopérable de partage de jeux de données

Marie-Christine ROUSSET

PerSCiDO_Grenoble_Alpes est une plateforme de partage de jeux de données, développée dans le cadre du labex PERSYVAL-lab qui fédère les sciences du numérique à Grenoble. Le but de cette plateforme est de faciliter l'exploration de jeux de données pour les chercheurs désireux de tester et comparer leurs propres méthodes sur de nouvelles données. Une caractéristique importante de PerSciDo_Grenoble_Alpes est de découpler le problème du stockage des jeux de données de leur description à l'aide de métadonnées riches et flexibles. La plateforme PerSciDo_Grenoble_Alpes offre de manière transparente à ses utilisateurs un espace de stockage adapté en s'appuyant sur des infrastructures mutualisées de type data center ou des serveurs qui hébergent déjà des données ouvertes pour la recherche. L'aspect innovant de PerSciDo_Grenoble_Alpes repose sur son modèle de métadonnées et son infrastructure qui s'inscrivent dans les standards recommandés par le W3C à la base du succès du déploiement du Linked Open Data (http://linkeddata/org).

Gestion des données sismologiques de l'infrastructure de recherche RESIF : de la collecte à la diffusion et à la valorisation

Catherine PÉQUEGNAT

RESIF est un équipement national d'excellence pour l'observation et la compréhension de la Terre interne.

C'est un instrument ambitieux permettant à des disciplines comme la géodésie, la sismologie, la gravimétrie, d'acquérir de nouvelles données de qualité et ainsi de progresser dans notre compréhension de la dynamique de notre planète.

Le centre de données national de RESIF pour la sismologie est implanté à Grenoble, sur les infrastructures de GRICAD et de la DSI UGA.

Il est l'un des principaux nœuds de l'archive virtuelle européenne EIDA pour la sismologie dans le cadre du projet européen EPOS.
Notre présentation portera sur les données, les métadonnées et les services exposés par le centre de données, et sur le système
 d'information réparti mis en place pour assurer la leur normalisation, leur qualité et
leur valorisation.

FLI-IAM : Une infrastructure nationale pour la gestion des données et des outils en imagerie in vivo

Michel DOJAT

Dans le cadre des investissements d'Avenir « Infrastructure en Biologie et Santé », France Life Imaging (FLI) a pour ambition de coordonner à l'échelle nationale les activités de recherche et les compétences en imagerie in vivo chez l'homme et l'animal, et de fournir un accès commode à un éventail complet de technologies d'imagerie (150 systèmes d'imagerie) et de services intégrés et harmonisés. Au sein de FLI, l'infrastructure “Image Analysis and Management” (IAM) a pour objectif la mise en place d'une infrastructure informatique (logicielle et matérielle) pour la gestion et le traitement dématérialisé des données d'imagerie in vivo (homme et petit animal) en provenance d'acteurs très divers (centres de recherche, hôpitaux, recherche clinique publique et privée, etc...). FLI-IAM propose une infrastructure versatile, développée à partir de composants logiciels fournis par les partenaires académiques du projet et permettant la connexion de composants allant de la gestion des données et des méta-données d'imagerie au traitement des images produites à travers des outils mis à disposition sur le poste de travail de l'usager ou à travers l'usage de ressources de calcul massives (grilles de calcul, clusters, ...). Dans ce cadre, FLI-IAM fournit un cadre d'interopérabilité permettant de faire cohabiter des composants logiciels de diverses origines (solutions académiques ou provenant de fournisseurs de logiciels) pour l'offre de services d'hébergement et de calcul de données d'imagerie in-vivo. Ainsi, l'infrastructure FLI-IAM en cours de développement représente une avancée technologique importante pour fédérer de façon structurée les données et méta-données d'imagerie in vivo acquises sur différents sites, fusionner des données hétérogènes (structurales, fonctionnelles, comportementales et génétiques), faciliter le déploiement et l'exécution de chaînes de traitement de référence et permettre le développement de projets à large échelle chez l'homme et l'animal pour dépasser les limitations des études actuelles.