EC
Métadonnées et interopérabilité
Compétences requises
Notions de base en Informatique générale, Programmation Objet, bases de données.
--
Basics in computer science, Object oriented programming, Database design and programming (basics).
Compétences visées
Expliquer le développement de projets pour la distribution pérenne des données scientifiques, l’organisation et l' accès à des plateformes interopérables. Principes de partages FAIR de la science ouverte: données, codes et implications vis à vis des architectures distribuées.
Compréhension des enjeux et principes de distribution ouverte des données, éléments de base sur les schémas de distribution des métadonnées et pratique des formats de distribution XML, RDF.
--
Explain how a project can be developed at a large scale within a scientific community. How to share heterogeneous and complex data in an interoperable framework and how to define and handle metadata for this. Examples from the astronomical community are explained in detail using the Virtual Observatory project as a framework example. Other examples in other science domains are also presented.
Understand the role of metadata and how to design them for a simple project. Practice with XML /JSON formats and get used to an interoperable infrastructure : what makes it work and what makes it fail.
Syllabus
Métadonnées pour l'inter-opérabilité - Partage de données scientifiques: Le cas des données massives, hétérogènes et complexes. Rôle des métadonnées. Le besoin de description et standardisation.
Quelques exemples: observations astronomiques, systèmes d’information géographiques, etc.
Formats de représentation : XML, RDF : introduction /rappels sur ces formats
Archivage et principe de distribution
Infrastructure base de données / applications clients serveurs et webservices
Données propriétaires vs Données partagées : les principes FAIR (Findable Accessible Interoperable Reliable)
Metadonnées de caractérisation des observations : cohérence, pertinence, requêtes. Application aux données astronomiques.
Provenance des données
Modèles et sérialisations: Prov-W3C . Applications en astronomie, géosciences et imagerie médicale.
Partage de codes : Principes, Exemples de la distribution Astropy, ASCL et Software Heritage.
Les acteurs de développement de l' accès ouvert aux données scientifiques: Context européen, exemples de projets (Research Data Alliance, IVOA, IPPC Climate change, CODATA, EOSC etc.)
--
Sharing scientific data: the keys of data and metadata. Examples in observation science: remote sensing, geoscience, astronomy. Metadata representation in XML, RDF and other formats.
Archives and data publishing : the basic infrastructure: database, servers and clients applications. Examples of webservices in the Virtual Observatory context.
Sharing data : the FAIR principles. Application in the Virtual Observatory project.
Data provenance: models and serializations in and how to derive from it.
Code sharing: basic principles, Metadata standards as used in ASCL, Software Heritage, etc.
Development examples in various european/international contexts : IPPC (climate), Research Data Alliance (RDA , open data), IVOA (astronomy).