[31/03/2020, Bx] Hackathon Software Heritage : référencer, préserver et valoriser le code source des logiciels scientifiques

Bonjour,

La manifestation est organisée en partenariat avec : le centre Inria Bordeaux - Sud-Ouest ; la délégation Aquitaine CNRS, le réseau métiers des développeurs de logiciels inter-établissement « CEPAge », le service commun de la documentation de l’Université Bordeaux Montaigne :

Hackathon "Software Heritage : Référencer, préserver et valoriser le code source des logiciels scientifiques "

Dans le processus scientifique, les logiciels occupent une place centrale mais restent paradoxalement insuffisamment pris en compte en matière de curation (mal décrits, les logiciels restent difficiles à identifier et à utiliser), d’évaluation (être l’auteur d’un logiciel reste peu considéré).

En outre, la préservation et le partage de codes sources sont au centre des questions de reproductibilité de la recherche .

L’objectif du hackathon est de rassembler des profils aux expertises complémentaires pour travailler sur les différentes facettes de la préservation des logiciels

Infos pratiques et FAQ

  • 31/03/2020, 8h45-17h
  • Bordeaux, campus de Talence (accès en tram depuis le centre de Bordeaux) : centre Inria Bordeaux Sud-Ouest (200 avenue de la vieille tour, 33 405 Talence)
  • Inscription gratuite pour tous publics ; s’inscrire
  • Ateliers animés en français, diapos en anglais
  • La journée n’est pas filmée

Je n’ai pas de code source à verser dans l’archive. Faut-il être un.e développeur.euse pour participer ? Non. Le hackathon est ouvert à toute personne qui s’intéresse à l’édition scientifique, à la production des données, aux questions d’adaptation des normes et formats descriptifs est la bienvenue. Il n’y a pas de prérequis techniques.

Parle-t-on seulement alors d’anciens logiciels ? Non, le futur se construit dès à présent avec vous. Software Heritage est une bibliothèque de codes à votre disposition.

Mon outil principal est GitHub, existe-t-il un partenariat avec Software Heritage ? Oui, depuis l’automne 2019, GitHub a rejoint les partenaires de l’archive qui recense actuellement 6,4 milliards de fichiers sources provenant de plus de 91 millions de projets, dont Debian, GitHub, GitLab, Gitorious, GoogleCode, GNU, Python Package Index et bien d’autres. Ainsi, l’historique détaillé des révisions de toutes les versions du code qu’elle contient est disponible pour ces fichiers.

Dois-je savoir utiliser HAL et/ou Software Heritage ? Non, prévoyez votre ordinateur portable, c’est tout.

Dois-je avoir un compte HAL ou en créer un à l’avance ? Non, vous n’avez pas besoin de compte pour participer et profiter des ateliers. En revanche, si vous souhaitez déposer vos codes sur HAL pendant l’atelier 1, il est préférable d’avoir déjà un compte HAL.

Intervenants

Roberto di Cosmo , professeur en informatique à l’université Paris Diderot, fondateur et directeur de Software Heritage ; Twitter : @rdicosmo

Ludovic Courtès , initiateur et co-mainteneur du projet GNU Guix

Morane Gruenpeter , ingénieure logiciel à Software Heritage et membre projet européen EU2020 CROSSMINER

Alain Monteil coordinateur du Pôle Archives Ouvertes au sein du service IES de la DGD-S d’Inria

En savoir +

Ateliers et présentations

atelier " Archiver et référencer des codes sources scientifiques pour une recherche reproductible ", Morane Gruenpeter

Au cours des dernières années le logiciel et en particulier le code source sont devenus un produit légitime de recherche qui reçoit de plus en plus d’attention de l’écosystème académique. Les chercheurs ressentent de plus en plus le besoin d’archiver et de référencer les logiciels qu’ils produisent. La préservation du code source est cruciale si nous voulons conserver les connaissances techniques, fonctionnelles et culturelles qu’un logiciel peut contenir, en particulier lorsqu’il s’agit de logiciels de recherche et si l’on souhaite assurer la reproductibilité des études scientifiques . Pendant cet atelier, nous allons voir ensemble les possibilités d’archivage du code source et des bonnes pratiques .

atelier " Enjeux de citation et reporting des logiciels : comment citer et référencer des codes sources ", Alain Monteil

La différence entre citation et référencement est très importante quand il s’agit de logiciel . La citation est une pratique permettant de recevoir et d’attribuer le crédit pour la création d’un produit de recherche (un logiciel donné en tant que projet), tandis que la référence permet d’ identifier précisément l’objet utilisé pour des fins de réutilisation et de reproductibilité . Référencer des objets logiciels est souvent suffisant et peut être facilement réalisé. Actuellement, Il n’y a pas de meilleure pratique bien établie pour la citation de logiciels, et dans les citations on voit assez souvent des URL éphémères ou d’autres identifiants qui offrent peu ou pas de garantie que le logiciel cité puisse être trouvé plus tard. Pendant cet atelier nous allons voir ensemble des exemples de citation et de référencement de codes sources, en particulier le modèle de citation sur HAL et le référencement des codes de l’Apollo11 sur SW.

présentation " Valoriser les logiciels scientifiques marquants du passé: collecte, curation et archivage avec le Software Heritage Acquisition Process ", Roberto di Cosmo

L’Informatique est une science jeune: nous avons la chance unique de pouvoir encore parler avec la plupart des personnes qui l’ont créé, et de pouvoir retrouver les codes sources des logiciels marquants qui ont contribué à l’incroyable histoire de la révolution numérique. Il est de notre devoir de reconstruire et préserver la mémoire de cette épopée . Un processus détaillé est maintenant disponible pour guider le pas de qui veut contribuer à cette mission, et souhaite mettre en valeur le patrimoine logiciel de son institution , équipe, entreprise, organisation ou individu . On donnera dans cet exposé un aperçu du processus, et quelques exemples de résultats.

présentation " Environnements logiciels reproductibles avec GNU Guix ", Ludovic Courtès

Docker et Singularity peuvent reproduire un environnement logiciel à l’identique mais permettent difficilement d’aller au-delà d’expérimenter. Peut on concilier reproductibilité et expérimentation pour les environnements logiciels? GNU Guix est comparable à apt-get, yum ou CONDA, mais il fournit des binaires reproductibles bit à bit avec un suivi de leur provenance . Il peut aider à la gestion d’environnements à la « module » ou VirtualEnv, ou encore provisionner des conteneurs. J’évoquerai notre expérience avec Guix en calcul intensif (HPC).

Programme détaillé, inscription

Bien cordialement,

Sabrina Granger
Conservateur des bibliothèques
Responsable axe « Information scientifique et technique », Urfist de Bordeaux