• Réduire le texte
  • Rétablir taille du texte
  • Augmenter le texte
  • Imprimer

Ouvrir les données et publier autrement : une obligation, une nécessité, une priorité

La révolution numérique permet de revisiter le processus de production et de diffusion des données et publications scientifiques, dont le modèle actuel est trop fermé au regard des enjeux de société portés par les recherches de l’Inra. Base de construction des recherches, de diffusion des connaissances et d’évaluation des chercheurs, données et publications scientifiques sont consubstantielles à toute activité de recherche. Ce sujet était au cœur des discussions du séminaire #PublierAutrement! des 10 et 11 janvier 2017.

Odile Hologne, déléguée à l'Information scientifique et technique et Olivier Le Gall, directeur général délégué Inra. © Inra, MAITRE Christophe
Mis à jour le 03/02/2017
Publié le 02/02/2017

Sortir du système pour ouvrir la science… Devant un auditoire de 70 chercheurs et acteurs impliqués dans l’édition scientifique, une seule diapositive évoque par un tableau #ESRenpeinture(*) le dénuement des étudiants, des enseignants ou des citoyens devant l’impossibilité d’accéder à la connaissance diffusée dans des supports payants et, par ce clin d’œil, celui des instituts de recherche après paiement de leurs dispendieux abonnements.

Diapositive présentée par Olivier Le Gall lors du séminaire Publier Autrement ! 10 janvier 2017. © Inra
Diapositive présentée par Olivier Le Gall lors du séminaire Publier Autrement ! 10 janvier 2017 © Inra
En la commentant, Olivier Le Gall, directeur général délégué de l’Inra, a fait, dès les premières minutes, une introduction remarquée en ouverture du séminaire #PublierAutrement!, le 10 janvier dernier. D’emblée, il a affirmé la position de l’Inra en la matière : envisager la sortie du système des abonnements aux revues à l’horizon 2020 et, pour cela, explorer de nouveaux modes de publication et d’évaluation des chercheurs. Plus largement, rendre les données de la recherche disponibles et réutilisables par d’autres. Ces objectifs sont inscrits dans les orientations de l’Institut à l’horizon 2025, #Inra2025 #OpenScience, que le conseil d’administration de l’Institut a retenues en octobre 2016.

(*) sous le hashtag #ESRenPeinture, la communauté scientifique s’exprimait via Twitter sur sa condition, en illustrant ses propos par des peintures classiques ou modernes.

Entretien avec Olivier Le Gall et Odile Hologne, déléguée à l’Information scientifique et technique à l’Inra.

Ces objectifs sont très ambitieux !

 
Nous vivons une révolution qui est une vraie chance
 

O. Le Gall : Oui c’est ambitieux, mais nous vivons une révolution qui est une vraie chance pour les atteindre. Comme en leur temps l’invention de l’écriture puis de l’imprimerie, le développement exponentiel des technologies de l’information et de la communication, qui entrent dans nos vies et jusque dans nos poches, accélère et élargit spontanément le partage des connaissances et même leur production : profitons de ce mouvement et des possibilités qu’il offre. S’engager en faveur d’une science ouverte (#OpenScience) permet de revenir aux fondamentaux de la Science et en même temps de s’affranchir d’un certain nombre de ses limitations conjoncturelles actuelles. Ainsi, comment organiser nos infrastructures de recherche pour en faire des lieux de production et de collecte des données mieux partagés entre nos équipes et avec nos partenaires ? L’Inra a publié en 2016 sa charte des infrastructures de recherche, qui s’articule autour de six valeurs : ouverture, partage, transparence, accès aux données, soutenabilité financière et conformité.

Odile Hologne : Comment ensuite archiver, traiter et partager le déluge des données expérimentales ? (Sans parler de celles que produit le monde de plus en plus connecté qui nous entoure.) Comment les transformer en connaissance et la mettre en commun en s’affranchissant des limites imposées par le système actuel de publication ? Si la démarche et le travail des équipes de recherche se transforment aussi radicalement, quels critères pour en décrire et en reconnaître les mérites alors que trop souvent nous avons déjà des difficultés à évaluer nos productions dans leur diversité, qui va de pair avec celle de nos missions ? Bref, à tous les niveaux, l’Inra expérimente et s’organise pour mieux engager et partager la science dans la société, en commençant par celle qu’il produit.

Partager les données, mais avec qui et pour quoi faire ? C’est très technique une donnée, quand même !

O. Le Gall : En 2015 et 2016, deux lois très importantes ont fixé le cadre et les modalités de cette action. Il s’agit de la loi du 28 décembre 2015 relative à la gratuité et aux modalités de la réutilisation des informations du secteur public, et de celle du 7 octobre 2016 dite « pour une République numérique ». Donc il s’agit d’abord de respecter la Loi, une Loi qui va dans le sens de l’Histoire. L’Inra s’est d’ailleurs fait entendre dans le cadre des débats qui ont précédé leur promulgation : la loi pour une République numérique avait donné lieu, à ma connaissance, pour la première fois dans l’histoire du travail législatif français, à une grande consultation publique via une interface web dédiée.

Partager les données, c’est faire avancer la science et créer de la valeur

Partager les données produites par l’argent public est non seulement une obligation légale et morale, mais aussi un acte en faveur de l’avancement de la Science, en permettant aux autres équipes d’en bénéficier dans les meilleurs délais pour les réutiliser au lieu parfois de réinventer l’eau tiède. C’est d’ailleurs déjà la pratique standard dans un domaine comme la génomique, par exemple. C’est aussi un acte en faveur de la création de valeur par des initiatives citoyennes ou de petites entreprises innovantes, qui pourront ainsi s’en emparer pour les transformer en services qui ne relèvent pas des missions ou des compétences de l’Inra - ou même tout simplement, dont nous n’aurions pas eu l’idée ! Le risque est bien sûr que les majors mondiales de l’analyse de données soient les premières à profiter de l’aubaine, ne laissant même pas émerger ces initiatives. Nous ne devons donc pas « poser les données sur la table » et nous en désintéresser, mais également proposer les algorithmes qui permettent de les comprendre et y faire émerger du sens, les transformer en information : c’est pour cela que l’Inra appuie les recherches en mathématiques et informatique, et s’est doté d’un délégué à la transition numérique.

Odile Hologne : Pour aider les équipes de recherche à s’y retrouver concrètement dans un dédale qui est parfois nouveau pour elles, l’Inra a publié fin 2016 sa charte pour le libre accès à ses publications et données scientifiques et a ouvert le portail web http://datapartage.inra.fr. Ce portail Internet, qui est d’ailleurs accessible aussi pour les chercheurs d’autres établissements publics, rappelle les principes généraux de la politique Inra en la matière, donne quelques actualités, et surtout propose une boîte à outils bienvenue pour déposer des données dans des archives publiques, déterminer leur statut, leur affecter un identifiant unique, etc. Tout dernièrement, l’Inra vient de publier un Guide d’analyse du cadre juridique de l’ouverture des données de recherche, issu des réflexions d’un groupe de travail inter-organismes dans le cadre de la Bibliothèque scientifique numérique.

D’accord, mais les publications… N’est-on pas là au cœur de la production scientifique ? C’est un mastodonte !

Réinterroger un processus réducteur, chronophage, confiscatoire et onéreux
 

O. Le Gall : Publier est en effet le cœur de l’activité d’un chercheur (encadré 1). Cette prise de conscience collective intervient à un moment où les publications scientifiques ont évolué en quelques décennies vers un système dans lequel un très petit nombre de grands éditeurs internationaux ont capté l’essentiel du « marché » (je n’aime pas ce terme mais il faut avouer qu’il est devenu approprié). Paradoxalement, ce système engendre une grande fragilité de la communauté scientifique. Il est réducteur : à travers des critères d’évaluation simpl(ist)es comme le facteur d’impact, il impose une vision unique de ce que serait la production scientifique ; or cette vision « prêt-à-porter » est déformée. Il est chronophage : les chercheurs passent une partie de plus en plus grande de leur temps à valider les publications de leurs collègues ; c’est le système de révision dite « par les pairs », qui a beaucoup de mérite mais n’est pas exempt de défauts. Il est confiscatoire : sans même parler des citoyens et des partenaires qui n’ont pas accès à la connaissance publiée, les chercheurs eux-mêmes doivent payer pour relire leurs propres publications ! Enfin, il est gourmand en argent public : les équipes paient des frais de prise en charge pour soumettre leurs articles et, à l’autre bout de la chaîne, les abonnements aux revues coûtent chaque année à l’Inra autant que le fonctionnement de base de tous les labos d’un de ses treize départements scientifiques – avec, qui plus est, une nette tendance à la hausse.

Le monde académique doit se réinterroger et se réapproprier un processus aussi fondamental pour lui, et mieux le partager avec la société. D’ailleurs, les majors de l’édition en sont elles-mêmes conscientes. Par exemple, je ne vois aucune raison – en tout cas aucune bonne raison - pour laquelle un autre chercheur, un ingénieur agronome des pays du Sud, un agriculteur, un nutritionniste, un décideur politique, un enseignant, un étudiant ou même un citoyen intéressé par les questions sur lesquelles l’Inra mène des recherches devrait se voir refuser la lecture d’une seule de nos publications ; or c’est largement le cas actuellement, à plus de 80 % même si l’Inra est bien au-dessus de la moyenne nationale par la proportion de ses publications en accès libre.

Odile Hologne : Une tendance qui se développe en biologie, et reste marginale alors que dans d’autres disciplines c’est la règle, est la diffusion des articles scientifiques avant leur publication formelle, sur des serveurs de prépublication (ou preprints)  comme par exemple bioRxiv. Le principe est que tous les processus d’édition se greffent ensuite sur ce dépôt, y compris des processus inexistants dans le modèle dominant comme la discussion des articles au sein des communautés scientifiques avant leur publication. Cela offre de nombreux avantages : transparence, rapidité, fiabilité, etc. L’Inra examine avec beaucoup d’intérêt ce mouvement, qui est porté notamment par la communauté #ASAPBio pour la biologie, alors que les sciences sociales viennent d’y faire leur entrée en 2016 par le serveur SocArXiv.

Le célèbre publish or perish, la course au facteur d’impact, n’est-ce pas par là aussi que s’ancrent les forces de résistance du modèle actuel ?

O. Le Gall : Bien sûr que si ! Même si de fait, le modèle français de recherche n’est pas aussi sous-tendu que le modèle anglo-saxon par cette tristement célèbre maxime. En ce qui concerne le facteur d’impact, je rappelle souvent qu’il s’agit d’un outil d’évaluation de l’audience moyenne d’une revue scientifique donnée (étant entendu que, comme dans d’autres domaines, l’audience ne décrit pas la qualité de manière unique !) mais qu’il est dangereux de l’appliquer directement à l’évaluation de chercheurs ou de collectifs de recherche. La déclaration de San Francisco sur l’évaluation de la recherche (DORA) ne dit pas autre chose, et l’Inra la soutient ainsi que le manifeste de Leiden. Par exemple, j’entame systématiquement les concours de directeur de recherche en mettant fortement les jurys en garde contre l’usage facile mais abusif des facteurs d’impact, et je recommande la même chose aux commissions scientifiques spécialisées (CSS) qui évaluent les chercheurs tous les quatre ans ; je constate malheureusement que changer les habitudes prend du temps ! Ce qui compte pour un jury ou une commission d’évaluation, en réalité, c’est d’examiner la qualité et l’impact d’une stratégie de valorisation, qui passe certes de manière incontournable par la publication d’articles internationaux qui soient de la meilleure qualité possible, mais ne s’y résume pas. À ce titre, il est tout à fait légitime pour un chercheur ou un collectif de décrire sa stratégie de publication discipline par discipline, et que cette stratégie soit déclinée dans des journaux « cibles », choisis, entre autres, par leur audience moyenne au sein de chaque ensemble disciplinaire : cela a du sens, et c’est le sens de l’outil NORIA proposé par la délégation à l’information scientifique et technique.

Pour en revenir au séminaire #PublierAutrement!, quel était son sens et quelles en ont été les grandes conclusions ?

Le point de départ d'un chantier
 

Odile Hologne : Le séminaire #PublierAutrement! a permis de confronter les modèles actuels de publication scientifique et de partage des données, des plus classiques aux plus innovants : le premier jour avec des collègues d’autres établissements de recherche ou d’enseignement supérieur en France ou à l’étranger, puis le second jour dans un plus petit cercle au sein de la communauté Inra. Nous avons de la chance de disposer de journaux scientifiques directement soutenus par l’Inra avec une diversité de modèles, y compris des expérimentations éditoriales (encadré 2) comme Journal of Plant Hydraulics, gratuit pour les auteurs et pour les lecteurs, ou Peer Community in X qui dissocie les processus de révision des articles scientifiques et leur archivage relevant des métiers de l’édition.
Ce séminaire est le point de départ d’un chantier qui conduira l’Inra à définir une stratégie pour contribuer, à son niveau et en entraînant si possible une communauté plus large, à ce vaste mouvement qui démarre. Nous inventons la manière de diffuser la connaissance des futures générations, et les prochaines années seront déterminantes !
En savoir plus sur le séminaire >

En savoir plus

Quelle importance ont les publications pour un chercheur ?

Pour un chercheur, publier ses résultats dans des revues internationales n’est pas la seule forme que prend sa production scientifique, qui passe aussi par la participation à l’expertise, à la formation, à l’innovation, etc. mais c’est un acte fondateur incontournable.

  • Élaborer les hypothèses qui fondent ses recherches. Les publications sont un matériau essentiel pour élaborer ses propres recherches en s’articulant ou se plaçant en rupture à ce qui est déjà expérimenté, connu ou validé. L’accès aux publications et aux bases documentaires est donc essentiel pour tout chercheur.
  • Formaliser les nouvelles connaissances auxquelles il a contribué. Au travers des publications scientifiques, le chercheur formalise ses résultats et la façon dont ils ont été obtenus. Il en assure ainsi la reproductibilité, et sa communauté scientifique en assure la validité et l’originalité. Il transforme des données en informations et des informations en connaissances.
  • Partager ces connaissances dans la communauté scientifique. Ses publications pourront être citées par d’autres chercheurs et fonder à leur tour l’élaboration de nouvelles connaissances. C’est particulièrement important de s’adresser à une communauté la plus large et internationale possible : c’est la raison pour laquelle la plupart des publications sont en anglais.
  • Être utile à la société. Rendre ses résultats publics permet qu’ils soient diffusés, appropriés, discutés par tout citoyen et tout utilisateur final y compris au-delà du monde de la recherche. C’est un support, par exemple, pour la formation, l’innovation ou la mise en débat.

Des expérimentations éditoriales innovantes

Trois exemples d’innovation en édition scientifique

. © Inra, H. Cochard / S. Delzon / Inra
© Inra, H. Cochard / S. Delzon / Inra
Créé en 2014, Journal of Plant Hydraulics (JPH) s’inscrit dans la philosophie d’une réappropriation du circuit de l’édition par les acteurs de la recherche. Deux chercheurs de l’Inra, Hervé Cochard (Clermont-Ferrand) et Sylvain Delzon (Bordeaux) ont conçu un projet de revue scientifique qui sort, sur un champ disciplinaire étroit, des sentiers battus du modèle dominant de l’édition. JPH joue la carte de la gratuité tant pour l’auteur que pour le lecteur, dans le cadre d’un partenariat avec l’Université de Bordeaux. Par solidarité avec la communauté des chercheurs, le journal refuse le facteur d’impact. Les auteurs assurent eux-mêmes la mise en page, avec l’assistance des outils fournis par la plate-forme ; les chercheurs-éditeurs assurent la gestion des expertises par les rapporteurs ; la plate-forme assure les fonctions de diffusion. Les outils actuels d’édition et la nature exclusivement numérique de la revue permettent de réduire très fortement les coûts pris en charge par les institutions de recherche publique. Depuis janvier 2017, JPH expérimente un autre principe : celui de la transparence du processus éditorial et notamment la diffusion des rapports d’expertise signés.

Un autre exemple est le Journal of Data Mining & Digital Humanities (JDMDH), créé en 2014 à l’interface entre numérique et sciences humaines. Comme dans JPH, les auteurs font eux-mêmes la mise en forme, et la plate-forme assure la diffusion une fois que l’article a été validé par le processus éditorial. Tout le processus est adossé aux archives ouvertes et notamment HAL**, qui assurent la diffusion des articles sous forme preprint. Les articles sont publiés sous licence CC-BY.

Peer Community in Evolutionary Biology, lancé début 2017, propose un découplage complet des processus de diffusion et d’édition, qui relèvent, pour le premier, de la communauté de recherche compétente et, pour le second, des métiers d’éditeur. Il devient difficile de parler d’un « journal » mais il s’agit d’expérimenter la manière de diffuser des connaissances des futures générations… Une communauté disciplinaire donnée commente et valide des articles accessibles sur des archives ouvertes, par exemple des serveurs de preprints comme bioRxiv. Les outils de réseaux sociaux y jouent une place prépondérante. La possibilité pour un même article de se voir évalué et validé par plusieurs communautés disciplinaires - la création d’autres Peer Community in X [d’autres disciplines] est attendue -, dépasse ainsi le caractère monodisciplinaire de la plupart des revues classiques, qui est  un frein fort à l’interdisciplinarité que l’Inra encourage.

Le pari des éditeurs de tous ces modèles d’édition a été légitimé par l’adhésion de grands noms de chacune de leurs disciplines, qui ont décidé de s’associer à leurs démarches en s’impliquant dans les comités éditoriaux internationaux de ces initiatives.

Pour aller plus loin :
•    Journal of Plant Hydraulics : https://jplanthydro.org et sur Twitter @JPlantHydro
Lire l'article Edit or Perish
•    Peer Community in : https://peercommunityin.org/
•    Peer Community in Evolutionary Biology : https://evolbiol.peercommunityin.org/ et sur Twitter ‎@PCIEvolBiol
•    Journal of Data Mining & Digital Humanities : https://jdmdh.episciences.org/ et sur Twitter @Journal_DMDH

**HAL est une archive ouverte pluridisciplinaire nationale.

#OpenScience : une science ouverte grâce au numérique

Open science

Une priorité pour l'Inra

La stratégie de l'Inra à l'horizon 2025 fait de l'OpenScience une de ses huit priorités.

La révolution numérique modifie profondément le travail des chercheurs : de nouvelles questions de recherche vont émerger de jeux de données sans précédent, aujourd’hui disponibles et partagés au sein de la communauté scientifique et avec nos concitoyens. Ce constat invite à imaginer un nouveau partage du travail entre producteurs et analyste de données, à revisiter les modalités d’analyse des données massives et à contribuer à l’essor d’une économie de l’information.

En savoir plus >