Annuaires de chercheurs et valorisation de l’expertise des laboratoires

Un prix Nobel en manque de visibilité

En octobre 2013, Martin Karplus recevait le prix Nobel de chimie en compagnie de deux autres chercheurs pour leurs travaux sur la modélisation multi-échelle de systèmes chimiques complexes. Et, petit cocorico, on apprenait que Martin Karplus travaille à la fois à l’université de Strasbourg et à l’université de Harvard. Or voici quelle visibilité son laboratoire français donne à ce chercheur sur son site web :

Profil de Martin Karplus dans l'annuaire de son laboratoire strasbourgeois

Profil de Martin Karplus dans l’annuaire de son laboratoire strasbourgeois

Il s’agit, on le rappelle, d’un chercheur réputé et admiré, partagé entre la France et Harvard ! Non pas qu’il faille lui consacrer un “hall of fame” (quoique, si on se donnait les moyens qu’il faut en communication scientifique…) mais on pourrait s’attendre à une présentation de son travail, ses réussites, ses projets, ses enseignements. Ce que l’université de Harvard a parfaitement compris comme le montre la capture ci-après.

Profil de Martin Karplus dans l'annuaire de son laboratoire américain

Profil de Martin Karplus dans l’annuaire de son université américaine

Et plus encore si on clique sur le lien vers son équipe de recherche, avec une présentation longue de ses travaux et sa bibliographie complète…

Ce constat n’est pas nouveau : si les sites web des universités et laboratoires français pêchent souvent par leur habillage ou leur contenu, la partie « annuaire » ou « profils » est sans doute encore plus mésestimée. Julien Pierre, qui a mené une thèse en sciences de l’information et de la communication sur l’identité numérique, a toujours soulevé l’écart pouvant exister entre la page institutionnel du chercheur et ses autres présences en ligne (réseaux sociaux, apparitions médiatiques, page Wikipédia, blog etc.). Comme dans le diaporama ci-après, présenté lors d’une journée de formation à l’URFIST de Lyon, le 9 juin 2011 :

Les pages web institutionnelles des chercheurs vues par Julien Pierre

Les pages web institutionnelles des chercheurs vues par Julien Pierre

Pourquoi est-ce important ?

Pour répondre à cette question, on pourrait arguer sous forme de boutade que si les Américains le font, c’est bien que l’investissement est justifié ! Mais voici quelques réponses argumentées.

Le « marché » de l’enseignement supérieur et de la recherche est mondial

Les meilleurs professeurs passent d’une chaire à l’autre et d’un pays à l’autre, quand ils n’occupent pas plusieurs postes en même temps (comme Martin Karplus). Prendre soin d’un chercheur de dimension internationale en lui donnant la visibilité qu’il mérite devrait aller de soi ! Et comment faire connaître au monde entier qu’il travaille dans votre laboratoire plutôt que chez le voisin si vous ne l’affichez pas clairement ? Encore plus que l’affiliation des articles qu’il ou elle signera, le site web reste votre premier canal de communication et c’est un investissement efficace pour attirer plus d’étudiants, de candidats, de collaborateurs… et de financements venus du monde entier.

Les compétences des chercheurs sont uniques

Un des concepteurs du portail de la recherche en SHS Isidore nous confiait que les journalistes ont très vite compris l’intérêt de ce moteur de recherche pour repérer des experts à interroger : sur le conflit israëlo-palestinien, sur les rythmes scolaires, sur la neutralité du net, sur l’enfouissement des déchets nucléaires… La richesse des laboratoires, et plus largement de la recherche française, repose sur ces femmes et ces hommes qui ont développé des expertises très spécifiques et des compétences extrêmement pointues. Cette ressource principale, la matière grise des labos, doit être mise en avant comme telle. Car personne ne peut prédire qui aura besoin de votre expertise un jour !

L’information doit être accessible en un clic

Le retour d’expérience d’Isidore comportait un bémol : une fois parvenus à l’article scientifique qui les intéresse, les journalistes ne savent pas toujours comment contacter le chercheur en question — qu’il ait changé d’affiliation, que ses coordonnées ne soient pas publiées, qu’il ait pris sa retraite etc. Là où un annuaire bien indexé dans Google prendrait tout son sens ! L’exemple des journalistes peut se transposer au monde socio-économique (petites ou grandes entreprises, associations, collectivités, établissements publics…) quand il a besoin d’un expert pour une mission de conseil, pour discuter d’une nouvelle technologie, etc. Et même aux chercheurs qui voudraient contacter des collègues d’autres disciplines pour lancer des collaborations transversales ! Ainsi, le chercheur en informatique David Monniaux s’est déjà plaint sur son blog influent d’avoir eu « les pires difficultés à trouver les coordonnées où joindre des collègues de sciences humaines (ni page Web, ni email indiqué, ni annuaire…)”.

Si vous ne le faites pas… personne ne le fera à votre place !

Le Commissariat à l’énergie atomique et aux énergies alternative (CEA), qui n’est pas le dernier pour la valorisation de la recherche et les collaborations industrielles (notamment en raison de son statut d’établissements public à caractère industriel et commercial), a pris ce problème au sérieux en lançant la base COLA (Compétences des laboratoires). Celle-ci rassemble les données fournies par les unités de recherche concernant leurs domaines de compétences, axes de recherches et collaborations. Accessible à tout agent du CEA, elle est utilisée notamment par les conseillers chargés de la diffusion technologique en régions pour identifier des interlocuteurs en réponse à des demandes d’industriels.

En réalité notre titre est exagéré et certains services font déjà ce travail à votre place : Expernova vend son moteur de recherche aux industriels pour leur permettre d’identifier le bon expert, ou d’obtenir un panorama des compétences, acteurs et travaux en lien avec leur problématique. On pense également aux réseaux sociaux de chercheurs comme ResearchGate ou Academia.edu, qui échappent aux établissements de tutelle. Or vous ne voudriez pas laisser à un tiers le monopole de la mise en relation avec vos experts, n’est-ce pas ?

Les annuaires d’université sont morts, vive les Research Networking Systems !

En 2009, le National Center for Research Resources affilié aux NIH américains a lancé un appel à projets pour concevoir une infrastructure permettant de connecter les personnes et les ressources (données, modèles animaux, réactifs, matériel, outils…) afin de faciliter la découverte d’individus et de ressources scientifiques par les chercheurs et étudiants, pour encourager les collaborations interdisciplinaires et les échanges scientifiques. Ce fut le point de départ du premier Research Networking System (RNS), ou système de réseautage pour la recherche, piloté par l’université de Floride avec une dotation de 12 millions de dollars. Il s’agit de VIVO, d’après une technologie développée à l’université de Cornell depuis 2003, sur lequel nous reviendrons.

La spécificité des RNS, même s’ils peuvent remplir d’autres fonctions comme la gestion d’un portefeuille de projets de recherche, est qu’ils sont basés sur les profils des individus. Et puisqu’ils visent à faciliter les collaborations, ils donnent des éléments souvent déterminant pour le succès ou de l’échec d’une collaboration : besoins et objectifs des chercheurs, caractéristiques du projet, politique des tutelles, normes disciplinaires, contraintes institutionnelles…

Les annuaires de chercheurs au crible de 8 bonnes pratiques

Les expérimentations en matière d’annuaires d’universités ne manquent pas, heureusement ! Mais comment juger de ce qui relève des bonnes ou des mauvaises pratiques ? Titus Schleyer de l’université de Pittsburgh et ses collaborateurs ont mené l’enquête dans le champ biomédical, en mêlant un brainstorming KJ, des entretiens avec des chercheurs, une analyse de la littérature et des observations en contexte. Ils ont conclu qu’il existait 8 pré-requis à un bon RNS. Ces 8 pré-requis forment les chapitres suivants, que nous tenterons à chaque fois d’illustrer avec des solutions existantes.

1. Bon rapport coût/bénéfice de la création et la mise à jour des profils en ligne

Selon une étude britannique, la mise à jour des pages web des chercheurs, laboratoires, départements… d’une université représenterait 10 heures de travail par page et par an avec un outil de publication web classique. Pour un établissement de 1 000 chercheurs, organisé en 5 départements et 30 laboratoires, cela revient à 1 035 pages x 10 h/an soit 10 350 h/an, coûtant 310 500 € / an à raison de 30 € l’heure chargée d’ingénieur d’étude. Il semble bien plus efficace de collecter et mettre en forme automatiquement les informations disponibles dans les laboratoires ou les bases de données tierces (brevets, publications, dotations…). Or justement, les laboratoires utilisent de plus en plus ces logiciels de gestion des informations tout au long du cycle de vie de la recherche, que nous avons appelés Current Research Information Systems (CRIS) au chapitre précédent. Nous estimions alors le coût de déploiement d’un logiciel CRIS dans un établissement entre 12 000 et 25 000 € par an, bien inférieur aux 310 500 € de mise à jour manuelle.

Le choix du CRIS (ou à tout le moins d’un outil d’annuaire basé sur un CRIS) est donc un choix économique, mais c’est aussi un choix humain : il faut éviter les redondances de saisies d’information déjà nombreuses tout au long du cycle de vie de la recherche et chercher plutôt à exploiter au mieux l’information disponible.

En plus de diminuer les coûts, on peut chercher à augmenter les bénéfices. Pourquoi ne pas envisager, par exemple, que les pages de profils créées dans l’annuaire puissent être utilisées pour générer à la volée le CV des chercheurs ? En utilisant (tant qu’à faire) l’un des nombreux formats de CV qui se standardisent à travers le monde, à la demande notamment des institutions et des financeurs de la recherche :

  • Europass CV est un standard européen proposé par le Forum européen sur la transparence des qualifications professionnelles, lancé en 1998 en vue de réunir les partenaires sociaux et les autorités nationales en matière d’enseignement et de formation professionnels autour du thème de la transparence des qualifications ;
  • le CV commun canadien permet aux chercheurs de transmettre de façon standardisée les informations requises par un réseau d’organismes de financement fédéraux, provinciaux et de recherche à but non lucratif ;
  • NIH Biosketch est un formulaire biographique requis par les NIH dans les réponses à leurs appels à projets de recherche ;
  • SciENcv est un projet de plusieurs agences fédérales américaines pour créer un format standard de CV en ligne à l’usage des chercheurs, à partir duquel pourra notamment être généré une note biographique NIH Biosketch.

Ces exemples de formats n’ont pas été donnés au hasard : ce sont les formats d’export que l’on trouve dans le logiciel Converis (v. 5.4), un CRIS commercialisé par Thomson Reuters. La capture ci-après montre un exemple de page de profil créée avec Converis.

Exemple de profil dans l'annuaire de l'université de Stirling généré par Converis

Exemple de profil dans l’annuaire de l’université de Stirling généré par Converis

L’export vers l’un ou l’autre de ces formats de CV se retrouve dans d’autres logiciels sur lesquels nous reviendrons (VIVO, Digital Vita, UNIWeb, Elements, Pure…). Signalons également que le groupement euroCRIS travaille actuellement à aligner son schéma de données standard CERIF (qui sous-tend la majorité des CRIS) avec le Currículum Vitae Normalizado espagnol.

2. Représentation fidèle des chercheurs grâce à une information riche, complète et à jour

Plus les profils seront complets, plus ils seront utiles pour déterminer l’opportunité d’une collaboration et faciliter la prise de contact. On peut s’attendre à trouver en particulier les informations suivantes :

  • les accréditations (titres, diplômes, certificats, distinctions…) certifiant de la compétence générale dans tel ou tel domaine : la médecine, le droit, les sciences de gestion, etc. ;
  • les expériences professionnelles (projets ou postes occupés, qui se traduisent par des productions type publications, brevets, modules de cours…) précisant les thèmes sur lesquels portent l’expertise du chercheur ;
  • les champs d’intérêt déclarés fournissant des informations sur les motivations actuelles du chercheur ;
  • les coordonnées permettant de savoir comment joindre le chercheur.

Toutes ces informations sont utiles à la personne qui recherche un profil précis.

En pratique, c’est souvent la liste de publications qui est mise en avant, malgré sa limite évidente (elle est rétrospective et ne dit rien des intérêts actuels ou futurs du chercheur). C’est pourquoi de nombreuses solutions d’annuaire s’adossent à l’archive ouverte institutionnelle. En effet, celle-ci recense la production de l’établissement et il semble logique de lui ajouter une couche « annuaire ». Ainsi, l’entrepôt Okina de l’université d’Angers, dont le lancement public est prévu à la fin de l’année 2014, a particulièrement soigné l’entrée par les laboratoires et les chercheurs de l’établissement (voir captures ci-après).

Aperçu de l'entrepôt institutionnel de l'université d'Angers. Source : http://fr.slideshare.net/stbouvier/okina-jeda

Aperçu de l’entrepôt institutionnel de l’université d’Angers

Aperçu de l'entrepôt institutionnel de l'université d'Angers. Source : http://fr.slideshare.net/stbouvier/okina-jeda

Aperçu de l’entrepôt institutionnel de l’université d’Angers

Okina est un développement « maison » basé sur Drupal 7. D’autres solutions clés en mains existent, comme DSpace-CRIS qui est une surcouche CRIS au fameux logiciel libre d’archive ouverte DSpace. Développé par la société italienne Cineca sous une licence libre, DSpace-CRIS est utilisé notamment par l’entrepôt institutionnel de l’université de Hong Kong (voir capture ci-après).

Aperçu de l'entrepôt institutionnel de l'université de Hong Kong

Aperçu de l’entrepôt institutionnel de l’université de Hong Kong

De son côté, le logiciel Elements commercialisé par Symplectic en Grande-Bretagne peut se brancher à un entrepôt DSpace, Fedora, ePrints ou Intralibrary.

De la même façon, il peut être intéressant de collecter l’information disponible ailleurs (typiquement dans des bases bibliographiques), en utilisant si possible les avantages du web sémantique pour donner tout son sens aux données récoltées et faciliter le dédoublonnage. C’est l’approche suivie par le portail lyonnais SHSdocNET qui « met en œuvre des technologies innovantes du web social et sémantique » :

  • moissonnage de données (recherche automatique) à partir de toutes les sources d’information et de documentation publiques telles que IsidoreHAL-SHSSUDOC, etc. ;
  • sémantique : technologie s’appuyant sur les ontologies généralistes comme Rameau et spécialisées comme celle en cours d’élaboration à l’Institut des sciences de l’Homme, permettant d’améliorer la recherche de compétences et de proposer des compétences proches lors des recherches ;
  • consolidation des informations par les individus référencés et/ou les gestionnaires des laboratoires auxquels ils appartiennent.

3. Exploitation des réseaux sociaux

Au moment d’entrer en contact avec quelqu’un, vous aurez plus de chances de succès si vous passez par un contact commun ; et si vous cherchez une expertise éloignée de vos centres d’intérêt, il est souvent utile de solliciter une connaissance dont vous pensez qu’elle saura vous faire des recommandations (par exemple un directeur ou responsable, au réseau plus étendu). Par conséquent, il est important de pouvoir exploiter les liens existant entre personnes : co-auteurs, collègues du même établissement ou même département, etc.

Digital Vita et Profiles RNS proposent une double approche pour répondre à cette question :

  • l’appartenance à un même département de recherche et les co-publications sont implicitement comptabilisées comme liens de proximité (c’est le « réseau passif ») ;
  • les chercheurs peuvent déclarer explicitement leurs contacts à travers des « colleague requests » calqués sur les « friend requests » de Facebook (c’est le « réseau actif ») — voir capture ci-après.
Exemple de "Colleague Requests" dans Digital Vita. Source : http://hciresearch4.hcii.cs.cmu.edu/M-HCI/2007/PittDental/docs/Project%20Final%20Deliverable%20-%203rd%20Revision%20wo%20Appendix.pdf

Exemple de « Colleague Requests » dans Digital Vita.

4. Evaluation des savoir-être des collaborateurs potentiels (personnalité, style de travail…)

L’affinité thématique ne suffit pas à déterminer si une collaboration peut fonctionner ou non. On peut par exemple imaginer un outil qui évaluerait également la compatibilité des styles de travail, la disponibilité des chercheurs et leur envie de démarrer une nouvelle collaboration. Ces informations sont plus difficilement objectivables et disponibles, et nous ne les avons retrouvées dans aucun des outils testés. A défaut, il est possible de s’appuyer sur l’existence de contacts communs (cf. chapitre 3.) pour former une première opinion sur la personne.

5. Utilisation d’indicateurs multiples sur les activités de collaboration passées

Des études ont montré que la liste des co-auteurs ne donne qu’une image imparfaite du réseau de collaboration d’un chercheur (Bordons et Gómez, 2000 ; Katz et Martin, 1997). Par conséquent, il convient de la compléter avec d’autres données.

Or il arrive souvent que dans un projet de recherche pluridisciplinaire, tous les chercheurs aient une vision globale de l’ensemble mais ne collaborent spécifiquement qu’avec les chercheurs du même « work package« , qui seront leurs co-auteurs. Dans ce cas, il peut être intéressant de relier entre eux tous les chercheurs qui ont participé, à quelque titre que ce soit, à un même projet. Et justement, les CRIS alimentés par l’université contiennent les informations relatives aux projets financés, à défaut de pouvoir les obtenir auprès des financeurs eux-même comme nous l’avons constaté dans le premier chapitre de notre enquête (voir capture ci-après).

Profil de l'annuaire de l'université du Nebraska généré par Pure

Profil de l’annuaire de l’université du Nebraska généré par Pure, faisant apparaître les bourses de financement

Par ailleurs, il peut s’avérer intéressant de distinguer dans le profil du chercheur ce qui relève de ses intérêts passés et ce qui relève de ses intérêts présents. Digital Vita permet justement de qualifier chaque domaine d’intérêt selon la typologie suivante :

  • Current Major ;
  • Current Minor ;
  • Non-current Major ;
  • Non-current Minor.
Présentation des domaines d'intérêt dans Digital Vita

Présentation des domaines d’intérêt dans Digital Vita

Plus avancé encore, le logiciel Profiles RNS utilisé notamment par le Clinical & Translational Science Institute rattaché à l’université de Californie San Francisco a choisi d’illustrer l’évolution au fil du temps des centres d’intérêt de ses chercheurs sous la forme d’un graphique très parlant (voir capture ci-après).

Chronologie des centres d'intérêt dans un annuaire Profiles RSN

Chronologie des centres d’intérêt d’un chercheur dans un annuaire Profiles RSN

Profiles RNS sait également pondérer les résultats d’une recherche selon le rang du chercheur parmi les auteurs de la publication indexée avec le mot-clé, la fréquence de ce mot-clé dans les publications, l’ancienneté de la publication, etc. afin de retourner les résultats les plus pertinents et opérationnels possible !

6. Paramétrage de la confidentialité des informations

La protection de la vie privée et le droit à l’oubli sont devenus des exigences de notre vie numérique et toute entorse à ces règles se paierait cher : par conséquent, il n’est pas question de s’en passer. Qui plus est, un chercheur peut avoir plus ou moins envie d’être bien référencé dans un annuaire institutionnel, par exemple s’il reçoit déjà beaucoup de sollicitations (auquel cas on lui conseillerait plutôt de ne pas se cacher et d’en faire profiter les collègues !). Même s’il est de son devoir d’apparaître dans l’annuaire (en tant qu’agent public), il doit pouvoir maîtriser les informations publiées le concernant.

L’annuaire SHSdocNET assume par exemple une position dite « socio-éthique » qui nous semble intéressante. Celle-ci consiste à « refuser toute publicité, à ne jamais vendre d’extraits de la base de données, à ne jamais construire des statistiques nominatives, à garantir au mieux l’inviolabilité de la vie des chercheurs et à laisser le chercheur maître pour contrôler son information et décider par lui-même de ce qui est public et non ».

7. Recherche efficace à travers les disciplines

Une fois l’annuaire déployé, il ne s’avèrera utile que s’il permet effectivement aux chercheurs ou industriels de trouver les compétences dont ils ont besoin. Il faut un moteur de recherche, et un bon ! Plus que la recherche en texte libre, l’utilisation de vocabulaires contrôlés comme le MeSH en santé et l’ACM Computing Classification System en informatique permettent de chercher les synonymes et termes connexes (y compris les termes plus génériques ou spécifiques). Ca peut être utile quand on connaît mal le vocabulaire spécifique d’un domaine, pour chercher des compétences dans une autre discipline par exemple. Et l’utilisateur doit pouvoir affiner sa recherche avec autant de critères qu’il le souhaite.

Le logiciel UNIWeb, développé par la société canadienne Proximify, s’est fixé comme objectif de favoriser la recherche pluridisciplinaire en facilitant le rapprochement entre chercheurs d’une même institution. Pas question d’organiser l’information par faculté et département, place à des mots-clés décrivant les thèmes et sous-thèmes de recherche (même s’il reste toujours possible de filtrer sa requête par unité académique), qui forment des “grappes” de chercheurs ayant un domaine d’expertise en commun (voir capture ci-après).

Page thématique "Santé des populations" dans l'annuaire UNIWeb de l'université d'Ottawa

Page thématique « Santé des populations » dans l’annuaire UNIWeb de l’université d’Ottawa

Évidemment, plus votre annuaire embrassera tout le périmètre de votre établissement, plus il sera riche de compétences et de disciplines. De ce point de vue, les projets d’annuaire menés à l’échelle d’un seul département sont forcément désavantagés… tandis que les initiatives d’interopérabilité entre annuaires sont récompensées ! Deux exemples de méta-annuaires méritent d’être détaillés : VIVO et DIRECT2experts.

VIVO est une application du web sémantique, sous licence libre, capable de construire un annuaire de chercheurs à partir des données internes aux établissements et de bases externes comme PubMed (voir schéma ci-après). Bâti sur un schéma de données éprouvé et la technologie sémantique RDF, soutenu par une forte communauté de développeurs et d’utilisateurs (dont les plus grandes universités américaines comme Cornell) et appuyé par une subvention de 12,2 millions de dollars des instances fédérales américaines, c’est à la fois l’outil d’annuaire le plus ergonomique que nous ayons pu voir, et celui qui propose la navigation la plus riche (presque trop, voir par exemple le profil du Pr. Nina Lauren Bassuk).

Flux de données pour la mise en place d'un annuaire VIVO

Intégration des données dans un annuaire VIVO

Mais ce n’est pas tout : reconnu aujourd’hui comme un standard, VIVO est capable d’interopérer avec un tas de logiciels CRIS mais également avec d’autres instances de VIVO. D’où le puissant portail inter-institutionnel VIVOsearch, réunissant à titre expérimental 8 organismes de recherche : les universités de Cornell, d’Harvard, de l’Indiana et de Floride, les facultés de médecine de Ponce, St. Louis et Weill Cornell, et le Scripps Research Institute. Mentionnons également VIVO Searchlight, une extension pour navigateurs internet qui permet de requêter VIVOsearch à partir de n’importe quelle page web, par exemple pour trouver des experts relatifs à l’article que vous êtes en train de lire (voir capture ci-après).

Exemple d'utilisation de VIVO Searchlight sur une page PubMed

Exemple d’utilisation de VIVO Searchlight sur une page PubMed

Quant à DIRECT2experts, c’est un prototype de recherche fédérée qui a réussi en 6 mois à rendre interopérable 7 solutions logicielles utilisées dans 28 universités américaines. Conséquence de ces chantiers d’interopérabilité : des logiciels CRIS comme Pure ou Elements et des annuaires comme Profiles RNS permettent aujourd’hui d’être facilement présents dans les méta-annuaires VIVOsearch et/ou DIRECT2experts, avec la visibilité nationale afférente.

8. Mise en évidence des connexions inattendues ou « non intuitives » entre chercheurs

Pourquoi ne pas envisager que les systèmes de réseautage pour la recherche vous aident à trouver des experts par sérendipité ou en proposant de façon pro-active des collaborateurs potentiellement intéressants ? Les algorithmes d’appariement (« matching« ) sont très utilisés sur les sites de rencontre, alors pourquoi pas entre chercheurs également ? On trouve dans la littérature des algorithmes entraînés pour faire ce type de recommandations d’experts, en se basant sur le réseau social des chercheurs et/ou sur les descripteurs MeSH de leurs publications.

Parmi les logiciels du commerce, UNIWeb semble s’être penché sur la question et aide à révéler les connexions cachées entre chercheurs : non pas leurs relations institutionnelles (co-auteurs ou membres du même laboratoire/département) mais leurs proximité thématique telle qu’elle est décrite par des mots-clés hiérarchisés. Il n’est pas encore question de calculer des scores de proximité mais ça donne déjà des graphes de réseaux qui invitent à l’exploration (voir capture ci-après).

Graphe de réseau d'un chercheur de l'université d'Ottawa

Graphe de réseau d’un chercheur de l’université d’Ottawa

Elsevier va encore plus loin avec sa technologie propriétaire Fingerprint Engine inclue dans le logiciel CRIS Pure. Celle-ci fouille les publications associées aux chercheurs, les croise avec différents thésaurus afin d’en extraire les concepts clés, et créé l’empreinte du document qui permettra ensuite de « matcher » un chercheur avec les appels à projets pertinents, ou autre (voir schéma ci-après).

Schéma de principe de la technologie Fingerprint Engine d'Elsevier

Schéma de principe de la technologie Fingerprint Engine d’Elsevier

Conclusion : quatre solutions possibles

Pour conclure cet état des lieux, nous pouvons distinguer quatre approches permettant de bâtir l’annuaire des chercheurs d’une institution.

1. S’appuyer sur le service tiers ORCID

ORCID est un service offert par l’organisation à but non lucratif du même nom, qui permet à chaque chercheur d’obtenir son identifiant unique et d’alimenter la page de profil ORCID le concernant (voir capture ci-après). Chaque acteur du monde de la recherche est censé y trouver son intérêt :

  • les chercheurs disposent d’un identifiant unique auquel ils peuvent rattacher toute leur production, sans risquer d’être confondus avec un homonyme (et 9 autres bénéfices listés ici) ;
  • les financeurs de la recherche peuvent obtenir en un clic le CV complet et formaté des porteurs de projet ;
  • les éditeurs de revues peuvent déléguer à ORCID la gestion des métadonnées des auteurs (fin des soucis d’adresse électronique obsolète), trouver plus facilement les rapporteurs dont ils ont besoin, etc. ;
  • les tutelles peuvent suivre précisément la production et l’impact de leurs chercheurs (y compris avec des alertes à chaque mise à jour), et échanger plus facilement avec d’autres institutions par exemple en cas de mobilité.
Exemple de profil ORCID

Exemple de profil ORCID

La « migration massive » de chercheurs d’une université voire d’un pays vers ORCID n’est pas irréaliste : fin 2013, la Fundação para a Ciência e a Tecnologia (FCT), principal financeur de la recherche au Portugal, a demandé à ses chercheurs de créer un profil ORCID et d’utiliser l’outil d’importation pour ajouter leurs publications depuis la base Scopus. En 3 semaines, 40 000 chercheurs portugais se sont enregistrés sur ORCID et ont importé plus de 75 000 références bibliographiques ! L’université de technologie Chalmers en Suèdel’université de Boston… s’y sont mis également, et un guide très bien fait est disponible en ligne pour passer à l’acte.

2. Déployer un logiciel CRIS

Nous l’avons vu, les logiciels CRIS que sont Pure, Elements ou Converis permettent également de construire un annuaire de chercheurs. L’annuaire constitue dans ce cas le sommet de l’iceberg, constitué par toutes les données produites dans l’université et gérées par le CRIS : dotations, publications, thèses, enseignements, collaborations, distinctions, brevets, impact… D’où un plus gros chantier à prévoir.

Par contre, il faut se garder des logiciels vieillissants utilisés en France comme GRAALSangria ou Pleiade : ils sont loin du compte pour ce qui est d’offrir un annuaire digne de ce nom ! Ainsi, l’université Bordeaux Montaigne qui cherchait en 2012 à baser son annuaire de chercheurs sur Sangriaa finalement décidé de procéder autrement.

3. Installer une solution d’annuaire

Les logiciels VIVOProfiles RNS ou UNIWeb sont spécialisés dans la gestion et la mise en ligne d’annuaires de chercheurs. Ils ont de nombreuses qualités, et les deux premiers ont l’avantage d’être sous licence libre et interopérables avec d’autres solutions d’administration de la recherche.

4. Adosser l’annuaire à un entrepôt institutionnel

Pour les établissements dont l’entrepôt institutionnel est déjà installé ou en projet, il peut être avantageux de bâtir par-dessus une « couche annuaire » qui pourra bénéficier de la richesse informationnelle de l’entrepôt. Et réciproquement, cela permet de placer l’archive ouverte au centre de la politique de l’établissement, avec la carotte (la visibilité, l’accessibilité) et le bâton (le mandat de dépôt, l’évaluation).

Le choix se situe alors entre un développement « maison » comme Okina à l’université d’Angers ou une solution clés en mains comme DSpace-CRIS.

Enfin, il faut souligner à nouveau l’effort américain, poussé par quelques grandes universités et des facultés de médecine soucieuses de recherche translationnelle (« from bench to bedside« ), de fédérer ces annuaires au sein de portails comme VIVOsearchDIRECT2experts ou CTSAsearch.

Imaginez ce que l’équivalent en France pourrait faire à la visibilité des chercheurs et de la recherche française 🙂

Bonus