Aller au contenu principal

Publish or Perish

Présentation

Publish or Perish (PoP) est un logiciel développé par Anne-Wil Harzing (professeure en management) et publié par Tarma Software Research Ltd. Il est disponible gratuitement pour une utilisation non-commerciale sur le site Harzing.com. Le logiciel permet aux chercheurs et chercheuses d’obtenir des données bibliométriques entre autres sur les auteurs et autrices ainsi que les publications moissonnées à partir de différentes sources (principalement Google Scholar). L’objectif déclaré, auquel fait référence l’aphorisme de son nom, est d’aider les chercheurs et chercheuses dans l’obtention de postes et de promotions académiques, comme l’a fait Harzing en 2006 pour son poste à Melbourne (Bensman, 2011, p.340).

  • Adresse : https://harzing.com/resources/publish-or-perish  
  • Créatrice : Anne-Will Harzing
  • Date de création : 17 octobre 2006
  • Modalité(s) d’accès : Licence privée non-exclusive, installation et accès gratuit pour usage non-commercial.

Le logiciel est disponible pour les systèmes d’exploitation Windows, MacOS et Linux.

Contenu

Types de données

Source: https://harzing.com/resources/publish-or-perish/manual/using/data-sources

Le logiciel de Harzing utilise principalement les données de Google Scholar (FAQ, Harzing, 2021), plus spécifiquement les résultats de sa recherche avancée, en les liant à d’autres sources comme Web of Science et Scopus (Harzing & Alakangas, 2015, p.5). Les données moissonnées sont donc variées et nombreuses. L’accès à Web of Science exige un abonnement (Data Sources, Harzing, 2021). L’accès à Scopus requiert la création d’un compte chez Elsevier et l’obtention (sans délai) d’un API à inscrire dans les préférences du logiciel.

Voir la page Google Scholar pour le type de données utilisé par PoP, sa couverture et sa mise à jour.

Couverture disciplinaire

La couverture de cet outil est extrêmement variée puisqu’elle moissonne les données de Google Scholar, CrossRef, PubMed, Web of Science et Scopus (toutes des bases de données multidisciplinaires).

Couverture chronologique et linguistique

Relative aux bases interrogées (voir Google Scholar, Web of Science et Scopus).

Mise à jour

Le logiciel est mis à jour en général une fois par année (History of Harzing.com, 2021). Pour la mise à jour des données elles-mêmes, voir les pages des bases appropriées.

Exploration

Interface

1) Zone d’organisation – par  défaut les recherches sont conservées dans My searches, il est toutefois possible de créer d’autres dossiers et d'y sauvegarder ses recherches;
2) Zone d’aperçu – pour les recherches stockées dans la zone d’organisation, donne un aperçu de la requête, incluant un résumé des résultats;
3) Formulaire de recherche – c’est ici qu'on peut chercher les données bibliométriques pour une personne ou une publication. À chaque nouvelle recherche, la source de données doit être choisie parmi la liste proposée.

Source: Logiciel Publish or Perish

4) Métriques de citation – présente un portrait global de l'auteur avec les statistiques de citation correspondant au résultats de la requête. Voir la section “Analyse des résultats” pour une présentation de ces statistiques.

5) Liste des résultats – présente une liste des titres de références publiées, en partie ou en totalité, avec des métadonnées.

6) Détails du document - présente les métadonnées relatifs au document sélectionné dans la liste de résultats.

Recherche

La recherche dans PoP est possible de plusieurs façons : par autorat, par publication/revue, par titre, par mots-clés, ou par affiliation. Il est en général possible d’utiliser les opérateurs booléens AND, OR (|) et NOT, dépendant de la base interrogée. Les pages d’aide se trouvant sur le manuel d’utilisation de Publish or Perish compilent un grand nombre de recommandations syntaxiques et de cas problèmes pour maximiser les résultats dans vos recherches. Par exemple, on fait remarquer, à juste titre, que des auteurs et autrices pourraient être omis dans la recherche sur Google Scholar si leurs publications ont été signées avec leurs initiales. On apprend aussi que Crossref ne permet pas la recherche exacte (avec guillemets) à partir des mots-clés.

Listes des formats d'importation de données selon la source
Source: Rubrique d’aide du logiciel Publish or Perish

Il est également possible de chercher par intervalle d’années et par ISSN. Le bouton Search Direct permet de contourner la cache de PoP pour interroger directement les sources de données, utile surtout lorsqu’il y a des données récentes à afficher. Le bouton Import External Data permet d’utiliser dans le logiciel de Harzing des données qui ont été exportées à partir de sources partenaires ou externes (voir image ci-dessus, tirée du site Web de Harzing, page Imported Data Format).

Analyse des résultats

Indices bibliométriques

Publish or Perish permet d’accéder à plusieurs données factuelles et bibliométriques, accessibles dans la zone de résultats (résumé - voir zone #4 dans la figure plus haut). Ces données sont expliquées sur le site de Harzing (Citation metrics).

Publication Years Plage de dates de publication des documents trouvés
Citation Years Nombre d’années depuis la date de la publication du document le plus ancien repéré par la requête.
Papers Nombre de publications dans la zone de résultats détaillés (voir zone #5)
Citations Cumul des citations pour l’ensemble des publications
Cites/year Moyenne de citations par année de publication
Cites/paper Cumul des citations pour l’ensemble des publications divisé par le total des publications
Cites/author [PoP6] Moyenne de citations par auteur
Papers/author [PoP6] Moyenne des publications par auteur
Authors/paper Moyenne des collaborations par publication pour une même personne autrice
h-index voir la page sur l'indice h
g-index voir la page sur l'indice g
hI, norm indice h individuel normalisé
hI, annual Variante de l'indice h relativisant le co-autorat
hA-index Variante de l'indice h relativisant l’âge de la revue
*Count Nombre de résultats dont les citations/année égale ou excède la limite des publications "étoiles" (fixée dans la page d'aide des préférences de résultats)
Papers with ACC >=1, 2, 5, 10, 20  [PoP7] Citations / années depuis la publication

Les valeurs bibliométriques peuvent changer selon la provenance des données mais les indicateurs restent les mêmes. La grande majorité des indicateurs mesurés sont liés à l'indice h ou à une de ses nombreuses variantes, que Harzing a elle-même contribué à développer (Harzing et al., 2014). Quelques indicateurs ne sont pas affichés dans l’interface mais sont disponibles à l’exportation (tels que l’indice e et l’indice hc).

Exportation / visualisation

Le logiciel de W-A Harzing ne permet pas la visualisation des données mais offre de nombreuses options de sauvegarde :

  • Rapport (bref ou étendu);
  • Métriques en CSV;
  • Résultats en différents formats (BibTeX, CSV, JSON, RIS, etc.)
  • Fichier de sauvegarde compressé

Harzing ne spécifie pas la version des styles utilisés ou la fréquence des mises à jour mais inclut de nombreux détails à l’endroit de l’exportation dans les différents formats de fichier. Pour sauvegarder ou copier les données, il suffit de cliquer sur Save Results ou Copy Results et choisir le format de sauvegarde. Le logiciel permet aussi d’exporter les données dans un format d’archive propre à PoP (.pxa), afin de stocker les recherches sélectionnées avec les 5 zones analysées précédemment, sous forme de backup.

Points forts et précautions

Points forts

  • Très grande couverture (disciplines, types et langues des documents);
  • Gratuit pour un usage non-commercial;
  • Interface intuitive et relativement facile d’utilisation;
  • Permet l’agrégation en un seul endroit de plusieurs sources bibliométriques;
  • Nombreuses options d’exportation.

Points faibles et précautions

  • Plusieurs défauts provenant de Google Scholar (données instables, qualités inégales, réserves liées à l'indice h, etc.);
  • Interprétation bibliométrique globale difficile étant donné les différences dans la couverture des diverses sources utilisées. Par ex. les données de citation provenant de Google Scholar dans la discipline de management sont trois fois plus nombreuses que dans Web of Science (Harzing - Academic Resources, 2020);
  • Plusieurs étapes nécessaires pour l'analyse bibliométrique (installation du logiciel, extraction des données de sources externes, etc.);
  • Performance de recherche du logiciel moins efficace que dans l’interface Web de Google Scholar. Par ex. aucune gestion des doublons par PoP et résultats parfois radicalement différents pour les variantes du nom (Anne-Wil vs A-W).

Références

Bensman, S. J. (2011). Anne-Wil Harzing: The publish or perish book: Your guide to effective and responsible citation analysis. Scientometrics, 88(1), 339‑342. https://doi.org/10.1007/s11192-011-0388-8
Harzing - Academic Resources. (2020, 27 août). Which data sources can Publish or Perish search? https://www.youtube.com/watch?v=DrpdmAPiE3Q

Harzing, A.-W. (2007). Publish or Perish. Harzing.com. Repéré le 9 novembre 2023 from https://harzing.com/resources/publish-or-perish

Harzing, A.-W. et Alakangas, S. (2016). Google Scholar, Scopus and the Web of Science: a longitudinal and cross-disciplinary comparison. Scientometrics, 106(2), 787‑804. https://doi.org/10.1007/s11192-015-1798-9
Harzing, A.-W., Alakangas, S. et Adams, D. (2014). hIa: an individual annual h-index to accommodate disciplinary and career length differences. Scientometrics, 99(3), 811‑821. https://doi.org/10.1007/s11192-013-1208-0
Jacso, P. (2009). Google Scholar’s Ghost Authors. Library Journal, 134(18), 26‑27.