Aller au contenu principal

Google Scholar

Présentation

Google Scholar (GS) est un moteur de recherche indexant de façon automatisée des publications savantes de toutes les disciplines, de tous types (articles, rapports techniques, livres, brevets, jurisprudence, etc.) et de diverses provenances (catalogues de certains éditeurs, dépôts institutionnels, sites web, réseaux sociaux académiques, bases de données, etc.).

Google Scholar Citations (ou Google Scholar Profiles) est le module de profils de chercheurs et chercheuses pouvant être publics et présentant des indicateurs bibliométriques basés sur le contenu de Google Scholar.

Google Scholar Metrics est un module fournissant des données bibliométriques récentes sous forme de palmarès.

Contenu

Types de données

Il n’y a aucun chiffre officiel du nombre de publications indexées dans GS, mais certains estiment qu’il contient près de 400 millions de références (Gusenbauer, 2018). Celles-ci proviennent de bases de données tant payantes que gratuites.

Voici quelques types de documents qu’on retrouve dans GS : articles de revues scientifiques (en version pre-print, post-print ou finales), livres, littérature grise, brevet, profils d’auteurs et d'autrices, etc.

Les analyses de GS Metrics se basent principalement sur les données de publication des articles scientifiques.

Couverture disciplinaire

Les robots de cet index cherchant dans tout le web, le contenu de GS couvre toutes les disciplines et même des sujets plus locaux, dans différentes langues.

Couverture chronologique

Il est difficile de déterminer la couverture chronologique exacte de GS. On peut y retrouver, par exemple, des livres numérisés de Google Books datant du 17e siècle.

Par ailleurs, GS énonce clairement que la jurisprudence de la cour suprême américaine remonte à 1791.

Le palmarès de GS Metrics se base sur les indicateurs bibliométriques des documents publiés dans les quatre années précédentes.

Mise à jour

GS peut prendre de six mois à un an pour mettre à jour les notices existantes dans son système. Cependant, des références sont ajoutées dans la base de données quelques fois par semaine.

Exploration

Interface

La langue de l’interface s’adapte à celle de l’usager, selon le paramétrage de son compte ou de son navigateur. Toutefois, les rubriques d’aide de GS sont présentées uniquement en anglais.

Comme Google Search, l’accueil de Google Scholar montre une barre de recherche unique.

Boîte de recherche Google Scholar

Le menu déroulant propose quelques onglets.

Menu Google Scholar

“Mon profil” correspond à Google Scholar Citations. Il s’agit d’un profil scientifique et bibliométrique, généré à partir d’un compte Google (requis) et alimenté par la personne détentrice du compte. On peut y retrouver notamment : la liste des publications, une photo, une affiliation (validée par l’adresse courriel institutionnelle), des champs d’intérêts et des données bibliométriques. La personne peut choisir de le rendre public ou non.

“Ma bibliothèque” est une banque d’articles favoris. On peut attribuer des étiquettes personnalisées aux différentes références.

Alertes - Suivi des mises à jour

“Alertes” permet de recevoir par courriel des alertes (des mises à jour) à partir de requêtes ou à partir des profils publics des auteurs et autrices. Il est à noter qu'on peut bénéficier de cette fonction sans avoir un compte Google.

“Métriques” mène au module Google Scholar Metrics.

Recherche

Il est possible d’utiliser différents opérateurs de recherche dans la recherche simple (comme AND, OR, -, “” et *) ainsi que quelques champs de recherche (site:, author:, allintitle:, filetype:).

GS propose trois filtres: la date, les langues et les types de documents inclus (brevets et citations).

Le tri par pertinence n’est pas détaillé par Google et le tri par date recense seulement les articles publiés dans la dernière année.

Dans GS, il n'est pas possible de limiter les résultats aux publications révisées par les pairs.

Formulaire de recherche avancée

La recherche avancée est accessible par le menu. Le formulaire permet de saisir les termes à rechercher, chaque ligne correspondant à un opérateur: p. ex., "Articles contenant tous les mots suivants" correspond à l'opérateur AND, "au moins un des mots suivants" correspond à l'opérateur OR, etc. On peut ainsi remplir un seul champ ou en combiner plusieurs. S’ajoute à cela la recherche par titre de revue et par intervalle de dates.

Résultat

Dans la présentation des résultats, il y a les métadonnées de base : type de document (s’il s’agit d’un livre ou d’un pdf par exemple), titre, autorat, année de publication, source web et résumé. Les différentes versions d’un même article sont regroupées sous une seule entrée.

Analyse des résultats

Indices bibliométriques

Les variations de l'indexation automatique du contenu de GS affectent la fiabilité et la stabilité de ses données bibliométriques. En effet, les données de citations d’un document disparaîtraient si, pour une quelconque raison, ce dernier n'était plus repérable par les robots de GS. De plus, les calculs de citations se font à travers différentes sources de valeur égale, qu’ils aient été ou non révisés par les pairs. Un éditorial, un rapport technique et une thèse auraient la même “valeur” de citation, par exemple.

Les seules données bibliométriques associées à chaque document sont le nombre total de citations distribué sur les années et la liste des documents qui le citent.

Nombre total de citations, par année

Google Scholar Citations

Noter qu'un profil doit être public pour que les données bibliométriques individuelles soient accessibles.

Les indices bibliométriques visibles sur les profils sont :

  • le nombre de citations;
  • l’indice h;
  • l’indice i10, soit le nombre d’articles ayant été cités au moins 10 fois.

Si les publications ont été financées par des organismes subventionnaires, le profil présentera un graphique du nombre de publications disponibles ou non en libre accès selon les exigences de libre accès de ces organismes. Attention! Ces données sont parfois erronées en raison des mécanismes de moissonnage (voir les explications de Google).

Accès public

Google Scholar Metrics

Dans son classement des publications phares, GS Metrics présente l’indice h5 (indice h des cinq dernières années) et  la médiane h5 (nombre moyen de fois que les articles composant l’indice h5 sont cités). Ce classement peut être divisible en catégories et sous-catégories disciplinaires.

Publications phares

En cliquant sur une revue, on trouve la liste des articles les plus cités ayant généré le h5 (h5-core).

Données pour une revue

GS Metrics indique aussi les "Mandats de libre accès" pour les dernières années, soit les statistiques d’articles disponibles en libre accès pour 184 organismes subventionnaires qui l’exigent.

Attention! Ces données sont parfois erronées en raison des mécanismes de moissonnage (voir les explications de Google).

Mandat de libre accès

Exportation / visualisation

GS donne accès en un seul clic à la référence bibliographique de chaque résultat (APA, ISO 690, MLA). En les sélectionnant dans la page des résultats pour qu’elles apparaissent dans “Ma bibliothèque”, on peut exporter les références en lot sous différents formats : BibTeX, EndNote, RefMan ou CSV.

L’outil Publish or Perish utilise les données de Google Scholar et permet une exportation dans d’autres formats et sans passer par “Ma bibliothèque”.

La liste des statistiques des “Mandats de libre accès” de GS Metrics est exportable en CSV.

Points forts et précautions

Points forts

  • Très grande couverture (disciplines, langues, types de documents);
  • Profite de l’outil de recherche sémantique très puissant de Google;
  • Simplicité d’utilisation, multilinguisme;
  • Gratuit.

Points faibles et précautions

  • Données instables et indexation automatisée générant des erreurs (doublons, identification erronée de l’auteur ou l'autrice) et lenteur voire impossibilité à résoudre certaines erreurs d’indexation;
  • Qualité inégale du contenu : repérage de revues sans révision par les pairs, voire potentiellement prédatrices;
  • Options de filtre et de tri peu développées;
  • Reproductibilité de la recherche difficile;
  • Peu de données bibliométriques (principalement indice H et nombre de citations);
  • Manque de transparence sur l'algorithme de recherche et les critères de pertinence;
  • Aucun DOI;
  • Aucune liste-maître des sources recensées;
  • Exportation des données limitée et peu conviviale.

Références

About Google Scholar. (s. d.). https://scholar.google.com/intl/fr/scholar/about.html
Bibliometrics and Impact Factor: Google Scholar. (2021). University of Utah Libraries Research Guides. https://campusguides.lib.utah.edu/c.php?g=160579&p=1053802
Bibliothèque de l’Université Laval. (s. d.). Tableau comparatif des principaux outils. Soutien à l’édition savante et à la recherche. https://www5.bibl.ulaval.ca/services/soutien-a-ledition-savante-et-a-la-recherche/bibliometrie-et-impact-de-la-recherche/indicateurs-et-sources/tableau-comparatif-des-principaux-outils
Elango, B. et Bornmann, L. (2021). Letter. New Google Scholar section with information on funded publications. El Profesional de la información, e300314. https://doi.org/10.3145/epi.2021.may.14
Google Scholar Profiles : Public Access. (s. d.). Google Scholar. https://scholar.google.fr/intl/fr/scholar/citations.html#publicaccess
Gusenbauer, M. (2019). Google Scholar to overshadow them all? Comparing the sizes of 12 academic search engines and bibliographic databases. Scientometrics, 118(1), 177‑214. https://doi.org/10.1007/s11192-018-2958-5
Khabsa, M. et Giles, C. L. (2014). The number of scholarly documents on the public web. PLoS ONE, 9(5), e93949. https://doi.org/10.1371/journal.pone.0093949
Larivière, V., Sugimoto, C. R. et Chisogne, S. (2018). Mesurer la science. Presses de l’Université de Montréal. https://pum.umontreal.ca/catalogue/mesurer-la-science
López-Cózar, E. D., Orduna-Malea, E., Martín-Martín, A. et Ayllón, J. M. (2017). Google Scholar: The Big Data Bibliographic Tool. Dans Research analytics: boosting university productivity and competitiveness through scientometrics. Auerbach Publications. https://doi.org/10.1201/9781315155890
Martín-Martín, A. et López-Cózar, E. D. (2021). Large coverage fluctuations in Google Scholar: a case study. http://arxiv.org/abs/2102.07571
Martín-Martín, A., Thelwall, M., Orduna-Malea, E. et Delgado López-Cózar, E. (2021). Google Scholar, Microsoft Academic, Scopus, Dimensions, Web of Science, and OpenCitations’ COCI: a multidisciplinary comparison of coverage via citations. Scientometrics, 126(1), 871‑906. https://doi.org/10.1007/s11192-020-03690-4
Service des Bibliothèques de l’UQAM. (s. d.). Google Scholar. Bibliométrie : indicateurs reliés aux autrices et aux auteurs. https://uqam-ca.libguides.com/bibliometrie-indicateurs-auteurs/google-scholar
Van Noorden, R. (2021). Do you obey public-access mandates? Google Scholar is watching. Nature, d41586-021-00873‑8. https://doi.org/10.1038/d41586-021-00873-8
Walden University Library. (s. d.). Google Scholar. https://academicguides.waldenu.edu/library/googlescholar/home