CiteSeerx est à la fois un index de citations et un agrégateur de documents en libre accès dans le domaine de l’informatique et des disciplines associées (sciences de l’information, mathématiques appliquées, physique et économie). Il est particulièrement utile pour suivre les réseaux de citations.
CiteSeerx est avant tout un index de citations. Il moissonne les métadonnées des publications librement accessibles sur internet dans le but de faciliter les analyses statistiques des citations et des co-citations. Il s’agit du premier moteur de recherche scientifique à effectuer une indexation automatique de citations. En plus de référer des documents indexés dans la base de données, ces citations vont aussi référer à des documents qui en sont absents.
CiteSeerx est également un répertoire de littérature scientifique. La collection est constituée de documents en texte intégral. Son volume a connu une forte croissance à la fin les années 2000 grâce à l’essor du mouvement du libre accès : elle est passée de 1,8 millions de titres en 2008 à 21 millions en 2014. CiteSeerx accepte l’autoarchivage des articles par les auteurs et autrices.
Initialement spécialisé en informatique, sciences de l’information et mathématiques appliquées, le moteur intègre maintenant des publications du domaine de la physique et de l’économie.
La fréquence exacte de mise à jour du contenu n’est pas connue. Le site mentionne qu’il est « mis à jour régulièrement ».
Par défaut, l’écran d’accueil s’ouvre sur la recherche simple de documents.
1) Critères de recherche - Trois options d’interrogation sont disponibles : Documents, Authors et Tables. Cette dernière option permet de rechercher des graphiques et tableaux tirés des publications indexées.
2) Boîte de recherche - En plus de la boîte de recherche simple, un formulaire de recherche avancée est disponible (Advanced Search). Pour faire afficher les citations dans les résultats, il faut cocher la case Include Citations.
3) Liste des documents les plus cités et des citations les plus fréquentes.
4) Section réservée aux auteurs et autrices qui veulent archiver leurs articles.
Par défaut, la recherche est effectuée dans le texte des articles. Le formulaire de recherche avancée permet de choisir d’autres critères d’interrogation (titre, autorat, revue, affiliation, intervalle de dates de publication) ou d’en combiner plusieurs.
Les opérateurs booléens sont acceptés, mais il n’est pas possible de faire une recherche d’expression (guillemets). Il n’y a pas de caractères de troncature, mais la racinisation est automatique. Les caractères spéciaux (p. ex. les accents) sont pris en compte.
Les résultats sont triés par ordre de pertinence, selon la fréquence des termes recherchés dans le texte des articles. L’ordre du tri peut être changé pour le nombre de citations ou la date de publication.
CiteSeerx propose de lancer la même recherche avec d’autres moteurs scientifiques ou généralistes: (de gauche à droite) AllenAI Semantic Scholar, Google Scholar, Microsoft Academic, Google, Bing, DBLP Computer Science Bibliography.
Pour chaque article, CiteSeerx calcule :
Les citations sont présentées dans leur contexte. Exemple :
Les références bibliographiques peuvent être exportées au format BibTeX. Il est aussi possible de partager les articles sur les réseaux sociaux.
La création d’un compte CiteSeerx donne accès à d’autres fonctionnalités, dont la sauvegarde de résultats (Add to Collection), la correction d’erreurs (Correct Errors) et les alertes sur tout changement apporté aux articles sauvegardés (Monitor Changes).