Aller au contenu principal

Glossaire terminologique

Glossaire terminologique

  • Accès / Access
  • L'utilisation continue, disponible pour l'utilisation, d'une ressource numérique, en conservant toutes les qualités d'authenticité, d'exactitude et de fonctionnalité jugées essentielles aux fins pour lesquelles le matériel numérique a été créé et/ou acquis. Les utilisateurs qui y ont accès peuvent récupérer, manipuler, copier et stocker des copies sur une large gamme de disques durs et de périphériques externes.

  • Agrégateur / Aggregator
  • Outil qui rassemble les métadonnées provenant de plusieurs fournisseurs de données et les rend accessibles dans un entrepôt OAI.

  • Annuaire / Index
  • Site recensant des entrepôts de données, permettant de filtrer ses recherches par critère.

  • APC (Article Processing Charges)
  • Frais de publication demandés aux auteurs par les éditeurs pour que leurs articles soient en libre accès dès leur publication. Ces frais sont fréquemment payés par l’université ou l’institut de recherche auquel l’auteur est rattaché, ou par l’organisme de financement soutenant ses recherches.

  • API (Application programming interface)
  • Ensemble normalisé de classes, de méthodes, de fonctions et de constantes qui sert de façade par laquelle un logiciel offre des services à d'autres logiciels. Elle est offerte par une bibliothèque logicielle ou un service web, le plus souvent accompagnée d'une description qui spécifie comment des programmes consommateurs peuvent se servir des fonctionnalités du programme fournisseur.

  • Archive ouverte / Open repository
  • Réservoir en ligne de publications scientifiques, principalement des articles. Il permet un accès libre – immédiat ou différé (voir embargo) – et gratuit pour le déposant et le lecteur. Il peut être institutionnel, thématique ou centralisé.

  • ARK (Archive Resource Key)
  • Système d’identifiants mis en place par la California Digital Library (CDL), et qui a vocation à identifier des objets de manière pérenne. Il peut s’agir d’objets de tous types, physiques (table, livre), numériques (livre numérisé…) ou même immatériels (concepts, …).

  • Article de données (voir data paper)
  • Publication qui décrit un jeu de données scientifiques, notamment à l’aide d’informations structurées appelées métadonnées. Contrairement aux articles de recherches classiques, les data papers fournissent une voie formalisée au partage des données plutôt que tester des hypothèses ou présenter de nouvelles analyses.

  • Article lisible par la machine / Machine-readable article
  • Document qui a un format utilisé et compris par un ordinateur.

  • Audit
  • Une évaluation indépendante d'une organisation, d'un système, d'un processus, d'un projet ou d'un produit.

  • Auto-archivage / self-archiving
  • Acte par lequel les chercheurs déposent eux-mêmes leurs articles dans des archives ouvertes.

  • Base de données / Database
  • On entend par base de données un recueil d’oeuvres, de données ou d’autres éléments indépendants, disposés de manière systématique ou méthodique, et individuellement accessibles par des moyens électroniques ou par tout autre moyen.

  • Biais de publication / Publication bias
  • Désigne en science le fait que les chercheurs et les revues scientifiques ont bien plus tendance à publier des expériences ayant obtenu un résultat positif (statistiquement significatif) que des expériences ayant obtenu un résultat négatif (soutenant l'hypothèse nulle). Il donne aux lecteurs une perception biaisée (vers le positif) de l'état de la recherche.

  • Bibliothèque de l'ombre / Shadow library
  • Bibliothèque numérique donnant librement accès à un contenu normalement masqué ou difficilement accessible, protégé par des frais d'abonnement ou des droits d'auteur. La plupart des bibliothèques de l'ombre sont illégales car elles violent les droits d'auteur.

  • Bibliothèque numérique / Digital library
  • Collection de documents (textes, images, sons) numériques (c'est-à-dire numérisés ou nés numériques) accessibles à distance (en particulier via Internet), proposant différentes modalités d'accès à l'information aux publics.

  • Big data
  • Terme évolutif qui décrit toute quantité volumineuse de données structurées, semi-structurées et non structurées qui ont le potentiel d'être exploitées pour obtenir des informations.

  • Born digital
  • Matériaux numériques qui ne sont pas destinés à avoir un équivalent analogique, que ce soit en tant que source d'origine ou à la suite d'une conversion en forme analogique.

  • Catalogue / Catalogue
  • Type de collection qui décrit et pointe vers les caractéristiques d'une autre collection.

  • Code source / Source code
  • Ensemble d’instructions composant un programme informatique dans un langage de programmation.

  • Consulter / Access / To access data
  • L'utilisation continue d'une ressource numérique, en conservant toutes les qualités d'authenticité, de précision et de fonctionnalité jugées essentielles aux fins pour lesquelles le matériel numérique a été créé et/ou acquis.

  • Contrôle qualité analytique / Analytical quality control
  • Processus et procédures conçus pour garantir que les résultats des analyses de laboratoire sont cohérents, comparables, exacts et dans les limites de précision spécifiées.

  • Copyleft
  • Concept opposé du copyright et proche du concept Creative Commons – qui s’en est inspiré. Par ce système, l’auteur ou l’autrice autorise l’utilisation (copie, commercialisation…) et la modification de son œuvre mais l’œuvre copiée ou « dérivée » doit être produite et diffusée sous les mêmes conditions que l’œuvre originale.

  • Copyright
  • Concept qui couvre les droits exclusifs accordés aux auteurs d’œuvres originales fixées sur un support matériel : droits de reproduction, d’adaptation, de distribution…

  • Curation / Curation
  • L'activité de gestion et de promotion de l'utilisation des données depuis leur point de création pour s'assurer qu'elles [sic] sont adaptées à un usage contemporain et disponibles pour la découverte et la réutilisation. Pour les ensembles de données dynamiques, cela peut signifier un enrichissement ou une mise à jour continus pour les conserver [sic] à des fins. Des niveaux plus élevés de curation impliqueront également des liens avec l'annotation et avec d'autres documents publiés.

  • Cycle de vie des données / Data lifecycle
  • Ensemble des étapes de gestion des données de la recherche, de la création à l'archivage, visant à les rendre FAIR tout au long de leur vie.

  • Cycle ouvert de la recherche / Open research lifecycle
  • Processus suivi par un chercheur pour mener à bien un projet ou une étude, de sa conception à la publication de ses données et résultats, et dans lequel toutes les étapes sont conformes aux pratiques de la science ouverte.

  • Data journal
  • Journal (toujours en libre accès) qui publie des articles de données (data papers). Il fournit habituellement des modèles de description des données et guide les chercheurs sur les lieux de dépôt et sur la façon de décrire et de présenter leurs données.

  • Data paper / Data article / Data descriptor
  • Produit de publication de données, pouvant apparaître dans un data journal ou dans une revue académique classique. Contrairement aux articles de recherche classiques, les data papers ont pour but de rendre les données accessibles, interprétables et réutilisables, plutôt que de tester des hypothèses ou présenter de nouvelles analyses.

  • DCC (Digital Curation Centre)
  • Centre d’expertise dans le domaine de la conservation numérique, qui met l’accent sur le renforcement des capacités et des compétences pour la gestion des données de recherche. Il fournit des conseils d’experts et une aide pratique aux organismes de recherche qui souhaitent stocker, gérer, protéger et partager des données de recherche numérique.

  • Découverte des données / Data discovery
  • Processus qui consiste à collecter des données de sources internes ou externes et à les combiner en une seule source, puis à détecter des patterns en analysant ces données ou en les visualisant.

  • Dépôt dans une archive ouverte / Deposit in an open archive
  • Dépôt d’un article (version publiée ou manuscrit final) dans une archive ouverte par l’auteur (auto-archivage, self-archiving) ou l’un de ses représentants. Ce dépôt est communément appelé voie verte (green road, green open access).

  • Dépôt disciplinaire / Subject repository
  • Dépôt qui réunit l’ensemble de la production de plusieurs institutions dans un domaine scientifique donné.

  • Dépôt de données
    • Action :
    • Le dépôt en tant qu’action est le fait de verser minimalement les métadonnées du jeu de données dans une infrastructure afin de les rendre disponibles à tous pour consultation.

    • Infrastructure :
    • Les dépôts sont des plateformes numériques dans lesquelles les chercheurs peuvent verser leurs jeux de données de recherche pour qu'ils soient repérables. Il existe plusieurs types de dépôts : disciplinaires, généralistes, institutionnels, etc.

  • Dépôt institutionnel / Institutional repository
  • Dépôt qui relève d’une institution (université, grande école, organisme de recherche, association professionnelle) et a pour objectif de contenir, valoriser et conserver l’ensemble de la production scientifique de celle-ci.

  • Dictionnaire de données / Data dictionary
  • Collection de descriptions des objets de données ou des éléments dans un modèle de données.

  • DOI (Digital Object Identifier)
  • Identifiant pérenne qui permet l’identification unique d’un objet physique ou numérique et sa citation. Il fournit un lien stable à des ressources en ligne, comme les données de la recherche.

  • Données / Data
  • Faits, mesures, enregistrements, enregistrements ou observations sur le monde collectés par des scientifiques et autres, avec un minimum d'interprétation contextuelle. Les données peuvent être n'importe quel format ou support prenant la forme d'écrits, de notes, de chiffres, de symboles, de texte, d'images, de films, de vidéos, d'enregistrements sonores, de reproductions picturales, de dessins, de conceptions ou d'autres représentations graphiques, de manuels de procédure, de formulaires, de diagrammes, de flux de travail. des graphiques, des descriptions d'équipement, des fichiers de données, des algorithmes de traitement de données ou des enregistrements statistiques.

  • Données achevées / Completed data
  • Données non préparatoires produites par les établissements de recherche et d’enseignement dans le cadre de leur mission de service public. Il peut s’agir de données brutes, de données élaborées ou de métadonnées. Elle sont qualifiées de documents administratifs et sont donc communicables à toute personne qui en fait la demande, sauf exceptions légales.

  • Données à risques / At-risk data
  • Des données qui risquent d'être perdues. Les données à risque comprennent les données qui ne sont pas facilement accessibles, ont été dispersées, ont été séparées de l'objet de sortie de la recherche, sont stockées sur un support obsolète ou risquant de se détériorer, les données qui n'ont pas été enregistrées sous forme numérique et données qui sont disponibles mais ne sont pas utilisables parce qu'elles ont été détachées des données de support, des métadonnées et des informations nécessaires pour les utiliser et les interpréter intelligemment.

  • Données brutes / Raw data
  • Données issues d’une expérimentation, d’un procédé, d’une enquête, etc. : il peut s’agir de données de recherche communicables.

  • Données corrompues / Corrupt data
  • Détérioration des données informatiques à la suite de certains agents externes tels que virus, incompatibilité matérielle ou logicielle, défauts ou pannes, pannes de courant, poussière, eau, températures extrêmes, etc.

  • Données de la recherche / Research data
  • Des enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider des résultats de recherche. Un ensemble de données de recherche constitue une représentation systématique et partielle du sujet faisant l’objet de la recherche. Ce terme ne s’applique pas aux éléments suivants : carnets de laboratoire, analyses préliminaires et projets de documents scientifiques, programmes de travaux futurs, examens par les pairs, communications personnelles avec des collègues et objets matériels (par exemple, les échantillons de laboratoire, les souches bactériennes et les animaux de laboratoire tels que les souris).

  • Données du consommateur / Consumer data
  • Le parcours d'information que les clients laissent derrière eux en raison de leur utilisation d'Internet. Ces données, qui comprennent parfois des informations personnelles, proviennent de sources et de canaux tels que les réseaux de médias sociaux, les campagnes marketing, les demandes de service client, les communications du centre d'appels, les données de navigation en ligne, les applications mobiles, l'historique et les préférences d'achat, etc.

  • Données intégrées / Embedded data
  • Données figurant dans une publication scientifique.

  • Données ouvertes / Open data
  • Données partagées à quiconque sans restriction d’accès ou de consultation. Par exemple, la cession dans le domaine public ou le choix d’une licence comme Creative Commons en CC0 ou en CC-BY peuvent permettre la disponibilité en données ouvertes.

  • Données préliminaires / Preliminary data
  • Données préparatoires, préalables, nécessaires à la mise en place d’une expérimentation, d’un procédé, d’une enquête, etc : il ne s’agit pas de données de recherche.

  • Données sensibles / Sensitive data
  • Données à caractère personnel qui font apparaître, directement ou indirectement, les origines raciales ou ethniques, les opinions politiques, philosophiques ou religieuses ou l’appartenance syndicale des personnes, ou sont relatives à la santé ou à la vie sexuelle de celles-ci.

  • Données sous-jacentes / Underlying data
  • Données nécessaires à la validation des résultats présentés dans les publications scientifiques.

  • Données statistiques / Statistical data
  • Donnée collectée par voie d’enquête statistique ou transmises au service statistique public à des fins d’établissement des statistiques.

  • Données utilisables / Usable data
  • Des données qui peuvent être comprises et utilisées sans informations supplémentaires. Les données utilisables sont fournies sous une forme qui répond aux besoins des différents publics d'utilisateurs finaux, est prête pour les tâches que l'utilisateur final doit accomplir et qui a été adaptée aux besoins de l'utilisateur final (et non l'inverse) . Les données utilisables ont été nettoyées, structurées, sont dans un format lisible par machine, entièrement documentées et prêtes pour l'analyse et l'interprétation.

  • Droit d'auteur / Copyright
  • Ensemble des droits dont jouissent les auteurs sur leurs œuvres. Une œuvre est protégée dès sa création et dès lors qu’elle est originale, et ceci sans dépôt ni enregistrement. Le droit d’auteur comprend notamment des droits patrimoniaux ou d’exploitation qui peuvent être cédés à un tiers par l’auteur : droits de reproduction, de représentation et de suite et droit d’autoriser les œuvres dérivées. Les droits moraux ne sont pas cessibles.

  • Droit sui generis du producteur de base de données / Sui generis right of the database producer
  • Droit acquis au producteur de la base de données sur le contenu de celle-ci lui permettant d’interdire l’extraction ou la réutilisation d’une partie qualitativement ou quantitativement substantielle du contenu de sa base. Attention, à ne pas confondre avec l’architecture de la base de données, le contenant, qui est protégée par le droit d’auteur.

  • DSA (Data Seal of Approval)
  • Sceau d’approbation pour les données établi afin de s’assurer que les données archivées peuvent encore être trouvées, comprises et utilisées à l’avenir. Les objectifs du sceau d’approbation des données sont de protéger les données, d’assurer une haute qualité et de guider la gestion fiable des données pour l’avenir sans exiger la mise en œuvre de nouvelles normes, de nouveaux règlements ou des coûts élevés.

  • Écosystème du savoir / Scholarly ecosystem
  • Approche de la gestion des connaissances qui prétend favoriser l'évolution dynamique des interactions de connaissances entre différentes entités pour améliorer la prise de décision et l'innovation grâce à l'amélioration des réseaux évolutifs de collaboration.

  • Édition prédatrice / Predatory publishing
  • Édition qui détourne les possibilités de l'édition scientifique en libre accès à des fins mercantiles, où la recherche de profits prévaut sur les principes de rigueur scientifique et éditoriale habituellement respectés par les éditeurs de revues savantes.

  • Effet de réseau / Network effect
  • Phénomène dans lequel le prestige lié à la participation à une activité augmente avec le nombre de participants. La conséquence est que les membres d'un groupe sont désavantagés lorsqu'ils s'écartent des normes existantes. Par exemple, un chercheur choisissant de publier dans une revue en libre accès plutôt que dans une revue plus "prestigieuse" sur abonnement, pourrait amener les évaluateurs des futures demandes de financement de l'auteur à porter un jugement moins favorable sur son travail.

  • Embargo / Embargo period
  • Période pendant laquelle les articles et les données de recherche déposés dans un réservoir ne sont pas accessibles librement.

  • Épirevue / Overlay journal
  • Revue électronique en libre accès, alimentée par les articles déposés dans les archives ouvertes et non publiés par ailleurs.

  • Espace de nommage / Namespace
  • Désigne en informatique un lieu abstrait conçu pour accueillir des ensembles de termes appartenant à un même répertoire.

  • Entrepôt de confiance / Trusted repository
  • Entrepôt de données répondant aux critères de qualité exigés pour obtenir une certification (format des données, qualité des métadonnées, conditions d’accès et de réutilisation, identifiant pérenne, archivage à long terme, …). De nombreux entrepôts n’ont pas de certification mais sont cependant largement reconnus par la communauté scientifique et offrent des garanties de conservation à long terme.

  • Entrepôt de données / Data repository / Digital repository
  • Réservoir de données de recherche, brutes ou dérivées, qui peuvent être retrouvées et réutilisées grâce à une description par des métadonnées. Un identifiant pérenne ou numéro d’accès est attribué à chaque jeu de données. Il peut être disciplinaire ou thématique, être institutionnel ou centralisé.

  • Entrepôt mixte / Mixed repository
  • Entrepôt contenant à la fois des publications scientifiques et des jeux de données.

  • Principes FAIR / FAIR principles
  • La notion de FAIR data recouvre les manières de construire, stocker, présenter ou publier des données de manière à permettre que la donnée soit facile à trouver, accessible, interopérable et réutilisable.

  • Fichier Lisez-moi / README
  • Premier fichier qu’un développeur doit consulter avant d’entamer un projet. [...] Il contient habituellement des informations importantes à propos du système, du projet ou du logiciel en question.

  • Format de fichier / File format
  • Un format de fichier est une manière uniforme d'encoder un fichier informatique aux fins de stockage. Le format de fichier indique à l'ordinateur comment afficher, imprimer, traiter et enregistrer l'information. Le format est dicté par l'application qui a créé le fichier et par le système d'exploitation sous lequel il a été créé et stocké. Certains formats de fichiers sont propres à certains types de données alors que d'autres servent de contenant pour différents types de fichiers. Un format de fichier particulier est souvent identifié par une extension de trois ou quatre lettres.

  • Fouille de texte et de données / Text and Data Mining - TDM
  • Analyse informatique de bases de données et de corpus de texte pour extraire des éléments d’information qui serviront à la construction de connaissances.

  • Fournisseur de données / Data provider
  • Personne physique ou morale qui fournit de l'information ou alimente une base de données pour diffusion sur un quelconque support de communication.

  • Gestion des données de recherche / Research data management
  • Comprend les disciplines liées à la gestion des données de recherche en tant que ressource précieuse. Ceux-ci peuvent inclure, sans s'y limiter, la gouvernance, la sécurité et la qualité des données de recherche.

  • Humanités numériques / Digital humanities
  • [Les humanités numériques] désignent une transdiscipline, porteuse des méthodes, des dispositifs et des perspectives heuristiques liés au numérique dans le domaine des Sciences humaines et sociales.

  • Information scientifique / Scientifiques information
  • Articles de recherche scientifique évalués par les pairs et données de recherche (publications de données sous-jacentes, données ayant subi une curation ou données brutes).

  • Informations publiques / Public information
  • Les informations publiques sont celles qui figurent dans les documents administratifs publics ou communiqués.

  • Interopérabilité / Interoperability
  • Capacité de différents systèmes informatiques à dialoguer entre eux, à échanger des données, à communiquer sans ambigüité et ainsi interpréter des informations correctement.

  • ISNI (International Standard Name Identifier)
  • Code international normalisé servant à identifier de manière univoque, sur le long terme et à l’échelle internationale, les personnes et les organismes. Il permet d’identifier au niveau international les identités publiques des personnes ou des organismes impliqués dans la création, la production, la gestion et la distribution de contenus intellectuels et artistiques ou faisant l’objet de ces contenus. Les personnes identifiées peuvent être, par exemple, l’auteur, l’éditeur, le traducteur, l’illustrateur ou le sujet d’une œuvre.

  • IST
  • Information Scientifique et Technique

  • Jeu de données / Dataset
  • Agrégation (…) de données brutes ou dérivées présentant une certaine « unité », rassemblées pour former un ensemble cohérent.

  • Libre accès / Open access
  • Accès à des informations scientifiques en ligne, gratuites pour l’utilisateur final et réutilisables.

  • Licence Creative Commons / Creative Commons licence
  • Contrats-type, proposés par l’organisation Creative Commons, par lesquels les chercheurs et chercheuses déterminent les droits attachés à l’article ou aux données de recherche qu’ils ont produits dans le cadre de leurs recherches. Six contrats sont possibles en combinant quatre éléments de base qui sont : la paternité, la modification, l’utilisation commerciale et la réutilisation dans les mêmes conditions du contrat d’origine.

  • Métadonnées / Metadata
  • Ensemble d’informations structurées qui décrit, explicite, localise une ressource informationnelle, dans le but d’en faciliter la recherche, l’usage, et la gestion.

  • Métadonnées structurelles / Structural metadata
  • Un type de métadonnées qui indique comment les objets composés sont assemblés (par exemple, comment les pages sont ordonnées pour former des chapitres ; comment les données sont organisées dans un tableau ; comment les ensembles de données sont organisés dans une collection).

  • METS (Metadata Encoding and Transmission Standard)
  • Schéma XML qui permet la description intégrale d’objets numériques. Ce schéma sert à exprimer des métadonnées de nature diverses portant sur un document numérique, dans le but de faciliter son échange, sa gestion et sa préservation. Il peut servir de standard pour l’échange d’objets numériques entre différentes archives ou différents entrepôts.

  • Modèle auteur-payeur / Author-payer model
  • L’auteur ou son institution d’appartenance ou le bailleur de fonds donne une contribution à l’éditeur pour rendre l’article librement et gratuitement accessible à tous.

  • Modèle freemium / Freemium model
  • Modèle économique qui combine deux modes d’accès à des textes : un accès libre et gratuit pour un service « basique » et un accès payant pour une offre plus évoluée ou des services complémentaires.

  • Modèle hybride / Hybrid model
  • Modèle économique qui fait coexister deux types d’articles dans une même revue : ceux qui sont librement accessibles, contre une redevance versée à l’éditeur, et ceux qui sont accessibles par un abonnement.

  • Modèle lecteur-payeur / Reader-payer model
  • Modèle traditionnel de l’édition, l’abonnement. Le lecteur ne peut avoir accès qu’aux revues et aux ouvrages pour lesquels il a pris, mais le plus souvent il s’agit de son institution, un abonnement auprès d’un ou plusieurs éditeurs.

  • Modèle OAIS (Open Archival Information System)
  • Cadre conceptuel pour un système d’archivage dédié à la préservation et au maintien de l’accès à l’information numérique à long terme. Le but du modèle de référence est d’accroître la sensibilisation et la compréhension des concepts pertinents pour l’archivage d’objets numériques, en particulier parmi les institutions non archivistiques ; d’élucider la terminologie et les concepts pour décrire et comparer les modèles de données et les architectures archivistiques ; d’élargir le consensus sur les éléments et les processus endémiques de la préservation et de l’accès à l’information numérique ; et de créer un cadre pour guider l’identification et l’élaboration de normes.

  • Modèle sponsor-payer / Sponsor model
  • Modèle économique dans lequel le financement de la revue est pris en charge par une société savante, un organisme de recherche, une fondation…

  • Normalisation des données / Data normalisation
  • Le processus d'organisation des données dans des tableaux de telle sorte que les résultats de l'utilisation de la base de données soient toujours sans ambiguïté et conformes aux attentes. La normalisation est généralement un processus de raffinement après l'exercice initial d'identification des objets de données qui doivent figurer dans la base de données, d'identification de leurs relations et de définition des tables requises et des colonnes dans chaque table.

  • OAI-PMH
  • Protocole informatique développé par l'Open Archives Initiative afin d'échanger des métadonnées. Il permet de constituer et de mettre à jour automatiquement des entrepôts centralisés où les métadonnées de sources diverses peuvent être interrogées simultanément.

  • Ouverture des données / Open data
  • Ouverture des données au sens juridique et informatique : « Données qu’un organisme met à la disposition de tous sous forme de fichiers numériques afin de permettre leur réutilisation. Les données ouvertes n’ont généralement pas de caractère personnel. Elles sont accessibles dans un format favorisant leur réutilisation. La réutilisation des données peut être soumise à condition.»

  • Outil de moissonnage de données / Metadata harvester
  • Collecte automatisée de descriptions de métadonnées provenant de différentes sources pour créer des agrégations utiles de métadonnées et de services associés.

  • Partage des données
  • Il consiste à partager les métadonnées et les jeux de données avec ou sans conditions de consultation et de réutilisation.

  • PID (Persistent IDentifier)
  • Identifiant pérenne qui garantit un lien univoque et stable sur le long terme pour la ressource en ligne. Il fait correspondre en permanence l’identité de la ressource avec sa localisation sur le web.

  • Plan de gestion des données (PGD) / Data management plan (DMP)
  • Document à concevoir au début d’un projet de recherche expliquant la façon dont les données de recherche recueillies ou générées seront gérées durant le projet et après son terme.

  • Propriété industrielle / Industrial property
  • « La propriété industrielle a […] pour objet la protection et la valorisation des inventions, des innovations et des créations. »

  • Propriété intellectuelle / Intellectual property
  • « La propriété intellectuelle regroupe la propriété industrielle, d’une part, et la propriété littéraire et artistique, d’autre part. »

  • Publication dans une revue en libre accès / Open access publishing
  • Publication d’un article dans une revue donnant un accès libre et gratuit aux lecteurs dès sa publication. Le mode de financement diffère d’une revue à l’autre. Certains éditeurs ne demandent aucun frais, d’autres en demandent (voir frais de publication). Ce mode de publication est désigné par voie dorée (gold road, gold open access).

  • PURL / Persistent URL
  • Fonctionnellement, un PURL est une URL. Cependant, au lieu de pointer directement vers l’emplacement d’une ressource Internet, un PURL pointe vers un service de résolution intermédiaire. Le service de résolution PURL associe le PURL à l’URL réelle et renvoie cette URL au client sous la forme d’une redirection HTTP standard. Les PURLs sont une approche pour résoudre le problème des URLs instables.

  • RDF (Resource Description Framework)
  • Modèle standard de graphe destiné à décrire de façon formelle les ressources web et leurs métadonnées, de façon à permettre le traitement automatique de telles descriptions.

  • Repérabilité / Findability
  • Principe [qui] a pour objectif de faciliter la découverte des données par les humains et les systèmes informatiques et requiert une description et une indexation des données et des métadonnées.

  • Répertoire d'entrepôts
  • Site recensant des entrepôts de données, permettant de filtrer ses recherches par critère.

  • Science des données / Data Driven Science - Data Science
  • La science des données, parfois opposée à la science expérimentale, est une autre façon de faire de la science. Elle se base sur des méthodes automatisées pour fouiller et analyser de grandes quantités de données afin d’en extraire des éléments d’information qui serviront à la construction de connaissances.

  • Science ouverte / Open science
  • Diffusion sans entrave des publications et des données de la recherche.

  • Secret statistique / Statistical confidentiality
  • Le secret statistique permet d’apporter aux personnes qui fournissent des informations utilisées pour l’établissement de statistiques l’assurance que ces informations ne seront pas utilisées d’une façon susceptible de leur porter tort. Il permet ainsi d’assurer :

    • Aux personnes physiques que la confidentialité sur leur vie personnelle et familiale sera garantie,
    • Aux entreprises que le secret commercial sera respecté : les informations transmises ne seront pas mises à la disposition de leurs concurrents

  • Secret professionnel / Professional confidentiality
  • Toute information dont une personne a eu connaissance de par son état ou sa profession, soit en raison d’une fonction ou d’une mission temporaire. Ce sera donc toute information dont une personne a eu connaissance au cours de l’exercice de ses fonctions professionnelles. Le terme « état » renvoie à une fonction qui n’est pas forcément d’ordre professionnel, comme une fonction religieuse.

  • Service de découverte des données / Data discovery service
  • La découverte de données implique la collecte et l'évaluation de données provenant de diverses sources et est souvent utilisée pour comprendre les tendances et les modèles des données. Cela nécessite une progression d'étapes que les organisations peuvent utiliser comme cadre pour comprendre leurs données.

  • Service regroupé / Aggregation
  • Le rapprochement d'éléments. Les types d'agrégations diffèrent par la nature des processus par lesquels les éléments sont rassemblés et la raison comprise pour l'agrégation ou le contenu en tant qu'unité. Les agrégations diffèrent par la nature des relations entre les parties membres.

  • Silos de données / Data silo
  • Constitués de bases de données dont l’accès est uniquement réservé à une partie des collaborateurs d’une organisation.

  • Source de données / Data source
  • L’endroit où les données ont été créées ou celui où les informations physiques ont été numérisées.

  • TDM (Text and Data Mining)
  • Extraction d’un savoir ou d’une connaissance à partir de grandes quantités de textes et de données, par des méthodes automatiques ou semi-automatiques.

  • TRAC (Trustworthy Repositories Audit & Certification)
  • Liste de critères permettant d’identifier les entrepôts numériques capables de stocker, de migrer et de donner accès aux collections numériques de manière fiable.

  • Traitement de données personnelles / Processing of personal data
  • Opération, ou ensemble d’opérations, portant sur des données personnelles, quel que soit le procédé utilisé (collecte, enregistrement, organisation, conservation, adaptation, modification, extraction, consultation, utilisation, communication par transmission diffusion ou toute autre forme de mise à disposition, rapprochement). Un traitement de données doit avoir un objectif, une finalité, c’est-à-dire que vous ne pouvez pas collecter ou traiter des données personnelles simplement au cas où cela vous serait utile un jour. A chaque traitement de données doit être assigné un but, qui doit bien évidemment être légal et légitime au regard de votre activité professionnelle.

  • Vérification de la reproductibilité / Reproducibility testing
  • Processus qui valide le fait que les résultats de recherche rapportés peuvent être obtenus dans une expérience indépendante.

  • Vocabulaire contrôlé / Controlled vocabulary
  • Une liste de terminologie, de mots ou d'expressions normalisés, utilisée pour l'indexation ou l'analyse de contenu et la recherche d'informations, généralement dans un domaine d'information défini.