DCMI

Un article de Wiki Paris Descartes.

Version du 6 avril 2009 à 17:05 par Valencie (Discuter | Contributions)
(diff) ← Version précédente | voir la version courante (diff) | Version suivante → (diff)
Des clés pour comprendre l'Université numérique
Accès par catégories au glossaire : Accès thématique
HYPERGLOSSAIRE : A B C D E F G H I J K L M N O P Q R S T U V W X Y Z



(Dublin Core Metadata Initiative - Initiative de métadonnées du Dublin Core(IMDC) - Abrégé : Dublin Core (DC))
Organisation dont la mission consiste à développer des standards interdisciplinaires pour améliorer la recherche. Elle vise à promouvoir l’adoption à grande échelle de métadonnées standards et interopérables dans la description des ressources électroniques.

La norme de métadonnées du Dublin Core, proposé par la DCMI, est un ensemble d'éléments simples mais efficaces pour décrire une grande variété de ressources en réseau. La norme du Dublin Core comprend 15 éléments ("Dublin Core metadata") dont la sémantique a été établie au cours d'une série d'ateliers internationaux par des professionnels issus de diverses disciplines telles que la bibliothéconomie, l'informatique, le balisage de textes, la communauté muséologique et d'autres domaines connexes. C'est au cours d'un atelier organisé en 1995 à Dublin (Ohio) que fut défini le premier jeu de métadonnées.


Caractéristiques de Dublin Core

Le Dublin Core est le seul schéma général de métadonnées qui soit très largement reconnu par tous les acteurs de l'Internet et qui fasse référence. Il est relativement simple puisqu'il ne comporte que quinze éléments de description non hiérarchisés.

  • Les éléments de base du Dublin Core répondent à des critères de simplicité et de concision
    L'ensemble des éléments du Dublin Core a été conçu afin de permettre au non-spécialiste de créer sans difficultés des notices descriptives simples pour les ressources informationnelles tout en permettant des recherches efficaces de ces mêmes ressources dans un environnement en réseau.
  • L’identification des champs est conçue à partir d’une sémantique interdisciplinaire
    La terminologie suffisamment générique des éléments augmente ainsi la visibilité et l'accessibilité de toutes les ressources à tout internaute.
  • Envergure internationale
    L'ensemble d'éléments du Dublin Core a été d'abord développé en anglais mais grâce à de nombreux représentants qui s’impliquent sur presque tous les continents, une vingtaine de versions linguistiques du Dublin Core existe déjà.
  • Flexibilité
    Les éléments et qualificatifs sont facultatifs et répétables.
  • Extensibilité
    Si le modèle permet à différentes communautés d'utiliser l'ensemble des éléments du DC pour la description primaire de l'information, il autorise également :
    • des ajouts, spécifiques à un domaine, qui soient pertinents dans une communauté particulière (par ex, pour la communauté éducative).
    • l'association possible avec des métadonnées d'autres origines.


Les éléments de base (core elements)

  • Eléments liés au contenu de la ressource
    • Couverture : Etendue ou portée du contenu de la ressource
      Il peut s'agir d'une localisation spatiale (un nom de lieu ou des coordonnées géographiques), une période temporelle (une étiquette temporelle, une date ou une intervalle de dates) ou une juridiction (telle qu'une entité administrative nommée).
    • Description : Description du contenu de la ressource
      Elle peut contenir un résumé, une table des matières, une référence à une représentation graphique du contenu, un texte libre sur le contenu, etc. Le champ description est une source potentiellement riche de vocabulaire indexable.
    • Type : Nature ou du genre de contenu de la ressource
      Il est recommandé d'utiliser une valeur du vocabulaire contrôlé (Collection, Dataset, Event, Image, InteractiveResource, MovingImage, PhysicalObject, Service, Software, Sound, StillImage, Text)
    • Relation : Référence à une ressource reliée
      Chaîne de caractères ou de chiffres.
    • Source : Référence à une ressource à partir de laquelle la présente ressource est dérivée
    • Chaîne de caractères ou de chiffres.
    • Sujet : Sujet du contenu de la ressource
      Choisir des mots-clés significatifs et uniques.
    • Titre : Nom donné à la ressource
      Typiquement, le titre est le nom par lequel la ressource est officiellement connue.

  • Eléments liés à la propriété intellectuelle de la ressource
    • Collaborateur : Entité responsable de contributions au contenu de la ressource
    • Créateur : Entité principalement responsable de la création du contenu de la ressource
      (Une personne, un organisme ou un service).
    • Editeur : Entité responsable de rendre la ressource disponible
      (Une personne, un organisme ou un service).
    • Droits : Information au sujet des droits d tenus dans et sur la ressource.
      Enoncé sur la gestion des droits de la ressource ou une référence à un service fournissant une telle information. Les informations sur les droits englobent souvent les droits de propriété intellectuelle, le copyright et divers droits de propriété.

  • Eléments liés à l'instance particulière de la ressource
    • Date : Date associée à un évènement dans le cycle de vie de la ressource.
      Date de la création ou de la disponibilité de la ressource.
    • Format : Manifestation physique ou numérique de la ressource
      Type de média ou les dimensions de la ressource. Le format peut être utilisé pour déterminer le logiciel, le matériel ou tout autre équipement nécessaire à l'affichage ou au fonctionnement de la ressource.
    • Identifiant : L'identifiant est la référence non ambigüe à la ressource dans un contexte donné.
      (URL, ID, cote, ISBN, DOI, etc).
      Cet élément est notamment utilisé pour localiser la ressource, dans le cas d'une notice où la métadonnée est autonome (figurant dans un fichier extérieur à la ressource). .
    • Langue : Langue du contenu intellectuel de la ressource
      Information codée ou textuelle.


Chaque élément est optionnel et peut être répété. Les éléments de métadonnées peuvent apparaître dans n'importe quel ordre. Chaque élément possède également un ensemble limité de qualificatifs (attributs qui peuvent être utilisés afin de raffiner davantage la signification de l'élément). L'Initiative de métadonnées du Dublin Core (IMDC) a défini, en juillet 2000, des façons normalisées de "qualifier" les éléments au moyen de différents types de qualificatifs.
On distingue deux grandes catégories de qualificatifs :

  • le raffinements d'éléments
    Ces qualificatifs permettent de préciser le sens d'un élément pour qu'il soit plus circonscrit ou plus précis.
  • le schéma d'encodage
    Ces qualificatifs identifient des schémas qui aident l'interprétation de la valeur d'un élément ou un raffinement. Ces schémas comprennent des vocabulaires contrôlés et des notations formelles ou des règles d'interprétation. Une valeur exprimée en utilisant un schéma d'encodage pourra donc être une expression sélectionnée à partir d'un vocabulaire contrôlé (e.g. un terme d'un système de classification ou un ensemble de vedettes matières) ou une chaîne de caractères formatée en accord avec une notation formelle.

Ainsi, le Dublin Core peut être désigné comme :

  • simple : lorsque seuls sont utilisés les 15 éléments de base
  • qualifié : lorsqu'aux éléments de base sont ajoutés les qualificatifs
  • étendu : lorsque sont ajoutés des éléments issus d'autres standards (LOM, par exemple) ou des éléments relatifs à la gestion de collection, etc.


Syntaxe

Les concepts Dublin Core sont applicables à presque tous les formats de fichiers, notamment :

  • HTML, XHTML : métadonnées dans la ressource
  • XML, RDF : métadonnées dans un autre fichier ("notice descriptive")


Le langage HTML fournit un format facilement compréhensible pour montrer l'utilisation des concepts du Dublin Core :

  • Les métadonnées du Dublin Core prennent place dans les balises <META> du langage, à l'intérieur de l'en-tête (section <HEAD>). Ces balises peuvent être en effet extraites, reconnues, analysées et exploitées par les programmes d'indexation et les navigateurs web.
    La balise <META> contient les attributs suivants :
    • "name" (obligatoire) : nom de la métadonnée
    • "content" (obligatoire) : valeur de la métadonnée
    • "lang" (optionnel) : langue du contenu
    • "scheme" : format normalisé utilisé pour le contenu


    La syntaxe à utiliser pour mentionner les éléments du Dublin Core est la suivante :

    <META name="DC.Nom d'élément" content="valeur de la métadonnée"/>

    Lorsqu'on utilise un raffinement, on utilise la syntaxe suivante :

    <META name="DC.Nom d'élément.nom de raffinement" content="valeur de la métadonnée"/>

    Exemple :

    <html>
     <head>
       <title>Un document en HTML</title>
       <meta http-equiv="Content-type"
         content="text/html; charset=iso-8859-1" />
       <link rel="schema.DC"
         href="http://purl.org/dc/elements/1.1/" />
       <meta name="DC.Title" lang="fr" content="Un document en HTML" />
       <meta name="DC.Date.created" scheme="W3CDTF" content="2003-04-03" />
       <meta name="DC.Date.modified" scheme="W3CDTF" content="2003-04-27" />
       <meta name="DC.Subject" lang="fr" content="HTML, document, Dublin Core" />
       <meta name="DC.Language" scheme="RFC3066" content="fr-FR" />
       <meta name="DC.Description" lang="fr"
         content="Mon premier document HTML avec métadonnées" />
     </head>
     <body>
       …
    </body> </html>
  • La balise <LINK …> référence la liste officielle des éléments et des raffinements du Dublin Core.
    Elle permet aux logiciel de savoir à quoi exactement correspond le préfixe DC, en spécifiant son schéma :
    <LINK rel="schema.DC" href="http://purl.org/dc/elements/1.1/"/>


L’un des plus grands succès du Dublin Core est sans doute l’apparition de l’"Open Archives Initiative Protocol for Metadata Harvesting", plus souvent désigné sous l’acronyme OAI-PMH. Élaboré en 1999, ce projet visait initialement à « [...] faciliter la description et la diffusion des métadonnées d’articles scientifiques disponibles en accès ouvert sur Internet, notamment dans des répertoires de pré-publications. » Cependant, sa grande flexibilité a étendu son champ d’action bien au-delà du contenu scientifique et on l’utilise aujourd’hui à différentes fins.

Liens pour approfondir