Thésaurus

Un article de Wiki Paris Descartes.

Des clés pour comprendre l'Université numérique
Accès par catégories au glossaire : Accès thématique
HYPERGLOSSAIRE : A B C D E F G H I J K L M N O P Q R S T U V W X Y Z



(ou Thesaurus).
Terme issu du latin (au pluriel, thesauri et thésaurus sont tous les deux admis).
« Du point vue de de sa fonction, un thésaurus est un instrument de contrôle de la terminologie utilisé pour transposer en un langage plus strict (langage documentaire, langage d’information) le langage naturel employé dans les documents et par les indexeurs ou les utilisateurs. Du point de vue de sa structure, le thésaurus est un vocabulaire, contrôlé et dynamique, de termes ayant entre eux des relations sémantiques et génériques et qui s’applique à un domaine particulier de la connaissance. » (Chaumier, 1988).

Le thésaurus, outil documentaire d'indexation, est un ensemble hiérarchique, structuré ou non, de termes appartenant à un domaine de connaissance et représentant chacun un concept ou un ensemble de concepts. La hiérarchie du thésaurus s'appuie sur la relation sémantique que les termes établissent entre eux.

Termes du thésaurus

Chaque terme générique de premier niveau (le plus général), appelé aussi sous-domaine, conduit à des subdivisions (souvent nommées microthesaurus ou encore champs), généralement listées alphabétiquement. Chaque subdivision guide sur un ensemble de descripteurs et de non-descripteurs :

  • Descripteur (appelé aussi "terme préféré")
  • Terme utilisé lors de l'indexation pour représenter sans ambiguïté un concept donné.
    On distingue plusieurs descripteurs :

    • terme générique (repéré dans le thésaurus par le sigle TG)
      Descripteur qui représente un concept dont l'étendue est plus large et auquel sont subordonnés un ou plusieurs termes spécifiques dans une hiérarchie.
    • terme spécifique (sigle TS))
      Descripteur qui représente un concept dont l'étendue est plus limitée et qui est subordonné à un ou plusieurs termes génériques dans une hiérarchie
    • terme associé (sigle TA)
      Descripteur qu'on associe mentalement à un autre descripteur, mais qui ne fait pas partie d'une même hiérarchie.
  • Non-descripteur (appelé aussi "terme non-préféré")
    Synonyme, quasi-synonyme ou variante orthographique d'un descripteur.
    Un non-descripteur ne doit pas être utilisé pour l'indexation mais sert de point d'accès pour diriger les utilisateurs vers un descripteur.

Relations sémantiques entre les termes du thésaurus

Tous ces termes ont des liens sémantiques entre eux. Ces relations sont de trois types :

  • relation hiérarchique (entre descripteurs)
    Lien vers un concept de sens plus large (terme générique) ou de sens plus précis, plus particulier (terme spécifique). Cette relation est de type "genre/espèce" ou "tout/partie".
  • relation d'équivalence (entre descripteurs et non-descripteurs)
    Cette relation identifie les termes équivalents ( ou synonymes ou quasi-synonymes). Elle s'exprime par les renvois réciproques Employer (noté aussi EM) et Employé pour (noté aussi EP).
  • relation d'association (entre descripteurs)
    Lien vers les termes associés qui fournissent un enrichissement sémantique, guident sur des sujets connexes. Les relations d'association sont des relations de causalité, de localisation, de composition, relations de nature temporelle, fonctionnelle, etc.

Ainsi, le thésaurus est une taxonomie sur laquelle on ajoute des relations « horizontales » (relation d'association) en plus de la relation verticale (relation hiérarchique) qui structure la taxonomie originale.

A ces termes peuvent être adjointes, accessoirement, des définitions, des notices d'application qui précisent les conditions d'emploi d'un terme, des liens de toute nature etc.

Le thésaurus : un outil d'indexation

L'objectif d'un thésaurus est de proposer un vocabulaire contrôlé propre à un domaine, avec des termes soigneusement choisis et sémantiquement relationnés selon une approche rationnelle et pragmatique afin :

  • d'indexer des ressources documentaires
    Les descripeurs du thésaurus sont ainsi autant de mots-clés (métadonnées) pour identifier, qualifier, décrire, représenter, répertorier les documents du domaine concerné.
  • de permettre, en mode consultation, une recherche et une navigation aisée dans la connaissance des documents indexés
    Les termes génériques et termes spécifiques permettent d'élargir ou de restreindre le champ de la recherche et les termes associés constituent des passerelles pour explorer les champs connexes.

Un thésaurus peut être considéré comme une forme d'ontologie dont la grammaire n'a pas été formalisée.

Liens pour approfondir