doc/vocabulaires.rst
author Sylvain Thénault <sylvain.thenault@logilab.fr>
Fri, 03 Nov 2017 12:03:16 +0100
changeset 2865 5d0adc66a950
parent 2792 ed7eccb2e8db
child 2876 6624b3f44ace
child 2882 1d5d515a66d0
permissions -rw-r--r--
[hooks] Use file categories vocabulary by default for mime type and format id lists so by default it's the master vocabulary and MIME types / PRONOM vocabularies don't have to be kept in sync. Keep the synchronization mecanism though, and test it separatly.

Administration des vocabulaires SEDA
====================================

Le cube SEDA vient avec un certain nombre de vocabulaires utilisés pour
contrôler les valeurs possibles pour différents champs des profils. Cette
section détaille quelques points à noter à ce sujet.

Paramétrage des vocabulaires
----------------------------

Tout d'abord, le vocabulaire associé par défaut à un champ du SEDA est configuré
via des enregistrements dans la base de données, mais cela n'est pas à ce jour
configurable via l'interface Web. Dans le cas des profils complet, on peut en
configurer certains via l'onglet "vocabulaires". Dans le cas des profils
simplifiés ou des composants unités d'archives, les vocabulaires par défaut sont
utilisés et il n'est pas encore possible de faire autrement.

Le champ "type de descripteur" d'un vocabulaire permet de contrôler l'interface
de saisie des mots-clés associés à une unité d'archive, en ne rendant disponible
que les vocabulaires d'un type données en fonction du type choisie dans
l'interface.

Contrôle des valeurs entre les différents versions de SEDA
----------------------------------------------------------

Lors de l'export SEDA, la valeur à utiliser dans le cas d'un champ non
"sémantisé" (i.e. pour lequel on cherche à exporter une valeur et non une URL)
est cherchée de la manière suivante. Étant donné un concept lié, on va chercher
le libellé préféré dans la langue :

#. spécifique à la version du SEDA exportée : 'seda-2', 'seda-1', 'seda-02',
#. générique au SEDA : 'seda'
#. anglais : 'en'
#. français : 'fr'

Gestion du vocabulaire "Catégories de fichier"
----------------------------------------------

Ce vocabulaire est un peu particulier car il ne sert que dans l'interface
utilisateur. En fonction de la valeur saisie, le profil sera lié à différents
concepts correpondants pour les champs "type MIME" et "identifiant de format" du
SEDA.

La structure de ce vocabulaire est la suivante : ::

  + catégorie
   \
    + extension
     \
      + type MIME
       \
        - identifiant de format (PRONOM)

Lorsqu'une ou plusieurs valeurs sont sélectionnées pour la catégorie de fichier
d'un objet-données d'un profil, une jointure est effectuée sur le nom des type
MIME et identifiants de format sous-jacent avec les vocabulaires "types MIME" et
"formats de fichier" sélectionnés pour ce profil. Par défaut, le vocabulaire
sélectionné pour ces deux champs et le vocabulaire "Catégories de fichier" (ce
qui autorise théoriquement des valeurs supplémentaires indésirées pour chacun
des champs mais reste un choix pragmatique) et celui-ci reflêtera donc seul les
valeurs exportables.

Dans le cas d'un profil complet avec des vocabulaires spécifiques pour les
listes "types MIME" et "formats de fichier" (par exemple en utilisant les
vocabulaires dédiés "Types MIME" et/ou "Formats de fichier (PRONOM)") il
conviendra de s'assurer de la cohérence du vocabulaire "Catégories de fichier"
avec les vocabulaires sélectionnés car les valeurs exportées seront
l'intersection entre les valeurs spécifiées via la catégorie / extension du
fichier et les valeurs disponibles dans l'un ou l'autre vocabulaire.