Formation Continue Gestion Conservation Numérique Présentation Infrastructure Technique Métadonnées - Création Contrôle de la Qualité - définition Conversion - Introduction Sélection - Introduction Matières Introduction - Images numériques

5. Métadonnées

Concepts Clés

définition
types et fonctions
création

ressources supplémentaires


 

 

 

CREATION DE METADONNEES
La création et l'implantation de métadonnées sont des processus nécessitant beaucoup de ressources. Considérez les coûts et les bénéfices de la création de métadonnées, en prenant en considération les besoins actuels et futurs des usagers et des gestionnaires chargés de la collection. Identifiez les besoins de métadonnées à l'amont d'une opération d'imagerie. Ces besoins doivent être étroitement liés aux fonctions devant être prises en charge (p. ex. gestion des droits d'auteur, découverte de ressources et protection à long terme).

Considérez les aspects suivants :

  • Bien que certains éléments des métadonnées soient statiques (p.ex. date de création, résolution de la numérisation), certains champs (p.ex. informations concernant la migration) peuvent continuer à évoluer et nécessiteront une mise à jour et une maintenance continue.
  • La création et la gestion des métadonnées est effectuée grâce à des procédés manuels (création d'un registre Dublin Core) et automatisés (création d'un index à mots-clés à partir de texte lu par ROC). De même, le contrôle de qualité des métadonnées est basé sur un mélange de procédés manuels (évaluation de la qualité des catégories et sujets accessibles et des mots-clés) et automatisés (avec l'utilisation d'un parser (analyseur syntaxique) SGML pour valider les balises).
  • Les métadonnées peuvent être internes (nom de fichiers, structure des répertoires, titres de fichiers, ROC, SGML) ou externes (index et bases de données externes). Le facteur clé dans la prise de décision est d'évaluer si l'emplacement supporte la fonctionnalité et la gestion de ressources. Par exemple, les en-têtes de fichiers TIFF sont utilisés dans l'enregistrement externe de fichiers, mais ces métadonnées sont souvent perdues lorsque les fichiers TIFF sont convertis en d'autres formats tels que JPEG ou GIF.


  • Plusieurs standards en cours de développement existent afin de faciliter l'interopérabilité de schémas de métadonnées différents. Le Resource Description Framework (RDF Cadre de Description des Ressources) est une application basée sur le XML afin d'offrir une architecture flexible de gestion de différentes métadonnées dans un environnement en réseau. Le but des Métadonnées pour l'initiative d'image Numérique (DIG 35) du Groupe d'Imagerie numérique est de définir un jeu de métadonnées standard qui faciliteraient grandement la compatibilité entre les appareils, services et logiciels, rendant ainsi plus aisée la création, l'organisation, l'impression et l'échange d'images numériques. L'initiative MPEG-7 (Moving Picture Expert Group) vise la description des contenus audio-vidéos et à standardiser un jeu de schémas de description et de décripteurs, un langage pour spécifier les schémas de description, ainsi qu'un schéma pour coder la description. La compatibilité des données dans le projet de systèmes de commerce électronique (<indecs>) est le fruit d'une collaboration internationale destinée à développer un cadre de métadonnées prenant en charge le commerce en ligne de la propriété intellectuelle.
Exemple
Quelles sortes de métadonnées seront créées pour une collection de revues converties en images TIFF 6.0 1 bit à 600 dpi ? Les opérations de collecte des métadonnées suivantes doivent être entreprises. Chacune est identifiée par son type de métadonnée (S = Structurel, D = Descriptif, A= Administratif) . Remarque : Le RLG Model RFP fournit un exemple des besoins de métadonnées pour les projets de numérisation de texte.

  • Assigner les noms de fichiers et les structures de répertoires aux fichiers images et leurs fichiers métadonnées associés (S)
  • Créer ou mettre à jour les registres MARC (Champs 100, 110, 245, 260, 440, 650, etc.). (D)
  • Créer des enregistrements Dublin Core (D).
  • Utiliser le MARC Field 007 pour conserver les informations numériques et reformater les informations. (A)
  • Utiliser les titres de fichiers TIFF 6.0 appropriés pour enregistrer les informations techniques, c.à.d. Largeur d'Image, Longueur d'Image, Compression, Stripoffsets, StripByteCounts, RésolutionX, RésolutionY, Unité de Résolution, Nb de bits par échantillon. (A)
  • Assigner des noms de fichiers permanents, uniques, indépendants de leur emplacement (PURL ou Handle). (D)
  • Utiliser les titres de fichiers TIFF 6.0 pour la description d'images (Champ 270) afin d'enregistrer les éléments descriptifs essentiels pour identifier le fichier (c.à.d. numéro d'identification (ID) du projet, organisme, collection, année de publication, titre, auteur, numéro de séquence d'image). (D)
  • Créez une base de données pour entreposer et gérer les informations bibliographiques des index cumulés afin d'autoriser la recherche de vocabulaire structurée (par exemple volume de bulletin, parution, auteur, numéros de début et de fin de page) (D,S)
  • Utiliser le système d'encodage TEI Lite SGML pour établir une carte des éléments structurels de base des revues, tels que volume, parution, titre, nom de l'auteur, pages de début et de fin pour chaque article, afin de faciliter la recherche en ligne et la navigation (S).
  • Images ROC (OCR) pour offrir un accès par mot-clé libre de texte. (D)
  • Créer des tags (balises) HTML avec informations Dublin Core afin de faciliter la découverte de ressources. (D)
  • Enregistrer le site web avec les répertoires de sujets pertinents dans les portails de sujets spécialisés, et les portails d'accès afin d'augmenter la couverture par les moteurs de recherche web. (D)

 

Exemple 2
Quelles sortes de métadonnées devront être collectées et enregistrées pour une collection de photographies ?

En plus de nombreux éléments suggérés ci-dessus, examinez comment ·

  • · Améliorer une aide à la recherche déjà existante, et l'encoder en SGML à l'aide de la définition de Type de Document EAD (Encoded Archival Description) afin de créer un plan de la collection pour la recherche et la présentation. Cela facilitera la compatibilité avec d'autres aides à la recherche encodées EAD (D, S, A)

 

Contrôle de Connaissances

Parmi les métadonnées suivantes, quelles sont celles importantes pour des raisons de conservation ? Choisir toutes les réponses correctes.

Identifiants uniques
Tags (balises) structurants
Description physique du document source
Profil Scanner

 

© 2000-2003 Bibliothèque de l'Université Cornell/Département de Recherches

 


Vue en anglais
Vue dans l'Espanol