Contenidos Selección Introducción Conversión Control de Calidad Metadatos Infraestructura Técnica Presentación Preservación Digital Gestión Formación Continua

5. Metadatos

 

Conceptos claves

definición
tipos y funciones
creación

lecturas adicionales

 


 

 

 

CREACIÓN DE METADATOS

La creación y la implementación de metadatos son procesos intensivos en cuanto a la utilización de recursos. Equilibre los costos y los beneficios de desarrollar una estrategia de metadatos, tomando en cuenta las necesidades de los usuarios y de los gerentes de colección presentes y futuros. Identifique los requisitos de los metadatos al inicio de un proyecto de digitalización de imágenes. Estos requisitos deberían estar estrechamente conectados con funciones que deben ser sustentadas (por ejemplo: gestión de derechos, descubrimiento de recursos y cuidado a largo plazo).

Considere los siguientes temas:

  • A pesar de que algunos elementos de los metadatos son estáticos (por ejemplo: fecha de creación, resolución del escaneado), algunos campos (por ejemplo: información sobre migración) pueden continuar evolucionando y requerir actualización y mantenimiento constantes.
  • La creación y gestión de metadatos se logra mediante técnicas manuales (creación de un registro Dublin Core) y automatizadas (generación de un índice de palabras clavess del texto reconocido por medios ópticos - OCR). De manera similar, el control de calidad de los metadatos se basará en una combinación de procesos manuales (evaluación de la calidad de las categorías y palabras clavess de acceso a un tema) y automatizados (utilización de un analizador SGML - lenguaje estándar generalizado de señalamiento - para validar los rótulos).
  • Los metadatos pueden ser registrados en forma interna (asignación de nombre de archivo, estructuración de directorio, encabezados de archivos, reconocimiento óptico de caracteres [OCR], SGML) o en forma externa (índices y bases de datos externos). El factor claves en la toma de decisiones a este respecto, es evaluar si la ubicación soporta o no la gestión de funcionalidad y recursos. Por ejemplo, los encabezamientos de archivos TIFF juegan un papel decisivo en la grabación de metadatos en forma interna; sin embargo, estos metadatos por lo general se pierden cuando se convierten los archivos TIFF a otros formatos de archivo, como JPEG o GIF.
  • Existen varias normas en desarrollo para facilitar la interoperabilidad entre diferentes esquemas de metadatos.
  • El Resource Description Framework, RDF (Marco de Descripción de Recurso) es una aplicación con base XML para proporcionar una arquitectura flexible para la gestión de diversos metadatos en el ambiente de las redes. El objetivo de la iniciativa Metadata for Digital Images (Metadatos para Digitalización de Imágenes) del Digital Imaging Group (Grupo de Digitalización de Imágenes) (DIG 35) es definir un conjunto estándar de metadatos que mejorará la interoperabilidad entre dispositivos, servicios y software, por ende facilitando el procesamiento, la organización, impresión e intercambio de imágenes digitales. La iniciativa del MPEG-7 (Moving Picture Experts Group - Grupo de Expertos en Imágenes con Movimiento) apunta a la descripción de contenidos audiovisuales y pretende estandarizar un conjunto de esquemas de descripción y descriptores, un idioma para especificar esquemas de descripción, y un esquema para codificar la descripción. La interoperabilidad del proyecto Data in E-Commerce Systems (Datos en los Sistemas de E-Commerce - <indecs>) es una colaboración internacional para desarrollar un marco de metadatos que soporte el comercio de la propiedad intelectual por medio de redes.

  • Ejemplo
    ¿Qué tipos de metadatos se crearán para una colección de periódicos que se convierte en imágenes TIFF 6.0 a 600 dpi y 1 bit? Se podrían llevar a cabo las siguientes tareas asociadas con metadatos. Cada una está identificada por su tipo de metadatos principal (E = Estructurales, D = Descriptivos, A = Administrativos). Nota: El Modelo de RFP - solicitud de propuestas - de RLG (RLG Model RFP) proporciona un ejemplo de los requisitos de metadatos para un proyecto de imágenes de texto.

    • Asignación de nombres de archivo y estructuras de directorio a los archivos de imágenes y a los archivos de metadatos asociados. (S)
    • Creación o actualización de registros MARC (Campos 100, 110, 245, 260, 440, 650, etc.). (D)
    • Creación de registros Dublin Core. (D)
    • Utilización de MARC Field 007 (Campo MARC 007) para grabar información de preservación y reformateo digital. (A)
    • Utilización de encabezamientos de archivo TIFF 6.0 apropiados para grabar información técnica, como por ejemplo: Ancho de Imagen (ImageWidth), Longitud de Imagen (ImageLength), Compresión (Compression), Desplazamientos de Banda (StripOffsets), Filas por Banda (RowsPerStrip), Conteo de Bytes de Banda (StripByteCounts), Resolución X (Xresolution), Resolución Y (Yresolution), Unidad de Resolución (Resolution Unit); Bits por Muestra (BitsPerSample). (A)
    • Asignación de nombres de archivo continuos, únicos en el mundo e independientes respecto de su ubicación (PURL o Handle). (D)
    • Utilización de encabezamientos de archivo TIFF 6.0 apropiados para descripción de imágenes (Campo 270) utilizados para registrar elementos descriptivos esenciales para la identificación del archivo (por ejemplo: código de identificación (ID) del proyecto, institución, colección, año de publicación, título, autor, número de secuencia de imagen). (D)
    • Creación de una base de datos para almacenar y manejar la información bibliográfica desde los índices de periódicos acumulativos para permitir una búsqueda de vocabulario estructurada (por ejemplo, volumen del periódico, número, título, autor, número de página inicial y final). (D, S)
    • Utilización de la codificación TEI Lite SGML para trazar el mapa de los elementos estructurales básicos de los periódicos, tales como volumen, número, título, nombre del autor, páginas iniciales y finales de cada artículo, para facilitar la búsqueda y navegación online. (S)
    • Imágenes OCR (reconocimiento óptico de caracteres) para proporcionar acceso a palabras clavess de texto libre. (D)
    • Creación de rótulos HTML con información Dublin Core para facilitar el descubrimiento de recursos. (D)
    • Registro del sitio Web en los directorios de temas relevantes, portales de temas especializados, y accesos acceso para aumentar la cobertura de los motores de búsqueda de la Web. (D)

     

    Ejemplo 2
    ¿Qué tipos de metadatos serán recopilados y registrados para una colección de fotografías?

    Además de muchos de los elementos sugeridos con anterioridad, considere si debe o no:

    • Ampliar la asistencia de búsqueda existente, y SGML -codifíquela utilizando la Definición de Tipo de Documento EAD (Encoded Archival Description - Descripción de Archivos Codificada) para crear un mapa de la colección con fines de búsqueda y presentación. Esto facilitará la interoperabilidad con otras asistencias de búsqueda codificadas EAD. (D, S, A)

     

    ¿Lo sabe?

    ¿Cuáles de los siguientes metadatos serían importantes por motivos de preservación? Seleccione todas las respuestas correctas.

    Identificadores únicos
    Rótulos de estructuración
    Descripción física del documento fuente
    Perfil del escáner

     

    © 2000-2003 Biblioteca de la Universidad de Cornell / Departamento de Investigación

     

    Contenido


    Visión en inglés Visión en francés