La creación y la implementación de metadatos son
procesos intensivos en cuanto a la utilización de recursos. Equilibre
los costos y los beneficios de desarrollar una estrategia de metadatos,
tomando en cuenta las necesidades de los usuarios y de los gerentes de
colección presentes y futuros. Identifique los requisitos de los metadatos
al inicio de un proyecto de digitalización de imágenes. Estos requisitos
deberían estar estrechamente conectados con funciones que deben ser sustentadas
(por ejemplo: gestión de derechos, descubrimiento de recursos y cuidado
a largo plazo).
Considere
los siguientes temas:
A
pesar de que algunos elementos de los metadatos son estáticos (por ejemplo:
fecha de creación, resolución del escaneado), algunos campos (por ejemplo:
información sobre migración) pueden continuar evolucionando y requerir
actualización y mantenimiento constantes.
La creación y gestión de metadatos se logra mediante técnicas manuales
(creación de un registro Dublin
Core) y automatizadas (generación de un índice de palabras clavess
del texto reconocido por medios ópticos - OCR). De manera similar, el
control de calidad de los metadatos se basará en una combinación de procesos
manuales (evaluación de la calidad de las categorías y palabras clavess
de acceso a un tema) y automatizados (utilización de un analizador SGML
- lenguaje estándar generalizado de señalamiento - para validar
los rótulos).
Los
metadatos pueden ser registrados en forma interna (asignación de nombre
de archivo, estructuración de directorio, encabezados de archivos, reconocimiento
óptico de caracteres [OCR], SGML) o en forma externa (índices y bases
de datos externos). El factor claves en la toma de decisiones a este respecto,
es evaluar si la ubicación soporta o no la gestión de funcionalidad y
recursos. Por ejemplo, los encabezamientos de archivos TIFF juegan un
papel decisivo en la grabación de metadatos en forma interna; sin embargo,
estos metadatos por lo general se pierden cuando se convierten los archivos
TIFF a otros formatos de archivo, como JPEG o GIF.
Existen varias normas en desarrollo para facilitar la interoperabilidad
entre diferentes esquemas de metadatos.
El Resource Description Framework,
RDF (Marco de Descripción de Recurso) es una aplicación con base XML
para proporcionar una arquitectura flexible para la gestión de diversos
metadatos en el ambiente de las redes. El objetivo de la iniciativa Metadata
for Digital Images (Metadatos para Digitalización de Imágenes) del Digital
Imaging Group (Grupo de Digitalización de Imágenes) (DIG
35) es definir un conjunto estándar de metadatos que mejorará la interoperabilidad
entre dispositivos, servicios y software, por ende facilitando el procesamiento,
la organización, impresión e intercambio de imágenes digitales. La iniciativa
del MPEG-7
(Moving Picture Experts Group - Grupo de Expertos en Imágenes con
Movimiento) apunta a la descripción de contenidos audiovisuales y pretende
estandarizar un conjunto de esquemas de descripción y descriptores, un
idioma para especificar esquemas de descripción, y un esquema para codificar
la descripción. La
interoperabilidad del proyecto Data in E-Commerce Systems (Datos en los
Sistemas de E-Commerce - <indecs>)
es una colaboración internacional para desarrollar un marco de metadatos
que soporte el comercio de la propiedad intelectual por medio de redes.
Ejemplo
¿Qué tipos de metadatos se crearán para una colección de periódicos
que se convierte en imágenes TIFF 6.0 a 600 dpi y 1 bit? Se podrían
llevar a cabo las siguientes tareas asociadas con metadatos. Cada
una está identificada por su tipo de metadatos principal (E = Estructurales,
D = Descriptivos, A = Administrativos). Nota: El Modelo
de RFP - solicitud de propuestas - de RLG (RLG Model RFP) proporciona
un ejemplo de los requisitos de metadatos para un proyecto de imágenes
de texto.
Asignación de nombres de archivo y estructuras de directorio a
los archivos de imágenes y a los archivos de metadatos asociados.
(S)
Creación o actualización de registros MARC (Campos 100, 110, 245,
260, 440, 650, etc.). (D)
Creación de registros Dublin Core. (D)
Utilización de MARC
Field 007 (Campo MARC 007) para grabar información de preservación
y reformateo digital. (A)
Utilización de encabezamientos de archivo TIFF 6.0 apropiados
para grabar información técnica, como por ejemplo: Ancho de Imagen
(ImageWidth), Longitud de Imagen (ImageLength), Compresión (Compression),
Desplazamientos de Banda (StripOffsets), Filas por Banda (RowsPerStrip),
Conteo de Bytes de Banda (StripByteCounts), Resolución X (Xresolution),
Resolución Y (Yresolution), Unidad de Resolución (Resolution Unit);
Bits por Muestra (BitsPerSample). (A)
Asignación de nombres de archivo continuos, únicos en el mundo
e independientes respecto de su ubicación (PURL
o Handle). (D)
Utilización de encabezamientos de archivo TIFF 6.0 apropiados
para descripción de imágenes (Campo 270) utilizados para registrar
elementos descriptivos esenciales para la identificación del archivo
(por ejemplo: código de identificación (ID) del proyecto, institución,
colección, año de publicación, título, autor, número de secuencia
de imagen). (D)
Creación de una base de datos para almacenar y manejar la información
bibliográfica desde los índices de periódicos acumulativos para
permitir una búsqueda de vocabulario estructurada (por ejemplo,
volumen del periódico, número, título, autor, número de página
inicial y final). (D, S)
Utilización de la codificación TEI
Lite SGML para trazar el mapa de los elementos estructurales
básicos de los periódicos, tales como volumen, número, título,
nombre del autor, páginas iniciales y finales de cada artículo,
para facilitar la búsqueda y navegación online. (S)
Imágenes OCR (reconocimiento óptico de caracteres) para proporcionar
acceso a palabras clavess de texto libre. (D)
Creación de rótulos HTML con información Dublin Core para facilitar
el descubrimiento de recursos. (D)
Registro del sitio Web en los directorios de temas relevantes,
portales de temas especializados, y accesos acceso para aumentar
la cobertura de los motores de búsqueda de la Web. (D)
Ejemplo
2
¿Qué
tipos de metadatos serán recopilados y registrados para una colección
de fotografías?
Además
de muchos de los elementos sugeridos con anterioridad, considere
si debe o no:
Ampliar la asistencia de búsqueda existente, y SGML -codifíquela
utilizando la Definición de Tipo de Documento EAD (Encoded
Archival Description - Descripción de Archivos Codificada)
para crear un mapa de la colección con fines de búsqueda y presentación.
Esto facilitará la interoperabilidad con otras asistencias de
búsqueda codificadas EAD. (D, S, A)