Introducción Contenidos Selección Conversión Control de Calidad Metadatos Infraestructura Técnica Presentación Preservación Digital Gestión Formación Continua

6C. Infraestructura técnica:
GESTIÓN DE ARCHIVOS

 

  Conceptos claves

introducción
seguimiento
bases de datos de imágenes
almacenamiento
tipos de almacenamiento
necesidades de almacenamiento

 


 

 

 

TIPOS BÁSICOS DE ALMACENAMIENTO MASIVO

Las tecnologías de almacenamiento masivo se pueden clasificar de distintas maneras. El sistema de almacenamiento subyacente (magnético, óptico o magnetoóptico), el tipo de unidad (fija o removible), el material del medio (cinta, disco rígido, disco flexible) y la interfaz de hardware (ATA, ATAPI, SCSI, USB, Fireware / IEEE 1394, Canal de Fibra) en forma conjunta definen las características de cada tecnología.

Los sistemas de almacenamiento también se distinguen en almacenamiento de conexión directa o almacenamiento conectado a la red. El almacenamiento de conexión directa incluye unidades de escritorio estándar que se instalan dentro de un gabinete de computadora o se cablean directamente al mismo. El almacenamiento conectado a la red por lo general abarca almacenamiento accesible a múltiples computadoras y que puede estar conectado a un servidor y se puede acceder a él por medio de protocolos de sistema de archivos especiales (por ejemplo: Sistema de Archivo de Red o Sistema de Archivo Común de Internet) o puede ser parte de un sistema de almacenamiento que funciona en forma independiente de cualquier servidor en particular (por ejemplo, una Red SAN - Red de Área de Almacenamiento).

Las jerarquías de almacenamiento se refieren a la asignación de archivos a distintos tipos de almacenamiento dependiendo de la frecuencia de uso. Cuando el almacenamiento en disco magnético era muy costoso, era común colocar los archivos más utilizados en discos magnéticos (acceso en línea), los archivos utilizados con menor frecuencia en medios ópticos menos costosos (y más lentos) (almacenamiento casi en línea) y los archivos a los que se accedía muy rara vez en cinta magnética (almacenamiento offline). Debido a que el precio del almacenamiento en disco magnético ha disminuido de manera mucho más rápida que el almacenamiento óptico, también ha disminuido el incentivo para establecer tales jerarquías.

Usted puede ver una tabla que caracteriza las tecnologías disponibles basándose en la velocidad, capacidad y en el costo, haciendo clic en Tabla: Comparación de medios de almacenamiento.

Tendencias en el Almacenamiento Masivo
Desde la invención del disco rígido en 1952, el avance tecnológico regular y veloz ha dado lugar a mejoras increíbles en cuanto a capacidad, velocidad, fiabilidad y relación precio-rendimiento. La fuerza propulsora de estas mejoras ha sido el crecimiento constante de la cantidad de datos que se pueden almacenar en el mismo área (conocida como "densidad de área"). El costo unitario del almacenamiento básico en disco rígido disminuyó aproximadamente un cien por ciento entre 1997 y 2002. Se prevé que el costo por unidad de almacenamiento continuará disminuyendo en forma abrupta y que la capacidad de unidad continuará aumentando, de modo que es muy poco probable que incluso las colecciones de imágenes digitales más grandes y de crecimiento más rápido tengan problemas de capacidad o asequibilidad en el almacenamiento masivo. Otras formas de almacenamiento masivo, tales como los sistemas de disco óptico y de cinta magnética, están viendo mejoras en cuanto al precio y el rendimiento, pero a una velocidad inferior a la del disco magnético.

El inconveniente de un cambio tecnológico tan veloz es la también rápida obsolescencia. La necesidad de reemplazar los sistemas de almacenamiento a intervalos de tiempo cortos (quizás cada 3 a 5 años) anulan algunos de los beneficios relacionados con los costos. Los presupuestos de mantenimiento de los sistemas de digitalización de imágenes deberían anticipar estas necesidades.

Otro inconveniente es la confusa proliferación de nuevas tecnologías. Esto es particularmente cierto en dos áreas. Una es la de las interfases de hardware para los discos magnéticos. Para aprovechar la densidad de almacenamiento creciente (y los consecuentes aumentos en la velocidad de recuperación de datos) se deben desarrollar nuevas interfases de hardware que puedan estar a la altura de las unidades. De lo contrario, las unidades más rápidas no tendrían ventajas.

El resultado ha sido una intensa competencia por aumentar la velocidad de flujo de datos que pueden manejar las interfases, en la que las partes interesadas en las interfases intentan superar a los demás y ganar una porción más grande del mercado de las aplicaciones de alto rendimiento. Entre los ejemplos de esto podemos nombrar el cambio de USB 1.1 a 2.0, la introducción regular de nuevos estándares SCSI y los cambios inminentes de IEEE 1394a a 1394b y del ATA paralelo al ATA serial. Las nuevas versiones ofrecen un rendimiento superior pero pueden causar problemas tales como incompatibilidades (con dispositivos de versiones anteriores y con el sistema informático mismo), falta de soporte del sistema operativo y un retraso en la disponibilidad de los drivers del dispositivo.

El otro área en donde la proliferación de la tecnología ha provocado confusión y dolores de cabeza a los usuarios es el área de los formatos de los medios de disco compacto. Esto es especialmente cierto en lo que respecta a los formatos de DVD de alta densidad, en donde compiten por lo menos cinco formatos distintos, incluyendo tres formatos regrabables (DVD-RAM, DVD+RW y DVD-RW). La falta de estandarización da lugar a incompatibilidades entre las unidades y los medios y dificulta que los usuarios se decidan por una de las tecnologías. Para obtener más información acerca de este tema, vea la sección Preguntas Frecuentes sobre DVD.

Aquí puede encontrar una buena discusión acerca de muchas de las tendencias tratadas anteriormente.

Consideraciones en cuanto a la Fiabilidad
La fiabilidad del almacenamiento puede tener muchos significados distintos en diferentes puntos a lo largo de la cadena de digitalización. Durante la captura, la preocupación se centra en la grabación adecuada de los bits y el mantenimiento de la fidelidad a medida que los archivos atraviesan diversos pasos de procesamiento antes de arribar a un archivo de almacenamiento permanente. Una vez que están listos para la entrega, la preocupación a corto plazo pasa a ser el mantenimiento de la alta disponibilidad de los archivos importantes al minimizar el tiempo de inactividad del sistema de almacenamiento y recuperarse rápidamente de las fallas. A largo plazo, la fiabilidad se centra en reemplazar los sistemas de almacenamiento antes de que el hardware y / o el medio fallen, pierdan integridad o se vuelvan obsoletos.

En términos generales, la fiabilidad de los sistemas de almacenamiento ha mejorado en forma constante. Actualmente casi todas las tecnologías de almacenamiento poseen algún tipo de corrección de errores incorporada. Dado que el almacenamiento se ha vuelto más veloz y con una mayor capacidad, el tiempo extra y el almacenamiento redundante necesarios para implementar correcciones de errores se han vuelto una carga más liviana de implementar. Cada vez más unidades de disco poseen características tales como S.M.A.R.T. (Tecnología de Auto-Monitoreo, Análisis e Información) que permiten que una unidad controle constantemente su propio rendimiento y envíe un alerta si algo está comenzando a fallar (por ejemplo, si la velocidad rotacional de la unidad está cambiando, quizás indica que se está desarrollando un problema en el motor o en los cojinetes).

Las variedades de almacenamiento más grande se encuentran disponibles con diversas características de fiabilidad. RAID (Selección Redundante de Discos Independientes o Económicos) permite varias opciones de configuración relacionadas con el rendimiento y la fiabilidad, como la duplicación de datos (mirroring), de modo que haya redundancia completa. Algunos sistemas se pueden configurar con "reposición en caliente" y "recuperación automática" para que, en caso de una falla total de la unidad, los contenidos se reconstruyan en forma automática luego de una reposición de encendido sin intervención humana. Otros permiten el "intercambio en caliente" de unidades de modo que los reemplazos se puedan instalar sin apagar todo el sistema de almacenamiento. Ya que las unidades de disco rígido cada vez son menos costosas, no es un lujo tener unidades vacías con el único objetivo de tomar el control en caso de una falla.

Por desgracia, no se puede confiar solamente en estas impresionantes características para la protección de datos. Ninguna tecnología es infalible y todas las instalaciones de almacenamiento se pueden destruir ante acontecimientos imprevistos tales como incendios, inundaciones y terremotos. Por este motivo, por lo general se recomienda que todos los datos que sean únicos (en especial archivos maestros de imágenes y todos los metadatos asociados) se almacenen en por lo menos dos tipos de medios diferentes en distintas ubicaciones físicas. Con frecuencia, para el almacenamiento secundario se suelen elegir medios removibles tales como discos ópticos o cintas magnéticas.

La mayoría de los medios removibles puede tener una vida útil razonable (las afirmaciones varían entre los 10 y los 100 años), aunque muchas de estas cifras se basan en pruebas de envejecimiento acelerado y no en la experiencia real. Sin embargo, las condiciones de almacenamiento inadecuadas (por ejemplo, las altas temperaturas y la humedad) pueden reducir drásticamente la vida útil de los medios. Algunos fabricantes de unidades de discos rígidos actualmente afirman que el MTBF (Mean Time Between Failure - Tiempo Promedio Entre Fallas) es de 100 años o más. ¿Cuánta atención debería prestarle a estas cifras?

Dado que todas las tecnologías están sujetas a fallas, y que las nuevas tecnologías se están introduciendo a intervalos cada vez más reducidos, es posible quedar demasiado absorto en preocupaciones acerca de la vida útil de los medios de almacenamiento digital. Las unidades de medios removibles están sujetas a una rápida obsolescencia (muchos formatos han ido y venido sin siquiera lograr una amplia aceptación del mercado). Como se trató en Preservación digital, la supervivencia a largo plazo requiere de un plan exhaustivo que incluye atención respecto de la vida útil de los medios, el entorno de almacenamiento, los procedimientos de manipulación, detección de errores, copias de seguridad (backup), respuesta ante desastres y control de la obsolescencia de hardware, medios y formatos.

© 2000-2003 Biblioteca de la Universidad de Cornell / Departamento de Investigación

 

Contenido


Visión en inglés Visión en francés