Introducción Contenidos Selección Conversión Control de Calidad Metadatos Infraestructura Técnica Presentación Preservación Digital Gestión Formación Continua

6C. Infraestructura técnica:
GESTIÓN DE ARCHIVOS

 

Conceptos claves

introducción
seguimiento
bases de datos de imágenes
almacenamiento
tipos de almacenamiento
necesidades de almacenamiento

 


 

 

 

CÓMO DETERMINAR LAS NECESIDADES DE ALMACENAMIENTO

Fórmula para calcular las necesidades de almacenamiento
Los requisitos de capacidad pueden ser estimados por medio de un simple cálculo:

Almacenamiento total necesario = cantidad de archivos de imágenes x tamaño de archivo promedio x 1,25


Ejemplo:  Una colección de 3000 imágenes de texto de aproximadamente 75KB cada una, requerirá cerca de 225MB de almacenamiento. Sin embargo, muchos otros factores pueden aumentar las necesidades de almacenamiento. Un texto OCR (reconocimiento óptico de caracteres) para las mismas páginas, podría necesitar 3KB por página, a alrededor de 1/25 del espacio requerido para el archivo de imagen correspondiente. La cantidad y tamaño de los archivos derivados, así como también si se los almacena en forma permanente o se los crea a las carreras también podría agregar más a los requisitos de almacenamiento. Además, todas las tecnologías de almacenamiento comprenden cierta cantidad de espacio desperdiciado. La cantidad precisa depende de factores como por ejemplo la tecnología de almacenamiento utilizada, la capacidad total, el tamaño de la partición y el tamaño de archivo promedio. Se pueden necesitar algunos experimentos para determinar el porcentaje aproximado de espacio desperdiciado, pero se lo debe tener en cuenta al estimar las necesidades de almacenamiento. La fórmula anterior es un factor, en una gran mayoría, para cubrir dichas preocupaciones.

Se puede aproximar al costo de almacenamiento de la siguiente manera:

Fórmula de costo total de almacenamiento

Costo total de almacenamiento = almacenamiento total necesario x costo por unidad de almacenamiento

Esto proporcionará una estimación aproximada, dado que sólo incluye costos básicos de unidad y medios. Otros costos relacionados con el almacenamiento incluyen estantería y estuches, fuentes adicionales de energía eléctrica en caso de cortes, cables, tarjetas, software de gestión de almacenamiento, etc. Verifique con su personal de sistemas para tener una idea más completa.

¿Lo sabe?

Se escanea una colección de 10.000 transparencias de 4 x 5 pulgadas a 400 dpi y 24 bits de color, y luego se la comprime sin pérdida en una relación de 1,3:1. Calcule el costo de almacenamiento en disco duro (a $2 por GB) que se necesita para esta colección. Redondee su respuesta a los miles más cercanos.

dólares estadounidenses    

 

La elección de una tecnología en particular puede ser engañosa. Por ejemplo, considere el disco magnético, en donde hay muchas opciones -EIDE (con nombres tales como ATA DMA y Ultra DMA), SCSI (ancho / estrecho, Ultra II / III / 160, LVD, etc.), Firewire (IEEE-1394), USB, SSA (arquitectura de almacenamiento serial), Canal de Fibra, RAID, etc. La cantidad de opciones está aumentando, con versiones de USB, IEEE-1394 y SCSI de rendimiento superior, todas programadas para el año 2000.

EIDE es una buena elección para los sistemas de escritorio, pero le faltan muchas características necesarias para las grandes instalaciones de servidores. Los arreglos de disco SCSI de alto rendimiento pueden proporcionar características tales como configuraciones RAID (que proporcionan un rendimiento y / o redundancia mejorados), cambios de disco en caliente (agregar, remover o reemplazar discos sin cortar el suministro de energía), alta capacidad y rendimiento muy alto. USB en su implementación actual es demasiado lento para las unidades de disco rígido, pero la versión 2.0 probablemente cambiará eso. Las unidades de disco rígido Firewire están comenzando a aparecer, aunque en mayor medida para el mercado Macintosh. El soporte de Intel para Firewire es en su mayoría en el área de los dispositivos de video digital, como las videocámaras. Firewire y USB todavía deberían ser consideradas tecnologías emergentes y vistas con cierto cuidado.

Se puede encontrar un análisis más detallado acerca de los dispositivos de almacenamiento y las opciones de buses periféricos en RLG DigiNews.

Las diversas tecnologías de medios removibles (tanto disco como cinta) pueden ser consideradas en su mayoría tecnologías de almacenamiento secundarias. Es decir, son adecuadas para copias de seguridad (backups), almacenamiento fuera de las instalaciones y almacenamiento de material al que no se necesita acceder de manera inmediata. Además, si el escaneado se terceriza, muchos proveedores devuelven los archivos de imágenes en algún tipo de medio removible. A pesar de su baja densidad, el CD-R es actualmente un estándar de bajo costo y ampliamente aceptado. Sin embargo, a 650 MB de capacidad, puede no ser indicado para grandes colecciones y / o archivos de gran tamaño.

Consideraciones de la computadora
La consideración principal será el nivel de soporte proporcionado por el bus periférico elegido (es decir: SCSI, Firewire). Las arquitecturas de almacenamiento avanzadas como RAID o Canal de Fibra (Fibre Channel), son en su mayor parte soportadas en plataformas de usuarios múltiples como Windows NT/2000 o Unix/Linux. SCSI es una opción en muchos sistemas, pero no necesariamente vendrá con la configuración base. Asegúrese de que el sistema operativo soporta el arreglo de disco del tamaño que usted necesita y de que hay espacio suficiente para las tarjetas de expansión que se necesitan.

© 2000-2003 Biblioteca de la Universidad de Cornell / Departamento de Investigación

 

Contenido


Visión en inglés Visión en francés