Introduction - Images numériques Matières Sélection - Introduction Conversion - Introduction Contrôle de la Qualité - définition Métadonnées Infrastructure Technique - besoins de stockage Présentation Conservation Numérique Gestion Formation Continue

6C. Infrastructure Technique :
GESTION DE FICHIERS

Concepts Clés

introduction
suivi les mouvements
bases de données d'images
stockage
types de stockages
besoins de stockage


 

 

 

DETERMINER LES BESOINS DE STOCKAGE

Formule pour calculer les besoins de stockage
Les besoins de capacités de stockage peuvent être calculés par une simple opération mathématique :

Capacité de Stockage Totale Nécessaire = Nb de fichiers images X taille moyenne de fichier X 1,25

Exemple : Une collection de 3000 images de textes, chacune pesant environ 75Ko, nécessiterait environ 225Mo d'espace de stockage. Néanmoins, de nombreux autres facteurs peuvent augmenter les besoins de stockage. Le texte en mode ROC des mêmes pages peut prendre 3Ko par page, ou environ 1/25me de l'espace nécessaire pour le fichier image correspondant. Le nombre et la taille des fichiers dérivés, tout comme le fait qu'ils soient stockés en permanence ou créés à la volée peut nécessiter un espace de stockage supplémentaire. De plus, toutes les technologies de stockage impliquent un certain montant d'espace perdu. Le montant précis dépend de facteurs tels que la technologie de stockage utilisée, la capacité totale, la taille des partitions, et la taille moyenne de fichier. Certains essais peuvent être nécessaires afin de déterminer le pourcentage approximatif d'espace perdu, mais il doit être pris en compte dans l'estimation des besoins de stockage. La formule ci-dessus prévoit une marge généreuse permettant de couvrir de tels besoins.

Le coût de stockage peut être approximativement calculé comme suit :

Formule de Calcul du coût de stockage total

Coût de stockage total = stockage total nécessaire X coût par unité de stockage

Cette formule offre une estimation approximative, car elle n'inclut que les coûts de base des lecteurs et des médias. D'autres dépenses liées au stockage, telles que l'achat de racks et de placards, unité d'alimentation d'appoint, câbles, cartes, logiciels de gestion des espaces de stockage, etc.peuvent entrer en compte/ Consultez le personnel chargé des systèmes pour obtenir une vision d'ensemble.

Contrôle de Connaissances

Une collection de 10000 transparents de 4pouces sur 5 est numérisée en couleur 24 bits, 400 dpi, puis compressée à un rapport de 1,3:1. Calculez le coût de stockage sur disques durs (à 20$ le Go) pour cette collection. Arrondissez la réponse au millier le plus proche.

dollars    


Le choix d'une technologie particulière peut être déroutant. Prenez par exemple les disques magnétiques, où il existe plusieurs options, ATA (également appelée EIDE ou UDMA), SCSI (wide/narrow, Ultra II/III/160/320, LVD, etc.), Firewire (IEEE-1394), USB, Fibre channel, etc. Le choix s'élargit constamment, avec des versions de ces technologies à performances encore plus élevées en cours d'élaboration.

Pour les petites collections, à la fois pendant la capture d'images et la livraison, le ATA bureau, l'USB et le Firewire sont des connectiques tout à fait adaptées. L'implantation actuelle de l'ATA (maintenant dénommé ATA parallèle pour le distinguer de son successeur) a atteint le taux de transfert de 1333Mo/s et sera progressivement remplacé par l'ATA série, débutant à 150Mo/s. L'USB 2.0 et le Firewire (IEEE 1394a) offrent des débits de 50Mo/s, bien que l'IEEE 1394a doive prochainement doubler ses performances.

Le SCSI est une ancienne technologie qui a réussi à maintenir à travers une série de mises à jour continue des performances dominant les autres technologies. Le SCSI fut un temps la solution utilisée pour le stockage de bureau à haute performance (et faible coût), mais, bien qu'il soit toujours disponible, est de moins en moins utilisé pour les systèmes de bureau. Néanmoins, le SCSI reste très populaire au sein des dispositifs à haute performance de disques en réseau. Il est également l'une des technologies les plus utilisées dans les installations NAS et SAN.

Le stockage NAS (networked attached storage) peut offrir de larges quantités (téraoctets) d'espace de stockage sur disque dur dans une installation de stockage reliée à des serveurs réseaux traditionnels existants. Le NAS est assez facile à mettre en place et à maintenir, tout en étant généralement fiable. Le NAS n'est pas limité dans son extension, la gestion de grands nombres d'unités pouvant poser des problèmes. Le NAS est généralement basé sur des lecteurs SCSI, bien que certains utilisent l'ATA.

Le SAN (storage area network) est principalement utilisé pour les très grosses installations nécessitant des performances et une flexibilité maximales. Les SAN autorisent une meilleure intégration et partage des installations de sauvegarde, et aident à tenir le trafic entre les appareils de stockage éloignés des réseaux ethernet (p.ex. pour la sauvegarde). Néanmoins, les SAN peuvent être assez complexes à établir et nécessitent souvent une assistance extérieure afin d'installer l'infrastructure nécessaire et éviter les problèmes d'interopérabilité. Les SAN fonctionnent sur une infrastructure "Fibre Channel" (et non pas Ethernet), en utilisant des lecteurs soit SCSI soit Fibre channel.

Les différentes technologies de médias de stockage amovible (disques et bandes) doivent être majoritairement considérées comme des technologies secondaires. Cela dit, elles sont tout à fait adaptées à la sauvegarde, au stockage hors-lieu et au stockage de matériel n'ayant pas besoin d'être immédiatement accessibles. De même, si la numérisation est sous-traitée, de nombreux prestataires retournent les fichiers images sous forme de médias amovibles. Malgré sa faible densité, le CD-R est aujourd'hui un standard largement accepté et de coût réduit. Néanmoins, avec 650Mo de capacité, il peut ne pas être adapté pour les larges collections et/ou les très gros fichiers. Le DVD-R d'une capacité allant jusqu'à 9,4 Go sur les médias double face est une alternative possible et certains fabricants proclament une durée de vie de 100 ans. Néanmoins, si l'on considère que l'expérience avec les CD-R peut servir d'indication, cela signifie que la qualité des médias peut varier significativement parmi les fabricants, et même de lot en lot. Il n'est pas très clair de savoir combien de temps les formats DVD sont utilisables, vu que des formats de nouvelle génération à haute densité sont déjà en préparation, et que les questions de compatibilité arrière restent sans réponse. S'engager dans un nouveau format de médias amovibles pour le stockage d'archive peut se révéler une entreprise périlleuse, et tous les médias doivent être considérés comme temporaires.

Considérations d'Ordre Informatique
La principale considération est le niveau de support fourni pour le bus périphérique choisi (c.à.d. SCSI, Firewire) et la capacité de l'ordinateur de suivre la cadence de ses périphériques. Les vitesses des bus périphériques de bus excèdent aujourd'hui celles du bus interne de l'ordinateur, signifiant que certains engorgements sont inévitables, mais que des tentatives devraient les réduire, sinon les avantages de performance procurés par le stockage à accès rapide sont annulés. Les architectures de stockage avancées telles que RAID, ou Fibre Channel sont surtout supportées par les plateformes multi-utilisateurs telles que Windows NT/2000 ou Unix/Linux. Le SCSI est une option disponible sur de nombreux systèmes mais n'est pas nécessairement fourni avec la configuration de base. Assurez-vous que le système d'exploitation et le BIOS système supportent le dispositif dont vous avez besoin et qu'il existe de la place pour les cartes d'extension.

© 2000-2003 Bibliothèque de l'Université Cornell/Département de Recherches

 


Vue en anglais
Vue dans l'Espanol