Introduction - Images numériques Matières Sélection - Introduction Conversion - Introduction Contrôle de la Qualité - définition Métadonnées Infrastructure Technique - Types de stockages Présentation Conservation Numérique Gestion Formation Continue

6C. Infrastructure Technique :
GESTION DE FICHIERS

Concepts Clés

introduction
suivi les mouvements
bases de données d'images
stockage
types de stockages
besoins de stockage


 

 

 

TYPES DE BASE DE MOYENS DE STOCKAGE DE DONNEES
Les technologies de stockage de données peuvent être classées de différentes façons. Le système de stockage sous-jacent (magnétique, optique ou magnéto-optique), le système par disque (fixe ou amovible), le type de média (bande, disque rigide, disque flexible), et l'interface matériel (ATA, ATAPI, SCSI, USB, Firewire/IEEE 1394, Fibre Channel) définissent ensemble les caractéristiques de chaque technologie.

On peut également distinguer les systèmes de stockage selon qu'ils sont directement reliés au système, ou reliés sur le réseau. Parmi les systèmes de stockage directement reliés figurent les disques de bureau standard, soit insérés dans le boîtier de l'ordinateur, soit reliés par un câble. Les systèmes de stockage reliés sur le réseau regroupent les systèmes de stockage accessibles à partir de plusieurs ordinateurs et peuvent soit être connectés à un serveur et accédés via des protocoles de systèmes de fichiers spéciaux (p.ex. Système de Fichier sur Réseau ou Système de Fichier internet courant), ou comme parties d'un système de stockage fonctionnant indépendamment de tout serveur particulier (p.ex. un SAN - Storage Area Network)

Les hiérarchies de stockage se réfèrent à l'allocation de fichiers vers différentes sortes de moyens de stockage, selon la fréquence d'utilisation. Lorsque les systèmes de stockage par disque magnétiques étaient très coûteux, il était commun de placer les fichiers à usage intense sur les disques magnétiques (accès en ligne), et les fichiers moins fréquemment utilisés sur des médias optiques moins coûteux (et plus lents) (stockage pré-réseau), les fichiers très rarement utilisés sur bande magnétique. (stockage hors-ligne). Le fait que les systèmes de stockage magnétiques bénéficient d'une baisse de prix bien plus rapide que le stockage optique rend cette méthode de hiérarchisation de moins en moins fréquente.

Stockage de Masse : Tendances
Depuis l'invention en 1952 du lecteur à disque dur, l'évolution technologique régulière et rapide a provoqué des améliorations spectaculaires en termes de capacité, vitesse, fiabilité et rapport performance/prix. L'amélioration la plus forte concerne l'augmentation continue de la quantité de données pouvant être stockées sur la même zone (connue sous le terme de "densité de stockage"). Le coût unitaire du stockage sur disque dur de base a chuté d'un rapport de 100 à 1 entre 1997 et 2002. Alors qu'il est prévu que le coût par unité de stockage continue à baisser à forte allure et que la capacité des disques continue à augmenter, il est peu probable que même les plus larges bibliothèques, ou celles se développant très rapidement, rencontrent des problèmes de stockage de données en termes de capacités ou de coûts. D'autres types de stockage de masse, tels que les systèmes à disques optiques ou à bande magnétique, connaissent également des améliorations au niveau des prix et des performances, mais à un rythme moins élevé que pour les disques magnétiques.

Le revers de la médaille de cette évolution technologique si rapide est son obsolescence tout aussi rapide. La nécessité de remplacement des systèmes de stockage à intervalles rapprochés (environ tous les 3 à 5 ans) annule certains des bénéfices à l'achat. Les budgets de maintenance pour les systèmes d'imagerie numérique doivent tenir compte de ces besoins.

Un autre inconvénient est la prolifération incontrôlée de nouvelles technologies. Cela est particulièrement vrai dans deux domaines dont les interfaces de disques magnétiques. Afin de profiter de la densité de stockage en augmentation (et par conséquent l'augmentation de temps d'accès aux données) de nouvelles interfaces matériel pouvant suivre la cadence des disques doivent être développées. Sinon, il n'y aurait aucun avantage à utiliser des disques plus rapides.

En résulte d'une compétition féroce pour augmenter le débit d'accès aux données pouvant être supporté par les interfaces, chaque actionnaire des interfaces tentant de dépasser ses concurrents et gagner ainsi une part de marché plus large pour les applications haute performance. Peuvent être cités comme exemples le passage de la version USB 1.1 à 2.0, l'introduction régulière de nouveaux standards SCSI, et le passage de IEEE 1394a à 1394b ou de ATA parallèle à ATA série. Les nouvelles versions offrent des performances supérieures, mais peuvent entraîner des problèmes d'incompatibilité (avec des appareils aux versions antérieures et le système de l'ordinateur lui-même), manque de support du système d'exploitation, et disponibilité retardée de pilotes de périphériques.

L'autre domaine où la prolifération technologique a provoqué une certaine confusion et des maux de tête pour les utilisateurs est la gamme de formats de médias de stockage disponible. Cela est particulièrement exact pour les formats DVD, où au moins cinq formats différents co-existent, y compris trois formats de réécriture différents (DVD-RAM, DVD+RW et DVD-RW). Le manque de standardisation entraîne des incompatibilités au sein des lecteurs et des médias, et rend l'utilisation d'une certaine technologie risquée pour les utilisateurs. Pour plus d'informations concernant ce sujet, consultez le DVD FAQ.

Une discussion intéressante concernant les tendances exposées ci-dessus peut être consultée ici.

Etude de Fiabilité
La fiabilité de stockage prend différentes significations à certains points de la chaîne de numérisation. Pendant la capture, la préoccupation majeure est l'enregistrement correct des bits et la conservation de la fidélité alors que les fichiers passent par plusieurs étapes de traitement avant de terminer dans une archive de stockage permanente. Une fois prête pour la livraison, les préoccupations à cour terme se portent sur le maintien d'une parfaite disponibilité des fichiers importants en réduisant au minimum les coupures système et en rétablissant rapidement l'accès après les défaillances système. Sur le long terme, la fiabilité est concentrée sur le remplacement de systèmes de stockage avant que le matériel et/ou les médias ne puissent plus être lus, soient détériorés ou deviennent obsolètes.

Par-dessus tout, la fiabilité des systèmes de stockage s'est sans cesse améliorée. De nos jours, presque toutes les technologies de stockage ont des systèmes de correction d'erreurs intégrés. Comme le stockage est plus rapide et plus important en termes de capacité, le temps et la redondance supplémentaires nécessaires pour implanter la correction d'erreur est devenue très aisée à implanter. De plus en plus de disques possèdent des caractéristiques tels que S.MA.R.T. (Self-Monitoring, Analysis, and Reporting Technology, Technologie de supervision, analyse et rapport autonome) permettant au disque de surveiller en permanence sa propre performance et envoyer des messages d'alerte si quelque chose ne fonctionne pas correctement (par exemple, si la vitesse de rotation du disque se modifie, indiquant peut-être qu'il y a un problème de moteur ou de roulement).

Les systèmes de stockage de capacité plus élevée sont disponibles avec une grande variété de caractéristiques. Le RAID (Redundant Array of Independent or Inexpensive Disks) autorise plusieurs options de configuration liées à la performance et la fiabilité, tels que le miroitage de données, afin qu'il y ait une redondance complète. Certains systèmes peuvent être configurés avec des "disques de secours" et "basculement automatique"; ainsi, dans le cas d'un problème disque complet, le contenu sera automatiquement reconstruit sur un disque de remplacement qui prend ensuite sa place, sans aucune intervention humaine. D'autres autorisent le "hot swapping" (branchage à chaud) des disques, permettant de brancher ou d'enlever les disques sans avoir à éteindre tout le système; Le prix de stockage continuant sa baisse, il n'est plus un luxe de posséder des disques vides tournant uniquement dans le but de prendre le pas en cas de défaillance.

Malheureusement, ces caractéristiques impressionnantes ne peuvent s'appliquer à la protection des données. Aucune technologie n'est 100% sûre contre les défaillances, et les installations de stockages entières peuvent être détruites par des évènements imprévisibles tels qu'incendies, inondations et tremblements de terre. Pour cette raison, il est généralement recommandé que toutes les données uniques (en particulier les fichiers images originaux et toutes les métadonnées associées) soient stockées sur disques amovibles tels que disques optiques ou bandes magnétiques.

La plupart des médias amovibles ont des durées de vie raisonnables (les constructeurs proclament de 10 à 100 ans), bien que ces chiffres soient basés sur des tests de vieillissement accéléré et non sur l'expérience actuelle. Néanmoins, des conditions de stockage impropres (p.ex. températures ou humidité élevée) peuvent réduire considérablement la longévité des médias. Certains fabricants de disques durs annoncent aujourd'hui un MTBF (TMBF - mesure statistique de la probabilité de défaillance disque) de cent ans ou plus. Quelle attention doit être portée à ces chiffres ?

Etant donné que toutes les technologies sont sujettes aux défaillances, et que de nouvelles technologies sont introduites à intervalles de plus en plus rapprochés, il est possible de se retrouver emmêlé dans des problèmes de durée de vie de médias de stockage. Les lecteurs à médias amovibles sont sujets à une obsolescence rapide (de nombreux formats sont apparus et ont disparu bien avant de parvenir à s'imposer sur le marché). Comme indiqué dans la partie Conservation Numérique, la conservation à long terme suppose une planification complète portant une attention particulière sur la durée de vie du média, l'environnement de stockage, les procédures de manipulation, la détection d'erreurs, la sauvegarde, la réponse aux catastrophes, et la vérification d'obsolescence du matériel, des médias, et des formats.

© 2000-2003 Bibliothèque de l'Université Cornell/Département de Recherches

 


Vue en anglais
Vue dans l'Espanol