3. Conversion

Matières Sélection - Introduction Introduction - Images numériques Conversion - Étalonnage 
  du texte Contrôle de la Qualité Métadonnées Infrastructure Technique Présentation Conservation Numérique Gestion Formation Continue

Concepts Clés

introduction
réglages de numérisation
document numérique original enrichi
étalonnage
  du texte

  du trait
  tons continus   demi-teintes
méthodes de travail proposées

ressources supplémentaires


 

 

 

ETALONNAGE POUR LA CAPTURE NUMERIQUE
Cornell préconise une méthodologie afin de déterminer les exigences de conversion, basées sur les éléments suivants :

  • Evaluation des attributs de document (détails, tons, couleur)
  • Définition des besoins des utilisateurs actuels et futurs
  • Caractérisation objective des variables (p. ex. Taille des détails, qualité souhaitée, résolution de la puissance du système)
  • Corrélation des variables entre elles à travers l'utilisation de formules mathématiques
  • Confirmation des résultats par essais et évaluation

CONDITIONS REQUISES D'ETALONNAGE DE RESOLUTION POUR LE TEXTE IMPRIME
Cornell a adopté et affiné une formule pour calculer l'Index de Qualité numérique (Quality Index, QI ou IQ) de textes imprimés, développé par le Comité des Standards C10 de l'AIIM. [Une description de cette approche est détaillée dans la section Tutorial: Determining Resolution Requirements for Reproducing Text-based Material (Didacticiel : Déterminer les Exigences de Résolution pour la Reproduction de Matériels à base de Texte)]. Cette formule est basée sur l'interprétation de la méthode de l'Index de Qualité développée afin de conserver les normes de conservation des microfilms dans le monde numérique. La formule IQ pour la scannérisation du texte met en parallèle la qualité (IQ) à la taille de caractère (h) en mm et à la résolution (dpi). Comme dans les normes de conservation des microfilms, la formule IQ numérique prévoit des degrés de qualité d'image : à peine lisible (3,0), faible(3,6), bon (5,0) et excellent (8,0).

Tableau : Conversion Système Métrique / Système Anglais

...1 mm = 0,039 pouce
...1 pouce = 25,4 mm

La formule pour la numérisation bitonale offre un généreux suréchantillonnage afin de compenser les erreurs d'enregistrement et la diminution de qualité due à la conversion en pixels noirs et blancs par le filtre seuil.

Formule de IQ Bitonal pour le Texte Imprimé
QI = (dpi x 0,039h)/3
h = 3QI/0,039dpi
dpi = 3QI/0,039h

Remarque : Si la mesure de x est exprimée en pouces, enlevez le 0,039.


Résolution Requise pour le Texte Imprimé : Comparaison de lettres scannérisées à différentes résolutions.

Certains textes imprimés nécessiteront une numérisation en niveaux de gris ou en couleur pour les raisons suivantes :

  • Les pages sont sévèrement tachées
  • Les pages ont noirci à un point où il est devenu difficile de convertir l'information via le seuil pour obtenir des pixels noirs ou blancs purs.
  • Les pages contiennent des graphiques complexes ou des informations contextuelles importantes (p. ex. reliefs, annotations)
  • Les pages contiennent des informations en couleur (p.ex. différentes encres colorées)
  • Numérisation du Texte : Comparez la numérisation en mode bitonal (à gauche) et en niveaux de gris (à droite) d'une page de texte tachée.

    Parce que les images tonales font "disparaître" subtilement les pixels se trouvant partiellement sur un trait, une formule indépendante a été développée pour la numérisation en niveaux de gris/couleur du texte imprimé :

    Formule IQ Niveaux de Gris/Couleur pour le Texte Imprimé
    QI = (dpi x 0,039h)/2
    h = 2QI/0,039dpi
    dpi = 2QI/0,039h

    Remarque : Si la mesure de x est exprimée en pouces, enlevez le 0,039.

     

    Exemple : Cas de Livres Fragiles

    Cornell a utilisé l'étalonnage pour déterminer les exigences de conversion des livres fragiles contenant du texte et des graphiques simples, tels que dessins au trait, tableaux, schémas et documents similaires. Bien que certains livres possèdent des pages noircies, le contraste entre le texte et le fond est, dans la plupart des cas, suffisant pour capturer le texte en mode bitonal. Nous avons déterminé les besoins de résolution en évaluant la précision de détail requis et en définissant nos besoins qualitatifs.

    Le texte imprimé offre un outil de métrique pour les détails : la hauteur de la lettre significative la plus petite. En étudiant les imprimés commerciaux conçus entre 1850 et 1950, Cornell a découvert que pas un seul éditeur, ou presque, n'avait utilisé de polices de caractères inférieures en hauteur à 1mm. Nous souhaitions remplacer les documents originaux par des copies sur papier, et notre exigence de qualité était élevée-nous voulions un rendu excellent des polices, ainsi que la représentation complète des polices Serifs et d'autres attributs.

    Une fois déterminée la précision des détails et la qualité souhaitées, notre prochaine étape fut de mettre en équation ces exigences avec la résolution nécessaire. En utilisant la formule bitonale IQ et un détail fixe de 1mm, Cornell a évalué que les informations textes peuvent être capturées avec une qualité excellente à une résolution de 600 dpi. Un examen approfondi sur écran et papier de fac-similés numériques d'une série d'exemplaires utilisés à l'époque des livres fragiles ont confirmé cet étalonnage. Bien que de nombreux livres ne contiennent pas de texte si petit, et afin d'éviter un contrôle article par article, tous les livres sont scannérisés à 600 dpi.

    Contrôle de Connaissances

    Calculez la résolution de numérisation noir et blanc requise pour obtenir une qualité excellente (QI=8) pour un caractère de 3mm de haut (arrondir à l'entier le plus proche)

    dpi

     

    En utilisant un scanner bitonal à 400 dpi, quelle sera la taille du plus petit caractère capturé à une qualité moyenne (IQ=5) ? (Arrondissez la réponse au centième de millimètre le plus proche).

    mm

© 2000-2003 Bibliothèque de l'Université Cornell/Département de Recherches

 


Vue en anglais
Vue dans l'Espanol