ETALONNAGE POUR
LA CAPTURE NUMERIQUE
Cornell préconise une méthodologie afin de déterminer les exigences de conversion, basées sur les éléments suivants :
Evaluation des attributs de document (détails, tons, couleur)
Définition des besoins des utilisateurs actuels et futurs
Caractérisation objective des variables (p. ex. Taille des détails, qualité souhaitée, résolution de la puissance du système)
Corrélation des variables entre elles à travers l'utilisation de formules mathématiques
Confirmation des résultats par essais et évaluation
CONDITIONS
REQUISES
D'ETALONNAGE DE RESOLUTION POUR LE TEXTE IMPRIME
Cornell a adopté et affiné une formule pour calculer l'Index de Qualité numérique (Quality Index, QI ou IQ) de textes imprimés, développé par le Comité des Standards C10 de l'AIIM. [Une description de cette approche est détaillée dans la section Tutorial:
Determining Resolution Requirements for Reproducing Text-based Material (Didacticiel : Déterminer les Exigences de Résolution pour la Reproduction de Matériels à base de Texte)]. Cette formule est basée sur l'interprétation de la méthode de l'Index de Qualité développée afin de conserver les normes de conservation des microfilms dans le monde numérique. La formule IQ pour la scannérisation du texte met en parallèle la qualité (IQ) à la taille de caractère (h) en mm et à la résolution (dpi). Comme dans les normes de conservation des microfilms, la formule IQ numérique prévoit des degrés de qualité d'image : à peine lisible (3,0), faible(3,6), bon (5,0) et excellent (8,0).
Tableau : Conversion Système Métrique / Système Anglais
...1 mm = 0,039 pouce
...1 pouce = 25,4 mm
La formule pour la numérisation bitonale offre un généreux suréchantillonnage afin de compenser les erreurs d'enregistrement et la diminution de qualité due à la conversion en pixels noirs et blancs par le filtre seuil.
Formule de IQ Bitonal pour le Texte Imprimé
QI = (dpi x 0,039h)/3
h = 3QI/0,039dpi
dpi = 3QI/0,039h
Remarque :
Si la mesure de x est exprimée en pouces, enlevez le 0,039.
Résolution Requise pour le Texte Imprimé : Comparaison de lettres scannérisées à différentes résolutions.
Certains textes imprimés nécessiteront une numérisation en niveaux de gris ou en couleur pour les raisons suivantes :
Les pages sont sévèrement tachées
Les pages ont noirci à un point où il est devenu difficile de convertir
l'information via le seuil pour obtenir des pixels noirs ou blancs purs.
Les pages contiennent des graphiques complexes ou des informations
contextuelles importantes (p. ex. reliefs, annotations)
Les pages contiennent des informations en couleur (p.ex. différentes
encres colorées)
Numérisation
du Texte : Comparez la numérisation en mode bitonal (à gauche)
et en niveaux de gris (à droite) d'une page de texte tachée.
Parce
que les images tonales font "disparaître" subtilement les pixels se
trouvant partiellement sur un trait, une formule indépendante a été
développée pour la numérisation en niveaux de gris/couleur du texte
imprimé :
Formule
IQ Niveaux de Gris/Couleur pour le Texte Imprimé
QI = (dpi x 0,039h)/2
h = 2QI/0,039dpi
dpi = 2QI/0,039h
Remarque
: Si la mesure de x est exprimée en pouces, enlevez le 0,039.
Exemple
: Cas
de Livres Fragiles
Cornell
a utilisé l'étalonnage pour déterminer les exigences de conversion
des livres fragiles contenant du texte et des graphiques simples,
tels que dessins au trait, tableaux, schémas et documents similaires.
Bien que certains livres possèdent des pages noircies, le contraste
entre le texte et le fond est, dans la plupart des cas, suffisant
pour capturer le texte en mode bitonal. Nous avons déterminé les
besoins de résolution en évaluant la précision de détail requis
et en définissant nos besoins qualitatifs.
Le
texte imprimé offre un outil de métrique pour les détails : la
hauteur de la lettre significative la plus petite. En étudiant
les imprimés commerciaux conçus entre 1850 et 1950, Cornell a
découvert que pas un seul éditeur, ou presque, n'avait utilisé
de polices de caractères inférieures en hauteur à 1mm. Nous souhaitions
remplacer les documents originaux par des copies sur papier, et
notre exigence de qualité était élevée-nous voulions un rendu
excellent des polices, ainsi que la représentation complète des
polices Serifs et d'autres attributs.
Une
fois déterminée la précision des détails et la qualité souhaitées,
notre prochaine étape fut de mettre en équation ces exigences
avec la résolution nécessaire. En utilisant la formule bitonale
IQ et un détail fixe de 1mm, Cornell a évalué que les informations
textes peuvent être capturées avec une qualité excellente à une
résolution de 600 dpi. Un examen approfondi sur écran et papier
de fac-similés numériques d'une série d'exemplaires utilisés à
l'époque des livres fragiles ont confirmé cet étalonnage. Bien
que de nombreux livres ne contiennent pas de texte si petit, et
afin d'éviter un contrôle article par article, tous les livres
sont scannérisés à 600 dpi.
Contrôle
de Connaissances
Calculez
la résolution de numérisation noir et blanc requise pour obtenir
une qualité excellente (QI=8) pour un caractère de 3mm de haut
(arrondir à l'entier le plus proche)
En
utilisant un scanner bitonal à 400 dpi, quelle sera la taille
du plus petit caractère capturé à une qualité moyenne (IQ=5) ?
(Arrondissez la réponse au centième de millimètre le plus proche).