Différents types de sortie PDF expliqués
Objectifs
L'objectif de cette vidéo est d'apprendre à utiliser efficacement les outils de reconnaissance optique de caractères et comprendre les choix de styles de sortie PDF disponibles, afin de mieux gérer et archiver des documents numérisés.
Résumé
Explorez les différences entre les options de sortie PDF : image indexable et texte formaté.
Description
Dans cette leçon, nous allons introduire les deux principaux styles de sortie PDF proposés lors de la reconnaissance optique de caractères (OCR) : l'image indexable et le texte formaté. L'image indexable conserve l'aspect original du document en ajoutant un calque de texte invisible permettant la recherche et la sélection de texte. En revanche, le texte formaté ne conserve pas l'aspect visuel mais tente de recréer une version textuelle du document, potentiellement perdant en mise en page originale.
Nous expliquerons comment choisir entre ces options en fonction de vos besoins, notamment pour la préservation de documents juridiques ou pour la simple extraction d’informations textuelles. Cette compréhension est essentielle pour quiconque utilise des outils comme Adobe Acrobat pour l'archivage ou la gestion documentaire.
Des exemples concrets montrent comment utiliser ces options, y compris comment copier du texte reconnu et l’utiliser dans d'autres applications comme Wordpad. Finalement, nous couvrirons l’importance de la compression des images et comment ajuster les paramètres de sous-échantillonnage pour optimiser la taille des fichiers PDF.