Gérer le poids d’un document PDF scanné

Auteur·e: Ariane Elsig
6 décembre 2010
Catégorie(s): Articles , Guide / tutoriel

Deux méthodes

Scanner des revues ou articles permet de libérer de la place sur les étagères, et de rendre accessible des documents sur un espace du réseau ; mais la numérisation peut vite générer un poids de fichier important, rendant les envois de documents sur Internet difficiles.

Le poids d’un fichier dépend majoritairement des images, les textes étant beaucoup plus légers. Scanner une page consiste à numériser celle-ci comme une image, avec de ce fait comme résultat un fichier souvent lourd. Deux solutions permettent d’alléger ce type de fichier :

  • tout d’abord lors de la numérisation en travaillant sur les paramètres de scannage du document,
  • ensuite à l’aide d’applications permettant de compresser le fichier.

Pour un document texte sans image, l’option OCR (reconnaissance optique des caractères) peut être une option. Cependant toute mise en page sera perdue.

1. Optimiser son scan

La procédure de numérisation est en principe identique pour tous les scanners, par contre certains termes et options peuvent varier. Trois méthodes vous permettent d’optimiser le scannage.

1.1 Paramètres d’optimisation

En travaillant sur la résolution :

L’un des paramètres d’importation principal est la résolution, qui s’exprime en dpi (ou ppp). Plus la résolution est haute, plus la qualité du document est bonne, mais parallèlement plus son poids est important. L’objectif est donc d’obtenir l’image la plus belle et la plus légère en fonction de l’utilisation finale du document. Pour exemple, un fichier de 15 pages n/b sans images pesant 3.1 Mo à 300 dpi ne pèse plus que 1.5 Mo à 200 dpi.

Repères :
300 dpi = optimisé pour de l’impression papier
150 dpi = optimisé pour une bonne qualité écran et impression sur imprimante de bureau
100 dpi = optimisé pour une qualité correcte à l’écran du texte et de l’image
72 dpi = optimisé pour une qualité correcte à l’écran de l’image

En cadrant la zone à scanner :

Par défaut, le scanner sélectionne la totalité du document lorsqu’il le prévisualise. En limitant la zone à scanner vous diminuez la taille du contenu et par conséquent le poids du fichier.
Les éléments inutiles peuvent aussi être supprimés, une fois le document scanné, à l’aide d’un logiciel d’édition.
De plus, avant la numérisation, vérifiez le format cible de votre document (par défaut à 100%).

En modifiant le type d’image final (réglage couleur) :

Un document noir/blanc est plus léger qu’un document en couleur. Si l’apport de la couleur n’est pas nécessaire, vous pouvez scanner votre document avec le paramètre noir/blanc ou valeurs de gris.

1.2 Deux recommandations

Lorsque la page à scanner est fine et que le contenu du verso ombre votre recto, supprimez cet effet de transparence en posant une feuille noire au verso lors de la numérisation.

Lorsque vous scannez des documents imprimés (magazine, journaux, livres, etc), utilisez le paramètre « Détramage » (ou « Supprimer le moiré ») si cette option est proposée par votre scanner. Ce réglage va corriger l’effet dû à la trame d’impression par création d’un filtre flou (vous pouvez selon le besoin, et si votre scanner propose cette option, ajouter un léger filtre de netteté).

Les valeurs par défaut du détramage sont de 85 lpi pour un journal, 133 lpi pour un magazine, et de 175 lpi pour un livre d’art.

img1__pge

Astuce : selon les scanners, le document scanné peut n’être pas très bien détramé, même avec le bon réglage. Il suffit parfois de modifier le positionnement de l’original sur le scanner de quelques degrés pour arriver à de meilleurs résultats.

1.3 OCR

Un document texte peut être scanné et converti en texte. C’est ce qu’on appelle le procédé OCR (reconnaissance optique des caractères).

Certains scanners intègrent un module OCR. Dans le cas contraire, un logiciel d’OCR peut être installé – il en existe de gratuits sur Internet – pour convertir le document scanné.
Cette solution demande une relecture approfondie du document car certains caractères peuvent être mal interprétés. De plus la mise en page du document ne sera pas conservée. Le PDF ainsi créé peut être verrouillé afin d’empêcher le copier-coller du texte.

1.4 Formats d’enregistrement

Deux formats de documents sont à privilégier : JPG et PDF.
Suite aux tests, nous pouvons constater que la méthode consistant à scanner en JPG puis enregistrer le JPG au format PDF grâce à un logiciel de visualisation permet d’obtenir des fichiers plus légers que de numériser le document directement en PDF. Cependant, la compression du fichier PDF par un logiciel dédié permet de réduire voire de supprimer cet écart.

2. Compresser son document PDF

Il existe plusieurs solutions permettant la compression d’un document PDF, avec plus ou moins de résultat. L’utilisation d’un logiciel dédié payant est une solution efficace, mais vous avez également possibilité d’utiliser un convertisseur en ligne ou une application gratuite.
Nous vous proposons ci-dessous quelques solutions qui, après test, ont donné un résultat correct en poids et en qualité, avec une mention spéciale pour le logiciel PDF Shrink pour son efficacité, les options de compression qu’il propose, et sa simplicité d’utilisation.

Enfin quelle que soit la solution que vous choisissez portez attention à la qualité du rendu. Une forte compression du document peut entraîner une perte de qualité. Des tests sont donc nécessaires avant de définir le bon équilibre qualité/poids du fichier adapté à l’utilisation qui en sera faite.

img2b_new

Proposition d’outils: