WikiPlus

Réduire la taille des PDF numérisés — jusqu'à 85 % plus légers

Un document de 20 pages numérisé par un scanner de bureau produit souvent un PDF de 40 à 80 Mo. C'est 10 à 20 fois plus que nécessaire pour une lecture confortable sur écran. Les scanners sauvegardent par défaut à 300 DPI avec une compression minimale — une résolution adaptée à l'impression mais excessive pour la lecture numérique. L'Optimiseur PDF de WikiPlus compresse ces images de pages numérisées à des niveaux adaptés à l'usage, réduisant typiquement un tel fichier à 5-12 Mo, soit une réduction de 75 à 87 %.

Pourquoi les scanners produisent-ils des PDF si lourds

Les paramètres par défaut des scanners de bureau sont optimisés pour la qualité maximale, pas pour la taille de fichier. La résolution standard de 300 DPI est conçue pour permettre une impression fidèle du scan — ce qui implique de capturer bien plus d'informations que nécessaire pour la lecture sur un écran de 96 DPI. Une page A4 à 300 DPI en couleur produit une image de 2480 × 3508 pixels, soit environ 8,7 mégapixels par page. Sans compression, une telle image pèse 26 Mo. Même avec une compression JPEG modeste, elle reste à 1 à 3 Mo par page. Multipliez par 20 pages et vous obtenez un PDF de 20 à 60 Mo. L'optimiseur réduit la résolution cible à 150 DPI (preset Équilibré) ou 100 DPI (preset Maximum), ce qui représente 25 % à 11 % des pixels originaux respectivement — mais ces résolutions restent parfaitement lisibles sur écran et même imprimables à taille normale.

Conserver la lisibilité des documents scannés compressés

La question centrale lors de la compression de PDF numérisés est de savoir jusqu'où réduire la qualité sans compromettre la lisibilité du texte. Pour les documents textuels — contrats, lettres, factures, formulaires — la lisibilité du texte est prioritaire. Les caractères noirs sur fond blanc sont très bien rendus même à basse résolution car le contraste élevé compense la résolution réduite. Le preset Équilibré (150 DPI) préserve la lisibilité du texte jusqu'à 14 points de corps sans problème. Pour les documents avec des éléments graphiques fins — tableaux complexes, graphiques, graphes techniques — préférez le preset Haute qualité (200 DPI) qui préserve les détails fins. Pour les documents photographiques ou artistiques numérisés, évitez la Compression maximale qui peut dégrader visiblement la richesse colorimétrique. Un test pratique : ouvrez le fichier optimisé dans votre lecteur PDF, zoomez à 100 % sur une zone de texte dense et vérifiez que tous les caractères sont lisibles sans flou.

Traitement par lot de volumes importants de scans

Les organisations qui numérisent régulièrement des volumes importants de documents — cabinets d'avocats, études notariales, services de comptabilité, administrations — accumulent rapidement des dizaines de gigaoctets de PDF numérisés non optimisés. L'Optimiseur PDF de WikiPlus prend en charge le traitement par lot : déposez plusieurs fichiers PDF simultanément, sélectionnez le preset approprié, et cliquez sur Optimiser. Tous les fichiers sont traités en parallèle en mémoire et vous pouvez les télécharger d'un clic. Cette approche reste entièrement locale : même avec des lots de plusieurs dizaines de fichiers contenant des informations confidentielles (dossiers clients, actes notariés, documents fiscaux), aucun byte ne quitte votre appareil. Pour les archives massives de centaines ou milliers de fichiers, des outils en ligne de commande comme Ghostscript ou qpdf avec des scripts batch sont plus adaptés.

PDF numérisés et OCR : rendre le texte cherchable après compression

Les PDF numérisés sans couche de texte OCR ne sont que des images de pages : le texte est visible à l'écran mais pas cherchable, pas copiable, et invisible aux moteurs de recherche et aux outils d'indexation documentaire. L'Optimiseur PDF se concentre sur la réduction de taille et ne génère pas de couche de texte. Si vous avez besoin que vos documents numérisés compressés soient cherchables, le workflow recommandé est le suivant : optimisez d'abord le PDF pour réduire sa taille, puis passez le PDF optimisé dans l'outil PDF OCR de WikiPlus pour ajouter une couche de texte invisible par-dessus les images de pages. Le résultat est un PDF compact, cherchable et copiable. L'OCR s'exécute entièrement dans votre navigateur via Tesseract.js WebAssembly, sans envoi de fichier, et supporte neuf langues dont le français. La taille du PDF augmentera légèrement après l'ajout de la couche OCR, mais le gain en utilisabilité justifie largement cette légère augmentation.

Questions fréquemment posées

L'optimisation d'un PDF numérisé supprime-t-elle la couche de texte OCR existante ?
Non. Si votre scanner a ajouté une couche OCR lors de la numérisation, l'optimiseur préserve cette couche intacte. Seules les images de pages raster sont recompressées. Le texte OCR invisible superposé aux images reste intact et fonctionnel après l'optimisation.
Quelle est la résolution minimale pour garder un scan lisible ?
Pour du texte imprimé noir sur blanc (taille 10 points et plus), 100 DPI est suffisant pour la lecture sur écran. Pour du texte imprimé fin (8 points et moins) ou des documents avec des graphiques détaillés, préférez 150 DPI minimum. Pour l'impression standard, 200 DPI est généralement suffisant.
Peut-on améliorer la qualité d'un scan flou avec l'optimiseur ?
Non. L'optimiseur recomprime les images existantes mais ne peut pas améliorer la qualité d'un scan de mauvaise qualité. Si votre scan original est flou, sous-exposé ou de basse résolution, la seule solution est de rescanner le document original avec de meilleurs paramètres.