OCR

Présentation de différents OCR - Abbyy FineReader Express - PDFpen

PDF

Astuces PDF - Aperçu - Skim - PDFpen

PDFpen

PDFpen & PDFpen Pro - PDFpen pour iPad

PDFpen et PDFPenPro

A. Présentation rapide :

Son icône :

PDFPen

Qu'es-aco : PDFpen est un logiciel d'édition, d'annotation et de transformation des PDF fourni avec un logiciel de reconnaissance de caractère.

Site de l'éditeur : Smile

Traduction : oui - y compris le fichier d'aide.

Payant : oui

Stores :

App Store (liens sponsorisés) :

Disponible aussi chez Applications Systems.

Version démo : oui (sur le site de l'éditeur)

Interface :

interface

B. Plus en détails

Le PDF est un format bien connu et utilisé sur Mac. On distingue le PDF image qui est une copie conforme d’un original, obtenu par exemple suite à un scan, et le PDF « indexé » qui est un PDF dont on peut copier le texte, obtenu soit par le passage dans un logiciel d’OCR, soit par la fonction imprimer de Mac OS X.
Il faut savoir que ce format qui peut sembler parfaitement impossible à modifier n’est pas si figé et l’on peut, avec les bons outils, appliquer bien plus que de simples annotations. Dans ce domaine, une poignée de logiciels se disputent le marché, dont Acrobat d’Adobe. En dessous de ce mastodonte, il existe d’autres logiciels plus abordables et pas forcément moins efficaces, et j’ai décidé de vous parler de PDFpen et PDFpen Pro, de nos amis de SmileOnMyMac. Grand merci à eux pour la licence.

1. Interface :

PDFPenPro dispose d’outils communs avec PDFPen et de quelques fonctions spécifiques pas forcément nécessaires à tous, aussi je vais dans un premier temps m’attarder sur la version simple et de leurs fonctions communes, puis je traiterais à part des fonctions spécifiques « Pro ». La liste des différences est listée sur cette page .

interface

1. l’interface

L’interface comprend une barre d’outils personnalisable (Image 1 -1), et une barre latérale qui peut être masquée (Image 1 -2) et un inspecteur (Image 1 −3). Comme dans les logiciels iLife, l’inspecteur joue un rôle important dans les ajouts d’éléments et habillage de la sélection. Enfin, PDFPen dispose d’une bibliothèque d’éléments graphiques où l’on pourra stocker des « tampons » (Image 1 −4).

barre latérale

2. la barre latérale

Le rapprochement peut être fait avec Aperçu ©, notamment sur l’affichage lui-même avec les fonctions de zoom et de défilement, mais aussi la possibilité d’afficher les pages en vis à vis.
La barre latérale va ici aussi permettre de réorganiser les pages (Image 2 -1), d’ajouter éventuellement un autre document PDF à intégrer, supprimer un élément (touche effacement arrière), et même ajouter une page blanche (Image 2 -2). En bas de la fenêtre, on pourra choisir d’afficher les annotations, les miniatures, la table des matières ou la zone de recherche (Image 2 -3). Les pages peuvent bien sûr être tournées grâce à l’outil de rotation (à ajouter) ou bien avec le menu Présentationtourner.
PDFpen s’interface avec les scanners Twain et permet de ce fait de directement utiliser le scanner via le logiciel.

2. Annotations

outils de forme

3. outils de forme

Comme dans Aperçu, on dispose d’outils d’annotation, mais ils sont plus faciles à manier et plus complets. Il faudra passer par le menu (Image 3 -2) ou bien par la barre d’outils (Image 3 -1) pour choisir l’outil voulu :
◆ Le dessin à main levée (Image 3 -3)
◆ La forme à main levée (Image 3 -4) (pour fermer la forme il suffit de double cliquer sur le point de départ).
◆ Rectangles et ronds (Image 3 -5)
◆ Traits (Image 3 -6) dont on change les extrémités avec l’inspecteur)
◆ Rectangles à coins arrondis (Image 3 -7)

Tous ces éléments pourront être modifiés grâce à l’inspecteur en changeant le trait de contour le remplissage ou les extrémités (Image 3 −8). Il sera également possible de les aligner grâce à l’inspecteur adéquat, en sélectionnant les éléments concernés (Image 3 −9). D’ailleurs, on peut également afficher une grille afin d’améliorer l’alignement (Menu Agencement > afficher la grille).

annotations et liens

4. annotations et liens

L’outil du milieu permettra, lui, d’ajouter des zones de texte (Image 4 −1), dont on modifiera remplissage et couleur (Image 4 −2), mais aussi opacité grâce à l’inspecteur, mais aussi la police (Image 4 -3) (à aller chercher dans le menu Format). Les post-its (Image 4 -4) sont similaires à ceux d’Aperçu.
Les liens peuvent être de type URL ou vers une page du même document. Pour créer un lien, on trace une zone « gâchette » et on double clic dessus pour faire apparaître le menu (Image 4 −5).

annotations de texte

5. annotations de texte

Les manipulations de texte lui-même ne peuvent se faire que si le PDF est indexable. Ainsi, on retrouve le barré de texte (Image 5 -2), le surlignage de différentes couleurs (Image 5 −1), le gribouillage (Image 5 −3). Pour annuler les annotations, il suffit d’utiliser le menu « Effacer » (Image 5 −4).

L’outil d’annotation de texte (Image 5 -5) est ici important. Le premier type permet de sélectionner du texte, alors que la flèche simple permet la sélection des éléments graphiques. Le troisième item permet la simple surbrillance. La main, le déplacement d’objet. Le dernier permet d’effectuer une sélection.

sélection et masquage

6. Sélection et masquage

Un autre outil caché dans le menu Format (Image 6 -1) permettra soit de masquer la sélection (de texte) sous un gros trait noir (« Block ») soit de tout simplement effacer le texte ou la sélection. On voit ici le dernier outil qui permet d’effectuer une sélection globale d’une zone du PDF (Image 6 −2), dont les dimensions s’affichent, puis de rogner le document.

3 Les outils de correction

Lorsque l’on est face à un PDF indexable comme ici, on ne va pas se limiter aux simples annotations, mais on va directement pouvoir interagir et modifier le PDF, que ce soient les images ou le texte.

modifier du texte

7. Modifier du texte

Dans le cas du texte, il faut commencer par effectuer une sélection (Image 7 -1), puis utiliser l’outil « corriger du texte » (Image 7 -2). Le texte est alors disponible dans un cadre de sélection (Image 7 - 3), où l’on pourra changer le formatage, mais aussi la taille, police (Image 7 - 4) et même le contenu !

chercher et remplacer

8. chercher et remplacer

Ceci ouvre également la porte à des modifications de groupe que l’on va activer grâce au menu Présentation > chercher (Image 8 - 1). La barre latérale permet de taper le mot cherché : la liste des occurrences du mot apparaît en liste (Image 8 - 2). Dès lors on peut :

◆ Remplacer (Image 8 - 3) le mot par un autre soit sur l’un des résultats (Image 8 - 4), soit sur l’ensemble des occurrences.
◆ Effacer ce même mot ou le cacher (Bizarrement appelé Rédacter) (Image 8 - 5) derrière un cache noir comme tout à l’heure. Ceci est très utile pour faire disparaître des éléments confidentiels ou les réponses d’un questionnaire par exemple.

les images sont aussi modifiables

9. les images aussi sont modifiables

Le travail sur les images permet de déplacer (Image 9 - 3), mais aussi corriger les couleurs, exposition (Image 9 - 1) et même d’appliquer des effets (Image 9 - 2) : ceci s’effectue par un simple double-clic.

Plusieurs manipulations sont possibles

10. plusieurs manipulations sont possibles.

Outre ces modifications, on pourra utiliser les outils d’image situés dans le menu Édition pour pouvoir redresser et rogner l’image (Image 10 - 4), voire même la décompresser (Image 10 - 3). Bien sûr, on pourra supprimer et ajouter un autre cliché à la place, ou l’étirer (Image 10 - 5). Enfin, on peut utiliser la fonction transparence (Image 10 - 1) qui s’apparente à l’alpha instantané des logiciels iWork, où l’on désigne une couleur à supprimer. Notez que le bouton « tolérance » (Image 10 - 2) permet d’ajuster les limites.

Cette correction d’image n’est possible que dans les PDF nativement indexés, et ne sera pas possible sur un PDF image passé par l’OCR intégré.

4. La bibliothèque

la bibliothèque

11. la bibliothèque

Dans le même ordre d’idée que les outils d’annotation, on peut utiliser des éléments stockés dans la bibliothèque de PDFpen et les glisser sur le PDF. En fait, tout élément extérieur peut être glissé sur un PDF, mais il est pratique de pouvoir enregistrer ces éléments dans la bibliothèque en vue d’une réutilisation.
On appelle la bibliothèque (Image 11 - 1) qui comporte plusieurs sections : annotations à main levée, images, annotations autres (Image 11 - 2). Pour ajouter un élément que l’on vient de glisser ou de créer, il suffit de le mettre en surbrillance et de cliquer sur le bouton d’ajout (Image 11 - 3). Selon la nature de l’élément, il sera classé dans le panneau adéquat. Pour le réutiliser, on prend l’élément et on le glisse sur la page. On peut réaliser la même opération via un dessin à main levée ou une image. On peut agir sur l’élément texte ou dessin en changeant épaisseur du trait et couleur grâce à l’inspecteur (Image 11 - 7).
Ceci est particulièrement pratique pour insérer une signature : soit on va scanner une signature sur papier, soit on la crée grâce à une tablette graphique (avec Ink© par exemple). On l’enregistre comme image, puis on l’ajoute à la bibliothèque (Image 11 - 4). Il suffit ensuite de la rendre transparente (Menu Édition > rendre transparente) (Image 11 - 5) pour que le fond ne masque pas la feuille du PDF (Image 11 - 6). Plus besoin d’imprimer pour signer un document !

5. OCR

Préférences

13. les préférences

PDFpen dispose d’un OCR intégré en plusieurs langues. Il faut tout d’abord se rendre dans les préférences si l’on souhaite se voir systématiquement proposé d’effectuer le traitement lorsque l’on va ouvrir ou glisser un PDF image dans PDFpen (Image 12 - 1), ou même si l’on tente de sélectionner du texte (Image 12 - 2). Il sera de toute façon toujours possible de débuter le traitement manuellement grâce au menu Édition > OCR la page.

Une fois le traitement effectué, le texte sera modifiable selon les modalités ci-dessus.

6. Gérer des formulaires

ici, un simple PDF non interactif

14. Ici, un simple PDF non interactif

PDFpen peut permettre de remplir un formulaire si celui-ci est interactif : en cliquant sur un champ, on pourra le remplir puis l’enregistrer. Si le formulaire est un simple document scanné, il reste possible de déposer des blocs de texte pour le remplir (Image 14 - 2), mais aussi d’ajouter des coches (Image 14 - 1).

Spécificité PDFPenPro

les menus interactifs de formulaires

15. les menus interactifs de formulaires.

Il faudra passer par PDFpenPro pour créer des formulaires interactifs. Dès lors, on dispose d’un menu d’outils supplémentaire : Il est alors possible de créer des champs interactifs de texte (Image 15 - 4), mais aussi des cases à cocher (Image 14 - 1), des menus déroulants (Image 14 - 2) et même tableaux de sélection (Image 15 - 3). Les modifications se font via l’inspecteur. Le document ainsi créé, pourra être enregistré et parfaitement remplis sable par Aperçu par exemple (ou PDFpen). Un ultime bouton interactif permet d’envoyer les données récoltées via internet (Image 16).

les outils d'envoi en ligne des formulaires

16. les outils d’envoi en ligne des formulaires

7. La table des matières

PDFpen est capable d’utiliser une table des matières, mais pas de la créer.

utilisation de la table des matières

17. utilisation de la table des matières

Spécificité PDFPenPro

Il suffit d’afficher la table des matières, puis d’utiliser le menu « roue dentée » (Image 17 - 1) pour ajouter ou supprimer des éléments. Une arborescence sera possible afin de pouvoir grouper des chapitres et sous chapitres (Image 17 - 2 et 3).

8. Importer

Outre le support du scanner, PDFpen est capable de convertir directement un document Word en PDF.

import

18. Import

Spécificité PDFPenPro

Il suffit d’utiliser la commande Fichier > Nouveau > À partir de HTML pour créer un PDF d’un site. On pourra ici spécifier le nombre d’arborescences voulues. Le site est alors « aspiré » et traduit en fichier PDF.

9. Export

Le mode d’enregistrement va permettre de mettre un mot de passe, ou de compresser le PDF, mais également l’envoi direct par Mail. Une intégration spécifique est disponible vers Evernote©, via un envoi direct ne nécessitant pas d’utiliser l’application Mac.

export

19. Export

8. Les scripts

PDFpen dispose d’un certain nombre d’outils automatiques qui permettent par exemple d’ajouter des numéros de page automatique, ou de fusionner des PDF entre eux. Malheureusement, il faut savoir mettre les mains dans le cambouis pour pouvoir personnaliser les résultats (par exemple, le filigrane est en plein milieu des pages, et il faut le changer manuellement pour chaque page.

Scripts

20. Les scripts

Conclusion

PDFpen dispose d’un bon nombre d’outils efficaces pour annoter, mais surtout modifier des PDF. Si l’OCR n’est pas le meilleur dans sa catégorie, il permet néanmoins bon nombre de choses impossibles avec les autres logiciels de sa gamme, et mérite donc que l’on s’y penche. Il est simplement dommage que l’interface soit si vieillotte et la traduction incomplète.

Commentaires :

Laisser un commentaire à propos de cette page en cliquant ici

 

Bookmark and Share

Publicité :

Apple store :

MacWay :

RSS des offres de réductions MacWay

 

Twitter :

retrouvez aussi debutersurmac sur Twitter

twitter