A. Présentation rapide :
Ce produit n’est plus disponible
Son icône :
Qu’es-aco : logiciel de reconnaissance de caractères (OCR)
Site de l’éditeur : Abbyy
Traduction : oui
Payant : ce produit n’est plus disponible
Version démo : –
Interface :
B. Vidéos :
AbbyyFine Reader tutoriel vidéo
08/12/12
Pour télécharger la vidéo au format Apple TV, PC, Mac :
cliquez sur le bouton ci-contre,
ou abonnez-vous au podcast
C. Plus en détail :
1. Introduction :
ABBYY FineReader Express pour Mac est enfin disponible après de nombreux mois d’attente en version démo et j’en ai profité pour le tester. Ce que je vous livre ici est un simple test, pas un tutoriel complet, mais je pense qu’il est assez représentatif des possibilités du logiciel.
Readiris© n’a pas répondu à ma demande, donc je ne peux pas faire de comparatif.
La démo est effective pendant 14 jours, mais ne vous autorise qu’une seule page par conversion.
2. installation et préparation du document:
L’application vient avec son installeur, et un guide en français. Une fois l’application à sa place dans le dossier applications, il suffit de glisser un document (image/PDF) sur son icône pour activer le module de tâches rapides.
Il porte bien son nom puisqu’en 2 clics, c’est déjà fini : sélection de la langue, puis du type de sortie. Il est ainsi possible d’avoir un PDF indexable, un document HTML, du texte ou un tableau de calcul.
Tâches rapides
Il porte bien son nom puisqu’en 2 clics, c’est déjà fini : sélection de la langue, puis du type de sortie. Il est ainsi possible d’avoir un PDF indexable, un document HTML, du texte ou un tableau de calcul.
Notez le choix de langues disponibles dans la démo.
Essai n°1 :
Comme pour les autres applications d’OCR, je lui ai fourni en premier le PDF scanné en 300 pdi, de mauvaise qualité, pour voir ce que ça donne.
Si vous souhaitez voir une capture du document original, je la mets ici.
Je sélectionne une sortie texte et je donne un dossier et un nom d’enregistrement. La conversion se lance (processus assez rapide) et Word© va s’ouvrir pour afficher le résultat.
Le résultat est très bon.
Les listes sont respectées.
Le logiciel a même réussi à traduire le texte des captures d’écran. Néanmoins, je préfère qu’il les laisse comme images. Retour donc sur l’interface du logiciel. L’ensemble est sobre, avec finalement juste les options nécessaires.
Le zoom permet de faire des sélections plus fines
Une notification en bas de la fenêtre me signale que la résolution est insuffisante. Les zones dessinées de couleur sont déterminées par le logiciel et identifiées en 3 types :
- texte (vert),
- tableaux (bleu) et
- image (rouge).
On voit alors que le logiciel a pris l’image pour une zone de tableau.
Pour modifier un type de zone, un simple clic droit permet de faire la modification. Pour ajouter des zones, il suffit de cliquer sur le type dans la colonne de droite, puis d’encadrer la zone voulue.
On corrige l’erreur d’un clic droit (et l’on supprime une zone avec la touche effacement arrière)
Il suffit alors de cliquer sur le type de sortie voulu puis conversion. Voici le résultat obtenu. Même les listes, et autres formatages de texte sont conservés. Les accents sont gardés. Le résultat visualisé dans Pages© est malheureusement moins bon, car on perd les options de mise en page.
Les images sont récupérées et positionnées au sein du texte.
Essai n°2 :
Fort de ce premier résultat, je lui ai soumis une image qui est une capture d’écran d’une page de l’aide du logiciel. J’ai tenté de restreindre la sélection à la liste encadrée de bleu.
Le résultat n’est pas formidable :
Il semble que les polices exotiques et de couleur ne soient pas forcément les meilleures.
Après de multiples essais, j’ai eu beaucoup de mal avec les tableaux sur lesquels il faut veiller à ce que tous les délimiteurs soient bien détectés sinon tout est mélangé. Il est possible grâce à un clic droit d’ajouter des séparateurs, mais ce n’est pas très maniable.
Essai n°3 :
Ci-dessous un autre essai avec un PNG qui est également une capture d’écran faite d’une page web (faite avec LittleSnapper©).
Le résultat est plutôt convaincant.
Le résultat est proche de l’original. Le texte est bon et l’image bien positionnée.
Essai n° 4 :
Pour mon quatrième essai, je lui ai donné une image (JPG) prise à l’iSight d’une cartouche d’encre. Inutile de dire que la résolution n’est pas vraiment adéquate. La détection s’en sort pas mal.
Ici l’image originale est réellement de mauvaise qualité.
Forcément, il a vu les 2 seules zones de texte
Essai n°5 :
Enfin, je lui ai donné un vrai PDF fait dans les règles de l’art. Vous devrez m’excuser pour le choix du document. Il ne s’agit pas de publicité, mais j’avais besoin d’un texte complexe, avec une mise en page, des colonnes et surtout des images.
J’utilise ici Transfert d’image pour scanner sur le réseau (ABBYY FineReader Express ne reconnait que les scanners en USB).
J’augmente la résolution à 600 dpi et j’accentue également le contraste.
Il est bien sûr possible de scanner avec Aperçu (les réglages sont identiques)
Je soumets alors le tiff obtenu à l’OCR. La première vague de détection fait quelques erreurs.
Le premier résultat en automatique (sans correction)
Le résultat obtenu tel quel donne un résultat excellent.
Après correction manuelle des zones
Les zones sont parfaitement définies en corrigeant manuellement.
Le résultat dans Word© (non, ce n’est pas un PDF) est saisissant :
Les images ont été positionnées et la mise en page est presque parfaite.
Pour comparer, vous pouvez voir ci-dessous une capture du document original :
Comme vous le voyez sur ce petit test, le moteur d’ABBYY FineReader Express pour Mac est plus que convaincant, pour peu qu’on lui donne des documents correctement préparés. Dès lors, la conversion est très efficace et le tout pour un tarif plutôt favorable puisque l’on est à moins de 90€ sur le site de l’éditeur.