2010
09.25

fait le 25/09/10

A. Présentation rapide :

Son icône :

_edit_

Qu’es-aco : logiciel de reconnaissance de caractères (OCR)
Site de l’éditeur : Creaceed
Traduction : oui
Payant : oui
Sur l’App Store (lien sponsorisé) : Appstore 8,99 €
Interface :

interface

 

C. Plus en détail :

Prizmo est un logiciel d’OCR particulier puisqu’il agit sur des photos à la base. La déclinaison iPhone est sortie il y a quelques semaines, et le moins que l’on puisse dire, c’est qu’il y a eu un gros Buzz autour de sa sortie. Ayant déjà tâté de l’OCR sur Mac grâce au logiciel de Readdle, je n’attendais pas vraiment de miracle de Prizmo pour iPhone. Néanmoins, je suis agréablement surprise et vous propose d’en faire un petit tour d’horizon. Merci à Creaceed qui m’a permis de la tester.



prizmo.jpg

Présentation et réglages

L’interface de l’application est réellement soignée. Au démarrage, on a le choix du type de document à scanner. Le principe sera le même selon chacun des types, mais possède des options spécifiques, comme un mode de partage pour les tickets de caisse par exemple.

Le bouton documents permet de voir les anciens OCR qui sont sauvegardés. Un bon point, l’image originale est conservée, ainsi que le résultat de l’OCR. En tapotant sur la vignette, on voit le résultat que l’on affichera en grand grâce à la flèche à droite.

prizmo1-1-1.jpg

Les réglages permettent d’activer la sauvegarde systématique, mais surtout d’entrer les identifiants pour CloudApp et Dropbox, tous deux utilisés pour le partage et l’envoi des documents finaux. Espérons voir plus de destinations par la suite (MobileMe par exemple?)

prizmo_001.jpg

Le processus :

Le processus de capture et de préparation est le même quelque soit le type de document, les options apparaissant au niveau de l’OCR lui-même.

Prenons ici le mode texte.

On va pouvoir soit prendre un cliché ancien, soit utiliser le contenu du presse-papier, soit une image de la bibliothèque.



prizmo_49.jpg



Le premier panneau va permettre d’effectuer les correctifs d’images, avec des rotations et un rognage. La correction de la perspective nécessite de faire coïncider les coins et les lignes avec l’inclinaison éventuelle de l’image.

prizmo_64.jpg

Néanmoins, il vaut mieux essayer d’être bien cadré d’emblée car la correction de la perspective ne pourra pas faire des miracles.

prizmo_65.jpg

Chaque bouton de traitement dispose d’un bouton d’information expliquant la fonction.

prizmo_46.jpg

On va ensuite éventuellement corriger le blanc, en indiquant une zone de fond qui sera alors ajusté. Le dernier bouton MàZ est en fait la remise à zéro de l’image. Il n’est pas possible de simplement supprimer un des réglages, ce qui oblige à repasser par toutes les étapes. prizmo_73.jpg Pour passer à l’étape de la reconnaissance elle-même, on appuie soit sur suivant, soit on passe par le bouton OCR.  prizmo_68.jpg
 Ici, on choisit la langue de reconnaissance, mais on dispose également d’un ajusteur de contraste (qui optimise la reconnaissance). Pour être franche, j’ai trouvé que cela rendait l’OCR moins efficace, mais peut-être que je ne suis pas très douée.
prizmo_61.jpg
L’OCR est assez rapide sur un 3GS, avec une jolie animation, puisque l’on voit le prisme se déplacer sur une représentation (réelle) de l’image traitée. prizmo_83.jpg Le texte ainsi obtenu est ensuite affiché en mode édition et il est alors possible de corriger manuellement les erreurs. Ci dessous les résultats d’un article de magazine ne sont vraiment pas terribles (papier brillant). prizmo_60.jpg Alors qu’un prospectus mat sera largement mieux traité (résultat natif sans correction) prizmo_002.jpg Mes tests sont faits sur un 3GS et sont réellement dépendants, on s’en doute, de la qualité de la photo initiale. Bien évidemment, en cas de faible luminosité, c’est mauvais, même avec les outils d’optimisation. Le papier brillant des magazines est également un très mauvais sujet, car les reflets dégradent fortement la reconnaissance. Le papier mat, comme une page de livre ou un prospectus (pourtant jaune pâle) donne de meilleurs résultats. En cas de forte distorsion, les résultats sont moins bons, il faudra s’essayer à être le plus parallèle possible au moment de la prise du cliché. L’impossibilité d’annuler tel ou tel traitement d’optimisation après coup est ici pénalisante, obligeant à tout effacer pour recommencer lorsque l’OCR donne de mauvais résultats. De plus, en l’absence de sauvegarde systématique de l’image, une mauvaise manipulation est vite arrivée en appuyant un peu vite sur le bouton retour, on se retrouve à la fenêtre de choix du document et on a alors perdu l’image. prizmo_003.jpg Une fois le tout correct, l’étape suivante amène aux fonctions de partage. On dispose ici de l’envoi vers dropbox et CloudApp, de l’email, de la copie dans le presse papier. Pour toutes ces fonctions, on peut choisir entre l’image originale ou le résultat texte. prizmo_42.jpg Il sera également possible de sauvegarder l’image dans le rouleau de l’appareil photo, que ce soit l’image originale ou l’image après optimisation. Il y a deux options supplémentaires : la première, le mode de lecture nécessite l’achat de voix (in app). Le mode de traduction, enfin, permet d’utiliser plusieurs langues et utilise Google traduction. Le bouton de sauvegarde enverra le document dans la zone adéquate. prizmo_57.jpg

Le ticket de caisse

Ici, on va surtout être pénalisé par l’encrage du ticket lui-même, ainsi que par sa texture. Ainsi, les tickets brillants auront du mal, et les tickets imprimés en mode « économie d’encre » ne seront pas d’excellents sujets. Néanmoins, on arrive à s’en tirer. prizmo_74.jpg Ici, la particularité repose sur la séparation entre texte et chiffres. Une fois la colonne de nombres localisée, Prizmo va créer un résultat en colonnes, dont les chiffres seront traités à part et additionnés de façon automatique. Ci-dessous un « bon ticket ». prizmo_70.jpg Ci dessous un « mauvais ticket » prizmo_80.jpg On pourra éditer de la même façon les résultats de l’OCR. Le but n’est pas d’utiliser le total du ticket, mais de l’obtenir à partir de la colonne de chiffres. prizmo_11.jpg Ainsi, on aura accès à une fonction de calcul de part comme décrit ci-dessous. La reconnaissance du texte peut être plus difficile, mais globalement, les chiffres sont bien transcrits. Attention toutefois aux virgules parfois non détectées. Une fois le tout fait, on dispose ici d’un bouton « partager » : prizmo_09.jpg Il s’agit d’une fonction originale qui va permettre de calculer les parts de chaque personne (lors d’un repas au restaurant par exemple). Il faut indiquer le nom de la personne (qui sera mémorisé pour plus tard) puis cocher les lignes qui lui reviennent. prizmo_05.jpg Le montant s’additionne. Le bouton « Plus » à la fin de la ligne permet de multiplier les montants et l’inverse. Une fois le partage fait, on obtient la part de chacun ainsi que le montant attribué au total. prizmo_02.jpg Le bouton taxes et pourboire ajoute des lignes où l’on entre les pourcentages, l’application se chargeant du calcul. La touche plus ajoute une ligne vierge à remplir. Il est possible au contraire de supprimer des lignes via Modifier. prizmo_35.jpg Lorsque l’on sauvegarde le document, il reste possible d’éditer de nouveau les colonnes, le partage ou les montants ce qui est une bonne chose. Enfin, l’envoi permet de choisir un format csv.

Les tableaux

Ici, pas d’OCR. Il s’agit simplement d’optimiser la qualité de capture, de rogner et corriger la perspective puis d’envoyer le tableau ainsi sauvegardé. prizmo_15.jpg

Carte de visite.

Le module Carte de visite est probablement celui qui est le plus impressionnant. Il s’agit de créer dans Prizmo une fiche pour carnet d’adresses, à partir d’un cliché de carte de visite. Le principe de prise de photo est identique aux autres modules. L’OCR va tenter de déterminer chaque ligne de renseignement et leur attribuer la bonne étiquette. Néanmoins, ici aussi, les cartes de visite à police ésotérique, à fond foncé auront du mal à passer. Lors de mes essais, adresse et numéros de téléphone ont été parfaitement reconnus, mais le nom, décentré sur la carte, a été oublié. prizmo_23.jpg On peut bien sûr corriger les données, modifier les étiquettes, mais aussi en rajouter. Les libellés sont personnalisables, de même que les champs. prizmo_26.jpg Quand les données sont bonnes, outre la fonction de sauvegarde, on peut créer une fiche de carnet d’adresses, la partager et ainsi de suite.  prizmo_21.jpg
S’il existe une fiche du même nom, il est même possible de fusionner les résultats.

prizmo_20.jpg

Conclusion :

Pour l’instant l’application rencontre quelques plantages, notamment lors des opérations d’amélioration de l’image, obligeant alors à recommencer toute l’opération, y compris la prise du cliché qui n’est pas sauvegardé avant le résultat final, ce qui est souvent frustrant. Il est alors parfois plus efficace de prendre la photo avec l’application photo de l’iPhone puis charger l’image dans Prizmo secondairement. Prizmo pour iPhone bénéficie de l’expérience de l’éditeur sur Mac et apporte un moteur de reconnaissance efficace sur une machine mobile par excellence. Les résultats de l’OCR sont globalement bons, mais directement soumis aux aléas de la capture photographique. Il faut souvent s’y reprendre à plusieurs fois pour obtenir un bon résultat. Le module de carte de visite est probablement le plus utile simplifiant la saisie d’un contact. Il est par contre évident que ce genre d’application ne sera pas nécessaire à tout le monde et ne pourra pas rivaliser avec une solution d’OCR complète avec un bon scanner.
Be Sociable, Share!
  • Tweet