| | Aperçu fait de la reconnaissance de caractère ? | |
| | Auteur | Message |
---|
hr Légende vivante
Nombre de messages : 6919 Age : 70 Planète : Creuse Matos : mac mini M2 2023 en Ventura - mac mini fin 2014 en Monterey - iMac alu 2008 en El Capitan - G4 en 10.5 - iPhone 6s Date d'inscription : 19/11/2006
| Sujet: Aperçu fait de la reconnaissance de caractère ? 8/21/2015, 21:08 | |
| je suis perplexe. J’ai reçu par mail un PDF contenant une page imprimée, annotée à la main puis scannée et convertie en PDF. Aucun doute, c’est bien l’image d’une feuille de papier scannée incluse dans un PDF comme le montrent les petites taches par-ci par-là et de nombreuses annotations au crayon. Le contenu est aussi très légèrement de travers. Moi, bêtement, par automatisme, je sélectionne une ligne, pomme-C puis pomme-V dans un document et c’est bon, j’ai ma copie de ligne. Et c’est là que je me rends compte de ce que j’ai fait… J’ai copié l’image d’un texte et j’ai eu le texte, comme si Aperçu faisait de la reconnaissance de caractère… La sélection s’est faite avec le pointeur de souris comme lors de la sélection dans un traitement de texte ce que j’aurais déjà dû trouver louche. J’ai fait un essai avec deux nombres 450 qui étaient légèrement biffés d’un coup de crayon : j’ai pu copier mais j’ai obtenu §O-l)Ef sur un échantillon et 45O-i)O le trait de crayon étant plus costaud sur le premier et léger sur le second. Ce qui veut dire que c’est bien Aperçu qui a reconnu qu’il s’agissait de caractères, cette fois en se trompant mais ce n’est pas si mal pour un nombre barré. Le texte n’est donc pas inclus dans le PDF sous forme de texte et la ligne que j’ai recopiée a forcément dû être reconnue, et parfaitement en plus puisqu’elle était propre, sans trace de crayon, dans l’image. J’ai essayé de faire le même coup dans d’autres documents images mais ça ne donne rien. J’ai converti ces images en PDF, rien. Ça dépend peut-être de la police, je ne sais pas. Ou de la qualité du scannage ? Les autres n’avaient pas l’air mal pourtant. Rien trouvé dans l’aide d’Aperçu. Ça vous paraît normal ? C’est effectivement une fonction incluse dans Aperçu ? _______________ J’étais né pour rester jeune et j’ai eu l'avantage de m’en apercevoir le jour où j’ai cessé de l'être. Épitaphe de Georges Moinaux, dit Courteline
| |
| | | TG Légende vivante
Nombre de messages : 5793 Age : 60 Planète : Paradis n°2 Matos : MacBook Pro 16" 2019 Date d'inscription : 12/11/2006
| Sujet: Re: Aperçu fait de la reconnaissance de caractère ? 8/22/2015, 06:36 | |
| As-tu essayé avec un autre reader, notamment AR ?
Je pense, en réalité, que le document contient déjà le résultat d'une passe OCR. En effet, certains outils de numérisation, dont Adobe Acrobat, savent faire de l'OCR sur les documents scannés qu'on leur confie avant de les enregistrer en PDF.
Demande à ton expéditeur quels outils il utilise. | |
| | | hr Légende vivante
Nombre de messages : 6919 Age : 70 Planète : Creuse Matos : mac mini M2 2023 en Ventura - mac mini fin 2014 en Monterey - iMac alu 2008 en El Capitan - G4 en 10.5 - iPhone 6s Date d'inscription : 19/11/2006
| Sujet: Re: Aperçu fait de la reconnaissance de caractère ? 8/22/2015, 10:01 | |
| - TG a écrit:
- As-tu essayé avec un autre reader, notamment AR ?
Je pense, en réalité, que le document contient déjà le résultat d'une passe OCR. Bonne idée, en effet Reader fait la même chose et les erreurs dues aux coups de crayon donnent les mêmes résultats. Ça semble bien être des données contenues dans le document. Du coup j’ai essayé dans Evince qui est l’équivalent d’Aperçu dans Ubuntu et c’est encore pareil, même résultats. - TG a écrit:
- En effet, certains outils de numérisation, dont Adobe Acrobat, savent faire de l'OCR sur les documents scannés qu'on leur confie avant de les enregistrer en PDF.
Dans le cas d’un tableau de chiffres comme c’est le cas dans ce document, c’est drôlement pratique. Toutes les parties suffisamment propres de la page sont disponibles pour faire des copier/coller dans un tableur, ce qui était le but de ma manip. - TG a écrit:
- Demande à ton expéditeur quels outils il utilise.
Oh la la, ça je ne peux pas, elle est comptable dans une agence immobilière avec laquelle nous étions en conflit jusqu’à il y a quelques jours, le document en question clôturant enfin une très vieille affaire… De toute façon je pense que cette dame se sert des outils informatiques sans avoir la moindre idée technique sur la question. Genre grosse imprimante/photocopieur en réseau, tu mets la liasse dans la machine et tu retrouves tout sur ton PC, le reste est un mystère dont la seule chose claire est que quand ça ne marche pas, on appelle le numéro écrit sur le postit collé sur la machine. _______________ J’étais né pour rester jeune et j’ai eu l'avantage de m’en apercevoir le jour où j’ai cessé de l'être. Épitaphe de Georges Moinaux, dit Courteline
| |
| | | TG Légende vivante
Nombre de messages : 5793 Age : 60 Planète : Paradis n°2 Matos : MacBook Pro 16" 2019 Date d'inscription : 12/11/2006
| Sujet: Re: Aperçu fait de la reconnaissance de caractère ? 8/22/2015, 16:49 | |
| Regarde alors dans les propriétés du document. On y trouve souvent des traces intéressantes. | |
| | | hr Légende vivante
Nombre de messages : 6919 Age : 70 Planète : Creuse Matos : mac mini M2 2023 en Ventura - mac mini fin 2014 en Monterey - iMac alu 2008 en El Capitan - G4 en 10.5 - iPhone 6s Date d'inscription : 19/11/2006
| Sujet: Re: Aperçu fait de la reconnaissance de caractère ? 8/22/2015, 20:26 | |
| Pas grand chose, justement. Je pensais aussi pouvoir repérer quelque chose mais non, rien de significatif, même pas l’appli qui a créé le pdf : Bon, ce n’est pas grave, on explique tout de même comment c’est possible. En résumé, l’appli ayant créée le fichier a placé dans l’image des champs de texte générés par OCR et on peut les copier. Ces champs doivent être invisibles mais sélectionnables et voilà tout. Dit comme ça, ça a l’air beaucoup moins étrange ! Encore une chose à retenir. _______________ J’étais né pour rester jeune et j’ai eu l'avantage de m’en apercevoir le jour où j’ai cessé de l'être. Épitaphe de Georges Moinaux, dit Courteline
| |
| | | Contenu sponsorisé
| Sujet: Re: Aperçu fait de la reconnaissance de caractère ? | |
| |
| | | | Aperçu fait de la reconnaissance de caractère ? | |
|
Sujets similaires | |
|
| Permission de ce forum: | Vous ne pouvez pas répondre aux sujets dans ce forum
| |
| |
| |