DactylHomeService de frappe de manuscrits, transcriptions audio et documents

Transcription par traitement OCR

reconnaissance-transcription-ocr

Reconnaissance de texte par transcription OCR

Mais qu’entend-on par « Transcription par traitement OCR » ? Il s’agit tout simplement de logiciels de reconnaissance de texte et de conversion de documents.

Bien qu’il existe de nombreux logiciels sur le marché, tous ne sont pas adaptés à une utilisation professionnelle. Un bon logiciel OCR doit bien entendu identifier un maximum de caractères mais encore le faire de façon conviviale et intelligente, en étant capable de reconnaître toutes les polices de caractères des traitements de textes du marché.

Eh bien alors, plus besoin de correcteur relecteur ?

Attention, on ne parle ici que de reconnaissance de caractères et non pas de texte manuscrit pour lequel un logiciel OCR serait inefficace. Eh oui, le document à transcrire (image, PDF, scan) devra être composé de caractères et, si possible, sans graphiques ni tableaux.

Mais encore ?

En plus, le document se doit d’être de bonne qualité, avec une résolution (pixellisation) élevée et nette s’il s’agit d’une photo ou d’un scan. Malgré tous ces « pré-requis », le logiciel OCR fera toujours malheureusement des erreurs dues parfois simplement à une poussière ou un cheveu sur l’image.

… Et c’est tout ?

Non, la reconnaissance OCR n’est pas toujours suffisamment intelligente pour formater automatiquement le document transcrit. Par exemple, la reconnaissance d’un PDF initialement en Word n’ira pas concaténer les lignes, ou alors fera des fautes de sens ou n’identifiera pas les puces ou encore les indexations des titres et des sous-titres.

En résumé, une relecture est toujours nécessaire.

Selon la nature du document à transcrire, il m’arrive d’avoir parfois recours à de tels logiciels. Leur utilisation est toujours suivie d’une relecture attentive afin de produire un résultat de qualité et fidèle au document original.

Nicole Manuello

Catégories : Blog