Jai un PDF qui est une numérisation de quelques pages dun livre. Je veux pouvoir rechercher dans ce PDF des termes spécifiques. Je sais que lOCR peut être effectuée sur des fichiers dans Google Drive. Cependant, je ne semble pas être en mesure de lancer cela manuellement et le fichier PDF que je télécharge ne semble pas avoir de texte sélectionnable (je ne peux même pas rechercher des phrases dans la barre de recherche de Google Drive). un moyen de « forcer lOCR »?

Commentaires

  • Il semble seulement avoir converti le texte réel dans le PDF; il na ' t OCR quelque chose

Réponse

Maintenant que vous avez téléchargé un PDF numérisé (ou un fichier image), procédez comme suit:

  1. Accédez à linterface Web de GDrive.
  2. Faites un clic droit sur votre fichier image téléchargé.
  3. Appelez la commande de menu Open with > Google Docs.

Consultez la page daide Google Drive pour plus de détails et des conseils. Par exemple, le texte doit être à lendroit et dans une police courante et lisible; le fichier ne doit pas dépasser 2 Mo et le texte doit mesurer au moins 10 pixels de haut.

Voir ce tutoriel Tuts + pour plus de détails trucs et astuces.

Autre astuce: la recherche sur le Web de GDrive OCR permet de trouver ces articles.

Réponse

Je n « ai pas assez de réputation pour commenter, alors j » ajouterai comme réponse. Les fichiers PDF qui sont numérisés et qui ne contiennent pas dinformations textuelles intégrées seront OCR lors de leur importation. Drive najoutera pas les données texte au fichier, mais cela permettra de rechercher le texte du fichier dans Drive.

De Bien sûr, louverture du PDF en tant que document Google affichera le texte OCR qui peut ensuite être édité et rendu « joli ».

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *