Jai un PDF qui est une numérisation de quelques pages dun livre. Je veux pouvoir rechercher dans ce PDF des termes spécifiques. Je sais que lOCR peut être effectuée sur des fichiers dans Google Drive. Cependant, je ne semble pas être en mesure de lancer cela manuellement et le fichier PDF que je télécharge ne semble pas avoir de texte sélectionnable (je ne peux même pas rechercher des phrases dans la barre de recherche de Google Drive). un moyen de « forcer lOCR »?
Commentaires
- Il semble seulement avoir converti le texte réel dans le PDF; il na ' t OCR quelque chose
Réponse
Maintenant que vous avez téléchargé un PDF numérisé (ou un fichier image), procédez comme suit:
- Accédez à linterface Web de GDrive.
- Faites un clic droit sur votre fichier image téléchargé.
- Appelez la commande de menu
Open with > Google Docs
.
Voir ce tutoriel Tuts + pour plus de détails trucs et astuces.
Autre astuce: la recherche sur le Web de GDrive OCR
permet de trouver ces articles.
Réponse
Je n « ai pas assez de réputation pour commenter, alors j » ajouterai comme réponse. Les fichiers PDF qui sont numérisés et qui ne contiennent pas dinformations textuelles intégrées seront OCR lors de leur importation. Drive najoutera pas les données texte au fichier, mais cela permettra de rechercher le texte du fichier dans Drive.
De Bien sûr, louverture du PDF en tant que document Google affichera le texte OCR qui peut ensuite être édité et rendu « joli ».