Tengo un PDF que es un escaneo de algunas páginas de un libro. Quiero poder buscar en este PDF términos específicos. Sé que se puede realizar OCR en archivos de Google Drive. Sin embargo, no parece que pueda iniciar esto manualmente, y el PDF que subo no parece tener texto seleccionable (ni siquiera puedo buscar frases en él desde la barra de búsqueda en Google Drive). ¿una forma de «forzar el OCR»?
Comentarios
- Solo parece haber convertido el texto real en el PDF; no ' t OCR cualquier cosa
Responder
Ahora que cargó un PDF escaneado (o un archivo de imagen), haga esto:
- Navegue a la interfaz web de GDrive.
- Haga clic con el botón derecho en el archivo de imagen que cargó.
- Invoque el comando de menú
Open with > Google Docs
.
Consulte este tutorial de Tuts + para obtener más detalles problemas y consejos.
Otro consejo: la búsqueda web de GDrive OCR
encuentra estos artículos.
Respuesta
No tengo suficiente reputación para comentar, así que agregaré como respuesta. Los archivos PDF que son escaneados y no tienen información de texto incrustado serán OCR cuando se carguen. Drive no agregará los datos de texto al archivo, pero permitirá que el texto del archivo se busque en Drive.
De Por supuesto, al abrir el PDF como un documento de Google se mostrará el texto OCR que luego se puede editar y hacer «bonito».