Tengo un PDF que es un escaneo de algunas páginas de un libro. Quiero poder buscar en este PDF términos específicos. Sé que se puede realizar OCR en archivos de Google Drive. Sin embargo, no parece que pueda iniciar esto manualmente, y el PDF que subo no parece tener texto seleccionable (ni siquiera puedo buscar frases en él desde la barra de búsqueda en Google Drive). ¿una forma de «forzar el OCR»?

Comentarios

  • Solo parece haber convertido el texto real en el PDF; no ' t OCR cualquier cosa

Responder

Ahora que cargó un PDF escaneado (o un archivo de imagen), haga esto:

  1. Navegue a la interfaz web de GDrive.
  2. Haga clic con el botón derecho en el archivo de imagen que cargó.
  3. Invoque el comando de menú Open with > Google Docs.

Consulte la página de ayuda de Google Drive para obtener detalles y sugerencias. Por ejemplo, el texto debe estar boca arriba y en una fuente legible común; el archivo debe tener 2 MB o menos y el texto debe tener al menos 10 píxeles de alto.

Consulte este tutorial de Tuts + para obtener más detalles problemas y consejos.

Otro consejo: la búsqueda web de GDrive OCR encuentra estos artículos.

Respuesta

No tengo suficiente reputación para comentar, así que agregaré como respuesta. Los archivos PDF que son escaneados y no tienen información de texto incrustado serán OCR cuando se carguen. Drive no agregará los datos de texto al archivo, pero permitirá que el texto del archivo se busque en Drive.

De Por supuesto, al abrir el PDF como un documento de Google se mostrará el texto OCR que luego se puede editar y hacer «bonito».

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *