Jeg har en PDF-fil, der er en scanning af et par sider i en bog. Jeg vil være i stand til at søge inde i denne PDF efter specifikke termer. Jeg ved, at OCR kan udføres på filer i Google Drev. Jeg ser dog ikke ud til at være i stand til at starte dette manuelt, og den PDF, jeg uploader, synes ikke at have valgbar tekst (jeg kan ikke engang søge efter sætninger i den fra søgefeltet i Google Drev). Er der en måde at “tvinge OCR” til?

Kommentarer

  • Det ser kun ud til at have konverteret den faktiske tekst i PDF-filen; den ' t OCR noget

Svar

Nu hvor du uploader en scannet PDF (eller en billedfil) gør dette:

  1. Gå til GDrive-webgrænsefladen.
  2. Højreklik på din uploadede billedfil.
  3. Påkald menukommandoen Open with > Google Docs.

Se den relevante Google Drev-hjælpeside for detaljer og tip. F.eks. skal teksten være med højre side opad og med en fælles, læsbar skrifttype. Filen skal være 2 MB eller mindre, og teksten skal være mindst 10 pixels høj.

Se denne Tuts + tutorial for mere det problemer og tip.

Et andet tip: Websøgning efter GDrive OCR finder disse artikler.

Svar

Jeg har ikke nok omdømme til at kommentere, så jeg tilføjer som et svar. PDF-filer, der er scanninger og ikke har indlejret tekstinfo, bliver OCRed, når de uploades. Drev tilføjer ikke tekstdata til filen, men det gør det muligt at søge efter filteksten i Drev.

Af selvfølgelig åbner PDFen som et Google Doc OCR-teksten, som derefter kan redigeres og gøres “smuk”.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *