Jeg har en PDF-fil, der er en scanning af et par sider i en bog. Jeg vil være i stand til at søge inde i denne PDF efter specifikke termer. Jeg ved, at OCR kan udføres på filer i Google Drev. Jeg ser dog ikke ud til at være i stand til at starte dette manuelt, og den PDF, jeg uploader, synes ikke at have valgbar tekst (jeg kan ikke engang søge efter sætninger i den fra søgefeltet i Google Drev). Er der en måde at “tvinge OCR” til?
Kommentarer
- Det ser kun ud til at have konverteret den faktiske tekst i PDF-filen; den ' t OCR noget
Svar
Nu hvor du uploader en scannet PDF (eller en billedfil) gør dette:
- Gå til GDrive-webgrænsefladen.
- Højreklik på din uploadede billedfil.
- Påkald menukommandoen
Open with > Google Docs
.
Se den relevante Google Drev-hjælpeside for detaljer og tip. F.eks. skal teksten være med højre side opad og med en fælles, læsbar skrifttype. Filen skal være 2 MB eller mindre, og teksten skal være mindst 10 pixels høj.
Se denne Tuts + tutorial for mere det problemer og tip.
Et andet tip: Websøgning efter GDrive OCR
finder disse artikler.
Svar
Jeg har ikke nok omdømme til at kommentere, så jeg tilføjer som et svar. PDF-filer, der er scanninger og ikke har indlejret tekstinfo, bliver OCRed, når de uploades. Drev tilføjer ikke tekstdata til filen, men det gør det muligt at søge efter filteksten i Drev.
Af selvfølgelig åbner PDFen som et Google Doc OCR-teksten, som derefter kan redigeres og gøres “smuk”.