Jag har en PDF som är en genomsökning av några sidor i en bok. Jag vill kunna söka i denna PDF efter specifika termer. Jag vet att OCR kan utföras på filer i Google Drive. Jag verkar emellertid inte kunna initiera detta manuellt och PDF-filen som jag laddar upp verkar inte ha valbar text (jag kan inte ens söka efter fraser i den från sökfältet i Google Drive). Finns det ett sätt att ”tvinga OCR”?
Kommentarer
- Det verkar bara ha konverterat den faktiska texten i PDF-filen, det gjorde det inte ' t OCR vad som helst
Svar
Nu när du laddade upp en skannad PDF (eller en bildfil) gör detta:
- Bläddra till GDrive-webbgränssnittet.
- Högerklicka på din uppladdade bildfil.
- Anropa
Open with > Google Docs
menykommandot.
Se relevant Google Drive hjälp sida för detaljer och tips. Exempelvis måste texten ha rätt sida uppåt och ha ett gemensamt, läsbart teckensnitt. Filen ska vara 2 MB eller mindre och texten ska vara minst 10 pixlar hög.
Se den här Tuts + -studien för mer information problem och tips.
Ett annat tips: Webbsökning efter GDrive OCR
hittar dessa artiklar.
Svar
Jag har inte tillräckligt med rykte för att kommentera, så jag lägger till som svar. PDF-filer som är skannade och inte har inbäddad textinformation kommer att vara OCRed när de laddas upp. Drive lägger inte till textdata i filen, men det gör det möjligt att söka i filtexten på Drive.
Av Naturligtvis öppnar du PDF-filen som ett Google-dokument OCR-texten som sedan kan redigeras och göras ”vacker”.