Minulla on PDF, joka skannaa muutaman kirjan sivun. Haluan pystyä hakemaan tiettyjä termejä tästä PDF-tiedostosta. Tiedän, että OCR voidaan suorittaa Google Driven tiedostoille. En kuitenkaan näytä pystyvän aloittamaan tätä manuaalisesti, ja lataamassani PDF-tiedostossa ei näytä olevan valittavaa tekstiä (en voi edes etsiä siinä olevia lauseita Google Driven hakupalkista). tapa pakottaa tekstintunnistus?
Kommentit
- Vaikuttaa siltä, että se on muuttanut PDF-tiedoston varsinaisen tekstin; = ”f6c8914d00″>
t OCR mitään
Vastaa
Nyt kun lähetit skannatun PDF-tiedoston (tai kuvatiedosto), tee tämä:
- Selaa GDrive-verkkokäyttöliittymään.
- Napsauta hiiren kakkospainikkeella lähetettyä kuvatiedostoa.
- Kutsu
Open with > Google Docs
-valikkokomento.
Katso asiaankuuluva Google Driven ohjesivu lisätietoja ja vinkkejä. Esim. tekstin on oltava oikea puoli ylöspäin ja tavallisessa, luettavassa kirjasimessa; tiedoston on oltava 2 Mt tai vähemmän ja tekstin on oltava vähintään 10 pikseliä korkea.
Katso tämä Tuts + -opetusohjelma lisätietoja varten vaivat ja vinkit.
Toinen vinkki: Verkkohaku haulle GDrive OCR
löytää nämä artikkelit.
Vastaa
Minulla ei ole tarpeeksi mainetta kommentoida, joten lisätään vastauksena. Skannatut PDF-tiedostot, joihin ei ole upotettu tekstitietoa, lähetetään tekstintunnistusta ladattaessa. Drive ei lisää tekstitietoja tiedostoon, mutta se mahdollistaa tiedostojen hakemisen Drivesta.
kurssi, avaamalla PDF-tiedosto Google-dokumenttina, OCR-teksti näkyy, jota voidaan sitten muokata ja tehdä kauniista.