Mam plik PDF będący skanem kilku stron książki. Chcę mieć możliwość wyszukiwania określonych terminów w tym pliku PDF. Wiem, że OCR można wykonać na plikach na Dysku Google. Jednak wydaje mi się, że nie jestem w stanie zainicjować tego ręcznie, a przesyłany plik PDF nie zawiera tekstu do wybrania (nie mogę nawet wyszukiwać w nim fraz z paska wyszukiwania na Dysku Google). sposób na „wymuszenie OCR”?
Komentarze
- Wygląda na to, że przekonwertował tylko rzeczywisty tekst w pliku PDF; nie ' t OCR cokolwiek
Odpowiedź
Po przesłaniu zeskanowanego pliku PDF (lub plik obrazu), wykonaj następujące czynności:
- Przejdź do interfejsu internetowego GDrive.
- Kliknij prawym przyciskiem myszy przesłany plik obrazu.
- Wywołaj polecenie menu
Open with > Google Docs
.
Zobacz odpowiednią stronę pomocy Dysku Google , aby uzyskać szczegółowe informacje i wskazówki. Np. tekst musi być ułożony prawą stroną do góry i zwykłą, czytelną czcionką; plik powinien mieć maksymalnie 2 MB, a tekst powinien mieć co najmniej 10 pikseli wysokości.
Zobacz ten samouczek Tuts + , aby uzyskać więcej informacji Ails i wskazówki.
Kolejna wskazówka: wyszukując w sieci GDrive OCR
te artykuły.
Odpowiedź
Nie mam wystarczającej reputacji, aby komentować, więc dodam jako odpowiedź. Pliki PDF, które są skanami i nie mają osadzonych informacji tekstowych, zostaną przesłane OCR. Dysk nie doda danych tekstowych do pliku, ale umożliwi przeszukiwanie tekstu pliku na Dysku.
Z Oczywiście otwarcie pliku PDF jako dokumentu Google spowoduje wyświetlenie tekstu OCR, który można następnie edytować i uczynić „ładnym”.