Mam plik PDF będący skanem kilku stron książki. Chcę mieć możliwość wyszukiwania określonych terminów w tym pliku PDF. Wiem, że OCR można wykonać na plikach na Dysku Google. Jednak wydaje mi się, że nie jestem w stanie zainicjować tego ręcznie, a przesyłany plik PDF nie zawiera tekstu do wybrania (nie mogę nawet wyszukiwać w nim fraz z paska wyszukiwania na Dysku Google). sposób na „wymuszenie OCR”?

Komentarze

  • Wygląda na to, że przekonwertował tylko rzeczywisty tekst w pliku PDF; nie ' t OCR cokolwiek

Odpowiedź

Po przesłaniu zeskanowanego pliku PDF (lub plik obrazu), wykonaj następujące czynności:

  1. Przejdź do interfejsu internetowego GDrive.
  2. Kliknij prawym przyciskiem myszy przesłany plik obrazu.
  3. Wywołaj polecenie menu Open with > Google Docs.

Zobacz odpowiednią stronę pomocy Dysku Google , aby uzyskać szczegółowe informacje i wskazówki. Np. tekst musi być ułożony prawą stroną do góry i zwykłą, czytelną czcionką; plik powinien mieć maksymalnie 2 MB, a tekst powinien mieć co najmniej 10 pikseli wysokości.

Zobacz ten samouczek Tuts + , aby uzyskać więcej informacji Ails i wskazówki.

Kolejna wskazówka: wyszukując w sieci GDrive OCR te artykuły.

Odpowiedź

Nie mam wystarczającej reputacji, aby komentować, więc dodam jako odpowiedź. Pliki PDF, które są skanami i nie mają osadzonych informacji tekstowych, zostaną przesłane OCR. Dysk nie doda danych tekstowych do pliku, ale umożliwi przeszukiwanie tekstu pliku na Dysku.

Z Oczywiście otwarcie pliku PDF jako dokumentu Google spowoduje wyświetlenie tekstu OCR, który można następnie edytować i uczynić „ładnym”.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *