Automator – Instrukcja dla automatycznego rozpoznawanie tekstu z plików graficznych na macOS

Zgodnie z obietnicą z nagrania opublikowanego w poprzednim wpisie, tj. Automator – Automatyczne rozpoznawanie tekstu z plików graficznych na macOS, poniżej umieszczam dokładną instrukcję krok po kroku, jak sprawić, aby nasz system w sposób automatyczny rozpoznawał tekst na skanach, zdjęciach i innych plikach graficznych.

Tytułem wstępu

Niestety, zawsze gdy pobieramy z sieci lub otrzymujemy od kogoś w załączniku niedostępny dokument w formie skanu w plikach typu JPG, PDF itp, to aby zapoznać się z ich treścią, chcąc nie chcąc musimy sięgać do aplikacji OCR w rodzaju FineReader. Za to gdy już mamy tak wypasiony program jak FR, to możemy sobie uprzyjemnić życie podpinając go do jednego z katalogu na naszym dysku. A po co? Aby sam FineReader, automatycznie rozpoznawał nam wrzucane tam dokumenty.

Skoro automatycznie, to skorzystać będziemy musieli z systemowego narzędzia Automator, a znajdziemy go oczywiście wśród innych preinstalowanych aplikacji. Zatem do dzieła!

Instrukcja w dziesięciu krokach

  1. Zaczynamy od uruchomienia Automatora, i poprzez naciśnięcie Command+n otwarcia w nim okna nowego zdarzenia.
  2. w oknie o nazwie Wybierz typ dokumentu, strzałką góra/dół, wskazujemy Czynność folderu, a następnie przy włączonej szybkiej nawigacji przechodzimy na przycisk Wybierz i go aktywujemy.
  3. Teraz w nowym oknie, w tabeli o o nazwie Biblioteka Czynności ustawiamy pozycje Pliki i foldery, a po naciśnięciu tabulatora, strzałkami góra/dół, z tabeli czynności wybieramy pozycję Pobierz zawartość folderu. Wyboru tego dokonujemy poprzez naciśnięcie klawisza Enter.
  4. Shift+Tabulator wracamy do tabeli bibliotek, ustawiamy się na pozycji Dokumenty, i ponownie tabulatorem przechodząc do tabeli czynności, odszukujemy i dodajemy akcję Convert to TXT.

    UWAGA!!! W tym momencie w nowym oknie może otworzyć się FineReader. Niech was to nie zaskoczy i nie zaniepokoi. Jedyne co musimy zrobić, to upewnić się, że nadal znajdujemy się w oknie Automatora.

  5. Teraz wychodząc z interakcji opuszczamy rozdzielony widok opisu czynności i przy włączonej szybkiej nawigacji przechodzimy do pola oznajmianego jako

    bez nazwy.workflow kolejka czynności

    i tam, po wejściu w interakcję, w sekcji Czynności otrzymują pliki i foldery dodawane do, klikamy przycisku Wybierz folder – czyli wybieramy katalog do którego będziemy kopiować niedostępne dokumenty. Wystarczy gdy z zaproponowanej listy wybierzemy Inny, wtedy będziemy mogli wskazać dowolny folder na dysku.

  6. W kolejce czynności, po nazwie wskazanego przez nas katalogu, znajduje się jeszcze jedna sekcja o nazwie Convert to TXT Document. Możemy wejść z nią w interakcję i ustawić sobie różne parametry rozpoznawania tekstu, takie jak miejsce zapisu rozpoznanych plików, ich format czy kodowanie polskich znaków.
  7. Działania w Automatorze kończymy zapisaniem utworzonej czynności, poprzez naciśnięcie Command+s. Możemy nadać jej nazwę np. RozpoznawanieSkanow. W tym momencie możemy już zamknąć Automatora.
  8. Teraz z poziomu Findera odszukujemy folder wskazany wcześniej jako katalog wejściowy. Ustawiamy na nim fokus VoiceOver i naciskając Shift+VO+m otwieramy menu podręczne.
  9. Odszukujemy tam i aktywujemy pozycję usługi Ustawienia Czynności Folderów….
    UWAGA!!! Opcja Ustawienia Czynności Folderu może znajdować się również wśród Usług, które należy rozwinąć.
  10. W nowym oknie, z tabeli zawierającej różne czynności, wybieramy tę utworzoną przez nas kolejkę. Upewniamy się że jest ona zaznaczona i klikamy w przycisk Dołącz. Możemy teraz już zamknąć to okno ustawień naciskając Command+w.

Od tej pory wystarczy do wskazanego katalogu skopiować niedostępny skan, w formatach typu jpg, PDF itp, aby został on automatycznie rozpoznany i zapisany w wybranym miejscu w formacie TXT.

Miłego automatyzowania się… 😉