Zaprezentowany sposób nie jest idealny - średnio nadaje się do beletrystyki czy czytania na komórkach i czytnikach - tam zdecydowanie lepiej sprawdzi się program OCR. Jednak metoda w przypadku wszelakiej maści podręczników, zwłaszcza ze schematami/rysunkami jest świetna. Idealna do czytania na komputerze czy tablecie.
Dwa kroki do wykonania (a jak chcemy na szybko to i jeden):
Przedkrok - instalujemy pakiet imagemagick
Raz. Zamieniamy jpegi na gify z kilkoma parametrami dodatkowymi. Dlaczego gif? - lepiej nadaje się do przechowywania czarno białego tekstu ;) m.in mniejszy rozmiar.
Skrypcik:
#!/bin/bash
mkdir gotowe
MAX=`find ./ -name "*.jpg" | wc -l`
COUNT=1
echo "start"
for i in *.jpg
do
convert $i -colors 2 -scale 50% -normalize gotowe/$i.gif
# Inne przykładowe ustawienia:
# convert $i -colors 16 -scale 50% -normalize -unsharp 1.5×1.0+1.5+0.02 gotowe/$i.jpg
echo "$i >>>done $COUNT from $MAX<<<"
let COUNT=COUNT+1
done
echo "<<<>>> >>>ALL is DONE!<<< <<<>>>"
Oczywiście powyżej założenie do ksiażki czarnobiałej - parametr -colors.Opcje -scale również najlepiej dobrać pod konkretny przyadek w zależności od wielkości pliku wejściowego.
Dwa. Zamieniamy nasze pliki na pdf'a (tak samo możemy przeprowadzić konwersję wprost z plików *.jpg - wystarczy zmienić rozszerzenie)
convert *.gif ksiazka.pdfGotowe.
Metoda szybka i wydajna, ale to takie "ksero". Często jednak to nie wystarcza i trzeba się pobawić bo n.p. pojawia się w książce zdjęcie kolorowe które też chcemy załączyć. Wtedy pozostaje stary dobry jpg. Istnieje też format Djvu - takie pomieszanie gif'a z jpg, wymyślony specjalnie do digitalizacji.
OdpowiedzUsuń