Hallo zusammen,
ich habe mehrere gescannte Bücher in PDF-Form und die zunächst mittels...
[src=bash]@Echo OFF
FOR /D /R %%# in (*) DO (
PUSHD "%%#"
FOR %%@ in ("index*") DO (
Echo Ren: ".\%%~n#\%%@" "%%~n#%%~x@"
Ren "%%@" "%%~n#%%~x@"
)
POPD
)
Pause&Exit[/src]
...auf verschiedene Ordner, benannt nach den PDF-Dateinamen, verteilt. Daraufhin habe ich mir die PDFs aller neuen Unterordner mittels diesem Photoshop-Skript sämtliche Seiten der PDFs als JPEG exportieren lassen und zwar abgespeichert in den durch das Batch-Skript erstellten Ordnern.
Die JPEG-Dateien in jenen Ordnern waren dann Basis für eine Bearbeitung in ScanTailor. Da sind jetzt in einem neuen Unterordner /out sämtliche von ScanTailer aufgehübschten und geteilten PDF-Seiten als TIF-Datei gespeichert. Diese müssen jetzt alle wieder in einer jeweiligen PDF gebündelt werden (um sie dann durch den OCR-Prozess zu jagen).
Sehr sehr gerne würde ich den Prozess der Erstellung von PDFs aus den Ordnerinhalten mittels einer Stapelverarbeitung hinbekommen. Diese Skript scheint exakt das zu machen (bräuchte zwar vorher eine Konvertierung der TIFs in PDFs, was allerdings machbar sein könnte) - kostet aber 85$: http://try67.blogspot.de/2010/10/acrobat-batch-combine-all-files-in.html.
Hat ggf. jemand eine Idee, wie man das bewerkstelligen könnte? Ob eine Windows oder Linux-Lösung, das bekäme ich beides irgendwie hin.
Vielen Dank und lieben Gruß!
ich habe mehrere gescannte Bücher in PDF-Form und die zunächst mittels...
[src=bash]@Echo OFF
FOR /D /R %%# in (*) DO (
PUSHD "%%#"
FOR %%@ in ("index*") DO (
Echo Ren: ".\%%~n#\%%@" "%%~n#%%~x@"
Ren "%%@" "%%~n#%%~x@"
)
POPD
)
Pause&Exit[/src]
...auf verschiedene Ordner, benannt nach den PDF-Dateinamen, verteilt. Daraufhin habe ich mir die PDFs aller neuen Unterordner mittels diesem Photoshop-Skript sämtliche Seiten der PDFs als JPEG exportieren lassen und zwar abgespeichert in den durch das Batch-Skript erstellten Ordnern.
Die JPEG-Dateien in jenen Ordnern waren dann Basis für eine Bearbeitung in ScanTailor. Da sind jetzt in einem neuen Unterordner /out sämtliche von ScanTailer aufgehübschten und geteilten PDF-Seiten als TIF-Datei gespeichert. Diese müssen jetzt alle wieder in einer jeweiligen PDF gebündelt werden (um sie dann durch den OCR-Prozess zu jagen).
Sehr sehr gerne würde ich den Prozess der Erstellung von PDFs aus den Ordnerinhalten mittels einer Stapelverarbeitung hinbekommen. Diese Skript scheint exakt das zu machen (bräuchte zwar vorher eine Konvertierung der TIFs in PDFs, was allerdings machbar sein könnte) - kostet aber 85$: http://try67.blogspot.de/2010/10/acrobat-batch-combine-all-files-in.html.
Hat ggf. jemand eine Idee, wie man das bewerkstelligen könnte? Ob eine Windows oder Linux-Lösung, das bekäme ich beides irgendwie hin.
Vielen Dank und lieben Gruß!