## pdfid.py #Überblick über Inhalt eines PDFs pdfid.py #Um einen ganzen Ordner mit PDFs zu analysieren pdfid.py -s #Verarbeitung erzwingen auch wenn Datei defekt pdfid.py -f ## peepdf.py #Überblick ähnlich pdfid.py peepdf.py #Verarbeitung erzwingen auch wenn Datei defekt ist z.B: bei der Fehlermeldung: # Error: An error has occurred while parsing an indirect object!! peepdf.py -f #starten der interactiven peepdf-shell (empfohlen) peepdf.py -f -i # in der shell zeigt die Eingabe von "help" weitere Informationen an ## pdf-parser.py #Überblick über Struktur des Dokuments pdf-parser.py #Auswahl eines Elements pdf-parser.py -o #Hashen der Elemente pdf-parser.py -H pdf-parser.py -H -o #Exportieren eines Objects (z.B. word.doc) pdf-parser.py -d -f -o ## pdftk #Dateien aus PDF extrahieren pdftk unpack_files #Dateien aus passwortgeschütztem PDF extrahieren pdftk input_pw unpack_files #PDF - Plätten (javascript und andere objekte entfernen) #Dieser Prozess ist anschließend zu überprüfen pdftk cat output flattened_ #PDF - reparieren pdftk output fixed ##convert #PDF - in TIFF Plätten convert .tiff