diff --git a/file-analysis.dockerfile b/file-analysis.dockerfile index cbae1e2..f955572 100644 --- a/file-analysis.dockerfile +++ b/file-analysis.dockerfile @@ -2,7 +2,6 @@ FROM ubuntu:16.04 MAINTAINER tabledevil USER root - RUN apt-get update && apt-get install -y git && rm -rf /var/lib/apt/lists/* RUN git clone https://github.com/jesparza/peepdf /opt/peepdf RUN git clone https://github.com/DidierStevens/DidierStevensSuite /opt/didierstevenssuite @@ -40,6 +39,7 @@ RUN echo 'cat /opt/README' >> /etc/bash.bashrc RUN apt-get update && apt-get install -y \ p7zip-full \ + language-pack-de \ unzip ; \ rm -rf /var/lib/apt/lists/* @@ -54,6 +54,7 @@ useradd -u 1001 -r -g nonroot -d /home/nonroot -s /sbin/nologin -c "Nonroot User mkdir /home/nonroot && \ chown -R nonroot:nonroot /home/nonroot +ENV LANG de_DE.UTF-8 WORKDIR /home/nonroot/ USER nonroot WORKDIR /home/nonroot/ diff --git a/files/command_help b/files/command_help index 51638a9..f58f77d 100644 --- a/files/command_help +++ b/files/command_help @@ -39,9 +39,13 @@ pdf-parser.py -d -f -o ## pdftk -#Dateien extrahieren +#Dateien aus PDF extrahieren pdftk unpack_files +#Dateien aus passwortgeschütztem PDF extrahieren +pdftk input_pw unpack_files + + #PDF - Plätten (javascript und andere objekte entfernen) #Dieser Prozess ist anschließend zu überprüfen pdftk cat output flattened_