MultiScanTNG: Dokumente in pdf scannen mit scan2pdf

Einrichten des Druckers und des Drucksystems, Scannerkonfiguration und Software zum Scannen und Faxen.
Antworten
Benutzeravatar
puntarenas
Beiträge: 712
Registriert: 28.05.2005 15:07:05

MultiScanTNG: Dokumente in pdf scannen mit scan2pdf

Beitrag von puntarenas » 12.12.2005 17:44:15

Hallo,

nachdem mir dieser Thread Lust gemacht hat meine Dokumentenarchivierung etwas komfortabler zu gestalten, habe ich eine erste Version meines Scripts scan2pdf im Wikiartikel MultiScanTNG veröffentlicht.
Das Script erlaubt es, ein- und mehrseitige Dokumente als PDF zu Archivieren, wobei die durchnittliche Größe für eine DIN-A4 schwarz-weiß Kopie mit etwa 60Kb recht moderat ausfällt.

"Screenshots":

Code: Alles auswählen

~$ scan2pdf

Note: scan2pdf creates its PDF files in /home/puntarenas/scan2pdf,
using /tmp for temporary files.

Usage: scan2pdf [-h] [-b] [-c] [-a "author"] [-t "title"] [-k "keywords"] file

-h      show this help
-b      use the scanners button for batch mode scanning
-c      force cleanup of temporary files

PDF options (optional):

-a      Author to show up in the document properties, quotes needed
-t      Title to show up in the document properties, quotes needed
-k      Keywords to show up in the document properties, quotes needed

file    Name of the resulting PDF without suffix (required)

Code: Alles auswählen

~$ scan2pdf -a "puntarenas" -t "Einkaufszettel" -k "mein doppelseitiger DIN A4 Einkaufszettel vom 29. Februar" zettel

Please enter the first page and press any key to scan
Scanning page 1 ...

Please enter page 2 and press any key to scan
Press <q> to quit batch mode and start conversion
Scanning page 2 ...

Please enter page 3 and press any key to scan
Press <q> to quit batch mode and start conversion
Creating TIFF images...
/tmp/scan2pdfout101.pgm
scan2pdftiff101.tif
/tmp/scan2pdfout102.pgm
scan2pdftiff102.tif
Combining TIFF images...
Creating PDF document...
Optimizing PDF...
zettel.pdf was created at /home/puntarenas/scan2pdf
Cleaning up...

Code: Alles auswählen

~$ ls -hs scan2pdf/zettel.pdf
112K scan2pdf/zettel.pdf
Viel Spaß damit,

puntarenas

Edit: "Screenshots erneuert"
Zuletzt geändert von puntarenas am 22.12.2005 22:30:07, insgesamt 9-mal geändert.

Benutzeravatar
puntarenas
Beiträge: 712
Registriert: 28.05.2005 15:07:05

Beitrag von puntarenas » 12.12.2005 21:35:23

Update: Ich habe das Script überarbeitet, im Wiki steht nun Version 0.2 für Copy&Paste und zum Download bereit.
Neben ein paar Aufräumarbeiten habe ich die Variablen $TEMPDIR und $TARGETDIR hinzugefügt, so daß scan2pdf jetzt auch bequem von /usr/local/bin aufgerufen werden kann und die Dateien trotzdem an ihrem Bestimmungsort landen.

Eine Bitte an die Moderatoren. Ich habe festgestellt, daß ich diesen Thread leider im falschen Forum erstellt habe, könnte ihn bitte einer von euch nach "Drucken, Scannen und Faxen" verschieben, ich passe den Link aus dem Wiki dann entsprechend an.

Gruß
puntarenas

Benutzeravatar
napo
Beiträge: 230
Registriert: 27.07.2004 15:07:54

Beitrag von napo » 12.12.2005 22:36:13

Ich hab dein Skript mal ausprobiert.
Also, ich hab das Skript gestartet und da stand nur:

Code: Alles auswählen

Number of pages:
Ich hab zuerst auf Enter gedrückt => Fehldermeldung.
Ich hab gedacht das wäre eine Status-Information. Ich dachte, wie starte ich jetzt den Scan-Vorgang. Erst durchs Studium des Quelltextes hab ich verstanden dass man hier eingeben soll wieviele Seiten man scannen will.
Also vielleicht wäre folgender Text besser: Enter number of pages to scan

Benutzeravatar
puntarenas
Beiträge: 712
Registriert: 28.05.2005 15:07:05

Beitrag von puntarenas » 12.12.2005 22:55:38

Danke für den Hinweis. Ab sofort steht Version 0.3 bereit.
Neben deinem Verbesserungsvorschlag läßt sich die Seitenanzahl jetzt auch als Parameter übergeben.

Gruß
puntarenas

Edit: Anfänglich hatte ich vergessen, die neue Option in der Funktion usage auszugeben. Der Fehler ist korrigiert. Gibt es eigentlich viele Scanner ohne Button, ich kenne nur welche mit und finde diese Art des Batchscannens deutlich komfortabler?

Benutzeravatar
puntarenas
Beiträge: 712
Registriert: 28.05.2005 15:07:05

Beitrag von puntarenas » 13.12.2005 21:54:56

Ich habe das Script nocheinmal erweitert.

1) Nachdem beim Scannen eines 30-seitigen Dokuments beim letzten Arbbeitsschritt ein Fehler aufgetreten ist, habe ich mich entschlossen die temporären Dateien in einem solchen Fall nicht zu löschen, sondern stattdessen eine entsprechende Fehlermeldung auszugeben. Bei meinem großen Dokument hätte mir das eine Menge doppelter Arbeit erspart. In diesem Zuge ist die Option "-c" für cleanup hinzugekommen.

2) Vor Beginn wird nun überprüft, ob bereits ein PDF des gewählten Namens existiert, außerdem wird auf vorhandene temporäre Dateien gecheckt.

3) Für diejenigen, deren Scanner über keinen Button verfügt habe ich eine Möglichkeit hinzugefügt, die designierte Seitenzahl auch noch während des Batchscannens zu erhöhen oder zu veringern.


Leider musste ich feststellen, daß Umlaute in den PDF-Metainformationen (Optionen "-a", "-t" und "-k") zu einem Fehler bei der PDF-Erstellung führen. Ich weiß nun nicht, ob dies an einer verkonfigurierten $LOCALE auf meinem System liegt oder ein generelles Problem darstellt.
Es wäre toll, wenn sich Tester fänden, die ihr Ergebnis zusammen mit ihren Spracheinstellungen hier posten könnten.
Um den Fehler zu reproduzieren reicht bei mir:

Code: Alles auswählen

scan2pdf  -t "Ätsch" test 
@Mods: Nocheinmal die Bitte, könntet ihr diesen Thread nach "Drucken, Scannen und Faxen" verschieben. Es war wirklich bescheuert von mir, nach Neuigkeiten zu posten, sorry dafür.

Gruß
puntarenas
Zuletzt geändert von puntarenas am 14.12.2005 20:43:59, insgesamt 1-mal geändert.

Benutzeravatar
puntarenas
Beiträge: 712
Registriert: 28.05.2005 15:07:05

Beitrag von puntarenas » 14.12.2005 20:43:34

So, noch einmal eine neue Version des Scripts.

1) Die Seitenanzahl muß bei buttonlosen Scannern nicht länger vorab angegeben werden. Entsprechend ist auch die dämliche Option "-n" verschwunden. Nachdem alle gewünschten Seiten eingescannt sind, kann man das Batchscannen jetzt mit <q> beenden und die Konvertierung starten.

2) Nach erfolgreichem Abschluß wird ausgegeben wo die Datei erstellt wurde und wie sie heißt.

Was mich angeht, leistet das Script in der jetztigen Fassung prima Dienste und ich möchte es nicht mehr missen. Daß ich bei den Metainformationen auf Umlaute verzichten muß ist nervig, kann ich aber mangels Alternative verkraften.

Leider bin ich ein ziemlicher Bash-Scripting-Noob. Deshalb ist das Script noch immer alles andere als elegant, über Tips würde ich mich also freuen. Vor allem würde mich interessieren, wie man den Tastaturpuffer vor einem erneuten "read -s -n1" leeren kann.

Abschließend noch einmal meine obligatorische Bitte an die Moderatoren, Blabla, verschieben, bla ..., "Drucken, Scannen und Faxen" , ..., blabla, ich bin so dumm, ....., Entschuldigung!

Gruß
puntarenas

Benutzeravatar
TCA
Beiträge: 1465
Registriert: 14.05.2004 23:42:30
Wohnort: Göttingen

Beitrag von TCA » 14.12.2005 20:48:20

puntarenas hat geschrieben:Eine Bitte an die Moderatoren. Ich habe festgestellt, daß ich diesen Thread leider im falschen Forum erstellt habe, könnte ihn bitte einer von euch nach "Drucken, Scannen und Faxen" verschieben, ich passe den Link aus dem Wiki dann entsprechend an.
Verschoben von Neuigkeiten.
Gruss
Marc

Wer glaubt, etwas zu sein,
hat aufgehört, etwas zu werden.

debianforum.de Verhaltensregeln

Benutzeravatar
puntarenas
Beiträge: 712
Registriert: 28.05.2005 15:07:05

Beitrag von puntarenas » 14.12.2005 21:04:25

Tausend Dank!

Benutzeravatar
puntarenas
Beiträge: 712
Registriert: 28.05.2005 15:07:05

Beitrag von puntarenas » 22.12.2005 21:20:24

Version 0.3.3 steht im Wiki oder zum Download bereit.

Neben Aufräumarbeiten habe ich den Batchmodus für Scanner ohne Button nocheinmal verbessert. Außerdem beginnt die Nummerierung der temporären Dateien nun bei 101, so daß auch das Scannen ganzer Romane ermöglicht wird.

Leider bin ich immer noch nicht schlauer, was das Problem mit den Umlauten in den Metainformationen angeht. Über Tips würde ich mich freuen.

Frohes Scannen
puntarenas

meti
Beiträge: 559
Registriert: 19.12.2004 14:00:47
Lizenz eigener Beiträge: MIT Lizenz

Beitrag von meti » 22.08.2006 11:43:52

Ein kleiner Hinweis zu dem Script:

Auf einem normalen Sarge mit einigen Paketen von debian-multimedia und volatile in Verbindung mit einem HP PSC2355 Multifunktionsdrucker muß folgendes geändert werden damit das script funktioniert:

Von:

Code: Alles auswählen

scanimage ... --mode=Gray ...
nach:

Code: Alles auswählen

scanimage ... --mode=Grayscale ...

Antworten