iso8859 -> utf8 Sonderzeichen

Vom einfachen Programm zum fertigen Debian-Paket, Fragen rund um Programmiersprachen, Scripting und Lizenzierung.
Antworten
roli
Beiträge: 3174
Registriert: 10.09.2003 17:39:58

iso8859 -> utf8 Sonderzeichen

Beitrag von roli » 09.04.2007 14:16:47

Hallo,

irgendwie denke ich muss das Problem schon oft aufgetaucht sein, aber DIE Loesung habe ich noch nicht dafuer gefunden. Auf meinem alten PC hatte ich iso8859, auf dem neuen jetzt utf8. Ich habe eine Platte aus dem alten in den neuen Rechner geschraubt, und sehe jetzt bei Dateinamen mit Sonderzeichen, an der Stelle irgendwas anderes. Aus einer Datei die eigentlich "schön.mp3" heisst wird

Code: Alles auswählen

ls sch*|od -x
0000000 6373 f668 2e6e 706d 0a33
.
Es sollte aber eher was wie:

Code: Alles auswählen

echo "schön.mp3" |od -x
0000000 6373 c368 6eb6 6d2e 3370 000a
werden.
Klar kann ich jetzt 'n Script schreiben, aber das ist doch nix neues, die Loesung muss es doch schon geben, oder?
Roland


"Aber wenn du schon so unwissend bist, davon noch nicht gehört zu haben,
so will ich es doch als gut ansehen, daß du lieber einmal töricht fragst,
als weiterhin nichts von etwas zu wissen, das man doch wissen sollte."
aus "Die Edda des Snorri Sturluson", "Gylfis Täuschung"

Benutzeravatar
Manfred
Beiträge: 1970
Registriert: 08.02.2004 10:51:23
Wohnort: Far Far Away

Beitrag von Manfred » 09.04.2007 14:25:44

Hi roli,

das Problem scheinen momentan mehrere Leute zu haben. Unter anderem auch hier zu lesen:

http://www.debianforum.de/forum/viewtop ... highlight=

Eine Lösung habe ich aber auch noch nicht gefunden. :cry:
Ciao

Manfred

A computer only does what you actually told it to do - not what you thought you told it to do.

Benutzeravatar
Silke
Beiträge: 559
Registriert: 17.05.2005 15:58:20
Wohnort: Hannover
Kontaktdaten:

Beitrag von Silke » 09.04.2007 14:27:24

Klar gibt es eine Lösung - keine Sonderzeichen in Dateinamen verwenden. Warum? Weil das zu genau den Problemen führt, die du jetzt hast. Es geht zwar, aber es ist einfach nicht vorgesehen, und man erspart sich Stress, wenn man nur Zeichen verwendet, die in allen (hier zu Lande) verwendeten Zeichensätzen gehen.
Der Vorteil der Klugheit liegt darin, dass man sich dumm stellen kann. Das Gegenteil ist schon schwieriger.
- Kurt Tucholsky -

Benutzeravatar
armin
Beiträge: 2682
Registriert: 17.03.2005 11:49:14

Beitrag von armin » 09.04.2007 14:27:27

Ich mache es immer mit convmv, wie auch hier beshrieben: http://blog.space-based.de/2006/12/date ... umwandeln/
Wenn du das mit find kombinierst kannst du eigentlich sehr schnell alle Dateinamen anpassen.
Formerly known as Trigger.
HP 8510p - Debian Sid
Mitglied des Debian-KDE-Teams

Benutzeravatar
Manfred
Beiträge: 1970
Registriert: 08.02.2004 10:51:23
Wohnort: Far Far Away

Beitrag von Manfred » 09.04.2007 20:12:54

@silke
Wenn du die Dateinamen immer selbst vergibst, dann kannst du darauf achten. Aber was ist bei dAteien, die du gesendet bekommst? Was ist bei Betreffzeilen in Emails? Was ist bei einigen Webseiten?

Da kannst du nicht immer den Zeichensatz bestimnmen. Aber trotzdem sollte dein System in der Lage sein, alle Zeichen (zumindest die Westeuropäischen und USA) darzustellen.
Ciao

Manfred

A computer only does what you actually told it to do - not what you thought you told it to do.

roli
Beiträge: 3174
Registriert: 10.09.2003 17:39:58

Beitrag von roli » 10.04.2007 09:07:18

Hi Leute,

danke fuer die Hinweise.
@Tigger, der Links sieh gut aus, mal sehen was ich (wann) daraus machen kann
@Silke, wenn ich die Dateien "taufe", dann verzichte ich auf "Sonderzeichen", aber leider habe ich nicht nur ausschliesslich sebst erstellte Dateien auf meinem Rechner. Ich spaare mich die Sonderzeichen ja schon hier im Forum ;-}

Bis dann
Roland


"Aber wenn du schon so unwissend bist, davon noch nicht gehört zu haben,
so will ich es doch als gut ansehen, daß du lieber einmal töricht fragst,
als weiterhin nichts von etwas zu wissen, das man doch wissen sollte."
aus "Die Edda des Snorri Sturluson", "Gylfis Täuschung"

Benutzeravatar
Kokopelli
Beiträge: 1156
Registriert: 08.01.2007 10:13:24
Lizenz eigener Beiträge: MIT Lizenz

Beitrag von Kokopelli » 10.04.2007 09:19:20

Genau für dieses Problem gibt es das utf8-migration-tool:
Description: Debian UTF-8 migration wizard
This wizard upgrades legacy system locales to their UTF-8 equivalent. It also informs users whenever files in their home directory still utilize legacy encodings.
Problem: Das tool hat es soweit ich informiert bin nicht nach etch geschafft. Gibts in Lenny und Sid.
Beste Grüße, Kokopelli
--------------------------
"One must marvel that Godzilla never died laughing" (William Tsutsui)

roli
Beiträge: 3174
Registriert: 10.09.2003 17:39:58

Beitrag von roli » 10.04.2007 19:02:29

Hi,

die Konvertierung laeuft, klasse.
Das utf8-migration-tool hat den Nachteil, das ich ihm keinen Pfad angeben kann, wo nach zu konvertierenden Dateien gesucht werden soll, wenn die Daten unterm Home Verzeichnis liegen ist's aber eine bequeme Loesung. Das es allerdings ein Python Script ist, sollte das jedoch keine Hexerei sein.
@Trigger: dein Tip mit convmv war genau das was ich gesucht habe. Allerdings bin ich der Meinung das dein Blogeintrag Falsch ist. Du schreibst:
Abhilfe schafft hierbei das Tool convmv aus dem gleichnamigen Debianpaket.
$ convmv -f latin1 -t utf-8 --notest -r /toller/pfad
wandelt beispielsweise alle Dateinamen die sich unterhalb von /toller/pfad befinden um. Obiger Code führt nur einen Testlauf durch - um die Dateien auch wirklich umzubebennen braucht man noch die Option “–notest”.
Der angegebene Code fuehrt jedoch keinen "dryrun" aus, sondern convertiert gleich. Die Option --notest bewirkt das konvertiert wird, ohne wird nur angezeigt was das Toolt meint, das kovertiert werden muesste.

Nochmal Danke, Ihr habt mir 'nen Sack voll arbeit erspart.

<edit>Ich bin jetzt auch "vierstellig", das war meine Nummer 1000 8) </edit>
Roland


"Aber wenn du schon so unwissend bist, davon noch nicht gehört zu haben,
so will ich es doch als gut ansehen, daß du lieber einmal töricht fragst,
als weiterhin nichts von etwas zu wissen, das man doch wissen sollte."
aus "Die Edda des Snorri Sturluson", "Gylfis Täuschung"

Benutzeravatar
armin
Beiträge: 2682
Registriert: 17.03.2005 11:49:14

Beitrag von armin » 10.04.2007 19:51:04

Whoups, recht haste natürlich ;) Ist verbessert!
C&P hat seine Tücken!
Formerly known as Trigger.
HP 8510p - Debian Sid
Mitglied des Debian-KDE-Teams

roli
Beiträge: 3174
Registriert: 10.09.2003 17:39:58

Beitrag von roli » 10.04.2007 20:25:09

passiert mir auch immer wieder mal, ich bin dann auch froh wenn mir einer 'nen Wink mit'm Wald gibt ;-}
Roland


"Aber wenn du schon so unwissend bist, davon noch nicht gehört zu haben,
so will ich es doch als gut ansehen, daß du lieber einmal töricht fragst,
als weiterhin nichts von etwas zu wissen, das man doch wissen sollte."
aus "Die Edda des Snorri Sturluson", "Gylfis Täuschung"

Antworten