Zeichensätze unter Debian = Mission Impossible?

Du kommst mit der Installation nicht voran oder willst noch was nachfragen? Schau auch in den "Tipps und Tricks"-Bereich.
Antworten
stefann1977
Beiträge: 26
Registriert: 29.03.2003 16:05:20

Zeichensätze unter Debian = Mission Impossible?

Beitrag von stefann1977 » 17.01.2004 17:31:47

Hallo zusammen,

dies ist wohl mein letzter Hilferuf bevor ich Debian runterschmeisse und wieder auf Gentoo wechsle.

Wie ich bereits im Topic beschrieben habe geht es um das leidige Thema der Zeichensätze.

Die Vorgeschichte:

Ich benutze Gnome als Desktop und da ich ein Fan von Bleeding Edge Software bin benutze ich natürlich die neueste Version aus unstable. Ich war auch ganz zufrieden mit meinem ersten Debian-Desktop bis mir plötzlich auffiel das Nautilus in der Adresszeile anscheinend nicht mit Umlauten und Leerzeichen klarkommt (Leerzeichen werden durch %20% ersetzt und Umlaute durch irgendeinen anderen Kram). Da ich ja schon ein wenig Erfahrung mit Linux hatte wusste ich natürlich das es nur an dem verwendeten Zeichensatz oder an den Locales liegen kann. Jedoch kam es mir gleich ein wenig spanisch vor das Nautilus die Umlaute und Leerzeichen unter den Symbolen korrekt darstellen konnte. Ebenfalls wurden die Umlaute in allen anderen Programmen (gtk1, gtk2, Terminal, kde, Mozilla usw.) korrekt dargestellt. Wie stellt man nun also die Zeichensätze bei Debian um?
Ich bin dazu strikt nach diesem HowTo vorgegangen:
http://www.debianforum.de/guides/index. ... 1002&id=54

Ich habe alles so eingestellt das als locale überall "de_DE@euro.ISO8859-15" verwendet wird. Resultat: Das Problem mit Nautilus besteht weiterhin.

Der zweite Lösungsansatz (Die UTF-8-Lösung):
Ich bin also das ganze HowTo nochmal durchgegangen und habe alles auf "de_DE.UTF-8" umgestellt. Habe anschliessend meine ganzen Dateinamen mit dem Tool "convmv" von ISO8859 auf UTF-8 konvertiert.
Resultat: Es klappt jetzt mit Nautilus :) :) :)
Nebenwirkung: Alle GTK1-Programme habe jetzt eine grässliche Schrift und - keine Umlaute !!! :evil:

Nach diversen weiteren Umstellungsversuchen, Recherche in Newsgroups, Foren und Google, bin ich zu dem Schluss gekommen: Es geht anscheinend einfach nicht !!! Es muss wohl ein Bug im Nautilus-Paket von Debian sein.

Also, ich bin mit meinem Latein am Ende und nach mehreren Stunden herumprobieren auch stark gefrustet. Ich hoffe das mir hier noch jemand einen Tip geben kann.

Benutzeravatar
startx
Beiträge: 3165
Registriert: 07.12.2002 19:29:48
Wohnort: london

Beitrag von startx » 17.01.2004 18:33:12

top und da ich ein Fan von Bleeding Edge Software bin
wenn du bleeding-edge willst, bekommst du bleeding edge ... mit allen problemen.

hi.
also ich hab mit dem nautilus aus sarge diese probleme nicht.
(ein paar andere probs vielleicht :wink: )

die gtk1-schriften sahen bei mir immer gruselig aus, aber wenn du
gnome aus sid benutzt, welche gtk1 programme nutzt du dann überhaupt noch?

stefann1977
Beiträge: 26
Registriert: 29.03.2003 16:05:20

Beitrag von stefann1977 » 17.01.2004 18:56:37

Zum Beispiel xmule, gtk-gnutella und Gimp. Wird echt Zeit das mal alle Programme auf UTF-8 und GTK-2 umgestellt sind. Dieser ganze Mist mit dem Parallel-Betrieb von gtk1 und gtk2 hat Gnome geschadet.

Benutzeravatar
spiffi
Beiträge: 1128
Registriert: 09.08.2003 19:02:27

Re: Zeichensätze unter Debian = Mission Impossible?

Beitrag von spiffi » 17.01.2004 19:55:44

stefann1977 hat geschrieben:Nach diversen weiteren Umstellungsversuchen, Recherche in Newsgroups, Foren und Google, bin ich zu dem Schluss gekommen: Es geht anscheinend einfach nicht !!! Es muss wohl ein Bug im Nautilus-Paket von Debian sein.
Umlaute und Leerzeichen in der Nautilus-Adressleiste funktionieren bei mir mit SID und de_DE@euro.iso8859-15 problemlos.

stefann1977
Beiträge: 26
Registriert: 29.03.2003 16:05:20

Beitrag von stefann1977 » 17.01.2004 20:14:07

Exakt die selben Einstellungen verwende ich auch. Kannst du mal deine Ausgabe von locale, deine /etc/environment und deine /etc/local.gen posten?

Benutzeravatar
spiffi
Beiträge: 1128
Registriert: 09.08.2003 19:02:27

Beitrag von spiffi » 17.01.2004 20:36:09

Klar, kann ich machen.

Code: Alles auswählen

# /etc/environment
LANG=de_DE@euro
LC_MESSAGES=C
LC_NUMERIC=C

Code: Alles auswählen

# /etc/locale.gen
de_DE ISO-8859-1
de_DE@euro ISO-8859-15
en_US ISO-8859-1
de_DE.UTF-8@euro UTF-8
de_DE.UTF-8 UTF-8

Code: Alles auswählen

# locale
LANG=de_DE@euro
LC_CTYPE="de_DE@euro"
LC_NUMERIC=C
LC_TIME="de_DE@euro"
LC_COLLATE="de_DE@euro"
LC_MONETARY="de_DE@euro"
LC_MESSAGES=C
LC_PAPER="de_DE@euro"
LC_NAME="de_DE@euro"
LC_ADDRESS="de_DE@euro"
LC_TELEPHONE="de_DE@euro"
LC_MEASUREMENT="de_DE@euro"
LC_IDENTIFICATION="de_DE@euro"
LC_ALL=

stefann1977
Beiträge: 26
Registriert: 29.03.2003 16:05:20

Beitrag von stefann1977 » 17.01.2004 22:36:35

Danke.

Habe deine Settings ausprobiert. Klappt aber auch nicht. Ich bin jetzt aber ein Stückchen weiter in der Fehleranalyse.

Wie es aussieht benutzt Nautilus definitiv UTF-8. Wenn ich in Nautilus einen neuen Ordner mit Umlauten und Leerzeichen erstelle, kann Nautilus diesen Ordner korrekt in der Adressleiste darstellen. Schaut man sich dieses neue Verzeichnis aber im Gnome-Terminal an gibts wieder Probleme mit Umlauten und Leerzeichen. Wenn ich den Ordner dann per convmv -f utf8 -t iso-8859-15 konvertiere ist es wieder wie vorher (Gut im Terminal, schlecht in Nautilus). Hach verdammt! Wo kriegt Nautilus bloss gesagt welche Zeichenkodierung er verwenden soll?

Benutzeravatar
spiffi
Beiträge: 1128
Registriert: 09.08.2003 19:02:27

Beitrag von spiffi » 17.01.2004 22:55:25

Hm, hab grad mal ein wenig rumgespielt. Wenn ich mit Nautilus einen neuen Ordner anlege, dann ist der auch bei mir UTF-8 kodiert und demensprechend im Gnome-Terminal nicht richtig lesbar.
Lege ich den Ordner im Gnome-Terminal an, ist er ISO8859-15 kodiert und die Dastellung sind im Gnome-Terminal und im Nautilus richtig.
Das Problem scheint übrigens nicht nur Nautilus zu betreffen. Wenn ich mit gedit eine Datei mit Umauten im Namen speichere, verwendet der auch UTF-8.

stefann1977
Beiträge: 26
Registriert: 29.03.2003 16:05:20

Beitrag von stefann1977 » 18.01.2004 00:16:48

Bei Nautilus ist das besonders ärgerlich weil man dann die Skript-Funktion eigentlich wegwerfen kann.

Bei gedit kannst du aber im Speichern-Dialog auswählen in welcher kodierung gespeichert werden soll. Standardmässig ist da aber auch UTF-8 eingestellt.

Ich habe einfach mal einen Fehlerbericht über dieses Nautilus-Problem an Debian.org geschickt. Da muss irgendwas beim kompilieren vergessen worden sein. Mal sehen was dabei rumkommt.

Benutzeravatar
spiffi
Beiträge: 1128
Registriert: 09.08.2003 19:02:27

Beitrag von spiffi » 18.01.2004 00:23:28

stefann1977 hat geschrieben:Bei gedit kannst du aber im Speichern-Dialog auswählen in welcher kodierung gespeichert werden soll. Standardmässig ist da aber auch UTF-8 eingestellt.
Da hast Du mich jetzt falsch verstanden. Es ging mir um den Dateinamen, nicht den Inhalt der erstellten Datei. Die Datei wird immer mit einem UTF-8 kodierten Namen angelegt.

stefann1977
Beiträge: 26
Registriert: 29.03.2003 16:05:20

Beitrag von stefann1977 » 18.01.2004 00:26:21

Stimmt, jetzt habe ich es auch gesehen. Hmm vielleicht ein gtk2-problem? Naja, mal sehen. Vielleicht werde ich morgen mal versuchen mein ganzes System auf UTF-8 umzustellen. Ist zwar ein umständlicher Work-Around aber hey warum benutzen wir Linux? Doch nicht weil es einfach ist! ;)

stefann1977
Beiträge: 26
Registriert: 29.03.2003 16:05:20

Beitrag von stefann1977 » 18.01.2004 22:34:58

Habe eine Antwort auf meinen Fehlerbericht bekommen:


This is definitely as it should be. GTK+ 2 and GNOME 2 applications
assume all filenames are UTF-8 encoded, because such stuff cannot depend
on the locale.

If you really want to have your files encoded in the current locale's
character set, you have to set the G_BROKEN_FILENAMES environment
variable to 1.

Regards,
--=20
.''`. Josselin Mouette /\./\
: :' : josselin.mouette@ens-lyon.org
`. `' joss@debian.org
`- Debian GNU/Linux -- The power of freedom

Aha, interessant. Ich kenne dieses Verhalten nicht von Gentoo. Wahrscheinlich haben die von Gentoo ihre GTK2-Sourcen irgendwie gepatcht. Aber in jedem Fall gut zu wissen.

Benutzeravatar
spiffi
Beiträge: 1128
Registriert: 09.08.2003 19:02:27

Beitrag von spiffi » 18.01.2004 23:00:55

Hm, ist ja sehr interessant. Danke für die Info.

ernohl
Beiträge: 1186
Registriert: 04.07.2002 08:11:56
Wohnort: HL

Beitrag von ernohl » 20.01.2004 09:50:37

This is definitely as it should be. GTK+ 2 and GNOME 2 applications
assume all filenames are UTF-8 encoded, because such stuff cannot depend
on the locale.
Das ist auch meine Beobachtung. Kann man nur hoffen , dass die Gnome-Entwickler mal wieder zur Besinnung kommen.
If you really want to have your files encoded in the current locale's
character set, you have to set the G_BROKEN_FILENAMES environment
variable to 1.
Und mit dieser Variable funktionieren dann einige nette Funktionen in den Gnome-Applikationen nicht. :cry:
Gruß
ernohl

stefann1977
Beiträge: 26
Registriert: 29.03.2003 16:05:20

Beitrag von stefann1977 » 20.01.2004 23:58:36

Ich glaube die Gnome-Entwickler machen im Prinzip alles richtig. UTF-8 ist besser. Vorraussetzung ist natürlich das alle Programme unter Linux das auch unterstützen.

Genauso ist es mit GTK. Ich kriege immer zuviel wenn ich sehe das immer noch neue Programme erscheinen die in GTK-1 programmiert sind.

ernohl
Beiträge: 1186
Registriert: 04.07.2002 08:11:56
Wohnort: HL

Beitrag von ernohl » 21.01.2004 00:45:56

stefann1977 hat geschrieben:Ich glaube die Gnome-Entwickler machen im Prinzip alles richtig. UTF-8 ist besser. Vorraussetzung ist natürlich das alle Programme unter Linux das auch unterstützen.
Der Meinung bin ich überhaupt nicht. Ich habe in meinem Leben schon so viel mit Zeichensätzen und deren Konvertierung zu tun gehabt, dass ich mir erlaube, folgende These aufzustellen:
Unicode und deren umfassenden Umsetzung ist einerseits ein so ein kompliziertes Thema, dass es Jahrzehnte brauchen würde, um es umfassend allgemein einzuführen. Andererseit ist der Nutzen äußerst minimal. Er wäre nur in einer Welt ohne Zeichensatzdeklaration notwendig. Haben wir diese? Nein! Also überflüssig und dazu (weil unausgereift) potentiell und tatsächlich fehlerbehaftet.

Andererseits wäre ja nichts dagegen zu sagen, wenn die Entwickler sich 'mal Gedanken machen würden. Aber nein, bestehende Systeme und Daten (ISO-8859) werden einfach ignoriert. Siehe Antwortmail: "because such stuff cannot depend on the locale". Da weiß jemand nicht, wovon er redet. :cry:

UTF-8 ist besser? Mag sein! Wenn wir keinen PKW mehr in der Garage hätten, sondern ein Univarsalteil aus PKW, Truck, Yacht, Flieger, Hubschrauber,... wäre das auch besser. Wird das passieren? Warum wohl nicht?

Wird sich Unicode in absehbarer Zeit durchsetzen? Ich halte dagegen. ;-)
Gruß
ernohl

Benutzeravatar
spiffi
Beiträge: 1128
Registriert: 09.08.2003 19:02:27

Beitrag von spiffi » 21.01.2004 01:17:48

stefann1977 hat geschrieben:Ich glaube die Gnome-Entwickler machen im Prinzip alles richtig. UTF-8 ist besser. Vorraussetzung ist natürlich das alle Programme unter Linux das auch unterstützen.
Mag ja sein, daß UTF-8 besser ist. Aber wenn ich UTF-8 benutzen möchte, dann wähle ich ne UTF-8 Locale.
ernohl hat geschrieben:Unicode und deren umfassenden Umsetzung ist einerseits ein so ein kompliziertes Thema, dass es Jahrzehnte brauchen würde, um es umfassend allgemein einzuführen.
Ist das so!?
AFAIK läuft beispielsweise Red Hat 9 komplett unter UTF-8, und auch bei der Konkurenz aus dem Hause Microsoft werkelt (zumindest bei allen NT bsaierten Systemen) Unicode unter der Haube.
ernohl hat geschrieben:Andererseit ist der Nutzen äußerst minimal. Er wäre nur in einer Welt ohne Zeichensatzdeklaration notwendig. Haben wir diese? Nein!
Ähm, die Unmenge von Zeichensatzkodierungen sind gerade das Problem, das Unicode aus der Welt schaffen soll. Mit Unicode ist das Hin- und Herkonvertieren zwischen verschiedenen Encodings überflüssig.
ernohl hat geschrieben:Also überflüssig und dazu (weil unausgereift) potentiell und tatsächlich fehlerbehaftet.
Ja, genauso überflüssig und fehlerbehaftet, wie jede ander Zeichensatzkodierung auch.
ernohl hat geschrieben:Wird sich Unicode in absehbarer Zeit durchsetzen? Ich halte dagegen. ;-)
Und ich würde sagen, Unicode hat sich bereits durchgesetzt.

ernohl
Beiträge: 1186
Registriert: 04.07.2002 08:11:56
Wohnort: HL

Beitrag von ernohl » 21.01.2004 08:29:14

spiffi hat geschrieben: Ähm, die Unmenge von Zeichensatzkodierungen sind gerade das Problem, das Unicode aus der Welt schaffen soll. Mit Unicode ist das Hin- und Herkonvertieren zwischen verschiedenen Encodings überflüssig.
Hallo!?! Wie willst du das erreichen. Durch Umlegen eines Schalters, der von jetzt auf sofort alle *Systeme* auf UTF-8 umstellt oder durch eine allmähliche Einführung.
Ersteres ist unmöglich, für 2. müssen die Systeme beides (1-Byte.Zeichensätze und Unicode) perfekt beherrschen. Das ist ungleich schwieriger als reines UTF-8.

Und ganz wichtig: Wir reden hier nicht vom Umgang mit UTF-8-Dateien, sondern von UTF-8-Systemen (Kernel, Shell, Filesysteme, bla, bla,...)
spiffi hat geschrieben:
ernohl hat geschrieben:Also überflüssig und dazu (weil unausgereift) potentiell und tatsächlich fehlerbehaftet.
Ja, genauso überflüssig und fehlerbehaftet, wie jede ander Zeichensatzkodierung auch.
Ach ja? Warum gibt es sie denn? Weil du viel schlauer bist als all die Leute, die dies mal eingeführt haben, zusammen? Und dann schau dir mal an, wieso noch heute etliche Programme/Systeme sogar noch Probleme mit einem ISO-8859-ZS haben? Vielleicht weil es eine Menge Arbeit und Gehirnschmalz erforderte, brauchbar von ASCII auf ISO-8859 umzustellen. Und das waren beides 1-Byte-ZS. Die Gnome-Leute (als selbsternannte UTF-8-Profis) sind nicht mal in der Lage, vernünftig mit ISO-8859-Dateien (*Dateien!*) umzugehen. Aber wer braucht schon noch seine Altdaten? :wink:
spiffi hat geschrieben:
ernohl hat geschrieben:Wird sich Unicode in absehbarer Zeit durchsetzen? Ich halte dagegen. ;-)
Und ich würde sagen, Unicode hat sich bereits durchgesetzt.
Selten so gelacht. *ROFL*
Gruß
ernohl

Antworten