Testing auf UTF8, wie macht man es richtig?

Warum Debian und/oder eine seiner Spielarten? Was muss ich vorher wissen? Wo geht es nach der Installation weiter?
klak
Beiträge: 491
Registriert: 31.01.2003 19:18:45

Testing auf UTF8, wie macht man es richtig?

Beitrag von klak » 11.06.2007 21:10:59

Hallo *,

wie stelle ich mein Testing auf UTF8 um?
Ich habe den utf8 Wizard eingesetzt, aber bei root sieht es noch immer wie folgt aus:

Code: Alles auswählen

ak-2c1660:~# locale
LANG=de_DE@euro
LANGUAGE=de_DE.utf8
LC_CTYPE="de_DE@euro"
LC_NUMERIC="de_DE@euro"
LC_TIME="de_DE@euro"
LC_COLLATE="de_DE@euro"
LC_MONETARY="de_DE@euro"
LC_MESSAGES="de_DE@euro"
LC_PAPER="de_DE@euro"
LC_NAME="de_DE@euro"
LC_ADDRESS="de_DE@euro"
LC_TELEPHONE="de_DE@euro"
LC_MEASUREMENT="de_DE@euro"
LC_IDENTIFICATION="de_DE@euro"
LC_ALL=
Dank und Gruss
klak

Benutzeravatar
utkin
Beiträge: 1157
Registriert: 23.08.2005 22:42:22
Lizenz eigener Beiträge: GNU Free Documentation License
Wohnort: Erfurt

Beitrag von utkin » 11.06.2007 21:19:37

Code: Alles auswählen

dpkg-reconfigure locales

Gruß, utkin
Debian GNU/Linux SID

klak
Beiträge: 491
Registriert: 31.01.2003 19:18:45

Beitrag von klak » 11.06.2007 22:12:41

Ja, habe ich gemacht.

Aber für root hatte sich nichts geändert, ich habe jetzt die .bashrc manuell geändert.

klak

Aiellu
Beiträge: 270
Registriert: 11.05.2007 21:06:25
Lizenz eigener Beiträge: MIT Lizenz

Beitrag von Aiellu » 12.06.2007 16:05:01

eine frage hätte ich mal dazu:

wo liegt der sinn in einer umstellung auf utf-8, ausser dass es dann schön international wäre? - wenns denn international sein soll. wie funktioniert das dann mit den de_umlauten welche ja in utf-8 nicht drin sind?

mich nervt ja auch das mit diesem besch* deutschen zeichensatz und umlaut-gedöns und dann auch noch diese total unpraktikable tastaturbelegen und ... also von mir aus könnt die ganze welt auf utf-8 gehen, und alles andere gehört eigentlich... aber egal...

kann man mit einem utf-8 zeichensatz noch diese $%*piep* umlaute darstellen? mich würde die umstellung auch reizen jedoch frag ich mich wo dann die umlaute bleiben, und was mit den webseiten passiert die ja allesamt in iso-8859-1 geschrieben sind?

:roll:

Benutzeravatar
Meillo
Moderator
Beiträge: 8819
Registriert: 21.06.2005 14:55:06
Wohnort: Balmora
Kontaktdaten:

Beitrag von Meillo » 12.06.2007 16:29:05

Aiellu hat geschrieben:wie funktioniert das dann mit den de_umlauten welche ja in utf-8 nicht drin sind?
alles ist in UTF8 drin ... selbst Sprache die's gar nicht gibt ;-)

kann man mit einem utf-8 zeichensatz noch diese $%*piep* umlaute darstellen? mich würde die umstellung auch reizen jedoch frag ich mich wo dann die umlaute bleiben, und was mit den webseiten passiert die ja allesamt in iso-8859-1 geschrieben sind?
tja das ist halt irgendwie die Scheiße dabei: wenn nicht alle Rechner und alle Dateien gleich sind.

... aber scheinbar gibt's da keine _gute_ Lösung/Anleitung für die Umstellung.
Fakt ist halt, dass `dpkg-reconfigure locales' nur neue Umlautprobleme geschaffen hat :-(
Use ed once in a while!

jhr-online
Beiträge: 2186
Registriert: 18.09.2005 15:52:02
Lizenz eigener Beiträge: GNU Free Documentation License
Kontaktdaten:

Beitrag von jhr-online » 12.06.2007 18:54:55

Aiellu hat geschrieben:eine frage hätte ich mal dazu:
In Wirklichkeit sind es aber zwei - oder sogar mehr? :P
Aiellu hat geschrieben:wo liegt der sinn in einer umstellung auf utf-8, ausser dass es dann schön international wäre? - wenns denn international sein soll. wie funktioniert das dann mit den de_umlauten welche ja in utf-8 nicht drin sind?
"Alles drin und klappt wunderbar", sagt einer, der UTF-8 benutzt.
Aiellu hat geschrieben:mich nervt ja auch das mit diesem besch* deutschen zeichensatz und umlaut-gedöns und dann auch noch diese total unpraktikable tastaturbelegen und ... also von mir aus könnt die ganze welt auf utf-8 gehen, und alles andere gehört eigentlich... aber egal...
Nee nee, das ist schon gut so mit den verschiedenen Sprachen. UTF-8 sollte trotzdem die ganze Welt benutzen, ja.
Aiellu hat geschrieben:kann man mit einem utf-8 zeichensatz noch diese $%*piep* umlaute darstellen? mich würde die umstellung auch reizen jedoch frag ich mich wo dann die umlaute bleiben, und was mit den webseiten passiert die ja allesamt in iso-8859-1 geschrieben sind?
Ich kann so ziemlich alles darstellen und vermisse nichts. Ein vernünftiger Texteditor (ich nutze vim) erkennt eine andere Kodierung und konvertiert sie passend für den Display hin und beim speichern wieder zurück. Bei Webseiten gehört es sich, im Header anzugeben, welche Kodierung man verwendet. Dann macht dein Browser das auch alles richtig. Oder was glaubst du, wie du bisher die vielen UTF-8-Seiten problemlos darstellen konntest? ;)

jhr
Desktop: Intel Core2Quad Q8300 2.5GHz, 256GB SSD + 1 TB HDD, 8 GB RAM, Debian Sid, Kernel 3.13

123456
Beiträge: 6126
Registriert: 08.03.2003 14:07:24

Beitrag von 123456 » 12.06.2007 19:18:31

jhr-online hat geschrieben:Alles drin und klappt wunderbar", sagt einer, der UTF-8 benutzt.
Wieviel Zeit hat Dich das denn gekostet? fragt einer, der kein UTF-8 benutzt.

Aiellu
Beiträge: 270
Registriert: 11.05.2007 21:06:25
Lizenz eigener Beiträge: MIT Lizenz

Beitrag von Aiellu » 12.06.2007 20:25:49

ja gut ich gebs zu, es waren insgesamt 4 fragen. :P

schon ein kurzes querlesen bei google ergab dass utf-8 ganz klar vorteile hat, vor allem für mich als webdesigner ist hochinteressant dass ich bei utf-8 die umlaute garnicht erst maskieren mü(ü)sste. :wink:

ich glaub ich mach mich auch mal dran die webseiten auf utf-8 umzustricken.

mir ist auch schon öfters auf gefallen dass ich immer häufiger mit meinem eigenen browser probleme kriege weil der sich immer wieder von iso-8859-1 nach utf-8 umstellt.

fragt sich nur wie aufwendig die umstellung des systems wird. ma' guckn'...

jhr-online
Beiträge: 2186
Registriert: 18.09.2005 15:52:02
Lizenz eigener Beiträge: GNU Free Documentation License
Kontaktdaten:

Beitrag von jhr-online » 12.06.2007 21:29:18

ub13 hat geschrieben:
jhr-online hat geschrieben:Alles drin und klappt wunderbar", sagt einer, der UTF-8 benutzt.
Wieviel Zeit hat Dich das denn gekostet? fragt einer, der kein UTF-8 benutzt.
Das

Code: Alles auswählen

dpkg-reconfigure locales
macht eigentlich schon alles. Man muss lediglich aufpassen, dass man nicht in diversen Dateien, die die Umgebung beim Login laden, irgendetwas anderes versuchen (bashrc, Xressource und wie die alle heißen...). Das dauert zugegebenermaßen, wenn man sich den Rummel raussuchen muss.

jhr
Desktop: Intel Core2Quad Q8300 2.5GHz, 256GB SSD + 1 TB HDD, 8 GB RAM, Debian Sid, Kernel 3.13

Benutzeravatar
Meillo
Moderator
Beiträge: 8819
Registriert: 21.06.2005 14:55:06
Wohnort: Balmora
Kontaktdaten:

Beitrag von Meillo » 12.06.2007 23:14:18

jhr-online hat geschrieben:Das

Code: Alles auswählen

dpkg-reconfigure locales
macht eigentlich schon alles. Man muss lediglich aufpassen, dass man nicht in diversen Dateien, die die Umgebung beim Login laden, irgendetwas anderes versuchen (bashrc, Xressource und wie die alle heißen...). Das dauert zugegebenermaßen, wenn man sich den Rummel raussuchen muss.
mein fetchmail/procmail speichert mir aber immer noch ISO8859 ab :-/
Use ed once in a while!

Aiellu
Beiträge: 270
Registriert: 11.05.2007 21:06:25
Lizenz eigener Beiträge: MIT Lizenz

Flucht aus Babel...

Beitrag von Aiellu » 13.06.2007 08:16:26

hatte nun testweise per "dpkg-reconfigure locales" alles mal umgestellt auf de_utf-8 aber was anschliessend kam war eine reihe von fehlermeldungen von der sorte "dies und das nicht gefunden" sowie ein englischsprachiges linux und in diverser deutschsprachiger software wie z.b. auch im iceweasel ein zeichenkauderwelsch in den menüs. und ein "locale" in der console teilt mir mit dass immer noch alles auf "de_DE@euro" eingestellt ist...

hm?

eine googlen nach "umstellung auf utf-8" brachte dann hervor dass die umstellung durchaus mit problemen verbunden ist da manche deutschsprachige software einfach auf den latin-1 zeichensatz beharrt, da hilft also entweder nur das konsequente meiden alles deutschsprachigen oder gleich auswandern in ein utf8-land. :lol:

jedenfalls der gedanke kam mir dann so... :roll:

wie läuft es denn bei euch mit der umstellung? was ausser "dpkg-reconfigure locales" gibt es noch zu tun und wie kann ich bei der umstellung das deutschsprachige linux erhalten?

ich hab nun erstmal damit wieder alles funktioniert bis zum nächsten versuch in "dpkg-reconfigure locales" die unterstützung von de_DE@utf-8, de_DE@de und de_DE@euro eingestellt. und als hauptsystem de_DE@euro, was also vorher auch schon eingestellt war.

Benutzeravatar
Meillo
Moderator
Beiträge: 8819
Registriert: 21.06.2005 14:55:06
Wohnort: Balmora
Kontaktdaten:

Re: Flucht aus Babel...

Beitrag von Meillo » 13.06.2007 14:01:48

Aiellu hat geschrieben:hatte nun testweise per "dpkg-reconfigure locales" alles mal umgestellt auf de_utf-8 aber was anschliessend kam war eine reihe von fehlermeldungen von der sorte "dies und das nicht gefunden" sowie ein englischsprachiges linux und in diverser deutschsprachiger software wie z.b. auch im iceweasel ein zeichenkauderwelsch in den menüs. und ein "locale" in der console teilt mir mit dass immer noch alles auf "de_DE@euro" eingestellt ist...

hm?

wie läuft es denn bei euch mit der umstellung? was ausser "dpkg-reconfigure locales" gibt es noch zu tun und wie kann ich bei der umstellung das deutschsprachige linux erhalten?

ich hab nun erstmal damit wieder alles funktioniert bis zum nächsten versuch in "dpkg-reconfigure locales" die unterstützung von de_DE@utf-8, de_DE@de und de_DE@euro eingestellt. und als hauptsystem de_DE@euro, was also vorher auch schon eingestellt war.
so in der Art ging's/geht's mir auch: siehe http://www.debianforum.de/forum/viewtopic.php?t=84734 (letzter Post)


eine googlen nach "umstellung auf utf-8" brachte dann hervor dass die umstellung durchaus mit problemen verbunden ist [...] :roll:
... wenn du dein Etch neu installierst, dann hast du ein schönes UTF8-System ... per dist-upgrade scheint das aber wohl nicht zu gehen.

Also, ich bin davon überzeugt, dass es gehen muss/müsste/sollte ... aber entweder interessiert sich niemand dafür, oder ...
Jedenfalls findet Google keine Lösungen
Use ed once in a while!

Aiellu
Beiträge: 270
Registriert: 11.05.2007 21:06:25
Lizenz eigener Beiträge: MIT Lizenz

Re: Flucht aus Babel...

Beitrag von Aiellu » 13.06.2007 14:29:48

Meillo hat geschrieben:wenn du dein Etch neu installierst, dann hast du ein schönes UTF8-System ... per dist-upgrade scheint das aber wohl nicht zu gehen.
ich hatte sogar mal (eher aus flüchtigkeit) einmal linux mit utf8 installiert, weil ich mal eine installations ziemlich schnell und flüchtig abgenickt und einfach alles per default installiert hatte.

das ist also auch mein verdacht dass ein nachträgliches umstellen problematischer ist als ein reines utf8. ich frage mich jedoch auch wie "rein" es sein muss. ein radikales runterschmeissen von allem bis auf die x-window-system-core, dann per "dpkg-reconfigure locales" umstellen und alles wieder drauf wäre wohl sinnfrei, oder? ist latin1 eigentlich auch im kernel drin dass ein nachträgliches ändern deshalb so schwierig ist? ich vermute dass das ganze latin1 aus den ganzen settings rauszustricken und dann utf8 reinstricken, wäre von aufwand wohl ungefähr so wie eine neuinstallation, welche zum glück bei fluxbox echt mal so nebenbei geht. falls hier keiner eine andere lösung hat überleg ich mir das echt mal ob ich nicht nochmal neu installiere. wegen meiner ständigen neuinstalliererei und rumspielerei kann ich debian ja bald schon im schlaf installieren. und noch son lob nebenbei: bei debian lern ich an einem tag mehr als bei suse die ganzen jahre die ich dabei war, hab ich wohl voll was falsch gemacht damals. echt war! und dabei hatte ich schon damals als ich zu suse kam bereut dass ich davor schon so viele jahre mit ms-dos und windows verschwendet habe. nunja, mit dem alter kommt die weissheit. :P

€dit:
mir ist gerade noch eine idee eingefallen, und meine frage an euch: ist das machbar?
-> also, wie wäre das wenn ich per "dpkg-reconfigure locales" alles umstelle auf utf-8 und anschliessend per aptitude ein reinstall sämtlicher pakete mache? habe ich dann eine "saubere" utf-8 installation? weil er ja dann sämtliche pakete auf der basis von utf-8 nochmal zieht, installiert und konfiguriert. wäre das möglich? und wie lautet der befehl für aptitude?

irgendwas mit "aptitude reinstall all" oder so??? ich hab jedenfalls mal irgend wo gelesen dass man aptitude dazu bewegen kann sämtliche installierten pakete per "reinstall" nochmal downzuloaden, zu installieren und zu konfigurieren wie bei einer erstinstallation.

Benutzeravatar
Meillo
Moderator
Beiträge: 8819
Registriert: 21.06.2005 14:55:06
Wohnort: Balmora
Kontaktdaten:

Re: Flucht aus Babel...

Beitrag von Meillo » 13.06.2007 16:24:03

Aiellu hat geschrieben:also, wie wäre das wenn ich per "dpkg-reconfigure locales" alles umstelle auf utf-8 und anschliessend per aptitude ein reinstall sämtlicher pakete mache? habe ich dann eine "saubere" utf-8 installation? weil er ja dann sämtliche pakete auf der basis von utf-8 nochmal zieht, installiert und konfiguriert. wäre das möglich?
Ist es denn so, dass die Programme neu installiert werden müssen? (Frage an alle)
Die sind doch sowieso schon fertig kompiled, wenn man sie installiert, somit müsste eine Neuinstallation doch nicht nötig sein ... die Files werden doch nur auf die Platte kopiert.

Die Programme sollten doch eigentlich nur bei jeder Art von Text-Output schauen in welcher Codierung dies geschehen soll. (Stimmt das?)
Use ed once in a while!

artemis
Beiträge: 447
Registriert: 21.12.2005 23:11:11

Beitrag von artemis » 13.06.2007 16:31:54

Hallo...
Also, ich kann auch nur sagen, dass bei mir alles gut gegangen ist. Habe schon "früh" umgestellt, als Etch noch Testing war (also auch ohne neuinstallation). Einfach, wie oben beschrieben, ein

Code: Alles auswählen

dpkg-reconfigure locales
und nur noch de_DE.UTF-8 installiert.
Am Anfang gab es mal Probleme, besonders auf der Konsole und mit ein paar alten Programmen, die noch nicht umgestellt waren (Midnight Commander), aber jetzt läuft alles ohne Fehler.
Achso, ich musste meinen Home Ordner mal durchschauen, weil die Dateinamen mit Umlauten nicht mehr richtig angezeigt wurden, aber sonst...
Also, ich wüsste nicht, warum man alle Programme neu installieren sollte.

MfG,
artemis

PS: Mittlerweile bin ich bei SID, und es läuft immer noch gut mit utf8

Aiellu
Beiträge: 270
Registriert: 11.05.2007 21:06:25
Lizenz eigener Beiträge: MIT Lizenz

Beitrag von Aiellu » 13.06.2007 18:25:26

also ich hab nun auf utf-8 "umgestellt" (=neu installiert) und läuft alles wunderbar. :D

umlaute in dateinamen hab ich eh nie, ist noch so eine angewohnheit aus dos-zeiten, daher sollte es auch keine probleme geben mit dem bestehenden datenpool.

man kann es jedoch bestimmt auch ohne neuinstallation umstellen, aber neuinstallation ist bestimmt gründlicher.

Benutzeravatar
Meillo
Moderator
Beiträge: 8819
Registriert: 21.06.2005 14:55:06
Wohnort: Balmora
Kontaktdaten:

Beitrag von Meillo » 13.06.2007 23:08:12

Aiellu hat geschrieben:man kann es jedoch bestimmt auch ohne neuinstallation umstellen, aber neuinstallation ist bestimmt gründlicher.
... UNIXe sind doch gerade deshalb toll, weil man nie neu installieren muss ;-)


Ich war heute abend erfolgreich mit meiner Umstellung _ohne Neuinstallation_ :-D

Anleitung (für's Wiki) kommt morgen ...
Use ed once in a while!

123456
Beiträge: 6126
Registriert: 08.03.2003 14:07:24

Beitrag von 123456 » 13.06.2007 23:11:26

Meillo hat geschrieben:Anleitung (für's Wiki) kommt morgen ...
Prima, da bin ich mal gespannt. Ich frage mich immer noch, warum ich eigentlich umstellen soll. Tut alles, wie es soll...

Aiellu
Beiträge: 270
Registriert: 11.05.2007 21:06:25
Lizenz eigener Beiträge: MIT Lizenz

Beitrag von Aiellu » 13.06.2007 23:30:59

als webdesigner ist jedenfalls schon mal ein riesenvorteil dass keine maskierung der umlaute mehr erforderlich ist. und da ich gerne alles einheitlich mag ist mir lieber dass das ganze system auf utf-8 läuft. :P

hier kann man auch noch vorteile nachlesen:

http://www.6b.com/journal/plaedoyer-fuer-utf-8/

Benutzeravatar
neuss
Beiträge: 2165
Registriert: 06.11.2004 17:56:02
Lizenz eigener Beiträge: MIT Lizenz

Beitrag von neuss » 14.06.2007 00:03:58

ub13 hat geschrieben:Ich frage mich immer noch, warum ich eigentlich umstellen soll. Tut alles, wie es soll...
Ich bin ja auch oft recht konservativ bei Umstellungen und habe mich demzufolge lange (zu lange) gesträubt auf UTF-8 zu wechseln.
Es jedoch richtig wichtig, einen Standard zu haben, der mehr abdeckt als 7/8 Bit ASCII. Dafür ist UTF-8 erstmal der logische Weg. Die Zeichensatzproblematik könnte damit ein Relikt der Vergangenheit sein.

gruss neuss
stell dir vor, es geht, und keiner kriegt es hin.

Benutzeravatar
Meillo
Moderator
Beiträge: 8819
Registriert: 21.06.2005 14:55:06
Wohnort: Balmora
Kontaktdaten:

Beitrag von Meillo » 14.06.2007 12:13:33

ub13 hat geschrieben:
Meillo hat geschrieben:Anleitung (für's Wiki) kommt morgen ...
Prima, da bin ich mal gespannt.
Fertig!

Sarge auf UTF8 umstellen
Use ed once in a while!

Aiellu
Beiträge: 270
Registriert: 11.05.2007 21:06:25
Lizenz eigener Beiträge: MIT Lizenz

Beitrag von Aiellu » 14.06.2007 13:16:15

und gleich die erste frage von mir: (weitere fragen dann später wenn ich den ganzen artikel gelesen habe) :D

was bedeutet: "..., aber YMMV"?

123456
Beiträge: 6126
Registriert: 08.03.2003 14:07:24

Beitrag von 123456 » 14.06.2007 13:21:21

Aiellu hat geschrieben:was bedeutet: "..., aber YMMV"?

Code: Alles auswählen

dict YMMV
;)

Benutzeravatar
Meillo
Moderator
Beiträge: 8819
Registriert: 21.06.2005 14:55:06
Wohnort: Balmora
Kontaktdaten:

Beitrag von Meillo » 14.06.2007 13:22:53

Aiellu hat geschrieben:was bedeutet: "..., aber YMMV"?
Das steht für "Your Mileage May Vary" (oder "Your Machine May Vary") ... was soviel heißt wie:
Die Ergebnisse könnten bei dir anders ausfallen.

siehe auch: http://www.google.de/search?q=ymmv
Use ed once in a while!

123456
Beiträge: 6126
Registriert: 08.03.2003 14:07:24

Beitrag von 123456 » 14.06.2007 13:29:00

Meillo hat geschrieben:Fertig!

Sarge auf UTF8 umstellen
Schön. Punkt 7 macht mir aber weiter Kopfschmerzen...Ich habe mal vor vielen Monaten versucht umzustellen. An Kleinigkeiten und meiner Ungeduld bin ich dann gescheitert. Nicht vergessen sollte man auch die (noch) geringere Verbreitung von UTF-8. Wenn man es also selbst benutzt und ein kommunikatives Gegenüber nicht, kann es sein, das bei Demjenigen Zeichen nicht korrekt dargestellt werden.

Antworten