UTF-8

Das Original Benutzerinterface Neutrino-SD incl. zapit, sectionsd, yWeb etc...
Router-Fan
Erleuchteter
Erleuchteter
Beiträge: 521
Registriert: Dienstag 21. Mai 2002, 12:53

UTF-8

Beitrag von Router-Fan »

kann mir mal freundlicherweise einer erklären was UTF-8 bedeutet ?

jedesmal wenn ich im cvs log was von UTF-8 lese wird irgend ein Teil von Neutrino verstümmelt ....

heute musste Tuxmail dran glauben bzw. die benachrichtigung über das Popup Fenster bei neuen Mails
DieMade
Oberlamer, Administrator & Supernanny
Beiträge: 10532
Registriert: Samstag 13. Juli 2002, 10:49

Beitrag von DieMade »

Das hab ich mal auf die Schnelle in Google gefunden, HTH:

http://www.informatik.uni-augsburg.de/l ... olien3.pdf
There are 10 types of people in the world: those who know binary and those who don't
Router-Fan
Erleuchteter
Erleuchteter
Beiträge: 521
Registriert: Dienstag 21. Mai 2002, 12:53

Beitrag von Router-Fan »

Aha sehr interessant ! Hab das mal durchgelesen aber verstehe nicht so recht den Vorteil den man dadurch erhalten soll ?

Oder bedeutet das eine Schriftart aus Neutrino wegfällt und dafür dann im Unicode geschrieben wird ?
DieMade
Oberlamer, Administrator & Supernanny
Beiträge: 10532
Registriert: Samstag 13. Juli 2002, 10:49

Beitrag von DieMade »

Nicht Schriftart, sondern Zeichensatz ;)

Es geht hier "lediglich" um eine einheitliche und platformübergreifende Codierung.

Darauf müssen die einzelnen Applikationen/Plugins wohl noch angepasst werden (sonst würd's doch langweilig ;)).
Router-Fan
Erleuchteter
Erleuchteter
Beiträge: 521
Registriert: Dienstag 21. Mai 2002, 12:53

Beitrag von Router-Fan »

hmmm gut dann lass ich mich mal überraschen

auch wenn man ein popup per browser an die box schickt kann man keine sonderzeichen wie ÄäÜüÖö oder ß z.b. nehmen

alles was hinter so einem zeichen kommt wird ignoriert
thegoodguy
Erleuchteter
Erleuchteter
Beiträge: 465
Registriert: Mittwoch 14. August 2002, 20:45

Beitrag von thegoodguy »

@Router-Fan:
Umlaute gehen nach wie vor. Sie muessen halt codiert werden.
Versuch mal folgendes google Formular und schau dir dann die URL an. :wink:
http://www.google.com/search?q=%C3%A4%2 ... 8&oe=UTF-8

Unix-/Linux-Leute koennen mal mit iconv und uxterm rumspielen (und im locales thread gucken).

Viele Gruesse

P.S. Es geht auch ohne %, aber mit % ist eigentlich ueblich.
Router-Fan
Erleuchteter
Erleuchteter
Beiträge: 521
Registriert: Dienstag 21. Mai 2002, 12:53

Beitrag von Router-Fan »

Danke für die Erklärung :)

Bin selber ein Linuxianer :lol: nur mit dem coden haperts

Der Link geht einwandfrei man siehe und staune aber wo ist denn der Vorteil zum ascii format ? (war doch vorher so codiert ?)

Grüsse zurück von einem Neugierigen Coder Dau :)
thegoodguy
Erleuchteter
Erleuchteter
Beiträge: 465
Registriert: Mittwoch 14. August 2002, 20:45

Beitrag von thegoodguy »

Fuer Laien ausgedrueckt:

US-ASCII enhaelt keine deutschen Umlaute und besteht aus 7 bit, d.h. 128 Zeichen.

Latin-1 = ISO8859-1 enhaelt die deutschen Umlaute und kann mit 8 bit 256 Zeichen darstellen.
Aber es enthaelt nicht alle in Europa gaengigen Zeichen.

UTF-8 kann alle Zeichen darstellen und setzt sich immer mehr als Standard durch.
Homar
Senior Member
Beiträge: 1278
Registriert: Mittwoch 5. September 2001, 00:00

Beitrag von Homar »

goodguy...

die 450, ist das die Codepage ??

wenn ja, solltest du es doch lieber per settings übergeben, damit mann auch 857 und so einstellen kann.
Router-Fan
Erleuchteter
Erleuchteter
Beiträge: 521
Registriert: Dienstag 21. Mai 2002, 12:53

Beitrag von Router-Fan »

thegoodguy hat geschrieben:Fuer Laien ausgedrueckt:

US-ASCII enhaelt keine deutschen Umlaute und besteht aus 7 bit, d.h. 128 Zeichen.

Latin-1 = ISO8859-1 enhaelt die deutschen Umlaute und kann mit 8 bit 256 Zeichen darstellen.
Aber es enthaelt nicht alle in Europa gaengigen Zeichen.

UTF-8 kann alle Zeichen darstellen und setzt sich immer mehr als Standard durch.
Jetzt sind alle Klarheiten beseitigt :D

Many THX ! :)
thegoodguy
Erleuchteter
Erleuchteter
Beiträge: 465
Registriert: Mittwoch 14. August 2002, 20:45

Beitrag von thegoodguy »

@Homar:
vgl.: http://czyborra.com/charsets/codepages.html
Schreibst du fuer neutrino nen converter fuer die alten Codepages? Also es sind ja nur ein paar wenige: :wink:
ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/
alexW hat sicherlich Verstaendnis fuer den zusaetzlichen Platzbedarf im Flash. *duck*

Also jetzt im Ernst: URL/URIs sind imho eigentlich nur fuer US-ASCII standardisiert, wobei aber es Vorschlaege fuer IRIs gibt, und da scheint UTF-8 Standard zu werden.

P.S. gconv kann eigentlich schon einige konversionen handeln. Ansonsten muss dies halt im nhttpd geflickt werden bzw. die Auswahlmoeglichkeiten geschaffen werden.
Neben settings gaebe es natuerlich auch die Moeglichkeit die gewuenschte Encodinginterpretation als zusaetzliche Option einzubauen (vgl. google-link).
Da wird sicher doch sicherlich jemand der das Feature will, dafuer finden, oder?
thegoodguy
Erleuchteter
Erleuchteter
Beiträge: 465
Registriert: Mittwoch 14. August 2002, 20:45

Beitrag von thegoodguy »

@Konqueror-Benutzer:

Settings -> Web Shortcuts -> Add:

Search Provider Name: DBox Popup
Search URI: http://dbox/control/message?popup=\{@}
URI shortcut: dbox
Charset: UTF-8

-> Ok

Dann in Location Bar:
dbox: Hello ä ö ü Ä Ã– Ü ß World
Router-Fan
Erleuchteter
Erleuchteter
Beiträge: 521
Registriert: Dienstag 21. Mai 2002, 12:53

Beitrag von Router-Fan »

thegoodguy hat geschrieben:@Konqueror-Benutzer:

Settings -> Web Shortcuts -> Add:

Search Provider Name: DBox Popup
Search URI: http://dbox/control/message?popup=\{@}
URI shortcut: dbox
Charset: UTF-8

-> Ok

Dann in Location Bar:
dbox: Hello ä ö ü Ä Ã– Ü ß World
Das versteh ich widerum überhaupt nicht

muss ich nachher mal mit linux probieren