[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Unicode: Nicht-lateinische Schriften, Diakritika



Liebe Kolleginnen und Kollegen,
Herr Meyer wies auf die "Text Encoding Initiative" hin. Zum vorgesehenen
Zeichensatz fuer XML Dokumente sei noch einmal auf:
http://www.tei-c.org/P4X/CH.html
hingewiesen:
"The character encoding (i.e. the representation used for its encoded
characters) applicable to an XML document is stated in its encoding
declaration (2.10.1 SGML and XML declarations) and is UTF8 or UTF16 by
default. These Guidelines do not recommend usage of other character
encodings for XML documents. The encoding applicable to an SGML document is
defined (along with other matters) in the SGML declaration prefixed to it
and is almost entirely arbitrary."

In meinem Beitrag von letzter Woche wollte ich ja genau auf diesen
Unterschied hinweisen. 
Bibliothekarische Datenbanken sind ja nicht Texte im eigentlichen Sinne,
sondern Daten *zu* Texten, Medien oder Daten, um die Texte, Medien oder
Daten zu erreichen. Hierbei - so stellt es sich zumindest fuer den
ostasiatischen Raum dar - bietet die Reduzierung bzw. Limitierung der zur
Verfuegung stehenden Zeichen eine entscheidende Hilfe beim Auffinden der
Texte, Medien oder Daten. Das fuer Texte selbst ISO 10646 durchaus zu
begruessen ist, sollte unbestritten sein. Nur wenn ich den Text, die Daten
bereits vor mir (z.B. auf dem Bildschirm oder Datei) liegen habe, brauche
ich denselben ja nicht mehr zu finden; z.B. in einer bibliothekarischen
Datenbank.

Mit freundlichen Gruessen

Matthias Kaun
Staatsbibliothek zu Berlin - PK
Ostasienabteilung


 




Listeninformationen unter http://www.inetbib.de.