meta.txt, UTF-8 und das BOM

von Peter Müller

UTF-8 ist die Zukunft des Internet, zumindest was Zeichensätze angeht, aber wenn Sie Ihre Dateien mit dem Zeichensatz UTF-8 abspeichern, achten Sie darauf, dass Sie die Geschmacksrichtung "ohne BOM" auswählen. Das Ding macht nur Ärger: 

Das BOM (kurz für »Byte Order Mark«) besteht aus drei Byte, die ganz am Anfang des Dokuments stehen. Da das BOM unter UTF-8 optional ist und es bei der Ausgabe im Browser unter ungünstigen Umständen als wirre Zeichenfolge () am Anfang der Webseite erscheint, sollten die Dateien möglichst ohne BOM gespeichert werden. (aus Little Boxes Teil 2, Seite 26) 

Im aktuellen Fall hatte ein Leser Probleme mit der im Contaobuch auf Seite 258 beschriebenen meta.txt, mit der man unter anderem Bildergalerien beschriften kann. Immer der erste Datensatz wurde auf der Webseite nicht angezeigt.

Ein kurzer Test hat meine Vermutung bestätigt: Wird die meta.txt mit BOM abgespeichert, erscheint der erste Eintrag nicht auf der Webseite. 

Falls in Ihrem Editor beim Speichern nichts von wegen "BOM" auftaucht, schauen Sie mal in den Optionen Ihres Editors. Manchmal ist das gut versteckt. Im PSPad muss im Menü Einstellungen unter Programm einstellen... in der Kategorie Programm-Verhalten die Option Ident. Bytes bei UTF-8 hinzufügen ausgestellt sein. 

Unter Mac OS X ist die Standardeinstellung "UTF-8 ohne BOM". Ein Editor wie Smultron speichert also bei der Option UTF-8 automatisch ohne das BOM. 

UPDATE (11.082011)

Im Contao-Wiki gibt es einen ausführlichen Beitrag zum Thema UTF-8 ohne BOM, mit Beschreibung eines Programms, das die Contao-Dateien automatisch auf ein eventuell vorhandenes BOM überprüft. 

Zurück

Einen Kommentar schreiben

Kommentar von Darko |

Many thanks for advice. I have encountered a problem with meta.txt, and I didn't realize that it is because of BOM. I have resolved the problem and learned something new. ;)