BOM entfernen ()

Habe mir wieder mal fast die Haare ausgerauft: Auf jeder Seite kam ganz am Anfang oben rechts immer wieder die Zeichen „“.

Scheinbar handelt es sich um ein sogenanntes „BOM“

Bei http://toscho.de bin ich auf die Erklärung gestossen, was ein sog. „BOM“ ist und wie man die loswird.
Als Hex-Editor für Ubuntu habe ich mir „jeex“ installiert.

Zitate von der Webseite

„Wie wir wissen, ist UTF-8 die Zeichenkodierung im Internet. Viele Editoren speichern Dokumente in UTF-8 aber mit einem BOM (Byte Order Mark), was zu erheblichen Problemen führen kann, wenn wir die Datei etwa per PHP in eine andere einbinden.

Finden

Ob eine Datei überhaupt ein BOM hat, kann man festellen, indem man sie sich mit einem Hex-Editor ansieht. Ein BOM sieht darin so aus: EFBBEF. Das können wir hier gleich löschen – und den Rest dieses Artikels überspringen. Manche Editoren versauen dann aber die komplette Datei (PSPad beispielsweise), deshalb seien hier noch andere Wege genannt.

Wer sich zum Betrachten keine zusätzliche Software installieren möchte, kann die Datei auch einfach im Browser öffnen und die Zeichenkodierung der Ausgabe manuell auf ISO-8859-1 festsetzen. Steht ganz oben , haben wir ein BOM erwischt.

Online: UTF-8 BOM tester.

Entfernen

Gut, wir haben das BOM entdeckt – jetzt müssen wird es irgendwie loswerden.

Linux und Mac OS X

Hier ist es ganz einfach: Wir öffnen die Datei in Vim, geben :set nobomb ein und speichern sie. Fertig.

Windows

Mit Bordmitteln werden wir das BOM – soweit ich weiß – nicht los. Spätestens jetzt müssen wir einen zusätzlichen Editor benutzen, beispielsweise Notepad++: Öffnen, unter Format »UTF-8 ohne BOM« einstellen, speichern, fertig.
Für dieses Programm gibt es auch ein Hex-Editor-Plugin; damit können wir gleich prüfen, ob es geklappt hat.

Ein Tip von Andreas Borutta: Christoph Schneegans bietet ein VB-Script zum Entfernen des BOMs an. Auf der Seite ganz unten die Datei delete-utf8-bom.vbs herunterladen, auf dem Desktop ablegen und die »bomifizierte« Datei mit der Maus draufziehen – fertig.
Oder hier zum Download.


In jedem brauchbaren Editor kann man einstellen, daß alle Dateien oder nur bestimmte Dateitypen als UTF-8 ohne BOM gespeichert werden. Wenn dein Editor das nicht anbietet, dann wirf ihn weg.“