Gestern ist mir aufgefallen, dass ich mit dem Blog ein hässliches Problem bei der Anzeige in Google habe – immer, sobald ein oder mehrere Umlaute im Titel verwendet werden.
Aufgefallen ist es mir schon einmal vor ein paar Wochen, als ein “ß” nicht richtig dargestellt wurde. Damals habe ich es als ein temporäres Problem abgetan, gestern musste ich allerdings feststellen, dass seit ca. zwei Monaten alle Beiträge mit Umlauten im Titel falsch dargestellt werden. Nach eifrigem Suchen, intern als auch im Web, sowie unzähligen Kraftausdrücken habe ich den Fehler gefunden und behoben!
Den Beweis konnte ich mir heute selber geben, mit einem aktuellen Beitrag:
Die Lösung:
Zu 99% handelt es sich bei diesen Fehlern um eine falsche Codierung, einen falschen Zeichensatz. Dies war mir soweit auch schon alles bekannt, mein Blog ist auch auf UTF-8 eingestellt:
Die Datenbank als solche (kann man z.B. mit phpMyAdmin überprüfen) ist bei mir ebenfalls korrekt eingestellt. Da ich von Anfang an UTF-8 verwende, schied bei mir ein üblicher Fehler aus:
Man stellt den Zeichensatz im Blog um, die Datenbank-Einträge verbleiben aber beim alten.
Mein Header (header.php) sendet auch die korrekte Codierung an den Browser:
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
Achtung: Diese Einstellung kann gegenfalls (selten) vom Apache-Webserver überschrieben werden! Falls der Header etwas anderes ausgibt, als man in der jeweiligen Datei hinterlegt hat, am besten einmal die Konfigurations-Datei des Apache (httpd.conf) überprüfen, dort den Eintrag “AddType” suchen und ggf. korrigieren.
Dies war allerdings auch kein Problem, das bei mir zu traf.
Auf die Lösung stieß ich erst, als ich eine Blog-URL durch den W3C-Validator jagen wollte. Dieser verweigerte seine Arbeit mit dem Hinweis, dass in meinem Quelltext etwas vorkommt, was es laut UTF-8 Zeichensatz-Beschreibung gar nicht geben darf!
In meinem Fall handelte es sich hierbei um ein“-Zeichen, dass sich in meiner single.php und comments.php falsch eingeschlichen hatte.
(Anstelle des normalen Anführungszeichens ” hatte sich in die php-Dateien die “kursive Form” eingeschlichen, keine Ahnung wie man das nennt – wie ein doppeltes Apostroph´´ ?!)
Schnell korrigiert und auf einmal klappte es auch mit dem W3C-Test – und auch wieder mit Google, wie ich aufatmend heute zur Kenntnis nehmen konnte!
Ich nehme an, dass der Google-Bot erkannt hat, dass die Seite nicht UTF8-Konform ausgeliefert wird und daraufhin einen anderen Zeichensatz probiert hat – mit diesem gibt es dann natürlich Probleme bei der Darstellung von Umlauten.
Ein Beispiel für kleine Änderung – große Auswirkung :-)
PS: Wir deutschsprachigen Wordpress-Blogger sind mit unseren Umlauten sowieso gestraft – z.B. bei der Erstellung bzw. Darstellung der Permalinks für die Artikel. Quasi Pflicht für deutsche Blogs ist damit ein Umlaute-Plugin. Bekannt ist hier vor allem das o42-CleanUmlauts-Plugin. Hier verwende ich eine verbesserte, fehlerbereinigte Version: WP-CleanUnlauts
Eins von beiden findet sich hoffentlich auch bei euch im Einsatz?
![[GREGEL DOT COM]](http://static.gregel.com/themes/mg/images/header1.jpg)




Das ist ja wirklich lästig mit einem solchen kleinen Fehler. Aber der W3C Validator zeigt es ja an, dass da was nicht stimmt. Noch ein Grund die ein oder andere Seite hin und wieder dort durchzujagen ;-)
Für die Umlaute habe ich bis dato kein Plugin genutzt, sondern mich mit allen Blogs daran gewöhnt, da manuell vor dem Veröffentlichen dran zu arbeiten.
Ich hatte mir schon ganz wüste Theorien zusammengebastelt, wo der Fehler entstehen könnte…
Den Validator werde ich nun auf jeden Fall öters besuchen :-) Bei der Gelegenheit gestern habe ich direkt ein paar Kleinigkeiten in meinem html-Code ausgebessert – das muss ich jetzt wohl auch noch ein paar Plugins in meinen Sidebars beibringen. Seufz.
Fehlersuche ist immer etwas bescheiden. Aber mir hat da der Validator auch schon oft weiter geholfen. Auf das falsche ” wärste sonst nie im Leben gekommen ;-)
Nicht valide Plugins sind echt ein graus. Aber noch schlimmer ist das mit manchen kostenlosen Themes, da tauchen gleich ein paar hundert Fehler auf…
Mittlerweile kommen auch viele W3C “Fehler” von Haus aus, glaube ich. Mit der Version 2.7 hat das Wordpress-Team soweit ich weiss validen Code zugunsten von Barrierefreiheit aufgegeben.
Die Tage werde ich mich aber nochmal hinsetzen und so viel wie möglich korrigieren :-)
Das Korrigieren von W3C Fehlern ist nie schlecht. Ich mache das gerade am Anfang immer, und da sich ja auch öfter mal was ändert, ist es nie schlecht hin und wieder dort rein zu kucken. Wirkliche Auswirkungen hat ein valides Theme aber kaum. Ist aber einfach schöner und manche Fehler können durchaus auch dazu führen, dass Bots abbrechen und wieder gehen).
Vermutlich ist aber die Kompatibilität mit alten und/oder exotischen Browsern höher, wenn man so wenig “Fehler” wie möglich beim W3C-Test hat… oder?
Ich glaube schon, dass die Kompatibilität da höher ist. Sagen wir mal so: “Ein W3C konformes Layout schadet auf keinen Fall”. Über den Nutzen lässt sich wahrscheinlich streiten. Ich hatte in meinem Shop z.B. vor längerem haufenweise Fehler. Nach der Bereinigung konnte ich aber nicht auf ein besseres Ranking blicken.
Ich würde „“ als typografische Anführungszeichen bezeichnen – WordPress wandelt in Beiträgen ja die normalen " automatisch um (leider in die amerikanische Variante “” – ich behelfe mich da mit einer WP-Datei-Änderung…), vielleicht hast du da mal versehentlich etwas in deine PHP-Dateien reinkopiert.
Schon erstaunlich, was so ein kleiner Fehler bewirken kann…
Ja… ich denk auch, dass ich einmal zu hektisch copy&paste zelebriert habe – das wir mir eine Lehre sein :-)