Google hat einen kompletten Bear Blog aus dem Suchindex entfernt – aber der Grund ist unbekannt
(journal.james-zhan.com)- Der persönliche Blog blog.james-zhan.com wurde nur einen Monat nach dem Start vollständig aus dem Google-Suchindex entfernt
- Unmittelbar nachdem in der Google Search Console (GSC) versehentlich eine RSS-Feed-URL validiert wurde, wurden alle Beiträge mit dem Status „Gecrawlt – zurzeit nicht indexiert“ angezeigt
- Mehrere mögliche Ursachen wie Domain-Einstellungen, Content-Qualität und interne Linkstruktur wurden geprüft, doch es wurde kein Problem festgestellt
- Mit Hilfe von Bear-Blog-Gründer Herman wurden auch DNS, HTML/CSS und Plattformprobleme ausgeschlossen; in anderen Suchmaschinen wird der Blog normal indexiert
- Schließlich wurde der Blog auf eine neue Subdomain verschoben und man entschied sich, die natürliche Indexierung durch Google abzuwarten; die Ursache bleibt weiterhin unklar
Ausgangslage
- Der Blog wurde am 4. Oktober gestartet, und der erste längere meinungsstarke Artikel im Stil einer Kolumne wurde veröffentlicht
- Nach dem Einreichen der Sitemap in der Google Search Console (GSC) und einer Indexierungsanfrage erschien er bereits am nächsten Tag in den Suchergebnissen
- Danach wurde bei jedem neuen Beitrag erneut eine Indexierung angefragt, was jeweils normal funktionierte
Das Problem tritt auf
- Am 14. Oktober sah der Autor in der GSC die Meldung, dass eine URL nicht indexiert sei, und klickte auf „Validate“
- Bei der betreffenden URL handelte es sich um den RSS-Feed (
feed/?type=rss) und nicht um eine echte Seite
- Bei der betreffenden URL handelte es sich um den RSS-Feed (
- Am 20. Oktober wurden nach einer GSC-E-Mail mit dem Hinweis „einige Korrekturen fehlgeschlagen“ alle Beiträge deindexiert
- Die Statusmeldung lautete: „Page is not indexed: Crawled – currently not indexed“
- Weder das erneute Einreichen der Sitemap noch einzelne Indexierungsanfragen für URLs hatten irgendeine Wirkung
Ursachenforschung
- Der Tag, an dem die Indexierungsvalidierung gestartet wurde, und der Tag, an dem alle Beiträge nicht mehr indexiert wurden, sind identisch
- Ob der Versuch, den RSS-Feed zu validieren, das Problem ausgelöst hat, bleibt unklar
- Auch später neu veröffentlichte Beiträge blieben alle in demselben Fehlerstatus
- Am 3. November wurde schließlich sogar der letzte noch verbliebene indexierte Beitrag entfernt
Prüfung möglicher Ursachen
- Domain-Problem: Die bei GoDaddy genutzte Domain
james-zhan.comwird auf einer anderen Subdomain normal indexiert → nicht die Ursache - Content-Qualität: Im Vergleich mit anderen Bear-Blog-Fällen gibt es weder bei Menge noch Qualität der Inhalte ein Problem → nicht die Ursache
- Zu wenige interne Links: Die Standardstruktur von Bear Blog ist identisch, andere Blogs werden normal indexiert → nicht die Ursache
- Weitere Faktoren: Laut Prüfung durch Bear-Blog-Gründer Herman
- DNS, HTML/CSS und Plattform-Konfiguration sind sämtlich in Ordnung
- Auch benutzerdefinierter CSS-Code hat keinen Einfluss auf die Indexierung
Andere Suchmaschinen und Maßnahmen
- In DuckDuckGo, Bing, Brave und anderen Suchmaschinen wird der Blog normal indexiert
- Deshalb liegt die Vermutung nahe, dass das Problem auf Googles Seite liegt und kein technischer Defekt ist
- Der Blog wurde auf eine neue Subdomain (
journal.james-zhan.com) umgezogen- Die Domain wurde von GoDaddy zu Porkbun transferiert
- URL-Weiterleitungen wurden eingerichtet, damit bestehende Links automatisch auf den neuen Blog verweisen
- Für den neuen Blog wurde keine Sitemap in der GSC eingereicht; stattdessen wartet man auf die natürliche Indexierung
- Die Ursache ist weiterhin ungeklärt, und der Autor stellt die Intransparenz von Googles Indexierungssystem infrage
1 Kommentare
Hacker-News-Kommentare
AI Overview kann ich nicht kontrollieren, aber nachdem ich auf den Suchseiten
noindexhinzugefügt hatte, erholte sich der Traffic innerhalb einer Woche.Die Details habe ich in meinem Blogbeitrag zusammengefasst.
/search-Seite gecacht und Crawlern ausgeliefert.Suchseiten sollte man nicht cachen, und es ist besser, per X-Robots-Tag noindex zu setzen.
Künftig wird man den Traffic wohl mit eigenen Analyse-Tools verfolgen müssen.
Jetzt sehen die Leute nur noch Zusammenfassungen und Werbung und gehen wieder.
Hat vielleicht eine andere Website auf diese Such-URL verlinkt, sodass sie gecrawlt wurde?
Wenn Google in den Zusammenfassungssätzen Quellenlinks setzen würde, könnte sich die Klickrate vielleicht etwas erholen.
Wenn eine Website sanktioniert wird, kann man weder den Grund erfahren noch Einspruch einlegen.
Google fungiert faktisch als Gatekeeper.
Da es wie ein öffentliches Gut funktioniert, braucht es auch ein entsprechendes Support-System und Verantwortung.
Regulierung ist kein Allheilmittel, aber bei Unternehmen dieser Utility-Größenordnung sollte es zumindest eine minimale Pflicht zur Zugangssicherung geben.
Im Moment ist es so, dass man nur in der Suche sichtbar wird, wenn man Werbebudget bezahlt.
Danach fiel die Zahl indexierter Seiten von mehreren Tausend auf etwa 100.
Siehe Screenshot.
Auch nach sechs Monaten hat sich das nicht erholt. Für ein privates Projekt ist das okay, aber wäre es ein Geschäft gewesen, wäre ich wütend gewesen.
Aktualisierter Screenshot
Wenn sie lange genug betrieben werden, werden sie teils sogar als „Bestandsnutzung“ anerkannt.
Ich habe sogar erlebt, dass Google-Maps-Screenshots vor Gericht als Beweismittel eingereicht wurden.
und in Wirklichkeit war es ein Betrugsunternehmen. Es beschädigte das Schloss und verlangte 600 Dollar.
Nachdem ich es meldete, löschte Google den Eintrag schnell, aber ich finde, bei solchen Einträgen müsste schon bei der Registrierung eine Identitätsprüfung erfolgen.
Das Problem ist, dass sich die Realität manchmal an die Karte anpasst.
In Verwaltungsverfahren wird es oft nach dem Muster „Wenn sich niemand beschwert, ist es wohl okay“ durchgewunken.
Meine Website wird fälschlich als Duplicate Content erkannt und deindexiert.
Bei Bing gibt es dieses Problem nicht, nur Google macht solche Fehler.
und bei Reddit-Seiten werden nur in eine falsche Sprache übersetzte Versionen angezeigt.
Wahrscheinlich funktioniert die Deduplizierungslogik nicht richtig.
Wenn man auf einer anderen Domain einen Reverse Proxy aufsetzt, indexiert Google sie als Duplikat.
Es ist besser, Canonical-Tags und Links mit absoluten Pfaden zu verwenden.
Das war ein Blog, der 17 Jahre lang keine Probleme hatte.
Da es zu viel Spam gibt, scheint die Zahl der False Positives gestiegen zu sein.
So ein Ansatz hat vielmehr den kontraproduktiven Effekt, den Anteil legitimer Inhalte zu senken.
Gemeinsam ist beiden, dass Google in einer Struktur steckt, in der es entscheidet, wer überlebt.
Ein RSS-Fehler könnte einfach nur der Auslöser für Desinteresse gewesen sein.
Hat Google Maps wirklich so schnell aufgeholt?
Auch der Einfluss von Instagram oder TikTok ist nicht zu unterschätzen,
deshalb wirkt es wie eine Interpretation, die Google allein zu viel Macht zuschreibt.
Am Ende läuft es auf ein Henne-oder-Ei-Problem hinaus.
Kleine Seiten bekommen keine Sichtbarkeit und können deshalb nicht wachsen,
während große Seiten ohne Probleme weiter oben erscheinen.