Das Problem

Du checkst Google Search Console. Indexierung läuft seit Monaten. Heute siehst du plötzlich:

77 nicht indexierte Seiten

Was zum…? Gestern waren es 10. Ist deine SEO kaputt?

Du klickst auf “Details” und siehst:

  • 11 indexierte Seiten
  • ⚠️ 77 nicht indexierte Seiten
    • 73× “Gefunden – zurzeit nicht indexiert”
    • 2× “Gecrawlt – zurzeit nicht indexiert”
    • 1× “Nicht gefunden (404)”
    • 1× Durch “noindex”-Tag ausgeschlossen

73 Seiten die Google nicht indexiert? Das klingt nach einem massiven Problem.

Spoiler: Ist es nicht.


TL;DR

Wenn die “nicht indexierten” Seiten Pagination-Seiten sind (/tags/xyz/page/2/ etc.), ist das gewolltes Verhalten. Hugo’s canonical tags sagen Google absichtlich: “Indexiere nur Seite 1, nicht die Folgeseiten.” Das verhindert Duplicate Content und ist SEO-Best-Practice.

Keine Code-Änderungen nötig - deine Hugo-Konfiguration ist korrekt.


Die Diagnose

Du willst wissen was da los ist. Öffne eine “nicht indexierte” URL in GSC und schau dir die Details an.

Beispiel:

/tags/homelab/page/2/
/tags/jedi/page/3/
/categories/tutorial/page/2/

Aha - alle URLs haben /page/X/ im Pfad. Das sind Pagination-Seiten.

Jetzt prüfen ob das gewolltes Verhalten ist:

curl -s https://deathstar.lan/tags/homelab/page/2/ | grep canonical

Output:

<link rel="canonical" href="https://deathstar.lan/tags/homelab/">

Das ist der Schlüssel: Der canonical tag sagt Google “indexiere /tags/homelab/, NICHT diese Page-2-Variante”.

Google befolgt das und zeigt dir in GSC: “73× Gefunden – zurzeit nicht indexiert”.

Das ist kein Bug. Das ist die korrekte Funktion von canonical tags.


Was sind Pagination-Seiten?

Du hast 42 Blog-Posts mit Tag “homelab” auf deathstar.lan (Order 66 approved ✊). Hugo zeigt 10 Posts pro Seite:

URLPosts
/tags/homelab/1-10
/tags/homelab/page/2/11-20
/tags/homelab/page/3/21-30
/tags/homelab/page/4/31-40
/tags/homelab/page/5/41-42

Die URLs mit /page/2/, /page/3/ etc. sind Pagination-Seiten - die “Seitennummerierung” deiner Listen.

Wenn du mehrere Tags (jedi, sith, rebellion) und Kategorien hast, kommst du schnell auf 70-80 Pagination-URLs.


Warum sollen Pagination-Seiten NICHT indexiert werden?

Problem ohne canonical tags

Google crawlt:
- /tags/jedi/ (zeigt Posts 1-10)
- /tags/jedi/page/2/ (zeigt Posts 11-20)

Google denkt: "Das sind zwei verschiedene Seiten mit ähnlichem Content"
→ Duplicate Content Risk
→ SEO Penalty möglich

Lösung mit canonical tags

Hugo (und andere moderne Static-Site-Generatoren) fügen automatisch canonical tags ein:

<!-- Auf /tags/jedi/page/2/ -->
<link rel="canonical" href="https://deathstar.lan/tags/jedi/">

Das sagt Google: “Diese Seite ist nur eine Fortsetzung von /tags/jedi/ - indexiere NUR die Hauptseite.”


Das perfide

Google zeigt dir 77 “nicht indexierte” Seiten ohne Kontext. Kein “ist OK” oder “ist Problem”. Nur eine Zahl.

Du siehst:

  • ⚠️ 77 nicht indexiert

Aber Google sagt dir nicht:

  • ✅ 73 davon sind Pagination (gewollt durch canonical tags)
  • ⚠️ 2 sind gecrawlt (Google überlegt noch)
  • ❌ 1 ist 404 (prüfen)
  • ❌ 1 ist noindex (prüfen)

Das ist der Unterschied zwischen Panik und “alles gut”.

Du musst selbst die URLs analysieren um zu verstehen: Sind das wichtige Content-Seiten oder nur Pagination?


Die Verifikation

Ich habe das auf einer Beispiel-Site (mit Star Wars Hosts natürlich) geprüft:

1. Canonical tag prüfen

curl -s https://deathstar.lan/tags/homelab/page/2/ | grep canonical

Ergebnis:

<link rel="canonical" href="https://deathstar.lan/tags/homelab/">

Canonical tag ist vorhanden und korrekt - die Pagination-Seite verweist auf die Hauptseite.

2. Sitemap prüfen

curl -s https://deathstar.lan/sitemap.xml | grep -c "<loc>"

Expected: ~126 (nur Hauptseiten, keine /page/2/)

Ergebnis: 126

✅ Keine Pagination-URLs in der Sitemap.

3. Keine Pagination in Sitemap

curl -s https://deathstar.lan/sitemap.xml | grep -c "page/"

Expected: 0

Ergebnis: 0

✅ Perfekt - Hugo generiert die Sitemap ohne Pagination-Seiten.


Die anderen “Nicht indexiert”-Gründe

1× “Durch noindex-Tag ausgeschlossen”

  • Ursache: Entweder absichtlich gesetzt (z.B. draft: true in Frontmatter) oder Entwicklungsumgebung
  • Diagnose:
    curl -s https://deathstar.lan/path/to/page/ | grep -i noindex
    
  • Aktion: In GSC prüfen welche Seite betroffen ist, Frontmatter checken

1× “Nicht gefunden (404)”

  • Ursache: Seite wurde gelöscht/umbenannt, aber Google hat die alte URL noch im Index
  • Diagnose: URL in Browser öffnen, Status Code prüfen
  • Aktion: Evtl. 301 Redirect anlegen, oder warten bis Google die URL aus dem Index entfernt

2× “Gecrawlt – zurzeit nicht indexiert”

  • Ursache: Google hat gecrawlt, aber noch nicht entschieden ob indexiert wird
  • Aktion: Abwarten - Google entscheidet selbst (kann Wochen dauern)
  • Falls wichtige Seite: In sitemap.xml aufnehmen, interne Verlinkung verbessern

Hugo-Konfiguration (Verifikation)

Wenn du sichergehen willst, dass deine Hugo-Site korrekt konfiguriert ist:

Sitemap prüfen

curl https://deathstar.lan/sitemap.xml | grep -c "<loc>"

Erwartet: Nur Hauptseiten (keine /page/2/ URLs)

robots.txt prüfen

curl https://deathstar.lan/robots.txt

Erwartet:

User-agent: *
Disallow:

Sitemap: https://deathstar.lan/sitemap.xml

Canonical tag auf Pagination-Seite prüfen

curl -s https://deathstar.lan/tags/sith/page/2/ | grep canonical

Erwartet:

<link rel="canonical" href="https://deathstar.lan/tags/sith/">

Alle drei Checks grün? ✅ Deine Hugo-Config ist korrekt.


Wann du handeln musst

SymptomBewertungAktion
70+ “nicht indexiert” durch Pagination✅ OKKeine - das ist gewollt
Wichtige Content-Seiten nicht indexiert❌ ProblemIn sitemap.xml prüfen, robots.txt checken, interne Links verbessern
404-Fehler auf wichtigen URLs⚠️ HandelnRedirect anlegen oder URL-Struktur fixen
noindex auf Production-Seiten❌ ProblemFrontmatter prüfen (draft: false)
Gecrawlt aber nicht indexiert (>4 Wochen)⚠️ BeobachtenContent-Qualität verbessern, interne Verlinkung stärken

Optional: rel=prev/next Tags

Einige Hugo-Themes fügen zusätzlich rel="prev" und rel="next" Tags ein:

<!-- Auf /tags/rebellion/page/2/ -->
<link rel="prev" href="https://deathstar.lan/tags/rebellion/">
<link rel="next" href="https://deathstar.lan/tags/rebellion/page/3/">

Diese sind ein zusätzliches Signal an Google für Pagination-Series, aber nicht zwingend erforderlich. Der canonical tag ist das wichtigste.

Fun Fact: Google hat 2019 angekündigt, rel=prev/next zu ignorieren. Canonical tags bleiben der Standard.


Lessons Learned

  1. GSC zeigt Zahlen ohne Kontext - 77 “nicht indexiert” klingt dramatisch, ist es aber nicht wenn es Pagination ist
  2. Pagination soll NICHT indexiert werden - Sonst Duplicate Content Penalty
  3. Canonical tags sind das Werkzeug - Hugo/PaperMod macht das automatisch richtig
  4. Diagnose vor Panik - URLs analysieren: /page/X/ = OK, Content-Seiten = Problem
  5. Google braucht Zeit - “Gecrawlt, nicht indexiert” kann Wochen dauern

Wie man echte Probleme erkennt

Schau dir die Art der nicht indexierten Seiten an:

  • URLs mit /page/X/ → ✅ OK (Pagination)
  • Wichtige Content-Seiten/Posts → ❌ Problem
  • 404-Fehler → ⚠️ Prüfen
  • noindex-Tags → ⚠️ Prüfen (Draft-Status?)

Checkliste

Wenn Google Search Console viele “nicht indexierte” Seiten zeigt:

  • Art der URLs prüfen: Sind es Pagination-Seiten (/page/X/)?
  • Falls JA: Canonical tags verifizieren:
    curl -s https://<DEINE-DOMAIN>/tags/xyz/page/2/ | grep canonical
    
  • Falls canonical korrekt: ✅ Kein Handlungsbedarf
  • Falls Content-Seiten betroffen:
    • In sitemap.xml vorhanden?
    • robots.txt blockiert nichts?
    • Interne Verlinkung ausreichend?
  • 404-Fehler: Redirects anlegen oder warten
  • noindex-Tags: Frontmatter in betroffenen Posts prüfen (draft: false)

Fazit

Die 77 “nicht indexierten” Seiten sind kein Bug, sondern ein Feature. Hugo’s PaperMod Theme (und andere moderne Themes) nutzen canonical tags korrekt, um Duplicate Content zu vermeiden.

Wenn die meisten “nicht indexierten” Seiten Pagination-Pages sind, kannst du beruhigt weitermachen - deine SEO ist in Ordnung.

Monitoring (optional): Alle 3 Monate in GSC reinschauen und prüfen ob sich die Ratio verschiebtert. Solange ~10-15 Content-Seiten indexiert sind und ~70-80 Pagination-Seiten nicht indexiert, ist alles gut.

Die wichtigste Lektion: Kontext matters. Google Search Console zeigt dir Zahlen - du musst sie interpretieren.


Referenzen