Das Problem
Du checkst Google Search Console. Indexierung läuft seit Monaten. Heute siehst du plötzlich:
77 nicht indexierte Seiten
Was zum…? Gestern waren es 10. Ist deine SEO kaputt?
Du klickst auf “Details” und siehst:
- ✅ 11 indexierte Seiten
- ⚠️ 77 nicht indexierte Seiten
- 73× “Gefunden – zurzeit nicht indexiert”
- 2× “Gecrawlt – zurzeit nicht indexiert”
- 1× “Nicht gefunden (404)”
- 1× Durch “noindex”-Tag ausgeschlossen
73 Seiten die Google nicht indexiert? Das klingt nach einem massiven Problem.
Spoiler: Ist es nicht.
TL;DR
Wenn die “nicht indexierten” Seiten Pagination-Seiten sind (/tags/xyz/page/2/ etc.), ist das gewolltes Verhalten. Hugo’s canonical tags sagen Google absichtlich: “Indexiere nur Seite 1, nicht die Folgeseiten.” Das verhindert Duplicate Content und ist SEO-Best-Practice.
Keine Code-Änderungen nötig - deine Hugo-Konfiguration ist korrekt.
Die Diagnose
Du willst wissen was da los ist. Öffne eine “nicht indexierte” URL in GSC und schau dir die Details an.
Beispiel:
/tags/homelab/page/2/
/tags/jedi/page/3/
/categories/tutorial/page/2/
Aha - alle URLs haben /page/X/ im Pfad. Das sind Pagination-Seiten.
Jetzt prüfen ob das gewolltes Verhalten ist:
curl -s https://deathstar.lan/tags/homelab/page/2/ | grep canonical
Output:
<link rel="canonical" href="https://deathstar.lan/tags/homelab/">
Das ist der Schlüssel: Der canonical tag sagt Google “indexiere /tags/homelab/, NICHT diese Page-2-Variante”.
Google befolgt das und zeigt dir in GSC: “73× Gefunden – zurzeit nicht indexiert”.
Das ist kein Bug. Das ist die korrekte Funktion von canonical tags.
Was sind Pagination-Seiten?
Du hast 42 Blog-Posts mit Tag “homelab” auf deathstar.lan (Order 66 approved ✊). Hugo zeigt 10 Posts pro Seite:
| URL | Posts |
|---|---|
/tags/homelab/ | 1-10 |
/tags/homelab/page/2/ | 11-20 |
/tags/homelab/page/3/ | 21-30 |
/tags/homelab/page/4/ | 31-40 |
/tags/homelab/page/5/ | 41-42 |
Die URLs mit /page/2/, /page/3/ etc. sind Pagination-Seiten - die “Seitennummerierung” deiner Listen.
Wenn du mehrere Tags (jedi, sith, rebellion) und Kategorien hast, kommst du schnell auf 70-80 Pagination-URLs.
Warum sollen Pagination-Seiten NICHT indexiert werden?
Problem ohne canonical tags
Google crawlt:
- /tags/jedi/ (zeigt Posts 1-10)
- /tags/jedi/page/2/ (zeigt Posts 11-20)
Google denkt: "Das sind zwei verschiedene Seiten mit ähnlichem Content"
→ Duplicate Content Risk
→ SEO Penalty möglich
Lösung mit canonical tags
Hugo (und andere moderne Static-Site-Generatoren) fügen automatisch canonical tags ein:
<!-- Auf /tags/jedi/page/2/ -->
<link rel="canonical" href="https://deathstar.lan/tags/jedi/">
Das sagt Google: “Diese Seite ist nur eine Fortsetzung von /tags/jedi/ - indexiere NUR die Hauptseite.”
Das perfide
Google zeigt dir 77 “nicht indexierte” Seiten ohne Kontext. Kein “ist OK” oder “ist Problem”. Nur eine Zahl.
Du siehst:
- ⚠️ 77 nicht indexiert
Aber Google sagt dir nicht:
- ✅ 73 davon sind Pagination (gewollt durch canonical tags)
- ⚠️ 2 sind gecrawlt (Google überlegt noch)
- ❌ 1 ist 404 (prüfen)
- ❌ 1 ist noindex (prüfen)
Das ist der Unterschied zwischen Panik und “alles gut”.
Du musst selbst die URLs analysieren um zu verstehen: Sind das wichtige Content-Seiten oder nur Pagination?
Die Verifikation
Ich habe das auf einer Beispiel-Site (mit Star Wars Hosts natürlich) geprüft:
1. Canonical tag prüfen
curl -s https://deathstar.lan/tags/homelab/page/2/ | grep canonical
Ergebnis:
<link rel="canonical" href="https://deathstar.lan/tags/homelab/">
✅ Canonical tag ist vorhanden und korrekt - die Pagination-Seite verweist auf die Hauptseite.
2. Sitemap prüfen
curl -s https://deathstar.lan/sitemap.xml | grep -c "<loc>"
Expected: ~126 (nur Hauptseiten, keine /page/2/)
Ergebnis: 126
✅ Keine Pagination-URLs in der Sitemap.
3. Keine Pagination in Sitemap
curl -s https://deathstar.lan/sitemap.xml | grep -c "page/"
Expected: 0
Ergebnis: 0
✅ Perfekt - Hugo generiert die Sitemap ohne Pagination-Seiten.
Die anderen “Nicht indexiert”-Gründe
1× “Durch noindex-Tag ausgeschlossen”
- Ursache: Entweder absichtlich gesetzt (z.B.
draft: truein Frontmatter) oder Entwicklungsumgebung - Diagnose:
curl -s https://deathstar.lan/path/to/page/ | grep -i noindex - Aktion: In GSC prüfen welche Seite betroffen ist, Frontmatter checken
1× “Nicht gefunden (404)”
- Ursache: Seite wurde gelöscht/umbenannt, aber Google hat die alte URL noch im Index
- Diagnose: URL in Browser öffnen, Status Code prüfen
- Aktion: Evtl. 301 Redirect anlegen, oder warten bis Google die URL aus dem Index entfernt
2× “Gecrawlt – zurzeit nicht indexiert”
- Ursache: Google hat gecrawlt, aber noch nicht entschieden ob indexiert wird
- Aktion: Abwarten - Google entscheidet selbst (kann Wochen dauern)
- Falls wichtige Seite: In
sitemap.xmlaufnehmen, interne Verlinkung verbessern
Hugo-Konfiguration (Verifikation)
Wenn du sichergehen willst, dass deine Hugo-Site korrekt konfiguriert ist:
Sitemap prüfen
curl https://deathstar.lan/sitemap.xml | grep -c "<loc>"
Erwartet: Nur Hauptseiten (keine /page/2/ URLs)
robots.txt prüfen
curl https://deathstar.lan/robots.txt
Erwartet:
User-agent: *
Disallow:
Sitemap: https://deathstar.lan/sitemap.xml
Canonical tag auf Pagination-Seite prüfen
curl -s https://deathstar.lan/tags/sith/page/2/ | grep canonical
Erwartet:
<link rel="canonical" href="https://deathstar.lan/tags/sith/">
Alle drei Checks grün? ✅ Deine Hugo-Config ist korrekt.
Wann du handeln musst
| Symptom | Bewertung | Aktion |
|---|---|---|
| 70+ “nicht indexiert” durch Pagination | ✅ OK | Keine - das ist gewollt |
| Wichtige Content-Seiten nicht indexiert | ❌ Problem | In sitemap.xml prüfen, robots.txt checken, interne Links verbessern |
| 404-Fehler auf wichtigen URLs | ⚠️ Handeln | Redirect anlegen oder URL-Struktur fixen |
| noindex auf Production-Seiten | ❌ Problem | Frontmatter prüfen (draft: false) |
| Gecrawlt aber nicht indexiert (>4 Wochen) | ⚠️ Beobachten | Content-Qualität verbessern, interne Verlinkung stärken |
Optional: rel=prev/next Tags
Einige Hugo-Themes fügen zusätzlich rel="prev" und rel="next" Tags ein:
<!-- Auf /tags/rebellion/page/2/ -->
<link rel="prev" href="https://deathstar.lan/tags/rebellion/">
<link rel="next" href="https://deathstar.lan/tags/rebellion/page/3/">
Diese sind ein zusätzliches Signal an Google für Pagination-Series, aber nicht zwingend erforderlich. Der canonical tag ist das wichtigste.
Fun Fact: Google hat 2019 angekündigt, rel=prev/next zu ignorieren. Canonical tags bleiben der Standard.
Lessons Learned
- GSC zeigt Zahlen ohne Kontext - 77 “nicht indexiert” klingt dramatisch, ist es aber nicht wenn es Pagination ist
- Pagination soll NICHT indexiert werden - Sonst Duplicate Content Penalty
- Canonical tags sind das Werkzeug - Hugo/PaperMod macht das automatisch richtig
- Diagnose vor Panik - URLs analysieren:
/page/X/= OK, Content-Seiten = Problem - Google braucht Zeit - “Gecrawlt, nicht indexiert” kann Wochen dauern
Wie man echte Probleme erkennt
Schau dir die Art der nicht indexierten Seiten an:
- URLs mit
/page/X/→ ✅ OK (Pagination) - Wichtige Content-Seiten/Posts → ❌ Problem
- 404-Fehler → ⚠️ Prüfen
- noindex-Tags → ⚠️ Prüfen (Draft-Status?)
Checkliste
Wenn Google Search Console viele “nicht indexierte” Seiten zeigt:
- Art der URLs prüfen: Sind es Pagination-Seiten (
/page/X/)? - Falls JA: Canonical tags verifizieren:
curl -s https://<DEINE-DOMAIN>/tags/xyz/page/2/ | grep canonical - Falls canonical korrekt: ✅ Kein Handlungsbedarf
- Falls Content-Seiten betroffen:
- In
sitemap.xmlvorhanden? -
robots.txtblockiert nichts? - Interne Verlinkung ausreichend?
- In
- 404-Fehler: Redirects anlegen oder warten
- noindex-Tags: Frontmatter in betroffenen Posts prüfen (
draft: false)
Fazit
Die 77 “nicht indexierten” Seiten sind kein Bug, sondern ein Feature. Hugo’s PaperMod Theme (und andere moderne Themes) nutzen canonical tags korrekt, um Duplicate Content zu vermeiden.
Wenn die meisten “nicht indexierten” Seiten Pagination-Pages sind, kannst du beruhigt weitermachen - deine SEO ist in Ordnung.
Monitoring (optional): Alle 3 Monate in GSC reinschauen und prüfen ob sich die Ratio verschiebtert. Solange ~10-15 Content-Seiten indexiert sind und ~70-80 Pagination-Seiten nicht indexiert, ist alles gut.
Die wichtigste Lektion: Kontext matters. Google Search Console zeigt dir Zahlen - du musst sie interpretieren.