Technik & OnPage

robots.txt

Die robots.txt ist eine Textdatei im Wurzelverzeichnis einer Domain, die Crawlern über Anweisungen wie Disallow und Allow mitteilt, welche Verzeichnisse oder URLs sie nicht abrufen sollen. Sie folgt dem Robots-Exclusion-Standard und ist die erste Datei, die seriöse Bots vor dem Crawlen einer Website lesen.

Wichtig ist die Abgrenzung zur Indexierungssteuerung: Die robots.txt verhindert das Crawlen, nicht zwingend die Indexierung. Eine per robots.txt gesperrte Seite kann ohne Snippet trotzdem im Index landen, wenn sie verlinkt ist. Zum Ausschluss aus dem Index dient stattdessen ein noindex. In der robots.txt lässt sich zudem die XML-Sitemap referenzieren.

Hol dir dein kostenloses SEO-Audit.

Eine klare, ehrliche Einschätzung, wo deine größten Hebel liegen, bei Google und in der KI-Suche. Kein Verkaufsgespräch, sondern echter Mehrwert. Aktuell nehme ich 2 neue Audits pro Monat an.

Antwort in 24 hUnverbindlichKein Pitch

Schritt 1 von 2 · dauert keine Minute