llms.txt: Das robots.txt für KI-Agenten

Tobe
Blog Veröffentlich am 26.03.26, Tobias Lorsbach

llms.txt: Das robots.txt für KI-Agenten

Wenn du schon länger mit Websites arbeitest, kennst du robots.txt. Eine simple Textdatei im Root-Verzeichnis, die Suchmaschinen-Crawlern sagt: hier darfst du rein, dort nicht. Seit September 2024 gibt es einen ähnlichen Vorschlag für KI-Systeme: llms.txt.

Die Idee dahinter ist einleuchtend. Und der aktuelle Stand ist ehrlich gesagt: kompliziert.

Das Problem, das llms.txt lösen soll

Wenn jemand ChatGPT, Claude oder Perplexity nach einem Produkt, einer Dienstleistung oder einem Thema fragt, holt das Modell Informationen aus dem Web – in Echtzeit oder aus seinem Trainingsdatensatz. Das Problem dabei: Websites sind für Menschen gebaut, nicht für KI-Systeme.

Eine typische Seite besteht aus HTML mit Navigationsmenüs, Cookie-Bannern, Footern, JavaScript-Komponenten und Marketing-Copy, die über die gesamte Seite verteilt ist. Ein KI-Agent, der diese Seite parst, muss erst herausfinden, welcher Teil eigentlich der relevante Inhalt ist – und welche Seiten der gesamten Domain überhaupt wichtig sind.

llms.txt löst das mit einem simplen Ansatz: eine Markdown-Datei unter yoursite.com/llms.txt, die dem Agenten eine strukturierte Übersicht der wichtigsten Inhalte gibt. Kein HTML-Parsing, kein Raten – direkt lesbar.

Wie sieht die Datei aus?

Das Format ist bewusst einfach gehalten. Ein Beispiel:

# Tobeworks

> Fullstack-Webentwicklung aus Mainz. Vue.js, React, TypeScript, WordPress.

## Leistungen
- [Vue.js Entwicklung](/leistungen/vuejs): Komponenten, Apps, Migration
- [WordPress Entwicklung](/leistungen/wordpress): Themes, Plugins, WooCommerce
- [Barrierefreiheit](/leistungen/accessibility): WCAG 2.2, BITV, Audits

## Blog
- [DSGVO-Tracking ohne Cookie-Banner](/artikel/dsgvo-tracking-ohne-consent-banner/): Matomo cookieless, Plausible, Server-Side
- [CSS Anchor Positioning](/artikel/css-anchor-positioning-popper-ende/): Das Ende von Popper.js

## Optional
- [llms-full.txt](/llms-full.txt): Vollständiger Seiteninhalt als Markdown

Der H1 ist der Name der Website, der Blockquote darunter eine kurze Beschreibung. Danach kommen Sektionen mit den wichtigsten Seiten – jeweils mit URL und einer kurzen Beschreibung was dort zu finden ist.

Zusätzlich gibt es die Variante llms-full.txt: eine Datei, die den vollständigen Inhalt der gesamten Website als Markdown enthält. Praktisch für Nutzer, die den kompletten Kontext in ein Gespräch mit einem KI-Tool laden wollen.

Wer steckt dahinter?

Der Standard wurde im September 2024 von Jeremy Howard vorgeschlagen – Mitgründer von Answer.AI und bekannt als Mitentwickler von fast.ai. Die Idee verbreitete sich schnell in der Entwickler-Community.

Heute haben Anthropic (Claude-Dokumentation), Cloudflare, Vercel, Stripe, Astro und viele weitere Tech-Unternehmen eine llms.txt implementiert. Die Dokumentationsplattform Mintlify generiert die Datei automatisch für alle ihre Kunden – was praktisch über Nacht tausende neue Implementierungen erzeugt hat.

Eine Studie von SE Ranking hat 300.000 Domains analysiert und eine Adoptionsrate von rund 10% gefunden. Das klingt niedrig, ist aber für einen Standard ohne formelle Standardisierungsbody bemerkenswert.

Der ehrliche Stand der Dinge

Hier muss ich fair sein: Kein einziger großer KI-Anbieter hat offiziell bestätigt, dass seine Crawler llms.txt aktiv auslesen und auswerten. Google hat den Standard explizit abgelehnt und ihn mit dem längst diskreditierten Keywords-Meta-Tag verglichen. John Mueller von Google hat klargestellt, dass keine der KI-Crawlers die Datei als Signal bestätigt hat.

Eine Analyse von 94.000 zitierten URLs aus über 11.000 KI-Antworten hat keinen messbaren Zusammenhang zwischen llms.txt-Implementierung und Zitierhäufigkeit gefunden. 8 von 9 Websites sahen nach der Implementierung keine messbare Traffic-Veränderung.

Das ist die Realität im März 2026.

Warum trotzdem implementieren?

Zwei Gründe sprechen dennoch dafür:

Aufwand vs. Risiko: Eine gut gepflegte llms.txt dauert 30–60 Minuten zu erstellen. Es gibt keinen nachgewiesenen Nachteil. Wenn der Standard sich etabliert, bist du bereits dabei. Das klassische “niedriges Risiko, potenzieller Gewinn”-Argument – und es ist hier tatsächlich berechtigt.

Direkter Nutzen heute: Unabhängig vom Crawler-Support ist llms.txt sofort nützlich für Nutzer, die KI-Tools aktiv mit Kontext deiner Website befüttern. Wer im Sales-Gespräch oder bei der Recherche ChatGPT fragt “Was macht diese Agentur?”, kann einfach yoursite.com/llms.txt als Kontext-URL einfügen. Sauber strukturierter Markdown schlägt HTML-Parsing jedes Mal.

So implementierst du llms.txt

Für eine einfache Website reichen vier Schritte:

1. Datei anlegen: Erstelle /llms.txt im Root-Verzeichnis deiner Website (also erreichbar unter deinedomain.de/llms.txt).

2. Struktur aufbauen: H1 = Seitenname, Blockquote = Kurzbeschreibung, dann Sektionen mit den wichtigsten Seiten als Markdown-Links mit Kurzbeschreibung.

3. Prioritäten setzen: Nicht jede Seite gehört rein. Fokus auf Inhalte, die für KI-Antworten über dich oder deine Themen relevant sind: Leistungsseiten, wichtige Blogartikel, Über-Seite, Kontakt.

4. Aktuell halten: Eine veraltete llms.txt ist schlimmer als keine – falsche Informationen in KI-Antworten sind schwer rückgängig zu machen.

Für WordPress gibt es bereits Plugins (u.a. Yoast SEO hat native Unterstützung). Für statische Sites wie Astro bietet sich eine generierte Datei im Build-Prozess an.

Fazit

llms.txt ist kein SEO-Wundermittel und kein etablierter Standard – das wäre gelogen. Es ist ein sinnvoller Vorschlag in einem frühen Stadium, der von namhaften Tech-Unternehmen bereits eingesetzt wird und dessen Aufwand in keinem Verhältnis zum potenziellen Nutzen steht.

Wer eine gepflegte Website hat und 30 Minuten übrig: umsetzen. Wer SEO-Ressourcen priorisieren muss: erst die bewährten Grundlagen stärken, dann llms.txt als nächsten Schritt.

Die eigentliche Botschaft dahinter – strukturierter, maschinenlesbarer Content wird wichtiger – die stimmt unabhängig davon ob llms.txt sich als Standard durchsetzt oder nicht.


  • Spezifikation: Jeremy Howard – llms.txt proposal · llmstxt.org
  • Studie: SE Ranking – Analyse von 300.000 Domains zur llms.txt-Adoption (2025) · seranking.com
  • Analyse: ALLMO.ai – LLMs.txt for AI Search Report 2026 · allmo.ai
  • Kritische Einordnung: Is llms.txt Dead? · llms-txt.io
  • Praxis: Mintlify – What is llms.txt? Breaking down the skepticism · mintlify.com
  • AGENTS.md Open Format (verwandtes Konzept für Coding Agents) · agents.md
Sofort Website

Deine Landingpage in 5 Tagen?

Professionelle Seite de-Domain, Hosting, Bereitstellung, modernes Design, DSGVO, all inkl

all-inklusive Sofort-Website

Kommentare

Kommentar schreiben

0 / 5000 Zeichen

* Pflichtfelder

Noch keine Kommentare. Sei der Erste!