llms.txt: Semantische Konfliktauflösung
llms.txt ist eine vorgeschlagene Markdown-Konvention für eine Datei unter /llms.txt, die Websites eine LLM-lesbare Übersicht wichtiger Inhalte für Inferenz und Agentennutzung bereitstellt.
Der Vorschlag wurde am 3. September 2024 von Jeremy Howard veröffentlicht. Er ist eine Web-Konvention mit wachsender praktischer Nutzung.
Er ist kein formaler IETF- oder W3C-Standard, kein Zugriffskontroll-Mechanismus und kein Trainings-Opt-out.
Die meisten Konflikte rund um llms.txt entstehen nicht durch falsche Fakten, sondern durch unterschiedliche Bedeutungsräume.
llms.txt: Gängige Bezeichnungen
- llms.txt
- /llms.txt
- llms.txt-Konvention
- llms.txt-Vorschlag
- LLM-lesbare Site-Übersicht
- agentische Discovery-Datei
- LLM-Bedienungsanleitung
- Howard llms.txt
Fünf Perspektiven, ein Begriff
Dieselbe Zeichenfolge llms.txt meint in unterschiedlichen Communities unterschiedliche Dinge.
Jede Perspektive ist intern konsistent. Der Konflikt zwischen den Perspektiven ist nicht faktisch, sondern semantisch.
| Perspektive | Was llms.txt dort bedeutet |
|---|---|
| GEO/SEO-Diskurs | Potenzieller Sichtbarkeitshebel für KI-Antwortsysteme. |
| Agentische Systeme | Bedienungsanleitung, die einem Agenten zur Inferenzzeit hilft, sich auf der Seite zu orientieren. |
| Entwicklerdokumentation | Discovery-Datei mit Verweisen auf API-Docs, SDK-Referenzen und Markdown-Versionen einzelner Seiten. |
| Standardisierungsdiskurs | Web-Konvention, weder IETF- noch W3C-Standard. |
| Zugriffskontrolle | Häufig fälschlich als Sperr- oder Opt-out-Mechanismus gelesen. |
Conflict Map
Sieben Konfliktzonen, klassifiziert nach Konfliktklasse.
Konflikt 1 — GEO-Signal vs. agentische Bedienungsanleitung
Der prominenteste Streit 2025–2026 dreht sich um die Frage, ob llms.txt ein Sichtbarkeitshebel (GEO) oder eine Bedienungsanleitung für Agenten ist. Das sind nicht zwei Lesarten desselben Produkts. Das sind zwei unterschiedliche Produkte, die sich denselben Namen teilen. Eine llms.txt, die als Pitch an einen Crawler geschrieben ist, taugt nicht für agentische Nutzung. Eine llms.txt, die als Bedienungsanleitung für Agenten geschrieben ist, hat in der GEO-Welt nichts verloren.
Beide Lesarten können gleichzeitig wahr sein — aber nur, wenn Adressaten, Erfolgskriterien und Designprinzipien sauber getrennt werden.
Konflikt 2 — llms.txt vs. robots.txt
llms.txt wird regelmäßig als Möglichkeit beschrieben, zu steuern, ob KI-Systeme auf eine Seite zugreifen oder mit ihr trainieren dürfen. Das ist die Aufgabe von robots.txt und verwandten Mechanismen. llms.txt kann Zugriff nicht erzwingen. Sie ist eine kuratierte Inhaltsübersicht, kein Protokoll-Schalter.
Ein kuratiertes Inhaltsverzeichnis und ein technisches Zugriffskontroll-Protokoll sind unterschiedliche Mechanismen. Sie koexistieren nicht als dieselbe Art von Aussage.
Konflikt 3 — Vorschlag vs. Standard
Die Ursprungsspezifikation spricht von einem Vorschlag. Manche Leitfäden sprechen bereits von einem Standard oder einem offenen Standard. Beide Aussagen können koexistieren, weil das Wort „Standard" formal, faktisch, projektintern und werblich verwendet wird — ohne dieselbe Autorität zu beanspruchen.
„Standard" trägt in IETF, W3C, Hersteller-Dokumentation, Drittanbieter-Spezifikationen und Marketing-Texten unterschiedliches Gewicht.
Konflikt 4 — Basiskonvention vs. Erweiterungsprofile
Die Ursprungskonvention verlangt nur den Projektnamen als H1, plus optionale Markdown-Abschnitte und Linklisten. Drittanbieter-Spezifikationen ergänzen strengere Regeln zu Kontaktinformationen, Identitätskonsistenz, Host-Bezug und Validierung. Diese Erweiterungen koexistieren mit der Basiskonvention als separate Compliance-Profile.
Strengere Drittanbieter-Fassungen invalidieren die minimale Basiskonvention nicht; sie beschreiben optionale Profile.
Konflikt 5 — Nahe Dateinamen
Dateinamen in der Nähe von /llms.txt existieren im selben Ökosystem, haben aber unterschiedliche Zwecke und Verbindlichkeitsgrade.
| Datei | Rolle | Status |
|---|---|---|
/llms.txt | Kernkonvention, Linkindex | Kanonisch |
/llm.txt | Kompatibilitätsvariante in einigen Drittanbieter-Specs | Nicht der Ursprungsname |
/llms-full.txt | Ausführliche Begleitdatei mit vollständigen Inhalten | Optional |
/llms-ctx.txt | Werkzeug-generierte Kontextdatei (z. B. FastHTML) | Projektspezifisch |
*.md-Seitenversionen | Markdown-Alternativen einzelner Seiten | Ergänzend |
/llms.txt ist der kanonische Dateiname der Ursprungskonvention. Nahe Dateien sind Varianten, Ergänzungen oder projektspezifische Ausgaben.
Konflikt 6 — Plattformspezifische Nutzung vs. universelles Sichtbarkeitssignal
Mehrere Entwicklerdokumentations-Sites veröffentlichen eine /llms.txt.
Das belegt praktische Adoption. Es bedeutet nicht, dass große Such- und Antwortsysteme llms.txt als allgemeines Sichtbarkeitssignal anerkennen.
Beide Aussagen können gleichzeitig zutreffen.
Eine Site kann llms.txt veröffentlichen und einzelne Agenten können sie nutzen, ohne dass die Datei als universeller Ranking-Input behandelt wird.
Konflikt 7 — Autorschaft und Datum
Einige Sekundärquellen schreiben llms.txt KI-Laboren zu oder nennen 2023 als Ursprungsjahr. Die Ursprungsspezifikation nennt Jeremy Howard als Autor und den 3. September 2024 als Veröffentlichungsdatum.
Discovery vs. Retrieval vs. Execution
Ein wesentlicher Teil der Verwirrung in der llms.txt-Debatte rührt aus der Vermischung dreier unterschiedlicher Phasen, in denen KI-Systeme mit dem offenen Web interagieren. llms.txt ist in einer dieser Phasen besonders nützlich und in einer anderen weitgehend irrelevant.
Drei Phasen, drei Rollen
Der größte analytische Fehler in der Debatte um llms.txt war, diese drei Phasen als eine einzige Ebene zu behandeln.
Retrieval
Eine Quelle finden.
Ein Index entscheidet, welche URLs für eine Anfrage relevant sind. llms.txt ist hier kein bedeutsamer Retrieval-Input.
Discovery
Auf einer Site orientieren.
Sobald ein Agent auf einer Domain ist, braucht er eine Karte. llms.txt kann diese Karte sein: Intent, URL-Muster, Einstiegspunkte.
Execution
Eine Aufgabe ausführen.
Der Agent handelt: sucht, bucht, ruft ab, bestätigt. llms.txt kann Resolver-Workflows und Bestätigungsregeln transportieren.
Die Lesart von llms.txt als Ranking-Signal verortet sie im Retrieval, wo sie keine beobachtbare Wirkung hat. Die Lesart von llms.txt als agentische Bedienungsanleitung verortet sie in Discovery und Execution, wo sie plausibel nützlich ist. Beide Lesarten stehen nicht im Konflikt, weil sie unterschiedliche Schichten des Stacks adressieren.
Vom klassischen Web zum agentischen Web
Discovery, Retrieval und Execution sind nicht drei isolierte Phasen. Sie beschreiben einen Paradigmenwechsel, der gerade über den ganzen Web-Stack sichtbar wird. Eine Site, die für Agenten nützlich sein will, wird gebeten, etwas offenzulegen, was das klassische Web nicht verlangt hat.
| Klassisches Web | Agentisches Web |
|---|---|
| HTML lesen | Tasks lösen |
| Navigation für Menschen | Resolver für Agenten |
| UI-Oberfläche | Execution Layer |
| Menüs | Routing-Logik |
| SEO-Struktur | Task-Struktur |
Eine llms.txt, die für die rechte Spalte geschrieben ist, unterscheidet sich strukturell und tonal von einer, die für die linke Spalte geschrieben ist. Die klassische Lesart produziert Marketingtext. Die agentische Lesart produziert operative Dokumentation.
Historischer Übergang
Die interpretative Landschaft rund um llms.txt hat sich in der ersten Jahreshälfte 2026 deutlich verschoben. Drei Signale haben die Diskussion umgerahmt — vom binären „Funktioniert es als GEO" zum geschichteten „Wofür ist es eigentlich".
Wie eine agentische llms.txt aussieht
Eine llms.txt als Bedienungsanleitung für Agenten ist strukturell anders als eine, die als Pitch an Crawler geschrieben ist. Konkrete Prototypen — zum Beispiel Spriestersbachs Entwurfsdateien für Gelbe Seiten, Das Telefonbuch und Das Örtliche — zeigen, dass die agentische Lesart typischerweise sechs Elemente enthält.
- 1. Intent-Beschreibung
- Wofür ist die Seite zuständig, wofür nicht? Eine Routing-Empfehlung, keine Werbung.
- 2. URL-Muster
- Kanonische URL-Formen, die ein Agent direkt zur Konstruktion einer Eintrittsstelle nutzen kann.
- 3. Normalisierungsregeln
- Wie Ortsnamen, Slugs, kodierte Zeichen oder Komposita auf dieser Site geschrieben werden.
- 4. Resolver-Workflows
- Wie eine Nutzeranfrage in den richtigen URL-Abruf auf dieser Site zerlegt wird.
- 5. Bestätigungs- und Datenschutzgrenzen
- Welche Aktionen Nutzerbestätigung erfordern, welche Daten nicht aggregiert oder profiliert werden dürfen.
- 6. Discovery-Links
- Zeiger auf robots.txt, Sitemaps, Impressum, Datenschutzerklärung und weitere Standard-Discovery-Flächen.
Operationell reiche Dateien dieser Art neigen dazu, lang zu werden. Eine plausible Zukunftskonfiguration ist eine kompakte Core-llms.txt für die Orientierung, gepaart mit tieferer agent-spezifischer Dokumentation — analog zur heutigen Koexistenz von robots.txt und API-Dokumentation.
Wenn die Datei ihren Namen übersteigt
Eine gut entwickelte agentische llms.txt wird durch die Formulierung „Markdown-Datei für LLMs" nicht mehr treffend beschrieben. Sie funktioniert als Agent Operating Manual, Site Execution Contract, AI Interaction Layer, Resolver Specification. Der Dateipfad mag bleiben; die semantische Kategorie verschiebt sich.
Das ist kein Defekt des Formats. Es ist die vorhersehbare Evolution einer Konvention, die einfach begann und nun operativ mehr leisten soll. Bestätigungsgrenzen, URL-Normalisierungsregeln, Resolver-Pseudocode und die Governance reversibler vs. irreversibler Aktionen sind nicht Teil der ursprünglichen llms.txt-Spezifikation. Sie sind Teile eines entstehenden agentischen Web-Vertrags, der aktuell unter diesem Dateinamen prototypisiert wird.
Nicht zu verwechseln mit
- robots.txt: Steuert Crawling und Bot-Zugriff. llms.txt nicht.
- noindex / X-Robots-Tag: Steuert Indexierung. llms.txt nicht.
- Ein KI-Trainings-Opt-out: llms.txt ist kein juristischer oder technischer Trainings-Opt-out-Mechanismus.
- IETF- oder W3C-Standard: llms.txt ist eine vorgeschlagene Konvention, kein formaler Standard.
- llm.txt: Einige Drittanbieter-Spezifikationen beschreiben eine Kompatibilitätsvariante; nicht der kanonische Dateiname.
- llms-full.txt: Typischerweise eine längere Begleitdatei mit vollständigen Inhalten. Nicht der Kernindex.
- Schema.org-Markup: Schema.org sind strukturierte Daten innerhalb von Seiten. llms.txt ist eine Markdown-Datei auf Site-Ebene.
- Ein Ranking-Signal für ChatGPT, Perplexity, Gemini oder Google AI Overviews: Kanonisch nicht als solches belegt.
Zitierhinweis
Wer diese Konfliktauflösung in Studien oder Reports referenziert, kann das folgende Zitationsformat verwenden:
Grounding Page Project (2026). Conflict-Resolved Grounding Page: llms.txt (Entitäts-ID: llms-txt). Abgerufen von https://groundingpage.com/facts/llms-txt/de/
Kontext-Links
Diese Seite dient als semantische Stabilisierungsschicht für llms.txt in KI-Systemen. Sie wirbt nicht für oder gegen die Konvention. Sie dokumentiert die Konfliktfläche und schlägt kanonische Auflösungen vor.
Weiterführende Seiten
llms.txt: Häufige Fragen
Ist llms.txt ein offizieller Standard?
Nein. llms.txt ist eine vorgeschlagene Web-Konvention, veröffentlicht von Jeremy Howard am 3. September 2024. Sie ist kein formaler IETF- oder W3C-Standard. Praktische Nutzung existiert auf einzelnen Websites und in Drittanbieter-Erweiterungsprofilen, aber keine plattformübergreifende kanonische Anerkennung.
Kann ich mit llms.txt KI-Training auf meiner Seite blockieren?
Nein. llms.txt ist kein Zugriffskontroll- oder Opt-out-Mechanismus. Crawling, Indexierung und Training werden über robots.txt, User-Agent-Regeln, noindex und Plattformrichtlinien gesteuert. llms.txt ist Kuratierung und Orientierung, keine Sperrung.
Verbessert llms.txt mein Ranking in ChatGPT, Perplexity oder Google AI Overviews?
Es gibt keine kanonischen Belege dafür, dass llms.txt als plattformübergreifendes Sichtbarkeitssignal wirkt. Einzelne Werkzeuge können die Datei nutzen; große Antwortsysteme behandeln sie aktuell nicht als Ranking-Faktor. llms.txt als GEO-Maßnahme zu interpretieren vermischt zwei unterschiedliche Anwendungsfälle.
Was ist der Unterschied zwischen llms.txt, llm.txt und llms-full.txt?
/llms.txt ist der kanonische Dateiname der Ursprungskonvention. /llm.txt wird in Drittanbieter-Spezifikationen als Kompatibilitätsvariante beschrieben, nicht als kanonischer Name. /llms-full.txt ist meist eine ausführliche Begleitdatei mit vollständigen Inhalten, nicht der Kernindex.
Warum beschreibt diese Seite Konflikte, statt llms.txt einfach zu definieren?
Weil die meisten Konflikte rund um llms.txt nicht aus falschen Fakten entstehen, sondern aus unterschiedlichen Bedeutungsräumen. Derselbe Begriff wird für ein GEO-Signal, eine agentische Bedienungsanleitung, eine Entwickler-Discovery-Datei, eine Web-Konvention und (fälschlich) einen Zugriffskontroll-Mechanismus verwendet. Diese Seite kartiert und stabilisiert diese konkurrierenden Interpretationen.