Inhalt
Kurz gesagt: Nein, Sie brauchen keine llms.txt-Datei, um in KI-Suchmaschinen wie ChatGPT, Perplexity oder Gemini sichtbarer zu werden. llms.txt ist ein Community-Vorschlag aus dem Jahr 2024, kein verabschiedeter Standard — und die bislang verfügbare Evidenz zeigt keinen nachweisbaren Zitations-Lift. Eine Analyse von rund 300'000 Domains fand keinen Zusammenhang, kein grosser KI-Anbieter nutzt die Datei offiziell, und KI-Crawler fragen sie praktisch nicht ab. Schaden richtet sie keinen an — sie ist harmlos und in Minuten gebaut. Aber als Wachstumshebel für KI-Sichtbarkeit ist sie überverkauft. Die Hebel, die nachweisbar wirken, liegen woanders: bei belegten Inhalten und sauberer Crawlbarkeit. Welche das konkret sind, ordnet der Beitrag dazu ein, wie Sie für KI-Suchmaschinen zitierbar werden.
Dieser Beitrag macht den ehrlichen Faktencheck: Was llms.txt ist, was sie verspricht, was die Daten sagen — und wohin Ihr Aufwand stattdessen gehört.
Was ist eine llms.txt-Datei überhaupt?
Eine llms.txt-Datei ist eine Markdown-Datei im Wurzelverzeichnis einer Domain (/llms.txt), die grossen Sprachmodellen eine kuratierte, navigationsfreie Liste der wichtigsten Seiten geben soll. Jeremy Howard, Mitgründer von Answer.AI und Gründer von fast.ai, stellte den Vorschlag am 3. September 2024 vor. Die Idee adressiert ein reales technisches Problem.
Sprachmodelle haben begrenzte Kontextfenster, und eine typische HTML-Seite ist voll von Dingen, die ein Modell beim Lesen stören: Navigation, Werbung, JavaScript, Cookie-Banner, Footer-Links. Eine llms.txt soll diesen Lärm abräumen und dem Modell stattdessen eine aufgeräumte, reine Textsicht auf die Inhalte liefern, die zählen. Search Engine Land beschreibt das Format als technisch trivial und ohne Schaden — "no harm in doing so". So weit die Theorie, und sie klingt vernünftig.
Entscheidend ist das Wort Vorschlag. Howard formulierte ausdrücklich "We propose" — nicht "we standardise". Es gibt kein Standardgremium, das llms.txt verabschiedet hat, keine W3C-Spezifikation, keine offizielle Anbieter-Unterstützung. Das ist kein Detail, sondern der Kern der ehrlichen Einordnung: Eine Konvention ist nur so wirksam wie ihre Akzeptanz auf der Empfängerseite. Und genau dort beginnt das Problem.
Verbessert llms.txt die KI-Sichtbarkeit?
Nach heutiger Evidenzlage: nein. Es gibt keinen nachgewiesenen Zusammenhang zwischen einer vorhandenen llms.txt und besserer Sichtbarkeit in KI-Antworten. Die bislang grösste öffentliche Untersuchung kommt zum gegenteiligen Schluss — und das mit einer Methodik, die genau dafür gebaut ist, schwache Effekte sichtbar zu machen.
SE Ranking analysierte im November 2025 rund 300'000 Domains und fand keinen Zusammenhang zwischen einer vorhandenen llms.txt und der Häufigkeit, mit der eine Domain in KI-Antworten zitiert wird. Eingesetzt wurden Spearman-Korrelation, ein XGBoost-Modell und eine SHAP-Analyse — Werkzeuge, die auch indirekte Zusammenhänge aufspüren. Das Ergebnis war so eindeutig, dass das Entfernen der llms.txt-Variable die Modellgenauigkeit sogar verbesserte: Die Datei trug nichts zur Vorhersage von Zitationen bei, sie war Rauschen.
Dazu passt die Adoptionslage. In derselben Studie lag die Verbreitung bei 10,13 Prozent der gemessenen Domains — knapp neun von zehn Sites hatten die Datei rund 14 Monate nach dem Vorschlag nicht implementiert. Es gibt also weder einen messbaren Effekt noch einen breiten Konsens, dass man die Datei braucht.
Eine Konvention ohne Empfänger ist keine Optimierung — sie ist eine Datei, die niemand liest.
Wer tiefer einsteigen will, wie KI-Suchmaschinen Inhalte tatsächlich aufnehmen und zitieren, findet die Mechanik im Beitrag dazu, wie Headless-Inhalte für KI-Suchmaschinen zitierbar werden.
Nutzt Google llms.txt fürs Ranking?
Nein. Google hat öffentlich klargestellt, dass es llms.txt nicht verwertet — und die Einordnung kam von prominenter Stelle. Googles John Mueller erklärte 2025: "AFAIK none of the AI services have said they're using llms.txt (and you can tell when you look at your server logs that they don't even check for it). To me, it's comparable to the keywords meta tag".
Der Vergleich mit dem Keywords-Meta-Tag sitzt. Das war einst ein Feld, in das man seine wichtigsten Suchbegriffe schrieb — bis Suchmaschinen lernten, dass eine selbstberichtete Angabe, die der Betreiber frei befüllt, nichts zur Unterscheidung von Sites taugt. Genau dieselbe Logik trifft llms.txt: Eine Datei, die Sie selbst schreiben und in der Sie selbst behaupten, was wichtig ist, gibt einem Modell keinen verlässlichen Grund, Ihre Inhalte höher zu gewichten.
Mueller ging einen Schritt weiter. Am 22. Juli 2025 empfahl er, eine llms.txt-Datei bei Bedarf auf noindex zu setzen — und zwar ausdrücklich nicht wegen Duplicate Content, sondern damit die Datei nicht versehentlich über Links indexiert wird und Nutzer in den Suchergebnissen verwirrt. Eine Datei, zu der Googles eigene Empfehlung lautet "sorgen Sie dafür, dass sie nicht in der Suche auftaucht", ist ersichtlich kein Ranking-Faktor.
Fragen KI-Crawler die Datei überhaupt ab?
Kaum. Wenn die grossen KI-Crawler die Datei nicht einmal abrufen, kann sie auch keine Wirkung entfalten — und genau das zeigen Server-Logs. Zwei unabhängige Messungen kommen zum selben Bild.
OtterlyAI liess in einem 90-Tage-Experiment eine korrekt eingerichtete /llms.txt laufen und protokollierte den Traffic. Von über 62'100 KI-Bot-Besuchen entfielen nur 84 Anfragen auf die Datei — rund 0,1 Prozent. Die KI-Crawler kamen also durchaus auf die Site; sie ignorierten nur die Datei, die ihnen den Weg weisen sollte.
Die zweite Messung stützt das aus anderer Richtung. Eine CDN- und Log-Analyse von rund 1'000 Domains, zitiert von Evil Martians, zeigte, dass von allen Anfragen an llms.txt-Dateien 94,9 Prozent von GoogleBot kamen — während GPTBot, ClaudeBot und PerplexityBot vollständig fehlten. Hier ist Vorsicht bei der Deutung geboten, und Fairness gebietet, sie auszusprechen: GoogleBot holt ohnehin jede URL ab, die es findet. Diese 94,9 Prozent belegen also kein besonderes Interesse an llms.txt, sondern nur, dass ein generischer Crawler eine vorhandene Datei mitnimmt. Die KI-spezifischen Crawler, für die die Datei gedacht ist, tauchen in beiden Messungen praktisch nicht auf.
Was wirkt stattdessen für KI-Suchmaschinen?
Belegte Inhalte und saubere Crawlbarkeit — nicht eine Konventionsdatei. Wenn Sie Zeit in KI-Sichtbarkeit investieren wollen, gehört sie in Hebel, für die es Evidenz gibt. Davon gibt es eine ganze Reihe, und sie kosten ungefähr denselben Aufwand wie das Pflegen einer llms.txt, zahlen aber nachweisbar ein.
Der am besten untersuchte Hebel ist die inhaltliche Substanz. Die GEO-Studie von Princeton, Georgia Tech, dem Allen Institute for AI und IIT Delhi (KDD 2024) testete neun Optimierungsmethoden über rund 10'000 Anfragen und mass, dass das Hinzufügen von Quellenzitaten, Zitaten und Statistiken die Sichtbarkeit in generativen Antworten um bis zu rund 40 Prozent steigerte. Konkret heisst das: belegte Aussagen mit Zahl und Quelle, statt unbelegter Behauptungen. Genau das, was diesem Beitrag seine Linkliste gibt.
Aus dieser Studie leitet unsere hauseigene SEO- und GEO-Norm vier Richtwerte ab — Zitate +41 %, Statistiken +32 %, Quellenangaben +30 %, Fluency +28 %. Diese Einzelprozente sind unsere interne Interpretation der Studie als Arbeitsgrundlage, nicht ein wörtliches Studienergebnis; hart belegt ist die Gesamtgrössenordnung von "bis zu rund 40 Prozent". Als Priorisierungshilfe taugen sie trotzdem: Zahlen, Zitate und nachvollziehbare Quellen schlagen Stilpolitur.
Der zweite Hebel ist technisch. Evil Martians dokumentiert, dass LLM-Sichtbarkeit vor allem von sauber strukturiertem, gut abrufbarem Text abhängt — eine saubere robots.txt, abrufbare .md-Routen, gute HTML-Struktur und die serverseitige Messung, welche Bots tatsächlich kommen. Das ist kein Zufall, dass diese Liste nach einer entkoppelten Architektur klingt: Ein sauberes Headless-WordPress-Setup liefert genau diese Eigenschaften ab, weil Inhalt und Auslieferung getrennt sind und das Frontend strukturierten, rauscharmen HTML-Code ausgibt.
| Hebel | Evidenz | Aufwand | Empfehlung |
|---|---|---|---|
| llms.txt-Datei pflegen | Kein Zitations-Lift in 300'000-Domain-Studie; kein Anbieter-Support | Niedrig | Optional — schadet nicht, bringt aber nichts Messbares |
| Statistiken + Quellen im Text | Bis zu rund 40 % mehr generative Sichtbarkeit (GEO-Studie) | Mittel | Priorität — der bestbelegte Hebel |
| Saubere Crawlbarkeit (robots.txt, HTML-Struktur, .md-Routen) | Von Crawler-Logs gestützt | Mittel | Priorität — technische Grundlage |
| Serverseitige Messung der Bot-Zugriffe | Zeigt, welche KI-Crawler real kommen | Niedrig | Empfohlen — entscheidet datenbasiert statt nach Konvention |
Wann llms.txt trotzdem sinnvoll ist — der ehrliche Teil
Damit die Einordnung ehrlich bleibt, gehört auch die andere Seite auf den Tisch: llms.txt ist nicht wertlos, sie ist nur falsch positioniert. Wer sie als reine Entwickler-Bequemlichkeit versteht statt als Wachstumshebel, kann sie guten Gewissens pflegen.
Es gibt drei nüchterne Gründe, die Datei trotzdem anzulegen. Erstens kostet sie fast nichts: Eine llms.txt ist in wenigen Minuten geschrieben und richtet nachweislich keinen Schaden an. Zweitens ist sie eine saubere, menschenlesbare Inhaltsübersicht — manche Teams nutzen sie intern als kuratierte Sitemap der wichtigsten Seiten. Drittens ist sie eine günstige Wette auf die Zukunft: Sollte ein grosser Anbieter das Format eines Tages doch offiziell unterstützen, sind Sie ohne Mehraufwand dabei. Das ist eine legitime Haltung — solange Sie nicht erwarten, dass sie heute Sichtbarkeit kauft.
Wovon wir abraten: llms.txt zur Priorität zu machen oder dafür zu bezahlen. Wenn eine Agentur Ihnen eine llms.txt als KI-Sichtbarkeits-Massnahme verkauft, für die echte Hebel — belegte Inhalte, saubere Struktur — liegen lassen würden, ist das das Geld nicht wert. In unseren eigenen Schweizer Projekten 2024 bis 2026 haben wir die Datei bei Bedarf in fünf Minuten mitgeliefert; ein einziges Mal tauchte sie überhaupt in den Server-Logs als von einem KI-Crawler abgerufen auf. Der Sichtbarkeitsgewinn kam jedes Mal aus den belegten Inhalten und der Crawlbarkeit, nie aus der Datei.
Wo Ihre Site heute steht — der schnelle Check
Bevor Sie über einzelne Dateien nachdenken, lohnt der Blick auf die Grundlagen, die nachweisbar zählen. Der kostenlose Website-Check prüft von aussen unter anderem die technischen Indikatoren, die für KI-Crawler relevant sind — abrufbare Struktur, Sichtbarkeit der Inhalte, gesetzte Header. Das ist die Standortbestimmung, die vor der Frage nach llms.txt kommt: Eine Datei zu pflegen, deren Empfänger Sie nicht messen, ist die falsche Reihenfolge.
Aus dem Befund ergibt sich die richtige nächste Frage fast von selbst: Liefert Ihre bestehende Architektur sauberen, rauscharmen HTML-Code aus, den Crawler gut verarbeiten — oder kämpft Ihr Frontend mit Skript-Last und unsauberer Struktur, die jede KI-Sichtbarkeit von vornherein bremst? Wo genau eine entkoppelte Architektur hier den Unterschied macht, ordnet die Themenseite zu Headless WordPress ein.
Nächster Schritt
llms.txt ist ein gutes Beispiel dafür, wie schnell eine harmlose Konvention zum überverkauften Hebel wird. Die ehrliche Antwort ist unspektakulär: anlegen, wenn Sie wollen, aber nichts davon erwarten — und die Energie in belegte Inhalte und saubere Crawlbarkeit stecken, für die es echte Evidenz gibt. Wenn Sie wissen wollen, welche dieser Hebel für Ihre Site am meisten bringen, vereinbaren wir gerne ein Erstgespräch — 15 Minuten, kostenlos.
Wer die KI-Sichtbarkeit systematisch angehen will, findet in der SEO- und GEO-Kategorie im Blog die vertiefenden Beiträge zu strukturierten Daten, Zitierbarkeit und der Mechanik hinter KI-Suchmaschinen — die Felder, in denen sich Sichtbarkeit tatsächlich entscheidet.