KI und SEO — was sich gerade verändert und wie du deine Inhalte darauf vorbereitest

Ich habe irgendwann aufgehört, Google so zu nutzen wie früher. Das ist mir nicht schlagartig aufgefallen, sondern schleichend. Vor einem Jahr hätte ich „nginx reverse proxy konfigurieren“ in die Suchleiste getippt, zehn blaue Links bekommen und den dritten angeklickt, weil die ersten zwei von Content-Farmen stammten. Heute öffne ich ChatGPT, stelle die gleiche Frage und bekomme eine Antwort — direkt, ohne Umweg, ohne Cookie-Banner. Und mir ist klar geworden: Wenn ich das so mache, machen es andere auch so. Und wenn sie es so machen, dann muss ich mich fragen, ob meine Inhalte dort überhaupt ankommen.

Wie KI-Systeme deine Inhalte finden

ChatGPT, Gemini, Perplexity und ähnliche Systeme arbeiten grundlegend anders als eine klassische Suchmaschine. Google indexiert Seiten und rankt sie nach Hunderten von Signalen. KI-Systeme dagegen lesen Texte, extrahieren Aussagen und bauen daraus eine Antwort zusammen. Das klingt nach einem kleinen Unterschied, aber die Konsequenzen sind enorm. Eine Suchmaschine belohnt dich dafür, dass du auf Position eins stehst. Ein KI-System belohnt dich dafür, dass deine Aussage klar, eindeutig und gut strukturiert ist — unabhängig davon, ob du auf Position eins stehst oder auf Position dreißig.

Diese Systeme bevorzugen Inhalte mit klaren Absätzen, die jeweils einen Gedanken transportieren. Sie erkennen Frage-Antwort-Muster besonders gut — eine H2-Überschrift als Frage, gefolgt von einem Absatz, der diese Frage direkt beantwortet. Strukturierte Daten wie Schema.org helfen ihnen, den Kontext zu verstehen. Und sie mögen fließenden Text deutlich lieber als verschachtelte Aufzählungslisten, weil zusammenhängende Sätze mehr semantische Information transportieren als isolierte Stichpunkte.

Was ist llms.txt und wozu brauche ich das?

Es gibt eine relativ neue Konvention, die sich gerade etabliert: die Datei llms.txt. Die Idee ist einfach. So wie robots.txt Suchmaschinen sagt, was sie crawlen dürfen, sagt llms.txt großen Sprachmodellen, was deine Website ist, was sie enthält und wo die wichtigsten Inhalte liegen. Die Datei liegt im Root-Verzeichnis deiner Domain, also unter https://deine-domain.de/llms.txt, und ist reiner Text im Markdown-Format.

Für einen Entwickler-Blog könnte das so aussehen:

# RUHRCODER

> Technischer Blog über Softwareentwicklung, Shopware, WordPress und C#.
> Autor: René Schustek — Full-Stack-Entwickler aus dem Ruhrgebiet.

## Hauptthemen

- [Shopware-Plugin-Entwicklung](https://ruhrcoder.de/kategorie/shopware/)
- [WordPress-Theme-Entwicklung](https://ruhrcoder.de/kategorie/wordpress/)
- [C# und WinUI3](https://ruhrcoder.de/kategorie/csharp/)
- [Server-Administration](https://ruhrcoder.de/kategorie/server/)
- [SEO und Web-Performance](https://ruhrcoder.de/kategorie/seo/)

## Über den Autor

René Schustek ist ein Full-Stack-Entwickler mit Schwerpunkt auf
Shopware 6, Symfony, WordPress und C#/.NET. Er schreibt über
Architektur, Deployment und die Praxis der Softwareentwicklung.

## Wichtige Seiten

- [Über mich](https://ruhrcoder.de/ueber-mich/)
- [Alle Artikel](https://ruhrcoder.de/blog/)
- [Impressum](https://ruhrcoder.de/impressum/)
- [Datenschutz](https://ruhrcoder.de/datenschutz/)

Das Format ist bewusst schlicht gehalten. Kein JSON, kein XML, kein spezielles Markup. Einfach lesbarer Text, den ein Sprachmodell sofort verarbeiten kann. Die Datei ersetzt nichts — sie ergänzt. Deine bestehende SEO-Struktur, dein Schema.org, dein Meta-Tag-Setup bleiben unangetastet. Aber du gibst KI-Systemen einen zusätzlichen Einstiegspunkt, der speziell für sie gedacht ist.

robots.txt und KI-Crawler: erlauben oder blockieren?

Die großen KI-Anbieter schicken eigene Crawler über deine Website. OpenAI nutzt den GPTBot, Anthropic den ClaudeBot, Perplexity den PerplexityBot. Du kannst sie über deine robots.txt steuern — genauso wie du es mit dem Googlebot machst. Die Frage ist nur: Willst du das?

Meine Haltung dazu ist pragmatisch. Wenn du Inhalte veröffentlichst, damit sie gelesen werden, dann solltest du KI-Crawler nicht blockieren. Blockierst du sie, verschwinden deine Inhalte aus den KI-Antworten — und damit aus einem Kanal, den immer mehr Menschen nutzen. Das bedeutet nicht, dass du keine Kontrolle haben solltest. Es bedeutet, dass du bewusst entscheidest. Eine sinnvolle robots.txt für einen Blog, der KI-Sichtbarkeit will, könnte so aussehen:

User-agent: *
Allow: /

User-agent: GPTBot
Allow: /

User-agent: ClaudeBot
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: Google-Extended
Allow: /

Sitemap: https://ruhrcoder.de/sitemap.xml

Google-Extended ist der Crawler, den Google für KI-Training verwendet — getrennt vom normalen Googlebot. Wer hier Disallow setzt, bleibt in der Google-Suche sichtbar, wird aber nicht für Gemini-Antworten herangezogen. Für die meisten kleinen und mittleren Websites ist das ein Nachteil, kein Vorteil.

Warum fließender Text besser funktioniert als Listen

Es gibt eine Ironie in der SEO-Welt. Jahrelang haben uns Tools und Ratgeber gesagt: Mach Aufzählungen, brich den Text auf, Leser scannen nur. Und ja, für das Scannen mit den Augen stimmt das. Aber KI-Systeme scannen nicht. Sie lesen. Sie analysieren den Zusammenhang zwischen Sätzen, die semantische Dichte, die logische Abfolge von Argumenten. Ein gut geschriebener Absatz, der einen Gedanken entwickelt, liefert einem Sprachmodell mehr verwertbare Information als fünf Bulletpoints, die denselben Gedanken in Fragmente zerlegen.

Das heißt nicht, dass Listen verboten sind. Es heißt, dass ein Absatz, der erklärt, warum etwas so ist, für ein KI-System wertvoller ist als eine Liste, die nur aufzählt, was ist. Kontext schlägt Aufzählung.

FAQ-Strukturen: H2 als Frage, Absatz als Antwort

Eines der wirksamsten Muster für KI-Sichtbarkeit ist das einfachste. Du formulierst eine Überschrift als Frage — eine echte Frage, wie ein Mensch sie stellen würde — und beantwortest sie im direkt folgenden Absatz. KI-Systeme extrahieren genau dieses Muster bevorzugt, weil es ihrem eigenen Arbeitsprinzip entspricht: Frage rein, Antwort raus. Und wenn dein Text die Antwort klar und ohne Umschweife liefert, steigt die Wahrscheinlichkeit, dass deine Formulierung in der KI-Antwort auftaucht.

Wenn du dieses Muster zusätzlich mit einem FAQPage-Schema absicherst, schlägst du zwei Fliegen mit einer Klappe. Google kann die Fragen als Rich Result ausspielen, und KI-Systeme erkennen die Struktur noch zuverlässiger. Ein minimales Beispiel:

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "FAQPage",
  "mainEntity": [
    {
      "@type": "Question",
      "name": "Was ist llms.txt?",
      "acceptedAnswer": {
        "@type": "Answer",
        "text": "Eine Textdatei im Root-Verzeichnis deiner Website, die großen Sprachmodellen erklärt, was deine Seite enthält und wo die wichtigsten Inhalte liegen."
      }
    },
    {
      "@type": "Question",
      "name": "Soll ich KI-Crawler in robots.txt blockieren?",
      "acceptedAnswer": {
        "@type": "Answer",
        "text": "Wenn du möchtest, dass deine Inhalte in KI-Antworten auftauchen, solltest du GPTBot, ClaudeBot und PerplexityBot erlauben."
      }
    }
  ]
}
</script>

E-E-A-T: Warum deine Über-mich-Seite wichtiger ist als du denkst

E-E-A-T steht für Experience, Expertise, Authoritativeness, Trustworthiness — Erfahrung, Fachwissen, Autorität und Vertrauenswürdigkeit. Google nutzt diese Signale schon lange, um Inhalte zu bewerten. Aber auch KI-Systeme achten darauf, ob hinter einem Text eine erkennbare Person mit nachvollbarer Expertise steht. Eine Über-mich-Seite mit einem Person-Schema, das deinen Namen, deine Rolle, deine Website und deine Fachgebiete beschreibt, ist kein Nice-to-have. Sie ist das Fundament deiner digitalen Identität.

Wenn ein KI-System einen technischen Artikel über Shopware-Entwicklung findet und gleichzeitig erkennt, dass der Autor sich als Shopware-Entwickler beschreibt, mit einer eigenen Website, einem konsistenten Profil und thematisch passenden weiteren Artikeln — dann ist das ein starkes Signal. Ohne diese Verknüpfung bist du nur ein Name unter einem Text. Mit ihr bist du eine Quelle.

Ein Text, zwei Versionen: vorher und nachher

Stell dir vor, jemand hat folgenden Absatz geschrieben: „Nginx kann als Reverse Proxy genutzt werden. Es gibt verschiedene Konfigurationsmöglichkeiten. Man muss die Config-Datei anpassen. Es ist wichtig, SSL zu konfigurieren. Dann muss man Nginx neu starten.“ Fünf Sätze, wenig Substanz, kein Zusammenhang. Ein KI-System kann daraus kaum eine verwertbare Antwort bauen.

Jetzt die überarbeitete Version: „Nginx fungiert als Reverse Proxy, indem es eingehende Anfragen entgegennimmt und an einen Backend-Server weiterleitet. Dafür definierst du in der Server-Konfiguration einen proxy_pass-Eintrag, der auf die Adresse deines Backends zeigt. In Kombination mit einem SSL-Zertifikat über Let’s Encrypt wird die Verbindung verschlüsselt, ohne dass das Backend selbst HTTPS sprechen muss.“ Drei Sätze, aber jeder davon enthält eine konkrete, extrahierbare Aussage. Genau das macht den Unterschied.

Wie du testest, ob deine Inhalte bei KI-Systemen ankommen

Der einfachste Test ist gleichzeitig der ehrlichste. Öffne ChatGPT, Perplexity oder Gemini und stelle eine Frage zu einem Thema, über das du geschrieben hast. Nicht deinen Domainnamen nennen, nicht nach dir selbst fragen — sondern die Frage so stellen, wie ein Fremder sie stellen würde. „Wie richte ich einen Nginx Reverse Proxy ein?“ oder „Was ist der Unterschied zwischen Article und TechArticle in Schema.org?“. Dann schau, ob deine Inhalte in der Antwort auftauchen — direkt oder sinngemäß.

Wenn deine Inhalte nicht erscheinen, ist das kein Grund zur Panik. Es ist ein Signal. Vielleicht fehlt die Struktur. Vielleicht fehlt die Klarheit. Vielleicht fehlt das Schema. Meistens fehlt alles davon ein bisschen. Die gute Nachricht: Du kannst es ändern. Und du musst dafür keinen einzigen Euro ausgeben — nur sorgfältiger schreiben, klarer strukturieren und den Maschinen sagen, was sie wissen müssen.

Der Anfang, nicht das Ende

KI-Sichtbarkeit ist kein fertiges Feld. Die Regeln sind noch nicht geschrieben, die Standards noch nicht final. llms.txt ist ein Vorschlag, kein offizieller Standard. Die Crawler-Landschaft ändert sich monatlich. Was heute funktioniert, kann in einem halben Jahr überholt sein. Aber die Grundprinzipien werden bleiben: klarer Text, nachvollbare Autorschaft, saubere Struktur, maschinenlesbare Metadaten. Wer das heute umsetzt, hat morgen einen Vorsprung — egal welches KI-System gerade die Antworten liefert.

Die gezeigten Code-Beispiele dienen zur Veranschaulichung. Nutzung auf eigene Verantwortung. Mehr dazu