GLO/001

Wie ChatGPT Webseiten zitiert.

MAI 06 · 2026

GPTBot crawlt seit August 2024 das offene Web. Was deine Website jetzt braucht, damit ChatGPT, Claude und Perplexity dich nicht ignorieren — sondern als Quelle nennen.

TL;DR

ChatGPT, Claude und Perplexity zitieren primär aus drei Faktoren: Schema.org-Markup, Speakable-Annotation und llms.txt. Wer GPTBot blockiert oder strukturlosen Content liefert, wird nicht zitiert. Konkrete Hebel + Code-Beispiele unten.

Ende 2024 hat OpenAI das Web öffentlich crawlbar gemacht. GPTBot wandert seitdem durchs offene Internet und sammelt Inhalte, die ChatGPT in Antworten zitiert. Das gleiche tun ClaudeBot und PerplexityBot. Wer in deren Antworten auftauchen will, muss maschinenlesbar werden — nicht nur menschenlesbar. Die Frage ist also nicht mehr, ob deine Inhalte für Menschen funktionieren, sondern ob sie für Bots extrahierbar sind. Das ist eine fundamental andere Designaufgabe.

Was sich verschiebt

Klassische Suche funktioniert seit 25 Jahren nach demselben Muster: Nutzer tippt Keyword, sieht zehn blaue Links, klickt einen davon. Die KI-Suche bricht das Schema komplett auf. Nutzer stellt eine vollständig formulierte Frage, bekommt eine fertige Antwort und sieht — wenn überhaupt — zwei oder drei Quellenangaben am Rand. Wer in diesen Quellen fehlt, verliert den Erstkontakt zum potentiellen Kunden, bevor klassisches SEO überhaupt zur Anwendung kommt. Das Spielfeld hat sich grundlegend verändert, aber die meisten Unternehmen optimieren noch nach Regeln aus 2018.

Aktuelle Studien zeigen: Rund 50% der Nutzer suchen 2026 Antworten direkt mit KI-Tools statt klassischer Suchmaschinen. Die Verschiebung passiert jetzt — nicht 2028, nicht in der Zukunft. Wer heute nicht beginnt, sich zitierbar zu machen, hat in 12 bis 18 Monaten ein strukturelles Sichtbarkeitsproblem, das nicht mehr mit klassischem SEO-Budget reparierbar ist.

Quelle: Media Perspektiven 2026 · Conductor AI Search Report Q1/2026

Die drei Hebel für AI-Citation

Drei Hebel entscheiden, ob du zitiert wirst — und 90% der Sites halten am falschen fest, weil sie glauben, sie decken ihn schon ab.

Dietmar Straubinger Founder, Lab7
  • Schema.org JSON-LD

    Strukturierte Daten machen Content für Bots maschinenlesbar. Organization, WebSite und BreadcrumbList sind die Basis — ohne die bist du für AI-Crawler entity-los. FAQPage und Service helfen für GEO-Citation, Article mit datePublished, dateModified und verlinktem Person-Schema für E-E-A-T. Was wirklich entscheidet: Schema muss server-side im initialen HTML stehen. JavaScript-injected Schema (z.B. über GTM) sehen viele AI-Bots gar nicht — sie führen kein JS aus.

  • Speakable cssSelector

    Sagt der KI explizit: „Diese Elemente sind die Antwort, lies sie vor." Über SpeakableSpecification mit konkretem cssSelector-Array. Voice-AI-First — die meisten Konkurrenten ignorieren das noch komplett. Bei Lab7 gehört es zum Standard-Setup, weil ChatGPT Voice und Perplexity Voice langsam aber stetig wachsen.

  • llms.txt im Root

    Eine kompakte Markdown-Datei unter /llms.txt, die der KI Sitemap, Themen und Antworten serviert. Folgt der llmstxt.org-Spec (Proposal von Jeremy Howard / Answer.AI). Adoption bei AI-Crawlern ist im Aufbau — Anthropic, OpenAI und Perplexity haben das Format nicht offiziell als Standard bestätigt. Wir liefern es trotzdem: 5% Aufwand für eine potenziell hohe Citation-Brücke ist ein guter Trade.

Bot-Übersicht — wer crawlt was

Nicht jeder Bot crawlt gleich. Manche kommen wöchentlich, andere täglich, einige in Echtzeit. Hier die wichtigsten User-Agents Stand Mai 2026:

Bot Provider Crawl-Frequenz Cite-Effekt
GPTBot OpenAI Wöchentlich ChatGPT Answers
ClaudeBot Anthropic Wöchentlich Claude Sources
PerplexityBot Perplexity Real-time Perplexity Sources
Google-Extended Google Täglich Gemini, AI Overviews
Bytespider ByteDance Täglich Doubao

Schema.org-Beispiel — BlogPosting mit Speakable

So sieht der JSON-LD-Block aus, der genau diesen Artikel KI-zitierbar macht. Im Vergleich zu Standard-Implementierungen ist hier der speakable-Block der entscheidende Unterschied: er nennt nicht nur Text, sondern konkrete CSS-Selektoren auf der Seite. Damit weiß die Voice-AI exakt, wo auf der Seite die vorlesbare Antwort sitzt — nicht nur, dass es eine gibt:

json
{
  "@context": "https://schema.org",
  "@type": "BlogPosting",
  "headline": "Wie ChatGPT Webseiten zitiert.",
  "datePublished": "2026-05-06",
  "author": {
    "@type": "Person",
    "name": "Dietmar Straubinger"
  },
  "speakable": {
    "@type": "SpeakableSpecification",
    "cssSelector": [
      ".l7-banner__title",
      ".l7-post__lead",
      ".l7-post__tldr p",
      ".l7-post__content h2"
    ]
  }
}

Was viele KMUs falsch machen

  • GPTBot pauschal blockiert

    Aus diffuser Angst vor Datenklau steht in vielen robots.txt Dateien eine pauschale Blockade: User-agent: GPTBot Disallow: /. Das blockiert gleichzeitig deine Sichtbarkeit. Wer nicht gecrawlt wird, kann nicht zitiert werden — so einfach ist die Logik. Sinnvoller: nur sensitive Bereiche wie Login-Pages, Konten und Checkout blockieren, Marketing-Content explizit allowen. So bleibt das Geschäftsgeheimnis geschützt und die öffentliche Marke zitierbar.

  • Schema „auch noch" — statt von Anfang an

    Schema-Markup wird oft nachträglich draufgeklatscht über Yoast, Rank Math oder ähnliche SEO-Plugins. Das Resultat ist meistens inkonsistent: doppelte Einträge, fehlerhafte Properties, falsche Hierarchien. Schema gehört ins Fundament der Website, nicht in den Aftermarket. Wer die Themes oder Templates direkt entsprechend baut, bekommt eine konsistente, valide Datenbasis, die Google und KI gleichermaßen lesen können.

  • Content für Menschen statt für Bots

    „Unsere innovative Lösung optimiert Ihre Geschäftsprozesse." Aus solchen Sätzen kann eine KI nichts extrahieren. Es fehlen konkrete Antworten, Zahlen, Beispiele und FAQ-Blöcke. Wer für KI-Zitierbarkeit schreibt, denkt in Frage-Antwort-Paaren, nutzt strukturierte Listen mit echten Fakten und hält Absätze kurz genug, dass eine KI sie als geschlossene Einheit verarbeiten kann.

GEO ist nicht SEO 2.0. GEO ist die Antwort auf eine Frage, die SEO nicht stellt: Bist du KI-zitierbar?

Wie wir bei Lab7 das angehen

Wir bauen GEO als integriertes Modul, abgestimmt auf unsere Theme-Architektur — nicht als generisches SEO-Plugin obendrauf. Unser L7 Cite Modul kennt jeden Section-Type, generiert Schema.org passend dazu, Speakable cssSelectors pro Page und llms.txt automatisch aus den aktiven Inhalten. Plus eine Content-Optimierung, die für KI-Lesbarkeit gemacht ist. Das Ganze läuft typischerweise in 8 bis 12 Wochen vom ersten Audit bis zum Go-Live, je nach Umfang der bestehenden Site und der Tiefe der gewünschten Schema-Strukturen.

Häufige Fragen