Глоссарий AI Readiness
Рабочий глоссарий терминов из AI-readiness аудитов, Generative Engine Optimization (GEO) и LLM-visibility консалтинга. Кросс-референс с нашим open-source аудит-фреймворком.
AI-readiness
Мера того, насколько контент сайта, его структура и метаданные понятны для LLM-кроулеров (GPTBot, ClaudeBot, PerplexityBot, Google-Extended). Оценивается 0–125 баллов по 32 критериям в нашем open framework. Сайты с высоким AI-readiness чаще цитируются AI-агентами в ответах пользователям.
AI Visibility Score
Композитная метрика присутствия бренда в AI-ответах. Включает: прямые упоминания, цитирования (домен как источник), prominence (ранг в AI-ответе) и benchmark против конкурентов. Трекается tools'ами вроде Profound, Athena HQ, Otterly.AI обычно как 0–100 score.
Answer-first format
Контент-паттерн где основной ответ на implicit-вопрос страницы появляется в первых 30% (обычно первые 40–60 слов). Цитируется LLM'ами на 30–40% чаще, потому что они извлекают lead-ответ для preview.
CITABLE framework
Четырёхкомпонентная модель оценки likelihood цитирования: Citation hooks, Intent match, Time-current data, Authority signals, Biased toward earned media, Load of evidence, Exact-extractable structure.
Citation hook
Конкретный контентный элемент, повышающий citation likelihood:
- Verifiable statistic с источником: +22%
- Strategic pull quote: +37%
- Original research / proprietary data: +30–40%
dateModified
Schema.org property последнего значимого апдейта страницы. Критично для recency signals. Рекомендуемая периодичность обновления key pages: каждые 60 дней. PerplexityBot особенно weights этот сигнал высоко.
E-E-A-T для LLM
Experience, Expertise, Authoritativeness, Trustworthiness — адаптация Google E-E-A-T для AI-search. LLM оценивают: cross-platform presence (entity graph), schema.org Person + sameAs, consistent messaging across earned media, verifiable claims. Веса отличаются от Google E-E-A-T.
E1 gate
Жёсткое pre-condition в нашем audit-фреймворке: страница должна отдавать контент без выполнения JavaScript. LLM-кроулеры (GPTBot, ClaudeBot, PerplexityBot) JS не исполняют. SPA без SSR проваливают E1 катастрофически — score становится UNRELIABLE. Только Google AI Overview рендерит JS через Chromium-based crawler.
Entity authority
Сила признанной идентичности бренда в открытом вебе — измеряется: schema consistency, sameAs links, bio consistency на платформах, GitHub/npm/social footprint, external mentions. Отдельное измерение от technical AI-readiness. Наш companion checklist оценивает по 13 критериям.
FAQPage schema
JSON-LD schema.org тип с mainEntity содержащим Question объекты с acceptedAnswer.text. Best practice: встраивать FAQ-секции в substantive pages (страницы услуг, прайсинг), не standalone /faq страницы. Embedded FAQs в ~47% цитируемых страниц; standalone FAQ цитируются <1%.
Generative Engine Optimization (GEO)
Дисциплина оптимизации контента под цитирование AI-движками (ChatGPT, Claude, Perplexity, Google AIO, Gemini). Отличается от SEO: фокус на semantic structure, evidence-based content, schema enrichment, earned media — не keywords + backlinks. Академические исследования показывают, что GEO-стратегии повышают AI-видимость до 40%.
GPTBot
Training-кроулер OpenAI. User-Agent: GPTBot/1.1. Не выполняет JavaScript. Honors robots.txt. Блокировка GPTBot не запрещает OpenAI Search (OAI-SearchBot) индексировать — это отдельный бот. IP-диапазоны: openai.com/gptbot.json.
Hybrid search
Паттерн retrieval, комбинирующий dense vector search (semantic similarity) с sparse keyword search (BM25). Используется в современных RAG-pipelines (MEGA-RAG, Stable-RAG). Schema markup + clean text + external references — все вносят свои signals в hybrid retrieval.
JSON-LD
JSON-based Linked Data — формат schema.org разметки в <script type="application/ld+json"> блоках. Предпочтителен над microdata/RDFa у всех major search engines и AI-движков. Поддерживает @graph для linking related entities (Article → Author → Organization) в одном блоке.
llms.txt
Proposed standard (от Jeremy Howard / Answer.AI, сентябрь 2024) — Markdown-файл в корне сайта (/llms.txt) предоставляющий LLM-агентам чистый index контента. Формат: H1 (имя сайта) → blockquote (summary) → H2 секции с Markdown-ссылками. Adoption ~10–13% web, выше среди developer SaaS. Reality check: ни один major AI-провайдер не подтвердил использование для primary grounding — но IDE-агенты (Cursor, Cline, Aider) активно используют для inference-time context.
llms-full.txt
Companion к llms.txt: полный текст ключевых страниц конкатенированный в один Markdown-файл (до ~10 МБ). Предназначен для bulk ingestion AI-агентами, которым нужно потребить весь сайт без обхода отдельных страниц.
.md mirror
Per-page Markdown-версия на URL <url>.md (например, /services/ai-optimisation.md). Самый высокий ROI fix для SPA, которые не могут retrofit SSR. Даёт AI-кроулерам clean, unstyled, JS-free версию любой страницы. Реализован в нашем post-build script.
Perplexity-User
User-triggered fetch бот Perplexity. ⚠️ Игнорирует robots.txt — контроль только через WAF/IP filtering. User-Agent: Perplexity-User/1.0. Активируется когда пользователь кликает citation link в Perplexity-ответе или делает real-time запрос. Остальные боты Perplexity (PerplexityBot) honor robots.txt нормально.
Prominence (в AI)
Frequency и rank, с которыми бренд появляется в AI-ответах на category-relevant queries. Измеряется: 0% (никогда не цитируется) → 100% (всегда). Target для B2B SaaS после implementation: 50–70% за 90 дней.
RAG (Retrieval-Augmented Generation)
Техника, при которой LLM извлекают relevant документы из external knowledge base перед генерацией ответа. Underpins большинство AI-search продуктов (Perplexity, Google AIO, Bing Chat). Улучшения вроде MEGA-RAG (hybrid sources), Stable-RAG (permutation invariance), DRAG (debate-augmented) — активные research areas.
Recency signal
Маркеры свежести контента: <lastmod> в sitemap, dateModified в JSON-LD, Last-Modified HTTP header. RAG-системы предпочитают контент updated 30–90 дней для fast-changing topics. AI цитирует контент <12 мес значительно чаще older content.
sameAs (schema.org property)
Schema.org property, связывающая entity с её identities elsewhere в вебе — обычно Twitter, LinkedIn, GitHub, Wikipedia. Усиливает entity graph для LLM. Best practice: поддерживать минимум 5 platform URLs per Person/Organization. Inconsistent handle styles (an-ivannikov vs ivannikov_pro) требуют explicit alternateName для resolve.
Schema.org
Словарь типов и свойств для structured data, поддерживаемый Google, Bing, Yahoo, Yandex. Foundational для AI-readiness — даёт explicit entity relationships вместо NLP-inference. Priority типы для AI: Organization, Person, Service, Offer, FAQPage, Article/TechArticle, HowTo, BreadcrumbList.
Schema.org Service
Тип schema.org, описывающий service offering. Required fields: name, description, provider (Organization или Person). Recommended: serviceType, areaServed, offers (с Offer для прайсинга), hasOfferCatalog. Критично для B2B SaaS: AI извлекает pricing/offering details прямо в ответы.
Service-Level AI optimisation tier
Наш internal tiering для AI Optimisation engagements: Light Audit ($1,500) → Audit Plus ($2.5K–$3.5K, с entity authority) → Implementation ($8K–$15K, делаем фиксы) → Retainer ($5K–$8K/мес, ongoing content + tracking). См. услуга AI Optimisation.
SoftwareApplication schema
Schema.org тип для software-продуктов. Required: name, applicationCategory, operatingSystem. Recommended: softwareVersion, featureList, offers. Используется для citable product pages.
Sub-query coverage
Практика создания контента, ранжирующегося под sub-queries beneath a main keyword. Ranking только под main query → some citation. Ranking под main + 5–10 sub-queries → +161% citation likelihood. Тактика: H3 sub-sections отвечающие на специфические аспекты main topic'а страницы.
TechArticle schema
Schema.org тип, расширяющий Article для technical/developer content. Recommended fields: proficiencyLevel ("Beginner" / "Intermediate" / "Expert"), dependencies. Используется в наших блог-постах с тегами ai|llm|rag|geo|web3|solidity|api.
Zero-click reality
В AI-mode search, до 93% сессий завершаются без клика по ссылке — AI-ответ satisfies user in-conversation. Visibility внутри AI-ответа более ценна чем link click. Меняет success metric с CTR на citation rate.