Question 1

Что такое robots.txt?

Accepted Answer

Robots.txt — это текстовый файл в корне сайта, который управляет поведением поисковых роботов. Он указывает, какие страницы и разделы можно краулить, а какие — нет. Файл читается всеми поисковыми системами (Google, Яндекс, Bing) перед началом обхода сайта.

Question 2

Как Disallow: / влияет на индексацию?

Accepted Answer

Disallow: / в группе User-agent: * или User-agent: Googlebot означает полный запрет на краулинг сайта. Это самая критичная ошибка в robots.txt — сайт перестаёт индексироваться. Проверьте, что такой записи нет на боевом сайте, особенно после переноса с тестового домена.

Question 3

Что делает директива Crawl-delay?

Accepted Answer

Crawl-delay задаёт минимальную паузу в секундах между запросами поискового робота. Google официально не поддерживает эту директиву, Яндекс — поддерживает. Значение выше 5 секунд значительно замедляет переобход сайта, что критично для больших сайтов с частыми обновлениями.

Question 4

Нужно ли указывать Sitemap в robots.txt?

Accepted Answer

Да, рекомендуется. Директива Sitemap: https://example.com/sitemap.xml помогает поисковым системам быстро найти карту сайта, даже если она расположена не по стандартному адресу /sitemap.xml. Яндекс и Google обрабатывают эту директиву автоматически.

Question 5

В чём разница между Allow и Disallow?

Accepted Answer

Disallow запрещает роботу обходить указанные URL. Allow явно разрешает — используется для исключений из Disallow. Например, Disallow: /private/ запрещает весь раздел, а Allow: /private/public.html разрешает один конкретный файл. При конфликте приоритет имеет более длинный путь.

Question 6

Почему опасно блокировать CSS и JS в robots.txt?

Accepted Answer

Google рендерит страницы как браузер. Если CSS и JS заблокированы в robots.txt, Googlebot не сможет корректно отрисовать страницу и оценить её контент. Это может привести к снижению позиций. Рекомендация Google: не блокировать CSS и JS-ресурсы.

Question 7

Как работает директива Host?

Accepted Answer

Host — директива Яндекса для указания предпочтительного зеркала сайта (например, с www или без). Не поддерживается Google. Если у сайта есть несколько зеркал (http/https, www/без www), директива Host помогает Яндексу правильно определить главное зеркало.

Question 8

Инструмент бесплатный?

Accepted Answer

Да, проверка robots.txt полностью бесплатна и не требует регистрации. Для полного SEO-аудита сайта (до 50 страниц бесплатно) воспользуйтесь основным инструментом SEO Crawler.

Проверка robots.txt онлайн

Нужен полный аудит сайта?

Robots.txt: что это такое и как влияет на SEO

Критические ошибки, которые нужно исправить сразу

Что нельзя блокировать в robots.txt

Sitemap в robots.txt

Crawl-delay и краулинговый бюджет

Разница robots.txt и тега noindex

Частые вопросы

Полезные статьи

Похожие инструменты