Перейти к содержимому
Попробовать

Проверка robots.txt онлайн

Введите URL сайта и получите разбор robots.txt: правила, блокировки для ботов, директиву Sitemap и потенциальные ошибки.

Нужен полный аудит сайта?

Проверьте все страницы сразу — до 50 бесплатно. Получите отчёт в PDF и XLSX за минуту.

Начать аудит бесплатно

Robots.txt: что это такое и как влияет на SEO

Robots.txt — один из базовых файлов технического SEO. Он управляет краулингом: какие разделы робот обходит, а какие пропускает. Ошибка в одной строке может закрыть важные страницы от обхода и повлиять на видимость сайта.

Критическая ошибка: Disallow: /

Если правило Disallow: / стоит в группе User-agent: * или у нужного бота, краулинг всего сайта блокируется. Такое часто случается после переноса проекта с тестовой среды. Этот пункт стоит проверять в первую очередь.

Не блокируйте служебные ресурсы без причины

Если закрыть CSS и JavaScript, робот может увидеть страницу не так, как пользователь. Из-за этого страница индексируется хуже и появляются ложные проблемы в рендеринге. Поэтому пути к стилям и скриптам обычно оставляют открытыми.

Sitemap в robots.txt

Директива Sitemap: помогает поисковым системам быстрее найти карту сайта. Это особенно полезно, если sitemap лежит не по стандартному адресу. Лучше указывать полный URL карты прямо в robots.txt.

Crawl-delay и краулинговый бюджет

Crawl-delay работает в Яндексе, но обычно игнорируется Google. Если поставить слишком большую паузу, переобход сайта заметно замедлится. Используйте эту директиву аккуратно, особенно на крупных и часто обновляемых проектах.

Robots.txt и noindex — это не одно и то же

Robots.txt управляет обходом, а тег noindex управляет попаданием страницы в индекс. Если важно именно убрать страницу из поиска, одного запрета в robots.txt может быть недостаточно. Всегда разделяйте эти задачи при настройке.

Частые вопросы

Что такое robots.txt?

Robots.txt — это файл в корне сайта с правилами для поисковых ботов. В нем указывают, какие разделы можно обходить, а какие нужно закрыть от краулинга.

Как Disallow: / влияет на индексацию?

Такое правило закрывает обход всего сайта для выбранного робота. Это критичная ошибка, которую чаще всего заносят случайно после миграции или релиза.

Что делает директива Crawl-delay?

Она задает паузу между запросами робота. В Яндексе это работает, в Google обычно нет. Слишком большой интервал замедляет переобход страниц.

Нужно ли указывать Sitemap в robots.txt?

Да, лучше указывать. Это помогает ботам быстрее найти карту сайта, особенно если она размещена не по стандартному пути.

Почему опасно блокировать CSS и JS в robots.txt?

Поисковик рендерит страницу с учетом стилей и скриптов. Если их закрыть, бот видит искаженную версию документа и может хуже оценивать страницу.

В чём разница между Allow и Disallow?

Disallow запрещает обход, Allow открывает конкретные исключения внутри запрета. При конфликте обычно выигрывает более точное и длинное правило.

Как работает директива Host?

Host используют в Яндексе, чтобы указать главное зеркало сайта. Для Google эта директива не является рабочим сигналом.

Инструмент бесплатный?

Да, инструмент бесплатный и без регистрации. Если нужен полный срез по сайту, запустите аудит в SEO Crawler.

Полезные статьи

Похожие инструменты