Как закрыть от индексации сайт / страницу

Name: A2 Маркетинг - агентство интернет-маркетинга
Address: Санкт-Петербург, ш. Революции, д.69, БЦ "Реформа", офис 227А
Telephone: +7 (812) 985-55-53

Как закрыть сайт от индексации

Необходимость закрытия контента сайта или сайта целиком от индексации может возникнуть в следующих случаях:

при изменении структуры URL страниц сайта;
при изменении дизайна и структуры сайта;
когда станица еще не оптимизирована под seo-продвижение;
когда происходит тестирование глобальных изменений на сайте.

Закрыть от индексации можно как весь сайт, так и отдельную страницу. Рассмотрим два основных варианта закрытия от индексации контента – это при помощи метатега robots и директив в файле robots.txt.

Закрыть индексацию с помощью метатега robots

Влиять на индексацию контента сайта поисковыми роботами можно прописывая метатег robots либо в http-заголовке, либо в коде страницы.

Ниже приведен пример запрета на индексацию страницы сайта при помощи добавления метатега в http-заголовок в head-раздел страницы. Если метатег robots прописать в http-заголовке главного шаблона (для сайтов с динамическом формированием контента), то он запретит индексацию всего сайта.

<!DOCTYPE html>

<html>

<head>

........

<meta name="robots" content="noindex" />

........

</head>

<body>

</body>

</html>

Чтобы запретить сканирование определенному поисковому роботу, то необходимо указать его user-agent. Пример с роботом Google:

<meta name="googlebot" content="noindex" />

В случае, если нет технической возможности добавить метатег в код http-заголовка, то этот же метатег можно добавить в код страницы, он запретит индексирование страницы всем поисковым роботам:

<meta name="robots" content="noindex, nofollow">

Также можно запретить индексацию всех изображений, размещенных на странице:

<meta name="robots" content="noimageindex">

Закрыть индексацию с помощью robots.txt

При помощи директив в файле robots.txt можно ограничить индексацию не только всего сайта, но и отдельных страниц, разделов, папок и файлов сайта. Несмотря на то, что директивы файла robots.txt носят рекомендательный характер и многие краулеры могут их не исполнять, роботы Google и Яндекс работают с файлом достаточно корректно.

Запрет на индексацию при помощи директив файла robots.txt:

User-agent: *Disallow: / - всего сайта всеми поисковыми роботами;
User-agent: YandexDisallow: / - всего сайта поисковым роботом Яндекса;
Disallow: /papka/ - отдельной папки всеми поисковыми роботами;
User-agent: YandexDisallow: /papka/file - отдельного файла поисковым роботом Яндекс.

Андрей

13 Февраля 22

2462