| № | Что проверяем | Комментарий |
|---|---|---|
| 1 | Настроен HTTPS-протокол. |
- Нет ошибок.
- Нет ссылок на HTTP.
- С HTTP настроена переадресация (301-й редирект) на HTTPS на всех страницах сайта.
| | 2 | Зеркала с WWW и без WWW склеены корректно. | Осуществляется 301-редирект с одного зеркала на другое (не важно, на какое, главное, чтобы для всех страниц было одинаково). | | 3 | У сайта нет зеркал по другим доменам. | Если есть, то настроен 301-редирект на основной домен. | | 4 | Тестовые площадки (тестовые домены, поддомены, страницы), если есть, закрыты от индексирования. | В файле robots.txt для тестового домена/поддомена прописано:
User-agent: * Disallow: /
Для закрытия страницы от индексирования в robots.txt прописано для всех имеющихся User-agent:
Disallow: /url-of-the-page
(url-of-the-page заменить на URL соответствующей тестовой страницы, например, /test/ )
| | 5 | Технические дубли главной страницы отсутствуют. | Например, /index.php, /index.html, /index.htm. Могут быть другие. | | 6 | Технические дубли со слешем и без слеша отсутствуют. | | | 7 | Различных вариантов URL для первой страницы пагинации нет. | Если есть, то корректно настроен тег canonical | | 8 | Дублирующиеся страницы не обнаружены. | Если на сайте есть страницы товаров, услуг, статей, новостей и т.д., которые могут одновременно находиться в разных категориях, проверить, чтобы на сайте не было дублей таких страниц. Если есть, т.е. одна и та же страница может быть доступна по двум и более URL, то нужно проверить, чтобы на страницах дублей корректно прописывался canonical с ссылкой на основной (primary) URL. То же относится к страницам пагинации — они должны индексироваться, но для всех страниц, начиная со второй, должен прописываться canonical с ссылкой на первую страницу. | | 9 | CSS и JS файлы открыты для индексации. | В robots.txt для роботов Яндекс и Google прописано:
Allow: *.css Allow: *.js
Обратите внимание, что знака * может быть не достаточно. Например, если есть правило
Disallow: /wp-
скрипт при этом находится по ссылке /wp-content/js/scripts.js, то для необходимо будет прописать так:
Allow: /wp-*.js
Просканируйте все скрипты и убедитесь, что они все открыты для поисковых роботов.
| | 10 | Файлы изображений и документов для скачивания открыты для индексации. | Проверить, чтобы все файлы JPG, JPEG, GIF, PNG, WEBP, PDF, DOC, DOCX, XLS, XLSX, TTF, WOFF, EOT индексировались на сайте роботами Яндекса и Google. Другими поисковыми системами по необходимости, если важно.
Также могут быть и другие расширения файлов, которые вы используете на вашем сайте.
| | 11 | Flash не обнаружен. | | | 12 | Сайт добавлен в Яндекс.Вебмастер.
Сайт добавлен в Google Search Console (Гугл Вебмастер).
| Также может быть полезно добавить в Вебмастер Mail.Ru. и Bing, где можно получить дополнительные данные об индексировании сайта, а также сделать ряд дополнительных настроек специально для Mail.Ru и Bing. | | 13 | Счетчики статистики Яндекс.Метрика и Google Analytics установлены корректно на всех страницах сайта. |
- На сайте установлен счетчик Яндекс.Метрики на всех страницах сайта по одному разу, код счетчика корректный, размещен сразу после тега .
- На сайте установлен счетчик Google Analytics на всех страницах сайта по одному разу, код счетчика корректный, рамзещен после тега .
- Установлена связь счетчика Google Analytics с сайтом в Google Search Console.
- Установлена связь счетчика Яндекс.Метрики с Яндекс.Вебмастером.
- Корректно настроены целей в Google Analytics и Яндекс.Метрике.
| | 14 | URL страниц настроены в соответствии со стандартами ЧПУ. | Если URL были изменены, то настроены 301-редиректы со старой ссылки на новую. Это важно, если есть внешние ссылки на эти страницы. | | 15 | Все ссылки унифицированы по регистру букв. | Удобнее всего, чтобы всё было строчными буквами, если по каким-то причинам используются прописные буквы, регистр должен быть везде соблюден – ссылки /denisbisteinoff/ и /DenisBisteinoff/ для робота разные. | | 16 | Страниц со статус-кодом 3xx нет, либо их количество сведено к минимуму. | | | 17 | Нет множественных редиректов | Т.е. если не должно быть цепочек:
ссылка1 (301-редирект) ссылка2 (301-редирект) … ссылка****N
Должно быть сразу: ссылка1 (301-редирект) ссылка****N
| | 18 | Страница ошибки 404 формируется корректно, отдается статус-код 404. | Страница 404 должна быть в стиле сайта, с понятным сообщением о дальнейших шагах и строкой поиска по сайту. | | 19 | Страниц со статус-кодом 4xx и 5xx нет. |
- Статус всех имеющихся страниц сайта должен быть 200. Допускаются коды 3xx.
- Особое внимание, если страница, которая должна индексироваться, открывается для пользователя корректно, но при этом для робота отдается код 4xx или 5хх. Робот не сможет ее проиндексировать в этом случае.
- Проверку необходимо сделать отдельно для основных роботов Яндекса и Гугл (например, некоторые зарубежные плагины для ряда CMS могут запрещать индексирование сайта всем не известным им роботам, в т.ч. роботам Яндекса).
| | 20 | Файл robots.txt есть, настроен корректно. Сайт индексируется поисковыми системами Google и Яндекс. |
- Проверить, что в robots.txt не заблокировано ничего лишнего.
- Проверить, что на данный момент проиндексировано Яндексом и Google. Если в поиске присутствуют страницы, которые не нужно индексировать, их нужно закрыть в robots.txt (прежде всего, страницы с параметрами: дубли форм, поиск, сортировки, фильтры товаров, корзина, личный кабинет, персональные данные).
- Просканировать сайт, какие страницы могут индексироваться. Все лишнее закрыть от индексации.
| | 21 | Файл sitemap.xml есть, формируется корректно, регулярно обновляется.
Ссылка на него указана в robots.txt
| Может быть несколько вложенных sitemap. Рекомендуется, чтобы эти файлы повторяли структуру сайта. | | 22 | «Хлебные крошки» настроены. | | | 23 | Сайт проверен на кроссбраузерность: страницы сайта отображаются схожим образом в различных браузерах, модули на JavaScript функционируют корректно. | | | 24 | Нет критических ошибок в HTML-коде по стандарту W3C. | |