Пример SEO-аудита интернет-магазина (часть 1)

Начиная с этой статьи, мы расскажем, как делаем полный SEO-аудит интернет-магазина, хотя для информационных или сайтов услуг многие параметры пересекаются. Технические параметры везде одинаковы, а вот юзабилити и семантика, могут отличаться по содержанию, т.к. сайты решают разные задачи (купить товар, заказать услугу и получить ответ на вопрос), но подход по большей части везде будет один и тот же.

Мы не будем говорить о внешней оптимизации в виде наличия сообществ в социальных сетях, ссылочной массы и других методах данного вида продвижения, а только о внутренних факторах.

Полный материал будет состоять из трех частей:

  1. Технический SEO-аудит
  2. Юзабилити аудит
  3. Семантический аудит

И в этой статье речь пойдет о технической оптимизации и настройке сайта интернет-магазина. В качестве примера рассмотрим интернет-магазин по продаже сантехники. Содержание статьи можно рассматривать как чек-лист основных технических параметров, которые необходимо настроить /исправить для нормальной индексации поисковыми системами и пользователей сайта.

Содержание статьи:

  1. Общая информация о домене: возраст, тИЦ, страниц в Yandex, страниц в Google
  2. Время ответа сервера
  3. Скорость загрузки страниц
  4. Наличие зеркала сайта (с «www» или без «www»)
  5. Редирект с http версии сайта на https (при наличии)
  6. Дубли главной страницы (index.php, index.html, index.htm и т.д.)
  7. Проверка файла robots.txt
  8. Проверка карты сайта sitemap.xml
  9. Проверка ЧПУ страниц
  10. Проверка страницы ошибки 404
  11. Анализ страниц на 3ХХ, 4ХХ, 5ХХ ответы
  12. Наличие битых ссылок, картинок и прочего мусора в HTML-коде
  13. Наличие внешних ссылок, их количество и код ответа
  14. Наличие блокированных страниц в robots.txt
  15. Наличие страниц с meta noindex
  16. Индексация служебных страниц
  17. Индексация дублированных элементов навигации
  18. Индексация служебных текстовых элементов
  19. Наличие в HTML-коде Display: none
  20. Проверка наличия пагинатора и rel=canonical
  21. Проверка meta title: наличие, длина, дублирование
  22. Проверка meta description: наличие, длина, дублирование
  23. Проверка заголовка h1: количество, длина, дублирование
  24. Анализ изображений на наличие атрибута Alt

Технический SEO-аудит интернет-магазина сантехники svdd.ru

Общая информация о домене

Домен: svdd.ru
Возраст: 9 лет 2 месяцев
тИЦ: 70
Страниц в Google: 4,890
Страниц в Yandex: 13,923

Пояснения
Возраст домена может говорить об авторитетности ресурса. Как правило, чем старше домен, тем лучше он ранжируется в поиске. Если домен молодой, до 1 года, то резкого роста поискового трафика ожидать не стоит.

ТИЦ – тематический индекс цитирования. Данный показатель так же говорит нам об авторитетности ресурса или, как минимум, о наличии внешней ссылочной массы, которую тоже нужно анализировать.

Возраст домена и тИЦ прежде всего нужны для сравнения с конкурентами, выявить самого молодого и слабого, но который находится наряду с флагманами ниши и посмотреть что он делает с сайтом, чтобы ранжироваться так высоко.

Большая разница в количестве страниц в индексе Google и Яндекса может свидетельствовать о неправильной настройке robots.txt, попадании под фильтр в одной из поисковых систем или еще о какой-то ошибке, которую нужно отыскать и исправить.

Время ответа сервера

Главная – 700-800 мс
Категория – 600-700 мс
Страница товара – 600-700 мс

Время ответа должно быть 200-300 мс, т.е. сейчас ответ слишком долгий и нужно стремиться к нормальному показателю.

Рекомендации: Сократить время ответа сервера до 200-300 мс.

Скорость загрузки страниц

Главная – 10,408 сек.
Категория – 8,096 сек.
Страница товара – 8,5 сек.

Оптимальное время загрузки 2-3 секунды, но для интернет-магазинов с большим количеством товаров трудно достичь такого значения, поэтому сравним время загрузки страниц с сайтами конкурентов, которых возьмем из ТОП-10 выдачи Яндекса по одному из целевых запросов.

Т.к. львиная доля трафика приходится на категории, то для вывода будет достаточно сравнения времени загрузки аналогичных страниц.

Конкурент 1 – 4,593 сек.
Конкурент 2 – 5,964 сек.
Конкурент 3 – 9,485 сек.
Конкурент 4 – 5,401 сек.
Конкурент 5 – 2,314 сек.
Конкурент 6 – 7,446 сек.
Конкурент 7 – 6,999 сек.

Видим, что в большинстве случаев время загрузки меньше, чем у исследуемого сайта, поэтому, всевозможными средствами нужно стремиться к его уменьшению и достичь хотя бы среднего значения - 6 секунд.

Рекомендации: Сократить время загрузки страниц категорий до 6 сек.

Наличие зеркала сайта (с «www» или без «www»)

Склейка зеркал проведена корректно (через 301 редирект).

Пояснения
Чтобы избежать дублирования страниц сайта в индексе поисковых систем, необходимо провести склейку домена с WWW и без. Также, склейка необходима для пользователей, которые вводят доменное имя сайта в адресную строку браузера, - чтобы имени домена с указанием зоны, было достаточно для попадания на интересующий их сайт. Склейку нужно проводить с помощью 301 редиректа.

Редирект с http версии сайта на https (при наличии)

Редирект настроен корректно.

Пояснения
Протокол https для пользователя — залог безопасности его данных (в том числе, платежных реквизитов), а для поисковых систем — сигнал для ранжирования. В 2016 представители Google официально заявили, что с января 2017 безопасное соединение станет одним из официальных алгоритмов. То есть, сайты на http будут постепенно терять свои позиции.

Дубли главной страницы (index.php, index.html, index.htm и т.д.)

Отсутствуют.

Проверка файла robots.txt

Файл доступен.

Пояснения
Сессия начинается с загрузки файла robots.txt. Если файл отсутствует, не является текстовым или на запрос робота возвращается HTTP-статус отличный от 200 OK, робот считает, что доступ к документам не ограничен. Это может привести к попаданию в индекс нежелательных файлов и каталогов сайта.

Проверка карты сайта sitemap.xml

Файл доступен.

Пояснения
Наличие карты сайта позволяет роботу поисковой системы быстрее узнать и проиндексировать как можно больше страниц сайта, в случае отсутствия карты сайта, поиск страниц глубокой вложенности может затянуться.

Проверка ЧПУ страниц

ЧПУ в порядке.

Пояснения
Все URLs должны быть логичными и легко воспринимаемыми посетителями. ЧПУ лучше ранжируются в поисковой выдаче и приятнее выглядят на сайтах и в социальных сетях (если не прятать адрес сайта в анкор). По возможности, лучше не использовать нижнее подчеркивание в адресах.

Проверка страницы ошибки 404

Страница работает и отображается корректно.

Пояснения
404 страница нужна обязательно, чтобы после отключения или удаления какой-либо страницы с сайта, по ранее работающему адресу, показывалось сообщение для пользователей и был соответствующий 404 код ответа сервера. 404 ответ сервера избавит от необходимости следить за мусорными страницами в индексе, т.к. поисковая система сама их исключит.

Анализ страниц на 3хх, 4хх, 5хх ответы

0 Страниц имеют 3xx ответ
0 Страниц имеют 4xx ответ
0 Страниц имеют 5xx ответ

Пояснения
Наличие на сайте ссылок на страницы с 3хх, 4хх, 5хх кодом ответа необходимо взять под контроль, разобраться, по каким причинам это происходит. Убрать ссылки на страницы, которые имеют 4хх и 5хх ответы, а с 3хх разобраться. Например, если какая-то страница просто изменила свой адрес на постоянной основе, то при запросе на старый адрес должен быть редирект на новый адрес и 301 код ответа сервера, а не 302, как это часто бывает.

Наличие битых ссылок, картинок и прочего мусора в HTML-коде

1 Изображение с ответом 4хх

Проблема с кодировкой email адреса в футере сайта:

Неправильная кодировка адреса email

Пояснения
Наличие битых ссылок и картинок негативно сказывается на скорости обхода сайта, поэтому, это нужно исключать из HTML-кода. К прочему мусору можно отнести элементы в HTML-коде, которые не видны со стороны пользователя и не имеют никакого функционального значения, подобное может возникать после очередного редактирования php-кода или обновления плагинов/модулей сайта.

Наличие внешних ссылок, их количество и код ответа

962 Внешние ссылки с rel="nofollow"
27 Внешних ссылок с rel="dofollow"
0 Внешних ссылок с 4xx ответом
0 Внешних ссылок с 5xx ответом

Пояснения
Dofollow ссылки передают репутацию и должны ссылаться только на релевантные ресурсы, в которых вы уверены, т.к. это работает как рекомендация. Nofollow ссылки не передают репутацию с вашей страницы, - таким атрибутом нужно помечать ссылки, в достоверности которых вы сомневаетесь или не уверены вовсе.

Наличие блокированных страниц в robots.txt

0 Страниц заблокировано в robots.txt

Пояснения
В файле Robots.txt должно быть указано, какие файлы или разделы сайта следует и не следует
индексировать поисковым роботам. Обратите внимание, что технические страницы, вроде корзины или страницы регистрации нельзя закрывать через robots.txt, а делать это нужно через <meta name="robots" content="noindex"/>.

Наличие страниц с meta noindex

0 Страниц закрытых от индексации с помощью meta noindex

Индексация служебных страниц

Список служебных страниц, которые нужно закрыть от индексации через <meta name="robots" content="noindex"/>

https://svdd.ru/my-account
https://svdd.ru/quick-order
https://svdd.ru/password-recovery

Индексация дублированных элементов навигации

Закрыть от индексации дублирующие элементы через <!--noindex-->:

Пагинатор в категории под товарами.

Индексация служебных текстовых элементов

Закрыть часто встречающиеся служебные слова (выделено в красный прямоугольник) через <!—noindex-->:

В категории

Служебные слова, которые нужно закрыть в <!--noindex-->

На странице товара в блоках «Сопутствующие товары» и «Товары в этой категории»:

Блок сопутствующих товаров

Пояснения
Рассмотрим пример на категории товаров интернет-магазина любой тематики. В категориях товаров, на самих товарах, как правило, имеются служебные слова: «в наличии», «к сравнению», «скидка» и др. Большое количество вхождений служебного текста негативно влияет на релевантность категорий определенным запросам, поэтому, такие фрагменты нужно закрывать от индексации.

Наличие в HTML-коде Display: none

Все атрибуты размещены корректно, на разрешенных элементах.

Пояснения
Продолжение текст в категориях интернет-магазина обычно скрывают под кнопку "Еще" и сокрытие текста должно быть реализовано отличным от display: none способом, т.к. поисковая система посчитает, что вы скрыли фрагмент текста от пользователя и пытаетесь манипулировать алгоритмами ранжирования, за что пессимизирует страницу.

Проверка наличия пагинатора и rel=canonical

Пагинатор есть. Атрибут rel=canonical прописан корректно.

Пояснения
Если на сайте присутствуют группы схожих по содержанию страниц, необходимо указать для каждой страницы предпочитаемый (канонический) адрес, который будет участвовать в поиске.

Постраничная навигация (пагинация) в категориях интернет-магазинов, как правило, сопровождается похожим содержанием страниц, и чтобы избежать внутренней конкуренции между ними, нужно указать в HTML-коде этих страниц на ту, которая должна участвовать в поиске, с помощью атрибута rel=canonical.

Ниже приводятся проверки, каждая из которых нуждается в приведении примеров страниц, но здесь мы их не публикуем по понятным причинам, но в отчете аудита такой список страниц есть.

Проверка meta title: наличие, длина, дублирование

0 Страниц с пустым или отсутствующим title
222 Страницы с длинным title > 70
23 Страницы с коротким title < 10
28 Страниц с дублирующимся title

Проверка meta description: наличие, длина, дублирование

98 Страниц с пустым или отсутствующим description
50 Страниц с длинным description > 320
497 Страниц с коротким description < 50
19 Страниц с дублирующимся description

Проверка заголовка h1: количество, длина, дублирование

0 Страниц с пустым тегом H1
0 Страниц без тега H1
27 Страниц с длинным тегом H1
50 Страниц с дублирующимся тегом H1

Анализ изображений на наличие атрибута Alt

5032 Изображения с отсутствующим ALT текстом

Заполнить атрибут для картинок способов оплаты в футере сайта:

Способы оплаты в футере

Пояснения
Атрибут Alt позволяет указать текст, который будет отображаться на странице, если изображение по какой-либо причине невозможно показать. Грамотное описание изображения в атрибуте Alt вместе с информативным именем файла помогают поисковым системам проиндексировать изображения на странице.

На этом технический SEO-аудит завершен, дальше приступаем к юзабилити, а затем к семантическому аудиту.