Пример SEO-аудита интернет-магазина (часть 1)
Начиная с этой статьи, мы расскажем, как делаем полный SEO-аудит интернет-магазина, хотя для информационных или сайтов услуг многие параметры пересекаются. Технические параметры везде одинаковы, а вот юзабилити и семантика, могут отличаться по содержанию, т.к. сайты решают разные задачи (купить товар, заказать услугу и получить ответ на вопрос), но подход по большей части везде будет один и тот же.
Мы не будем говорить о внешней оптимизации в виде наличия сообществ в социальных сетях, ссылочной массы и других методах данного вида продвижения, а только о внутренних факторах.
Полный материал будет состоять из трех частей:
- Технический SEO-аудит
- Юзабилити аудит
- Семантический аудит
И в этой статье речь пойдет о технической оптимизации и настройке сайта интернет-магазина. В качестве примера рассмотрим интернет-магазин по продаже сантехники. Содержание статьи можно рассматривать как чек-лист основных технических параметров, которые необходимо настроить /исправить для нормальной индексации поисковыми системами и пользователей сайта.
Содержание статьи:
- Общая информация о домене: возраст, тИЦ, страниц в Yandex, страниц в Google
- Время ответа сервера
- Скорость загрузки страниц
- Наличие зеркала сайта (с «www» или без «www»)
- Редирект с http версии сайта на https (при наличии)
- Дубли главной страницы (index.php, index.html, index.htm и т.д.)
- Проверка файла robots.txt
- Проверка карты сайта sitemap.xml
- Проверка ЧПУ страниц
- Проверка страницы ошибки 404
- Анализ страниц на 3ХХ, 4ХХ, 5ХХ ответы
- Наличие битых ссылок, картинок и прочего мусора в HTML-коде
- Наличие внешних ссылок, их количество и код ответа
- Наличие блокированных страниц в robots.txt
- Наличие страниц с meta noindex
- Индексация служебных страниц
- Индексация дублированных элементов навигации
- Индексация служебных текстовых элементов
- Наличие в HTML-коде Display: none
- Проверка наличия пагинатора и rel=canonical
- Проверка meta title: наличие, длина, дублирование
- Проверка meta description: наличие, длина, дублирование
- Проверка заголовка h1: количество, длина, дублирование
- Анализ изображений на наличие атрибута Alt
Технический SEO-аудит интернет-магазина сантехники svdd.ru
Общая информация о домене
Домен: svdd.ru
Возраст: 9 лет 2 месяцев
тИЦ: 70
Страниц в Google: 4,890
Страниц в Yandex: 13,923
Пояснения
Возраст домена может говорить об авторитетности ресурса. Как правило, чем старше домен, тем лучше он ранжируется в поиске. Если домен молодой, до 1 года, то резкого роста поискового трафика ожидать не стоит.
ТИЦ – тематический индекс цитирования. Данный показатель так же говорит нам об авторитетности ресурса или, как минимум, о наличии внешней ссылочной массы, которую тоже нужно анализировать.
Возраст домена и тИЦ прежде всего нужны для сравнения с конкурентами, выявить самого молодого и слабого, но который находится наряду с флагманами ниши и посмотреть что он делает с сайтом, чтобы ранжироваться так высоко.
Большая разница в количестве страниц в индексе Google и Яндекса может свидетельствовать о неправильной настройке robots.txt, попадании под фильтр в одной из поисковых систем или еще о какой-то ошибке, которую нужно отыскать и исправить.
Время ответа сервера
Главная – 700-800 мс
Категория – 600-700 мс
Страница товара – 600-700 мс
Время ответа должно быть 200-300 мс, т.е. сейчас ответ слишком долгий и нужно стремиться к нормальному показателю.
Рекомендации: Сократить время ответа сервера до 200-300 мс.
Скорость загрузки страниц
Главная – 10,408 сек.
Категория – 8,096 сек.
Страница товара – 8,5 сек.
Оптимальное время загрузки 2-3 секунды, но для интернет-магазинов с большим количеством товаров трудно достичь такого значения, поэтому сравним время загрузки страниц с сайтами конкурентов, которых возьмем из ТОП-10 выдачи Яндекса по одному из целевых запросов.
Т.к. львиная доля трафика приходится на категории, то для вывода будет достаточно сравнения времени загрузки аналогичных страниц.
Конкурент 1 – 4,593 сек.
Конкурент 2 – 5,964 сек.
Конкурент 3 – 9,485 сек.
Конкурент 4 – 5,401 сек.
Конкурент 5 – 2,314 сек.
Конкурент 6 – 7,446 сек.
Конкурент 7 – 6,999 сек.
Видим, что в большинстве случаев время загрузки меньше, чем у исследуемого сайта, поэтому, всевозможными средствами нужно стремиться к его уменьшению и достичь хотя бы среднего значения - 6 секунд.
Рекомендации: Сократить время загрузки страниц категорий до 6 сек.
Наличие зеркала сайта (с «www» или без «www»)
Склейка зеркал проведена корректно (через 301 редирект).
Пояснения
Чтобы избежать дублирования страниц сайта в индексе поисковых систем, необходимо провести склейку домена с WWW и без. Также, склейка необходима для пользователей, которые вводят доменное имя сайта в адресную строку браузера, - чтобы имени домена с указанием зоны, было достаточно для попадания на интересующий их сайт. Склейку нужно проводить с помощью 301 редиректа.
Редирект с http версии сайта на https (при наличии)
Редирект настроен корректно.
Пояснения
Протокол https для пользователя — залог безопасности его данных (в том числе, платежных реквизитов), а для поисковых систем — сигнал для ранжирования. В 2016 представители Google официально заявили, что с января 2017 безопасное соединение станет одним из официальных алгоритмов. То есть, сайты на http будут постепенно терять свои позиции.
Дубли главной страницы (index.php, index.html, index.htm и т.д.)
Отсутствуют.
Проверка файла robots.txt
Файл доступен.
Пояснения
Сессия начинается с загрузки файла robots.txt. Если файл отсутствует, не является текстовым или на запрос робота возвращается HTTP-статус отличный от 200 OK, робот считает, что доступ к документам не ограничен. Это может привести к попаданию в индекс нежелательных файлов и каталогов сайта.
Проверка карты сайта sitemap.xml
Файл доступен.
Пояснения
Наличие карты сайта позволяет роботу поисковой системы быстрее узнать и проиндексировать как можно больше страниц сайта, в случае отсутствия карты сайта, поиск страниц глубокой вложенности может затянуться.
Проверка ЧПУ страниц
ЧПУ в порядке.
Пояснения
Все URLs должны быть логичными и легко воспринимаемыми посетителями. ЧПУ лучше ранжируются в поисковой выдаче и приятнее выглядят на сайтах и в социальных сетях (если не прятать адрес сайта в анкор). По возможности, лучше не использовать нижнее подчеркивание в адресах.
Проверка страницы ошибки 404
Страница работает и отображается корректно.
Пояснения
404 страница нужна обязательно, чтобы после отключения или удаления какой-либо страницы с сайта, по ранее работающему адресу, показывалось сообщение для пользователей и был соответствующий 404 код ответа сервера. 404 ответ сервера избавит от необходимости следить за мусорными страницами в индексе, т.к. поисковая система сама их исключит.
Анализ страниц на 3хх, 4хх, 5хх ответы
0 Страниц имеют 3xx ответ
0 Страниц имеют 4xx ответ
0 Страниц имеют 5xx ответ
Пояснения
Наличие на сайте ссылок на страницы с 3хх, 4хх, 5хх кодом ответа необходимо взять под контроль, разобраться, по каким причинам это происходит. Убрать ссылки на страницы, которые имеют 4хх и 5хх ответы, а с 3хх разобраться. Например, если какая-то страница просто изменила свой адрес на постоянной основе, то при запросе на старый адрес должен быть редирект на новый адрес и 301 код ответа сервера, а не 302, как это часто бывает.
Наличие битых ссылок, картинок и прочего мусора в HTML-коде
1 Изображение с ответом 4хх
Проблема с кодировкой email адреса в футере сайта:
Пояснения
Наличие битых ссылок и картинок негативно сказывается на скорости обхода сайта, поэтому, это нужно исключать из HTML-кода. К прочему мусору можно отнести элементы в HTML-коде, которые не видны со стороны пользователя и не имеют никакого функционального значения, подобное может возникать после очередного редактирования php-кода или обновления плагинов/модулей сайта.
Наличие внешних ссылок, их количество и код ответа
962 Внешние ссылки с rel="nofollow"
27 Внешних ссылок с rel="dofollow"
0 Внешних ссылок с 4xx ответом
0 Внешних ссылок с 5xx ответом
Пояснения
Dofollow ссылки передают репутацию и должны ссылаться только на релевантные ресурсы, в которых вы уверены, т.к. это работает как рекомендация. Nofollow ссылки не передают репутацию с вашей страницы, - таким атрибутом нужно помечать ссылки, в достоверности которых вы сомневаетесь или не уверены вовсе.
Наличие блокированных страниц в robots.txt
0 Страниц заблокировано в robots.txt
Пояснения
В файле Robots.txt должно быть указано, какие файлы или разделы сайта следует и не следует
индексировать поисковым роботам. Обратите внимание, что технические страницы, вроде корзины или страницы регистрации нельзя закрывать через robots.txt, а делать это нужно через <meta name="robots" content="noindex"/>.
Наличие страниц с meta noindex
0 Страниц закрытых от индексации с помощью meta noindex
Индексация служебных страниц
Список служебных страниц, которые нужно закрыть от индексации через <meta name="robots" content="noindex"/>
https://svdd.ru/my-account
https://svdd.ru/quick-order
https://svdd.ru/password-recovery
Индексация дублированных элементов навигации
Закрыть от индексации дублирующие элементы через <!--noindex-->:
Пагинатор в категории под товарами.
Индексация служебных текстовых элементов
Закрыть часто встречающиеся служебные слова (выделено в красный прямоугольник) через <!—noindex-->:
В категории
На странице товара в блоках «Сопутствующие товары» и «Товары в этой категории»:
Пояснения
Рассмотрим пример на категории товаров интернет-магазина любой тематики. В категориях товаров, на самих товарах, как правило, имеются служебные слова: «в наличии», «к сравнению», «скидка» и др. Большое количество вхождений служебного текста негативно влияет на релевантность категорий определенным запросам, поэтому, такие фрагменты нужно закрывать от индексации.
Наличие в HTML-коде Display: none
Все атрибуты размещены корректно, на разрешенных элементах.
Пояснения
Продолжение текст в категориях интернет-магазина обычно скрывают под кнопку "Еще" и сокрытие текста должно быть реализовано отличным от display: none способом, т.к. поисковая система посчитает, что вы скрыли фрагмент текста от пользователя и пытаетесь манипулировать алгоритмами ранжирования, за что пессимизирует страницу.
Проверка наличия пагинатора и rel=canonical
Пагинатор есть. Атрибут rel=canonical прописан корректно.
Пояснения
Если на сайте присутствуют группы схожих по содержанию страниц, необходимо указать для каждой страницы предпочитаемый (канонический) адрес, который будет участвовать в поиске.
Постраничная навигация (пагинация) в категориях интернет-магазинов, как правило, сопровождается похожим содержанием страниц, и чтобы избежать внутренней конкуренции между ними, нужно указать в HTML-коде этих страниц на ту, которая должна участвовать в поиске, с помощью атрибута rel=canonical.
Ниже приводятся проверки, каждая из которых нуждается в приведении примеров страниц, но здесь мы их не публикуем по понятным причинам, но в отчете аудита такой список страниц есть.
Проверка meta title: наличие, длина, дублирование
0 Страниц с пустым или отсутствующим title
222 Страницы с длинным title > 70
23 Страницы с коротким title < 10
28 Страниц с дублирующимся title
Проверка meta description: наличие, длина, дублирование
98 Страниц с пустым или отсутствующим description
50 Страниц с длинным description > 320
497 Страниц с коротким description < 50
19 Страниц с дублирующимся description
Проверка заголовка h1: количество, длина, дублирование
0 Страниц с пустым тегом H1
0 Страниц без тега H1
27 Страниц с длинным тегом H1
50 Страниц с дублирующимся тегом H1
Анализ изображений на наличие атрибута Alt
5032 Изображения с отсутствующим ALT текстом
Заполнить атрибут для картинок способов оплаты в футере сайта:
Пояснения
Атрибут Alt позволяет указать текст, который будет отображаться на странице, если изображение по какой-либо причине невозможно показать. Грамотное описание изображения в атрибуте Alt вместе с информативным именем файла помогают поисковым системам проиндексировать изображения на странице.
На этом технический SEO-аудит завершен, дальше приступаем к юзабилити, а затем к семантическому аудиту.