Что такое индексация сайта и как её проверить — SEO на vc.ru
Чем бы вы ни занимались, интернет-магазином, корпоративным порталом или лендингом, сделать сайт — лишь полдела. Дальше начинается самое интересное — продвижение. Индексация в этом деле — первый шаг на пути к топу поисковой выдачи. Рассказываем о том, как она происходит, как её проверить и ускорить.
38 995 просмотров
Как работает индексация
Продвижение начинается с попадания страниц сайта в индекс поисковых систем (ПС). В эти базы данных Яндекс, Google и другие сервисы заносят информацию о содержимом страниц: использованных на них ключевых словах, размещённом на них контенте и другую информацию. Затем, когда пользователь обращается к ПС с запросом, сервис анализирует собранные данные и подбирает наиболее подходящие варианты ответа из списка проиндексированных страниц.
Как попасть в индекс поисковых систем
Чтобы ваш сайт проиндексировали, о нём нужно сообщить поисковикам.
1. С помощью инструментов поисковых систем. Почти у всех поисковиков есть собственные сервисы для веб-мастеров. У самых популярных из них на территории СНГ — Google и Яндекс — это Search Console и Яндекс.Вебмастер. В последнем даже есть специальный инструмент, позволяющий отправлять от 20 ссылок в день на страницы, которые нужно проиндексировать в приоритетном порядке.
Однако когда речь заходит не о нескольких десятках страниц, а об индексации сайта в целом, более эффективным решением будет добавить его в Яндекс и Google, а затем указать ссылку на карту сайта (файл Sitemap) в Search Console и Яндекс.Вебмастер. Тогда поисковики начнут самостоятельно и регулярно посещать ваш сайт и его новые страницы, чтобы затем добавить их в индекс. О том, как составить карту сайта вы можете узнать в руководстве Google. Что касается скорости попадания в выдачу, она зависит от многих факторов, но в среднем занимает одну—две недели.
2. С помощью ссылок с других сайтов. Быстро обратить внимание поисковых систем на вашу новую страницу можно, разместив ссылки на неё на других порталах. Если один из них будет новостным, скорее всего, страница быстро попадёт в выдачу, так как поисковики часто проверяют такие сайты и ссылки на них считают полезными. В некоторых случаях индексирование может занять меньше суток.
Попадёт ли страница в поисковую выдачу, зависит от её содержимого. Если с ней всё в порядке, робот проиндексирует её и в скором времени она появится в поисковой выдаче.
Как проверить индексацию сайта
Есть несколько способов узнать были ли проиндексированы нужные вам страницы.
1. С помощью Яндекс.Вебмастера и Search Console. В первом для этого есть специальный инструмент — «Проверить статус URL». Достаточно добавить в него ссылку на нужную страницу, и в течение двух минут (иногда — нескольких часов) вы узнаете о статусе страницы в ПС.
Чтобы проверить статус страницы в Search Console, нужно ввести ссылку на неё в поисковой строке, которая отображается в верхней части экрана. На открывшейся форме вы узнаете, была ли страница проиндексирована поисковиком.
2. С помощью команды «site». Если вы не хотите добавлять сайт в сервисы для веб-мастеров, вы можете проверить сразу все попавшие в индекс поисковиков страницы с помощью специальной команды. Для этого введите в поиск Яндекс или Google запрос вида «site:mysite.ru» (без кавычек), и вы увидите все страницы, попавшие в выдачу.
3. С помощью сервисов. Самый простой способ проверить индексацию определённых страниц — воспользоваться для этого сторонними сервисами. Например, Серпхант позволяет проверить индексацию сразу 50 страниц в Яндекс и Google. Введите ссылки на них в специальную форму (не забудьте про http:// или https://) и нажмите «Начать проверку». Иногда инструмент долго выдаёт результаты проверки по одной—двум позициям, но существенно на функциональность это не влияет.
Ещё один сервис — плагин RDS Bar для Chrome, Firefox и Opera — позволяет получить подробную информацию о любой открытой в браузере странице, в том числе и о том, проиндексирована ли она.
Как ускорить индексацию
Чем быстрее поисковые системы внесут страницу в индекс, тем быстрее на неё попадут посетители. Чтобы сократить время ожидания, следуйте следующим рекомендациям:
- Обязательно добавьте сайт в ПС через сервисы для веб-мастеров.
- В Search Console и Яндекс.Вебмастере укажите ссылки на файлы Sitemap и robots.txt.
- Регулярно добавляйте на сайт новый уникальный контент.
- Не забывайте перелинковывать страницы между собой.
- Добавляйте ссылки на новые страницы в социальные сети и на другие сайты.
Как закрыть сайт от индексации
Не все страницы нравятся поисковым системам. Некоторым из них — например, служебным страницам и тем, которые пока что находятся в разработке, — не только нечего делать в выдаче, но и лучше вообще не попадаться на глаза поисковым роботам. Чтобы предотвратить попадание таких страниц в выдачу, лучше сразу запретить их индексацию. Сделать это также можно несколькими способами:
1. Использовать команду Disallow в файле robots.txt. В этом файле указываются правила для поисковых роботов: какие-то страницы в нём можно разрешить индексировать определённым ПС, а какие-то — запретить. Чтобы страница не попала в выдачу, используйте команду Disallow. Подробнее о работе с файлом robots.txt читайте в руководстве Яндекса.
2. Добавить тег noindex в HTML-код страницы. Наверное, самый простой способ, когда нужно запретить роботу индексацию конкретной страницы или страниц определённого типа. Чтобы воспользоваться им, достаточно добавить в раздел HTML-кода страницы директиву .
3. Использовать авторизацию. Некоторые страницы — например, личный кабинет и «черновики», находящиеся в разработке, — можно закрыть от роботов формой авторизации. Это самый надёжный способ, так как даже те страницы, индексация которых запрещена в robots.txt или директивой noindex, могут попасть в поисковую выдачу, если на них ведут ссылки с других страниц.
Проверка индексации сайта в Яндекс и Гугл
11 дек., 2017
В данной статье мы рассмотрим, как проверить индексацию страницы в Яндексе и Google, что для этого делают опытные SEO-специалисты, а также какие есть способы массовой проверки индексации страниц.
Индексируем или сканируем?
Прежде чем мы приступим к рассмотрению вопроса статьи, сделаем небольшое замечание: часто читатели и начинающие владельцы сайтов путают такие понятия, как сканирование страницы и её индексация.
При индексации поисковый робот добавляет все важные сведения о сайте и странице в индекс (отдельную базу данных). После того, как это произошло, запросы в поисковой системе ведут только на те страницы, которые уже были ранее проиндексированы. Сканирование сайта – чуть другая вещь, предусматривающая изучение поисковым роботом сайта согласно с данными, указанными в robots.txt. Но вернемся к нашей теме – как может проводиться массовая проверка индексации сайтов?
Проверяем индексацию в панели вебмастера
Базовый и самый простой способ как для вебмастера, так и для владельца сайта:
Проверка сайта в Google. В случае, если проводится проверка проиндексированности страниц в Гугле, следует зайти в Search Console и там найти вкладку «Индекс Google», а далее перейти к просмотру статуса индексирования.
Проверка сайта в Yandex. Если же аналогичные данные нужно получить от Яндекса, то в панели «Яндекс.Вебмастер» следует пройти по маршруту «Индексирование сайта» → «Страницы в поиске». Там же, к слову, можно посмотреть и динамику индексации сайта и его страниц.
Для того, чтобы получить эти данные, нужно иметь соответствующий доступ к панели вебмастера и в Гугле, и в Яндексе.
Ниже вы можете увидеть пример сайта, который имеет хорошие показатели индексации…
…и не очень хорошие показатели, появившиеся вследствие запрета на проведение индексации в файле robots.txt.
Работаем с операторами поисковых запросов
С помощью поисковых операторов можно уточнить те или иные результаты поиска. Так, с помощью оператора «site:» можно узнать о примерном количестве страниц, которые находятся в индексе.
Для того, чтобы получить такую информацию, достаточно лишь в поисковой строке ввести site:[url сайта]. Кстати говоря – подобная проверка является своеобразным триггером для некоторых случаев. Так, при слишком большой разнице между результатами в Гугле и Яндексе можно сделать вывод, что у сайта есть какие-то проблемы в одной из поисковых систем. Например – наложенный фильтр.
В Google массовую проверку индексации страниц помогают провести дополнительные инструменты поиска. Например, тут можно увидеть, что за последний час появилось 49 страниц в русскоязычной Википедии:
Используем плагины и расширения для браузеров
Не будем давать рекламу тем или иным браузерным расширениям или плагинам, которые могут использоваться для проверки индексации страниц. Отметим только, что они представляют собой небольшие части java-кода, которые размещаются в браузере и позволяют проводить проверку индексации в автоматическом режиме.
Есть также специальные сервисы-краулеры, которые используются для проверки страниц. Их огромное множество, и большинство способны предоставить даже больше данных, чем просто сведения об индексации (например, редиректы, битые ссылки, переадресацию, каноникал, метаописание и т.д.).
В Интернете также можно встретить множество сайтов, которые предлагают провести проверку индексации страниц сайта. Некоторые специально «заточены» для таких задач, другие же предоставляют комплексный анализ. Но во всех случаях мы рекомендуем использовать вышеперечисленные варианты – они показывают наиболее точные данные, а получение информации и проверка проиндексированности страниц происходит очень быстро.
Онлайн-сервисы для проверки индексации
В случае, если вам необходимо проверить индексацию страниц без использования сервисов аналитики поисковых систем, вы можете воспользоваться функционалом следующих онлайн-сервисов:
Google Index Checker от Small SEO Tools
Всё, что вам нужно, чтобы проверить индексацию сайта за несколько секунд — использование сервиса Google Index Checker. Для получения информации вам будет необходимо ввести URL и нажать кнопку “Check”, после чего вы получите данные о количестве проиндексированных страниц.
Index Checking
Ещё один сервис, который позволяет проверить индексацию сайта в Гугле, это Index Checking. С его помощью вы также можете получить информацию об индексации любого URL вашего сайта, а в режиме проверки вы можете вводить до 25 URL за один раз.
Почему сайт не индексируется?
Индексация сайта в некоторых случаях может содержать ошибки. В частности, проверка индексации сайта может показать, что поисковые системы не видят много страниц. Почему в таком случае сайт не индексируется?
- Новый сайт. Несмотря на то, что официально поисковые системы заявляют об отсутствии т.н. “Песочниц”, молодые сайты не сразу попадают в индекс, а потому этот процесс может затянуться на несколько месяцев.
- Отсутствует sitemap. При отсутствии карты сайта краулеры поисковых систем могут индексировать сайт куда дольше.
- Ошибки с мета-тегом robots. Проверьте мета-тег на страницах — если у вас в мета-теге содержится директива noindex, поисковые системы не смогут проиндексировать сайт.
- Ошибки в htaccess/robots.txt. Проверьте эти файлы и убедитесь в том, что вы не закрыли доступ поисковым ботам.
Ну и напоследок — если кроме индексации вас интересуют еще и позиции — наш сервис поможет вампроверить сайт в Google или в Yandex, а также и в других поисковых системах. Просто введите ваш домен в форму ниже. Это бесплатно.
Как проверить статус индексирования крупного веб-сайта
Прежде чем ваши страницы появятся в результатах поиска и привлекут трафик на ваш сайт, их необходимо проиндексировать.
К сожалению, проиндексировать сайт непросто, особенно если у вас большой веб-сайт. Согласно нашему исследованию, 16% ценных страниц веб-сайтов не индексируются.
Прежде чем предпринимать шаги по улучшению индексации и эффективности поиска вашего сайта, крайне важно проверить статус индексации вашего сайта и определить, какие из ваших страниц индексируются правильно, а какие нет.
Одной из проблем, с которой вы можете столкнуться, является поиск надежных методов проверки статуса индексации вашего сайта, позволяющих анализировать URL-адреса в пакетном режиме. Если это так, то вы обратились по адресу.
Существует несколько полезных инструментов, которые могут помочь вам определить статус индексации вашего сайта и помочь в более тщательном анализе каждого URL-адреса, чтобы определить, почему он не индексируется.
Следуйте моим советам в этой статье, чтобы узнать, как проверить статус индексации крупного веб-сайта, проанализировать проблемы, препятствующие индексации страниц, и найти правильные решения.
Что делать перед проверкой статуса индексации вашего веб-сайта
Прежде чем проверять статус индексации и решать проблемы, вам необходимо разработать правильную стратегию индексации.
Создав его, вы сможете определить, какие страницы являются важными и должны быть проиндексированы, а какие следует исключить из индексации.
Некоторые из ваших страниц могут быть низкого качества или содержать дублированный контент, и пользователи не должны находить их в результатах поиска. Как правило, это те страницы, которые должны быть исключены из индекса.
Вот несколько примеров страниц, которые не следует индексировать:
- Архивное содержимое,
- Страницы, защищенные логином и паролем,
- URL с добавленными параметрами, созданные в результате сортировки или фильтрации,
- Результаты внутреннего поиска,
- страниц благодарности.
Если вы не хотите, чтобы страница индексировалась, вы можете:
- Включить соответствующие директивы для ботов в файл robots.txt, чтобы они не сканировали данную страницу,
- Внедрите тег noindex, чтобы роботы поисковых систем не индексировали страницу.
URL-адреса, которые не были проиндексированы и должны оставаться такими, не требуют вашего внимания. Вместо этого сосредоточьтесь на страницах, которые не проиндексированы, но должны быть проиндексированы.
Как правило, вы должны стремиться к тому, чтобы канонические версии ваших страниц были проиндексированы, и они должны быть представлены в вашей карте сайта.
Так как же узнать, какие страницы проиндексированы, а какие нет?
Методы проверки статуса индексации и диагностики проблем с индексацией
Существует несколько полезных инструментов для проверки статуса индексации вашего сайта.
Но имейте в виду, что большинство из них имеют ограничения на количество URL-адресов, которые вы можете проверить. При поиске в Интернете вы можете столкнуться со многими ненадежными инструментами.
Я покажу вам какие инструменты показывают наиболее точную информацию и обходные пути для расширения своих возможностей.
Кроме того, я познакомлю вас с новым инструментом анализа индексации, разработанным нашей дочерней компанией ZipTie.
Команда «site:»
Один из популярных способов проверить количество проиндексированных страниц сайта — ввести команду «site:» в поиске Google, а затем имя домена, например «site:onely.
Несмотря на то, что он позволяет вам проверить статус индексации веб-сайта, данные, которые вы увидите, могут вводить в заблуждение или быть неточными, поскольку числа являются только приблизительными.
Этот метод будет особенно неточным для больших веб-сайтов с динамически изменяющимся содержимым.
Может случиться так, что каждый раз, когда вы его используете, результаты будут показывать совершенно другое количество проиндексированных страниц для вашего домена.
Однако, несмотря на то, что команда «site:domain» далека от оптимальной, вы можете использовать команду «site:URL», где вы вводите конкретный URL-адрес вместо имени домена. Затем вы можете узнать, был ли проиндексирован конкретный URL-адрес.
Джон Мюллер рекомендовал это решение:
Использование site:-queries полезно для проверки отдельных URL-адресов, но я бы не стал использовать счетчики для целей диагностики.
— Джона Мюллера здесь почти нет 🐀 (@JohnMu) 16 апреля 2019 г.
Инструменты в Google Search Console
Google Search Console предлагает гораздо лучшие инструменты для проверки охвата вашего индекса.
Если вы еще не используете их регулярно, начните прямо сейчас — они должны стать вашими стандартными инструментами SEO-мониторинга.
Расскажу о них подробнее и посоветую, как максимально использовать их на большом сайте.
Отчет о покрытии индексом (индексация страниц)
Отчет «Покрытие индекса (индексация страниц)» в Google Search Console предоставляет данные от Google о том, какие страницы проиндексированы.
Кроме того, он дает вам представление о конкретных состояниях ваших URL-адресов в отношении их обнаружения, сканирования и индексации, а также, если применимо, о том, какую проблему обнаружил Google, которая препятствует их индексации.
В отчете «Покрытие индекса (индексация страниц)» отображаются два состояния:
- Не проиндексировано — для страниц, которые не проиндексированы.
- Они могут столкнуться с такими ошибками, как код состояния HTTP 5xx, неправильная директива disallow в файле robots.txt или неправильное использование тега noindex.
- Иногда системы Google могут принять решение не индексировать страницу, которая была им доступна для сканирования, по другим причинам.
- Indexed — для страниц, которые проиндексированы. Некоторые из них могут все еще иметь дело с проблемами, которые вы должны исследовать, но никакая критическая проблема не помешала их индексации.
В зависимости от того, какие данные вы хотите отобразить, в левом верхнем углу вы можете выбрать:
- «Все известные страницы» — для всех URL-адресов, обнаруженных Google каким-либо образом,
- «Все отправленные страницы» — для URL-адресов, которые Google нашел в вашей карте сайта,
- «Только неотправленные страницы» — для URL-адресов, обнаруженных Google при сканировании, даже если их нет в вашей карте сайта.
Обычно представление «Все отправленные страницы» должно содержать все страницы, которые вы хотите проиндексировать.
Если некоторые страницы отображаются в разделе «Только неотправленные страницы» и должны быть проиндексированы, поместите их в карту сайта. Если они не должны быть проиндексированы, это означает, что Google находит их в другом месте, возможно, по ссылкам.
Основным ограничением отчета является то, что каждый отчет, отображающий определенные проблемы, содержит только 1000 страниц. К счастью, есть способы обойти это.
Одним из решений является создание отдельных свойств домена для разных разделов веб-сайта.
Альтернативой может быть разделение ваших страниц на создание нескольких карт сайта и сужение отчета до отдельной карты сайта.
Рекомендуется, чтобы каждая карта сайта содержала не более 50 000 URL-адресов.
Есть много способов разделения страниц между картами сайта. Подумайте о том, чтобы упорядочить их таким образом, чтобы вам было легче сгруппировать похожие типы контента для более удобного анализа.
Вот несколько советов:
- Отдельные файлы Sitemap для разных типов контента, например категорий, продуктов, сообщений в блогах,
- Отдельные карты сайта для выбранного количества или вида продуктов,
- Отдельные карты сайта для разных языковых версий сайта.
Теперь выберите одну из карт сайта и перейдите к разделу «Почему страницы не индексируются» отчета.
Просмотрите проблемы, которые он отображает — справа вы можете увидеть количество затронутых страниц и узнать, какие проблемы являются наиболее распространенными. Вы можете ознакомиться с другими нашими статьями о том, как работать с часто возникающими отчетами «просканировано — в настоящее время не проиндексировано» и «обнаружено — в настоящее время не проиндексировано».
Статусы отчета довольно описательно описывают причины каждой проблемы и в большинстве случаев указывают действия, которые необходимо предпринять для их устранения.
Узнайте, как обращаться с каждым статусом, в моем полном руководстве по отчету о покрытии индекса (индексации страниц) консоли поиска Google.
Ищите закономерности на исключенных страницах. Если многие страницы имеют схожее содержание или макет, просмотр только части URL-адресов может дать вам представление о том, с чем могут быть проблемы на остальных страницах.
Инструмент проверки URL
Еще одна полезная функция, доступная в Google Search Console, — это инструмент проверки URL.
Позволяет проверить, находится ли конкретный URL в индексе Google, и просмотреть массу дополнительной информации. Этот инструмент можно использовать для дополнения данных, получаемых из отчета «Покрытие индекса (индексация страниц)».
Вот обзор наиболее важных функций инструмента проверки URL:
- Статус присутствия — может ли URL-адрес отображаться в результатах поиска Google, а также в любых предупреждениях или ошибках, обнаруженных Google.
- Просмотр просканированной страницы — технические подробности, такие как ответ HTML и HTTP, полученный Google.
- Запросить индексацию — используйте его, чтобы попросить Google повторно просканировать и повторно проиндексировать ваш URL. Для этой функции существует дневной лимит. Хотя это явно не указано в документации Google, он упоминается как способ отправки «всего нескольких URL-адресов». Это может позволить вам отправить до 50 URL-адресов.
- Подробная информация о статусе покрытия страницы, а именно:
- Указывают ли какие-либо известные карты сайта на URL-адрес,
- Ссылающаяся страница — страница, которую Google мог использовать для обнаружения URL-адреса,
- Когда страница была просканирована в последний раз,
- Доступна ли страница для сканирования,
- Можно ли получить страницу с сервера,
- Является ли страница индексируемой,
- Канонический URL-адрес, объявленный пользователем,
- Вместо этого выбран канонический URL.
- Улучшения — в этом разделе показано, нашел ли Google достоверные структурированные данные на странице, а также сведения об удобстве использования страницы для мобильных устройств и AMP.
- Test Live URL — вы можете запустить живой тест на URL-адресе, например. если вы хотите проверить исправления или изменения.
Инструмент проверки URL-адресов требует, чтобы вы проверили статус индексации для каждого URL-адреса, что может занять много времени, если у вас большой веб-сайт.
Однако анализ выборки страниц уже может указать вам, с какими проблемами сталкивается ваш сайт.
Вместо проверки всех URL-адресов вы можете выбрать и проверить часть URL-адресов, которые были исключены из индекса Google. Вы также можете собирать URL-адреса, которые должны быть проиндексированы, но не получают органического трафика.
Кроме того, на вашем сайте могут быть следующие разделы:
- example.com/shop
- example.com/blog
- example.com/галерея.
Вы можете выбрать несколько URL-адресов для анализа из каждого отдельного раздела. Но не просто выберите несколько URL-адресов — используйте репрезентативную выборку для каждого раздела.
Ваши страницы «исключены тегом noindex» в Google Search Console?
Прочитайте нашу статью, чтобы убедиться, что вы использовали тег noindex намеренно.
API проверки URL
В 2022 году Google объявила о выпуске API проверки URL, который позволяет отправлять до 2000 запросов в день для одного свойства Google Search Console.
Это отличная новость для тех, кто считает данные инструмента проверки URL полезными, но не может проверить только один URL за раз. Получая доступ к данным проверки URL-адресов через API, вы можете автоматизировать процесс, что открывает множество новых возможностей использования этой информации.
Ограничения инструментов Google Search Console
Инструменты Google Search Console не лишены недостатков.
В октябре 2021 года пользователи сообщали, что видели в отчете об индексировании URL-адреса с пометкой «Просканировано — в настоящее время не проиндексировано». Однако при проверке с помощью инструмента проверки URL-адресов эти URL-адреса были указаны как «Отправлено и проиндексировано» или с другим статусом.
Google ответил, что эта ситуация не ошибка, а скорее ограничение отчета о покрытии индекса:
Это связано с тем, что данные отчета о покрытии индекса обновляются с другой (и более медленной) скоростью, чем данные проверки URL. Результаты, показанные в проверке URL-адресов, являются более свежими, и их следует рассматривать как достоверные, если они противоречат отчету о покрытии индекса. (2/4)
— Google Search Central (@googlesearchc) 11 октября 2021 г.
Сообщить о проблеме с индексированием
В апреле 2021 года Google объявила о введении функции «Сообщить о проблеме с индексированием», которая помогает пользователям информировать Google о проблеме с индексацией. В настоящее время эта функция доступна в США.
Для тех, кто нуждается в дополнительной поддержке, вошедшие пользователи Search Console в США скоро увидят кнопку «Сообщить о проблеме с индексированием» под отчетом о покрытии индекса и статьями Инструмента проверки URL в Справочном центре Search Console. https://t. co/3sFqvCvhjohttps://t.co/I7k3BYAH0i pic.twitter.com/Wd9ooXqK0y
— Google Search Central (@googlesearchc) 28 апреля 2021 г.
Пользователи могут получить доступ к форме и выбрать, будут ли их сайт или страницы не проиндексированы или проиндексированы, но не ранжируются должным образом. Затем им будут предложены варианты устранения неполадок, связанных с обнаруженной проблемой.
Если эти решения не сработают, они могут сообщить о проблеме непосредственно в Google.
Однако к этой функции следует относиться в крайнем случае, и не гарантируется, что Google выполнит ваш запрос и проиндексирует ваш контент.
Google стремится индексировать только наиболее актуальный и высококачественный контент. Поэтому, следуя передовым методам и оптимизируя свои страницы, чтобы сделать их доступными для сканирования, индексируемыми и достойными внимания Google, вы можете обеспечить долгосрочные результаты своего сайта.
ZipTie
ZipTie предоставляет набор обширных функций для анализа статуса индексации любого веб-сайта, независимо от его размера. Этот инструмент особенно удобен для крупных веб-сайтов корпоративного типа.
Вот что предлагает ZipTie:
Анализ покрытия индекса
Основная функция ZipTie заключается в том, что сообщает вам, какие страницы не были проиндексированы Google.
И, что очень важно, нет ограничений на количество URL-адресов, которые ZipTie может анализировать. Это важно для крупных веб-сайтов с тысячами или миллионами URL-адресов, которые невозможно успешно оценить с помощью других инструментов.
Важно отметить, что вы можете проверить индексирование любого домена — не только своего, но и домена вашего конкурента. Затем сравните свой статус индексации с конкурирующими доменами и посмотрите, какие области вам следует улучшить, чтобы продвинуться вперед.
Мониторинг задержек индексации
ZipTie позволяет отслеживать задержки индексации и оценивать, когда ваш недавно опубликованный контент будет проиндексирован и когда вы можете ожидать, что он будет привлекать трафик.
Это делается путем анализа новых URL-адресов, добавленных в ваши карты сайта, и изучения времени между публикацией контента и моментом его появления в результатах поиска.
Оповещения о деиндексированном контенте
ZipTie сообщит вам количество деиндексированного контента. Уже проиндексированные страницы могут быть исключены из индекса Google через некоторое время — эта функция позволяет вам быстро реагировать, когда это происходит.
Индексация JavaScript
Индексация страниц на основе JavaScript сложна, но ZipTie предлагает руку помощи.
В частности, ZipTie может определить, проиндексировал ли Google определенные фрагменты страниц, сгенерированные с помощью JavaScript.
Очень важно понимать, есть ли у Google проблемы с рендерингом и индексированием вашего контента на основе JavaScript. В этом случае ZipTie может сообщить вам, какие именно элементы страницы вызывают проблемы.
Дополнительная информация о непроиндексированных страницах
В качестве бонуса ZipTie предлагает дополнительную информацию о непроиндексированных URL-адресах , такие как количество слов, заголовки, заголовки, количество изображений, метаописание и многое другое. Это важно при исследовании возможных причин проблем с индексацией и выявлении закономерностей между неиндексированными страницами.
Вы можете экспортировать данные из ZipTie в виде файла CSV и легко комбинировать их с данными из других инструментов, таких как Google Analytics или Google Search Console.
ZipTie пока не доступен в открытом доступе. Более подробная информация о нем будет опубликована по мере развития инструмента. Вы можете быть в курсе официального запуска, подписавшись на список рассылки ZipTie.
Но ждать не обязательно.
Свяжитесь с командой ZipTie прямо сейчас, чтобы провести углубленный анализ статуса индексации вашего веб-сайта.
Инструменты Bing для веб-мастеров
Даже если появление в Bing не является вашим приоритетом, Инструменты Bing для веб-мастеров могут помочь вам получить представление обо всех типах проблем с индексированием, некоторые из которых могут возникать и в других поисковых системах.
Site Explorer
Прежде всего, давайте посмотрим на Site Explorer.
Инструмент Site Explorer позволяет вам просматривать структуру вашего веб-сайта и сведения о статусе индексации страниц, среди прочих данных:
Одним из аспектов, выделяющих Site Explorer, является возможность группировать URL-адреса по папкам, где каждая папка может представлять поддомен или часть пути URL-адреса. В результате у вас есть доступ к данным для значительного количества страниц.
Информация о сканировании, к которой у вас есть доступ, включает:
- Проиндексировано — количество проиндексированных URL-адресов в данной папке,
- Ошибка — критические ошибки сканирования, которые привели к тому, что указанные URL-адреса не были проиндексированы,
- Предупреждение . Было обнаружено, что эти URL-адреса имеют проблемы с рекомендациями, временные проблемы со сканированием, запрещены в robots.txt и т. д. Регулярно проверяйте этот раздел, чтобы выявлять скачки или падения затронутых URL-адресов,
- Excluded — URL-адреса, которые были исключены из индекса, например, из-за спама или низкого рейтинга.
У вас есть возможность дополнительно фильтровать URL-адреса для отображения страниц на основе определенных функций.
Эти фильтры позволяют определить URL-адреса, требующие вашего внимания, и указать правильное направление при решении проблем с индексацией.
Инструмент проверки URL-адресов Bing
Еще одна замечательная функция — инструмент проверки URL-адресов Bing, который дополняет Site Explorer. Он позволяет вам проверить, находится ли конкретный URL-адрес в индексе Bing и были ли обнаружены какие-либо ошибки индексации или сканирования.
Вставьте URL-адрес в инструмент — вы увидите много дополнительной информации.
В разделе Index Card вы можете увидеть статус индексирования URL-адреса и подробные сведения о нем, например, когда URL-адрес был обнаружен и как он был просканирован.
Вы также можете просмотреть HTML-код страницы и HTTP-ответ, полученный системой.
Если URL-адрес не был проиндексирован из-за ошибок, вы сможете предпринять дальнейшие действия, например запросить индексацию URL-адреса, связаться со службой поддержки, внести изменения в файл robots. txt и т. д.
Bing предоставляет рекомендации о том, почему страница может не индексироваться – вот несколько причин:
- Нет ссылок, ведущих на вашу страницу,
- Страница не соответствует пороговым значениям качества,
- Директивы robots.txt блокируют сканирование страницы,
- Есть и другие проблемы со сканированием страницы — функция Live URL поможет вам разобраться в этом подробнее,
- Страница имеет тег noindex, который препятствует ее индексации,
- URL-адрес еще не был обнаружен и просканирован, и ему просто нужно больше времени,
- Страница не соответствует рекомендациям по качеству, за что была оштрафована и удалена из индекса.
Вы можете использовать его в качестве ориентира при диагностике проблем с индексацией в других поисковых системах, таких как Google.
Если URL-адреса не проиндексированы, а должны быть, Bing позволяет отправлять URL-адреса для индексирования.
Важно то, что лимит относительно высок — вы можете отправить до 10000 URL-адресов в день. Это намного превышает заявленный Google предел в 50 URL-адресов.
Распространенные проблемы с индексацией для крупных веб-сайтов
Проблемы с индексацией возникают на большинстве сайтов и могут иметь катастрофические последствия для эффективности обычного поиска вашего сайта.
Томек Рудзки изучил наиболее распространенные проблемы индексации для веб-сайтов разного размера.
Благодаря его исследованиям мы теперь знаем, что крупные веб-сайты обычно страдают от следующих проблем:
- Просканировано – в настоящее время не проиндексировано,
- Обнаружен — в настоящее время не проиндексирован,
- Дублированный контент,
- Мягкий 404,
- Проблемы со сканированием.
Другая типичная проблема касается внутренних ссылок. Роботу Googlebot нужно пройти по пути, чтобы найти страницу — если она не связана с другими страницами, она может быть исключена из индекса.
Как решить проблемы с индексацией
Вы можете предпринять шаги, чтобы максимизировать шансы на индексацию ваших страниц.
Эти решения также полезны, когда вы находите непроиндексированные URL-адреса и не можете определить, почему они не проиндексированы.
Убедитесь, что ваши страницы индексируются
Выяснение того, индексируются ли ваши страницы, состоит из изучения двух аспектов:
Директивы, указанные в вашем файле robots.txt
Файл robots.txt содержит инструкции для поисковых роботов о том, что должно быть залез на сайт. Убедитесь, что директива «Запретить» не препятствует сканированию ваших ценных страниц.
Содержат ли страницы теги noindex
Теги Noindex позволяют ботам поисковых систем посещать страницы, но препятствуют их индексации.
Чтобы массово проверить, индексируются ли ваши страницы, используйте поисковый робот, например, Screaming Frog.
Ознакомьтесь с другими популярными поисковыми роботами в этой статье.
Вы можете вставить список своих URL-адресов в инструмент и начать сканирование. Когда это будет сделано, посмотрите на столбец «Индексируемость», в котором будет указано, является ли страница индексируемой или неиндексируемой.
Убедитесь, что все ценные страницы представлены в карте сайта
Проверьте, непроиндексированные страницы были отправлены в карту сайта – если нет, добавьте их соответствующим образом.
Кроме того, убедитесь, что ваши карты сайта не содержат URL-адресов, которые не должны быть проиндексированы в первую очередь. Разрешение поисковым системам обнаруживать и сканировать нерелевантные страницы может привести к неэффективному сканированию и увеличению времени, необходимого ботам для поиска вашего контента самого высокого качества.
Если у вас нет карты сайта, вы можете легко создать ее или использовать специальные инструменты, которые будут поддерживать ее в актуальном состоянии, например, Yoast SEO или SEO Spider от Screaming Frog. Вы также можете использовать один из инструментов генератора карты сайта.
Наше исчерпывающее руководство по картам сайта станет вашим главным ресурсом для создания оптимизированной карты сайта.
Настройте внутренние ссылки
Внутренние ссылки являются важным аспектом вашего сайта с точки зрения SEO.
Для Google недостаточно просто включить URL-адрес в карту сайта. Роботу Googlebot необходимо убедиться, что URL-адрес заслуживает его внимания — по этой причине ему необходимо найти сигналы, подчеркивающие его важность.
Убедитесь, что у вас нет потерянных страниц, означает страницы без входящих ссылок. Вы можете просканировать свой веб-сайт, чтобы найти потерянные страницы — например, сделать это с помощью отчета Screaming Frog о потерянных страницах.
Некоторые идеи по улучшению внутренних ссылок включают создание разделов для связанных продуктов или написание сообщений в блогах для ссылок на другие страницы вашего сайта.
Вам также необходимо иметь чистую архитектуру веб-сайта. Это означает организацию контента на сайте таким образом, чтобы пользователи и боты могли интуитивно и быстро перемещаться по каждому разделу вашего сайта.
Свяжитесь с Onely, если вам нужна более подробная внутренняя оптимизация ссылок.
Устранение проблем с дублированием контента
Если на вашем сайте существует более одной версии одного и того же или очень похожего контента, поисковым системам может быть трудно решить, какая страница является наиболее репрезентативной.
Чтобы упростить работу поисковых систем, внедрите канонические теги, указывающие на выбранные вами канонические URL-адреса. Каждая версия страницы должна иметь только один канонический URL.
Убедитесь, что канонические теги последовательно указывают на правильные канонические страницы. Если они указывают на дубликаты страниц, основной URL-адрес может остаться непроиндексированным.
Консоль поиска Google уведомила вас о проблемах с индексацией из-за дублирования контента? Прочтите наши руководства и исправьте:
- статус «Дубликат, Google выбрал другой канонический статус, чем пользовательский»,
- статус «Дублировать без выбранного пользователем канонического».
Следуйте передовым методам поисковой оптимизации JavaScript для упрощения сканирования и индексации
Хотя поисковые системы стали намного лучше отображать и индексировать JavaScript, их обработка по-прежнему не идеальна.
Как правило, поисковые системы могут не отображать JavaScript на странице , если они считают, что это не внесет существенных изменений в ее содержание. Кроме того, если ваши страницы выглядят совершенно по-разному с JavaScript и без него, у вас могут возникнуть проблемы с их индексацией.
Существуют инструменты, которые можно использовать для анализа индексации JavaScript.
Вы можете легко проверить, какие части вашей страницы используют JavaScript, используя наш инструмент Что бы сделал JavaScript.
Используйте Live Test в инструменте проверки URL-адресов Google, чтобы увидеть скриншот того, как именно робот Googlebot будет отображать содержимое JavaScript на вашей странице. Затем вы можете перейти на вкладку «Дополнительная информация», чтобы найти ошибки JavaScript.
Параметр «Просмотреть просканированную страницу» в инструменте проверки URL-адресов сообщит вам, что Google просканировал на вашей странице, и есть ли там весь контент JavaScript.
В случае проблем с индексированием JavaScript, обратитесь к нашей статье о JavaScript SEO для получения дальнейших инструкций или свяжитесь с нами, чтобы получить SEO-аудит JavaScript.
Оптимизируйте краулинговый бюджет
Краулинговый бюджет — это количество страниц на веб-сайте, которые поисковые системы могут и хотят сканировать.
На краулинговый бюджет вашего сайта может влиять множество факторов.
Следуйте этим общим рекомендациям по оптимизации краулингового бюджета :
- Улучшите производительность в Интернете,
- Оптимизируйте файлы JavaScript и CSS на своем сайте,
- Остерегайтесь внутренних перенаправлений и цепочек перенаправлений, чтобы избежать проблем с «ошибкой перенаправления»,
- Настройте архитектуру сайта,
- Очистите свои внутренние ссылки — обновите все ссылки, указывающие на страницы «Не найдено (404)», и часто ссылайтесь на ваш самый важный контент,
- Имейте правильно структурированную карту сайта — вы можете проанализировать структуру своей карты сайта с помощью одного из поисковых роботов, таких как Ryte или Sitebulb.
СЛЕДУЮЩИЕ ШАГИ
Вот что вы можете сделать сейчас:
- Свяжитесь с нами.
- Получите от нас индивидуальный план решения ваших проблем с индексацией.
- Наслаждайтесь своим контентом в индексе Google!
Все еще не уверены, стоит ли писать нам? Узнайте, как услуги технического SEO могут помочь вам улучшить ваш сайт.
Takeaways
Крупные веб-сайты могут испытывать трудности с индексацией многих своих страниц. Но это не значит, что невозможно проиндексировать весь ваш ценный контент.
Анализ индексации большого веб-сайта может потребовать некоторой работы. Тем не менее, функции, доступные в Google Search Console и Bing Webmaster Tools, дадут вам полезную информацию, на основе которой вы сможете немедленно начать действовать.
Я думаю, вы можете ожидать, что ZipTie изменит правила игры в области индексации — Я рекомендую вам связаться с командой ZipTie для анализа индексации.
И, если вы имеете дело с масштабными проблемами индексации, которые вы изо всех сил пытаетесь решить, свяжитесь с нами для полного технического SEO-аудита.
Как проверить индексацию вашего сайта в Google — Travelpayouts
Что такое индексация сайта?
По сути, индексация веб-сайтов — это процесс добавления сайта в базу данных поисковой системой. Затем на основе полученной информации движок оценивает качество сайта и соответственно ранжирует его.
Индексация веб-сайтов в Google — это первый шаг к их оптимизации для поисковых систем. Вы не можете получить высокий рейтинг, если ваш сайт даже не проиндексирован. Таким образом, необходимо постоянно отслеживать индексацию вашего сайта как для новых страниц, так и для существующего контента.
Если вы заметили, что многие страницы не проиндексированы, найдите возможную причину и устраните ее. Например, из-за нарушения рекомендаций Google ваш сайт может потерять индексацию, поэтому вам придется отправить запрос на повторное включение. Это, естественно, повлияет на трафик и доход, поэтому всегда важно следить за индексацией вашего сайта.
Как проверить индексацию сайта
Чтобы проверить индексацию веб-сайта, используйте такие инструменты, как Google Search Console, URL Profiler или Google Index Checker.
Во-первых, вам нужно будет создать список URL-адресов страниц вашего сайта либо вручную, либо с помощью специальных инструментов или плагинов (таких как Google XML Sitemaps). Затем введите URL-адреса выбранного вами инструмента. Ниже приведен пример использования URL Profiler:
.Нажав «Запустить профилировщик», вы проверите, индексирует ли Google ваш веб-сайт. Программа сгенерирует электронную таблицу с проиндексированными страницами и ошибками, как вы можете видеть ниже:
При выборе подходящего инструмента учитывайте его цену и характеристики. Существуют разные варианты проверки индексных страниц сайта:
- Бесплатные инструменты (Google Search Console),
- Плата за URL (SEranking. com),
- Ежемесячная подписка (профилировщик URL).
Как улучшить индексацию вашего веб-сайта
Сканер решит, индексировать страницу или нет, в зависимости от ее значения для пользователей. Таким образом, создавайте значимые страницы, а затем регулярно проверяйте статус индексации веб-сайта. Это позволит отслеживать прогресс и замечать проблемы на ранних стадиях.
Запрос на индексирование новой страницы
Сообщите Google о вашей новой странице, запросив ее индексацию. Такой запрос сработает только для вновь созданных страниц и не поможет, если Google уже посещал их и по каким-то причинам не проиндексировал.
Перед запросом на индексацию обязательно:
- Добавить внутренние ссылки на новую страницу с релевантных и/или популярных страниц вашего сайта
- Добавить качественные обратные ссылки на новую страницу с других ресурсов
- Добавить новую страницу на карту сайта
Затем зайдите в Google Search Console и запросите индексацию:
- Откройте инструмент проверки URL-адресов
- Вставьте ссылку на страницу, которую хотите проверить
- Нажмите «Запросить индексацию»
Проверьте существующий контент
Контент является наиболее важной частью веб-сайта. Если у вас есть старые страницы, которые еще не были проиндексированы, это может указывать на проблему. Мы подготовили список самых распространенных ошибок в контенте и поделимся советами, как их избежать.
Обратные ссылки
Качественные обратные ссылки сообщают Google, что страница, на которую они ссылаются, была высоко оценена пользователями. Это не означает, что страницы без обратных ссылок никогда не будут проиндексированы, просто это может занять больше времени.
Не забывайте следить за тем, откуда берутся ссылки. Источники низкого качества также могут плохо повлиять на индексацию. То же самое относится и к массовым ссылкам в комментариях к блогам, социальным сетям и т. д. Думая о том, как получить обратные ссылки для своего блога, лучше сосредоточиться на надежных и ценных ресурсах.
Содержание
Контент должен быть качественным и уникальным. Это важно не только для пользователей, но и для поисковых систем. Страница с низкой уникальностью статьи может быть признана роботом бесполезной и не будет проиндексирована.
Разделите страницы вашего сайта на важные и неважные с точки зрения индексации. Последние могут включать в себя технические или дублирующие страницы, важные для работы сайта, но не представляющие никакой ценности для пользователя. Если они будут проиндексированы, это может негативно повлиять на общий рейтинг вашего сайта:
- Замедлит индексацию важных страниц.
- Важные страницы будут иметь меньший вес с точки зрения SEO.
- Меньше доверия к сайту со стороны поисковых систем.
- Если у вас есть похожие страницы, важную страницу можно заменить на неважную.
Скорость загрузки
По словам Нила Пателя, 75% посетителей покинут страницу, если она загружается более трех секунд. Скорость загрузки страниц напрямую влияет на индексацию и ранжирование. Чем быстрее скорость, тем полезнее страница для пользователей. Кроме того, у сканеров есть ограничения по времени, поэтому они будут индексировать меньше страниц на сайте с низкой скоростью.
Проверьте скорость загрузки вашего сайта с помощью одного из следующих инструментов:
- PageSpeed Insights измеряет скорость загрузки, выделяет слабые места и дает рекомендации.
- Google Analytics также помогает проверить скорость вашего сайта. Нажмите «Поведение», затем «Скорость загрузки сайта». Он также имеет интеграцию с PageSpeed Insight.
- Serpstat Site Audit позволяет проверить скорость загрузки для мобильных и десктопных устройств. Вы получите сводку об ошибках, замедляющих скорость, и рекомендации по их устранению.
Вложение страниц
Вложенность страниц — еще один важный момент для индексации сайта. По сути, это структура вашего сайта:
Страницы, расположенные далеко от главной страницы, могут быть пропущены поисковыми роботами. Итак, убедитесь, что все страницы вашего сайта легко доступны.
Существует два типа размещения страниц, о которых нужно позаботиться:
- Вложение по кликам. Проверьте, сколько раз пользователю нужно кликнуть, чтобы попасть на страницу. Если это слишком глубоко в структуре, вы можете исправить это, упростив последнюю. В идеале все страницы должны быть в пределах трех кликов от главной страницы.
- Вложение по URL. Сканеры не любят длинные URL-адреса, поэтому убедитесь, что они короткие. В то же время, когда все страницы находятся на первом уровне вложенности, структура сайта также будет подозрительной для краулера.
Показатель отказов
Показатель отказов — это отношение пользователей, которые посетили более одной веб-страницы, к тем, кто посетил только одну и ушел. Показатель отказов варьируется от 10 до 90% в зависимости от ниши. Например, в интернет-магазинах показатель отказов составляет 20-40%, а в туристической нише в среднем около 37%.
Слишком высокий показатель отказов может указывать на определенные проблемы, такие как:
- Невыполнение запроса пользователя
- Плохой дизайн
- Оскорбительная реклама
- Неудобная навигация
- Низкая скорость загрузки страницы
- Проблемы с мобильностью
Кодировка
Кодирование может стать еще одной основной проблемой как для поисковых роботов, так и для пользователей. Краулеры определяют кодировку на основе информации, полученной с сервера или содержимого веб-страницы. Если есть ошибка в кодировке, текст может не сканироваться.
Вот несколько причин ошибок кодирования:
- Отсутствует тег
Код ответа сервера
Код ответа сервера выдается сервером по запросу клиента. Существуют разные коды состояния ответа HTTP, самые популярные из них:
.- 200 – положительный, означает, что страница успешно загружена.
- 301 — перенаправление посетителя на другую страницу.
- 404 – страница не существует.
Для проверки кода ответа вы можете использовать Audit Serpstat, ScreamingFrog или Web Sniffer. Также вы можете проверить код ответа сервера прямо в Google Chrome. Нажмите F12, затем перейдите на вкладку «Сеть» и выберите «Документ». Обновите страницу и посмотрите код ответа сервера в столбце Статус.
Карта сайта
Все важные страницы, которые вы хотите проиндексировать, должны быть включены в карту сайта. Итак, возникает необходимость регулярно обновлять файл карты сайта и проводить проверки каждые 10-14 дней. Вы можете использовать Screaming Frog или любой другой инструмент для сканирования вашей карты сайта.
Не проведя аудит, вы можете пропустить ряд различных проблем, таких как:
- Дублирование страниц
- Замена страниц (пример — /home вместо / , когда они идентичны)
- Неактуальные адреса, например адрес страницы с http при использовании https.
- Неверный URL страницы с www. когда вы используете страницы без www.
- Страницы перенаправления, страницы 404 или любые другие коды состояния ответа HTTP, отличные от 200.
Фильтры
Существует множество фильтров, которые Google использует для регулирования индексации и ранжирования. Некоторые из них уже стали частью автоматизированных алгоритмов, а другие работают с помощью человека. В некоторых случаях вы можете быстро понять, что попали под санкции, когда заметите сообщение в Google Search Console о своих нарушениях.
Но в других случаях вы можете даже не заметить какой-либо проблемы на ранней стадии. Вот почему так важно отслеживать производительность и рейтинг вашего сайта, например, с помощью одного из следующих инструментов:
- Датчик SEMRush помогает отслеживать позиции в рейтинге
- Инструмент SEO Panguin помогает проверить, не повлияли ли на ваш сайт обновления алгоритма Google
- Google Penalty Checker помогает проверить, был ли ваш сайт наказан Google
Вирусы
Заражение вашего веб-сайта вирусом может произойти несколькими способами:
- Ваш сайт был взломан с использованием уязвимостей
- Вирус переносится с компьютера веб-мастера на сайт через FTP-клиент
- Использование плагинов или надстроек из сомнительных источников
- Размещение рекламных баннеров, содержащих вредоносный код
Очевидно, что вирусы негативно влияют на индексацию и работу сайта. Если на вашем сайте появится какой-либо вирус, вы можете быть оштрафованы поисковыми системами и вашим хостинг-провайдером. Ваш сайт может выпасть из индекса, уменьшится посещаемость и т.д.
Чтобы решить эту проблему, вам нужно будет найти и удалить вирус. Затем вы должны связаться со службой поддержки из Google Search Console и сообщить им, что проблема устранена. Тогда будет необходимость просить хостинг-провайдера разблокировать вас. И, наконец, вам нужно запросить у Google повторную индексацию вашего сайта. После всех этих действий сайт начнет медленно восстанавливаться и набирать трафик.
Стойки
Ваш сайт оптимизирован для поисковых систем, но не индексируется Google? Проблема может быть в файле robots.txt. Проверьте этот файл, перейдите на сайт sitename.com/robots.txt и проверьте написанный там код. Убедитесь, что у вас нет похожих строк в коде:
- User-agent: Googlebot или просто *
- Disallow: /
Такие строки могут препятствовать индексации страниц.