Как проверить индексацию всего сайта и конкретной страницы в Яндексе и Google: инструкция по сервисам и рекомендации
Технические доработки под требования SEO и оптимизация структуры сайта – это первостепенные моменты в продвижении ресурса, но если поисковые системы не знают о нем, то есть он не проиндексирован, то продвижение невозможно.
Что же такое индексация? Это добавление поисковыми роботами собранных сведений о ресурсе в базы данных. Дальнейшее ранжирование происходит уже по проиндексированным страницам. Предлагаем несколько простых и понятных способов проверки страниц, которые «видят» поисковые системы.
Рассмотрим каждый вариант подробнее.
Оглавление:
-
Проверка индексирования сайта через панель Яндекс.Вебмастера и Google Search Console
-
Проверка количества проиндексированных страниц в ПС при помощи операторов
-
Анализ индексации сайта при помощи плагинов и расширений
-
Отслеживание проиндексированных страниц с помощью online сервисов
-
Программы для контроля индексации сайта
-
Проверка индексации страницы
-
Почему сайт может не индексироваться
-
Выводы SEO-специалиста Веб-центра
1. Проверка индексирования сайта через панель Яндекс.Вебмастера и Google Search Console
Бесплатный и достоверный способ с использованием сервисов для вебмастеров.
Яндекс.Вебмастер
В первую очередь выполняем авторизацию в аккаунте Яндекса и входим в сервис Вебмастер. Далее вводим url ресурса и нажимаем кнопку «Добавить».
Добавление сайта в вебмастер Яндекса
После прохождения верификации переходим в панель и нажимаем вкладку «Индексирование» – «Страницы в поиске». Тут представлены страницы веб-сайта, участвующие в поиске Яндекса.
Просмотр страниц в поиске Яндекса через панель для вебмастеров
Также количество загруженных и проиндексированных страниц можно посмотреть в сервисе на странице «Мои сайты».
Просмотр количества страниц в поиске на вкладке «Мои сайты»
Для анализа список страниц можно скачать из сервиса файлом в форматах .xls и .csv.
Google Search Console
Аналогично вебмастеру Яндекса проходим авторизацию в аккаунте Google, входим в сервис search.google, вводим url сайта и нажимаем кнопку «Добавить ресурс».
Пример верификации в панели вебмастеров в Гугл
После подтверждения прав на сайт для проверки индексации ресурса в панели Вебмастера Гугл переходим во вкладку «Индекс» – «Покрытие».
Просмотр страниц в ПС Гугл через панель для вебмастеров
Нужно учитывать, что информация в Google Search Console примерная, так как в отчете показывается статистика после последнего обхода, то есть количество страниц может быть другим на текущий момент проверки.
Примеры проверки индексации сайта
На скриншоте – сайт, у которого нет проблем с индексацией в Яндексе
На скриншоте – сайт, у которого регулярно удаляются страницы из поиска Яндекса
На скриншоте – сайт, у которого регулярно удаляются страницы из поиска Гугл
2. Проверка количества проиндексированных страниц в ПС при помощи операторов
Применяя документный оператор «site» возможно увидеть примерное количество страниц в индексе. Для использования этого параметра введите в строке поиска «site:адрес_интересующего_сайта», например «site:https://www.bordur32.ru».
Пример использования оператора «site» в Яндексе
Пример использования команды «site» в Гугле
3. Анализ индексации сайта при помощи плагинов и расширений
Чтобы не вводить операторы в строке браузера перед url используется данный автоматизированный способ. Скачиваем бесплатный букмарклет для браузера (небольшой по размеру скрипт, сохраняемый в закладках) и кликаем на специальную иконку находясь на сайте.
Пример использования плагина SEO-tools
Установить расширение вы можете по ссылке
Пример использования расширения RDS bar
Установить расширение вы можете по ссылке
4. Отслеживание проиндексированных страниц с помощью online сервисов
Еще один способ проверки индексации это использование сторонних ресурсов. Например, переходим на сайт a.pr-cy.ru вводим url и нажимаем «Анализировать».
Скриншот проверки индексации сайта в a.pr-cy.ru
Индексацию сайта можно проверить и в других сервисах, например: seogadget.ru, xseo.in и других.
5. Программы для контроля индексации сайта
Существуют бесплатные (Site-Auditor) и платные программы (Semonitor) для анализа сайта и проверки страниц в индексе. Выбранное программное обеспечение скачиваем и устанавливаем на ПК. В строку ввода добавляем url проверяемого сайта.
Скриншот фрагмента анализа сайта в программе Site-Auditor
Проверка индексации страницы
Иногда требуется не только узнать сколько страниц проиндексировано в Яндексе и Google, но и нужно определить индексируется ли какая-то конкретная страница. Это можно сделать следующими способами:
1. В панели для вебмастеров:
-
Яндекс – следовать по пути «Индексирование» – «Проверить статус URL». В поле для ввода данных ввести либо полный урл интересующей страницы, либо путь от корня сайта начинающийся с «/». Далее нажать кнопку «Проверить».
Проверяемая страница в поиске Яндекса
-
Google – перейти во вкладку «Проверка URL» и ввести урл интересующей страницы.
Проверяемая страница проиндексирована в Google
2. Оператор «url»
В строке поиска вводим специальный оператор. Запрос будет выглядеть так: «url:адрес_интересующей_страницы».
Пример использования оператора «url» в ПС Яндекс
3. Оператор «info»
В поисковой системе Google можно воспользоваться оператором «info». Запрос в строке поиска будет выглядеть следующим образом: «info:адрес_интересующей_страницы»
Пример использования оператора «info» в ПС Гугл
Почему сайт может не индексироваться
В идеале страницы ресурса должны быть проиндексированы и их количество в поисковых системах должно быть примерно одинаковым. Но так бывает далеко не всегда. Рассмотрим причины мешающие индексации сайта.
Ошибки в файле robots.txt
Файл robots.txt – это текстовый документ в формате .txt лежащий в корневом каталоге веб-сайта, запрещающий или разрешающий индексирование страниц роботам ПС. Поэтому неправильное использование директив может закрыть от индексации весь сайт или отдельные страницы ресурса.
Отсутствие файла sitemap.xml
Карта сайта (файл sitemap.xml) – это специальный документ расположенный в корневом каталоге, содержащий ссылки на все страницы ресурса. Этот файл помогает поисковым роботам оперативно и качественно индексировать ресурс. Поэтому в него нужно добавлять только те страницы, которые должны попасть в индекс.
Новый сайт
Процесс индексации нового ресурса занимает некоторое время. Поэтому в данном случае нужно просто подождать, не забывая контролировать процесс индексации.
Приватные настройки
В некоторых CMS, таких, как WordPress и Megagroup, существует возможность скрыть от индексации страницы через админку сайта, данные настройки могут стоять по умолчанию.
Тег «noindex»
Страницы могут быть закрыты от индекса в коде с помощью мета тега name=»robots» content=»noindex, nofollow» />. Нужно проверить его наличие и либо убрать из кода, либо заменить на «index» и «follow».
Мусорные страницы
Еще одной из причин может стать большое количество мусорных страниц, не предоставляющих полезного и уникального контента в рамках сайта. Такие страницы нужно закрывать от индексации, чтобы не возникали проблемы с индексированием ресурса и робот не тратил время на посещения этих страниц.
Также причиной не индексации страниц ресурса могут быть ошибки сканирования, блокировка сайта в файле .htaccess, дубли страниц, не уникальный контент, низкий uptime хостинга, медленная скорость загрузки сайта, баны и фильтры ПС.
Выводы SEO-специалиста Веб-центра
Главная цель как владельца сайта так и SEO-специалиста добиться индексирования нужных страниц ресурса. Для этого нужно регулярно контролировать страницы в поиске Яндекса и Google, проверять сервисы для вебмастеров на наличие ошибок на сайте, наполнять его уникальным и полезным контентом, следить и оптимизировать скорость загрузки ресурса.
Для ускорения процесса индексации нужно подтвердить права на сайт в Яндекс.Вебмастер и Google Search Console и разместить в них ссылку на файл sitemap.xml, также можно отправлять на переобход важные страницы ресурса.
Подробно эту тему мы разобрали в видео на нашем Ютуб-канале
Как проверить индексацию сайта и страницы в Яндексе и Гугле
В сегодняшней статье я напишу о том, как проверить индексацию сайта и отдельной страницы в Яндексе и Гугле. Кроме этого вы узнаете, что такое основной и дополнительный индекс в поисковой системе Google. Итак, давайте обо всем по порядку.
Как проверить индексацию сайта в Яндексе?
Для того чтобы проверить индексацию целого сайта в Яндексе, достаточно ввести вот такой адрес в поисковую строку:
url:www.ваш домен* | url:ваш домен*
пример:
url:www.vachevskiy.ru* | url:vachevskiy.ru*
В результатах поиска можно узнать, сколько страниц находиться в индексе Яндекса, посмотреть на сниппет и заголовок Title. Кроме этого с помощью такого запроса можно увидеть, какие картинки индексирует Яндекс. Для этого достаточно нажать справа на ссылку: «Все картинки»:
В данном случае видно, что поисковая система индексирует 83 документа.
С помощью дополнения RDS Bar также можно посмотреть индексацию страниц и не только. Это расширения позволяет узнать очень много полезной информации о любом сайте, все что нужно, это просто установить его на свой браузер. Подробно где скачать и как пользоваться плагином RDS Bar я писал здесь.
Здесь, напротив надписи «Индекс Я» указано число, которое отвечает за количество проиндексированных документов в Яндексе. На это число можно нажать и увидеть все страницы в выдаче, как и в предыдущем случае.
В Яндекс Вебмастере также отображается информация об индексации сайта. Там можно узнать, сколько страниц запрещено к индексированию в файле robots.txt, а сколько индексируется. Но проблема в том, что там показывается индексация ресурса немного с задержкой. Например, я знаю, что Яндексом сейчас проиндексировано 83 страницы, а в Вебмастере отображается только 77 :smile::
Но все равно это очень полезный сервис и туда нужно добавить сайт обязательно.
Как проверить индексацию страницы в Яндексе?
Иногда есть необходимость проверить не индексацию сайта а конкретной страницы. Для этого достаточно в поисковую строку Яндекса ввести вот такой запрос:
site:адрес любой страницы
Пример:
site:vachevskiy.ru/rds-bar
Если страница проиндексирована, то вы увидите ее в результатах поиска:
Если не проиндексирована, то будет писать: «Искомая комбинация слов нигде не встречается».
Кроме этого индексацию конкретной страницы можно проверить с помощью дополнения RDS Bar. Если страница проиндексирована, то напротив надписи «Индекс Я стр.» будет писать «да», когда не проиндексирована, то соответственно «нет». Если документ был проиндексирован недавно, то будет отображаться время индексации, например: «вчера», «16 часов назад» и т. д. Таким образом можно определить, как быстро индексируется ваш ресурс:
Как проверить индексацию сайта в Гугле?
Прежде чем перейти к проверке индексации ресурса в Гугле, нужно понимать, что в этой поисковой системе есть два индекса: «основной» и «дополнительный».
В основной индекс попадают только качественные документы, которые участвуют в ранжировании.
В дополнительном индексе находятся некачественные страницы, которые появляются в результатах поиска очень редко. Ну, например, когда пользователь вводит какой-нибудь странный запрос, и в основном индексе нет на него ответа :smile:. В дополнительный поиск Гугл заносит дубликаты документов, неуникальные страницы, документы, запрещенные в файле robots.txt и т. д.
Сейчас на примере моего блога я покажу, как можно узнать, сколько документов находится в основном поиске, а сколько в дополнительном.
Сначала узнаем, сколько всего документов Гугл индексирует. Для этого я ввожу в поисковую строку такой запрос:
site:vachevskiy.ru
Как видно в индексе Гугла 423 страницы.
Теперь нам нужно узнать, сколько документов находиться в основном индексе. Для этого я ввожу вот такой запрос:
site:vachevskiy.ru/&
В основном индексе 108 документов. Теперь давайте узнаем, сколько страниц находиться в дополнительном индексе. И сделать это очень просто. Нужно отнять все страницы, которые индексирует Гугл, от тех, которые находятся в основном поиске. В данном случае 423 – 108 = 315.
Итак, 315 страниц – это «сопли», которые не участвуют в ранжировании. Гугл почему-то занес туда те документы, которые запрещены от индексации в robots.txt. Почему, не знаю, но ничего страшного в этом нет, главное чтобы в основном поиске были основные документы, которые не запрещены к индексации.
Проверить индексацию сайта в Гугле можно также и с помощью дополнения RDS Bar:
Здесь нам слева показано, сколько всего страниц Гугл индексирует, а справа, какой процент от этих документов участвуют в основном поиске. Но данные также могут быть немного не точными.
Проверить индексацию целого ресурса в Гугле можно еще и с помощью инструмента Google Webmaster. Сначала, конечно, нужно добавить туда сайт, если его там нет. Потом перейдите в раздел «Индекс Google» -> «Статус индексирования» и выберите «Расширенные данные»:
Здесь можно посмотреть, сколько страниц проиндексировано всего, а сколько заблокировано в Robots.txt. Но данные отображаются с задержкой, поэтому они далеко не всегда правильные :smile:.
Как проверить индексацию страницы в Гугле?
Для проверки индексации отдельного документа в поисковой системе Гугл, как и в случае с Яндексом достаточно ввести в строку такой запрос:
site:vachevskiy.ru/rds-bar
Кроме этого RDS Bar также определяет индексацию страницы:
Как видите все очень просто, если установить плагин RDS Bar на свой браузер, то можно за секунду узнать индексацию сайта или страницы в Яндексе и Гугле.
На этом я, пожалуй, закончу. Всем пока ;-).
Индексация сайта в поисковых системах Яндекс и Google. Как ускорить, проверить
Индексация сайта в поисковых системах — важная составляющая продвижения сайта в топ Яндекс и Google.
В статье расскажем, что такое индексация сайта, чем отличается индексация Яндекс и Google, как проиндексировать сайт в поисковых системах и как можно ускорить этот процесс. В завершении покажем, как проверить индексацию страниц.
Получайте до 18% от расходов на контекстную и таргетированную рекламу!Рекомендуем: Click.ru – маркетплейс рекламных платформ:
- Более 2000 рекламных агентств и фрилансеров уже работают с сервисом.
- Подключиться можно самому за 1 день.
- Зарабатывайте с первого потраченного рубля, без начальных ограничений, без входного барьера.
- Выплаты на WebMoney, на карту физическому лицу, реинвестирование в рекламу.
- У вас остаются прямые доступы в рекламные кабинеты, рай для бухгалтерии по документообороту и оплатам.
Читайте также: 10 лучших курсов по SEO-продвижению
Что такое индексация сайта в поисковых системах?
Индексация сайта или страниц сайта — это когда поисковые роботы обходят сайт и собирают данные о его содержании. Во время индексации сканируется вёрстка, текст, внешние и внутренние ссылки, графические и медиа элементы. После успешной проверки сайт попадает в индекс поисковой системы.
Простыми словами, поисковики вносят ваш сайт в свою базу данных и решают, показывать ли его в результатах выдачи. Далее поисковая система ранжирует ресурсы по собственным алгоритмам, учитывая полезность, тематику и другие параметры.
По большому счёту, процесс индексирования сайта в Яндекс и Google идентичен, но с одним отличием. В 2019 году Google изменил свой основной принцип индексирования сайта и перешёл на Mobile-first. С этого момента, поисковик в первую очередь сканирует мобильную версию страниц, а не десктопную. Поэтому, если вы хотите, чтобы ваш сайт лучше ранжировался в Google, проработайте отображение сайта на мобильных устройствах.
При этом, не стоит путать индексацию и ранжирование сайта:
- Ранжирование — это порядок отображения сайта в результатах поисковой выдачи, по определённым запросам.
- Индексация — это всего лишь фиксация данных о сайте в базе данных ПС.
Не путайте!
Как проиндексировать сайт в Яндекс и Google
По факту, можно ничего не делать и просто подождать, и поисковые системы, рано или поздно, самостоятельно проиндексируют сайт. Но лучше не надеяться на поисковики и взять инициативу в свои руки.
Но перед тем, как отправить сайт на индексацию, помните о поисковой оптимизации: правильном заполнении title и description, заголовков h2 и h3-H6, уникальном тексте, перелинковке, микроразметке.
Когда сайт готов, можно переходить к индексации.
Индексация сайта в Яндексе:
- Правильно прописать файл robots.txt.
- Сделать карту сайта.
- Добавить сайт в Яндекс.Вебмастер.
- Отправлять новые страницы на индексацию.
Индексация сайта в Google:
- Правильно прописать файл robots.txt.
- Сделать карту сайта.
- Добавить сайт в Google Search Console.
- Отправлять новые страницы на индексацию.
После этого поисковикам потребуется время на то, чтобы собрать и отобразить данные о сайте. Отобразятся они там же, в Яндекс.Вебмастер и Search Console. Обычно на это уходит 2-3 дня, может и больше, но не более недели.
Если вы всё сделали правильно и сайт до сих пор не проиндексирован, то почитайте нашу статью: скоро здесь появится ссылка.
Как ускорить индексацию сайта
Выпустили новую статью и хотите, чтобы она как можно быстрее стала приводить вам поисковый трафик? В таком случае, можно ускорить индексацию новой страницы.
Вот несколько действенных способов:
- Откройте Яндекс.Вебмастер. Перейдите «Индексирование — Переобход страниц». Вставьте в текстовое поле URL-адрес и нажмите внизу «Отправить». Молодые сайты таким способом могут проиндексировать до 30 новых страниц за сутки, далее лимиты устанавливаются индивидуально.
- Для Google. Заходим в Search Console. В поле сверху вставляем URL-адрес и жмём Enter. Откроется страница с предварительными данными, здесь нажимаем «Запросить индексирование».
- Разместите ссылку на новую страницу в социальных сетях: ВКонтакте, Facebook, Twitter и прочих. Чем больше, тем лучше.
- Сделайте email-рассылку с анонсом новой страницы или статьи. Также рассылку можно сделать в соцсетях или мессенджерах.
- Добавьте внутренние ссылки, ведущих на нужную страницу. Лучше всего размещать такие ссылки на самых посещаемых страницах своего сайта.
- Чаще обновляйте сайт и публикуйте новый контент. Тогда поисковые роботы сами будут чаще сканировать ваш ресурс.
Все эти действия в комплексе или по отдельности позволят поисковикам раньше обнаружить и проиндексировать новую страницу или ресурс в целом.
Как проверить индексацию сайта
Чтобы проверить индексацию сайта в поисковых системах, можно сделать следующее.
Способ 1. Введите в поиске специальный запрос: оператор [site] и адрес сайта (без пробела).
Пример: site:postium.ru.
Актуально, как для Яндекса, так и для Google.
Способ 2: Как узнать сколько страниц проиндексировал Яндекс.
Заходим в Яндекс.Вебмастер и переходим «Индексирование — Структура сайта». Напротив своего сайта, в столбце «В поиске» вы увидите количество проиндексированных страниц.
Способ 3: Как узнать сколько страниц проиндексировал Google.
Заходим в Search Console и открываем раздел «Покрытие». Здесь также показывается количество проиндексированных страниц, и страницы с ошибками.
Способ 4. Расширения для браузера, такой как, например RDS-бар.
Способ 5. Различные SEO-сервисы для анализа сайтов: Serpstat, Netpeak Checker, Pr-cy и прочие.
ЗаключениеПосле успешной индексации сайта в поисковых системах, работа не заканчивается. Необходимо периодически делать анализ индексации сайт, а так же снимать позиции по популярным запросам. Это позволит держать руку на пульсе и не оказаться в ситуации, когда значительная часть трафика из поисковиков просто исчезла.
Полезные ссылки:
Как проверить индексацию сайта – просто о важном
Каждая поисковая система в Интернете имеет собственную базу данных сайтов, среди которых и проводится поиск по вводимым пользователями запросам. Добавление сайта в эту базу называется индексацией сайта.
Она выполняется специальными поисковыми роботами и проходит по определенным алгоритмам. Каждая из существующих поисковых систем имеет собственные алгоритмы индексации.
Индексация страниц сайта играет важнейшую роль в его продвижении. От нее зависит, узнают о вашем ресурсе пользователи Сети, или нет, увидят его, или нет. По этой причине сайт сразу же стараются зарегистрировать в Гугле и в Яндексе, чтобы ускорить его раскрутку.
Проверка индексации сайта выполняется по-разному в разных поисковых системах. Если вы хотите узнать, проиндексирован ли ваш сайт, следуйте приведенным ниже инструкциям.
Одна из самых популярных и крупных поисковых машин Интернета содержит в своей базе данных несчетное количество сайтов и страниц. Чтобы проверить индексацию сайта в Google, в его поисковой строке наберите запрос: site:url_сайта (можно без http://):
После введения данного запроса Google покажет, сколько страниц сайта он проиндексировал. При этом необходимо знать, что Google имеет два списка индексации: основной и дополнительный. В основной список он добавляет качественные страницы, которые появляются в поисковой выдаче.
В дополнительный список попадают не уникальные страницы или дубликаты страниц, которые очень редко, или вообще никогда не участвуют в ранжировании. Чтобы проверить, сколько документов попало в основной список, наберите: site:url_сайта/&.
Чтобы проверить индексацию сайта в Яндексе, наберите в поисковой строке:
url:www.ваш домен* | url:ваш домен* (звездочки вводить обязательно):
Если вы хотите проверить индексацию конкретной страницы, а не всего сайта, наберите следующий запрос:
site:url_страницы.
Не секрет, что быстрая индексация сайта привлекательна. Обычно на то, чтобы поисковые роботы «заметили» ваш сайт, уходит не один месяц. Что делать, если вы хотите ускорить этот процесс?
Ускорить индексацию можно разными способами в зависимости от поисковой системы. Тем не менее, существует несколько стандартных шагов:
- Создайте XML-файл Sitemap. В нем укажите URL страниц сайта, которые нужно проиндексировать с метаданными – датой последнего изменения, частотой изменений и приоритетностью на уровне сайта;
- Можно «облегчить» роботам работу, исключив из индексации не нужные страницы. Можно запретить индексацию страниц сайта в файле robots.txt, в котором перечисляются URL запрещенных страниц;
- Создайте страницу с картой сайта, которая будет содержать ссылки на все страницы ресурса.
Один из секретов быстрой индексации в Google состоит в следующем. Найдите наиболее популярные ресурсы по тематике, схожей с тематикой вашего сайта.
Договоритесь с его администрацией о размещении на их сайте ссылки на ваш в обмен на размещение обратной ссылки на вашем ресурсе. Если их сайт имеет высокий показатель PageRank, ваш может быть проиндексирован за считанные сутки.
Ускорить индексацию сайта в Яндексе можно разными способами. Суть этих способов состоит в том же, в чем и суть методов ускорения аналогичного процесса в гугле. Нужно добиться того, чтобы на ваш сайт вели ссылки со сторонних уже раскрученных и популярных ресурсов.
К примеру, можно воспользоваться сервисами вопросов и ответов от Mail.ru и Google. Найдите пользователя, который ищет ответ на вопрос, освещенный на вашем сайте. В своем ответе для более полной информации вы можете оставить ссылку на ваш сайт.
Если по каким-либо причинам вы не хотите, чтобы ваш сайт был проиндексирован поисковыми системами, в вышеупомянутом файле robots.txt напишите следующие инструкции:
User-agent: * Disallow: /
Этого достаточно, чтобы закрыть сайт от индексации.
Удачи!
Как проверить 100 тыс страниц на вхождение в индекс Google — инструкция
Для специалиста по поисковой оптимизации понимание того, как Google и другие поисковые системы сканируют и индексируют веб-сайт, является одним из главных приоритетов. Однако получить необходимые данные для анализа сотен тысяч страниц не так просто, как хотелось бы.
Первое, о чем подумает опытный SEO-гуру, — это автоматическая обработка лог-файла визитов сайта, чтобы отследить посещения робота Google. Но само посещение еще не гарантирует добавление страницы в индекс. У нас сотни тысяч страниц находятся в индексе, поэтому мы задумались о разработке надежного способа получения данных о статусе индексации Google.
В этом материале мы поговорим:
-
почему важно знать статус индексации сайта;
-
какие проблемы чаще всего возникают при сборе данных об индексации Google;
-
о решении этой задачи с помощью кастомного инструмента проверки индексации;
-
как проверить индексацию сайта самостоятельно.
Почему важно знать статус индексации сайта
Если вы крупный издатель, то наверняка хотите привлечь потенциальных пользователей или клиентов на сайт из поиска Google. Если веб-сайт (или его часть) не проиндексирован, вы не будете отображаться в результатах поиска и потеряете любой потенциальный органический трафик, конверсии или рекламный инвентарь останется невостребованным.
Но может быть и обратная проблема. Если веб-сайт создает URL-адреса в геометрической прогрессии (обычная проблема на сайтах электронной торговли) или допускает неконтролируемый пользовательский контент, то Google может сканировать и индексировать больше, чем следовало бы. Это может быстро привести к огромной неэффективности в ущерб основной архитектуре сайта. В этом случае страницы, которые представляют пользу для издателя будут отдаваться сервером медленнее, именно потому что сервер тратит много времени на отработку запросов бота Google. Поэтому реальный человек, когда зайдет на сайт, получит контент медленнее или вообще не получит, так как сервер сбросит его соединение по таймауту.
Распространенные проблемы при сборе данных об индексации Google
Скорее всего, для сбора данных индексации вы используете Google Search Console или стороннее решение. Однако оба варианта имеют свой набор недостатков, когда дело доходит до проверки индексирования сотен тысяч страниц. Обычно они связаны с доступностью данных и точностью результатов. Это те проблемы, с которыми столкнулись мы.
Ограничения Google Search Console
Google Search Console (GSC) — достоверный и точный источник данных о статусе индексации, ведь он подключен к системе индексирования Google. В GSC есть три суперполезных отчета, которые предоставляют данные о статусе индексации: инструмент URL Inspector, отчет о покрытии и отчет о файлах Sitemap.
Однако ни один из этих отчетов не подходит для крупномасштабных веб-сайтов, поскольку GSC ограничивает количество URL-адресов, которые вы можете проверять в день (50 URL для инспектора, и по 1000 URL в остальных отчетах).
Мы хорошо знаем об этом, потому что нам приходилось автоматизировать работу браузера для работы с URL Inspector Tool. Возможно, мы поделимся этим драгоценным опытом в новой статье.
Теоретически отчет о покрытии и отчет о файлах Sitemap могут помочь, но, к сожалению, Google Search Console ограничивает отчет об экспорте до 1000 строк данных, и сейчас нет доступа к API для извлечения большего количества.
GSC ограничивает экспорт до 1000 URL, но у нас сотни тысяч страниц… Спасибо Google 🙂
Наверное, единственный способ обойти это ограничение — разделить всю архитектуру сайта на XML-карты объемом не более 1000 URL-адресов. Следовательно, если на сайте есть 100 000 (известных / важных) URL-адресов, потребуется создать 100 XML-файлов Sitemap. Но этим было бы очень сложно управлять, и поэтому не вариант.
Кроме того, это не даст вам необходимых данных для индексации неконтролируемых URL-адресов, созданных с помощью фасетной навигации или пользовательского контента.
Ограничения URL Profiler
В некоторых случаях профилировщик URL был подходящим вариантом для сбора данных индексации. Хотя нам нравится этот инструмент для решения других задач, мы поняли, что у него много проблем с получением точных данных для «нечистых» URL.
Некоторые примеры включают параметризованные URL-адреса, URL-адреса с закодированными символами, URL-адреса с различным регистром букв и URL-адреса с небезопасными символами.
Решение: кастомный инструмент проверки индексации
Чтобы обойти ограничения, с которыми сталкиваются большинство SEO-специалистов, работающих с крупными проектами, мы разработали специальный скрипт для проверки индексации.
Он может проверять неограниченное количество URL-адресов с любыми типами проблемных символов: параметры, кодировка, зарезервированные символы, небезопасные символы, разные алфавиты — если Google проиндексировал страницу, наш скрипт подтвердит это.
Как настроить скрипт
Вам понадобятся начальные знания о командной строке и немного о node.js. Скорее всего, этого будет достаточно.
Сначала установите последнюю версию Node.js на свой компьютер. Затем загрузите или клонируйте наш репозиторий с GitHub.
Откройте командную строку и перейдите в папку, которую вы только что скачали. Затем установите необходимые зависимости, используя следующую команду:
npm install
Раньше, если бы вам приходилось парсить результаты поиска Google, понадобилось бы много прокси-серверов, но благодаря ребятам из ScraperAPI это больше не проблема. У них есть тысячи прокси по всему миру, поэтому всё, что вам нужно сделать, — это отправить запрос, используя вызов через их API, они будут выполнять ротацию прокси в фоновом режиме. Как это сделать, читайте дальше.
Перейдите на сайт ScraperAPI и создайте учетную запись. Первые 1000 запросов в месяц бесплатны, этого более чем достаточно для тестирования нашего скрипта, а за $29 можно проверить 250 000 страниц.
Зайдите в свой аккаунт и получите свой API-ключ.
Добавьте свой ключ API в файл APIKEY.js, который находится в папке, которую вы скачали с нашего репозитория.
Пора запускать скрипт
Теперь добавьте список URL-адресов, которые вы хотите проверить на индексирование Google и сохраните его без заголовков в виде CSV с именем urls.csv в папке, которую скачали. Обязательно используйте полные URL-адреса с протоколом.
Если у вас нет списка, вы можете использовать наш список сложных URL. Мы подготовили его, когда разрабатывали скрипт, и он включает почти все проблемные типы URL-адресов, а также несколько поддельных URL-адресов, чтобы проверить, не было ли ложных срабатываний.
Перейдите в обратно в командную строку и запустите скрипт с помощью следующей команды:
npm run start
Работа скрипта началась. Теперь вы должны увидеть URL-адреса из вашего CSV, появляющиеся в командной строке с кодом ответа сервера.
Поскольку скрипт использует прокси, иногда вы будете получать код состояния 500. Ничего страшного:, скрипт повторно обработает эти ошибки и повторно запустит список, пока не будут проверены все URL-адреса.
По завершении сценария вы получите сообщение об успешном выполнении и новый файл с именем results.csv. Внутри вы найдете список URL-адресов с указанием статуса индексации.
В среднем проверка 2500 URL-адресов занимает около часа, поэтому если вы планируете использовать этот скрипт для тысяч URL-адресов, имейте это в виду.
как сделать в Яндексе и Гугле
Автор Prodvigaem Team На чтение 5 мин. Просмотров 141 Опубликовано
Регулярная проверка индексирования сайта необходима при продвижении в поисковых системах. Вы должны проверять на наличие в индексе не только целевые URL, но и возможное попадание в поисковую выдачу «мусорных» или служебных страниц.
Способы проверки
Поисковый запрос в Google
Самый быстрый вариант проверить индексацию сайта в индексе яндекса и гугла – это сформировать в поисковой строке запрос вида «site:yoursite.ru». Естественно, после команды site: нужно указывать свой адрес ресурса. Выполнив поиск, Google покажет все страницы, находящиеся в индексе.
Помимо поиска всех страниц, можете точно так же найти все ресурсы раздела. Если же требуется проверка индекса конкретной страницы, то в этом поможет оператор поискового запроса «info:».
Google Search Console
Незаменимый инструмент SEO-оптимизации. Если Вы еще не зарегистрировали свой сайт в панели вебмастера Google, сделайте это как можно скорее.
Чтобы посмотреть статус индексирования зайдите в раздел Индекс Google > Статус индексирования. В этом разделе Вы увидите количество проиндексированных страниц проверяемой площадки. Сравните количество проиндексированных URL с количеством в файле sitemap.xml.
Если проиндексировано страниц меньше, чем содержит XML карта сайта, возможно, наблюдается одна из проблем, о которых мы поговорим немного позже. Если же страниц в индексе находится больше, чем в файле sitemap, значит, в индекс попали лишние страницы, которые нужно срочно закрыть от индексации.
Лишние URL:
- Страницы дубликаты контента (создаются автоматически некоторыми CMS системами).
- Служебные ресурсы (файлы CMS системы, админ-панель).
- Файлы. Например, PDF фалы, могут попасть в индекс.
SEO-плагины для браузеров
SEO-плагины – это специальные надстройки для браузеров, которые позволяют узнать основную информацию об открытом сайте, попавшую в выдачу поисковиков Яндекс и Гугл: количество проиндексированных ресурсов и картинок, рейтинг, ошибки в meta-тегах и много другой ценной информации. Один из самых популярных плагинов – RDS bar для Google Chrome или Mozilla.
Netpeak Spider и Netpeak checker
Два профессиональных инструмента для вебмастеров, которые занимаются вопросами SEO. Эти программы платные. Netpeak Spider стоит 117.6$ в год, а Checker 159.6$ в год. Есть подписки на месяц, три или полгода. Несмотря на внушительную стоимость, относительно других инструментов: эти две программы позволяют проводить SEO-анализ по самым глубоким показателям и находить SEO-ошибки.
Netpeak Spider
Как можно понять из названия – это программа паук, которая, пройдя по всему сайту, найдет все страницы, скачает контент так, как его видят поисковые роботы, и выдаст отчет по 112 показателям. Сейчас же нас интересует проверка соответствия инструкции для индексации.
Проверяем инструкции для поисковых агентов (пауков).
В программе Netpeak Spider зайдите в меню «Настройки сканирования», и в разделе «индексация» отметьте все пункты. После проведения сканирования программа выдаст отчет по всему сайту.
Куда смотреть в отчете
Запомните теги, которые указывают на разрешение или запрет на индексацию конкретной страницы.
Разрешающие команды:
- Allow – команда из robots.txt.
- Index – из тега meta-robots. Разрешает показ в результатах поиска.
- Follow – из тега meta-robots. Разрешает переходить по ссылкам со страницы.
Запрещающими тегами будут соответственно:
- Disallow.
- Noindex.
- Nofollow.
Проверьте все страницы в отчете на предмет соответствия целям. Нет ли в отчете важных disallow страниц? Нет ли мусорных, наоборот, разрешенных к индексированию?
Canonical URL
Канонический URL – это указание в специальном теге страницы оригинала. Если на вашем ресурсе существуют страницы дубликаты, или частичные дубликаты, нужно указывать канонический URL в специальном теге.
Пример: <link rel=»canonical»href=»http://site.ru/blog/index/google»/>
В этом отчете указываются данные об исходных URL, если они были указаны.
Netpeak Checker
Эта программа покажет: проиндексирован сайт или нет, а также, сколько страниц проиндексировано.
Запустите сканирование и выберите пункт Google SERP: URL.
Значения TRUE / FALSE покажут наличие индексации и склейки с другим доменом или URL. А в следующей колонке Вы увидите количество проиндексированных страниц.
Screaming Frog SEO Spider
Еще один сервис-паук для SEO-анализа сайта. Сразу о приятном. Программа имеет бесплатную ограниченную версию, которая может анализировать сайты до 500 страниц. Если же нужно проанализировать ресурс большего размера, Вы можете купить программу за 149 фунтов в год.
Конечно, покупать программу за 150 фунтов для проверки индексации абсолютно не целесообразно. Однако помимо проверки индекса домена и заданных страниц, Screaming Frog проводит полный технический SEO-аудит сайта. Поэтому рекомендуем ознакомиться с программой хотя бы в бесплатной версии.
Xenu Link Sleuth
Старая и надежная программа для аудита архитектуры сайта и поиска нерабочих ссылок. Функционал программы сильно уступает ранее описанным, однако Xenu распространяется бесплатно. Xenu не предназначена для проверки индексации, однако позволит найти базовые ошибки в архитектуре сайта.
Почему может не индексироваться контент
- Вы запретили доступ к индексации в файле robots.txt.
- Отсутствует файл sitemap.xml.
- Существует много дублей, вызванных неправильной работой CMS. Тоже касается битых ссылок и висячих узлов.
- На сайте присутствует вирус.
- Низкая скорость загрузки сайта.
Как ускорить индексацию
Прежде чем заняться вопросом ускорения, индексации необходимо устранить SEO-ошибки, т.к. они влияют на доверие поисковой системы к вашему ресурсу. После, можете применить некоторые лайфхаки для ускорения индексации.
Ускорение индексации:
- Опубликуйте ссылку на ресурс и на каждую страницу в социальной сети Google+ и других социальных сетях.
- Если Вы выкатываете большое количество страниц, можете обновить файл sitemap.xml в панели вебмастера.
- Регулярно обновляйте контент на своем ресурсе. Поисковик выработает график посещения и страницы будут быстрее попадать в индекс.
После того как вы научитесь проверять индексацию своего сайта, вы сможете вовремя обнаруживать проблемы со страницами на нем.
Как проверить индексацию сайта и страницы в Яндексе, Гугле?
Поисковые системы приводят основную массу посетителей на сайты, поэтому каждый вебмастер стремится как можно быстрее добавить свой ресурс и новые страницы в поисковики.
Как добавить сайт в Яндекс и Google мы уже рассказывали, но чтобы поисковые системы начали индексацию, на это требуется время.
Как проверить индексацию сайта и страницы? Вы можете узнать, проиндексирована ваша страница или сайт в любое время. Для этого можно использовать разные способы, например, установить специальный тулбар или просто делать запросы в поиске. Сейчас мы покажем, как это делать.
Индексация в Яндексе, как проверить?
Перед тем как представить самый простой способ, напомним про плагин RDS Bar, о котором мы рассказывали в расширениях браузера для блоггера. После установки этой утилиты в браузер, вы будете получать много разной информации о любом сайте, на который зайдете:
Самое главное, что в нем отображается количество проиндексированных страниц наиболее известными поисковыми машинами. Так вы сможете легко следить за тем, когда в поиске появятся страницы ваших сайтов.
Проверка индексации сайта
Без программ и расширений провести проверку тоже можно. Например, чтобы проверить индексацию сайта в Яндексе, откройте поисковую систему и введите вот такой запрос:
url:www.workion.ru* | url:workion.ru* (укажите свой адрес)
После этого откроется выдача, где будут представлены все страницы вашего сайта (если вообще проиндексирован):
Здесь же вы увидите приблизительное количество страниц, которые добавлены в выдачу от вашего сайта.
Проверить индексацию сайта в Google тоже не сложно, используйте запрос site:workion.ru:
Здесь представляется более точное количество всех проиндексированных страниц, а ниже вы увидите, как они выглядят в выдаче.
Как проверить индексацию страницы?
Чтобы выполнить проверку отдельной страницы, потребуется использовать другой вид запроса — site:https://workion.ru/kak-zarabotat:
Если страница находится в индексе, то она появится в выдаче. Аналогичным образом вы можете сделать проверку в Гугле:
Следить за индексацией через строку поиска неудобно, поэтому лучше добавить свои сайты в сервисы для вебмастеров от Яндекса и Google, где будут отображаться подробные данные о ресурсе и страницах.
Если ваш сайт слишком долго добавляется в поисковики, узнайте, как ускорить индексацию или используйте услуги сервиса Buydrop.
Индексация в поисковых системах легко проверяется. Заметили, что ваш сайт или страницы вообще не добавляются в выдачу? Читайте, почему не индексируется сайт. Если вы создали качественный ресурс и не копировали информацию с других сайтов, то страницы обязательно будут проиндексированы.
Вам также будет интересно:
— Как получать естественные ссылки?
Узнайте, сколько страниц домена проиндексировано Google
Google предоставляет два простых варианта определения количества проиндексированных страниц вашего домена. Один общедоступен для всех доменов, другой находится в Search Console. Вот как их использовать.
Сайт Google: запрос
Используя простой поисковый запрос браузера с так называемым оператором «site:» и вашим доменом, вы можете получить приблизительное количество страниц, проиндексированных Google.
В поле поиска Google или в строке поиска браузера Chrome введите следующее:
сайт: www.my-domain.com
Результат поискового запроса должен выглядеть следующим образом:
Если в индексе много страниц, результат site: query можно отфильтровать с помощью различных параметров:
- site: www .my-domain.com / subdirectory /
Отображает только проиндексированные страницы в каталоге / subdirectory / - site: www.my-domain.com Фраза выбора
Отображает только те проиндексированные страницы, которые содержат выбранную вами фразу - сайт: www.my-domain.com inurl: фраза
Отображает только те проиндексированные страницы, которые содержат слово «фраза» в URL. - site: www.my-domain.com intitle: фраза
Отображает только те проиндексированные страницы, которые содержат слово «фраза» в заголовке - сайт: www.my-domain.com filetype: pdf
Отображает только те проиндексированные файлы с выбранным типом файла (другие возможные типы файлов: doc, pdf, ps, xls, rtf, swf и т. Д.)
Сайт: цифры запроса следует рассматривать только как индикатор, и возможно, что поиск из разных мест в разное время может дать очень разные результаты.
Использование консоли поиска Google
Вы можете легко получить обзор проиндексированных страниц вашего домена в консоли поиска Google.
Анализ состояния индексации вашего веб-сайта с помощью консоли поиска Google следующим образом:
- Войдите в консоль поиска Google и выберите желаемый веб-сайт.
- Нажмите «Покрытие» в левой навигационной панели.
Теперь вы находитесь. показан отчет о покрытии. Общее количество «Действительных» страниц 1 и 2 на изображении выше — это общее количество проиндексированных страниц.
Проиндексированные страницы в консоли поиска Bing
Поисковая система Bing также предоставляет свои собственные инструменты для веб-мастеров, которые также позволяют оценить количество проиндексированных страниц в Bing. В разделе «Эффективность поиска» можно просмотреть историю проиндексированных страниц:
Что такое поисковый индекс и как он работает?
Представьте, что вы вводите поисковый запрос в Google и все ждете и ждете, пока ваши результаты медленно появятся на экране. Вы, вероятно, нажмете кнопку обновления или переключитесь на другой веб-сайт.В эпоху быстро развивающегося Интернета никто не хочет тратить время на ожидание поискового запроса.
Этот сценарий является гипотетическим, поскольку поисковые системы в настоящее время работают очень быстро . В течение нескольких секунд они отображают результаты вашего поиска после того, как вы ввели поисковый запрос. Чтобы ваш пользовательский опыт был таким гладким, поисковые системы используют так называемые поисковые индексы для выдачи результатов по запросу.
Насколько мы привыкли получать быстрые результаты в Google и других популярных поисковых системах, зачастую внутренний поиск по сайту на странице не может предложить результаты так же быстро.Без индекса поиска поисковый запрос забирает ресурсы сервера и замедляет работу сайта. Вот почему поисковый индекс — жизненно важная часть любого хорошего варианта поиска по сайту.
Что такое поисковый индекс?
Индекс поиска помогает пользователям быстро находить информацию на веб-сайте. Он предназначен для сопоставления поисковых запросов с документами или URL-адресами, которые могут появиться в результатах.
Звучит сложно? Вот более простой способ описать это:
Возможно, вы уже сталкивались с указателем на более традиционном носителе : книги .Во многих больших (научных) книгах есть указатели, которые помогут вам найти нужную информацию за секунды.
Обычно в конце книги можно найти указатель, который включает список ключевых слов, упорядоченных в алфавитном порядке. Каждое из ключевых слов указывает на страницу, где вы можете найти полезную информацию о ключевом слове.
Например, у вас может быть книга о животных на несколько сотен страниц. Вы хотите найти информацию о «кошках». В указателе вы должны найти ключевое слово «кошка» и прочитать упомянутые страницы (стр.17, 89, 203-205).
Индекс поиска очень похож на индекс в книге. Позволяет пользователю быстро находить полезную информацию по ключевому слову. Конечно, индекс веб-поиска имеет много технологических преимуществ по сравнению с индексом в книге и предлагает отличные инструменты, помогающие посетителям веб-сайта быстрее получить желаемое.
Как создаются поисковые индексы?
Индексы для книг традиционно создаются авторами, редакторами, а также профессионалами, специализирующимися на индексировании, так называемыми индексаторами.Путем анализа содержания книги они определяют ключевые слова и следят за тем, чтобы они указывали на самые релевантные страницы в книге.
Программа автоматизирует процесс индексации. Индекс поиска для веб-сайтов создается сканерами , также известными как веб-сканеры и веб-пауки. Проще говоря, краулер посещает страницы веб-сайта и собирает содержимое с веб-сайта. Затем эти данные преобразуются в индекс.
Возвращаясь к нашему примеру, если вы выполните поиск по слову «кошка» в Google, вам будут представлены несколько страниц и URL-адресов, релевантных вашему ключевому слову «кошка».В то время как указатель книг статичен, потому что содержание книги не меняется, поисковый индекс является динамическим, поскольку веб-сайты постоянно создаются и обновляются.
Кроме того, количество поисковых запросов в указателе книги фиксировано. Веб-поиск пытается включить все ключевые слова и поддерживает запросы с комбинированными условиями поиска. Например, вы можете поискать «видео с кошками», и поисковый индекс предложит релевантные результаты.
Как результаты поиска возвращаются из индекса?
Когда пользователь вводит поисковый запрос, поисковая система найдет документы, содержащие этот поисковый запрос.Результаты возвращаются из индекса с заголовком , коротким выделением содержимого , возможно изображением и ссылкой на URL-адрес страницы .
Некоторые CMS предлагают собственные поисковые системы, которые обращаются к собственной базе данных CMS. Поскольку база данных не организована как индекс, результаты будут отображаться медленнее, чем при поиске по сайту на основе индекса.
Как поисковый индекс может улучшить ваш веб-сайт
Поисковые системы автоматически собирают содержимое вашего веб-сайта .Приоритетность результатов поиска определяется алгоритмом. Некоторым результатам будет присвоен больший вес, поэтому они будут отображаться перед другими страницами на странице результатов.
Выбирая поисковую систему по сайту, вы можете улучшить результаты поиска с помощью различных функций.
Управление результатами и корректировка ранжирования
Существует три основных функции для управления и корректировки вашего рейтинга в AddSearch — области сайта, закрепленные результаты и рекламные акции.
Области сайта: С помощью функции области сайта вы можете выбрать, какие области вашей веб-страницы вы хотите улучшить, а какое содержание вы хотите уменьшить.Например, вы можете захотеть, чтобы ваши статьи поддержки показывались перед любыми статьями в блоге, если ваш пользователь с большей вероятностью найдет релевантную информацию в разделе «Поддержка». Вы также можете вообще исключить определенные страницы из результатов поиска, например целевые страницы или страницы авторов. Эта функция влияет только на внутренний поиск по сайту, но не на поиск в Google.
Закрепленные результаты: Вы можете закрепить определенный контент, чтобы он отображался вверху страницы результатов. Сначала вы выбираете ключевое слово, затем выбираете страницу, которая должна отображаться первой.Можно закрепить несколько страниц и соответственно упорядочить их. Эта функция отображается как нормальный результат, поэтому ваши пользователи не будут знать, что они смотрят на закрепленный результат.
Промоакции: Подобно закрепленному результату, промоакция отображается первой на странице результатов. Акции можно выбрать для нескольких ключевых слов и страниц. Кроме того, вы можете использовать несколько элементов дизайна, например цвета фона, чтобы сделать рекламу визуально привлекательной для вашего посетителя. Акции могут быть временными, например, в связи с рождественским специальным предложением.
Персонализация
Вы можете персонализировать результаты для каждого посетителя сайта. Благодаря персонализации пользователи могут видеть результаты поиска на основе своих предпочтений и истории просмотров.
Все пользователи заходят на веб-сайт с разной целью, и, хотя кажется, что они выполняют поиск по одному и тому же ключевому слову, ожидаемые результаты могут сильно отличаться. Например, если посетитель сайта, заведомо вегетарианский, вводит запрос «рецепт макарон», в результатах поиска могут сразу же появиться сведения о вегетарианском соусе, в то время как вы порекомендуете мясоеду болоньезе.
Пользовательские результаты более релевантны, а лучшие результаты поиска улучшают пользовательский опыт на вашем веб-сайте, повышают удовлетворенность и, как следствие, повышают конверсию. На персонализацию может влиять что угодно, от просмотра определенной страницы до предпочтительных настроек поиска, информации об учетной записи или истории покупок.
AddSearch также предоставляет владельцам сайтов рекомендации по настройке параметров персонализации, чтобы обеспечить удовлетворение потребностей каждого пользователя. Если вас это интересует, вы можете связаться с нашим отделом продаж.
Пользовательский интерфейс поиска и API
Если вы хотите настроить свой пользовательский интерфейс на более продвинутый и персонализированный дизайн для поиска по сайту, вы можете использовать AddSearch для сканирования вашего сайта и предоставления индекса поиска, но при этом создайте собственный дизайн. Такой индивидуальный подход отлично подходит для оформления страницы результатов поиска с учетом уникальных потребностей и желаний посетителя.
Одна из альтернатив — предоставить поисковому роботу API индексирования. Благодаря этому методу результаты могут постоянно обновляться новым входящим контентом.Это решение имеет смысл, если ваш веб-сайт включает прямые трансляции или постоянно обновляемый контент (например, новостные сайты или видеоплатформы).
Analytics
С помощью Analytics вы можете увидеть, что ищут ваши пользователи, и дать им именно то, что они хотят. Вы можете получить ценную информацию о том, как ваши пользователи используют поиск: как часто ваши пользователи ищут, что они ищут и находят ли они это.
С помощью этой информации вы можете создавать контент, чтобы дать своим пользователям именно то, что они просят.Аналитика включает такую информацию, как самых популярных ключевых слов , ключевые слова без клика или ключевые слова , не возвращающие никаких результатов . AddSearch поддерживает Google Analytics, Adobe Analytics и Matomo, поэтому вы можете интегрировать всю свою аналитику в одном месте.
Подобно редактору книги, который подбирает ключевые слова для индекса, все эти функции предлагают персонализированный «человеческий подход» для улучшения результатов поиска.
Заключение
Подводя итог, мы увидели, что есть некоторые сходства и некоторые различия между индексами поиска книг и поисковых систем.В общем, цель индекса — найти информацию с небольшими усилиями и быстро, используя ключевое слово . Индекс поиска имеет решающее значение для создания релевантных результатов поиска, а дополнительные функции поисковой системы позволяют еще больше улучшить результаты поиска.
Сообщите нам, понравился ли вам пост. Это единственный способ стать лучше.
Что такое индексирование поисковой системы и как оно работает?
Что происходит, когда поисковая система завершает сканирование страницы? Давайте посмотрим на процесс индексирования, который поисковые системы используют для хранения информации о веб-страницах, что позволяет им быстро возвращать релевантные высококачественные результаты.
Зачем нужна индексация поисковыми системами?
Помните дни до появления Интернета, когда вам приходилось обращаться к энциклопедии, чтобы узнать о мире, и копаться в Желтых страницах, чтобы найти сантехника? Даже на заре Интернета, до появления поисковых систем, нам приходилось искать информацию в каталогах. Какой трудоемкий процесс. Откуда у нас хватило терпения?
Поисковые системы произвели революцию в поиске информации до такой степени, что пользователи ожидают почти мгновенных ответов на свои поисковые запросы.
Что такое индексация поисковой системой?
Индексирование — это процесс, с помощью которого поисковые системы систематизируют информацию перед поиском, чтобы обеспечить сверхбыстрые ответы на запросы.
Поиск на отдельных страницах по ключевым словам и темам будет очень медленным процессом для поисковых систем для определения релевантной информации. Вместо этого поисковые системы (включая Google) используют инвертированный индекс, также известный как обратный индекс.
Что такое инвертированный индекс?
Инвертированный индекс — это система, в которой база данных текстовых элементов составляется вместе с указателями на документы, которые содержат эти элементы.Затем поисковые системы используют процесс, называемый токенизацией, для сокращения слов до их основного значения, тем самым уменьшая количество ресурсов, необходимых для хранения и извлечения данных. Это гораздо более быстрый подход, чем перечисление всех известных документов по всем релевантным ключевым словам и символам.
Пример перевернутой индексации
Ниже приведен очень простой пример, иллюстрирующий концепцию перевернутой индексации. В примере вы можете видеть, что каждое ключевое слово (или токен) связано со строкой документов, в которой этот элемент был идентифицирован.
Ключевое слово | Путь к документу 1 | Путь к документу 2 | Путь к документу 3 |
SEO | example.com/seo-tips | moz.com | … |
HTTPS | deepcrawl.co.uk/https-speed | example.com/https-future | … |
В этом примере используются URL-адреса, но это могут быть идентификаторы документов, в зависимости от структуры поисковой системы.
Кешированная версия страницы
В дополнение к индексированию страниц поисковые системы могут также хранить сильно сжатую текстовую версию документа, включая весь HTML и метаданные.
Кэшированный документ — это последний снимок страницы, которую просматривала поисковая система.
Доступ к кэшированной версии страницы (в Google) можно получить, щелкнув маленькую зеленую стрелку рядом с URL каждого результата поиска и выбрав параметр кэширования. Кроме того, вы можете использовать оператор поиска Google «cache:» для просмотра кэшированной версии страницы.
Bing предлагает те же возможности для просмотра кэшированной версии страницы с помощью зеленой стрелки вниз рядом с каждым результатом поиска, но в настоящее время не поддерживает поисковый оператор «cache:».
Что такое PageRank?
«PageRank» — это алгоритм Google, названный в честь соучредителя Google Ларри Пейджа (да, действительно!). Это значение для каждой страницы, рассчитываемое путем подсчета количества ссылок, указывающих на страницу, с целью определения ее ценности. относительно любой другой страницы в Интернете.Значение, передаваемое каждой отдельной ссылкой, основано на количестве и значении ссылок, которые указывают на страницу со ссылкой.
PageRank — лишь один из многих сигналов, используемых в большом алгоритме ранжирования Google.
Примерные значения PageRank изначально были предоставлены Google, но больше не являются общедоступными.
Хотя PageRank — это термин Google, все коммерческие поисковые системы рассчитывают и используют эквивалентную метрику ссылочного капитала. Некоторые инструменты SEO пытаются дать оценку PageRank, используя собственную логику и расчеты.Например, авторитет страницы в инструментах Moz, TrustFlow в Majestic или рейтинг URL в Ahrefs. DeepCrawl имеет метрику DeepRank для измерения ценности страниц на основе внутренних ссылок на веб-сайте.
Как PageRank перемещается по страницам
страниц передают PageRank или ссылочный вес на другие страницы через ссылки. Когда страница ссылается на контент в другом месте, это рассматривается как вотум доверия и доверия, поскольку контент, на который делается ссылка, рекомендуется как релевантный и полезный для пользователей.Подсчет этих ссылок и мера того, насколько авторитетен ссылающийся веб-сайт, определяют относительный PageRank страницы, на которую ведет ссылка.
PageRank делится поровну между всеми обнаруженными ссылками на странице. Например, если на вашей странице пять ссылок, каждая ссылка будет передавать 20% PageRank страницы через каждую ссылку на целевые страницы. Ссылки, использующие атрибут rel = ”nofollow”, не передают PageRank.
Важность обратных ссылок
Обратные ссылки являются краеугольным камнем того, как поисковые системы понимают важность страницы.Было проведено множество исследований и тестов для определения корреляции между обратными ссылками и рейтингом.
Исследование обратных ссылок, проведенное Moz, показывает, что результаты для 50 самых популярных поисковых запросов Google (~ 15 000 результатов поиска), 99,2% из них имеют как минимум 1 внешнюю обратную ссылку. Вдобавок ко всему, оптимизаторы поисковых систем постоянно оценивают обратные ссылки как один из наиболее важных факторов ранжирования в опросах.
Далее: Различия в поисковых системах
Автор
Сэм Марсден
Сэм Марсден — бывший менеджер по поисковой оптимизации и контенту Deepcrawl.Сэм регулярно выступает на маркетинговых конференциях, таких как SMX и BrightonSEO, и является автором отраслевых публикаций, таких как Search Engine Journal и State of Digital.
Почему Google не индексирует ваш сайт
«Почему мой сайт не индексируется ?!»
Это самая важная функция SEO за все время. Google должен проиндексировать ваш сайт, чтобы он мог получать любой органический трафик от Google. Если ваш сайт не проиндексирован, вы потерялись. Никто не найдет ваш контент в обычном режиме, потому что он не входит в поисковый индекс Google.
Первым шагом к устранению проблемы с индексированием является диагностика проблемы с индексированием. Этот список поможет вам в этом.
Я примерно организовал этот список от наиболее распространенных до наименее распространенных. Вы можете просмотреть список сверху вниз и найти причину и лекарство.
1. Ваш сайт проиндексирован в домене www или без www.
Технически www является субдоменом. Таким образом, http://example.com — это не то же самое, что http://www.example.com. Убедитесь, что вы добавили оба сайта в свою учетную запись GWT, чтобы они оба были проиндексированы.Обязательно укажите предпочтительный домен, но подтвердите право собственности на оба.
Реклама
Продолжить чтение ниже
2. Google еще не нашел ваш сайт
Обычно это проблема с новыми сайтами. Подождите несколько дней (хотя бы), но если Google все еще не проиндексировал ваш сайт, убедитесь, что карта сайта загружена и работает правильно. Если вы не создали или не отправили карту сайта, это может быть вашей проблемой. Вы также должны запросить сканирование Google и загрузить свой сайт.Вот инструкции Google о том, как это сделать:
- На главной странице Инструментов для веб-мастеров щелкните нужный сайт.
- На панели управления в разделе «Сканирование» нажмите «Просмотреть как Google».
- В текстовом поле введите путь к странице, которую вы хотите проверить.
- В раскрывающемся списке выберите Рабочий стол. (Вы можете выбрать другой тип страницы, но в настоящее время мы принимаем материалы только для нашего индекса веб-поиска.)
- Нажмите «Получить». Google получит запрошенный URL. Обновление статуса Fetch может занять до 10-15 минут.
- Когда вы увидите статус «Успешно», нажмите «Отправить в индекс», а затем выберите один из следующих вариантов:
- Чтобы отправить отдельный URL-адрес в индекс Google, выберите URL-адрес и нажмите «Отправить». Таким способом можно отправлять до 500 URL-адресов в неделю.
- Чтобы отправить URL-адрес и все связанные с ним страницы, щелкните URL-адрес и все связанные страницы. Вы можете отправлять до 10 таких запросов в месяц.
3. Сайт или страницы заблокированы с помощью robots.txt
Другая проблема заключается в том, что ваш разработчик или редактор заблокировал сайт с помощью роботов.текст. Это простое решение. Просто удалите запись из robots.txt, и ваш сайт снова появится в индексе. Подробнее о robots.txt здесь.
4. У вас нет sitemap.xml
На каждом веб-сайте должен быть sitemap.xml, который представляет собой простой список указаний, которым Google должен следовать для индексации вашего сайта. Вы можете прочитать о политике Google Sitemap и легко ее создать.
Реклама
Продолжить чтение ниже
Если у вас возникли проблемы с индексацией в какой-либо части вашего сайта, я рекомендую вам пересмотреть и повторно отправить карту сайта.xml на всякий случай.
5. У вас есть ошибки сканирования
В некоторых случаях Google не индексирует некоторые страницы вашего сайта, потому что не может их сканировать. Даже если он не может их сканировать, он все равно их видит.
Чтобы определить эти ошибки сканирования, перейдите в Инструменты Google для веб-мастеров → Выберите свой сайт → Нажмите «Сканирование» → Нажмите «Ошибки сканирования». Если у вас есть какие-либо ошибки, то есть неиндексированные страницы, вы увидите их в списке «1000 самых популярных страниц с ошибками».
6. У вас много повторяющегося контента
Слишком много повторяющегося контента на сайте может сбить с толку поисковые системы и заставить их отказаться от индексации вашего сайта.Если несколько URL-адресов на вашем сайте возвращают одно и то же содержание, значит, у вас есть проблема с дублированием контента на вашем сайте. Чтобы решить эту проблему, выберите страницу, которую хотите сохранить, и 301 остальные.
Иногда имеет смысл канонизировать страницы, но будьте осторожны. Некоторые сайты сообщили, что индексация помешала запутанная проблема канонизации.
7. Вы включили настройки конфиденциальности
Если у вас есть сайт WordPress, возможно, вы случайно оставили настройки конфиденциальности включенными.Перейдите в Админ → Настройки → Конфиденциальность, чтобы проверить.
8. Сайт заблокирован .htaccess
Ваш файл .htaccess является частью существования вашего веб-сайта на сервере, что позволяет ему быть доступным во всемирной паутине. Файл .htaccess написан на Apache. Хотя .htacess удобен и полезен, его можно использовать для блокировки поисковых роботов и предотвращения индексации.
9. Сайт имеет NOINDEX в метатеге
Другой способ сказать роботам «нет» и, следовательно, не иметь никакой индексации, — это иметь метатеги noindex.Часто это выглядит так:
Это одна из тех проблем, когда вы думаете: «Ой, блин, не могу поверить, что не знал» не вижу этого! » Вот что Барри Шварц написал об этом в «Круглом столе по SEO»:
Реклама
Продолжить чтение ниже
Черт возьми, я все время вижу это на форумах. Мне звонили крупные компании из списка из 500 компаний, у которых были проблемы с поисковой оптимизацией. Я не раз видел, что у них на главной странице есть тег noindex, вызывающий проблему.Иногда их трудно обнаружить из-за переадресации, поэтому используйте инструмент проверки заголовка http для проверки перед переадресацией. Но не упускайте из виду очевидное, сначала проверьте это.
Удалите эту строку кода, и вы сразу же вернетесь в индекс.
10. У вас проблемы с AJAX / JavaScript
Google выполняет индекс JavaScript и AJAX. Но эти языки не так легко индексируются, как HTML. Таким образом, если вы неправильно настраиваете свои страницы AJAX и выполнение JavaScript, Google не будет индексировать страницу.
11. Ваш сайт загружается вечно
Google не любит, если ваш сайт загружается вечно. Если поисковый робот обнаруживает бесконечное время загрузки, он, скорее всего, вообще не проиндексирует сайт.
12. Время простоя хостинга
Если сканеры не могут получить доступ к вашему сайту, они не будут его индексировать. Это достаточно очевидно, но почему это происходит? Проверьте подключение. Если ваш хост часто выходит из строя, возможно, сайт не сканируется. Пора покупать нового хозяина.
Реклама
Продолжить чтение ниже
13. You Got Deinedexed
Это действительно плохо.
Если вы получили ручной штраф и удалили из индекса, вы, вероятно, уже знаете об этом. Если у вас есть сайт с сомнительной историей (о которой вы не знаете), возможно, индексации мешает скрытый ручной штраф.
Если ваш сайт выпал из индекса, вам придется очень потрудиться, чтобы вернуть его.
Эта статья не является попыткой обсудить все причины ручного штрафа.Я отсылаю вас к посту Эрика Сиу по этой теме. Тогда советую сделать все, что в ваших силах, чтобы оправиться от штрафа. Наконец, я рекомендую вам сыграть в оборонительную игру, чтобы предотвратить дальнейшие штрафы, алгоритмы или инструкции.
Заключение
Индексация — залог хорошего SEO. Если ваш сайт или некоторые страницы вашего сайта не индексируются , вам нужно выяснить, почему.
Показанное изображение: antb через Shutterstock
Реклама
Продолжить чтение ниже
9 быстрых и простых способов индексирования вашего веб-сайта в Google
Хотите узнать, как проиндексировать свой веб-сайт в Google, чтобы он отображался в результатах поиска?
Когда пользователь выполняет поиск, Google использует свой индекс для поиска наиболее релевантного содержания, соответствующего поиску.Это означает, что, если ваш веб-сайт не проиндексирован, его нет в поисковой системе Google. И это будет плохой новостью, если вы хотите привлечь на свой сайт обычный трафик.
Итак, в этом посте мы покажем вам 9 быстрых и простых способов проиндексировать ваш сайт в Google. Мы также объясним, что такое индекс Google и как проверить, проиндексировал ли Google ваш сайт.
Что такое индекс Google?
Индекс Google — это просто список всех веб-страниц, которые Google просканировал и о которых знает.Если Google не проиндексирует ваш сайт, он не появится в результатах поиска.
Никто не найдет ваш сайт, что не пойдет на пользу бизнесу… Теперь вы, вероятно, понимаете, почему индексирование имеет решающее значение для ранжирования в Google.
Поскольку в этом посте много сложных слов, мы начнем с определения нескольких ключевых терминов, чтобы вы знали, о чем мы говорим:
- Индексирование — процесс сохранения веб-страниц в индексе (базе данных) Google
- Сканирование — процесс перехода по гиперссылкам в Интернете для обнаружения нового содержания
- Googlebot / web spider — программное обеспечение Google, которое систематически ищет в Интернете новое содержание по ссылкам
Теперь, когда вы знаете, что означают эти ключевые термины, давайте посмотрим, как в следующий раз проиндексировать ваш веб-сайт в Google.
Как проиндексировать ваш сайт в Google
Как уже упоминалось, Google использует свой индекс для поиска и отображения наиболее релевантного контента, когда пользователи выполняют поиск. Это означает, что Google должен иметь возможность найти ваш веб-сайт, чтобы проиндексировать и отобразить его в результатах поиска.
К счастью, вы можете сделать несколько вещей, чтобы поисковый гигант проиндексировал ваш сайт.
Поскольку это всеобъемлющий пост, вы можете щелкнуть эти быстрые ссылки, чтобы сразу перейти к различным разделам:
- Проверьте настройки WordPress для видимости в поисковой системе
- Отправьте свой веб-сайт в Google Search Console
- Создайте XML-карту сайта
- Отправьте свой Sitemap в Google Search Console
- Оптимизируйте своих роботов.txt
- Проверьте свои теги Noindex
- Удалите ссылки Nofollow
- Создайте внутренние ссылки на своем веб-сайте
- Создайте высококачественные обратные ссылки
Как проверить, проиндексировал ли Google ваш веб-сайт
1. Проверьте настройки WordPress для видимости в поисковых системах
Для начала вам нужно убедиться, что ваш сайт WordPress виден поисковым системам.
Вы можете легко проверить это, перейдя в настройки »Чтение страницы и прокрутив вниз до опции Видимость в поисковой системе .
Не забудьте снять флажок с этого параметра, чтобы поисковые системы могли индексировать и сканировать ваш веб-сайт.
А теперь перейдем к тому, как отправить свой веб-сайт в Google.
2. Добавьте свой веб-сайт в Google Search Console
Google Search Console, ранее известная как «Инструменты Google для веб-мастеров», — это бесплатная услуга, доступная для всех владельцев веб-сайтов.
Он показывает вам, как Google индексирует и добавляет ваш сайт в результаты поиска Google, чтобы вы могли быть уверены, что нужные люди видят ваш сайт.
Вы можете легко отправить свой веб-сайт в Google Search Console и проверить, проиндексированы ли ваши веб-страницы, используя лучший плагин SEO для WordPress All in One SEO (AIOSEO).
Для начала перейдите к Общие настройки в меню All in One SEO , а затем щелкните вкладку Инструменты для веб-мастеров .
Теперь перейдите в консоль поиска Google и скопируйте тег подтверждения HTML. Если вы еще не добавили свой сайт, ознакомьтесь с нашим руководством о том, как добавить консоль поиска Google на свой сайт WordPress.
Затем щелкните блок Google Search Console и вставьте HTML-тег в поле Google Verification Code .
Затем вернитесь в консоль поиска Google и нажмите кнопку Проверить .
Google Search Console найдет HTML-тег в коде вашего сайта и покажет вам сообщение Подтверждено право собственности .
Вы подтвердили свой веб-сайт с помощью Google Search Control и убедились, что он проиндексирован.
Примечание: Если вы не видите это сообщение, вам необходимо очистить кеш WordPress. Это гарантирует, что Google сможет установить последнюю версию вашего сайта.
Теперь все, что вам нужно, — это немного терпения, поскольку ваш сайт не будет проиндексирован в одночасье. Это займет некоторое время, но есть способы ускорить процесс индексации. Давайте посмотрим, как ускорить индексацию вашего сайта WordPress поисковыми системами.
3. Создайте XML-карту сайта
Карта сайта помогает поисковым системам легко перемещаться по содержанию вашего сайта.Он предоставляет им список всего вашего контента в машиночитаемом формате.
Он также сообщает поисковым системам, какие ссылки на вашем веб-сайте более важны, чем другие, и как часто вы обновляете свой сайт.
Sitemap чрезвычайно полезны, когда вы впервые запускаете блог или создаете новый веб-сайт, потому что на большинстве новых веб-сайтов еще нет такого количества внутренних ссылок или обратных ссылок.
Итак, создав карту сайта в формате XML, вы можете убедиться, что ваш новый контент, а также все ваши важные сообщения и страницы индексируются поисковыми системами.
Самый простой способ создать карту сайта в формате XML — использовать AIOSEO, и мы покажем вам, как это сделать дальше. Лучше всего то, что он автоматически уведомляет поисковые системы всякий раз, когда вы публикуете, обновляете или удаляете контент на своем веб-сайте.
Кроме того, карта сайта включена по умолчанию, поэтому вам нужно только установить AIOSEO и все готово!
Включить XML-карту сайта в AIOSEO
Для начала перейдите к Sitemaps в меню All in One SEO . Затем нажмите Общая карта сайта в верхнем главном меню навигации.
Это откроет окно General Sitemap, где вы увидите, что Enable Sitemap включен.
После этого вы можете продолжить и нажать кнопку Открыть карту сайта , чтобы просмотреть свою карту сайта в формате XML.
Открыв карту сайта, вы увидите страницу индекса для карты сайта XML, которая выглядит следующим образом:
Вот и все!
Теперь вы можете быть уверены, что Google будет знать обо всех ваших веб-страницах и сможет отображать их в результатах поиска.
Подробнее о том, как настроить карту сайта, вы можете прочитать в нашей публикации о том, как создать карту сайта в WordPress.
4. Отправьте свой файл Sitemap в консоль поиска Google
Следующим шагом является отправка вашей XML-карты сайта в Google Search Console.
Просто войдите в свою учетную запись Google Search Console и выберите свой веб-сайт.
Затем перейдите к Sitemaps в левой части экрана и добавьте последнюю часть URL-адреса вашей карты сайта (sitemap.xml) в разделе Добавить новую карту сайта и нажмите кнопку Отправить .
Вот и все!
После того, как Google просканирует и проиндексирует ваш сайт, вы начнете видеть отчеты в консоли поиска.
5. Оптимизируйте файл Robots.txt
Файл robots.txt — мощный инструмент SEO, поскольку он работает как руководство по веб-сайту для роботов или роботов, выполняющих сканирование поисковых систем. Как вы уже догадались, важно, чтобы ваш robots.txt давал Google разрешение на сканирование сайта.
С другой стороны, страницы wp-admin обычно запрещают, поскольку они бесполезны для посетителей и необходимы для сканирования Google. Указание Google не сканировать ненужные страницы может помочь повысить рейтинг в поисковых системах и увеличить скорость страницы.
Но когда дело доходит до индексации, вам нужно убедиться, что ваши страницы доступны для сканирования и что вы не запретили какие-либо важные URL. Вместо этого вы можете указать ботам Google разрешить сканирование для определения приоритета этих URL-адресов.
Подробнее читайте в нашем посте о том, как редактировать файл robots.txt в WordPress.
6. Проверьте свои теги Noindex
Иногда вам может потребоваться исключить страницу из результатов поиска Google, поскольку она не имеет отношения к содержанию вашего веб-сайта. Или вы просто хотите защитить свою конфиденциальность и отпугнуть нежелательных пользователей.
При этом, если определенные страницы не проиндексированы, возможно, у них нет тегов noindex.
Самый простой способ проверить это — использовать Google Search Console. После входа в свою учетную запись просто перейдите на вкладку Coverage в левом меню и найдите сообщение: Excluded by ‘noindex’ tag .
Если вы видите это сообщение, вам нужно вернуться к настройкам WordPress »Чтение (как мы показали вам ранее) и проверить, чтобы Запретить поисковым системам индексировать этот параметр не отмечен.
Если этот параметр отмечен, вам необходимо снять его и нажать кнопку Сохранить изменения .
Но если это не так, следующий шаг — проверить, являются ли ваши URL-адреса nofollow. Далее мы объясним почему.
7. Удалите ссылки Nofollow
Когда робот Googlebot обнаруживает ссылки nofollow, он сообщает Google, что ему следует удалить эти ссылки из своего индекса. Поэтому вам нужно обязательно удалить внутренние ссылки nofollow.
Просто найдите атрибут ссылки rel = «nofollow» и удалите его. Вы можете сделать это прямо из HTML-кода или с помощью редактора блоков WordPress. Чтобы узнать больше, посетите, как добавить ссылки nofollow в WordPress.
8. Создайте внутренние ссылки на своем веб-сайте
Один из наиболее эффективных способов поощрения сканирования и повышения индексации вашего веб-сайта — использование внутренних ссылок.
Пути, по которым ползучие пауки проходят по сети, образуются ссылками. Когда одна страница ссылается на другую страницу, паук следует по этому пути.
Таким образом, вам следует сосредоточиться на создании ссылок на все ваши самые важные страницы. Это сообщает Google, а также посетителям вашего веб-сайта о вашем новом и важном содержании. Вы можете найти более подробную информацию о внутренних ссылках в нашем контрольном списке для SEO.
9. Создавайте качественные обратные ссылки
Google признает, что страницы заслуживают доверия, если на них регулярно ссылаются авторитетные веб-сайты.Другими словами, обратные ссылки также сообщают Google, что страницу следует проиндексировать.
Если вы хотите знать, как создавать обратные ссылки, вы можете прочитать нашу публикацию о 30 SEO-приемах, которые гарантированно увеличат ваш трафик.
Как проверить, проиндексировал ли Google ваш веб-сайт
Мы почти закончили, но сначала мы покажем вам 2 простых и быстрых способа проверить, проиндексировал ли Google ваш сайт:
1. Проверьте свои URL-адреса с помощью консоли поиска Google
Для начала вы можете проверить свои веб-страницы с помощью инструмента проверки URL в Google Search Console.
Для этого перейдите к инструменту URL Inspection .
Затем вставьте URL-адрес, который нужно проиндексировать, в строку поиска и дождитесь, пока Google проверит URL-адрес. Если он проиндексирован, вы увидите зеленую галочку с текстом « URL находится в Google ».
Если URL не проиндексирован, нажмите кнопку Запросить индексирование , и все.
2. Используйте Google, чтобы узнать, проиндексирован ли ваш сайт
Вы также можете использовать Google, чтобы узнать, проиндексирован ли ваш сайт.Просто зайдите в Google и введите поисковый запрос site: yourwebsite.com .
Как в этом примере:
Число прямо под поиском показывает, сколько примерно ваших страниц проиндексировал Google.
И если вы хотите проверить статус индекса определенного URL-адреса, используйте тот же процесс, но вместо этого используйте полный URL-адрес.
Например, сайт : yourwebsite.com/web-page-slug .
Если URL не проиндексирован, результатов не будет, и вы можете запросить индексацию в Google Search Console.
И вот оно!
Мы надеемся, что этот пост помог вам научиться индексировать свой сайт в Google. Воспользуйтесь этими советами, чтобы ускорить процесс индексирования вашего сайта, и он появится в результатах поиска раньше, чем вы об этом узнаете.
Если вы хотите вывести свои усилия по поисковой оптимизации на новый уровень, мы даем массу отличных советов о том, как улучшить рейтинг в поисковых системах и оптимизировать сообщения в блогах. Кроме того, не забывайте отслеживать свой SEO-рейтинг с помощью Google Analytics.
На сегодня все!
Еще не используете AIOSEO? Чего же ты ждешь?
Следует ли индексировать страницы результатов поиска по внутреннему сайту?
* Точность этого сообщения была обновлена в ноябре 2020 г.
В большинстве случаев нет — ваши внутренние страницы результатов поиска не должны индексироваться ни Google, ни любыми другими поисковыми системами. Фактически, индексирование результатов внутреннего поиска может иметь пагубные последствия не только для вашего веб-сайта, но и для удобства пользователей.
К счастью, есть способы исключить результаты внутреннего поиска из индексации и не дать сканерам поисковых систем тратить свое время на анализ страниц, которые не помогут вашим клиентам или бизнесу.
Что такое URL-адрес внутреннего поиска по сайту?URL-адрес внутреннего поиска по сайту — это страница, которая отображается, когда посетитель вашего сайта использует вашу функцию внутреннего поиска.Например, посетитель HomeScienceTools.com, ищущий на сайте химический набор, попадает на эту страницу с соответствующими результатами. Проверьте уникальный URL:
Почти каждый веб-сайт имеет собственную функцию панели поиска. Это может помочь вашим пользователям находить продукты, которые они ищут, на вашем сайте, не покидая его в поисках более крупной поисковой системы, такой как Google.
Эта функция упрощает просмотр вашего сайта посетителями, и ваш бизнес с большей вероятностью получит выгоду от удержания пользователя на сайте.
Что такое проиндексированные страницы и почему они важны?Когда веб-страница проиндексирована, это означает, что она просканирована и проанализирована поисковым роботом, таким как Googlebot или Bingbot, а затем добавлена в свою базу данных результатов поиска. Страницы вашего сайта должны быть проиндексированы, прежде чем они появятся на странице результатов поисковой системы. Владелец веб-сайта может запросить индексирование страницы, или же страница может быть обнаружена роботом поисковой системы естественным образом через входящие или внутренние ссылки.
Проиндексированные страницы важны по нескольким причинам, но прежде всего по одной: только проиндексированные страницы могут появляться в обычных результатах поиска и привлекать органический трафик на ваш сайт.Когда поисковая система индексирует ваши веб-страницы, она определяет, что ваш контент является релевантным и достаточно авторитетным, чтобы приносить пользу пользователям.
Что Google говорит об индексировании результатов поиска по сайту?Итак, почему, зная ценность проиндексированной страницы, не следует индексировать страницы результатов поиска?
Мэтт Каттс четко объяснил позицию Google по этой теме в 2007 году, сославшись на следующее из Руководства по обеспечению качества Google, стр. :
«Используйте роботов.txt, чтобы предотвратить сканирование страниц результатов поиска или других автоматически сгенерированных страниц, которые не представляют особой ценности для пользователей, переходящих из поисковых систем ».
Возвращаясь к руководящим принципам 2017 года, мы видим возможные серые зоны в отношении автоматически созданного контента и страниц с небольшим или отсутствующим оригинальным контентом.
Центральная видеовстреча для веб-мастеров, проведенная Джоном Мюллером в апреле 2018 года, привлекла внимание к тому факту, что ограниченный бюджет сканирования Google для веб-сайта может быть легко съеден огромным количеством URL-адресов внутреннего поиска по сайту, что «с точки зрения сканирования… вероятно, не так уж оптимально.”
Рекомендации Google по дверным страницам также затрагивают эту тему:
«Вот несколько примеров дверных проемов:
- «Наличие нескольких доменных имен или страниц с таргетингом на определенные регионы или города, которые перенаправляют пользователей на одну страницу.
- «Страницы, генерируемые для направления посетителей к фактически используемым или релевантным частям вашего сайта (ов)
- «Практически похожие страницы, которые ближе к результатам поиска, чем четко определенная просматриваемая иерархия»
Многие ресурсы намекают, что индексировать эти страницы, как правило, не идеально.Однако для всего есть исключения, поэтому следует присмотреться к ним повнимательнее.
Причины не индексировать страницы внутреннего поискаМожет показаться противоречивым исключение результатов внутреннего поиска из индексации, когда некоторые из них уже могут занимать высокие позиции в результатах поисковых систем. Но есть скрытые последствия, которые могут повлиять на производительность вашего сайта, если вы продолжите разрешать индексацию этих URL внутреннего поиска по сайту.
1. Бюджет сканирования и раздувание индексаЕсть много Интернета, чтобы поисковые системы могли сканировать.Чтобы работа продолжалась, боты поисковых систем выделяют определенное время сканирования (известное как «бюджет сканирования») для каждого сайта.
Хотя бюджет сканирования вашего сайта может меняться изо дня в день, в целом он довольно стабилен. Ваш обходной бюджет определяется такими факторами, как размер и состояние вашего сайта.
Чтобы обеспечить максимальную эффективность вашего сайта в обычных результатах поиска, вам необходимо оптимизировать существующий бюджет сканирования. Это начинается с определения того, какие страницы достаточно важны для сканирования и индексации поисковой системы.Вы же не хотите, чтобы они тратили свое время на большое количество тонких страниц, которые могут содержать дублированный контент. Это может привести к раздуванию индекса.
Раздутие индекса происходит, когда Google индексирует сотни или тысячи некачественных типов страниц, которые не предоставляют вашим посетителям оптимальное содержание. Вы заметите раздувание индекса, когда количество проиндексированных страниц на вашем сайте резко возрастет (это можно найти в отчете об охвате в Google Search Console). Эти некачественные страницы могут постепенно ухудшить качество вашего сайта в целом.
Деиндексирование ваших внутренних страниц результатов поиска позволяет сканерам сосредоточиться на том, что действительно важно — на страницах с качественным содержанием, которые вы улучшили и оптимизировали для удобства чтения и конверсии.
2. Взаимодействие с пользователемПосетители веб-сайта хотят максимально эффективно находить то, что они ищут. Если пользователь попадает на страницу результатов поиска, а не на страницу, которая была обновлена для включения полезного содержания, у него могут остаться вопросы.В идеале пользователь попадет на релевантную, полезную и удобную для навигации страницу, а не на страницу со списком продуктов.
Это также при условии, что внутренний поиск работает достаточно хорошо, чтобы найти релевантные продукты. Опять же, из этого правила, безусловно, есть исключения, но часто на веб-сайтах есть созданная ими страница, на которую они предпочли бы перейти пользователю, а не на внутренний поисковый URL.
Как оценить URL-адреса внутреннего поиска в электронной коммерции для деиндексации«Но эти страницы приносят мне деньги!» вы можете подумать.Как и многие сайты электронной коммерции, вы можете проверить аналитику, чтобы обнаружить, что эти страницы результатов внутреннего поиска по сайту приносят большую часть дохода.
Вас бы уволили за блокировку этих URL в файле Robots.txt, верно?
Мы слышали это не раз, и в большинстве случаев дальнейший анализ раскрывал более тонкую правду. Выполните следующие шаги, чтобы решить, действительно ли вам следует деиндексировать эти страницы.
Расчет процента дохода от URL-адресов внутреннего поискаПрежде всего, вы должны подтвердить, какой процент от общего дохода на сайте получают люди, находящие страницы поиска сайта непосредственно из результатов поиска.Вот как:
- В Google Analytics используйте атрибуцию по последнему клику (т. Е. Пользователь выполнил поиск и нажал на результат поиска), чтобы перейти к поисковому трафику по целевой странице
- Примените фильтр, чтобы увидеть только URL-адреса внутреннего поиска по сайту
- Обратите внимание на общую выручку от них. Это хотя бы 1% от общего дохода от обычного поиска? 2%? Если оно выше, у вас могут быть проблемы с качеством контента на страницах продуктов и / или проблема со сканированием на страницах стандартной таксономии / категории.
Теперь, когда вы знаете, какой процент дохода для сайта в целом составляет органический поисковый трафик, попадающий на эти URL-адреса внутреннего поиска по сайту, вы знаете абсолютно худший сценарий.
Дело в следующем: Часто в случае блокировки URL-адресов внутреннего поиска по сайту вы обнаруживаете, что обычный поисковый трафик увеличивается, и доход от многих других страниц сайта возрастает. Более того, они, вероятно, будут лучше конвертировать.
Например:Вы проиндексировали 1000 результатов внутреннего поиска (например,грамм. site: domain.com inurl: catalogsearch) = ~ 1,000
У вас есть 100 URL-адресов результатов внутреннего поиска, получающих по крайней мере 1 транзакцию в качестве целевой страницы из обычного поиска.
Остальные 900 проиндексированных URL-адресов поиска по сайту либо показывают 0 транзакций как целевую страницу из обычного поиска, либо вообще не отображаются в Google Analytics.
Теперь вычислите процент проиндексированных URL результатов внутреннего поиска по сравнению с каждым URL, проиндексированным Google (site: yourdomain.com). В этом примере мы находим:
10% URL-адресов внутреннего поиска по сайту составляют 100% дохода от обычного поиска по этому типу страниц.
Хотя пример прост, результаты аналогичны тем, которые мы находим в реальном мире. Часто 80–99% трафика и дохода приходится на 1–20% проиндексированных страниц с результатами внутреннего поиска.
Это означает, что вы можете масштабировать индивидуальное решение. Вы не должны терять этот доход!После получения данных у вас есть варианты — деиндексировать, оставить индексированными или оставить часть URL-адресов проиндексированной.
Как деиндексировать URL-адреса внутреннего поиска по сайтуСуществуют технические особенности SEO, касающиеся того, как удалить эти страницы из индекса, которые зависят от других проблем, таких как бюджет сканирования и пути навигации для поиска продуктов.
Например, если вы собираетесь перенаправить некоторые из них или оставить их вживую, вам придется «Разрешить» их в файле Robots.txt или, по крайней мере, дождаться, пока перенаправления не будут обнаружены Google, прежде чем блокировать их вместе с другие.
Вот распространенные методы удаления URL-адресов внутреннего поиска по сайту из индекса:
- Noindex через Meta Robots.txt Tag : Этот первый метод, пожалуй, самый простой и эффективный способ исключить результаты внутреннего поиска из индексации.Добавьте к этому типу страницы метатег «noindex». Это выглядит так:
- Disallow: Добавьте запрещающую строку в файл robots.txt, чтобы запретить поисковым системам сканировать внутренние поисковые страницы.
- Redirect: 301 redirect (deindex) внутренние поисковые страницы, обеспечивающие органический трафик и доход на страницы «реальных» категорий в таксономии сайта или на существующие отобранные, оптимизированные страницы сетки продуктов. Остальное — noindex.
Основываясь на результатах исследования, вы можете также решить сохранить их в индексации на тот случай, если они получат больше обычного трафика, дохода и / или конверсий, чем существующие страницы продуктов или категорий. Вы также можете выбрать индивидуальное решение, которое будет поддерживать индексирование нескольких высокоэффективных URL-адресов поиска по сайту, а все остальное получать.
Что теперь?Тот факт, что вы получаете трафик и доход от этих некачественных страниц, которые Google посоветовал веб-мастерам не индексировать, не означает, что вы должны оставить их в покое. Проведите исследование и поделитесь своими открытиями с сильными мира сего. Пусть приходят к такому же выводу.
Возникли проблемы или все еще не уверены, как следует обрабатывать URL-адреса внутреннего поиска своего сайта? Компания Inflow готова помочь! Свяжитесь с нами , если это похоже на проект, который вы хотели бы изучить.
13 советов, как быстрее проиндексировать ваш сайт в Google
Прежде чем вы начнете разбираться в стратегиях поисковой оптимизации вашего веб-сайта, вы должны подумать об индексировании вашего веб-сайта Google.
Без индексации Google ваш веб-сайт практически невидим для поисковых запросов, что убивает ваш обычный веб-трафик.
Важно понимать, что Google обнаруживает новые веб-страницы, сканируя Интернет. Это приводит к тому, что Google добавляет новые страницы в свой индекс (часто это называется индексированием).
Затем, когда вы ищете (или в Google) что-то, вы просите Google предоставить вам все релевантные страницы из своего индекса. В наши дни для любого заданного поиска могут быть легко получены миллионы результатов, поэтому Google сортирует эти результаты, ранжируя те, которые кажутся наиболее релевантными, вверху, чтобы пользователь увидел их первыми.
Узнайте больше о процессе из этого видео от Google.
Конечно, индексация и ранжирование — это разные вещи. Ключевым моментом является то, что вы должны быть проиндексированы, чтобы вообще занимать место.
Перво-наперво, давайте выясним, проиндексирован ли ваш сайт Google или нет. (Это особенно важно, чтобы проверить, только что запустили вы или собираетесь запустить свой веб-сайт.)
- Перейдите на Google.com и выполните поиск по сайту: yourwebsite .com. Например, здесь, в DailyStory, мы будем искать site: dailystory.com.
- Число результатов поиска показывает, сколько ваших веб-страниц было проиндексировано Google.
- Вы можете получить более конкретную информацию, используя тот же процесс, но добавив веб-ярлык в конце URL-адреса в поиске, выполнив поиск site: dailystory.com/blog/7-tips-to-level-up-your-content-marketing / (Например).
- Никаких результатов не будет, если страница не проиндексирована.
Чтобы получить более точное представление о том, что индексируется, а что нет, вы можете использовать бесплатную консоль поиска Google.Просто перейдите к Индексу, а затем к отчету о покрытии. Количество «действительных страниц» (с предупреждениями и без них) отражает количество проиндексированных страниц. Если число равно 0, значит, ваш сайт не проиндексирован. Если это число очень мало (меньше, чем количество страниц на вашем веб-сайте), значит, ваш сайт был проиндексирован только частично. Вы также можете проверить определенную страницу с помощью инструмента проверки URL в консоли поиска Google.
Возможно, проиндексирована только часть вашего веб-сайта или, возможно, ваши новейшие веб-страницы не индексируются достаточно быстро.
Ниже приведены 13 советов, которые помогут быстрее проиндексировать ваш сайт в Google, чтобы вам не приходилось ждать в течение неопределенного периода времени. (Некоторые из наших предложений упрощены при использовании Google Search Console.)
Запрос индексации у Google
Это может показаться очевидным, но многие компании не знают, что они могут использовать Google Search Console для запроса индексации напрямую у Google.
- Войдите в консоль поиска Google.
- Перейдите к инструменту проверки URL-адресов.
- Вставьте URL, который Google должен проиндексировать, в строку поиска.
- Google проверит URL.
- Щелкните кнопку «Запросить индексирование».
Хотя это может быть эффективным методом для новых страниц, он может не помочь со старыми страницами, если существует основная проблема, которая до сих пор препятствовала индексации.
Проверьте файл robots.txt на наличие блоков сканирования
Если Google не индексирует весь ваш веб-сайт, это может быть из-за блокировки сканирования в вашем файле robots.txt файл.
Вы можете проверить это, перейдя по адресу yourdomain .com / robots.txt и найдите эти фрагменты кода:
- User-agent: Googlebot
Disallow: / - Агент пользователя: *
Disallow: /
Эти фрагменты кода сообщают Google, что сканирование каких-либо страниц вашего веб-сайта запрещено. Чтобы это исправить, просто удалите их.
Чтобы узнать, есть ли блокировка сканирования для определенной страницы, вставьте URL-адрес в инструмент проверки URL-адресов в Google Search Console.Вы сможете узнать больше, нажав на блокировку покрытия и найдя ошибку с надписью «Сканирование разрешено? Нет: заблокировано файлом robots.txt ».
Удалить любые мошеннические теги noindex
Поскольку вы можете захотеть сохранить конфиденциальность некоторых веб-страниц, вы можете попросить Google не индексировать эти страницы. Но если эти теги попадают на другие страницы, которые вы хотите проиндексировать, вы, очевидно, захотите найти и удалить их.
Вы можете:
- Найдите метатег в разделе своей веб-страницы.Это может быть или. Дело в том, что вы ищете все, что написано «noindex».
- Найдите «noindex» в заголовке HTTP-ответа X-Robots-Tag.
Добавьте свою не проиндексированную страницу в карту сайта
Хотя Google может находить веб-страницы, которых нет в вашей карте сайта, их рекомендуется включать.
Sitemap сообщает Google, какие страницы вашего сайта являются важными, а какие нет.Они также предлагают, как часто следует повторно сканировать страницы.
Проверить, есть ли страница в карте сайта, можно с помощью инструмента проверки URL в консоли поиска Google. Если вы получаете сообщение об ошибке «Sitemap: N / A» в сообщении «URL не в Google», значит, этой страницы нет в вашем файле Sitemap.
Удалить любые несанкционированные канонические теги
Канонические теги сообщают Google, какая версия веб-страницы является предпочтительной, а на большинстве страниц их вообще нет.
Однако, если на странице есть канонический тег, который направляет Google на предпочитаемую версию этой страницы, которая не существует, ваша страница не будет проиндексирована.Эти теги называются мошенническими каноническими тегами.
Чтобы выяснить, так ли это, используйте инструмент проверки URL-адресов. Вы увидите предупреждение «Альтернативная страница с каноническим тегом», если рассматриваемая страница указывает на другую страницу. Если этого не должно быть, удалите канонический тег, чтобы страницу можно было проиндексировать.
Имейте в виду, что канонические теги не всегда плохи и служат определенной цели. Перед удалением канонического тега спросите себя, действительно ли другая страница, на которую имеется ссылка, является предпочтительной версией.Если нет или другой страницы не существует, обязательно удалите тег.
Еще раз проверьте на наличие потерянных страниц
Потерянная страница — это веб-страница, на которую нет внутренних ссылок (внутри веб-сайта), указывающих на нее.
Проблема с потерянной страницей в том, что не только Google не найдет ее, но и посетители веб-сайта.
Если потерянная страница не важна, удалите ее и удалите из карты сайта. Если страница важна, включите ее во внутреннюю структуру ссылок вашего сайта.
Исправить любые внутренние ссылки nofollow
Ссылки Nofollow — это гиперссылки на вашей странице, которые предотвращают сканирование и ранжирование этого целевого URL с вашей страницы.
Изначально они были задуманы для того, чтобы спам в разделах с комментариями не мог получить какой-либо кредит в поисковом рейтинге, засоряя хорошо ранжированные страницы.
Однако, если тег rel = «nofollow» присутствует на любой из ваших внутренних ссылок на вашем веб-сайте, это вызовет проблему с индексированием.
Определите, являются ли ваши страницы качественными и ценными
Если это не техническая проблема, препятствующая индексации вашей веб-страницы, то это может быть проблема качества.
Звучит субъективно, и, честно говоря, несколько. Однако важно часто просматривать свои страницы и спрашивать себя:
- Оценил бы пользователь эту страницу, если бы он или она щелкнули по ней со страницы результатов поиска?
- Предлагает ли моя страница качественную и полезную информацию?
- Насколько ценна моя страница?
Регулярный аудит веб-сайта может помочь вам оставаться на вершине обзора контента, задавать эти вопросы и затем улучшать контент там, где это необходимо.
Если сама страница не представляет ценности и в целом низкое качество, рассмотрите возможность полного удаления страницы. Бонус за это включает оптимизацию вашего «краулингового бюджета», который представляет собой количество ресурсов сервера по отношению к количеству страниц, которые необходимо просканировать.
Узнайте больше о бюджете сканирования от Google.
Создайте качественные обратные ссылки
Обратные ссылки — это когда другие веб-сайты ссылаются на страницу или страницы вашего веб-сайта. Качественные обратные ссылки — это когда на вас ссылаются высокопоставленные веб-сайты.
Ваши страницы не нуждаются в обратных ссылках для индексации, но Google определенно проиндексирует вашу страницу быстрее, чем больше у вас качественных обратных ссылок.
Ознакомьтесь с нашими семью советами по увеличению качества обратных ссылок для вашего веб-сайта.
Не забывайте о социальных сетях
Конечно, совместное использование ваших веб-страниц в социальных сетях помогает Google быстрее индексировать ваши страницы.
Вы должны убедиться, что ваша стратегия в социальных сетях включает публикацию в социальных сетях вашего наиболее ценного контента таким образом, чтобы привлечь внимание ваших подписчиков, чтобы они также делились им со своими собственными сетями.
Ваш бизнес только начинается в социальных сетях? Убедитесь, что вы начинаете с правильной платформы социальных сетей, соответствующей вам и вашим целям.
Отправить сообщение через Google Мой бизнес
Эта рекомендация работает только в том случае, если страница, которую вы публикуете с помощью публикации в Google Мой бизнес, имеет смысл публично отображаться на вашей панели знаний.
Другими словами, не все страницы могут иметь смысл делать это с.
При этом вы можете дать Google толчок для сканирования и индексации страницы:
- Вход в Google Мой бизнес
- Выбор места, для которого вы хотите отправить сообщение (если применимо)
- Нажмите «Создать сообщение», а затем введите «Что нового».
- Добавление фотографии (если есть)
- Написание поста
- Выбор опции «Подробнее» для «Добавить кнопку»
- Заполнение URL-адреса в поле «Ссылка для кнопки»
- Нажатие на «Опубликовать»
Используйте Google Indexing API для краткосрочного содержания
Если на вашем веб-сайте есть недолговечные страницы и контент, например объявления о вакансиях, объявления о мероприятиях и / или видео в прямом эфире, вам следует рассмотреть возможность использования Google Indexing API.
Этот инструмент позволяет автоматически запрашивать сканирование и индексирование нового содержимого и изменений содержимого.
В частности, Google Indexing API может вам помочь:
- Обновить URL
- Удалить URL
- Получить статус запроса
Не допускайте дублирования контента
Дублированный контент — это очень похожий (или даже идентичный) контент, который отображается на нескольких страницах вашего веб-сайта или на других веб-сайтах.