Ранжирование — что это такое?
Это механизм, по которому страницы сайтов сортируются в соответствии с пользовательскими запросами. Выглядит это так: поисковая система получает запрос от пользователя и оценивает все сайты, присутствующие в базе, на соответствие данному запросу. После этого, релевантные данному запросу страницы сортируются по определенным критериям и открываются перед пользователем в результатах поиска.
Похожие термины
CGI-параметр (Common Gateway Interface)
В переводе на русский обозначает «параметр общего шлюзового интерфейса». Для добавления CGI-параметров к запросу необходимо в URL-адрес прописать символ «?», после чего задать имя и значения параметра. Несколько параметров принято раздел…
Подробнее
SEO-оптимизатор / SEO-оптимизация
Тавтология. Термин дословно переводится следующим образом: «Оптимизация под поисковую систему».
Подробнее
SERP (Search Engine Results Page)
В переводе с английского «страница результатов поиска». Она создается в автоматическом режиме индивидуально для каждого пользователя в соответствии с его поисковым запросом. В зависимости от запросов, истории поиска, местоположения польз…
Подробнее
SERM (Search Engine Reputation Management)
В переводе с английского «управление репутацией в поисковых системах». Действия, направленные на управление репутацией бренда, компании, товара, персоны в интернете с привлечением инструментов поисковой оптимизации.С помощью SERM можно п…
Подробнее
URL (Uniform Resource Locator)
Унифицированный указатель информационных ресурсов.
URL – это адрес, присвоенный HTML-странице, CSS-файлу, изображению и другому уникальному ресурсу в интернете. URL бывает абсолютным и относительным. Абсолютный – начинается с указания пр…Подробнее
A B C G I J K L M N P R S T U W А Б В Г Д З И К Л М Н О П Р С Т У Ф Ц Ч Ш Я
Категории словаря
Другие термины Маркетинговые термины Общие понятия и термины Поведенческие факторы и аналитика Поисковые запросы Санкции и фильтры Ссылочные и социальные факторы Текстовые факторы Технические термины и вёрстка
Семантическое ранжирование — Azure Cognitive Search
Twitter LinkedIn Facebook Адрес электронной почты
- Статья
- Чтение занимает 3 мин
Важно!
Семантический поиск предоставляется в общедоступной предварительной версии и к нему применяются дополнительные условия использования. Его можно использовать на портале Azure, через REST API предварительной версии или пакеты SDK бета-версии. Эти функции являются платными. Дополнительные сведения об этом см. в разделе Доступность и цены.
Семантические ранжирование — это расширение конвейера выполнения запросов, которое повышает точность путем повторного ранжирования верхней части списка совпадений исходного результирующего набора. Семантические ранжирование поддерживается большими сетями на основе преобразователя, обученными для захвата семантического значения условий запроса, в отличие от лингвистического сопоставления по ключевым словам. В отличие от алгоритма ранжирования сходства по умолчанию, семантическое ранжирование использует контекст и значение слов для определения релевантности.
Семантические ранжирование требует ресурсов и времени. Чтобы завершить обработку в пределах ожидаемой задержки операции запроса, входные данные для семантического ранжирования объединяются и сокращаются, чтобы можно было как можно быстрее выполнить базовые операции формирования сводных данных и повторного ранжирования.
Предварительная обработка
Перед оценкой релевантности содержимое сокращается до умеренного количества входов, которое можно эффективно обработать семантическим ранжированием.
Сокращение содержимого начинается с начального набора результатов, возвращаемого алгоритмом ранжирования по сходству по умолчанию, который используется для поиска по ключевым словам. Результатом любого запроса может быть несколько документов (до 1000 максимум). Так как обработка большого количества совпадений займет слишком много времени, в семантическом ранжировании будут участвовать только первые 50.
Независимо от числа документов (один или 50) начальный результирующий набор определяет первую версию корпуса документа для семантического ранжирования.
Затем содержимое каждого поля в семантической конфигурации извлекается и объединяется в длинную строку.
После консолидации все слишком длинные сроки обрезаются, чтобы обеспечить соответствие общей длины требованиям к входным данным этапа формирования сводных данных.
В этом упражнении по обрезке важно добавлять поля в семантическую конфигурацию в порядке приоритета. В очень больших документах с полями, содержащими большие объемы текста, все данные, превышающие лимит, игнорируются.
Каждый документ теперь представлен одной длинной строкой.
Примечание
В версии 2020-06-30-preview для определения используемых полей используется параметр searchFields, а не семантическая конфигурация. Для достижения наилучших результатов рекомендуется выполнить обновление до версии API 2021-04-30-preview.
Строка состоит из токенов, а не символов или слов. В строке может быть максимум 128 уникальных токенов. Для оценки можно предположить, что 128 токенов примерно эквивалентны строке длиной 128 слов.
Примечание
Разметка определяется в зависимости от назначения анализатора в полях с возможностью поиска. Если вы используете специализированный анализатор, например nGram или EdgeNGram, может потребоваться исключить это поле из searchFields.
Чтобы получить представление о том, как строки размечены, можно проверить выходные данные токена анализатора с помощью анализатора тестов REST API.После обрезки строк можно передать сокращенные входные данные с помощью моделей машинного чтения и распознавания языка, чтобы определить, какие предложения и фразы лучше всего соответствуют документу с учетом запроса. На этом этапе извлекается содержимое из строки, которая затем будет проходить семантическое ранжирование.
Входы для формирования сводных данных — это длинные строки, получаемые для каждого документа на этапе подготовки. В каждой строке модель формирования сводных данных находит наиболее репрезентативный объект. Она также создает семантический заголовок для документа. Каждый заголовок доступен в виде простой текстовой версии и версии с выделением, и часто составляет менее 200 слов на документ.
Семантический ответ также возвращается, если был указан параметр «Ответы», если запрос был создан как вопрос и если в длинной строке присутствует объект, который, скорее всего, отвечает на вопрос.
Семантическое ранжирование
Заголовки оцениваются с точки зрения концептуальной и семантической релевантности относительно предоставленного запроса.
На следующем рисунке показана схема «семантической релевантности». Рассмотрим термин «капитал», который может использоваться в контексте финансов, законодательства, географии или грамматики. Если запрос содержит термины из одного и того же векторного пространства (например, «капитал» и «инвестиции»), то документ, который также содержит токены в том же кластере, получит более высокий ранг, чем остальные.
Объект @search.rerankerScore назначается каждому документу на основе семантической релевантности заголовка. Оценки варьируются от 4 до 0 (высокий к низким), где более высокий балл указывает на более сильное совпадение.
После оценки все документы отображаются в порядке убывания по оценке и включаются в полезные данные ответа на запрос. Полезные данные включают в себя ответы, обычный текст и выделенные заголовки, а также все поля, помеченные как извлекаемые или указанные в предложении выбора.
Дальнейшие действия
Семантические ранжирование доступно на стандартных уровнях обслуживания в определенных регионах. Дополнительные сведения о доступности и регистрации см. в статье Доступность и цены. Новый тип запроса обеспечивает ранжирование и структуру запросов семантического поиска. Чтобы приступить к работе, настройте семантическое ранжирование.
Кроме того, ознакомьтесь со следующими статьями о ранжировании по умолчанию. Семантические ранжирование зависит от результатов ранжирования по сходству. Знание структуры запросов и ранжирования позволит вам получить общее представление о работе всего процесса.
- Полнотекстовый поиск в когнитивном поиске Azure
- Сходство и оценка в Когнитивном поиске Azure
- Анализаторы для обработки текста в когнитивном поиске Azure
Результаты ранжирования – Как работает поиск Google
Как автоматически генерируются результаты
В огромном количестве доступной информации найти то, что вам нужно, было бы практически невозможно без помощи в ее сортировке. Системы ранжирования Google предназначены именно для этого: сортировать сотни миллиардов веб-страниц и другого контента в нашем поисковом индексе, чтобы за долю секунды представить наиболее релевантные и полезные результаты.
Ключевые факторы, влияющие на ваши результаты
Чтобы предоставить вам наиболее полезную информацию, алгоритмы поиска учитывают множество факторов и сигналов, включая слова вашего запроса, релевантность и удобство использования страниц, опыт источников, ваше местоположение и настройки. Вес, применяемый к каждому фактору, варьируется в зависимости от характера вашего запроса. Например, свежесть контента играет большую роль в ответах на вопросы о текущих темах новостей, чем в словарных определениях.
Узнайте больше о ключевых факторах, которые помогают определить, какие результаты будут возвращены для вашего запроса:
Значение вашего запроса
Чтобы получить релевантные результаты, нам сначала нужно установить, что вы ищете ー цель вашего запроса. Для этого мы создаем языковые модели, чтобы попытаться расшифровать, как относительно небольшое количество слов, которые вы вводите в поле поиска, соответствует наиболее полезному доступному контенту.
Это включает в себя такие, казалось бы, простые шаги, как распознавание и исправление орфографических ошибок, и распространяется на нашу сложную систему синонимов, которая позволяет нам находить соответствующие документы, даже если они не содержат точных слов, которые вы использовали. Например, вы могли искать «изменить яркость ноутбука», но производитель написал «отрегулировать яркость ноутбука». значительно улучшает результаты более чем в 30 % поисковых запросов на разных языках.
Наши системы также пытаются понять, какую информацию вы ищете. Если вы использовали в своем запросе такие слова, как «приготовление пищи» или «фотографии», наши системы определят, что показ рецептов или изображений может лучше всего соответствовать вашим намерениям. Если вы выполняете поиск на французском языке, большинство отображаемых результатов будет на этом языке, как вы, скорее всего, и захотите. Наши системы также могут распознавать, что многие запросы имеют местный характер, поэтому при поиске по слову «пицца» вы получаете результаты о близлежащих предприятиях, которые осуществляют доставку.
Если вы ищете популярные ключевые слова, наши системы понимают, что актуальная информация может быть более полезной, чем старые страницы. Это означает, что когда вы ищете спортивные результаты, доходы компании или что-то особенно новое, вы увидите самую свежую информацию.
Релевантность контента
Затем наши системы анализируют контент, чтобы определить, содержит ли он информацию, которая может иметь отношение к тому, что вы ищете.
Самый простой признак того, что информация релевантна, — это когда контент содержит те же ключевые слова, что и ваш поисковый запрос. Например, для веб-страниц, если эти ключевые слова появляются на странице, или если они появляются в заголовках или основной части текста, информация может быть более актуальной.
Помимо просмотра ключевых слов, наши системы также анализируют, соответствует ли контент запросу. Мы также используем агрегированные и анонимные данные о взаимодействиях, чтобы оценить, соответствуют ли результаты поиска запросам. Мы преобразуем эти данные в сигналы, которые помогают нашим системам с машинным обучением лучше оценивать релевантность. Только подумайте: когда вы ищете «собаки», вам, скорее всего, не нужна страница, на которой сотни раз встречается слово «собаки». Имея это в виду, алгоритмы оценивают, содержит ли страница другой релевантный контент помимо ключевого слова «собаки» — например, изображения собак, видео или даже список пород.
Важно отметить, что хотя наши системы и ищут такого рода поддающиеся количественной оценке сигналы для оценки релевантности, они не предназначены для анализа субъективных понятий, таких как точка зрения или политическая направленность содержания страницы.
Качество контента
После определения релевантного контента наши системы стремятся отдать приоритет тем, которые кажутся наиболее полезными. Для этого они определяют сигналы, которые могут помочь определить, какой контент демонстрирует опыт, авторитетность и надежность.
Например, одним из нескольких факторов, которые мы используем, чтобы помочь определить это, является понимание того, ссылаются ли другие известные веб-сайты или ссылаются на контент. Это часто оказывается хорошим признаком того, что информации доверяют. Обобщенные отзывы, полученные в результате нашего процесса оценки качества поиска, используются для дальнейшего совершенствования того, как наши системы оценивают качество информации.
Контент в Интернете и более широкая информационная экосистема постоянно меняется, и мы постоянно измеряем и оцениваем качество наших систем, чтобы убедиться, что мы достигаем правильного баланса актуальности и авторитетности информации, чтобы поддерживать ваше доверие к результатам, которые вы видите .
Удобство использования веб-страниц
Наши системы также учитывают удобство использования контента. Когда все вещи относительно равны, контент, который люди сочтут более доступным, может работать лучше.
Например, наши системы будут учитывать аспекты взаимодействия со страницей, например, будет ли контент удобным для мобильных устройств, чтобы пользователи мобильных устройств могли легко его просматривать. Точно так же они смотрят, быстро ли загружается контент, что также важно для мобильных пользователей.
Контекст и настройки
Такая информация, как ваше местоположение, предыдущая история поиска и настройки поиска, помогает нам гарантировать, что ваши результаты будут наиболее полезными и актуальными для вас в данный момент.
Мы используем информацию о вашей стране и местоположении, чтобы доставлять контент, актуальный для вашего региона. Например, если вы находитесь в Чикаго и ищете «футбол», Google, скорее всего, сначала покажет вам результаты об американском футболе и чикагских медведях. В то время как если вы ищете «футбол» в Лондоне, Google покажет результаты о футболе и Премьер-лиге. Настройки поиска также являются важным индикатором того, какие результаты вы, вероятно, найдете полезными, например, если вы выбрали предпочтительный язык или включили безопасный поиск (инструмент, который помогает отфильтровывать явные результаты).
Поиск также включает некоторые функции, которые персонализируют результаты на основе активности в вашей учетной записи Google. Например, если вы ищете «события рядом со мной», Google может адаптировать некоторые рекомендации к категориям событий, которые, по нашему мнению, могут вас заинтересовать. расы, религии или политической партии.
Вы можете контролировать, какие действия в Поиске используются для улучшения работы с Поиском, включая настройку данных, сохраняемых в вашей учетной записи Google, на странице myaccount.google.com. Чтобы отключить персонализацию поиска на основе активности в вашей учетной записи, отключите Историю приложений и веб-поиска.
Вы также можете найти настройки содержимого, такие как Безопасный поиск, в настройках. Это поможет вам решить, будут ли результаты поиска включать в себя графическое содержимое, которое может шокировать некоторых пользователей.
Узнать больше
Организационная информация
Узнайте, как Google постоянно составляет самый длинный в мире индекс.
Строгие испытания
Узнайте о процессах и инструментах Google, позволяющих находить полезную и актуальную информацию.
Обнаружение спама
Узнайте о шагах, которые Google предпринимает для защиты ваших поисковых запросов.
Объяснение мирового рейтинга университетов
Еще до того, как вам исполнится двадцать, вы столкнетесь с одним из самых важных решений в своей жизни: какой университет выбрать.
Решение, к лучшему или к худшему, повлияет на вашу социальную жизнь, финансы и карьеру на долгие годы.
Уже более десяти лет Всемирный рейтинг университетов Times Higher Education предоставляет молодым людям и их семьям надежное руководство, помогающее принять это решение.
Каждый год рейтинг растет и адаптируется, чтобы включить в него больше стран и больше университетов.
Это позволяет вам оценить более широкий спектр учебных заведений, независимо от того, хотите ли вы учиться за границей или внутри страны.
Благодаря нашей собственной команде по обработке данных мы можем обеспечить еще большую прозрачность основных необработанных данных. Большая часть этих необработанных данных теперь общедоступна в качестве «ключевой статистики» для каждого университета: количество студентов, гендерное соотношение студентов, соотношение сотрудников и студентов и процент иностранных студентов.
Каждый университет оценивается в пяти категориях, охватывающих основные задачи всех мировых университетов мирового класса: преподавание, исследования, цитирование (влияние исследований), отраслевой доход и международные перспективы.
Пять баллов в этих категориях для каждого ранжированного университета доступны в разделе «Разбивка результатов». Это означает, что в дополнение к просмотру университетов по общему рейтингу или поиску определенного учебного заведения вы можете отсортировать таблицу по пяти показателям, чтобы принять решение на основе конкретных приоритетов.
Преподавание: учебная среда
Для любого студента и любого предмета наиболее важным фактором является учебная среда: каково это учиться в университете.
Рейтинги основаны на твердом убеждении, что качество преподавания в университете само по себе зависит от качества его исследований: производство знаний и передача знаний в университете.
По этой причине показатель Преподавание измеряется пятью показателями эффективности: обзор репутации, соотношение числа сотрудников и студентов, соотношение числа докторантов и студентов бакалавриата, количество докторских степеней, присуждаемых на одного преподавателя, и доход учреждения.
Это дает хорошее представление о престиже, возможностях и ресурсах учебной среды, которые окажут непосредственное влияние на вас, студента.
Исследования
Университет может преуспеть в обучении, но не в исследованиях: хороший преподаватель не обязательно хороший исследователь. Но качество и объем исследований в учреждении, тем не менее, важны для вас, если вы ищете лучший академический опыт.
Одно дело, когда тебя учат идеям, теориям и результатам, лежащим в авангарде академических достижений, и совсем другое, когда тебя учат исследователи, ответственные за такие скачки.
Если у вас есть возможность учиться у ведущих исследователей, вы получите как интеллектуальную, так и практическую пользу. Вы узнаете не только об исследованиях, которые они проводят, но и приобретете необходимые интеллектуальные навыки, которые пригодятся вам на всю жизнь.
В лучших научно-исследовательских учреждениях вы также сможете воспользоваться преимуществами ресурсов и возможностей, доступных только в таких условиях.
Метрика «Исследования» измеряется опросом репутации, который показывает, как университетские исследования воспринимаются коллегами из академических кругов; доход от исследований, который указывает на важность и качество исследований; и продуктивность исследований, которая указывает, сколько высококачественных исследований публикуется учеными в учреждении.
Лучшие университеты мира Окончательным критерием качества исследования является его влияние, поскольку все исследования направлены на то, чтобы быть влиятельными и важными. В рейтингах исследовательское влияние университета измеряется количеством раз, когда работа одного академика в этом университете цитируется другим ученым. Эффект влияния исследований на вашу университетскую жизнь аналогичен эффекту качества исследований. Чем больше цитируется работа университета, тем больше вероятность того, что вы будете взаимодействовать с учеными, которые ведут и расширяют дискуссии в этой области. Говоря более романтично, влияние исследований является отражением того, какой вклад организация вносит во всемирный проект коллективного и совместного понимания мира. Этот вклад является одновременно мерилом качества в университете и источником гордости как для ученых, так и для студентов. В основном относящийся к науке, технике, бизнесу и технологиям, этот фактор становится все более приоритетным для университетов и студентов. Он указывает на коммерческое влияние исследования учреждения, которое само по себе является отражением промышленной ценности исследования. Индикатор дохода отрасли имеет фундаментальное значение, если вы отдаете приоритет реальному применению научных и технологических исследований. Университеты больше не сравнивают только с соперниками в своем городе или даже в своей стране; Ведущие мировые университеты конкурируют на глобальном уровне и привлекают студентов и исследователей со всего мира. Таким образом, международное мировоззрение является признаком ведущего учебного заведения, актуального как для иностранных, так и для местных студентов. Он измеряется тремя показателями: соотношением иностранных и местных студентов, соотношением иностранных и местных сотрудников и долей исследований, которые включают международное сотрудничество.
Путеводитель по рейтингу университетов для иностранных студентов
Как пользоваться рейтингом: часто задаваемые вопросы влияние Промышленный доход
Международная перспектива