Написание sql запросов: Основные команды SQL, которые должен знать каждый программист

Содержание

Создание SQL запросов

В том случае, если встроенного языка запросов ZuluGIS недостаточно, запросы могут выполняться с использованием OGC расширения языка SQL.

В программе используется диалект языка SQL основанный на диалекте Transact-SQL, разработанном компаниями Microsoft и Sybase (см. http://msdn.microsoft.com/en-us/library/bb510741(SQL.100).aspx и http://infocenter.sybase.com/help/index.jsp?topic=/com.sybase.help.ase_15.0.sqlug/html/sqlug/title.htm). Используемый диалект дополнен в соответствии с OGC расширением языка SQL, информация о котором приводится по адресам http://www.opengeospatial.org/standards/sfa (общая архитектура) и http://www.opengeospatial.org/standards/sfs (SQL расширение).

IntelliSense — технология автодополнения, дописывает название функции при вводе начальных букв. Кроме прямого назначения IntelliSense используется для доступа к документации и для устранения неоднозначности в именах переменных, функций и методов.

Подсветка синтаксиса — выделение синтаксических конструкций текста с использованием различных цветов, шрифтов и начертаний. Обычно применяется для облегчения чтения исходного текста компьютерных программ, улучшения визуального восприятия.

Рисунок 588. Написание SQL запроса с IntelliSense

	Примечание
	Видеоуроки с примерами выполнения SQL запросов можно посмотреть в разделе: https://www.politerm.com/videos/geosql/.

Для вызова диалога формирования SQL запросов выполните команду меню запрос, либо нажмите кнопку панели инструментов.

Рисунок 589. Диалог SQL запроса

В области ввода задается текст SQL запроса. В правой части диалога расположен навигатор по полям карты (Источник:), позволяющий быстро добавить запрос данных из какого либо поля карты. Для добавления запроса данных поля, выберите в списке требуемый слой, БД и выполните двойной щелчок по названию поля, запрос будет добавлен в область ввода.

Примечание

Для быстрого поиска нужных полей в списке Источник, введите начало названия требуемого поля в поисковой строке над списком, в списке будут отображаться только поля, начинающиеся с введенных символов.

Для отображения реальных названий полей базы данных в области полей сделайте щелчок правой кнопкой мыши и в контекстном меню выберите . Для возврата к пользовательским названиям надо снять опцию .

После задания текста запроса нажмите кнопку Выполнить панели инструментов, в области Ответ в нижней части диалога отобразится панель данных с результатами запроса. Панель можно открепить от диалога запроса для дальнейшей работы с результатами, для этого наведите указатель мыши на заголовок панели, нажмите левую кнопку мыши, не отпуская ее, переместите мышь в произвольную часть окна программы ZuluGIS, после чего отпустите кнопку мыши. Подробнее о панели данных см. «Панель данных».

В диалоге SQL запросов предусмотрено сохранение текущего запроса в файл, открытие запроса из файла и создание нового запроса:

Для открытия запроса из файла (в формате .sql) выполните команду меню , или нажмите кнопку панели инструментов – и выберите требуемый файл в стандартном диалоге выбора файлов;
Для сохранения текущего запроса в файле (формата .sql) выполните команду меню , или нажмите кнопку панели инструментов – и задайте требуемое название файла в стандартном диалоге сохранения файлов.
Для создания нового запроса выполните команду меню , либо нажмите кнопку панели инструментов .

Справочник SQL для выражений запросов, применяемых в ArcGIS—ArcGIS Pro

This topic describes the elements of common selection queries in ArcGIS. Выражения запросов в ArcGIS используют SQL.

Внимание:

Синтаксис SQL не работает при вычислении полей с помощью окна Калькулятора поля .

Часто используемые запросы: поиск строк

Строковые значения в выражениях всегда заключаются в одинарные кавычки, например:

STATE_NAME = 'California'

Строки в выражениях чувствительны к регистру, кроме случаев работы в базах геоданных в Microsoft SQL Server. Чтобы выполнять не чувствительный к регистру поиск в других источниках данных, можно использовать функцию SQL для преобразования всех значений в один регистр. Для источников данных на основе файлов, таких как файловые базы геоданных или шейп-файлы, для задания регистра выборки можно использовать функции UPPER или LOWER. Например, при помощи следующего выражения выбирается штат, имя которого написано как ‘Rhode Island’ или ‘RHODE ISLAND’:

UPPER(STATE_NAME) = 'RHODE ISLAND'

Если строка содержит одинарную кавычку, вам в первую очередь требуется использовать другую одинарную кавычку как символ управляющей последовательности, например:

NAME = 'Alfie''s Trough'

При помощи оператора LIKE (вместо оператора = ) строится поиск частей строк. Например, данное выражение выбирает Mississippi и Missouri среди названий штатов США:

STATE_NAME LIKE 'Miss%'

Символ процента (%) означает, что на этом месте может быть что угодно – один символ или сотня, или ни одного. Если вы хотите использовать групповой символ, обозначающий один любой символ, используйте символ подчёркивания (_). Следующий пример показывает выражение для выбора имен Catherine Smith и Katherine Smith:

OWNER_NAME LIKE '_atherine Smith'

Можно также использовать операторы больше (>), меньше (<), больше или равно (>=), меньше или равно (<=), не равно (<>) и BETWEEN, чтобы выбирать строковые значения на основании их сортировки. Например, этот запрос выбирает все города в покрытии, названия которых начинаются с букв от М до Z:

CITY_NAME >= 'M'

Строковые функции могут использоваться для форматирования строк. Например функция LEFT возвращает определенное количество символов начиная с левого края строки. Данный запрос возвращает все штаты, начинающиеся на букву A:

LEFT(STATE_NAME,1) = 'A'

Список поддерживаемых функций вы найдете в документации по своей СУБД.

Часто используемые выражения: поиск значений NULL

Вы можете использовать ключевое слово NULL, чтобы отбирать объекты и записи, содержащие пустые поля. Перед ключевым словом NULL всегда стоит IS или IS NOT. Например, чтобы найти города, для которых не была введена численность населения по данным переписи 1996 года, можно использовать следующее выражение:

POPULATION IS NULL

Или, чтобы найти все города, для которых указана численность населения, используйте:

POPULATION96 IS NOT NULL

Часто используемые выражения: поиск чисел

Точка (.) всегда используется в качестве десятичного разделителя, независимо от региональных настроек. В выражениях в качестве разделителя десятичных знаков нельзя использовать запятую.

Вы можете запрашивать цифровые значения, используя операторы равно (=), не равно (<>), больше (>), меньше (<), больше или равно (>=) и меньше или равно (<=), а также BETWEEN (между), например:

POPULATION >= 5000

Числовые функции можно использовать для форматирования чисел. Например функция ROUND округляет до заданного количества десятичных знаков данные в файловой базе геоданных:

ROUND(SQKM,0) = 500

Список поддерживаемых числовых функций см. в документации по СУБД.

Даты и время

Общие правила и часто используемые выражения

В таких источниках данных, как база геоданных, даты хранятся в полях даты–времени. Однако в шейп-файлах это не тек. Поэтому большинство из примеров синтаксиса запроса, представленных ниже, содержит ссылки на время. В некоторых случаях часть запроса, касающаяся времени, может быть без всякого вреда пропущена, когда известно, что поле содержит только даты; в других случаях её необходимо указывать, или запрос вернет синтаксическую ошибку.

Поиск полей с датой требует внимания к синтаксису, необходимому для источника данных. Если вы создаете запрос в Конструкторе запросов в режиме Условие, правильный синтаксис будет сгенерирован автоматически. Ниже приведен пример запроса, который возвращает все записи после 1 января 2011, включительно, из файловой базы геоданных:

INCIDENT_DATE >= date '2011-01-01 00:00:00'

Даты хранятся в исходной базе данных относительно 30 декабря 1899 года, 00:00:00. Это действительно для всех источников данных, перечисленных здесь.

Цель этого подраздела – помочь вам в построении запросов по датам, но не по значениям времени. Когда со значением даты хранится не нулевое значение (например January 12, 1999, 04:00:00), то запрос по дате не возвратит данную запись, поскольку если вы задаете в запросе только дату для поля в формате дата – время, недостающие поля времени заполняются нулями, и выбраны будут только записи, время которых соответствует 12:00:00 полуночи.

Таблица атрибутов отображает дату и время в удобном для пользователя формате, согласно вашим региональным установкам, а не в формате исходной базы данных. Это подходит для большинства случаев, но имеются и некоторые недостатки:

Строка, отображаемая в SQL-запросе, может иметь только небольшое сходство со значением, показанным в таблице, особенно когда в нее входит время. Например время, введенное как 00:00:15, отображается в атрибутивной таблице как 12:00:15 AM с региональными настройками США, а сопоставимый синтаксис запроса Datefield = ‘1899-12-30 00:00:15’.
Атрибутивная таблица не имеет сведений об исходных данных, пока вы не сохраните изменения. Она сначала попытается отформатировать значения в соответствии с ее собственным форматом, затем, после сохранения изменений, она попытается подогнать получившиеся результаты в соответствии с базой данных. По этой причине, вы можете вводить время в шейп-файл, но обнаружите, что оно удаляется при сохранении ваших изменений. Поле будет содержать значение ‘1899-12-30’, которое будет отображаться как 12:00:00 AM или эквивалентно, в зависимости от ваших региональных настроек.

Синтаксис даты-времени для многопользовательских баз геоданных

Oracle

Datefield = date 'yyyy-mm-dd'

Имейте в виду, что здесь записи, где время не равно нулю, не будут возвращены.

Альтернативный формат при запросах к датам в Oracle следующий:

Datefield = TO_DATE('yyyy-mm-dd hh:mm:ss','YYYY-MM-DD Hh34:MI:SS')

Второй параметр ‘YYYY-MM-DD Hh34:MI:SS’ описывает используемый при запросах формат. Актуальный запрос выглядит так:

Datefield = TO_DATE('2003-01-08 14:35:00','YYYY-MM-DD Hh34:MI:SS')

Вы можете использовать более короткую версию:

TO_DATE('2003-11-18','YYYY-MM-DD')

И снова записи, где время не равно нулю, не будут возвращены.

SQL Server

Datefield = 'yyyy-mm-dd hh:mm:ss'

Часть запроса hh:mm:ss может быть опущена, когда в записях не установлено время.

Ниже приведен альтернативный формат:

Datefield = 'mm/dd/yyyy'

IBM Db2

Datefield = TO_DATE('yyyy-mm-dd hh:mm:ss','YYYY-MM-DD Hh34:MI:SS')

Часть запроса hh:mm:ss не может быть опущена, даже если время равно 00:00:00.

PostgreSQL

Datefield = TIMESTAMP 'YYYY-MM-DD Hh34:MI:SS'
Datefield = TIMESTAMP 'YYYY-MM-DD'

Вы должны указать полностью временную метку при использовании запросов типа «равно», в или не будет возвращено никаких записей. Вы можете успешно делать запросы со следующими выражениями, если запрашиваемая таблица содержит записи дат с точными временными метками (2007-05-29 00:00:00 или 2007-05-29 12:14:25):

select * from table where date = '2007-05-29 00:00:00';

или

select * from table where date = '2007-05-29 12:14:25';

При использовании других операторов, таких как больше, меньше, больше или равно, или меньше или равно, вам не нужно указывать время, но это можно сделать для повышения точности. Оба эти выражения работают:

select * from table where date < '2007-05-29';

select * from table where date < '2007-05-29 12:14:25';

Файловые базы геоданных, шейп-файлы, покрытия и прочие файловые источники данных

Datefield = date 'yyyy-mm-dd'

Файловые базы геоданных поддерживают использование времени в поле даты, поэтому его можно добавить в выражение:

Datefield = date 'yyyy-mm-dd hh:mm:ss'

Шейп-файлы и покрытия не поддерживают использование времени в поле даты.

SQL, используемый в файловой базе геоданных, базируется на стандарте SQL-92.

Известные ограничения

Построение запросов к датам, находящимся в левой части (первой таблице) соединения, работает только для файловых источников данных, таких как файловые базы геоданных, шейп-файлы и таблицы DBF. Но возможен обходной путь при работе с другими, не файловыми, источниками, такими как многопользовательские данные, как описано ниже.

Запрос к датам левой части соединения будет выполнен успешно, если использовать ограниченную версию SQL, разработанную для файловых источников данных. Если вы не используете такой источник данных, можете перевести выражение для использования этого формата. Нужно обеспечить, чтобы выражение запроса включало поля из более чем одной присоединенной таблицы. Например, если соединены класс пространственных объектов и таблица (FC1 и Table1), и они поступают из многопользовательской базы геоданных, следующее выражение не будет выполнено или не вернет данные:

FC1.date = date #01/12/2001#
FC1.date = date '01/12/2001'

Чтобы запрос был выполнен успешно, можно создать вот такой запрос:

FC1.date = date '01/12/2001' and Table1.OBJECTID > 0

Так как запрос включает поля из обеих таблиц, будет использована ограниченная версия SQL. В этом выражении Table1.OBJECTID всегда > 0 для записей, которые сопоставлены в процессе создания соединения, поэтому это выражение всегда верно для всех строк, содержащих сопоставления соединения.

Чтобы быть уверенным, что каждая запись с FC1.date = date ’01/12/2001′ выбрана, используйте следующий запрос:

FC1.date = date '01/12/2001' and (Table1.OBJECTID IS NOT NULL OR Table1.OBJECTID IS NULL)

Такой запрос будет выбирать все записи с FC1.date = date ’01/12/2001′, независимо от того, есть ли сопоставление при соединении для каждой отдельной записи.

Комбинированные выражения

Составные запросы могут комбинироваться путем соединения выражений операторами AND (И) и OR (ИЛИ). Вот пример запроса для выборки всех домов с общей площадью более 1500 квадратных футов и гаражом более чем на три машины:

AREA > 1500 AND GARAGE > 3

Когда вы используете оператор OR (ИЛИ), по крайней мере одно из двух разделенных оператором выражений, должно быть верно для выбираемой записи, например:

RAINFALL < 20 OR SLOPE > 35

Используйте оператор NOT (НЕ) в начале выражения, чтобы найти объекты или записи, не соответствующие условию выражения, например:

NOT STATE_NAME = 'Colorado'

Оператор NOT можно комбинировать с AND и OR. Вот пример запроса, который выбирает все штаты Новой Англии за исключением штата Maine:

SUB_REGION = 'New England' AND NOT STATE_NAME = 'Maine'

Вычисления

Вычисления можно включить в запросы с помощью математических операторов +, –, * и /. Можно использовать вычисление между полем и числом, например:

AREA >= PERIMETER * 100

Вычисления также могут производиться между полями. Например чтобы найти районы с плотностью населения меньшим или равным 25 человек на 1 квадратную милю, можно использовать вот такой запрос:

POP1990 / AREA <= 25

Приоритет выражения в скобках

Выражения выполняются в последовательности, определяемой стандартными правилами. Например, заключённая в круглые скобки часть выражения выполняется раньше, чем часть выражения за скобками.

HOUSEHOLDS > MALES * (POP90_SQMI + AREA)

Вы можете добавить скобки в режиме Редактирование SQL вручную, или использовать команды Группировать и Разгруппировать в режиме Условие, чтобы добавить или удалить их.

Подзапросы

Подзапрос – это запрос, вложенный в другой запрос и поддерживаемый только в базах геоданных. Подзапросы могут использоваться в SQL-выражении для применения предикативных или агрегирующих функций, или для сравнения данных со значениями, хранящимися в другой таблице и т.п. Это может быть сделано с помощью ключевых слов IN или ANY. Например этот запрос выбирает только те страны, которых нет в таблице indep_countries:

COUNTRY_NAME NOT IN (SELECT COUNTRY_NAME FROM indep_countries)

Покрытия, шейп-файлы и прочие файловые источники данных, не относящиеся к базам геоданных, не поддерживают подзапросы. Подзапросы, выполняемые на версионных многопользовательских классах объектов и таблицах, не возвращают объекты, которые хранятся в дельта-таблицах. Файловые базы геоданных имеют ограниченную поддержку подзапросов, описанных в данном разделе, в то время, как многопользовательские базы геоданных поддерживают их полностью. Информацию обо всех возможностях подзапросов к многопользовательским базам геоданных смотрите в документации по своей СУБД.

Этот запрос возвращает объекты, где GDP2006 больше, чем GDP2005 любых объектов, содержащихся в countries (странах):

GDP2006 > (SELECT MAX(GDP2005) FROM countries)

Поддержка подзапросов в файловых базах геоданных ограничена следующим:

Операторы

Ниже приведен полный список операторов, поддерживаемых файловыми базами геоданных, шейп-файлами, покрытиями и прочими файловыми источниками данных. Они также поддерживаются в многопользовательских базах геоданных, хотя для этих источников данных может требоваться иной синтаксис. Кроме нижеперечисленных операторов, многопользовательские базы геоданных поддерживают дополнительные возможности. Более подробную информацию см. в документации по своей СУБД.

Арифметические операторы

Для сложения, вычитания, умножения и деления числовых значений можно использовать арифметические операторы.

Арифметические операторы
Оператор	Описание
*	Арифметический оператор умножения
/	Арифметический оператор деления
+	Арифметический оператор сложения
–	Арифметический оператор вычитания

Операторы сравнения

Операторы сравнения используются для сравнения одного выражения с другим.

Операторы сравнения
Оператор	Описание
<	Меньше . Может использоваться со строками (сравнение основывается на алфавитном порядке) и для числовых вычислений, а также дат.
<=	Меньше или равно. Может использоваться со строками (сравнение основывается на алфавитном порядке) и для числовых вычислений, а также дат.
<>	Не равно . Может использоваться со строками (сравнение основывается на алфавитном порядке) и для числовых вычислений, а также дат.
>	Больше . Может использоваться со строками (сравнение основывается на алфавитном порядке) и для числовых вычислений, а также дат.
>=	Больше или равно. Может использоваться со строками (сравнение основывается на алфавитном порядке) и для числовых вычислений, а также дат.
[NOT] BETWEEN x AND y	Выбирает запись, если она имеет значение, которое больше или равно x и меньше или равно y. Если перед ней стоит значение NOT, она выбирает запись, если та имеет значение вне указанного диапазона. Например это выражение выбирает все записи со значениями, которые больше или равны 1 и меньше или равны 10: OBJECTID BETWEEN 1 AND 10 Вот эквивалент этого выражения: OBJECTID >= 1 AND OBJECTID <= 10 Однако, выражение с оператором BETWEEN обрабатывается быстрее, если у вас поле проиндексировано.
[NOT] EXISTS	Возвращает TRUE (истинно), если подзапрос возвращает хотя бы одну запись; в противном случае возвращает FALSE (ложно). Например, данное выражение вернет TRUE, если поле OJBECTID содержит значение 50: EXISTS (SELECT * FROM parcels WHERE OBJECTID = 50) EXISTS поддерживается только в файловых и многопользовательских базах геоданных.
[NOT] IN	Выбирает запись, если она содержит одну из нескольких строк или значений в поле. Если впереди стоит NOT, выбирает запись, где нет таких строк или значений. Например, это выражение будет искать четыре разных названия штатов: STATE_NAME IN ('Alabama', 'Alaska', 'California', 'Florida')
IS [NOT] NULL	Выбирает запись, если там в определенном поле есть нулевое значение. Если перед NULL стоит NOT, выбирает запись, где в определенном поле есть какое-то значение.
x [NOT] LIKE y [ESCAPE ‘escape-character’]	Используйте оператор LIKE (вместо оператора = ) с групповыми символами, если хотите построить запрос по части строки. Символ процента (%) означает, что на этом месте может быть что угодно – один символ или сотня, или ни одного. Если вы хотите использовать групповой символ, обозначающий один любой символ, используйте символ подчёркивания (_). Если вам нужен доступ к несимвольным данным, используйте функцию CAST. Например, этот запрос возвращает числа, начинающиеся на 8, из целочисленного поля SCORE_INT: CAST (SCORE_INT AS VARCHAR(10)) LIKE '8%' Для включения символа (%) или (_) в вашу строку поиска, используйте ключевое слово ESCAPE для указания другого символа вместо escape, который в свою очередь обозначает настоящий знак процента или подчёркивания. Например данное выражение возвращает все строки, содержащие 10%, такие как 10% DISCOUNT или A10%: AMOUNT LIKE '%10$%%' ESCAPE '$'

Логические операторы

Логические операторы
Оператор	Описание
AND	Соединяет два условия и выбирает запись, в которой оба условия являются истинными. Например, выполнение следующего запроса выберет все дома с площадью более 1 500 квадратных футов и гаражом на две и более машины: AREA > 1500 AND GARAGE > 2
OR	Соединяет два условия и выбирает запись, где истинно хотя бы одно условие. Например выполнение следующего запроса выберет все дома с площадью более 1,500 квадратных футов или гаражом на две и более машины: AREA > 1500 OR GARAGE > 2
NOT	Выбирает записи, не соответствующие указанному выражению. Например это выражение выберет все штаты, кроме Калифорнии (California): NOT STATE_NAME = 'California'

Операторы строковой операции


Оператор	Описание
\|\|	Возвращает символьную строку, являющуюся результатом конкатенации двух или более строковых выражений. FIRST_NAME \|\| MIDDLE_NAME \|\| LAST_NAME

Функции

Ниже приведен полный список функций, поддерживаемых файловыми базами геоданных, шейп-файлами, покрытиями и прочими файловыми источниками данных. Функции также поддерживаются в многопользовательских базах геоданных, хотя в этих источниках данных может использоваться иной синтаксис или имена функций. Кроме нижеперечисленных функций, многопользовательские базы геоданных поддерживают дополнительные возможности. Более подробную информацию см. в документации по своей СУБД.

Функции дат

Функции дат
Функция	Описание
CURRENT_DATE	Возвращает текущую дату.
EXTRACT(extract_field FROM extract_source)	Возвращает фрагмент extract_field из extract_source. Аргумент extract_source является выражением даты–времени. Аргументом extract_field может быть одно из следующих ключевых слов: YEAR, MONTH, DAY, HOUR, MINUTE или SECOND.
CURRENT TIME	Возвращает текущую дату.

Строковые функции

Аргументы, обозначаемые string_exp, могут быть названием столбца, строковой константой или результатом другой скалярной функции, где исходные данные могут быть представлены в виде символов.

Аргументы, обозначаемые character_exp, являются строками символов переменной длины.

Аргументы, указанные как start или length могут быть числовыми постоянными или результатами других скалярных функций, где исходные данные представлены числовым типом.

Строковые функции, перечисленные здесь, базируются на 1; то есть, первым символом в строке является символ 1.

Строковые функции
Функция	Описание
CHAR_LENGTH(string_exp)	Возвращает длину строкового выражения в символах.
LOWER(string_exp)	Возвращает строку, идентичную string_exp, в которой все символы верхнего регистра изменены на символы нижнего регистра.
POSITION(character_exp IN character_exp)	Возвращает место первого символьного выражения во втором символьном выражении. Результат – число с точностью, определяемой реализацией и коэффициентом кратности 0.
SUBSTRING(string_exp FROM start FOR length)	Возвращает символьную строку, извлекаемую из string_exp, начинающуюся с символа, положение которого определяется символами start и length .
TRIM(BOTH \| LEADING \| TRAILING trim_character FROM string_exp)	Возвращает string_exp, укороченную на количество символов, указанное в аргументе trim_character, с начала, с конца или с обоих концов строки.
UPPER(string_exp)	Возвращает строку, идентичную string_exp, в которой все символы нижнего регистра изменены на символы верхнего регистра.

Числовые функции

Все числовые функции возвращают числовые значения.

Аргументы, обозначенные numeric_exp, float_exp или integer_exp могут быть именем столбца, результатом другой скалярной функции или числовой константой, где исходные данные могут быть представлены числовым типом.

Числовые функции
Функция	Описание
ABS(numeric_exp)	Возвращает абсолютное значение numeric_exp.
ACOS(float_exp)	Возвращает угол в радианах, равный арккосинусу float_exp.
ASIN(float_exp)	Возвращает угол в радианах, равный арксинусу float_exp.
ATAN(float_exp)	Возвращает угол в радианах, равный арктангенсу float_exp.
CEILING(numeric_exp)	Возвращает наименьшее целочисленное значение, большее или равное numeric_exp.
COS(float_exp)	Возвращает косинус float_exp, где float_exp — угол, выраженный в радианах.
FLOOR(numeric_exp)	Возвращает наибольшее целое значение, меньшее или равное numeric_exp.
LOG(float_exp)	Возвращает натуральный логарифм float_exp.
LOG10(float_exp)	Возвращает логарифм по основанию 10 float_exp.
MOD(integer_exp1, integer_exp2)	Возвращает результат деления integer_exp1 на integer_exp2.
POWER(numeric_exp, integer_exp)	Возвращает значение numeric_exp в степени integer_exp.
ROUND(numeric_exp, integer_exp)	Возвращает numeric_exp, округленное до integer_exp знаков справа от десятичной точки. Если integer_exp отрицательное, numeric_exp округляется до \|integer_exp\| знаков слева от десятичной запятой.
SIGN(numeric_exp)	Возвращает указатель знака numeric_exp. Если numeric_exp меньше нуля, возвращается -1. Если numeric_exp равно нулю, возвращается 0. Если numeric_exp больше нуля, возвращается 1.
SIN(float_exp)	Возвращает синус float_exp, где float_exp — угол, выраженный в радианах.
TAN(float_exp)	Возвращает тангенс float_exp, где float_exp — угол, выраженный в радианах.
TRUNCATE(numeric_exp, integer_exp)	Возвращает numeric_exp, округленное до integer_exp знаков справа от десятичной точки. Если integer_exp отрицательное, numeric_exp округляется до \|integer_exp\| знаков слева от десятичной запятой.

Функция CAST

Функция CAST конвертирует значение в определенный тип данных. Синтаксис выглядит так:

CAST(exp AS data_type [(length)])

Пример:

CAST (SCORE_INT AS VARCHAR(10))

Аргумент exp может быть названием столбца, результатом другой скалярной функции или буквенным. Data_type может быть любым из следующих ключевых слов, и задается строчными или заглавными буквами: CHAR, VARCHAR, INTEGER, SMALLINT, REAL, DOUBLE, DATE, TIME, DATETIME, NUMERIC или DECIMAL.

Более подробно о функции CAST см. CAST and CONVERT.

Связанные разделы

Отзыв по этому разделу?

10 полезных советов по написанию SQL запросов | Info-Comp.ru

Сегодня я хочу поговорить о тех простых моментах, которые помогут начинающим программистам SQL более правильно, продуманно и просто составлять логику своих запросов и быстрей освоить язык SQL.

Все эти моменты я выделяю как

«полезные советы», которые основаны как на личном опыте, так и на опыте других более опытных людей. И сегодня я хочу поделиться ими с Вами. Получилось у меня их 10.

Совет 1 — перечисляйте поля

При написании запроса перечисляйте поля. Не ставьте *, так как в дальнейшем могут возникнуть некоторые проблемы, хотя с первого взгляда Вы их не замечаете, а, напротив, думаете, что это намного удобней. Проблемы могут возникнуть следующие: не задействуются индексы, появляются столбцы с одинаковыми названиями, это возникает тогда, когда в запросе Вы объединяете несколько таблиц, в которых есть поля с одинаковыми названиями. И в данном случае потом, например, разработчик клиентской части, не подозревая, может выводить пользователю не те данные, которые нужны.

Не нужно так делать

    
   SELECT *  
   FROM table

Лучше так

   
   SELECT col, col2, col3 
   FROM table

Примечание! Если Вы начинающий программист и у Вас нет базовых знаний языка SQL, то я Вам рекомендую почитать книгу «SQL код» – это самоучитель по данному языку. Книга написана мной, в ней я очень подробно рассказываю о языке SQL.

Совет 2 — не пишите сложные многоуровневые запросы

Не делайте сложные, большие, многоуровневые запросы. Вы просто запутаетесь, так как такой запрос трудно переделывать, и вообще — это влияет на скорость работы. Если запрос используется часто, то вынесите наиболее сложную часть в функцию или процедуру, и вообще, не стесняйтесь писать свои функции для любых нужд, конечно, если предполагается, что эти функции будут активно использоваться во всевозможных запросах, а в запросе в нужном месте вызывайте ее. Это намного упрощает написание запросов, в дальнейшем не придется изучать заново логику запроса, например, если Вам необходимо что-то в нем переделать, а также в некоторых случаях увеличится скорость работы запроса.

Примечание!

Если Вы не знаете, как писать собственные функции, можете ознакомиться со статьей, которая посвящена именно этому Как написать функцию на PL/pgSQL. В языке T-SQL для упрощения написания кода запросы есть специальная конструкция WITH.

Совет 3 — не используйте в WHERE функции

Не используйте в условии функции, которые будут вычислять какое-то значение на основе поля в текущей таблице, так как это будет сделано для каждой строки, и, соответственно, увеличится нагрузка и как следствие уменьшится скорость работы. Также это относится и к подзапросам. Хотя во многих случаях без этого не обойтись, но помните, если есть возможность подумать и не использовать это, то лучше подумайте и реализуйте эту задачу по-другому. Все это можно отнести, например, и к секции SELECT, но здесь такое требуется довольно часто.

Совет 4 — перечисляйте столбцы во время INSERT

При добавлении данных в таблицу, так же как и в SELECT перечисляйте поля таблицы, например:

Не нужно так делать

    
   INSERT INTO table 
      VALUES (col1, col2, col3……)

Лучше так

     
   INSERT INTO table (col1, col2, col3……) 
       VALUES (col1, col2, col3……)

Так как поля в таблице могут добавляться, и поэтому могут возникнуть некоторые трудности, даже если Вы позаботились о значении по умолчанию для новой колонки.

Совет 5 — используйте значение по умолчанию, избегайте NULL

Данный совет вытекает из предыдущего. Старайтесь при создании таблицы задавать значения по умолчанию, чтобы избавиться от NULL, так как если Вы этого не будете делать, то могут возникать такие значения как NULL, а следует помнить, что NULL — это не значение, а это состояние ячейки, т.е. отсутствие значения. Чем так плохо это значение, а тем, что при написании запросов, Вам придется помнить, что у Вас могут встречаться такие значения и соответственно принимать их во внимание. Так как если Вы забудете или попросту не знаете, что в какой-то таблице есть значения NULL, то в дальнейшем Вы можете выводить неправильные данные, а это не есть хорошо.

Совет 6 — в ORDER BY используйте имена столбцов

При сортировке (ORDER BY) лучше использовать имена столбцов, а не их позиции (номера), так как могут возникнуть проблемы. Например, Вы использовали сортировку по их номеру и отдали запрос разработчику приложения, затем через некоторое время возникла необходимость изменить данный запрос путем добавления или удаления некоторых полей, а про сортировку забыли и снова отдали запрос разработчику. И теперь при выводе данных будет использоваться неправильная сортировка, а со стороны пользователя вообще может возникнуть мнение, что выводятся неправильные данные, он об этом скажет Вам, а Вы будете не понимать, ведь все же работало, что же не так. А все потому, что никакой ошибки не возникнет, чтобы ее можно было отследить, а все банально и просто, Вы использовали сортировку по номеру столбца.

Не нужно так делать

   
   SELECT col, col2, col3
   FROM table
   ORDER BY 2, 1

А лучше так

   
   SELECT col, col2, col3
   FROM table
   ORDER BY col2, col

Совет 7 — сохраняйте SQL запросы

Если Вы пишите какой-то разовый запрос и в дальнейшем он может, и никогда не будет использоваться, все равно сохраните этот запрос в любом виде, обычно в файлах .sql, так как по опыту могу сказать, что он может пригодиться и для других задач или помочь их решить намного быстрей. Если Вы не сохраните, то Вам придется продумывать всю логику, алгоритм заново что, конечно же, влияет на скорость выполнения задания.

Совет 8 — не создавайте много курсоров

Не создавайте много курсоров. Так как курсор — это достаточно ресурсоемкая операция для сервера, поэтому если есть возможность обойтись без него, то лучше его не использовать. Хотя есть такие задачи, когда курсор это единственное возможное решение, поэтому он тоже, в некоторых случаях, очень полезен.

Примечание! А если Вы даже не знаете, как создавать курсоры, то в этом Вам поможет следующая статья Как использовать курсор в функциях на PL/pgSQL

Совет 9 — проверяйте и тестируйте условия при UPDATE и DELETE

Совет на собственную проверку. Иногда, когда требуется что-то массово обновить (UPDATE), всегда тестируйте запрос на тестовой базе, иначе, например, одно не верное условие может быть практически необратимо. Поэтому всегда под рукой должна быть тестовая база.

Совет 10 — используйте понятные названия

Создавайте понятные названия столбцов в таблицах, а также используйте понятные название переменных, данный совет относится не только к SQL, но и к программированию в целом.

Надеюсь, эти советы Вам помогут правильно составлять свои запросы и не наступать на те же грабли, как многие другие начинающие программисты.

Нравится2Не нравится

Как сделать сложные запросы SQL проще для написания? [закрыто]

Я основываю большую часть этого на попытках получить «правильный» ответ, чтобы вы могли обнаружить, что есть некоторые проблемы с производительностью. Нет смысла ускорять неправильный запрос.

Поймите отношения таблицы — большинство будет один ко многим. Знать таблицу «многие». Определите поля, необходимые для ваших объединений.

Подумайте о сценариях ЛЕВОГО присоединения — выберите всех сотрудников и их зарплату с прошлого месяца. Что если они не получили зарплату в прошлом месяце?

Знайте набор результатов: 1) В электронной таблице вручную введите хотя бы одну правильную запись для вашего запроса. 2) Напишите запрос в достаточно простой форме, чтобы определить, сколько записей должно быть возвращено. Используйте оба из них, чтобы проверить ваш запрос, чтобы убедиться, что присоединение к новой таблице не изменит результат.

Разбейте ваш запрос на управляемые части — вам не нужно писать все сразу. Сложные запросы иногда могут быть просто набором простых запросов.

Остерегайтесь смешанных уровней агрегации : если вам нужно поместить ежемесячные, квартальные и текущие значения в один и тот же набор результатов, вам нужно будет рассчитать их отдельно в запросах, сгруппированных по разным значениям.

Знайте, когда объединяться Иногда легче разделить подгруппы на свои собственные операторы выбора. Если у вас есть таблица, смешанная с менеджерами и другими сотрудниками, и в каждом столбце вы должны делать операторы Case, основанные на членстве в одной из этих групп, может быть проще написать запрос Manager и объединить его с запросом Employee. Каждый из них будет содержать свою собственную логику. Необходимость включать элементы из разных таблиц в разные строки — очевидное применение.

Сложные / вложенные формулы — Старайтесь последовательно делать отступы и не бойтесь использовать несколько строк. «Дело, когда дело, когда дело, когда» сводит вас с ума. Потратьте время, чтобы обдумать это. Сохраните сложные кальки для последнего. Получите правильные записи, выбранные в первую очередь. Затем вы атакуете сложные формулы, зная, что работаете с правильными значениями. Просмотр значений, используемых в формулах, поможет вам определить области, в которых необходимо учитывать значения NULL, и где обрабатывать ошибку деления на ноль.

Тестируйте часто, когда вы добавляете новые таблицы, чтобы убедиться, что вы все еще получаете желаемый набор результатов и знаете, какое соединение или предложение является виновником.

Используйте возможности SQL для создания запросов в Excel и напрямую к таблицам Excel

Порой таблицы Excel постепенно разрастаются настолько, что с ними становится неудобно работать. Поиск дубликатов, группировка, сложная сортировка, объединение нескольких таблиц в одну, т.д. — превращаются в действительно трудоёмкие задачи. Теоретически эти задачи можно легко решить с помощью языка запросов SQL… если бы только можно было составлять запросы напрямую к данным Excel.

Инструмент XLTools «SQL запросы» расширяет Excel возможностями языка структурированных запросов:

Создание запросов SQL в интерфейсе Excel и напрямую к Excel таблицам
Автогенерация запросов SELECT и JOIN
Доступны JOIN, ORDER BY, DISTINCT, GROUP BY, SUM и другие операторы SQLite
Создание запросов в интуитивном редакторе с подстветкой синтаксиса
Обращение к любым таблицам Excel из дерева данных

Перед началом работы добавьте «Всплывающие часы» в Excel

«SQL запросы» – это один из 20+ инструментов в составе надстройки XLTools для Excel. Работает в Excel 2019, 2016, 2013, 2010, десктоп Office 365.

Скачать XLTools для Excel

– пробный период дает 14 дней полного доступа ко всем инструментам.

Как превратить данные Excel в реляционную базу данных и подготовить их к работе с SQL запросами

По умолчанию Excel воспринимает данные как простые диапазоны. Но SQL применим только к реляционным базам данных. Поэтому, прежде чем создать запрос, преобразуйте диапазоны Excel в таблицу (именованный диапазон с применением стиля таблицы):

Выделите диапазон данных На вкладке «Главная» нажмите Форматировать как таблицу Примените стиль таблицы.
Выберите таблицу Откройте вкладку «Конструктор» Напечатайте имя таблицы.
Напр., «КодТовара».
Повторите эти шаги для каждого диапазона, который планируете использовать в запросах.
Напр., «КодТовара», «ЦенаРозн», «ОбъемПродаж», т.д.
Готово, теперь эти таблицы будут служить реляционной базой данных и готовы к SQL запросам.

Как создать и выполнить запрос SQL SELECT к таблицам Excel

Надстройка «SQL запросы» позволяет выполнять запросы к Excel таблицам на разных листах и в разных книгах. Для этого убедитесь, что эти книги открыты, а нужные данные отформатированы как именованные таблицы.

Нажмите кнопку Выполнить SQL на вкладке XLTools Откроется окно редактора.
В левой части окна находится дерево данных со всеми доступными таблицами Excel.
Нажатием на узлы открываются/сворачиваются поля таблицы (столбцы).
Выберите целые таблицы или конкретные поля.
По мере выбора полей, в правой части редактора автоматически генерируется запрос SELECT.
Внимание: редактор запросов SQL автоматически подсвечивает синтаксис.
Укажите, куда необходимо поместить результат запроса: на новый или существующий лист.
Нажмите «Выполнить» Готово!

Операторы Left Join, Order By, Group By, Distinct и другие SQLite команды в Excel

XLTools использует стандарт SQLite. Пользователи, владеющие языком SQLite, могут создавать самые разнообразные запросы:

LEFT JOIN – объединить две и более таблиц по общему ключевому столбцу
ORDER BY – сортировка данных в выдаче запроса
DISTINCT – удаление дубликатов из результата запроса
GROUP BY – группировка данных в выдаче запроса
SUM, COUNT, MIN, MAX, AVG и другие операторы

Совет: вместо набора названий таблиц вручную, просто перетягивайте названия из дерева данных в область редактора SQL запросов.

Как объединить две и более Excel таблиц с помощью надстройки «SQL запросы»

Вы можете объединить несколько таблиц Excel в одну, если у них есть общее ключевое поле. Предположим, вам нужно объединить несколько таблиц по общему столбцу «КодТовара»:

Нажмите Выполнить SQL на вкладке XLTools Выберите поля, которые нужно включить в объединённую таблицу.
По мере выбора полей, автоматически генерируется запрос SELECT и LEFT JOIN.
Укажите, куда необходимо поместить результат запроса: на новый или существующий лист.
Нажмите «Выполнить» Готово! Объединённая таблица появится в считанные секунды.

MS SQL Server и T-SQL

Первый запрос на T-SQL

Последнее обновление: 05.07.2017

В прошлой теме в SQL Management Studio была создана простенькая база данных с одной таблицей. Теперь определим и выполним первый SQL-запрос. Для этого откроем SQL Management Studio, нажмем правой кнопкой мыши на элемент самого верхнего уровня в Object Explorer (название сервера) и в появившемся контекстном меню выберем пункт New Query:

После этого в центральной части программы откроется окно для ввода команд языка SQL.

Выполним запрос к таблице, которая была создана в прошлой теме, в частности, получим все данные из нее. База данных у нас называется university, а таблица — dbo.Students, поэтому для получения данных из таблицы введем следующий запрос:


SELECT * FROM university.dbo.Students

Оператор SELECT позволяет выбирать данные. FROM указывает источник, откуда брать данные. Фактически этим запросом мы говорим «ВЫБРАТЬ все ИЗ таблицы university.dbo.Students». Стоит отметить, что для названия таблицы используется полный ее путь с указанием базы данных и схемы.

После ввода запроса нажмем на панели инструментов на кнопку Execute, либо можно нажать на клавишу F5.

В результате выполнения запроса в нижней части программы появится небольшая таблица, которая отобразит результаты запроса — то есть все данные из таблицы Students.

Если необходимо совершить несколько запросов к одной и той же базе данных, то мы можем использовать команду USE, чтобы зафиксировать базу данных. В этом случае при запросах к таблицам достаточно указать их имя без имени бд и схемы:


USE university
SELECT * FROM Students

В данном случае мы выполняем запрос в целом для сервера, мы можем обратиться к любой базе данных на сервере. Но также мы можем выполнять запросы только в рамках конкретной базы данных. Для этого необходимо нажать правой кнопкой мыши на нужную бд и в контекстном меню выбрать пункт New Query:

Если в этом случае мы захотим выполнить запрос к выше использованной таблице Students, то нам не пришлось бы указывать в запросе название базы данных и схему, так как эти значения итак уже были бы понятны:


SELECT * FROM Students

Советы по правильному написанию запросов к SQL-базе

Немного советов о том, как правильно писать запросы к SQL-базе. И немного про ORM.

0. Очевидное

Используй только параметризованые запросы, и всегда ставь внешние ключи там, где они необходимы.

1. Не бойся делать SELECT

Если у тебя просто по id выбираются записи из базы — это ок. Не нужно бояться сделать один лишний простой SELECT к базе.

Такие запросы база может переваривать тысячами, и от одного лишнего ей ничего не будет.

SELECT * FROM user WHERE id=:id

2. Избегай цикличных запросов

Казалось бы, притча во языцах, но нет-нет да столкнешься на проекте с цикличными запросами. Особенно часто это касается связанных сущностей. Вместо

SELECT * FROM user WHERE id=1
SELECT * FROM user WHERE id=2
SELECT * FROM user WHERE id=3

у тебя должен быть всего один запрос

SELECT * FROM user WHERE id IN (1,2,3)

3. Не оптимизируй джойнами

Серьезно, джойны — это не оптимизация. Они не облегчают запросы. Джойны нужны для выборки кастомного набора столбцов, которые находятся в разных таблицах или вычисляются на лету (чаще всего это статистика, и все что около нее).

Тут правило такое, если можно обойтись без джойна — обойдись без джойна. На мой взгляд, есть 2 типа кейсов, когда джойн необходим или уместен.

Выборка по нескольким таблицам

Например, нужно выбрать сколько у пользователя машин:

SELECT user.id, COUNT(car.id) AS cars_count FROM user
JOIN car ON car.user_id = user.id
GROUP BY user.id

Для таких кейсов мы используем джойны, потому что без них тут не обойтись.

Транзитивные условия

И еще один кейс — это оптимизация транзитивных условий. Например, нам нужно получить всех пользователей из определенной страны. Для этого нужно выбрать области в стране, и города в областях.

SELECT user.* FROM user
JOIN city ON city.id = user.city_id
JOIN region ON region.id = city.region_id
JOIN country ON country.id = region.country_id
WHERE country.id=:id

В данном случае, сделать “4 селекта без джойна” или “1 но с джойнами” выходит примерно одинаково дешево. Но один запрос иметь поприятнее, согласись.

Если твой запрос не попадает под эти 2 пункта, то вероятно тебе не нужен джойн и его лучше не использовать.

4. Один запрос — один тип сущности

Один запрос должен возвращать один тип сущности. Не надо заставлять свою базу вернуть одновременно 2 типа сущности. Это приводит к усложенению запросов ненужными джойнами, дублированию данных в ответе и увеличению времени выполнения запроса.

Пример возврата двух типов сущностей:

SELECT user.*, city.* FROM user
JOIN city ON city.id = user.city_id
WHERE user.id IN (<ids>)

Данный запрос породит дублирование данных, которое нужно будет как-то разруливать. Плюс за джойн база тебе спасибо не скажет.

А должно быть так:

SELECT * FROM user WHERE id IN (<ids>)
SELECT * FROM city WHERE id IN (<ids>)

Мы делаем селект юзеров. Затем собираем необходимый список id городов, и по ним делаем второй селект. Просто и прозрачно.

5. Не бойся работать руками

Этот пункт — логическое продолжение 4го пункта (или даже повторение).

Нам нужно выбрать большое количество связанных сущностей. Вопрос: какое оптимальное количество запросов нам для этого нужно? Ответ простой — по одному запросу на каждый тип сущности, ни больше ни меньше.

Пример: нужно выбрать Страны с Областями, с Городами и с Улицами. Для того, чтобы это сделать нужно ровно 4 простых селекта:

SELECT * FROM country
SELECT * FROM region WHERE country_id IN (<ids>)
SELECT * FROM city WHERE region_id IN (<ids>)
SELECT * FROM street WHERE city_id IN (<ids>)

Но сложность в том, что между этими запросами вам нужно вычислить промежуточные id сущностей на клиенте. И текущий пункт о том, что не нужно бояться этого делать. Почти всегда это делается простыми map-функциями.

Пример кода на гипотетическом js:

countries = countriesRepo.selectAll()
countriesIds = countries.map(it => it.id)

regions = regionsRepo.selectAllByCountries(countriesIds)
regionsIds = regions.map(it => it.id)

cities = citiesRepo.selectAllByRegions(regionsIds)
citiesIds = cities.map(it => it.id)

streets = streetsRepo.selectAllByCities(citiesIds)

Все данные есть, можно делать с ними теперь что угодно. Промежуточная манипуляция это совсем не страшно. Лучше отправить простой запрос к базе, и потом на клиенте все разложить как надо, чем пытаться делать запрос-франкенштейн, чтобы он вернул тебе данные в каком-то удобном для тебя виде, или потому что так работает твоя ORM.

6. Именование таблиц со связями many-many

В таблицах со связями не должно быть данных, кроме id (и возможно временных меток создания).

Есть таблицы, которые хранят связи many-many, и их именуют обычно так: users_has_cars, user_to_car, user_car и т.д. По названию сразу понятно, что там хранятся связи в виде списков id.

Когда в эти таблицы добавляются какие-то поля с другими данными (например crashes_count, insurance_cost), эти таблицы нужно превращать в отдельные сущности, и соответственно, переименовывать таблицы. В противном случае ты рискуешь столкнуться в проекте с такими полноценными сущностями, как UserHasCar. И тебе придется с ними работать наравне с User и Car. Согласись, что CarOwnership лучше чем UserHasCar, хотя бы потому, что это существительное, а не утверждение.

Как только в таблицу many-many добавляется поле с данными — переименовывай таблицу в полноценную сущность.

Вместо заключения, про ORM

Иногда программисты ошибочно возводят в абсолют разные технологии. Технология объявляется чем-то идеальным, а все что выходит за ее рамки применимости — считается чем-то дурным и неправильным. ORM — не исключение, и я бы хотел развеять эту догматичность.

Большинство ORM не умеют решать проблему N+1 (цикличные запросы при получении связанных сущностей), часто джойнят запросы, пытаясь получить много сущностей из одного запроса. Когда эти пункты накладываются в проде под нагрузкой, ты внезапно обнаруживаешь, что твой сервер начинает потеть и долго отвечать.

ORM — не панацея, а может быть даже и антипаттерн (холиварный момент). Мне неизвестны ORM, которые бы учитывали все пункты, которые я привел выше. Поэтому я считаю ORM плохим подходом. А, например связка репозитории+object-мапперы полностью заменяет ORM, но при этом является более гибкой, прозрачной и простой.

Если тебе мешает ORM — подумай, возможно пора переосмыслить подход к работе с базой. Следуй вышеперечисленным пунктам. И твоя база будет атлетична и быстра.

Как писать простые запросы

Как запросить базу данных SQL:

Убедитесь, что у вас есть приложение для управления базой данных (например, MySQL Workbench, Sequel Pro).
Если нет, загрузите приложение для управления базой данных и поработайте с вашей компанией, чтобы подключить вашу базу данных.
Изучите свою базу данных и ее иерархию.
Узнайте, какие поля есть в ваших таблицах.
Начните писать SQL-запрос, чтобы получить желаемые данные.

Вы когда-нибудь слышали о компьютерном языке под названием SQL? Возможно, вы слышали об этом в контексте анализа данных, но никогда не думали, что это применимо к вам как к маркетологу.Или вы, возможно, подумали: «Это действительно для , действительно опытных пользователей данных . Я бы никогда не смог этого сделать».

Что ж, более ошибаюсь! Наиболее успешные маркетологи руководствуются данными, и одна из наиболее важных составляющих работы на основе данных — это возможность быстро собирать данные из баз данных. SQL оказался одним из лучших и самых популярных инструментов для этого.

SQL расшифровывается как язык структурированных запросов и используется, когда у компаний есть тонны данных, которыми они хотят легко и быстро манипулировать.Если ваша компания уже хранит данные в базе данных, вам может потребоваться изучить SQL для доступа к данным. Но не волнуйтесь — вы находитесь в правильном месте, чтобы начать работу!

Прежде чем мы начнем, убедитесь, что у вас есть приложение для управления базой данных, которое позволит вам извлекать данные из вашей базы данных. Некоторые варианты включают MySQL Workbench или Sequel Pro. Начните с загрузки одного из этих вариантов, а затем поговорите со своей компанией о том, как подключиться к базе данных. Выбранный вами вариант будет зависеть от серверной части вашего продукта, поэтому проконсультируйтесь со своей командой разработчиков, чтобы убедиться, что вы выбрали правильный.

Давайте прыгнем прямо.

Зачем нужен SQL?

Прелесть SQL в том, что любой, кто работает в компании, которая хранит данные в реляционной базе данных, может его использовать. (И, скорее всего, ваш.)

Если вы работаете в компании-разработчике программного обеспечения и хотите получить данные об использовании своих клиентов, вы можете сделать это с помощью SQL. Если вы работаете в компании электронной коммерции, у которой есть данные о покупках клиентов, вы можете использовать SQL, чтобы узнать, какие клиенты покупают какие продукты. Конечно, это лишь некоторые из многих-многих примеров.

Подумайте об этом так: открывали ли вы когда-нибудь очень большой набор данных в Excel только для того, чтобы ваш компьютер зависал или даже выключался? SQL позволяет вам получать доступ только к определенным частям ваших данных за раз, поэтому вам не нужно загружать данные в CSV, манипулировать ими и, возможно, перегружать Excel. Другими словами, SQL заботится об анализе данных, к которому вы, возможно, привыкли в Excel. (Если вы хотите немного углубиться в этот аспект SQL, вот статья в блоге, с которой вы можете начать.)

Как писать простые запросы SQL

Понять иерархию вашей базы данных

Прежде чем начать, важно привыкнуть к своей базе данных и ее иерархии.Если у вас есть несколько баз данных данных, вам нужно сосредоточиться на местонахождении данных, с которыми вы хотите работать.

Например, давайте представим, что мы работаем с несколькими базами данных о людях в Соединенных Штатах. Введите запрос «ПОКАЗАТЬ БАЗЫ ДАННЫХ;». Наши результаты могут показать, что у вас есть несколько баз данных для разных мест, в том числе одна для Новой Англии.

В вашей базе данных у вас будут разные таблицы, содержащие данные, с которыми вы хотите работать. Используя тот же пример выше, допустим, мы хотим узнать, какая информация содержится в одной из баз данных.Если мы воспользуемся запросом «ПОКАЗАТЬ ТАБЛИЦЫ в Новой Англии;», мы обнаружим, что у нас есть таблицы для каждого штата Новой Англии: people_connecticut, people_maine, people_massachusetts, people_newhampshire, people_rhodeisland и people_vermont.

Наконец, вам нужно выяснить, какие поля находятся в таблицах. Поля — это определенные фрагменты данных, которые вы можете извлечь из своей базы данных. Например, если вы хотите получить чей-то адрес, имя поля может быть не просто «адресом» — оно может быть разделено на address_city, address_state, address_zip.Чтобы в этом разобраться, воспользуйтесь запросом «Describe people_massachusetts;». Это предоставит список всех данных, которые вы можете получить с помощью SQL.

Давайте быстро рассмотрим иерархию на примере Новой Англии:

Наша база данных: NewEngland.
Наши таблицы в этой базе данных: people_connecticut, people_maine, people_massachusetts, people_newhampshire, people_rhodeisland и people_vermont.
Наши поля в таблице people_massachusetts включают: address_city, address_state, address_zip, hair_color, first_name и last_name.

Теперь, чтобы научиться писать простой SQL-запрос, давайте воспользуемся следующим примером:

Кто эти люди с рыжими волосами в Массачусетсе, родившиеся в 2003 году, в алфавитном порядке?

ВЫБРАТЬ

SELECT выбирает поля, которые вы хотите отобразить на диаграмме. Это конкретная информация, которую вы хотите извлечь из своей базы данных. В приведенном выше примере мы хотим найти человек , которые соответствуют остальным критериям.

Вот наш SQL-запрос:

ВЫБРАТЬ
first_name,
last_name

ИЗ

FROM определяет таблицу, из которой вы хотите извлечь данные. В предыдущем разделе мы обнаружили, что существует шесть таблиц для каждого из шести штатов Новой Англии: people_connecticut, people_maine, people_massachusetts, people_newhampshire, people_rhodeisland и people_vermont. Поскольку мы ищем людей конкретно в Массачусетсе, мы будем извлекать данные из этой конкретной таблицы.

Вот наш SQL-запрос:

ВЫБРАТЬ
first_name,
last_name
FROM
people_massachusetts

ГДЕ

WHERE позволяет вам фильтровать ваш запрос, чтобы быть более конкретным. В нашем примере мы хотим отфильтровать наш запрос, чтобы он включал только людей с рыжими волосами, родившихся в 2003 году. Начнем с фильтра рыжих волос.

Вот наш SQL-запрос:

ВЫБЕРИТЕ
first_name,
last_name
FROM
people_massachusetts
ГДЕ
hair_color = «red»

hair_color могло бы быть частью вашего начального оператора SELECT, если бы вы хотели посмотреть на всех людей в Массачусетсе вместе с их конкретным цветом волос.Но если вы хотите отфильтровать только человек с рыжими волосами, вы можете сделать это в инструкции WHERE.

И

AND позволяет добавлять дополнительные критерии к вашему оператору WHERE. Помните, что мы хотим фильтровать людей с рыжими волосами в дополнение к людям, родившимся в 2003 году. Поскольку наше выражение WHERE основано на критериях рыжих волос, как мы можем фильтровать также и по определенному году рождения?

Вот где на помощь приходит оператор AND. В этом случае оператор AND является свойством даты, но это не обязательно.(Примечание. Уточняйте формат дат с командой разработчиков продукта, чтобы убедиться, что он указан в правильном формате.)

Вот наш SQL-запрос:

ВЫБЕРИТЕ
first_name,
last_name
FROM
people_massachusetts
ГДЕ
hair_color = «red»
AND
Дата рождения AND BETWEEN ‘2003-01-01’ 2003-12-31 ‘

ЗАКАЗАТЬ В

Когда вы создаете SQL-запросы, вам не нужно экспортировать данные в Excel.Расчет и организация должны выполняться в рамках запроса. Вот тут-то и пригодятся функции «ORDER BY» и «GROUP BY». Сначала мы рассмотрим наши SQL-запросы с функциями ORDER BY и затем GROUP BY соответственно. Затем мы кратко рассмотрим разницу между ними.

Предложение ORDER BY позволяет выполнять сортировку по любому из полей, указанных в операторе SELECT. В этом случае будем заказывать по фамилии.

Вот наш SQL-запрос:

ГРУППА ПО

«GROUP BY» похожа на «ORDER BY», но объединяет данные, имеющие сходство.Например, если у вас есть какие-либо дубликаты в ваших данных, вы можете использовать «GROUP BY» для подсчета количества дубликатов в ваших полях.

Вот ваш SQL-запрос:

ЗАКАЗ VS.ГРУППА BY

Чтобы ясно показать вам разницу между оператором «ORDER BY» и оператором «GROUP BY», давайте ненадолго выйдем за пределы нашего примера с Массачусетсом и рассмотрим очень простой набор данных. Ниже приведен список идентификационных номеров и имен четырех сотрудников.

Если бы мы использовали оператор ORDER BY в этом списке, имена сотрудников были бы отсортированы в алфавитном порядке. Результат будет выглядеть так:

Если бы мы использовали оператор GROUP BY, сотрудники были бы подсчитаны на основе того, сколько раз они появлялись в исходной таблице.Обратите внимание, что Петр дважды появлялся в исходной таблице. Результат будет выглядеть так:

Со мной так далеко? Хорошо. Вернемся к создаваемому нами SQL-запросу о рыжеволосых людях из Массачусетса, родившихся в 2003 году.

ПРЕДЕЛ

В зависимости от количества данных в базе данных выполнение запросов может занять много времени. Это может быть неприятно, если вы обнаружите, что долго ждете выполнения запроса, с которого вы действительно не хотели начинать.Если вы хотите протестировать наш запрос, отлично подойдет функция LIMIT, поскольку она позволяет ограничить количество получаемых результатов.

Например, если мы подозреваем, что в Массачусетсе есть миллионы людей с рыжими волосами, мы можем протестировать наш запрос с помощью LIMIT, прежде чем запускать его полностью, чтобы убедиться, что мы получаем нужную информацию. Скажем, например, мы хотим видеть только первых 100 человек.

Вот наш SQL-запрос:

Вот и все по основам!

Чувствуете себя хорошо? Вот еще несколько способов улучшить ваши SQL-запросы.

Бонус: расширенные советы по SQL

Теперь, когда вы освоили создание SQL-запроса, давайте рассмотрим некоторые другие приемы, которые вы можете использовать, чтобы поднять его на ступеньку выше, начиная со звездочки.

*

Когда вы добавляете звездочку к одному из ваших SQL-запросов, она сообщает запросу, что вы хотите включить все столбцы данных в свои результаты. В примере, который мы использовали, у нас было только два имени столбца: first_name и last_name. Но предположим, что у нас есть данные объемом 15 столбцов, которые мы хотим видеть в наших результатах — было бы довольно сложно ввести все имена 15 столбцов в операторе SELECT.Вместо этого, если вы замените имена этих столбцов звездочкой, запрос будет извлекать все столбцы из результатов.

Вот как будет выглядеть SQL-запрос:

ВЫБРАТЬ
*
ИЗ
people_massachusetts
ГДЕ
hair_color = «red»
И
дата рождения МЕЖДУ ‘2003-01-01’ И ‘2003-12-31 ‘
ЗАКАЗАТЬ ПО
фамилия
LIMIT
100
;

ПОСЛЕДНИЕ 30 ДНЕЙ

Как только я начал регулярно использовать SQL, я обнаружил, что один из моих постоянных запросов включал попытку выяснить, какие люди совершили действие или выполнили определенный набор критериев в течение последних 30 дней.Поскольку этот тип запросов был очень полезен для меня, я хотел поделиться с вами этой возможностью.

Давайте представим, что сегодня 1 декабря 2014 года. Вы, , могли бы создать эти параметры , сделав интервал Birth_date между 1 ноября 2014 года и 30 ноября 2014 года. Этот SQL-запрос будет выглядеть так:

ВЫБЕРИТЕ
first_name,
last_name
FROM
people_massachusetts
ГДЕ
hair_color = «red»
AND
Дата рождения И Дата рождения BETWEEN ‘2014-11-01’ 2014-11-01 ‘ 2014-11-30 ‘
ЗАКАЗАТЬ ПО
фамилия
LIMIT
100
;

Но это потребовало бы размышлений о том, какие даты охватывают последние 30 дней, и это означало бы, что вам придется постоянно обновлять этот запрос.Вместо этого, чтобы даты автоматически охватывали последние 30 дней независимо от того, какой это день, вы можете ввести это в поле AND: Birth_date> = (DATE_SUB (CURDATE (), INTERVAL 30.

)

(Примечание: вам нужно перепроверить этот синтаксис со своей командой разработчиков продукта, потому что он может отличаться в зависимости от программного обеспечения, которое вы используете для получения запросов SQL.)

Таким образом, ваш SQL-запрос будет выглядеть так:

ВЫБЕРИТЕ
first_name,
last_name
FROM
people_massachusetts
ГДЕ
hair_color = «red»
AND
Дата рождения> = (DATE_SUB) (CURS 30))
ЗАКАЗАТЬ ПО
фамилия
LIMIT
100
;

СЧЕТ

В некоторых случаях вы можете захотеть подсчитать, сколько раз появляется критерий поля.Например, предположим, вы хотите подсчитать, сколько раз появлялись разные цвета волос у людей, которых вы подсчитываете из Массачусетса. В этом случае вам пригодится COUNT, так что вам не придется вручную складывать количество людей с разными цветами волос или экспортировать эту информацию в Excel.

Вот как будет выглядеть этот SQL-запрос:

ВЫБРАТЬ
цвет_ волос,
СЧЕТ (цвет_ волос)
ИЗ
people_massachusetts
И
дата рождения МЕЖДУ ‘2003-01-01’ И ‘2003-12-31’
ГРУППА ПО
цвет волос
;

ПРИСОЕДИНЯЙТЕСЬ

Может быть, в какой-то момент вам понадобится получить доступ к информации из двух разных таблиц в одном SQL-запросе.В SQL для этого можно использовать предложение JOIN. (Для тех из вас, кто знаком с формулами Excel, это похоже на то, как вы использовали бы формулу ВПР, когда вам нужно объединить информацию из двух разных листов в Excel.)

Например, предположим, что у нас есть одна таблица, в которой содержатся данные об идентификаторах пользователей всех жителей Массачусетса и их датах рождения. Допустим, у нас также есть полностью отдельная таблица, в которой есть данные об идентификаторах пользователей всех жителей Масачусетса и их цвете волос. Если мы хотим выяснить цвет волос жителей Массачусетса, родившихся в 2003 году, нам потребуется получить доступ к информации из обеих таблиц и объединить их.Это работает, потому что обе таблицы имеют совпадающий столбец: идентификаторы пользователей жителей Массачусетса.

Поскольку мы вызываем поля из двух разных таблиц, наш оператор SELECT также немного изменится. Вместо того, чтобы просто перечислять поля, которые мы хотим включить в наши результаты, нам нужно указать, из какой таблицы они берутся. (Примечание: здесь может пригодиться функция звездочки, поэтому ваш запрос включает обе таблицы в ваши результаты.)

Чтобы указать поле из определенной таблицы, все, что нам нужно сделать, это объединить имя таблицы с именем поля.Например, в нашем операторе SELECT будет сказано «table.field» — с точкой, разделяющей имя таблицы и имя поля.

Давайте посмотрим, как это выглядит в действии.

В этом случае мы предполагаем несколько вещей:

Таблица дат рождения в Массачусетсе включает следующие поля: first_name, last_name, user_id, Birthdate
Таблица цветов волос Массачусетса включает следующие поля: user_id, hair_color

Таким образом, ваш SQL-запрос будет выглядеть так:

ВЫБРАТЬ
Birthdate_massachusetts. first_name,
Birthdate_massachusetts. фамилия
ИЗ
Birthdate_massachusetts ПРИСОЕДИНЯЙТЕСЬ 31 ‘
ЗАКАЗАТЬ ПО
фамилия
;

Этот запрос объединит две таблицы с помощью поля «user_id», которое появляется как в таблице Birthdate_massachusetts, так и в таблице haircolor_massachusetts.После этого вы сможете увидеть таблицу с людьми, родившимися в 2003 году с рыжими волосами.

Поздравляем: вы готовы приступить к работе со своими собственными SQL-запросами! Хотя с SQL вы можете сделать гораздо больше, я надеюсь, что этот обзор основ оказался для вас полезным, чтобы вы могли запачкать руки. Обладая прочными основами, вы сможете лучше ориентироваться в SQL и работать над некоторыми из более сложных примеров.

Какие данные вы хотите получать с помощью SQL?

Sql Лучшие Лрактики

В этой статье рассказывается о некоторых передовых методах написания SQL-запросов для аналитиков и специалистов по обработке данных.Большая часть нашего обсуждения будет касаться SQL в целом, но мы включим некоторые заметки о функциях, специфичных для Metabase, которые упрощают написание SQL.

Корректность, читаемость, затем оптимизация: именно в таком порядке

Здесь действует стандартное предупреждение против преждевременной оптимизации. Не настраивайте SQL-запрос, пока не убедитесь, что он возвращает данные, которые вы ищете. И даже в этом случае расставляйте приоритеты оптимизации запроса только в том случае, если он часто выполняется (например, при включении популярной панели мониторинга) или если запрос проходит через большое количество строк.В целом, прежде чем беспокоиться о производительности, расставьте приоритеты в отношении точности (дает ли запрос желаемые результаты) и удобочитаемости (могут ли другие легко понять и изменить код).

Сделайте свои стога сена как можно меньше, прежде чем искать иглы

Возможно, здесь мы уже приступили к оптимизации, но цель должна состоять в том, чтобы указать базе данных сканировать минимальное количество значений, необходимое для получения ваших результатов.

Отчасти красота SQL заключается в его декларативности.Вместо того, чтобы сообщать базе данных, как получать записи, вам нужно только сообщить базе данных, какие записи вам нужны, и база данных должна определить наиболее эффективный способ получения этой информации. Следовательно, большая часть советов по повышению эффективности запросов состоит просто в том, чтобы показать людям, как использовать инструменты SQL для более точного формулирования своих потребностей.

Мы рассмотрим общий порядок выполнения запросов и добавим советы по сокращению пространства поиска.Затем мы поговорим о трех основных инструментах, которые можно добавить в ваш пояс служебных программ: INDEX, EXPLAIN и WITH.

Сначала ознакомьтесь со своими данными

Ознакомьтесь со своими данными, прежде чем писать хоть одну строчку кода. Соблюдается железный закон GIGO (мусор на входе, мусор на выходе), поэтому изучите метаданные, чтобы убедиться, что столбец действительно содержит данные, которые вы ожидаете.

В редакторе SQL в Metabase есть удобная вкладка справки по данным (доступная через значок книги), где вы можете просматривать таблицы в своей базе данных и просматривать их столбцы и соединения (рисунок 1):

Рис.1 . Используйте боковую панель «Ссылка на данные» для просмотра полей таблицы.

Вы также можете просмотреть образцы значений для определенных столбцов (рисунок 2).

Рис.2 . Используйте боковую панель со ссылкой на данные, чтобы просмотреть образцы данных.

Metabase дает вам множество различных способов исследования ваших данных: вы можете просматривать таблицы, составлять простые и настраиваемые вопросы с помощью построителя запросов и редактора записной книжки, преобразовывать сохраненный вопрос в код SQL или строить из существующего собственного запроса.

Мы расскажем об исследовании данных в следующей публикации.А пока давайте рассмотрим общий рабочий процесс запроса.

Разработка вашего запроса

У всех разные методы, но вот пример рабочего процесса, которому нужно следовать при разработке запроса.

Как и выше, изучите метаданные столбца и таблицы. Если вы используете собственный редактор запросов Metabase, вы также можете искать фрагменты SQL, содержащие код SQL для таблицы и столбцов, с которыми вы работаете. Фрагменты позволяют увидеть, как другие аналитики запрашивали данные.Или вы можете начать запрос из существующего вопроса SQL.
Чтобы получить представление о значениях таблицы, ВЫБЕРИТЕ * из таблиц, с которыми вы работаете, и ОГРАНИЧИТЕ свои результаты. Продолжайте применять LIMIT при уточнении столбцов (или добавлении дополнительных столбцов с помощью объединений).
Сузьте столбцы до минимального набора, необходимого для ответа на ваш вопрос.
Примените к этим столбцам любые фильтры.
Если вам нужно агрегировать данные, агрегируйте небольшое количество строк и убедитесь, что агрегаты соответствуют вашим ожиданиям.
Если у вас есть запрос, возвращающий нужные вам результаты, найдите разделы запроса, которые нужно сохранить как общее табличное выражение (CTE), чтобы инкапсулировать эту логику.
С помощью Metabase вы также можете сохранить код в виде фрагмента кода SQL для совместного использования и повторного использования в других запросах.

Теперь перейдем к выполнению запроса.

Общий порядок выполнения запросов

Прежде чем мы перейдем к отдельным советам по написанию кода SQL, важно иметь представление о том, как базы данных будут выполнять ваш запрос — что отличается от порядка «чтения» (слева направо, сверху вниз), который вы используете при составлении запроса. .Обратите внимание, что оптимизаторы запросов могут изменять порядок следующего списка, но этот общий жизненный цикл SQL-запроса следует иметь в виду при написании SQL. Мы будем использовать порядок выполнения, чтобы сгруппировать следующие советы по написанию хорошего SQL.

Практическое правило заключается в следующем: чем раньше вы удалите данные из этого списка, тем лучше.

FROM (и JOIN) получают таблицы, указанные в запросе. Эти таблицы представляют собой максимальное пространство поиска, указанное вашим запросом. По возможности ограничьте это пространство поиска, прежде чем двигаться дальше.
ГДЕ фильтрует данные.
GROUP BY объединяет данные.
HAVING отфильтровывает агрегированные данные, не соответствующие критериям.
SELECT захватывает столбцы (затем дедуплицирует строки, если вызывается DISTINCT).
UNION объединяет выбранные данные в набор результатов.
ORDER BY сортирует результаты.

И, конечно же, всегда будут случаи, когда оптимизатор запросов для вашей конкретной базы данных разработает другой план запроса, так что не зацикливайтесь на этом порядке.

Некоторые рекомендации по запросам (не правила)

Следующие советы представляют собой рекомендации, а не правила, призванные уберечь вас от неприятностей. Каждая база данных обрабатывает SQL по-разному, имеет немного другой набор функций и использует разные подходы к оптимизации запросов. И это еще до того, как мы даже перейдем к сравнению традиционных транзакционных баз данных с аналитическими базами данных, которые используют столбчатые форматы хранения, которые имеют совершенно разные характеристики производительности.

Помогите людям (включая себя через три месяца), добавляя комментарии, объясняющие различные части кода.Самая важная вещь, которую нужно уловить, — это «почему». Например, очевидно, что приведенный ниже код отфильтровывает заказы с идентификатором , ID больше 10, но это происходит потому, что первые 10 заказов используются для тестирования.

  ВЫБРАТЬ
  я бы,
  товар
ИЗ
  заказы
- отфильтровать тестовые заказы
КУДА
  order.id> 10

Загвоздка здесь в том, что вы вводите небольшие накладные расходы на обслуживание: если вы меняете код, вам нужно убедиться, что комментарий по-прежнему актуален и актуален.Но это небольшая цена за читаемый код.

ИЗ

Объединение таблиц с помощью ключевого слова ON

Хотя возможно «объединить» две таблицы с помощью предложения WHERE (то есть для выполнения неявного соединения, например, SELECT * FROM a, b WHERE a.foo = b.bar ), вместо этого вы должны предпочесть явное ПРИСОЕДИНЕНИЕ:

  ВЫБРАТЬ
  o.id,
  o.total,
  п. продавец
ИЗ
  заказы как o
  ПРИСОЕДИНЯЙТЕСЬ к продуктам КАК p ON o.product_id = p.id

В основном для удобства чтения, поскольку синтаксис JOIN + ON отличает соединения от предложений WHERE , предназначенных для фильтрации результатов.

Псевдоним нескольких таблиц

При запросе нескольких таблиц используйте псевдонимы и используйте эти псевдонимы в своем операторе select, чтобы базе данных (и вашему читателю) не нужно было анализировать, какой столбец принадлежит какой таблице. Обратите внимание: если у вас есть столбцы с одинаковыми именами в нескольких таблицах, вам нужно будет явно ссылаться на них с помощью имени таблицы или псевдонима.

Избегать

  ВЫБРАТЬ
  заглавие,
  фамилия,
  имя
FROM fiction_books
  ВЛЕВО ПРИСОЕДИНИТЬСЯ fiction_authors
  ПО fiction_books.author_id = fiction_authors.id

Предпочтительно

  ВЫБРАТЬ
  books.title,
  авторы.last_name,
  авторы.first_name
FROM fiction_books КАК книги
  ВЛЕВО ПРИСОЕДИНИТЬСЯ fiction_authors AS авторы
  НА books.author_id = авторы.id

Это тривиальный пример, но когда количество таблиц и столбцов в вашем запросе увеличивается, вашим читателям не нужно будет отслеживать, какой столбец в какой таблице находится. Это и ваши запросы могут сломаться, если вы присоединитесь к таблице с неоднозначным именем столбца (например,g., обе таблицы включают поле с именем Created_At .

Обратите внимание, что фильтры полей несовместимы с псевдонимами таблиц, поэтому вам необходимо удалить псевдонимы при подключении виджетов фильтров к фильтрам полей.

ГДЕ

Фильтр с ГДЕ до ИМЕНИ

Используйте предложение WHERE для фильтрации лишних строк, чтобы вам не приходилось вычислять эти значения в первую очередь. Только после удаления нерелевантных строк и после агрегирования этих строк и их группировки следует включать предложение HAVING для фильтрации агрегатов.

Избегайте функций для столбцов в предложениях WHERE

Использование функции в столбце в предложении WHERE может действительно замедлить ваш запрос, так как функция делает запрос несаргируемым (т. Е. Не позволяет базе данных использовать индекс для ускорения запроса). Вместо использования индекса для перехода к соответствующим строкам функция столбца заставляет базу данных запускать функцию для каждой строки таблицы.

И помните, оператор конкатенации || также является функцией, так что не пытайтесь объединить строки для фильтрации нескольких столбцов.Вместо этого предпочитайте несколько условий:

Избегать

  ВЫБЕРИТЕ героя, кореша
ОТ супергероев
ГДЕ герой || sidekick = 'БэтменРобин'

Предпочтительно

  ВЫБЕРИТЕ героя, кореша
ОТ супергероев
КУДА
  герой = 'Бэтмен'
  И
  sidekick = 'Робин'

Предпочитать

= на КАК

Это не всегда так. Полезно знать, что LIKE сравнивает символы и может сочетаться с операторами подстановки, такими как % , тогда как оператор = сравнивает строки и числа на предмет точных совпадений. = может использовать индексированные столбцы. Это не относится ко всем базам данных, поскольку LIKE может использовать индексы (если они существуют для поля), если вы избегаете префикса поискового запроса с помощью оператора подстановки, % . Это подводит нас к следующему пункту:

Избегайте подстановочных знаков закладки в операторах WHERE

Использование подстановочных знаков для поиска может быть дорогостоящим. Предпочитайте добавлять подстановочные знаки в конце строк. Добавление к строке подстановочного знака может привести к полному сканированию таблицы.

Избегать

  ВЫБРАТЬ столбец ИЗ таблицы WHERE col LIKE "% wizar%"

Предпочтительно

  ВЫБРАТЬ столбец ИЗ таблицы WHERE col LIKE "wizar%"

Предпочитать СУЩЕСТВУЕТ в

Если вам просто нужно проверить наличие значения в таблице, выберите EXISTS до IN , поскольку процесс EXISTS завершается, как только находит значение поиска, тогда как IN будет сканировать всю таблицу . IN следует использовать для поиска значений в списках.

Точно так же предпочтите НЕ СУЩЕСТВУЕТ до НЕ В .

ГРУППА ПО

Упорядочить несколько групп по убыванию мощности

Где возможно, GROUP BY столбцов в порядке убывания мощности. То есть сначала сгруппируйте по столбцам с более уникальными значениями (например, идентификаторами или номерами телефонов), а затем по столбцам с меньшим количеством различных значений (например, по состоянию или полу).

ИМЕЕТ

Используйте HAVING только для фильтрации агрегатов

И до ИМЕЕТ , отфильтруйте значения с помощью предложения WHERE перед агрегированием и группировкой этих значений.

ВЫБРАТЬ

ВЫБРАТЬ столбцы, а не звезды

Укажите столбцы, которые вы хотите включить в результаты (хотя можно использовать * при первом просмотре таблиц — просто не забудьте LIMIT для ваших результатов).

СОЮЗ

Предпочитайте UNION All вместо UNION

Если дубликаты не являются проблемой, UNION ALL не отбрасывает их, а поскольку UNION ALL не выполняет задачу удаления дубликатов, запрос будет более эффективным.

ЗАКАЗАТЬ

По возможности избегайте сортировки, особенно в подзапросах

Сортировка дорогая. Если вам необходимо выполнить сортировку, убедитесь, что ваши подзапросы не сортируют данные без необходимости.

ИНДЕКС

Этот раздел предназначен для администраторов баз данных в толпе (и тема слишком большая, чтобы поместиться в этой статье). Одна из наиболее частых проблем, с которыми сталкиваются люди при возникновении проблем с производительностью при запросах к базе данных, — это отсутствие адекватного индексирования.

Какие столбцы следует индексировать, обычно зависит от столбцов, по которым выполняется фильтрация (т.е., какие столбцы обычно заканчиваются в ваших предложениях WHERE ). Если вы обнаружите, что всегда выполняете фильтрацию по общему набору столбцов, вам следует подумать об индексировании этих столбцов.

Добавление индексов

Индексирование столбцов внешнего ключа и часто запрашиваемых столбцов может значительно сократить время запроса. Вот пример инструкции для создания индекса:

  СОЗДАТЬ ИНДЕКС product_title_index ON продукты (title)

Доступны различные типы индексов, наиболее распространенный тип индекса использует B-дерево для ускорения поиска.Ознакомьтесь с нашей статьей о том, как ускорить работу сводных панелей, и ознакомьтесь с документацией по вашей базе данных о том, как создать индекс.

Использовать частичные индексы

Для особенно больших наборов данных или однобоких наборов данных, где определенные диапазоны значений встречаются чаще, рассмотрите возможность создания индекса с предложением WHERE , чтобы ограничить количество проиндексированных строк. Частичные индексы также могут быть полезны для диапазонов дат, например, если вы хотите проиндексировать данные только за последнюю неделю.

Использовать составные индексы

Для столбцов, которые обычно объединяются в запросы (например, last_name, first_name), рассмотрите возможность создания составного индекса.Синтаксис аналогичен созданию единого индекса. Например:

  CREATE INDEX full_name_index ON для клиентов (last_name, first_name)

ОБЪЯСНИТЬ

Ищите узкие места

Некоторые базы данных, такие как PostgreSQL, предлагают понимание плана запроса на основе вашего кода SQL. Просто добавьте к вашему коду префикс EXPLAIN ANALYZE . Эти команды можно использовать для проверки планов запросов и поиска узких мест или для сравнения планов одной версии запроса с другой, чтобы увидеть, какая версия более эффективна.

Вот пример запроса с использованием базы данных dvdrental , доступной для PostgreSQL.

  EXPLAIN ANALYZE SELECT title, release_year
ИЗ фильма
ГДЕ release_year> 2000;

А на выходе:

  Seq Scan на пленке (стоимость = 0,00..66,50 строк = 1000 ширины = 19) (фактическое время = 0,008..0,311 строк = 1000 петель = 1)
   Фильтр: ((год_выпуска) :: целое число> 2000)
 Время планирования: 0,062 мс
 Время выполнения: 0,416 мс

Вы увидите миллисекунды, необходимые для планирования времени, времени выполнения, а также стоимости, строк, ширины, времени, циклов, использования памяти и т. Д.Чтение этих анализов — своего рода искусство, но вы можете использовать их для выявления проблемных областей в ваших запросах (таких как вложенные циклы или столбцы, для которых может быть полезно индексирование) по мере их уточнения.

Вот документация PostreSQL по использованию EXPLAIN.

С

Организуйте свои запросы с помощью общих табличных выражений (CTE)

Используйте предложение WITH для инкапсуляции логики в общее табличное выражение (CTE). Вот пример запроса, который ищет продукты с самым высоким средним доходом от проданной единицы в 2018 году, а также максимальные и минимальные значения.

  С product_orders AS (
  ВЫБЕРИТЕ o.created_at AS order_date,
          p.title AS product_title,
          (o.subtotal / o.quantity) AS выручка на единицу
   ИЗ заказов как о
   LEFT JOIN products AS p ON o.product_id = p.id
   - Отфильтровать заказы, размещенные службой поддержки клиентов, для взимания платы с клиентов
   ГДЕ o.quantity> 0
)
ВЫБЕРИТЕ product_title КАК продукт,
       AVG (выручка на единицу) AS avg_revenue_per_unit,
       MAX (доход_на_единицу) AS max_revenue_per_unit,
       MIN (выручка на единицу) AS min_revenue_per_unit
ОТ product_orders
ГДЕ order_date МЕЖДУ "2019-01-01" И "2019-12-31"
ГРУППА ПО ПРОДУКТУ
ЗАКАЗАТЬ ПО avg_revenue_per_unit DESC

Предложение WITH делает код читаемым, поскольку основной запрос (то, что вы на самом деле ищете) не прерывается длинным подзапросом.

Вы также можете использовать CTE, чтобы сделать ваш SQL более читаемым, если, например, в вашей базе данных есть поля с неудобными названиями или требующие небольшого изменения данных для получения полезных данных. Например, CTE могут быть полезны при работе с полями JSON. Вот пример извлечения и преобразования полей из большого двоичного объекта JSON пользовательских событий.

  С исходными_данными AS (
  ВЫБРАТЬ события -> 'данные' - >> 'имя' AS имя_события,
    CAST (события -> 'данные' - >> 'ts' временная метка AS) AS event_timestamp
    CAST (события -> 'данные' - >> 'cust_id' AS int) AS customer_id
  ОТ user_activity
)
ВЫБЕРИТЕ event_name,
       event_timestamp,
       Пользовательский ИД
ИЗ исходных_данных

В качестве альтернативы вы можете сохранить подзапрос как фрагмент кода SQL (рисунок 3 — обратите внимание на круглые скобки вокруг фрагмента), чтобы легко повторно использовать этот код в других запросах.

Рис.3 . Сохранение подзапроса во фрагменте и использование его в предложении FROM.

И да, как и следовало ожидать, Aerodynamic Leather Toucan приносит самый высокий средний доход от проданной единицы.

SQL потрясающий. Но то же самое с конструктором запросов и редактором записных книжек Metabase. Вы можете составлять запросы с помощью графического интерфейса Metabase для объединения таблиц, фильтрации и суммирования данных, создания настраиваемых столбцов и т. Д. А с помощью настраиваемых выражений вы можете обрабатывать подавляющее большинство аналитических сценариев использования, даже не обращаясь к SQL.Вопросы, составленные с помощью редактора записной книжки, также выигрывают от автоматической детализации, которая позволяет зрителям ваших диаграмм щелкать и исследовать данные — функция, недоступная для вопросов, написанных на SQL.

Явные ошибки или упущения?

Существуют библиотеки книг по SQL, так что мы здесь лишь поверхностно. Вы можете поделиться секретами своего SQL-колдовства с другими пользователями Metabase на нашем форуме.

Спасибо за ваш отзыв!

Получайте подобные статьи в свой почтовый ящик каждый месяц

Учебное пособие по простым запросам и утверждениям

В этой статье объясняется, как писать простые SQL-запросы, начиная с самых простых, и постепенно улучшать сценарий для решения некоторых математических задач и задач, связанных с датой.Кроме того, мы собираемся прояснить концепции, связанные с SQL-запросами.

Хотя эта статья предназначена в первую очередь для начинающих, она содержит советы, которые будут полезны для любого уровня опыта.

Что такое SQL-запрос в базе данных?

Давайте сначала поговорим немного о SQL-запросах, чтобы правильно их понять, прежде чем получить практический опыт написания.

SQL означает структурированный язык запросов , который является важным языком, используемым для запросов к реляционным базам данных.

T-SQL vs SQL — в чем разница?

T-SQL или Transact-SQL — это версия SQL от Microsoft с большим количеством функций и возможностей, чем в традиционном языке SQL, также известном как ANSI SQL.

Следовательно, T-SQL — это традиционный язык SQL, плюс дополнительные возможности, добавленные Microsoft. Он чаще используется и упоминается, когда мы говорим о SQL.

Эта статья будет относиться к версии Microsoft SQL независимо от того, используем ли мы слово SQL или T-SQL.

Почему мы используем запросы SQL в реляционной базе данных?

Реляционная база данных — это база данных с ключами, которые используются для соединения таблиц, а не для физического соединения таблиц.

Например, у вас есть таблица с именем Book , которую вы связываете с другой таблицей с именем BookType с помощью ключей, чтобы добавить больше значений к записям.

Таблицы на иллюстрации связаны ключом. Их не нужно связывать физически. Это фундаментальное правило реляционных баз данных — вы создаете отношения между двумя таблицами с помощью ключа (ов).

Читайте также реляционная база данных против NoSQL — что выбрать для управления большими данными?

Что такое запросы к базе данных?

Вы запрашиваете базу данных, чтобы получить ответы на вопросы, связанные с этой базой данных.Другими словами, вы пишете запросы к базе данных, чтобы получить информацию о содержащихся в ней данных.

Например, вы хотите просмотреть все книжные записи вместе с их типами в конкретной базе данных. Вам нужно запросить эту базу данных, чтобы просмотреть требуемые данные. Для этого вы должны написать и запустить сценарий для базы данных.

Что нужно для запроса?

Для запроса к базе данных должны присутствовать некоторые предварительные условия, поскольку мы не можем просто написать и запустить запрос где угодно против чего-либо.

Следующие вещи являются обязательными для запроса к базе данных:

Сервер базы данных, например SQL Server (установленный локально или удаленно), на котором вы храните базу данных.
Инструмент управления базой данных, такой как SQL Server Management Studio или dbForge Studio для SQL Server, который вы будете использовать для написания и выполнения ваших запросов.
База данных, для которой вы запускаете свои запросы. Вы можете создать любую примерную базу данных в учебных целях.

Кроме того, вы должны иметь общее представление о своей базе данных, например, какая таблица содержит нужную информацию и т. Д.Понимание концепций реляционных баз данных тоже является плюсом.

Мы предполагаем, что вы уже выполнили указанные выше требования. Но вы также можете обратиться к следующей статье для получения более подробной информации:

Основы SQL Server Management Studio (SSMS) — Часть 1

Что нужно сделать перед написанием запросов в SQL

Теперь мы собираемся написать простые SQL-запросы.

Настройте среду, чтобы начать писать запросы SQL. Подготовьте инструменты.Откройте dbForge Studio для SQL Server или SQL Server Management Studio и подключитесь к экземпляру SQL. Здесь мы начинаем наше путешествие по SQL:

После успешного подключения нажмите CTRL + N или перейдите в Файл> Создать> Запрос с текущим подключением :

Теперь вы успешно подключились к главному серверу (системной базе данных) подключенного в данный момент сервера.

Важный совет: Всегда создавайте образец базы данных для выполнения ваших запросов (сценариев) к ней.Запросы к системным базам данных не рекомендуется, за исключением трех случаев:

Вы работаете с образцом базы данных, а затем созданный для него сценарий будет выполняться в системной (главной) базе данных.
Вы запрашиваете основную базу данных с целью получить из нее некоторую информацию.
Запросы можно безопасно запускать к системной (главной) базе данных.

Настройка образца базы данных

Давайте создадим образец базы данных с именем BookSimple без каких-либо таблиц.Напишите следующий сценарий для основной базы данных, чтобы создать образец базы данных и Нажмите F5 , чтобы выполнить запрос:

  - Создать образец базы данных BookSimple
ИСПОЛЬЗУЙТЕ МАСТЕР
ИДТИ

СОЗДАТЬ БАЗУ ДАННЫХ BookSimple
ИДТИ

ИСПОЛЬЗОВАТЬ BookSimple

Основанная на наборах концепция, лежащая в основе SQL-запросов

Непосредственно перед тем, как вы напишете даже простейший SQL-запрос, вы должны понять, что SQL — это язык, основанный на наборах.

Это означает, что когда вы хотите запросить свою базу данных с помощью SQL, вы должны думать о наборах или группах.

SQL разработан и по умолчанию очень эффективен для обслуживания запросов на основе наборов. Если вы разрабатываете свои сценарии (запросы) с учетом логики, основанной на наборах, вы понимаете и реализуете SQL быстрее, чем те, которые следуют типичному пути обучения (который имеет свои преимущества).

Давайте подумаем о естественном множестве, таком как класс или группа. Когда мы говорим о классе, мы имеем в виду всех учеников этого класса. SQL может помочь запросить этот класс в целом.

Точно так же Книга — это таблица с книгами.Он содержит все записи для книг. Мы можем просто запросить эту таблицу, как если бы мы говорили об одной книге, но на самом деле мы запрашиваем всю таблицу книг, представленную таблицей Book .

Мы увидим больше преимуществ концепции, основанной на множествах, позже, когда рассмотрим некоторые базовые примеры.

Простой оператор SQL SELECT

SELECT — это оператор T-SQL, который извлекает все или выбранные строки и столбцы (на основе критерия) из базы данных.

Другими словами, SELECT позволяет нам просматривать (выбирать) данные из таблицы или ряда таблиц на основе определенных критериев, которые, если не упоминаются в целом, показывают все данные.

Следовательно, SELECT — это первый оператор, который нужно искать, если мы хотим получить строки и столбцы из базы данных. Самая простая форма синтаксиса SELECT следующая:

  ВЫБРАТЬ * ИЗ <Таблица>

Помните, что со временем мы будем изменять синтаксис, чтобы постепенно улучшать процесс обучения.

Другой способ использования оператора SELECT:

  ВЫБРАТЬ <Выражение>

Выражение может быть различным, включая следующее:

Константа (например, фиксированное число, например 1).
Переменная (например, @X, которая может быть изменена на любое число).
Комбинация констант или переменных (например, 1 + 2 или @X + @ Y).

Однако, независимо от того, используете ли вы SELECT или SELECT * FROM

, вы должны мыслить в терминах множеств.

Как написать простой SQL-запрос

Давайте сделаем запрос к базе данных BookSimple , обновив узел Базы данных в обозревателе объектов . Щелкните правой кнопкой мыши BookSimple > Новый запрос :

Запишите простейший запрос SQL — напишите и запустите следующий сценарий для образца базы данных:

  - Дисплей 1
ВЫБРАТЬ 1

Выполнение запроса (нажатие F5) покажет следующие результаты:

Итак, SELECT 1 возвращает 1, но с безымянным столбцом (без имени столбца).

1 — постоянная величина. Он останется равным 1, поэтому мы ожидаем, что результат тоже будет 1. Однако необходимо понять еще одну важную вещь: наш вывод преобразуется в набор из 1 столбца и 1 строки. Поскольку мы не указали имя для столбца и не задействована таблица (чтобы получить имя), мы получаем значение 1 для безымянного столбца безымянной таблицы (набора).

Язык на основе наборов автоматически вернул предоставленное нами значение в безымянный столбец безымянной таблицы, имеющей одну строку.

Назовем столбец, изменив скрипт следующим образом:

  - Показать значение 1 для столбца Номер безымянной таблицы (набор)
ВЫБЕРИТЕ 1 КАК Число

Запустите сценарий, чтобы на этот раз увидеть следующий набор результатов:

Поскольку этот запрос всегда возвращает одно и то же значение (число), которое мы вводим (предоставляем), обсуждать особо нечего, кроме понимания того, почему мышление, основанное на множествах, жизненно важно для понимания того, как работают запросы.

Расчет

в выписке Select

Давайте воспользуемся приведенным выше случаем для быстрых вычислений в SQL — мы превратим единичное значение в выражение.

Например, мы хотим быстро сложить два числа 1000 и 200. Мы можем просто написать следующий запрос без упоминания какой-либо таблицы, используя только оператор SELECT:

  - Сложение двух чисел 1000 и 200
ВЫБЕРИТЕ 1000 + 200 КАК [Сумма 1000 и 200]

Результат ниже:

Точно так же мы можем складывать, умножать, делить и вычитать числа.

Полезно добавить два столбца в таблицу, содержащую числовые значения. Однако мы также можем использовать этот подход для добавления двух переменных.Использование переменных полезно, поскольку мы можем сложить любые два числа, инициализировав эти переменные желаемыми значениями. Это иллюстрируется следующим сценарием:

  - SQL-скрипт для сложения любых двух чисел
ОБЪЯВИТЬ @X INT, @Y INT, @Addition INT

SET @ X = 550 - Инициализировать переменную X значением (числом)
SET @ Y = 350 - Инициализировать переменную Y значением (числом)
 
НАБОР @ Сложение = @ X + @ Y - СУММА X и Y

ВЫБЕРИТЕ @X как FirstNumber_X, @ Y как SecondNumber_Y, @ Addition как SumOfNumbers

Запуск сценария показывает нам следующий результат:

Мы можем сохранить этот запрос, чтобы повторно использовать его в любое время для сложения любых двух чисел (изменяя значения @X и @Y).Если мы думаем об этом с точки зрения набора, мы можем сказать, что выходные данные возвращаются как безымянная таблица (набор) с одной строкой и следующими тремя столбцами:

FirstNumber_X
SecondNumber_Y
SumOfNumbers

Однако вы можете сделать больше с помощью SELECT с пустой базой данных (без таблиц).

Еще один пример расчета данных

Здесь мы собираемся использовать функцию GETDATE (), чтобы получить текущую дату и ожидаемую дату доставки неизвестного заказа, который еще не является частью нашей таблицы.

Предположим, у нас еще нет таблицы заказов, но мы хотим быстро рассчитать ожидаемую дату доставки заказа продукта. Если мы добавим какое-либо число к функции GETDATE (), она сообщит нам добавленную дату с указанным числом дней.

Другими словами, если мы ожидаем, что дата доставки заказа будет через два дня после размещения заказа, мы можем рассчитать ее, используя SELECT с GETDATE () + 2.

Чтобы увидеть это в действии, запустите следующий сценарий SQL:

  - Расчет даты заказа и ожидаемой даты доставки
ВЫБЕРИТЕ GETDATE () как [Дата заказа], GETDATE () + 2 как [Ожидаемая дата доставки]

Набор результатов выглядит следующим образом:

На этот раз мы могли рассчитать ожидаемую дату доставки заказа напрямую, используя оператор SELECT с функцией GETDATE () при отсутствии какой-либо таблицы.

Однако, если бы у нас была таблица, мы бы получили ожидаемую дату доставки для всех заказов в этой таблице.

Еще раз, если мы проанализируем этот вывод с точки зрения логики набора, у нас будет одна безымянная таблица (набор) с двумя столбцами и одной строкой. SQL — это язык, основанный на наборах, который очень быстро работает с наборами, такими как таблицы. Если таблиц нет, он обрабатывает входные значения (подлежащие обработке) как безымянные наборы.

Короче говоря, SQL-запрос требует оператора SELECT, за которым следует выражение для выполнения некоторых числовых или датированных вычислений даже в отношении пустой базы данных (без таблиц).

Поздравляем! Вы изучили основы SQL-запросов и с помощью оператора SELECT написали несколько простых запросов к образцу базы данных.

Оставайтесь на связи, ведь написание простых SQL-запросов к таблицам базы данных еще впереди.

Что нужно узнать, как лучше писать SQL-запросы

Теперь, когда вы можете написать несколько базовых запросов SQL, попробуйте выполнить следующие упражнения:

Создайте образец базы данных BookSimple2.
Создайте запрос для умножения любых двух чисел, определив их как переменные.
Напишите запрос для создания даты заказа как текущей даты, даты отгрузки через два дня после даты заказа и ожидаемой даты доставки через два дня после даты отгрузки.

Глубокий интерес Харуна к логике и рассуждениям в раннем возрасте его академической карьеры проложил ему путь к тому, чтобы стать профессионалом в области данных.

Он начал свою профессиональную жизнь в качестве компьютерного программиста более 10 лет назад, работая над своим первым предприятием данных по миграции и переписыванию экзаменационной системы, управляемой базами данных государственного сектора, с IBM AS400 (DB2) на SQL Server 2000 с использованием VB 6.0 и Classic ASP наряду с разработкой отчетов и архивированием данных за многие годы.

Его работа и интересы связаны с архитектурами, ориентированными на базы данных, а его опыт включает проектирование, разработку, тестирование, внедрение и миграцию баз данных и отчетов, а также управление жизненным циклом баз данных (DLM).

Последние сообщения Харуна Ашрафа (посмотреть все)

Написание подзапросов в SQL | Advanced SQL

Начиная с этого места? Этот урок является частью полного руководства по использованию SQL для анализа данных.Проверьте начало.

В этом уроке мы рассмотрим:

В этом уроке вы продолжите работу с теми же данными о преступности Сан-Франциско, которые использовались в предыдущем уроке.

Основные сведения о подзапросах

Подзапросы (также известные как внутренние запросы или вложенные запросы) — это инструмент для выполнения операций в несколько этапов. Например, если вы хотите получить суммы из нескольких столбцов, а затем усреднить все эти значения, вам нужно будет выполнить каждую агрегацию на отдельном шаге.

Подзапросы

можно использовать в нескольких местах в запросе, но проще всего начать с оператора FROM . Вот пример базового подзапроса:

  ВЫБРАТЬ под. *
  ИЗ (
        ВЫБРАТЬ *
          ИЗ tutorial.sf_crime_incidents_2014_01
         ГДЕ day_of_week = 'Пятница'
       ) sub
 ГДЕ sub.resolution = 'НЕТ'

Давайте разберемся, что происходит, когда вы запускаете вышеуказанный запрос:

Сначала база данных выполняет «внутренний запрос» — часть в скобках:

  ВЫБРАТЬ *
  ИЗ учебника.sf_crime_incidents_2014_01
 ГДЕ day_of_week = 'Пятница'

Если бы вы запускали это самостоятельно, он бы выдал набор результатов, как и любой другой запрос. Это может показаться очевидным, но это важно: ваш внутренний запрос должен фактически выполняться сам по себе, поскольку база данных будет рассматривать его как независимый запрос. После выполнения внутреннего запроса внешний запрос будет запускаться с использованием результатов внутреннего запроса в качестве базовой таблицы :

  ВЫБРАТЬ под. *
  ИЗ (
       << результаты внутреннего запроса здесь >>
       ) sub
 ГДЕ под.разрешение = 'НЕТ'

Подзапросы должны иметь имена, которые добавляются после круглых скобок так же, как вы добавляете псевдоним к обычной таблице. В данном случае мы использовали название «подпрограмма».

Небольшое примечание о форматировании: при использовании подзапросов важно помнить, что читатель должен каким-то образом легко определить, какие части запроса будут выполняться вместе. Большинство людей делают это, используя какой-либо отступ в подзапросе. Примеры в этом руководстве имеют довольно большой отступ — вплоть до круглых скобок.Это непрактично, если вы вкладываете много подзапросов, поэтому довольно часто отступ только в два пробела или около того.

Практическая задача

Напишите запрос, который выбирает все ордера на арест из набора данных tutorial.sf_crime_incidents_2014_01 , а затем оберните его во внешний запрос, который отображает только неразрешенные инциденты.

Попробуй это Посмотреть ответ

Приведенные выше примеры, а также практическая проблема на самом деле не требуют подзапросов — они решают проблемы, которые также могут быть решены путем добавления нескольких условий в предложение WHERE .В следующих разделах приведены примеры того, какие подзапросы являются лучшим или единственным способом решения соответствующих проблем.

Использование подзапросов для агрегирования в несколько этапов

Что, если вы хотите выяснить, сколько инцидентов регистрируется каждый день недели? Еще лучше, что, если бы вы хотели знать, сколько инцидентов происходит в среднем в пятницу в декабре? В январе? Этот процесс состоит из двух этапов: подсчет количества инцидентов каждый день (внутренний запрос), затем определение среднемесячного значения (внешний запрос):

  ВЫБРАТЬ ВЛЕВО (под.дата, 2) КАК cleaned_month,
       sub.day_of_week,
       AVG (суб.инциденты) AS average_incidents
  ИЗ (
        ВЫБЕРИТЕ день_недели,
               Дата,
               COUNT (incidnt_num) инцидентов AS
          ИЗ tutorial.sf_crime_incidents_2014_01
         ГРУППА ПО 1,2
       ) sub
 ГРУППА ПО 1,2
 ЗАКАЗАТЬ ПО 1,2

Если у вас возникли проблемы с выяснением того, что происходит, попробуйте выполнить внутренний запрос индивидуально, чтобы получить представление о том, как выглядят его результаты. В общем, проще всего сначала написать внутренние запросы и пересматривать их до тех пор, пока результаты не станут для вас понятными, а затем перейти к внешнему запросу.

Практическая задача

Напишите запрос, который отображает среднее количество инцидентов в месяц для каждой категории. Подсказка: используйте tutorial.sf_crime_incidents_cleandate , чтобы немного облегчить себе жизнь.

Попробуй это Посмотреть ответ

Подзапросы в условной логике

Вы можете использовать подзапросы в условной логике (вместе с WHERE , JOIN / ON или CASE ).Следующий запрос возвращает все записи с самой ранней даты в наборе данных (теоретически — плохое форматирование столбца даты фактически заставляет его возвращать значение, которое сортируется первым по алфавиту):

  ВЫБРАТЬ *
  ИЗ tutorial.sf_crime_incidents_2014_01
 ГДЕ Дата = (ВЫБЕРИТЕ МИН (дата)
                 ИЗ tutorial.sf_crime_incidents_2014_01
              )

Вышеупомянутый запрос работает, потому что результатом подзапроса является только одна ячейка. Большая часть условной логики будет работать с подзапросами, содержащими результаты в одну ячейку.Однако IN — единственный тип условной логики, которая будет работать, когда внутренний запрос содержит несколько результатов:

  ВЫБРАТЬ *
  ИЗ tutorial.sf_crime_incidents_2014_01
 ГДЕ ДАТА В (ВЫБЕРИТЕ дату
                 ИЗ tutorial.sf_crime_incidents_2014_01
                ЗАКАЗАТЬ ПО дате
                ПРЕДЕЛ 5
              )

Обратите внимание, что вы не должны включать псевдоним при написании подзапроса в условном операторе. Это связано с тем, что подзапрос обрабатывается как отдельное значение (или набор значений в случае IN ), а не как таблица.

Присоединение к подзапросам

Возможно, вы помните, что вы можете фильтровать запросы в соединениях. Довольно часто присоединяются к подзапросу, который попадает в ту же таблицу, что и внешний запрос, вместо фильтрации в предложении WHERE . Следующий запрос дает те же результаты, что и в предыдущем примере:

  ВЫБРАТЬ *
  ИЗ инцидентов из tutorial.sf_crime_incidents_2014_01
  ПРИСОЕДИНЯЙТЕСЬ (ВЫБЕРИТЕ дату
           ИЗ tutorial.sf_crime_incidents_2014_01
          ЗАКАЗАТЬ ПО дате
          ПРЕДЕЛ 5
       ) sub
    ПО инцидентам.date = sub.date

Это может быть особенно полезно в сочетании с агрегированием. Когда вы присоединяетесь, требования к выходным данным вашего подзапроса не такие строгие, как при использовании предложения WHERE . Например, ваш внутренний запрос может выдать несколько результатов. В следующем запросе все результаты ранжируются по количеству инцидентов, зарегистрированных в определенный день. Это достигается путем агрегирования общего количества инцидентов каждый день во внутреннем запросе, а затем использования этих значений для сортировки внешнего запроса:

  ВЫБРАТЬ инциденты.*,
       sub.incidents AS incidents_that_day
  ИЗ инцидентов из tutorial.sf_crime_incidents_2014_01
  ПРИСОЕДИНЯЙТЕСЬ (ВЫБЕРИТЕ дату,
          COUNT (incidnt_num) инцидентов AS
           ИЗ tutorial.sf_crime_incidents_2014_01
          ГРУППА ПО 1
       ) sub
    ON инциденты.date = sub.date
 ORDER BY sub.incidents DESC, time

Практическая задача

Напишите запрос, который отображает все строки из трех категорий с наименьшим количеством зарегистрированных инцидентов.

Попробуй это Посмотреть ответ Подзапросы

могут быть очень полезны для повышения производительности ваших запросов. Давайте вкратце вернемся к данным Crunchbase. Представьте, что вы хотите объединить все компании, получающие инвестиции, и компании, приобретенные каждый месяц. Вы можете сделать это без подзапросов, если хотите, но на самом деле не запускает это, так как для возврата :

потребуется несколько минут.

  ВЫБРАТЬ COALESCE (acquisitions.acquired_month, investments.funded_month) AS месяц,
       COUNT (DISTINCT acquisitions.company_permalink) AS companies_acquired,
       COUNT (DISTINCT investments.company_permalink) AS инвестиций
  ИЗ приобретений tutorial.crunchbase_acquisitions
  ПОЛНОЕ СОЕДИНЕНИЕ tutorial.crunchbase_investments инвестиции
    ON acquisitions.acquired_month = investments.funded_month
 ГРУППА ПО 1

Обратите внимание, что для того, чтобы сделать это правильно, вы должны объединить поля даты, что вызовет массовый «взрыв данных». По сути, происходит то, что вы присоединяете каждую строку в заданном месяце из одной таблицы к каждому месяцу в заданной строке в другой таблице, поэтому количество возвращаемых строк невероятно велико.Из-за этого мультипликативного эффекта вы должны использовать COUNT (DISTINCT) вместо COUNT , чтобы получить точные подсчеты. Вы можете увидеть это ниже:

Следующий запрос показывает 7414 строк:

  ВЫБРАТЬ СЧЕТЧИК (*) ИЗ tutorial.crunchbase_acquisitions

Следующий запрос показывает 83893 строки:

  ВЫБРАТЬ СЧЕТЧИК (*) ИЗ tutorial.crunchbase_investments

Следующий запрос показывает 6 237 396 строк:

  ВЫБРАТЬ СЧЕТЧИК (*)
      ИЗ учебника.crunchbase_acquisitions приобретения
      ПОЛНОЕ СОЕДИНЕНИЕ tutorial.crunchbase_investments инвестиции
        ON acquisitions.acquired_month = investments.funded_month

Если вы хотите понять это немного лучше, вы можете провести дополнительное исследование декартовых произведений. Также стоит отметить, что приведенные выше FULL JOIN и COUNT на самом деле работают довольно быстро — это COUNT (DISTINCT) , которое занимает вечность. Подробнее об этом читайте в уроке по оптимизации запросов.

Конечно, вы могли бы решить эту проблему гораздо эффективнее, агрегируя две таблицы по отдельности, а затем объединив их вместе, чтобы подсчеты выполнялись для гораздо меньших наборов данных:

  SELECT COALESCE (acquisitions.month, investments.month) AS month,
       acquisitions.companies_acquired,
       investments.companies_rec_investment
  ИЗ (
        ВЫБРАТЬ приобретенный_месяц КАК месяц,
               COUNT (DISTINCT company_permalink) AS companies_acquired
          ИЗ учебника.crunchbase_acquisitions
         ГРУППА ПО 1
       ) приобретения

  ПОЛНОЕ СОЕДИНЕНИЕ (
        ВЫБЕРИТЕ funded_month AS месяц,
               COUNT (DISTINCT company_permalink) AS companies_rec_investment
          ИЗ tutorial.crunchbase_investments
         ГРУППА ПО 1
       )инвестиции

    ON acquisitions.month = investments.month
 ЗАКАЗАТЬ ПО 1 DESC

Примечание. Мы использовали приведенное выше значение FULL JOIN на тот случай, если в одной таблице были наблюдения за месяц, а в другой — нет. Мы также использовали COALESCE для отображения месяцев, когда в подзапросе приобретений не было записей о месяцах (предположительно, в эти месяцы не было никаких сборов).Мы настоятельно рекомендуем вам повторно запустить запрос без некоторых из этих элементов, чтобы лучше понять, как они работают. Вы также можете запускать каждый из подзапросов независимо, чтобы лучше понять их.

Практическая задача

Напишите запрос, который подсчитывает количество основанных и приобретенных компаний по кварталам, начиная с первого квартала 2012 года. Создайте агрегаты в двух отдельных запросах, а затем присоедините их.

Попробуй это Посмотреть ответ

Подзапросы и СОЮЗЫ

Для этого следующего раздела мы будем заимствовать непосредственно из урока по UNION — снова используя данные Crunchbase:

  ВЫБРАТЬ *
  ИЗ учебника.crunchbase_investments_part1

 СОЮЗ ВСЕ

 ВЫБРАТЬ *
   ИЗ tutorial.crunchbase_investments_part2

Определенно не редкость, когда набор данных разбивается на несколько частей, особенно если данные проходят через Excel в любой момент (Excel может обрабатывать только ~ 1 млн строк на электронную таблицу). Две таблицы, использованные выше, можно рассматривать как разные части одного и того же набора данных — вам почти наверняка захочется выполнять операции со всем комбинированным набором данных, а не с отдельными частями.Вы можете сделать это с помощью подзапроса:

  ВЫБРАТЬ СЧЕТЧИК (*) КАК total_rows
  ИЗ (
        ВЫБРАТЬ *
          ИЗ tutorial.crunchbase_investments_part1

         СОЮЗ ВСЕ

        ВЫБРАТЬ *
          ИЗ tutorial.crunchbase_investments_part2
       ) sub

Это довольно просто. Попробуйте сами:

Практическая задача

Напишите запрос, который ранжирует инвесторов из приведенного выше комбинированного набора данных по общему количеству вложенных ими инвестиций.

Попробуй это Посмотреть ответ

Практическая задача

Напишите запрос, который выполняет то же действие, что и в предыдущей задаче, за исключением компаний, которые все еще работают. Подсказка: рабочий статус находится в tutorial.crunchbase_companies .

Попробуй это Посмотреть ответ

Написание SQL-запросов — Руководство пользователя Ignition 8.1

Первичный ключ

Первичный ключ — это способ однозначной идентификации каждой строки в таблице.Хотя можно создать таблицу базы данных без первичного ключа, настоятельно рекомендуется настроить его для каждой таблицы. Первичный ключ состоит либо из одного столбца, либо из набора столбцов. Когда в качестве первичного ключа указано несколько столбцов, это называется составным первичным ключом . Никакие две отдельные строки в таблице не могут иметь одинаковое значение (или комбинацию значений) в этих столбцах.

Хотя первичные ключи можно настроить несколькими способами, они обычно соответствуют следующим критериям:

Целочисленный тип данных : Тип данных ключевого столбца обычно является целым числом, а не varchar.Первичный ключ — это только идентификатор определенной строки в таблице, поэтому можно легко использовать целочисленный тип данных. Некоторые базы данных поддерживают UID или UUID (Universally Unique IDentifier), которые выглядят как символьная строка, но специально созданы для первичных ключей.
Автоматическое увеличение : значение первичного ключа увеличивается по мере добавления строк. Ключ обычно настраивается на автоматическое приращение в базе данных, так что внешним приложениям (таким как Ignition) не нужно вычислять следующее доступное значение при вставке новой строки.
Статически определено : Любая вставляемая строка должна заполнять эти значения без создания дубликатов. Настройка автоматического увеличения первичного ключа означает, что база данных будет автоматически обрабатывать этот критерий.
Ненулевое значение : ПУСТО (пустые) значения не должны присутствовать в первичном ключе. Этот столбец (или столбцы) обычно не допускает значений NULL.

Индекс

Индексы ускоряют процесс запроса, обеспечивая быстрый доступ к строкам в таблицах данных, аналогично тому, как индекс книги помогает вам быстро находить информацию в этой книге.Индексы чрезвычайно важны при запросе больших наборов данных. Вы должны создать индекс для набора столбцов, которые вы обычно используете в предложении WHERE . Например, вы должны добавить индекс в столбец временной метки исторической таблицы при запросе таблицы по начальной и конечной дате. Ignition делает это автоматически, когда создает таблицы для истории тегов или групп транзакций.

Внешний ключ

Внешний ключ — это ссылочное ограничение между двумя таблицами. Внешний ключ идентифицирует столбец или набор столбцов в одной (ссылающейся) таблице, которая ссылается на столбец или набор столбцов в другой (ссылочной) таблице.Столбцы в ссылочной таблице должны быть первичным ключом в ссылочной таблице. Например, у вас может быть список поставщиков со столбцом целочисленного идентификатора. Тогда в ваших счетах будет использоваться идентификатор поставщика вместо имени. Эти связанные таблицы могут сэкономить много места, потому что вам не нужно включать все о поставщике в каждый счет.

Пример

Поставщик ( SupplierNumber , Имя, Адрес, Тип)
Счета (InvoiceNumber, SupplierNumber , Text, Cost)

Null Value

NULL — это специальный маркер, используемый в SQL, чтобы указать, что значение данных не существует в базе данных.Таким образом становится ясно, что данных нет, вместо того, чтобы угадывать, является ли значение 0 правильным или данные просто отсутствуют. По определению NULL не равен ничему, даже другим значениям NULL. В каждой базе данных есть функция для определения значения NULL, обычно называемая isNULL () или что-то подобное.

Комментарии могут быть добавлены к любому SQL-запросу точно так же, как при написании сценария. Однострочные комментарии обозначаются двумя дефисами и пробелом: ‘-‘

 - это однострочный комментарий в запросе SQL.
ВЫБРАТЬ * ИЗ my_table

Вы также можете делать многострочные комментарии, заключая текст в косую черту и звездочку: / * текст * /

 / * Многострочный комментарий
может охватывать несколько строк.В
комментарий остановится, когда он будет закрыт
с другой звездочкой и косой чертой. * /

Пишите более быстрые и эффективные SQL-запросы

В этой статье объясняется, почему оптимизация так важна, поскольку мы исследуем некоторые из лучших способов быстрой оптимизации ваших SQL-запросов для минимального воздействия на производительность базы данных с помощью:

Эффективное индексирование,
Уточнение операторов SELECT и SELECT DISTINCT,
Стратегическое использование подстановочных знаков и условий, а также
Анализ стоимости запроса с использованием EXPLAIN

Введение в SQL-запросы и управление данными

Standard Query Language, или сокращенно SQL, позволяет пользователям получать доступ к базам данных с помощью определенных команд или запросов, позволяя им изменять и поддерживать их.Такие команды, как SELECT, которые помогают пользователям извлекать данные из базы данных, UPDATE, DELETE, INSERT INTO и многие другие, упрощают управление данными для администраторов баз данных.

Каждая из этих команд имеет собственный набор функций, которые полезны при работе с базами данных. Некоторые среды разработки SQL, такие как Arctype, предлагают разработчикам идеальную среду для визуализации, проектирования, моделирования и управления своими базами данных. Arctype — это бесплатный, удобный и интуитивно понятный редактор SQL, который упростит все ваши требования к управлению данными и визуализации.

Быстрый и простой в использовании SQL-клиент для разработчиков и команд

В следующих разделах мы кратко обсудим и определим факторы, которые влияют на производительность запроса, и способы улучшения каждого из них, чтобы получить тот же желаемый результат с гораздо более быстрыми запросами.

Три этапа SQL-запроса

От разработки глобальной схемы для нашей логической базы данных до назначения данных по компьютерной сети и создания схем, специфичных для локальной СУБД, жизненный цикл базы данных включает все этапы, необходимые для базы данных. творчество.Процесс не останавливается, потому что мониторинг, улучшение и обслуживание базы данных начинаются только после определения проекта. Критическое понимание этих этапов не только помогает нам принимать лучшие решения по оптимизации, но также помогает выявить проблемы с производительностью:

Аннотация : После выполнения запроса сервер SQL анализирует команду с помощью синтаксического анализатора, который анализирует данные и делит его на различные структуры данных. Этот запрос модифицируется, и результатом является дерево синтаксического анализа с текстами пояснений для всех введенных данных.
Оптимизация запросов : после анализа запроса SQL оптимизатор запросов позволяет серверу SQL возвращать выходные данные более эффективно. Цель состоит в том, чтобы максимально эффективно использовать системные ресурсы, одновременно снижая затраты (ЦП и время). Затем оптимизированный запрос отправляется на следующий этап:
Выполнение запроса : На этом этапе преобразованный план запроса доводится до его окончательной формы. После этого мы получаем результат.

Размер = Ресурсы: Теория времени выполнения SQL-запроса

Мы часто упускаем из виду тот факт, что базы данных, как и все компьютерное программное обеспечение, имеют аппаратные ограничения.Помимо конфигурации оборудования, на скорость обработки запросов SQL-сервера влияют и другие факторы. Эти факторы включают размер таблицы, способ объединения таблиц, количество одновременно выполняемых запросов, комбинации строк, а также программное обеспечение базы данных и саму оптимизацию.

Хотя некоторые из этих факторов, например, программное обеспечение базы данных, невозможно контролировать, большинство из них поддаются контролю. Ниже мы рассмотрим, какие из них находятся в пределах нашего контроля.

Как размер таблицы SQL влияет на производительность

Количество строк в запросе влияет на скорость его обработки.Другими словами, : чем больше количество строк, тем выше вероятность низкой производительности . Простое уменьшение размера таблицы путем удаления избыточных данных может легко решить эту проблему.

Мы можем начать серию анализов раздела данных, чтобы ускорить этот промежуточный шаг по удалению избыточности, но не до устранения каких-либо ограничений. Перед выполнением этого процесса вы реализуете его для всего набора данных. Кроме того, важно убедиться, что желаемые данные все еще находятся в окончательном запросе.

Однако ускорение промежуточной фазы приведет к замедлению качественной оценки, поэтому другой способ управления размером таблицы результатов запроса — принудительное выполнение предложения LIMIT с использованием режима. При построении и уточнении запроса нам не обязательно просматривать весь набор данных — все, что нам обычно требуется, это 100 строк образцов данных, на которых мы можем проверить логику, выходные данные и форматирование нашего запроса.

Хотя это может показаться небольшим набором данных, он вернет результат за значительно более короткое время.Компромисс? Хотя использование предложения LIMIT может значительно ускорить процесс, оно может не дать точного набора результатов. Таким образом, мы должны использовать его только для проверки логики нового запроса.

Корреляция между объединениями таблиц SQL и средой выполнения запроса

Время выполнения запроса SQL увеличивается каждый раз, когда выполняется объединение таблиц. Это связано с тем, что объединения увеличивают количество строк — и во многих случаях столбцов — в выходных данных. Чтобы исправить эту ситуацию, размер таблицы должен быть уменьшен (как предлагалось ранее) перед присоединением.

Работает ли LIMIT с агрегатными функциями SQL?

Агрегация — это комбинация двух или более строк. В отличие от простого извлечения строк из набора данных, объединение двух или более строк с последующим получением точного вывода требует большей вычислительной мощности и времени.

Хотя предложение LIMIT хорошо работает в ситуациях, когда уменьшение размера таблицы принципиально не меняет результаты запроса, оно неэффективно при агрегировании. Когда SQL-запрос выполняет агрегированные функции для набора данных, вывод ограничивается заранее определенным количеством строк.Если вы собираетесь объединить строки в одну, использование LIMIT 100 — например, — для минимизации времени выполнения не сработает.

Что такое оптимизация запросов SQL?

Оптимизация SQL-запросов — это простое написание запросов с использованием осознанного подхода. SQL — это декларативный язык запросов, что означает, что он прост в использовании и специально предназначен для сосредоточения внимания на данных, которые необходимо получить. Оптимизацией запросов часто пренебрегают на этапе разработки, потому что тестируемые данные малы. Однако последствия этого решения становятся очень заметными, когда проект запускается и база данных постоянно заполняется данными в реальном времени.В конце концов, все пути приводят к вопросу: есть ли лучший способ создавать запросы SQL, которые выполняются быстрее?

Стратегии оптимизации SQL-запросов

Для выполнения оптимизации мы должны правильно обрабатывать индексацию, избегать циклов и использовать функции SELECT и EXITS (), подзапросы, выбор строк и подстановочные знаки. Мы рассмотрим некоторые из этих приемов ниже:

Использование индексирования для увеличения времени извлечения данных

Индекс — это структура данных, которая улучшает скорость извлечения данных в таблице базы данных и представляет собой простой, но эффективный способ отшлифовать наши запросы.Правильная индексация обеспечивает более быстрый доступ к базе данных, а в хорошо проиндексированной базе данных будет более быстрое время поиска, гарантируя, что ваше приложение сможет быстрее находить конкретные данные, необходимые в базе данных.

Выше приведен простой контрольный список, помогающий эффективно структурировать запросы. Поскольку для всех таблиц требуется первичный ключ, обеспечение того, чтобы наш первичный ключ имел индекс, помогает извлекать данные. Это, в свою очередь, гарантирует, что все таблицы имеют в себе кластерный индекс. Таким образом, любая операция извлечения из таблицы с использованием первичного ключа будет быстрой.Однако регулярное использование INSERT и UPDATE для поддержки нашего индекса логически ведет к снижению производительности.

Редактор SQL для совместной работы

Что лучше: ВЫБРАТЬ столбец или ВЫБРАТЬ *?

Мы часто используем SELECT * при выполнении исследовательских запросов. Вы можете существенно улучшить производительность, просто указав необходимый столбец вместо использования * для возврата всех и передачи гигабайт данных по сети. Вот пример:

  SELECT * FROM Games

Взгляд на планы выполнения показывает:
Стоимость запроса равна 1655.02 и Execution Time: 0: 00: 0.00377150

Однако проблема с вышеизложенным состоит в том, что вы обрабатываете больше данных, чем действительно необходимо. Звучит просто, но эту ошибку часто совершают даже самые опытные разработчики. Более эффективный метод — просто выбрать столбцы, которые нас действительно интересуют:

  SELECT Name, Year, Genre FROM Games

При взгляде на планы выполнения отображается:
Стоимость запроса как 1655.02 и время выполнения: 0 : 00: 0.00011700

Почему следует избегать SELECT DISTINCT

Мы обычно используем предложение SQL DISTINCT всякий раз, когда нам нужны уникальные записи из нашего запроса. Допустим, мы объединили две таблицы и в результате получили повторяющиеся строки. Оператор DISTINCT, который фильтрует повторяющуюся строку, обеспечивает простой обходной путь.

Теперь сравним планы выполнения некоторых простых операторов SELECT. Обратите внимание, что оператор DISTINCT — единственное различие между запросами:

  SELECT Year FROM Games

Взгляд на планы выполнения показывает:
Стоимость запроса равна 1655.02 и время выполнения: 0: 00: 0,00131060

Однако DISTINCT представит:

  ВЫБРАТЬ ОТЛИЧНЫЙ год ИЗ игр

При взгляде на планы выполнения отображается:
Стоимость запроса как 1655.02 и время выполнения: 0 : 00: 0.01145430

Эффективное использование подстановочных знаков SQL

Рассмотрим сценарий, в котором вам нужно найти имя или состояние. Подстановочные знаки могут помочь вам в этом, однако, как бы привлекательно это ни выглядело, это расточительно, поскольку резко снижает производительность запросов.

Когда мы используем подстановочные знаки в начале запроса, оптимизатор запросов может не использовать подходящий индекс. Таким образом, по возможности лучше избегать использования подстановочного знака в строках поиска, поскольку он заставляет ваш SQL-запрос выполнять сканирование всей таблицы. Когда набор данных огромен, требуются дополнительные системные ресурсы, такие как ввод-вывод, ЦП и память.

Чтобы лучше оптимизировать ваш запрос, подстановочный знак постфикса может быть более эффективным:

  SELECT
Имя
ИЗ
Игры
КУДА
Имя LIKE '% Wii%'

Взгляд на планы выполнения показывает:
Стоимость запроса как 1655.02 и время выполнения: 0: 00: 0.02328750

Однако, когда мы правильно используем подстановочные знаки (например):

  SELECT
Имя
ИЗ
Игры
КУДА
Имя LIKE 'Wii%'

Если взглянуть на планы выполнения, можно увидеть:
Стоимость запроса равна 1655,02 и время выполнения: 0: 00: 0,01539200

Такое улучшение замечательно, особенно в наборе данных всего с 15975 строками. Теперь подумайте, насколько это может изменить при запросе больших данных.

Оптимизация условных операторов SQL

Проще говоря, при фильтрации запроса на основе условия операторы WHERE более эффективны.

С другой стороны, HAVING следует использовать при фильтрации агрегированного поля.

Почему следует использовать EXISTS () вместо COUNT ()

При попытке сканирования таблицы использование EXISTS () более эффективно, чем COUNT (). В то время как последний просматривает таблицу и подсчитывает все записи, соответствующие нашему условию, EXISTS () завершает работу после выполнения критериев.

Помимо упомянутых практик, есть еще несколько советов, например, отказ от использования функций с правой стороны оператора, которые могут помочь улучшить производительность и удовлетворить потребности вашего бизнеса.

Анализируйте запросы SQL с помощью EXPLAIN

План выполнения — это последовательность операций, которые база данных выполняет для выполнения оператора SQL. Как мы уже объясняли, желаемый тип данных, индексы и другие факторы влияют на производительность SQL-запросов. Лучший способ отслеживать, что происходит с запросом, — это смотреть на план выполнения (не выполняя его).

Вы можете начать свой запрос с EXPLAIN, чтобы увидеть стратегию выполнения, которая позволит вам поэкспериментировать и определить оптимальное решение для ваших операторов.

Он отображает стоимость (чем больше число, тем больше время выполнения), и его следует использовать в качестве ориентировочного, а не абсолютного измерения. Чтобы быть точным, вы можете изменить свой запрос, а затем запустить EXPLAIN, чтобы узнать, выросла или уменьшилась стоимость:

  EXPLAIN
ВЫБРАТЬ
*
ИЗ
Игры

План запроса:
Стоимость запроса как 1655,02, строк: 15975 и время выполнения: 0: 00: 0,00039610

Сам по себе EXPLAIN не предоставляет подробную информацию о наших выходных данных, так как наш оператор не выполняется.Нам нужно будет использовать ключевое слово ANALYZE, которое запускает запрос, чтобы получить более подробный результат:

  EXPLAIN ANALYZE
ВЫБРАТЬ
*
ИЗ
Игры

План запроса:
Сканирование таблицы в играх (стоимость = 1655,03 строк = 15975) (фактическое время = 0,059..12,778 строк = 15972 цикла = 1) \ n ‘

Почему важна оптимизация SQL-запросов?

Целью оптимизации запросов является минимизация времени ответа на наши запросы за счет выбора наилучшей стратегии выполнения при ограниченных ресурсах.Вы можете добиться этого, принимая осознанные, осторожные и хорошо продуманные проектные решения во время цикла разработки базы данных. Так почему это так важно? Прежде всего, более быстрая и эффективная обработка запросов. Система сможет обслуживать больше запросов за то же время, поскольку каждый оптимизированный запрос будет использовать меньше времени по сравнению с неоптимизированным запросом. Это помогает при попытке предотвратить задержку, сохраняя при этом хорошее взаимодействие с пользователем для вашего приложения. Хорошие методы оптимизации также замедляют износ вашего оборудования и позволяют вашему серверу работать более эффективно (с меньшим использованием памяти).В конечном итоге все это обеспечивает высокий уровень производительности и оптимизированную систему.

Оптимизация запросов — это задача, которой нельзя пренебрегать: она помогает точно настроить общую производительность системы баз данных. Даже при наличии надежной инфраструктуры неэффективные запросы могут истощить ресурсы производственной базы данных, что приведет к задержкам и снижению производительности. Поэтому первым и наиболее важным шагом является выявление и соблюдение передовых методов и стратегий для улучшения жизненной силы любого проекта с интенсивным использованием данных — запросов к базе данных.

ПРИСОЕДИНЯЙТЕСЬ к информационному бюллетеню Arctype

Истории программирования, учебные пособия и советы по базам данных каждые 2 недели

Access SQL: основные понятия, словарь и синтаксис

Если вы хотите получить данные из базы данных, вы запрашиваете данные с помощью языка структурированных запросов или SQL. SQL — это компьютерный язык, который очень похож на английский, но его понимают программы баз данных. Каждый запрос, который вы выполняете, использует SQL за кулисами.

Понимание того, как работает SQL, может помочь вам создавать более качественные запросы и упростить понимание того, как исправить запрос, который не возвращает желаемых результатов.

Это одна из серии статей о Access SQL. В этой статье описывается базовое использование SQL для выбора данных и используются примеры для иллюстрации синтаксиса SQL.

В этой статье

Что такое SQL?

SQL — это компьютерный язык для работы с наборами фактов и связями между ними. Программы реляционных баз данных, такие как Microsoft Office Access, используют SQL для работы с данными. В отличие от многих компьютерных языков, SQL нетрудно читать и понимать даже новичку.Как и многие компьютерные языки, SQL — это международный стандарт, признанный такими организациями по стандартизации, как ISO и ANSI.

Вы используете SQL для описания наборов данных, которые могут помочь вам ответить на вопросы. При использовании SQL необходимо использовать правильный синтаксис. Синтаксис — это набор правил, по которым элементы языка правильно сочетаются. Синтаксис SQL основан на английском синтаксисе и использует многие из тех же элементов, что и синтаксис Visual Basic для приложений (VBA).

Например, простой оператор SQL, который извлекает список фамилий для контактов, имя которых Мэри, может выглядеть следующим образом:

 ВЫБРАТЬ Фамилию 
 ИЗ контактов 
 ГДЕ Имя = 'Мэри';

Примечание. SQL используется не только для управления данными, но также для создания и изменения структуры объектов базы данных, таких как таблицы.Часть SQL, которая используется для создания и изменения объектов базы данных, называется языком определения данных (DDL). В этом разделе не рассматривается DDL. Дополнительные сведения см. В статье Создание или изменение таблиц или индексов с помощью запроса определения данных.

Операторы SELECT

Чтобы описать набор данных с помощью SQL, вы пишете оператор SELECT. Оператор SELECT содержит полное описание набора данных, которые вы хотите получить из базы данных.Это включает следующее:

Какие таблицы содержат данные.
Как связаны данные из разных источников.
Какие поля или вычисления будут производить данные.
Критерии, которым должны соответствовать данные для включения.
Следует ли и как сортировать результаты.

Пункты SQL

Как и предложение, в операторе SQL есть предложения. Каждое предложение выполняет функцию для оператора SQL. Некоторые предложения требуются в инструкции SELECT. В следующей таблице перечислены наиболее распространенные предложения SQL.

Предложение SQL	Что он делает	Требуется
ВЫБРАТЬ	Перечисляет поля, содержащие интересующие данные.	Есть
ИЗ	Перечисляет таблицы, содержащие поля, перечисленные в предложении SELECT.	Есть
ГДЕ	Задает критерии поля, которым должна соответствовать каждая запись, чтобы включить ее в результаты.	Нет
ЗАКАЗАТЬ ПО	Указывает, как сортировать результаты.	Нет
ГРУППА ПО	В операторе SQL, содержащем агрегатные функции, перечисляются поля, которые не суммированы в предложении SELECT.	Только если есть такие поля
ИМЕЕТ	В операторе SQL, содержащем агрегатные функции, определяет условия, которые применяются к полям, которые суммированы в операторе SELECT.	Нет

Термины SQL

Каждое предложение SQL состоит из терминов, сопоставимых с частями речи.В следующей таблице перечислены типы терминов SQL.

Условие SQL	Сопоставимая часть речи	Определение	Пример
идентификатор	существительное	Имя, которое вы используете для идентификации объекта базы данных, например имя поля.	Клиенты. [Телефон]
оператор	глагол или наречие	Ключевое слово, представляющее действие или изменяющее действие.	как
постоянная	существительное	Неизменяемое значение, например число или NULL.	42
выражение	прилагательное	Комбинация идентификаторов, операторов, констант и функций, вычисляющая одно значение.	> = Товары.[Цена за единицу]

Верх страницы

Базовые предложения SQL: SELECT, FROM и WHERE

Оператор SQL имеет общую форму:

 ВЫБРАТЬ поле_1 
 ИЗ таблицы_1 
 ГДЕ критерий_1 
;

Примечания:

Access игнорирует разрывы строк в операторе SQL.Однако рассмотрите возможность использования строки для каждого предложения, чтобы улучшить читаемость ваших операторов SQL для себя и других.
Каждый оператор SELECT заканчивается точкой с запятой (;). Точка с запятой может стоять в конце последнего предложения или в отдельной строке в конце оператора SQL.

Пример в Access

Ниже показано, как может выглядеть инструкция SQL для простого запроса выбора в Access:

1.Предложение SELECT

2. ИЗ пункта

3. ГДЕ пункт

Этот пример SQL-оператора гласит: «Выберите данные, которые хранятся в полях с именем E-mail Address и Company из таблицы с именем Contacts, особенно те записи, в которых значение поля City равно Seattle».

Давайте рассмотрим пример, по одному предложению за раз, чтобы увидеть, как работает синтаксис SQL.

Предложение SELECT

ВЫБЕРИТЕ [адрес электронной почты], компания

Это предложение SELECT.Он состоит из оператора (SELECT), за которым следуют два идентификатора ([Адрес электронной почты] и Компания).

Если идентификатор содержит пробелы или специальные символы (например, «Адрес электронной почты»), он должен быть заключен в квадратные скобки.

Предложение SELECT не должно указывать, какие таблицы содержат поля, и не может указывать какие-либо условия, которым должны удовлетворять включаемые данные.

Предложение SELECT всегда появляется перед предложением FROM в операторе SELECT.

Предложение FROM

ОТ КОНТАКТЫ

Это предложение FROM. Он состоит из оператора (FROM), за которым следует идентификатор (Контакты).

В предложении FROM не перечислены поля, которые нужно выбрать.

Предложение WHERE

ГДЕ Город = «Сиэтл»

Это предложение WHERE. Он состоит из оператора (WHERE), за которым следует выражение (City = «Seattle»).

Примечание: В отличие от предложений SELECT и FROM, предложение WHERE не является обязательным элементом оператора SELECT.

Многие действия, которые позволяет выполнять SQL, можно выполнять с помощью предложений SELECT, FROM и WHERE. Более подробная информация о том, как вы используете эти пункты, представлена в этих дополнительных статьях:

Верх страницы

Сортировка результатов: ЗАКАЗАТЬ ПО

Как и Microsoft Excel, Access позволяет сортировать результаты запроса в таблице.Вы также можете указать в запросе, как вы хотите сортировать результаты при выполнении запроса, используя предложение ORDER BY. Если вы используете предложение ORDER BY, это последнее предложение в операторе SQL.

Предложение ORDER BY содержит список полей, которые вы хотите использовать для сортировки, в том же порядке, в котором вы хотите применять операции сортировки.

Например, предположим, что вы хотите, чтобы ваши результаты сначала были отсортированы по значению поля Компания в порядке убывания, а затем — если есть записи с таким же значением для Компании — отсортированы по значениям в поле Адрес электронной почты в возрастающем порядке. порядок.Предложение ORDER BY будет выглядеть следующим образом:

ЗАКАЗАТЬ ПО компании DESC, [адрес электронной почты]

Примечание. По умолчанию Access сортирует значения в порядке возрастания (A – Z, от наименьшего к наибольшему). Вместо этого используйте ключевое слово DESC для сортировки значений в порядке убывания.

Дополнительные сведения о предложении ORDER BY см. В разделе Предложение ORDER BY.

Верх страницы

Работа с обобщенными данными: GROUP BY и HAVING

Иногда требуется работать со сводными данными, такими как общий объем продаж за месяц или самые дорогие товары в инвентаре.Для этого вы применяете агрегатную функцию к полю в предложении SELECT. Например, если вы хотите, чтобы в вашем запросе отображалось количество адресов электронной почты, перечисленных для каждой компании, ваше предложение SELECT может выглядеть следующим образом:

ВЫБЕРИТЕ СЧЕТЧИК ([Адрес электронной почты]), Компания

Агрегатные функции, которые вы можете использовать, зависят от типа данных, содержащихся в поле или выражении, которое вы хотите использовать. Дополнительные сведения о доступных агрегатных функциях см. В статье Агрегатные функции SQL.

Указание полей, которые не используются в агрегатной функции: предложение GROUP BY

При использовании агрегатных функций обычно необходимо также создать предложение GROUP BY. В предложении GROUP BY перечислены все поля, к которым вы не применяете агрегатную функцию. Если вы применяете агрегатные функции ко всем полям в запросе, вам не нужно создавать предложение GROUP BY.

Предложение GROUP BY следует сразу за предложением WHERE или предложением FROM, если предложение WHERE отсутствует.В предложении GROUP BY перечислены поля в том виде, в котором они указаны в предложении SELECT.

Например, продолжая предыдущий пример, если ваше предложение SELECT применяет агрегатную функцию к [E-mail Address], но не к Company, ваше предложение GROUP BY будет выглядеть следующим образом:

ГРУППА ПО КОМПАНИИ

Дополнительные сведения о предложении GROUP BY см. В разделе Предложение GROUP BY.

Ограничение совокупных значений с помощью групповых критериев: предложение HAVING

Если вы хотите использовать критерии для ограничения результатов, но поле, к которому вы хотите применить критерии, используется в агрегатной функции, вы не можете использовать предложение WHERE.Вместо этого вы используете предложение HAVING. Предложение HAVING работает как предложение WHERE, но используется для агрегированных данных.

Например, предположим, что вы используете функцию AVG (которая вычисляет среднее значение) с первым полем в предложении SELECT:

ВЫБЕРИТЕ СЧЕТЧИК ([Адрес электронной почты]), Компания

Если вы хотите, чтобы запрос ограничивал результаты на основе значения этой функции COUNT, вы не можете использовать критерий для этого поля в предложении WHERE.Вместо этого вы помещаете критерии в предложение HAVING. Например, если вы хотите, чтобы запрос возвращал строки только в том случае, если с компанией связано несколько адресов электронной почты, предложение HAVING может выглядеть следующим образом:

HAVING COUNT ([E-mail Address])> 1

Примечание: Запрос может иметь предложение WHERE и предложение HAVING — критерии для полей, которые не используются в агрегатной функции, указываются в предложении WHERE, а критерии для полей, которые используются с агрегатными функциями, входят в предложение HAVING.

Дополнительные сведения о предложении HAVING см. В разделе Предложение HAVING.

Верх страницы

Объединение результатов запроса: UNION

Если вы хотите просмотреть все данные, возвращаемые несколькими похожими запросами на выборку вместе, как объединенный набор, вы используете оператор UNION.

Оператор UNION позволяет объединить два оператора SELECT в один. Комбинируемые операторы SELECT должны иметь одинаковое количество выходных полей в одном порядке и с одинаковыми или совместимыми типами данных.Когда вы запускаете запрос, данные из каждого набора соответствующих полей объединяются в одно выходное поле, так что выходные данные запроса имеют такое же количество полей, что и каждый из операторов выбора.

Примечание: Для целей запроса на объединение типы данных Number и Text совместимы.

При использовании оператора UNION вы также можете указать, должны ли результаты запроса включать повторяющиеся строки, если таковые существуют, с помощью ключевого слова ALL.

Базовый синтаксис SQL для запроса на объединение, который объединяет два оператора SELECT, выглядит следующим образом:

 SELECT field_1 
 FROM table_1 
 UNION [ALL] 
 SELECT field_a 
 FROM table_a 
;

Например, предположим, что у вас есть таблица с именем Products и другая таблица с именем Services. В обеих таблицах есть поля, которые содержат название продукта или услуги, цену, гарантию или наличие гарантии, а также то, предлагаете ли вы продукт или услугу исключительно.Хотя в таблице «Продукты» хранится информация о гарантии, а в таблице «Услуги» хранится информация о гарантиях, основная информация остается неизменной (независимо от того, содержит ли конкретный продукт или услуга обещание качества). Вы можете использовать запрос на объединение, например следующий, чтобы объединить четыре поля из двух таблиц:

 ВЫБЕРИТЕ имя, цену, доступность_гарантии, эксклюзивное_предложение 
 ИЗ ПРОДУКТА 
 СОЮЗ ВСЕ 
 ВЫБЕРИТЕ имя, цену, доступность_гарантии, эксклюзивное_предложение 
 ИЗ УСЛУГ 
;

Дополнительные сведения о том, как объединить операторы SELECT с помощью оператора UNION, см. В разделе Объединение результатов нескольких запросов выбора с помощью запроса объединения.

Верх страницы