Теория

Что такое индексы в sql. Индексы в SQL. Основы индексов в SQL Server

Теоретический материал

Индексы позволяют максимально эффективно находить информацию в огромных базах данных.

SQL Server 2008 поддерживает два базовых типа индексов: кластеризованные и некластеризованные. Индексы обоих типов реализуются как сбалансированное дерево (B-дерево), в котором уровень листьев находится на нижнем уровне структуры. Разница между индексами двух типов состоит в том, что кластеризованный индекс обеспечивает физическое упорядочивание данных на диске. Кластерный индекс является разреженным – указатели в листьях B-дерева ссылаются на страницу данных.

Некластеризованный индекс является плотным и содержит только столбцы, включенные в ключ индекса. В плотных индексах указатели в листьях B-дерева ссылаются на строки реальных данных. Если для таблицы не определен кластеризованный индекс, она называется кучей (heap) или неотсортированной таблицей. В последнем случае таблица физически организуется (отсортирована) в порядке добавления новых записей в отличии от таблиц с кластеризованными индексами, которые упорядочиваются по значениям ключа сортировки. Можно сказать, что таблица может быть представлена в одной из двух форм, в виде кучи или в виде кластеризованного индекса .

Кластеризованные индексы

Кластеризованные индексы можно создавать на основе одного или нескольких столбцов таблицы – такой индекс называется индексным ключом и у него есть ряд ограничений:

Столбцы кластеризованного индекса называются ключом кластеризации (clustering key). Кластеризованный индекс оказывает особое влияние на SQL Server, так как заставляет его упорядочивать данные в таблице согласно ключу кластеризации. Поскольку таблица может упорядочиваться лишь одним способом, в ней можно задать лишь один кластеризованный индекс.

Кластеризованные индексы задают порядок сортировки данных в таблице. Однако кластеризованные индексы не обеспечивают порядок физической сортировки. Кластеризованный индекс не приводит к физическому упорядочиванию данных на диске, потому что это привело бы к большому числу операций дискового ввода-вывода при разбиении страниц. Он лишь гарантирует, что индексированная цепочка страниц упорядочена логически, что позволяет SQL Server при поиске данных переходить прямо по цепочке страниц. В процессе движения сервера SQL Server по индексированной цепочке страниц строки данных считываются в порядке ключа кластеризации .

Некластеризованный индекс

Некластеризованный индекс не накладывает никаких ограничений на упорядочивание записей в таблице, поэтому в одной таблице можно создать много некластеризованных индексов, но у этих индексов такие же ограничения, как и у кластеризованных индексов:

Индекс не может охватывать не более 16 столбцов;

Максимальный размер индексного ключа – 900 байт.

Конечный уровень некластеризованного индекса содержит указатель на нужные данные. Если в таблице есть кластеризованный индекс, конечный уровень некластеризованного индекса указывает на ключ кластеризации. Если же кластеризованного индекса нет, страницы конечного уровня указывают на строки данных в таблице .

Общий синтаксис создания реляционного индекса таков:

CREATE INDEX имя_индекса

ON <объект> (column [, … n])

[ ; ]

Составной индекс

Составной индекс может быть создан на основании нескольких полей. В этом случае справедливы ограничения описанные ранее. Если индекс построен по полям с фиксированным размером, сумма длин этих полей должна не превышать эти 900 байт, если индекс построен по полям с переменной длинной, сумма максимальных размеров полей может превышать 900 байт, но само значение сумм по каждой записи не может быть больше 900 байт. Например, в таблице есть два поля переменной длины по 500 байт. SQL Server позволяет создать составной ключ на базе этих двух полей, если нет записей, сумма длин по обоим полям которых превышает 900 байт. Стоит обратить внимание на тот момент, что составной индекс для (Column1, Column2) является отличным от (Column2, Column1), а так же от индексов, созданных по двум этим полям в отдельности.

Фрагментация индексов

Файлы операционной системы обычно со временем фрагментируются из-за многократных операций записи. Индексы тоже могу становится фрагментированными, но фрагментация индексов отличается от фрагментации файлов.

При создании индекса все значения ключа индекса записываются в упорядоченном виде на страницах индекса. При удалении строки из таблицы SQL Server должен удалить соответствующею запись в индексе, что создает "дыры" на странице индекса. SQL Server не возвращает освобожденное пространство из-за слишком высокой стоимости операции обнаружения и повторного использования "дыр" в индексе. Если значение в базовой таблице изменяется, SQL Server перемещает запись с указателем в другое место, что создает еще одну "дыру". При переполнении страниц индексов и потребности разбиения страниц снова происходит фрагментация индекса. Со временем индексы таблицы, в которых происходит изменение данных, становятся фрагментированными .

Для управления степенью фрагментации индекса обычно используют параметр, который называется коэффициентом заполнения (fill factor). Для устранения фрагментации можно так же задействовать инструкцию ALTER INDEX. Параметр fill factor - это параметр индекса, который определяет долю свободного пространства, которое резервируется на каждой странице конечного уровня при создании или перестроении индекса. Зарезервированное пространство позволяет в дальнейшем размещать дополнительные значения, снижая таким образом число разбиений страниц Коэффициент заполнения измеряется в целых процентах, например значение 75 означает, что каждая создаваемая страница конечного уровня должно содержать 25% свободного пространства для размещения будущих значений .

Дефрагментация индексов

Поскольку SQL Server не возвращает пространство в систему, надо периодически освобождать пустое пространство в индексе, чтобы сохранить тот выигрыш в производительности, из-за которого индекс изначально создавался. Для дефрагментации индексов используют инструкцию ALTER INDEX .

ALTER INDEX { index_name | ALL }

index	индекс
heap	куча
table	таблица
view	представление
B-tree	сбалансированное дерево
clustered index	кластеризованный индекс
nonclustered index	некластеризованный индекс
composite index	составной индекс
covering index	покрывающий индекс
primary key constraint	ограничение на первичный ключ
unique constraint	ограничение на уникальность значений
query	запрос
query engine	подсистема запросов
database	база данных
database engine	подсистема хранения данных
fill factor	коэффициент заполнения индекса
surrogate primary key	суррогатный первичный ключ
query optimizer	оптимизатор запросов
index selectivity	избирательность индекса
filtered index	фильтруемый индекс
execution plan	план выполнения

Что такое индексы в sql. Индексы в SQL. Основы индексов в SQL Server

Используемая терминология:

Основы индексов в SQL Server.

Кластеризованный индекс

Некластеризованный индекс

Типы индексов

Составной индекс

Уникальный индекс

Покрывающий индекс

Проектирование индексов

База данных

Запросы к базе данных

Почему таблица не может иметь два кластеризованных индекса?

Если кластеризованная таблица даёт множество преимуществ, то зачем использовать кучу?

Как изменить установленное по умолчанию значение коэффициента заполнения индекса?

Можно ли создать кластеризованный индекс на столбце, содержащем дубликаты?

Как хранится таблица, если не был создан кластеризованный индекс?

Какая взаимосвязь между ограничениями на уникальность значения и первичным ключом с индексами таблицы?

Почему в SQL Server кластеризованные и некластеризованные индексы называются сбалансированным деревом?

Как вообще индекс может улучшить производительность запросов, если приходится переходить по всем этим индексным узлам?

Если индексы настолько замечательны, то почему бы просто не создать их на каждый столбец?

Обязательно ли создавать кластеризованный индекс на столбце с первичным ключом?

А что если проиндексировать представление, то это по-прежнему будет представление?

Зачем использовать покрывающий индекс взамен составного индекса?

Имеет ли значение количество дубликатов в ключевом столбце?

Можно ли создать некластеризованный индекс только для определенного подмножества данных ключевого столбца?

Кластеризованный индекс

Некластеризованный индекс

Типы индексов

Составной индекс

Уникальный индекс

Покрывающий индекс

Проектирование индексов

База данных

Запросы к базе данных

14 вопросов об индексах в SQL Server, которые вы стеснялись задать

Почему таблица не может иметь два кластеризованных индекса?

Если кластеризованная таблица даёт множество преимуществ, то зачем использовать кучу?

Как изменить установленное по умолчанию значение коэффициента заполнения индекса?

Можно ли создать кластеризованный индекс на столбце, содержащем дубликаты?

Как хранится таблица, если не был создан кластеризованный индекс?

Какая взаимосвязь между ограничениями на уникальность значения и первичным ключом с индексами таблицы?

Почему в SQL Server кластеризованные и некластеризованные индексы называются сбалансированным деревом?

Как вообще индекс может улучшить производительность запросов, если приходится переходить по всем этим индексным узлам?

Если индексы настолько замечательны, то почему бы просто не создать их на каждый столбец?

Обязательно ли создавать кластеризованный индекс на столбце с первичным ключом?

А что если проиндексировать представление, то это по-прежнему будет представление?

Зачем использовать покрывающий индекс взамен составного индекса?

Имеет ли значение количество дубликатов в ключевом столбце?

Можно ли создать некластеризованный индекс только для определенного подмножества данных ключевого столбца?

Что такое индексы в базе данных?

Типы индексов в Microsoft SQL Server

Создание и удаление индексов в Microsoft SQL Server

Создание индексов

Пример удаления индекса в Microsoft SQL Server

Оптимизация индексов в Microsoft SQL Server

Реорганизация индексов

Перестроение индексов

6. Индексы и оптимизация производительности

6.1 Для чего нужны индексы