Классика баз данных - статьи

       

Присутствие гистограмм в индустрии


Гистограммы являются не только предметом многих исследований, но также являются и любимым методом аппроксимации во всех коммерческих СУБД. Практически все системы начинали с применения гистограмм с одинаковой шириной, а затем постепенно двигались к гистограммам с одинаковой глубиной. В этом разделе мы кратко опишем прменяемые в настоящее время классы гистограмм для трех наиболее популярных СУБД.

В DB2 используются гистограммы класса compressed со значениями в качестве параметра разделения и частотой в качестве параметра источника []. Пользователи могут специфицировать число одноэлементных и неодноэлементных бакетов, желательных для наиболее частых значений, и, соответственно, часть гистораммы compressed с умолчанием от10 до 20. Отклонение от приведенного выше общего описания состоит в том, что в DB2 внутри неодноэлементных бакетов сохраняются накопленные частоты. Конструирование гистограммы основывается на образцах хранимых данных. В DB2 используется многомерная информация о мощности из индексов на составных атрибутах (когда они доступны) для получения количественных оценок зависимостей, которые могут существовать между атрибутами, и эти оценки используются в процессе оценивания селективности. При отсутствии таких оценок атрибуты считаются независимыми. Возможности обучения LEO [] играют основную роль в том, как вся доступная информация используется для получения высококачественных оценок.

В Oracle все еще используются гистограммы с одинаковой шириной []. Основной подход к многомерной селективности похож на подход DB2 и основывается на использовании всякой информации из составных индексов. Однако, в дополнение к этому, поддерживаются средства динамического взятия образцов для получения при потребности "на лету" информации о зависимостях для сложных предикатов (в настоящее время это работает для предикатов ограничения и функций на одной таблице, а вариант для соединений будет доступен в следующем релизе системы). Также принимаются во внимание зависимости, существующие между атрибутами иерархий измерений куба при выполнении roll-up, и обеспечиваются оценки на соответствующем уровне иерархии.

Содержание  Назад  Вперед