Классика баз данных - статьи

       

Десять лет тому назад


Упомянутый выше результат мог бы не иметь влияния, если бы данное утверждение было истинным только для того ограниченного класса запросов, для которого оно было изначально доказано. Однако на VLDB'93 утверждение было обобщено для произвольных запросов с эквисоединением, что отчетливо показало, что наиболее эффективные гистограммы могут существенно отличаться от тех, которые использовались ранее [].

Насколько нам известно, гистограммы с частотой в качестве параметра разделения представляли первое отклонение от группировки бакетов на основе значений не только в области баз данных, но также и в математике и статистике. Кроме того, их введение позволило существенно обобщить некоторые распространенные практические приемы, которые уже использовались в коммерческих системах (например, в DB2), где информация о значениях с наибольшей частотой поддерживалась индивидуально и точно по причине ее важности для оценки селективности. Такой прием является примером особого вида гистограммы с классом разделения со смещением к краю и частотой в качестве параметра разделения: значения с наивысшим значением параметра разделения поддерживаются в одиночных бакетах. Хотя в нескольких случаях гистограммы со смещением к краю оказываются менее точными, чем общие сериальные гистограммы, они достаточно эффективны.



Содержание  Назад  Вперед