Классика баз данных - статьи

       

Производительность


В массивно-параллельной среде для СУБД очень важно демонстрировать линейную масштабируемость в терминах увеличения быстродействия и увеличения масштаба. Ускорение быстродействия – это мера того, насколько быстро параллельная вычислительная систем решает проблему фиксированного размера. Другими словами, при использовании NonStop SQL пользователи могут повышать скорость выполнения запроса почти линейно путем добавления к своей системе процесоров и дисковых устройств. Увеличение масштаба – это мера того, насколько хорошо параллельная вычислительная система справляется с ростом базы данных. Другими словами, когда возрастает размер пакетного задания, пользователи могут удерживать константное время обработки путем добавления к системе большего оборудования. NonStop SQL демонстрировал близкие к линейным ускорение производительности и увеличение масштабности для приложений тестового набора с аудитом Codd and Date Consulting Group. Этот тестовый набор документирован в [Engl89, Engl 90].

Мы приведем несколько результатов некоторых тестов производительности, которые прогонялись при тестировании нашего программного обеспечения. Заметим, что эти результаты не были официально подтверждены независимым аудитором. Они представлены здесь просто для того, чтобы подчеркнуть выгоду от поддержки более эффективных алгоритмов при обычной обработке запросов.

Улучшение производительности в диапазоне от 12 до 60 процентов наблюдалась при использовании для запросов из Wisconsin benchmark метода соединения хэшированием вместо вложенных циклов и сортировки со слиянием. При выполнении группировки и агрегации с использованием метода на основе хэширования вместо метода на основе сортировки для запросов из того же тестового набора наблюдалось повышение производительности до 60%. Когда агрегация выполнялась дисковым процессом, применявшим агрегатную функцию к лидирующим столбцами ключа таблицы из 1000 строк, реализованной в ключовом-последовательном файле, рост производительности составил 75%. Когда та же таблица соедаржала 100000 строк, на том же запросе был показан рост производительности в 230%. В обоих случаях размер строк составлял 208 байт.



Содержание  Назад  Вперед