Классика баз данных - статьи

       

в репозитории XML постоянно происходит


Хотя в репозитории XML постоянно происходит добавление и удаление элементов, сами документы в основном только читаются.

Обработка потоков данных. Обработка потоковых данных – это нечто вроде изгоя в нашем черновом списке приложений, требующих обработки большого объема данных. Строго говоря, обработка потоков данных не является задачей управления данными; это задача фильтрации данных, т.е. данные производятся в некотором источнике и потоковым образом посылаются получателям, которые отфильтровывают поток на предмет обнаружения «интересных» событий. Например, финансовые организации отслеживают символы акций для определения того, какие акции наиболее хорошо продаются и покупаются, а какими из них обмениваются не так интенсивно, как ожидалось.

Причина, по которой эти приложения потоковой обработки данных включены в наш список, является лингвистической: фильтры, которые обычно требуются в этих средах, выглядят подобно SQL; однако, в то время как SQL предназначался для работы с постоянно хранимыми таблицами, эти запросы выполняются над потоком значений данных, поступающих в реальном времени. Стоунбрейкер довольно глубоко разъясняет, насколько плохо для решения этой задачи подходят системы баз данных. Возможно, более удивительно не то, что системы баз данных плохо подходят для решения этой задачи, а то, что, поскольку SQL показал себя «правильным» языком запросов, разработчики используют системы реляционных баз данных для приложений, в которых отсутствует постоянное хранение данных!

Потоковая обработка данных представляет собой класс приложений, которые могут выиграть от использования подобного языка запросов поверх системы управления данными со свойствами, радикально отличающимися от свойств РСУБД. Поскольку потоковые запросы обычно выполняются над данными, наблюдаемыми в течении некоторого временного окна, требуется некоторое временное локальное хранилище данных, но от это хранилище не обязано обладать свойствами персистентности, транзакционности, а также поддержки выполнения сложных запросов.Реляционные базы данных хорошо приспособлены для обработки динамических запросов над сравнительно статическими или медленно изменяемыми данными, а этот класс приложений характеризуется довольно статическим набором запросов над весьма динамическими данными.


Содержание  Назад  Вперед