Классика баз данных - статьи

       

Отчетность с использованием витрин данных


Следующий шаг в развитии BI-средств заключается в передаче данных транзакций в некоторые системы, специально разработанные для эффективного создания отчетов. Такие системы называются витринами данных (data mart), а соответствующая технология оптимизации данных для отчетности - многомерным моделированием данных (dimensional data modeling).

С ее помощью разработчики представляют данные уже на языке бизнес-терминологии, а не в виде формальных OLTP-структур. Тогда любой средний пользователь, не являющийся специалистом по учетным системам, сможет без особой подготовки получить из витрины данных относительно сложную информацию. Такой метод анализа получил название оперативной аналитической обработки, или OLAP (OnLine Analytical Processing). Он является мощным инструментом просмотра любых параметров коммерческой деятельности компании. Эти параметры также известны как измерения, в них заносится информация о клиентах, поставщиках, типе продукции, времени и географии продаж и т.д. Таким образом, OLAP дает ответы на такие вопросы, как, например: "Сколько товаров и каким продавцом было продано по каждому из регионов в прошлом месяце?" или "Как эти значения изменились по сравнению с предыдущим месяцем и с тем же месяцем в прошлом году?".

Рис. 3. Отчетность в дублированной базе учетной системы

Надписи на рисунке:

Sales -продажи;

Operations - операции;

Financial - финансы;

HR - человеческие ресурсы;

Sales Data Mart - витрина данных продаж;

Operations Data Mart - витрина данных операций;

Financial Data Mart - витрина данных финансов;

HR Data Mart - витрина данных человеческих ресурсов;

Business User - бизнес-пользователь

Чтобы перенести данные из учетной системы в витрину данных, необходимо задействовать дополнительные механизмы. Хотя эти методы могут замедлить доступ к данным, они оптимизируют данные, упрощая создание отчетов. Однако данные, перемещенные в витрину, зачастую остаются по-прежнему не обработанными и не очищенными.

Следует отметить, что учетная система и витрина данных - это две самостоятельные системы, каждая из которых использует свои ресурсы только для одной цели, а поэтому работает максимально эффективно.
Еще одно преимущество этой технологии: в витринах можно хранить транзакции за длительные периоды, что позволяет анализировать различные временные тенденции, тогда как в OLTP-системах это невозможно.

Основный недостаток этого подхода - ограниченность масштабируемости витрин данных. Для сохранения наглядности представления витрина обычно ориентирована на какую-нибудь одну предметную область (например: продажи, управление запасами, финансовый анализ или производство). Крупная организация может иметь до 20 витрин для каждого отдела. Причем использование этой технологии не решает проблемы консолидации и очистки данных. Сложности здесь могут возникнуть при попытке, например, объединить данные о доходах из витрины продаж с данными по численности сотрудников из витрины человеческих ресурсов. Если поместить все эти сведения в одну витрину, то пользователи будут перегружены слишком большим количеством информации. Для таких целей лучше подходит Хранилище данных предприятия.


Содержание раздела