Классика баз данных - статьи

       

Другие полезные возможности баз данных


Системы баз данных приближаются к решению проблемы управления данными петабайтного масштаба, руководствуясь потребностями управлять гигантскими хранилищами информации в коммерческих и правительственных организациях. Эти системы скрывают понятие файла и работают с коллекциями данных. Они могут образовывать федеративные объединения многих различных источников, позволяя программам видеть их как единую коллекцию данных. Они также позволяют программам опираться на любые атрибуты данных.

Системы баз данных обеспечивают очень мощные средства определения данных для специфицирования абстрактных форматов данных и способов организации данных. Они позволяют реплицировать данные, так что их можно организовывать несколькими способами (по времени, по пространственному расположению, по другим атрибутам). Эти методы простираются от простых индексов до материализованных представлений, в которых могут комбинироваться данные из многих источников.

Системы баз данных обеспечивают мощный ассоциативный поиск (поиск по значению, а не по местоположению), а также автоматические параллельные доступ и исполнение, что существенно для анализа петабайтных данных. Они обеспечивают непроцедурный и параллельный поиск данных для быстрого нахождения поднаборов данных, а также много инструментальных средств для автоматического проектирования структур данных и управления ими.

Кроме того, удалось достичь громадного прогресса в анализе данных с использованием кубов данных, и теперь исследования фокусируются на интеграции алгоритмов машинного обучения, которые выводят тенденции, производят кластеризацию данных и обнаруживают аномалии. Все эти средства нацелены на облегчение анализа коммерческих данных, но они равно применимы и к анализу научных данных.



Содержание  Назад  Вперед