Традиционные табличные системы баз данных пригодны для анализа объектов (галактик, спектров, белков, событий и т.д.). Но даже в этих случаях поддержка временных рядов, пространственных, текстовых и других типов данных оказывается недостаточной. В системах баз данных традиционно не поддерживается основной научный тип данных – N-мерный массив. В большинстве систем массивы приходится маскировать под blob’ы (binary large objects). Этот набор проблем обычно называют потерей соответствия – имея в виду несоответствие между моделью программирования и возможностями базы данных. Потеря соответствия затрудняет отображение многих научных приложений на традиционные табличные системы баз данных.
Но системы баз данных меняются. Они интегрируются с языками программирования, чтобы обеспечить поддержку объектно-ориентированных баз данных. Это новое поколение объектно-реляционных систем баз данных воспринимает любой тип данных (будь то обычное плавающее число, массив, строка символов или составной объект, такой как XML- или HTML-документ) как инкапсулированный тип, значения которого могут храниться в поле записи. В действительности, эти системы позволяют либо сохранять значение прямо в записи (встроенным образом), либо хранить в записи ссылку на реальное место хранения этого значения (связанным образом). Эта объектная модель с возможностями связывания и встраивания хорошо подходит для интеграции систем баз данных и файловых систем – файлы рассматриваются как связанные объекты. Запросы могут читать и писать эти расширенные типы с использованием тех же методов, что и для обычных типов. На самом деле, мы ожидаем, что в большинстве систем баз данных к набору типов будут добавлены HDF и другие форматы файлов.
Как только вы сможете поместить свои типы и программы внутрь базы данных, вы получите преимущества параллелизма, непроцедурных запросов и независимости данных, присущие традиционным системам баз данных. Мы полагаем, что эта интеграция баз данных, файловых систем и языков программирования будет в будущем ключом к управлению данными и обеспечению доступа к данным в петабайтных системах управления базами данных.