Классика баз данных - статьи

       

Пространства данных и Лоуэллский отчет


В заключение [] авторы говорят: "Пространства данных можно считать "зонтиком" для большей части исследований, которые уже активно ведутся в сообществе баз данных; на самом деле, в этом и состояла одна из исходных целей. Однако мы также попытались очертить несколько новых исследовательских возможностей, которые происходят из более целостного представления возникающих проблем "данных повсюду". Исследовательское сообщество баз данных однозначно решило заняться решением этих проблем, и мы предвидим непрерывный прогресс в расширении области применения технологии управления данными". В действительности, это утверждение полностью подтверждается при сопоставлении идей и предложений [] с положениями Лоуэллского отчета.

Пункт (интеграция текста, данных, кода и потоков) в [] развивается и обогащается на основе идеи иерархии моделей данных. В данном случае говорится не об однородной интеграции в пределах одной базы данных, а об организации однородного доступа к разнородным источникам данных. Но цель преследуется та же, и мне кажется заманчивой перенести идею иерархии моделей на локальную СУБД.

Пункт (слияние информации) в контексте [] получает оригинальную и, как мне кажется, предельно ясную трактовку. С использованием предусматриваемых в [] компонентов DSSP и зависящего от конкретной ситуации объема человеческого труда можно обеспечить интеграцию любого числа источников данных любой природы с требуемым уровнем качества (в зависимости, конечно, от качества исходных данных в источниках). Возможность внешнего индексирования и кэширования позволяет добиться компромисса между виртуальной интеграцией данных и построением физически отдельного хранилища данных. Весь вопрос в том, сколько это будет стоить.

Что касается пункта (неточные данные), то при работе с пространствами данных придется сталкиваться и неполнотой данных (вследствие, например, недоступности некоторых источников или устареванием данных в кэше), и с неточностью запросов (в связи, например, с возможностью сочетания поисковых и структурированных запросов). И снова авторы предлагают прагматичный подход, позволяющий пользователям итеративным образом совершенствовать результаты своих запросов путем сочетания различных стилей доступа к данным.

Пункт (самоадаптация) трансформируется в [] в "повторное использование человеческого труда". И снова это кажется очень здравой идеей, поскольку первичным источником знаний, которыми должна руководствоваться программная система, является человек.

Наконец, целый ряд идей [] можно соотнести с пунктом (пользовательские интерфейсы). Здесь и комбинирование средств контекстного поиска и структурированных запросов, и итерационное совершенствование формы запроса под руководством системы, и т.д.



Содержание  Назад  Вперед