Классика баз данных - статьи


         

Выборка и обнаружение данных


Очевидно, все больше и больше информации будет доступно в Web, коллекции неформально связанных ресурсов Internet. Неформальность и распределенный характер управления в среде Web представляют разительный контраст в сравнении со структурированностью и управляемостью, характерными для современных распределенных баз данных. Возникновение этой новой среды еще раз подтверждает важную роль инструментов для интеграции гетерогенных информационных ресурсов, которая отмечалась в отчете [Silberschatz at al., 1990].

Однако природа Web порождает ряд новых проблем, а также примеров, которые иллюстрируют крайние случаи многих проблем, связанных с гетерогенной информационной средой. Например, приходится иметь дело со следующим:

  • Имеются данные с нечеткой схемой, которая может произвольно меняться, или с нерегулярной структурой.
  • Данные, не имеющие четкого определения и/или обладающие неизвестной достоверностью.
  • В рамках технологий СУБД выработаны эффективные механизмы индексации и другие средства поддержки поиска для хорошо структурированных данных; очень важно расширить подобные механизмы и адаптировать их к неструктурированному миру Web.



Содержание  Назад  Вперед