Использование неточных данных

"За пределами мира бизнеса все данные, подлежащие обработке, являются неполными и неточными. … Для успешного использования в подобных областях СУБД должны обеспечивать встроенную поддержку неточных данных. Обработка запросов должна базироваться на вероятностной, недетерминированной модели; процессор запросов должен накапливать факты, чтобы обеспечивать все лучшие и лучшие ответы на запросы пользователей. У пользователей должна иметься возможность задания неточных запросов, и процессор запросов должен относиться к этому как к дополнительному источнику неполноты и неточности." Здесь следует отметить сочетание двух возможностей: точные запросы над неточными данными и неточные запросы над точными данными. Понятно, что возможны разнообразные промежуточные варианты в зависимости от уровня точности данных и запросов. В последние годы достаточно интенсивно исследуется частный случай этой проблемы, так называемые top-K-запросы (см. например, []), когда системе подается некоторый точный запрос к точным данным, а она стремится обеспечить K ответов, максимально близких к точному ответу. Конечно, в общей постановке проблема более интересна и полезна, но и менее понятна.

Содержание Назад Вперед

Главная сайта