Классика баз данных - статьи

       

в которых Вы видите возможность


ДГ: Имеются ли другие области, в которых Вы видите возможность исследований, требуемых для совершенствования контент-менеджеров и для оказания содействия пользователям в управлении широким разнообразием данных?

ПС: Имеется несколько областей, которые очень интересны для меня. Постоянная исследовательская работа требуется в области самоуправляемых вычислительных систем. Что нужно сделать, чтобы получить по-настоящему самоуправляемую систему данных, которую можно было бы во что-то встраивать? Что нужно сделать, чтобы получить по-настоящему массивный параллелизм на уровне миллионов систем (например, в Internet)? При наличии тенденции к постоянному уменьшению размеров аппаратных средств, как нам добиться связывания миллионов систем и параллельного решения на них задач, если сегодняшний уровень технологии позволяет связывать только тысячи систем? Как работать с потоками данных, где запросы фиксированы, а данные стремительно поступают, и эти данные могут быть неструктурированными?

Как обнаружить звонок Осамы бин Ладена в потоке данных с использованием таких методов, как семантический анализ, распознавание голоса, автоматическое преобразование речи в текст и языковой перевод?

Как накапливать метаданные и поддерживать их актуальность? Как управлять ими, обучаться на их основе, выводить из них информацию?

Пока мы имеем дело с первым поколением средств поиска. Имеется множество возможностей улучшить эти средства. Если бы поисковая система знала, что вы были рассержены, когда вводили в систему свои три ключевые слова, могло ли бы это помочь ей понять, что вы ищите? Если бы она знала, какие сообщения электронной почты вы просматривали до ввода этих поисковых ключевых слов, могло ли бы это помочь ей понять, что вы ищите? Как может поисковая машина найти то, что вы имеете в виду, а не просто руководствоваться введенными ключевыми словами?

Насколько надежна порождаемая информация? Имеется много источников ненадежности. Что делать при наличии источника информации, которая верна только в половине случаев? Как оценить качество этой информации при сравнении ее с информацией из другого источника, которая является правильной всегда? Как соединить информацию из этих двух источников, и каков должен быть уровень доверия к результирующей соединенной информации?


Содержание  Назад  Вперед