Классика баз данных - статьи

       

О точности диагностики патологий


Сергей Кузнецов

Подавляющее большинство статей, посвященных управлению данными, касается частных технических вопросов. Чем дальше, тем чаще, чтобы понять смысл некоторой статьи (или хотя бы разобраться в том, есть ли в ней какой-то смысл), приходится прокопать массу литетатуры, опубликованной до данной статьи (если, конечно, она не посвящена какому-то узкому направлению, в котором ты специализируешься сам). И, как правило, двигаясь таким образом назад по времени, ты натыкаешься на какую-то статью, которая написана на гораздо более низком техническом уровне, но зато содержит идеи, с которых и началось развитие данного технического направления. После почтения такой "идейной" статьи все становится намного понятнее.

Идейные статьи писать гораздо труднее, чем технические (хотя бы потому, что для этого нужны идеи). Таких статей на порядке меньше, чем технических. И тем они ценнее. С моей точки зрения, статья Адама Якобса "Патологии больших данных" относится к категории "идейных" статей, будоражущих сообщество баз данных, заставляющих людей думать.

Статья написана на (почти) популярном уровне, не требует (почти) никаких предварительных знаний. Фактически, цель статьи состоит в том, чтобы показать, что при создании эффективных средств анализа данных большого объема невозможно обходиться старыми методами. Необходимы новые, подчас рискованные подходы, в которых применяются все возможности современных аппаратных средств, и которые опираются на теоретические результаты и алгоритмы, полученные в разных областях computer science.

Первой специализацией автора статьи была лингвистика, а степень PhD он получил в области вычислительной нейропсихологии. Ему приходилось заниматься аналитическими исследованиями больших объемов данных, и с начала 2000-х он работает в компании 1010data Inc., где руководит разработкой аналитической СУБД Tenbase.

Таким образом, Адам Якобс пришел в область управления данными сравнительно недавно, не из унивеситета, а из научной практики.

Содержание    Вперед