Все строится на основе файлов. В HDF используются файлы. В системах баз данных используются файлы. Но в файловых системах отсутствуют метаданные, кроме иерархической структуры каталогов и имен файлов. В них поддерживается модель данных "сделай сам", которой не принесет пользу разрастающийся набор средств анализа данных. В них поддерживаются методы доступа "сделай сам", которые не будут обеспечивать параллельный, ассоциативный, темпоральный или пространственный поиск. В них также отсутствует высокоуровневый язык запросов. Наконец, большинство файловых систем может управлять миллионами файлов, но к тому времени, когда файловая система сможет работать с миллиардами файлов, она станет системой баз данных.
Как вы можете видеть, мы придерживаемся экуменических представлений о том, что такое база данных. Мы рассматриваем NetCDF, HDF, FITS и Google Map-Reduce как зарождающиеся системы баз данных (другие люди могут расценивать их как файловые системы). У них имеется язык схемы (метаданных) для определения метаданных. У них имеются несколько стратегий индексирования и простой язык манипулирования данными. У них имеются зачатки непроцедурного и параллельного программирования. И у них есть набор средств для создания, доступа, поиска и визуализации данных. Так что, с нашей точки зрения, они являются простыми системами баз данных.