Классика баз данных - статьи

       

Семантическая конвергенция: числа в объекты


Многие научные данные представляются в форме числовых массивов, генерируемых инструментами или моделями. Выявлены простые и удобные модели данных для представления таких массивов и связей между ними. Эти модели данных могут также представлять происхождение данных и другие метаданные путем включения в файлы комментирующего текста, определений данных и таблиц данных. Хорошими примерами таких стандартов являются , и . Каждый из них включает библиотеку, которая инкапсулирует файлы и обеспечивает плаформенно-независимый способ чтения подмассивов, а также создания и обновления файлов. Каждый из этих стандартов дает ученым возможность простого обмена данными. Поверх стандартов построены общие средства анализа и визуализации соответствующих высокоуровневых форматов файлов.

В то время как в коммерческом мире придерживаются стандартов реляционной модели данных и SQL, в научном сообществе ни один стандарт или инструмент не набрал аналогичной критической массы. Ведется много параллельных и конкурирующих работ по созданию таких инструментальных средств – по меньшей мере, по одной для каждой дисциплины. Обмен данными вне каждой группы является проблематичным. Поскольку обмен данным между научными дисциплинами становится все более важным, в следующем десятилетии, вероятно, появится общий, подобный HDF формат и пакет для всех наук.

В каждой дисциплине появляются определения общей терминологии (измерения и единицы измерений). Мы наиболее близко знакомы со словарем Universal Content Descriptors () астрономического сообщества, в котором определяется около тысячи астрофизических измерений, единиц измерения и понятий. Почти в каждой дисциплине ведет работа по созданию аналогичной онтологии (называемой также управляемым словарем). Это значительно облегчит построение инструментальных средств, поскольку общее согласие относительно этих понятий может помочь при разработке средств анализа. В дополнение к стандартизации, пригодные для использования компьютерами онтологии помогут построить Semantic Web: приложения станут совместимыми на семантическом уровне, а не только синтаксически совместимыми, как это возможно при использовании текущего поколения Web-сервисов на основе типизированных интерфейсов. Однако пройдет некоторое время, прежде чем появятся и будут интегрированы со средствами анализа данных высокопроизводительные процессоры онтологий общего назначения.

С другой стороны, у пользователей баз данных имеется хорошая возможность прототипирования таких приложений: схема базы данных, не являясь полной онтологией, может быть ценным фрагментом онтологии. Для реализации элементарной семантической алгебры может использоваться SQL. Интеграция XML в современных системах управления базами данных (СУБД) открывает двери для существующих стандартов RDF и OWL. Визуализация или, еще лучше, визуальное исследование представляют собой простые примеры приложений, успех которых определяется возможностью отображения вопроса, сформулированного в концептуальной среде онтологии предметной области, в запрос(ы) сервера анализа (мета)данных. В настоящее время целевым "языком ассемблера", пригодного для использования в этом процессе трансляции, является гибрид SQL и XQuery.



Содержание  Назад  Вперед