Что должен знать бухгалтер о хранении данных
Марк Левин, Джоэль Сигель
Начало в выпусках: #126, #127, #128
В кратком изложении
Определение и функции метаданных
Движение данных в хранилище управляется метаданными, которые обеспечивают полноценный доступ к хранилищу и работу с ним. Правильно используя метаданные, пользователь может изучать содержание данных и определять их пригодность простым, нетехническим языком.
В двух словах, метаданные - это информация о данных и их движении по хранилищу. Они указывают, какие данные доступны, где они находятся и как перемещались в прошлом. Метаданные позволяют видеть и понимать логику модели данных в хранилище. Они дают представление о:
- данных, постоянно присутствующих в хранилище;
- их конкретном наполнении;
- источниках, из которых они были получены;
- степени очистки, интеграции, преобразования и обобщения, которым подверглись данные.
Категории метаданных
В книге "Хранилище данных" Дон Майер (Don Mayer) и Кейси Кэнон (Casey Canon) делят метаданные на 2 категории: техническую и коммерческую.
Техническими метаданными пользуются программы управления хранилищами и администраторы ИТ. Эти метаданные определяют содержание данных в прежних системах-источниках, сообщают, какая обработка была произведена в хранилище (извлечение, преобразование, очистка, интеграция, обновление графиков управления процессами).
Коммерческие метаданные позволяют нетехническим пользователям просматривать содержимое хранилища, таблицы и графики, которые являются элементами информации; определяют, как могут быть использованы эти элементы и насколько современны резидентные данные. Большинство коммерческих метаданных сопровождаются описанием содержания.
Применение
Метаданные контролируют долгосрочные административные функции, управляя данными в хранилище в течение их исторического периода. Поскольку данные поступают из многих операционных БД, менеджер должен знать обо всех источниках, изменениях и преобразованиях данных.
Метаданные проверяют: извлечение данных, атрибуты данных, индексную информацию, число рядов в таблице, статистику использования и модели объединения данных. Для этого управляющий метаданными должен указать:
- четко определенные коммерческие и технические переменные;
- источники данных, в том числе операционные системы, ПО для извлечения и очистки;
- графики регулярного обновления;
- приемы получения данных из источников;
- процедуры и правила, гарантирующие качественную обработку и архивацию обработанных данных;
- необходимые процедуры системной документации.
Каждая система операционных данных содержит метаданные. ПО для интеграции метаданных может уменьшить и устранить многие этапы (steps), необходимые для больших хранилищ.
Окончание в следующем выпуске.
Продолжение в выпусках: #130