Формальная модель данных
В основе исходных данных для анализа лежит их представление в виде многомерного массива , где элемент массива представляет собой вектор wx=( wx,1, wx,2,… wx, p) представляющей характеристики конкретного объекта, а индексы соответствуют номерам значений соответствующих признаков объекта. То есть индексу соответствует значение признака массива k-ых признаков объекта. Такой массив называется OLAP-кубом. Индексы массива соответствуют измерениям куба, а вектора значений называются мерами (measures) куба. Отметим, что не всяким комбинациям индексов соответствуют реальные объекты, то есть в большинстве случаев приходится иметь дело с разряженными массивами. Агрегирование данных состоит в их свертке по части индексов, то есть на основе куба с индексами 1, 2…m строится куб с индексами k1, k2 … kl, где l< m. То есть, при агрегировании кубу W ставится в соответствие куб U с меньшим количеством индексов. Подобную операцию удобнее представить в виде последовательной свертке по одному индексу. Пусть свертка ведется по k-ому индексу, тогда W→ U, где . Как правило, хотя и необязательно в качестве функции свертки выступает . Любой набор признаков может быть использован в качестве измерений для построения OLAP-куба. В то же время, если некоторые признаки носят иерархический характер, то есть множество индексов Is но s-ому измерению детализирует t-ое измерение куба, то есть Is разбивается на подмножества . В этом случае нет необходимости хранить куб по всем измерениям. Свертка по старшему уровню иерархии в этом случае принимает вид . Для обработки может представлять интерес не только полный объем данных, но и некоторая выборка из него. То есть по s-ому измерению рассматривается не все множество Is, а его некоторое подмножество Is*. . Возможности такой фильтрации определяются типом данных, образующих измерение. Выделяются 5 типов шкал измерений: Шкала наименований характеризуется только отношением эквивалентности какого-либо качественного проявления свойства. Например, цвет: красный, белый, сине-зелёный и т. д..; номер телефона и т.п. Шкалы эквивалентны, если между элементами шкал можно установить взаимно-однозначное соответствие. Шкала порядка описывает свойства, для которых имеют смысл не только отношение эквивалентности, но и отношение порядка по возрастанию или убыванию количественного проявления свойства. Примерами шкал порядка могут служить шкалы чисел твёрдости тел, шкалы баллов землетрясений и т. п. Для пары элементов определены понятия равенства и предшествования. Шкалы эквивалентны, если для любых объектов X, Y, для которых в шкале Φ φ( X)<φ( Y), в шкале Ψ выполняется ψ( X)< ψ( Y). Шкала разностей (интервалов) отличается от шкалы порядка тем, что для описываемого ею свойства имеют смысл не только отношения эквивалентности и порядка, но и пропорциональности или суммирования интервалов (разностей) между различными количественными проявлениями свойства. Примерами шкал разностей могут служить шкалы времени; интервалы времени можно суммировать или вычитать, складывать же даты каких-либо событий бессмысленно. Шкалы разностей имеют условный нуль, опирающийся на какую-либо реперную точку. Например, температурные шкалы Цельсия, Фаренгейта, Реомюра. Шкалы Φ и Ψ эквивалентны, если для любого объекта X выполняется ψ( X)= a+ b φ( X). Шкала отношений описывает свойства, к множеству количественных проявлений которых применимы отношения эквивалентности, порядка, пропорциональности или суммирования (а, следовательно, и вычитания, и умножения). В шкале отношений существует естественный критерий нулевого количественного проявления свойства, т. е. нуль имеет не условный, а вполне определенный физический смысл. Примерами шкал отношений могут служить шкала массы, температурная шкала Кельвина. Шкалы Φ и Ψ эквивалентны, если для любого объекта X выполняется ψ( X)= α(φ( X)), где α( y) – монотонная функция, причем α(0)=0. Абсолютные шкалы обладают всеми признаками шкал отношений, но дополнительно в них существует естественное однозначное определение единицы измерения. Примерами абсолютные шкал могут служить шкала для измерений в штуках, отношений одноимённых физических величин, описываемых шкалами отношений, например коэффициенты полезного действия, коэффициенты усиления и т.п. Таблица 12.1. Шкалы измерений
Популярное: Почему стероиды повышают давление?: Основных причин три... Как выбрать специалиста по управлению гостиницей: Понятно, что управление гостиницей невозможно без специальных знаний. Соответственно, важна квалификация... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (221)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |