Мегаобучалка Главная | О нас | Обратная связь


VI. МНОГОМЕРНЫЙ АНАЛИЗ



2019-12-29 190 Обсуждений (0)
VI. МНОГОМЕРНЫЙ АНАЛИЗ 0.00 из 5.00 0 оценок




Множественно-корреляционный анализ

 

Этот анализ позволяет исследовать объем, прогнозировать уровень зависимой переменной, основываясь на возможных изменениях более чем одной независимой переменной. Зависимость между 3 и более факторами называется множественной или многофакторной корреляционной зависимостью.

 

Коэффициенты называются коэффициентами условной корреляционной регрессии и являются именованными числами в различных единицах измерения, а, следовательно, не сравнимы друг с другом. На основании этих коэффициентов строятся относительные показатели тесноты связи, которые называются коэффициентами эластичности.

При увеличении фактора Xi на 1 % результативный фактор растет на Эi % (при условии, что другие факторы неизменны).

Основой изменения связи является матрица данных коэффициента корреляции.

Признаки Y X1 X2 Xn
  у   1   -   -   -
Х1 r (YX1) 1 - -
Х» r (YX2) r (X1X2) 1 -
Хn r (YXn) r (X1Xn) r (X2Xn) 1

 

На основе этой матрицы можно судить о тесноте связей признаокв с результативным признаком и между собой.

 

Обычно матрицу используют для предварительного отбора факторов в уравнении регресии. Обычно в модель не включаются факторы, слабо связанные с результатом, но тесно связанные с другими факторами. Если фактор Хi тесно связан с фактором Xj, то говорят, что он коллинеарен с фактором Xi (см. Коэффициент множественной корреляции).

 

Наиболее общим показателем тесноты связи всех входящих в уравнении регрессии факторов с результатом является коэффициент множественной детерминации; он представляет собой отношение части вариации результативного признака, объясняемого за счет входящих в уравнение факторов к общей вариации результативного признака.

 


1. Общая вариация (Yi - Y)2

2. Необъясненная вариация (Yi - У)

3. Объясненная = общая - необъясненная

 

Коэффициент детерминации = объясненная / общая

Объясняется теми факторами, которые включены в модель.

 

Значимость общего коэффициента корреляции.

 

Для проверки используется распределение Фишера с вероятностью a и числами свободы:

1 = числу независимых переменных

2 = n - 3

 

                     R2 /2

F расчетное = (1 - R2) / (n - 3)

 

Так как F расчетное больше F табличного, следовательно, существенен и связь между У и X1Xn подтверждается.

 

 

Дискретный анализ

 

Дискретный анализ является статистическим методом, который позволяет изучить различия между двумя и более группами объектов, по нескольким переменным одновременно. Он схож с множественно-регрессионным анализом, однако существует различие:

при регрессионном анализе зависимая переменная является количественной, а в дискретном анализе - качественной.

 

Цели дискретного анализа:

1. Определение значимости различий между двумя и более группами.

2. Построение модели, позволяющей классифицировать респондентов или объектов между группами на основании независимых переменных

3. Проверка соответствия фактического дискретного множества расчетному, полученному по независимой переменной.

 

Для проведения дискретного анализа необходимо образовать две обучающие выборки Z1 и Z2 (может быть больше) - пользователи и непользователи.

 

       1

Z1 = n1 * å( А0 +  B1*X1 +B2*X2 + Bn*Xn)

 

Предположим, что во множестве Z1 будут включены все покупатели данного продукта .

           1

Z2 = n2 * å( А0 +  B1*X1 +B2*X2 + Bn*Xn)

(никогда не покупают данного продукта)

 

Если индивидуальные значения ответов какого-либо респондента будут больше, чем полусумма (Z1i + Z2i), то такого респондента следует относить к пользователям, иначе к лицам, которые не покупают данный продукт.

 

Дискретный анализ может быть использован для ответа на вопросы:

n как потребители какого-либо товара отличаются от тех, кто не покупает этот продукт.

n как потенциальные потребители новых товаров, показывающие большую вероятность покупки данного товара отличается по демографическим признакам от тех, для кого характерна низкая вероятность покупки данного товара.

 


Плохо 1 2   3 4   5 6   7     8     9     10 Отлично

 

1. Общее качество приготовленных блюд

2. Расположенность недалеко от дома

3. Близко от работы

4. Качество обслуживания

5. Скорость обслуживания.

 

Следующей важной задачей является классификация объектов или людей. При этом используются данные о реальной и смоделированной совокупности.

 

Действительный статус Всего

Предположит. стат.

    Не явл-ся пос-м Явл-ся посм
Не является посетителем 117 94 (80,3 %) 23 (19,7 %)
Является посетителем 296 61 (20,6 %) 235 (79,4 %)
Всего 413    

 

Данные свидетельствуют о том, что 80,3 % из числа лиц, не являющихся посетителями, отнесены к той же группе, а 19,7 % ошибочно были отнесены к посетителям.

Проблема в том, чтобы определить, являются ли данные моделирования достаточными для принятия решения. При этом для оценки используются критерии случайной пропорциональности:

с= р2 + (1 - р)2

 

р- доля лиц, попавших в группу 1

(1 - р) - доля лиц, попавших в группу 2.

 

Мы правильно классифицировали 80,3 %, т.о. наша модель позволяет классифицировать людей на посетителей и непосетителей.

 

Кластерный анализ.

 

Используется для технических процедур; используется для классификации людей и объектов по нескольким признакам одновременно. Цель - объединить объекты так, чтобы в одну группу попали насколько возможно однородные объекты и чтобы различные группы отличались существенно между собой.

 

Существует несколько процедур кластеризации, но все они базируются на использовании мер или критериев близости. Наиболее распространенным критерием близости является среднеквадратическая разность.

 

Евклидово расстояние - расстояние между объектами

 

d (Xi; Xj) = [å (Xik - Xjk)2 ]2

 

Суть в том, что последовательно объединяются объекты сначала более близкие, а затем все более отдаленные друг от друга. Работа алгоритма заканчивается, когда все объекты будут объединены в один класс. Результатом обычно является графическое изображение, иллюстрирующее вид иерархического дерева (дендрограмма).

 

Описанный алгоритм не имеет четких правил остановки на каком-то этапе кластеризации. Обычно исследователи принимают во внимание устойчивость групп на протяжении нескольких шагов алгоритма. В кластерном анализе не рекомендуется использовать большое количество факторов. Существует зависимость между количеством объектов и количеством факторов.

 

         lg n

L max = lg 2

 

Иногда используются многомерные средние (объединение нескольких признаков в общий).

 

Факторный анализ.

 

Факторный анализ - это процедура упрощения исходных данных через сокращение переменных до меньшего числа факторов. Целью является сводка информации, содержащей большое количественных оценок, меньшее число суммарных величин, называемых факторами. Нет зависимых переменных (как и в кластерном анализе), скомбинировать число переменных.

 

Техническое определение факторов - линейная комбинация переменных. Рассчитывается факторное множество для каждого субъекта в группе данных, при этом каждой переменной соответствует определенный вес в соотношении с тем, сколько она вносит в вариацию каждого фактора.

 

Природа образованных факторов может быть определена с помощью факторных нагрузок. (Это корреляция между каждым факторным множеством и каждой переменной).

 



2019-12-29 190 Обсуждений (0)
VI. МНОГОМЕРНЫЙ АНАЛИЗ 0.00 из 5.00 0 оценок









Обсуждение в статье: VI. МНОГОМЕРНЫЙ АНАЛИЗ

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Модели организации как закрытой, открытой, частично открытой системы: Закрытая система имеет жесткие фиксированные границы, ее действия относительно независимы...
Личность ребенка как объект и субъект в образовательной технологии: В настоящее время в России идет становление новой системы образования, ориентированного на вхождение...
Организация как механизм и форма жизни коллектива: Организация не сможет достичь поставленных целей без соответствующей внутренней...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (190)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.011 сек.)