Мегаобучалка Главная | О нас | Обратная связь


Корреляционный, регрессионный и факторный анализ



2019-11-21 799 Обсуждений (0)
Корреляционный, регрессионный и факторный анализ 0.00 из 5.00 0 оценок




Первооткрывателем корреляционного метода является французский естествоиспытатель и натуралист Жорж Кювье (George Cuvier, 1769–1832). Закон Корреляции был выведен им средствами сравнительной анатомии. Кювье понял, что органы одного организма соответствуют друг другу и его общим условиям существования. Так, травоядные имеют зубы, приспособленные для пережевывания растений, а на ногах у них копыта для быстрого бега от хищников. У хищников же выдающиеся клыки, а на ногах когти, и т. д. По его утверждению, ему было под силу восстановить всё животное по одной его части.

 

Таким образом, корреляция – показатель, отражающий взаимную зависимость двух или более величин. При этом величины должны выбираются случайно, а зависимость может определяться либо совпадением, либо отношениями причинности. Необходимо выяснить, не является ли корреляция ложной, то есть основанной на совпадении. Для этого вводится еще одна новая случайная величина. Только при изменении значения одной величины, которое влечет за собой неминуемое систематическое изменение значения другой величины, корреляция считается установленной. Такое изменение может быть выражено в виде коэффициента корреляции, или корреляционного отношения. Коэффициент корреляции показывает, насколько тесно две переменных связаны между собой.

 

Статистической характеристикой при проверке значимости корреляции служит отношение самого коэффициента к его утроенной ошибке.

 

Различают два вида зависимостей, которые присущи объективным явлениям природы и общества. Функциональная зависимость – это взаимосвязь между признаками, в которой каждому значению одного признака соответствует единственное значение другого признака. Простейшей ее формой является линейная зависимость, характеризующаяся уравнением: y = ax + b .

 

К другими формами функциональной зависимости, относятся: парабола ( y = ax2 + bx + c ), гипербола (ax by k+= ), логарифмическая функция ( y = a lg x )

 

Функциональная зависимость предполагает изолированность взаимосвязанных признаков от воздействия других факторов. Но такая ситуация в явлениях общественной жизни практически не встречается. В случае, если на связь между признаками влияет множество других факторов, и она проявляется лишь в тенденции, «в среднем», то такая зависимость носит название статистической, или корреляционной. Для того, чтобы определить тесноту связи между двумя признаками, следует высчитать так называемый парный линейный коэффициент корреляции.

 

В качестве примера подобных вычислений приведем данные из книги Б.Н. Миронова «История в цифрах», где была определена степень корреляционной зависимости между доходом и размерами помещичьего хозяйства в России на рубеже XIX-XX вв. по сведениям о размерах (в десятинах) и доходах (в тыс. руб.) десяти помещичьих имений6 .Доходность имения зависела от его размера, но, кроме этого на нее влияло и качество земли, и состояние хозяйства, и деловые способности владельца, а также близость рынка и другие факторы. В связи с этим, исследователь поставил задачу узнать, насколько же размер имения влиял на доходность имения.

 

При анализе статистической зависимости важна не только оценка тесноты связи между признаками, но и выявление ее формы. Данная задача решается методами регрессионного анализа. Регрессионный анализ представляет собой совокупность методов математической статистики, которые позволяют определить форму связи между результативным и факторным признаками, установленной корреляционным анализом. Корреляционная связь описывается уравнением регрессии с помощью с помощью подходящей функции. Простейшее уравнение линейной регрессии: y = ax + b, где x - факторный признак; y - результативный признак; a и b – параметры уравнения, которые могут быть найдены методом наименьших квадратов.

 

Регрессионный анализ не используется для определения наличия связи между переменными, ввиду того, что наличие такой связи и есть предпосылка для применения анализа.

 

Линейная регрессия достаточно хорошо работающим в ряде простых задач. К ее достоинствам относится простота алгоритма и высокое быстродействие. Недостаток только один – неприспособленность к решению существенно нелинейных задач.

 

Корреляционный анализ выявляет структуру взаимосвязей признаков, характеризующих изучаемое явление или процесс, но не способен объяснить, чем обусловлена именно такая структура связей. Ответить на этот вопрос позволяют методы факторного анализа.

 

Факторный анализ объединяет методы анализа структуры множества признаков, характеризующих изучаемые явления и процессы, и выявления обобщенных факторов. В его основе лежит положение о том, что корреляционные связи между большим числом наблюдаемых показателей определяются существованием меньшего числа гипотетически наблюдаемых показателей или факторов.

 

Объяснение множества исходных признаков через небольшое число общих факторов осуществляется сжатием информации, которая содержится в исходных коррелированных признаках.

 

Основными характеристиками факторного анализа являются факторные нагрузки и факторные веса.

 

Факторная нагрузка - это значение коэффициентов корреляции каждого из исходных признаков с каждым из выявленных факторов. Чем теснее связь данного признака с рассматриваемым фактором, тем выше значение соответствующей факторной нагрузки. Положительный знак факторной нагрузки указывает на прямую связь данного признака с фактором, а отрицательный знак – на обратную. Если значение факторной нагрузки близко нулю, то это свидетельствует о том, что этот фактор практически не влияет на данный признак.

 

Данные о факторных нагрузках позволяют судить о выборе исходных признаков, отражающих тот или иной фактор, и об относительной доле отдельных признаков в структуре каждого фактора.

 

Факторные веса – это количественные значения выделенных факторов для каждого из n имеющихся объектов. У объектов с большими значениями факторных весов большая большая степень проявления свойств, присущих данному фактору. Факторы определяются как стандартизированные показатели со средним арифметическим значением 0 и средним квадратическим отклонением 1. Вследствие этого положительные факторные веса соответствуют тем объектам, которые характеризуются степенью проявления свойств больше средней, а отрицательные факторные веса соответствуют тем объектам, в которых степень проявления свойств меньше средней. Объекты ранжируются в пределах каждого фактора исходя из данных о факторных весах. А их, в свою очередь, можно рассматривать как значения индекса, характеризующего уровень развития объектов в рассматриваемом аспекте.

 

Соответственно, факторные веса могут стать основой классификации исследуемых объектов. Создание многомерной типологии на основе факторного анализа особенно эффективно в том случае, если имеется большое число признаков, характеризующих совокупность объектов, но их содержательный отбор представляет значительные трудности. В такой ситуации необходимо «сжатие» информации, после чего проводится классификация по любому из выделенных факторов.

 

В качестве примера эффективного использования факторного анализа можно назвать работу И.Д.Ковальченко и Л.И.Бородкина, посвященную изучению аграрной структуры районов Европейской России на рубеже XIX-XX веков. Исследователи не только охарактеризовали основные компоненты аграрной структуры, определив их сравнительные доли, но и получили обобщенные характеристики общего уровня аграрного развития отдельных районов и губерний страны.

 

Вывод

Самое широкое применение в исследовательской практике историков получили методы математической статистики. Эти методы особенно эффективны при изучении массовых исторических источников. Они позволяют решать задачи статистического описания совокупности объектов (методы дескриптивной статистики), статистического оценивания параметров генеральной совокупности по выборочным данным (выборочный метод), статистического анализа взаимосвязей (методы корреляционного и регрессионного анализа), классификации объектов или признаков (методы кластерного и факторного анализа), сжатия информации (методы факторного анализа). Применяя методы математической статистики, историк получает информацию, которая не может быть выявлена описательными методами. Это позволяет строить модели изучаемых явлений и процессов, адекватно отражающие их внутреннюю суть, итогом анализа которых является приращение знания.

Литература

1. МАТЕМАТИЧЕСКИЕ МЕТОДЫ В ИСТОРИЧЕСКИХ ИССЛЕДОВАНИЯХ. ., Негин А.Е., Миронос А.А Электронное учебно-методическое пособие. – Нижний Новгород: Нижегородский госуниверситет, 2012. – 31 с.

 

2. Шендерюк М.Г. Количественные методы в источниковедении: Учеб. посо- бие / Калинингр. ун-т. - Калининград, 1996. - 75 с. - ISBN 5-88874-043-8.

 



2019-11-21 799 Обсуждений (0)
Корреляционный, регрессионный и факторный анализ 0.00 из 5.00 0 оценок









Обсуждение в статье: Корреляционный, регрессионный и факторный анализ

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Организация как механизм и форма жизни коллектива: Организация не сможет достичь поставленных целей без соответствующей внутренней...
Как вы ведете себя при стрессе?: Вы можете самостоятельно управлять стрессом! Каждый из нас имеет право и возможность уменьшить его воздействие на нас...
Генезис конфликтологии как науки в древней Греции: Для уяснения предыстории конфликтологии существенное значение имеет обращение к античной...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (799)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.006 сек.)