Мегаобучалка Главная | О нас | Обратная связь


Линейные регрессионные модели



2015-11-12 776 Обсуждений (0)
Линейные регрессионные модели 0.00 из 5.00 0 оценок




Регрессионный анализ – это статистический метод исследования функциональной связи случайной величины y от переменных , , рассматриваемых как неслучайные (известные) многомерные случайные величины с произвольной функцией распределения.

Задачей регрессионного анализа является построение зависимости изучаемой случайной величины y от факторов x по результатам наблюдения:

ξ, (1.4)

где – неизвестные параметры, ξ– случайные ошибки или остатки, – независимые наблюдения, [27].

Регрессионные модели бывают линейными и нелинейными. В линейной регрессионной модели математическое ожидание зависимой переменной – это линейная комбинация регрессоров с неизвестными коэффициента, что функция линейна по параметрам. Уравнение линейной регрессии записывается следующим образом:

, (1.5)

– известные функции, – оценка параметров регрессии.

Будем рассматривать линейные оценки истинных параметров. Можно найти оценки , которые являются состоятельными, несмещенными и обладают наименьшими дисперсиями среди множества всех линейных несмещенных оценок [27]. Такие оценки называются наилучшими линейными оценками, и в случае независимых и распределенных с одинаковыми дисперсиями случайными ошибками ξ вычисляются по формуле:

, (1.6)

где матрица равна

, (1.7)

матрица равна

. (1.8)

Средний квадрат ошибки прогноза равен

. (1.9)

Ковариационная матрица ошибок оценок равна

. (1.10)

Ширина коридора ошибок в данном случае определяется по формуле:

, (1.11)

где ε – уровень доверия, а

Для оценивания точности регрессионной модели используют коэффициент детерминации. Коэффициентом детерминации называется число:

. (1.12)

Коэффициент детерминации определяет наличие функциональной связи вида (1.9). Если , то , то есть неучтенные ошибки будут определяющими. Следовательно, линейная связь между и отсутствует. Если , то , то вектор однозначно определяется переменными . Если , то связь между и недостаточно подтвержденная. Если , то говорят о наличии средней связи. При , применение линейной регрессии обосновано и связь сильная [27].

Факторный анализ

Факторный анализ является естественным обобщением и развитием метода главных компонент. Если объект описывается с помощью n признаков, то в результате действия метода получается математическая модель, зависящая от меньшего числа переменных. При этом предполагается, что на исходные измеряемые данные оказывает влияние небольшое число латентных признаков. Цель факторного анализа заключается в выявлении этих скрытых характеристик (факторов) и оценивании их числа.

Запишем факторную модель в общем виде

, (1.13)

где , – факторы, – факторные нагрузки, – латентные факторы,

Техника факторного анализа направлена на определение факторных нагрузок, дисперсий характерных факторов и значений факторов для каждого наблюдаемого объекта.

Запишем двухфакторную модель в виде:

,

причем на накладывают условие взаимной некоррелированности и условие нормировки .

Нахождение факторных нагрузок и факторов осуществляется с помощью метода неопределенных множителей Лагранжа из условия минимизации . Так как , то функция Лагранжа определяется следующим равенством:

где – неизвестные множители.

Для нахождения условного экстремума дифференцируем функцию Лагранжа по и приравниваем найденные производные нулю:

(1.14)

где .

Можно показать, что . Тогда имеет место случай однофакторной модели, причем за фактор взят вектор . Решение этой задачи известно: – собственные вектора матрицы ковариаций , – ее собственные числа. При этом дисперсия достигает минимума, если и будут первым и вторым наибольшими по величине собственными числами матрицы .

Вводя в рассмотрение матрицу P c центрированными элементами исходных данных по формуле и учитывая выполнение соотношения , полученного ранее в однофакторной модели, определим факторы как собственные вектора матрицы P, соответствующие ее первым максимальным по абсолютной величине собственным числам и .

Рассмотрение общего случая p–факторной модели производится в полном соответствии с двухфакторной моделью. Однако следует помнить, что при вычислении факторов и факторных нагрузок необходимо задействовать уже p наибольших по величине собственных чисел и p соответствующих им собственных векторов.

Найденные образуют в пространстве признаков новый базис, а играют роль координат в этом базисе.

После определения факторов исследователю зачастую требуется оценить уровень информативности или вклад фактора в суммарную дисперсию всех признаков.

Определение: пусть имеется n-факторная модель. Пусть – некоторый фактор, . Вкладом фактора в суммарную дисперсию всех признаков называется число , где – собственное число выборочной матрицы ковариаций .

Очевидно, что для n-факторной модели общая дисперсия есть . В этом случае называют еще суммарной общностью факторов .

Определение: долей фактора в суммарной общности называется отношение . Оно характеризует долю, которую вносит фактор в факторную модель.

Определение: пусть – собственные числа выборочной матрицы ковариаций . Пусть собственному числу соответствует фактор и имеются факторные нагрузки , которые, в свою очередь, являются наибольшими по абсолютной величине координатами вектора . Тогда число называется коэффициентом информативности признаков .

Данное число определяет, какие вектора из множества вносят наибольший вклад в название . Принято считать набор объясняющих признаков удовлетворительным, если [21]


 



2015-11-12 776 Обсуждений (0)
Линейные регрессионные модели 0.00 из 5.00 0 оценок









Обсуждение в статье: Линейные регрессионные модели

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Как построить свою речь (словесное оформление): При подготовке публичного выступления перед оратором возникает вопрос, как лучше словесно оформить свою...
Как вы ведете себя при стрессе?: Вы можете самостоятельно управлять стрессом! Каждый из нас имеет право и возможность уменьшить его воздействие на нас...
Генезис конфликтологии как науки в древней Греции: Для уяснения предыстории конфликтологии существенное значение имеет обращение к античной...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (776)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.01 сек.)