Мегаобучалка Главная | О нас | Обратная связь


Этапы дискриминантного анализа



2018-06-29 580 Обсуждений (0)
Этапы дискриминантного анализа 0.00 из 5.00 0 оценок




 

Дискриминантный анализ состоит из трех основных этапов.

 

и Выбор переменных-предикторов. Исследователь использует свои теоретическиезнания, практический опыт, догадки и т. п. для того, чтобы составить список переменных, которые могут повлиять на результат группировки (переменную-критерий). В рассматриваемом файле помимо переменной-критерия (оценка) содержится 13 переменных, характеризующих каждого учащегося; это позво-ляет нам сделать все 13 переменных предикторами и включить их в уравнение регрессии. Если бы число переменных было велико (например, несколько со-тен), было бы невозможно применить дискриминантный анализ ко всем пере-менным одновременно. Это обусловлено как концептуальными причинами (возможная коллинеарность переменных, потеря степеней свободы и т. п.), так

 

практическими ограничениями (недостаточный объем оперативной памяти компьютера). Обычно на начальном этапе дискриминантного анализа для пре-дикторов формируется корреляционная матрица. В данном контексте она име-ет особый смысл, называется общей внутригрупповой корреляционной матрицей

 

содержит средние коэффициенты корреляции для двух или более корреля-ционных матриц (каждая для одной группы). Помимо общей внутригрупповой корреляционной матрицы можно также вычислить ковариационные матрицы для отдельных групп, для всей выборки либо общую внутригрупповую кова-риационную матрицу. Нередко исследователи применяют серию t-критериев между двумя группами для каждой переменной либо однофакторный диспер-сионный анализ, если число групп оказывается больше двух. Поскольку целью дискриминантного анализа является составление наилучшего уравнения ре-грессии, дополнительный анализ исходных данных никогда не является лиш-ним. Так, в результате применения t-критериев для данных нашего примера были найдены значимые различия между двумя уровнями переменной оценка для 8 из 13 предикторов. Мы рассмотрим один из наиболее распространенных вариантов дискриминантного анализа, при проведении которого программа ав-томатически исключает несущественные для предсказания предикторы, но по критериям, которые устанавливает сам исследователь.

 

и Выбор параметров. В этой главе будет продемонстрирован один из вариантовдискриминантного анализа. По умолчанию программа реализует метод, кото-рый основан на принудительном включении в регрессионное уравнение всех предикторов, указанных исследователем. В другом варианте используется ме-тод Уилкса (Wilks), относящийся к категории пошаговых методов и основан-ный на минимизации коэффициента Уилкса (λ) после включения в уравнение регрессии каждого нового предиктора. Так же как и в случае множественно-го регрессионного анализа, существует критерий для включения предикторов в уравнение регрессии (по умолчанию таким критерием является F > 3,84)

 

критерий для исключения предикторов из уравнения регрессии (по умолча-нию F < 2,71). Коэффициент λ представляет собой отношение внутригруппо-вой суммы квадратов к общей сумме квадратов и характеризует долю влияния


Пошаговые алгоритмы вычислений

 

предиктора на дисперсию критерия. Со значением λ связаны величины F и p, характеризующие его значимость. Более полное описание вы можете найти в разделе «Представление результатов».

 

Какой же из двух методов предпочтительнее? Как показывает практика, зача-стую компьютер справляется с составлением уравнения регрессии лучше, чем исследователь, задающий список предикторов вручную. Однако встречаются си-туации, когда полезней ограничить самостоятельность компьютера. Например, если провести дискриминантный анализ для наших данных с включением всех переменных, то неверно классифицированы будут 5 объектов из 46. Той же точ-ности прогноза можно достичь всего с 7 предикторами, если выбрать пошаговый метод с отличающимися от принятых по умолчанию установками (как указано ниже в пошаговом алгоритме). В то же время, если использовать пошаговый метод с установками по умолчанию, оставляющий только три предиктора, ко-личество неверно сгруппированных объектов увеличится до 9. Помимо рассмо-тренных программа SPSS располагает и другими методами выбора предикторов, однако их описание выходит за рамки темы данной книги, и при необходимости мы рекомендуем вам обратиться к руководству пользователя SPSS.

 

В Интерпретация результатов. Целью дискриминантного анализа является со-ставление уравнения регрессии с использованием выборки, для которой извест-ны значения и предикторов, и критерия. Это уравнение позволяет по извест-ным значениям предикторов определить неизвестные значения критерия для другой выборки. Разумеется, точность рассчитываемых значений критерия для второй выборки в общем случае не выше, чем для исходной. Так, в нашем при-мере регрессионное уравнение обеспечило около 90 % корректных результатов для той выборки, с помощью которой оно было создано. Соответственно, точ-ность предсказания успешности обучения для 10 претендентов может достигать 90 % лишь в том случае, если выборка претендентов совершенно идентична тем 46 учащимся, данные для которых послужили основой для прогноза.

 



2018-06-29 580 Обсуждений (0)
Этапы дискриминантного анализа 0.00 из 5.00 0 оценок









Обсуждение в статье: Этапы дискриминантного анализа

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Модели организации как закрытой, открытой, частично открытой системы: Закрытая система имеет жесткие фиксированные границы, ее действия относительно независимы...
Личность ребенка как объект и субъект в образовательной технологии: В настоящее время в России идет становление новой системы образования, ориентированного на вхождение...
Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (580)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.008 сек.)