Выявление различий в распределении признака - критерий c2 – Пирсона. Ограничения в применении

2018-06-29

1184

Обсуждений (0)

0.00 из 5.00 0 оценок

⇐ Предыдущая 4 5 6 7 8 91011 12 13 Следующая ⇒

Распределения могут различаться по средним, дисперсиям, асимметрии, эксцессу и по сочетаниям этих параметровТрадиционные для отечественной математической статистики критерии определения расхождения или согласия распределений – это метод χ2 – К. Пирсона и λ-критерий Колмогорова- Смирнова. Оба эти метода требуют тщательной группировки данных и довольно сложных вычислений. Кроме того, возможности этих критериев в полной мере проявляются на больших выборках (n>30). Тем не менее, они могут оказаться столь незаменимыми, что исследователю придется пренебречь экономией времени и усилий. Например, они незаменимы в следующих двух случаях: 1) в задачах, требующих доказательства неслучайности предпочтений в выборе из нескольких альтернатив; 2) в задачах, требующих обнаружения точки максимального расхождения между двумя распределениями, которая затем используется для перегруппировки данных с целью применения критерия ϕ* (углового преобразования Фишера). Назначения критерия. Критерий χ2 применяется в двух целях: 1) для сопоставления эмпирического распределения признака с теоретическим – равномерным, нормальным или каким-то иным; 2) для сопоставления двух трех или более эмпирических распределений одного и того же признака На самом деле области применения критерия χ2 многообразны, но мы ограничиваемся только этими двумя, наиболее часто встречающимися на практике, целями).

Описание критерия.

Критерий χ2 отвечает на вопрос о том, с одинаковой ли частотой встречаются разные значения признака в эмпирическом и теоретическом распределениях или в двух и более эмпирических распределениях. Преимущество метода состоит в том, что он позволяет сопоставлять распределения признаков, представленных в любой шкале, начиная от шкалы наименований. В самом простом случае альтернативного распределения "да – нет", "допустил брак – не допустил брака", "решил задачу – не решил задачу". При сопоставлении эмпирического распределения с теоретическим мы определяем степень расхождения между эмпирическими и теоретическими частотами. При сопоставлении двух эмпирических распределений мы определяем степень расхождения между эмпирическими частотами и теоретическими частотами, которые наблюдались бы в случае совпадения двух этих эмпирических распределений. Формулы расчета теоретических частот будут специально даны для каждого варианта сопоставлений. Чем больше расхождение между двумя сопоставляемыми распределениями, тем больше эмпирическое значение χ2 .

Гипотезы.

Возможны несколько вариантов гипотез, в зависимости от задач, которые мы перед собой ставим. Первый вариант: H0: Полученное эмпирическое распределение признака не отличается от теоретического (например, равномерного) распределения. H1: Полученное эмпирическое распределение признака отличается от теоретического распределения. Второй вариант: H0: Эмпирическое распределение 1 не отличается от эмпирического распределения 2. H1: Эмпирическое распределение 1 отличается от эмпирического распределения 2. Третий вариант: H0: Эмпирические распределения 1, 2, 3,... не различаются между собой. Н1: Эмпирические распределения 1, 2, 3, ... различаются между собой. Критерий χ2 позволяет проверить все три варианта гипотез.

Ограничения критерия.

1) Объем выборки должен быть достаточно большим: n>.30.

2) Теоретическая частота для каждой ячейки таблицы не должна быть меньше 5: ƒ≥5. Это означает, что если число разрядов задано заранее и не может быть изменено, то мы не можем применять метод, χ2 не накопив определенного минимального числа наблюдений.

3) Выбранные разряды должны "вычерпывать" все распределение, то есть охватывать весь диапазон вариативности признаков. При этом группировка на разряды должна быть одинаковой во всех сопоставляемых распределениях.

4) Необходимо вносить "поправку на непрерывность" при сопоставлении распределений признаков, которые принимают всего 2 значения. При внесении поправки значение χ2 уменьшается

5) Разряды должны быть неперекрещивающимися: если наблюдение отнесено к одному разряду, то оно уже не может быть отнесено ни к какому другому разряду. Сумма наблюдений по разрядам всегда должна быть равна общему количеству наблюдений.

20. Многофункциональный статистический критерий φ*-угловое преобразование Фишера. Ограничения в применении

Назначение и описание критерия Фишера

Критерий Фишера предназначен для сопоставления двух выборок по частоте встречаемости интересующего исследователя эффекта.

Критерий оценивает достоверность различий между процентными долями двух выборок, в которых зарегистрирован интересующий нас эффект.

Суть углового преобразования Фишера состоит в переводе процентных долей в величины центрального угла , который измеряется в радианах. Большей процентной доле будет соответствовать больший угол φ, а меньшей доле - меньший угол, но соотношения здесь не линейные: φ = 2*arcsin( ), где P - процентная доля, выраженная в долях единицы.

При увеличении расхождения между углами φ1 и φ2 и увеличения численности выборок значение критерия возрастает. Чем больше величина φ*, тем более вероятно, что различия достоверны.

Гипотезы критерия Фишера

H₀: Доля лиц, у которых проявляется исследуемый эффект, в выборке 1 не больше, чем в выборке 2.

H₁: Доля лиц, у которых проявляется исследуемый эффект, в выборке 1 больше, чем в выборке 2.

Ограничения критерия Фишера

1. Ни одна из сопоставляемых долей не должна быть равной нулю. Формально нет препятствий для применения метода φ в случаях, когда доля наблюдений в одной из выборок равна 0. Однако в этих случаях результат может оказаться неоправданно завышенным (Гублер Е.В., 1978, с. 86).

2. Верхний предел в критерии φ отсутствует - выборки могут быть сколь угодно большими.

Нижний предел - 2 наблюдения в одной из выборок. Однако должны соблюдаться следующие соотношения в численности двух выборок:

а) если в одной выборке всего 2 наблюдения, то во второй должно быть не менее 30: n₁=2 -> n₂≥30;
б) если в одной из выборок всего 3 наблюдения, то во второй должно быть не менее 7: n₁=3 -> n₂≥7;
в) если в одной из выборок всего 4 наблюдения, то во второй должно быть не менее 5: n₁=4 -> n₂≥5;
г) при n₁, n₂≥5 возможны любые сопоставления.

2018-06-29

1184

Обсуждений (0)

0.00 из 5.00 0 оценок

⇐ Предыдущая 4 5 6 7 8 91011 12 13 Следующая ⇒

Обсуждение в статье: Выявление различий в распределении признака - критерий c2 – Пирсона. Ограничения в применении

Обсуждений еще не было, будьте первым... ↓↓↓