Мегаобучалка Главная | О нас | Обратная связь


СТАТИСТИЧЕСКИЕ СРАВНЕНИЯ



2016-01-05 2258 Обсуждений (0)
СТАТИСТИЧЕСКИЕ СРАВНЕНИЯ 0.00 из 5.00 0 оценок




Статистические гипотезы.

Решение той или иной задачи исследования эмпирического уровня, как правило, не обходится без сравнений. Сравнивать приходится данные экспериментальной и контрольной групп, данные двух экспериментальных групп и т.д. О преимуществе одной из сравниваемых групп судят обычно по разности между выборочными средними. Но так как выборочные показатели – величины случайные, варьирующие вокруг своих генеральных параметров, которые в подавляющем большинстве случаев остаются неизвестными, то и разность между этими показателями может возникнуть не в следствие систематически действующих на признак, а чисто случайных причин. Чтобы решить вопрос об истинной значимости различий, наблюдаемых между выборочными средними, исходят из статистических гипотез – предположений или допущений о неизвестных генеральных параметрах, выражаемых в терминах вероятности, которые могут быть проверены на основании выборочных показателей.

В педагогической статистике обычно применяется так называемая нулевая гипотеза (Н0),т.е. предположение о том, что между генеральными параметрами сравниваемых групп разница ровна нулю и различия, наблюдаемые между выборочными показателями, носят не систематический, а исключительно случайный характер. Так, если одна выборка взята из совокупности с параметрами х1 и s1 , а другая – из совокупности, характеризуемой параметрами х2 и s2 то нулевая гипотеза предполагает, что х1 = х2, s1 = s2 и х1 – х2 = 0, а s1 - s2 = 0.

Противоположная, или альтернативная (НА), гипотеза, наоборот, исходит из предположения, что х1 – х2 ¹ 0, а s1 - s2 ¹ 0.

Истинность принятой гипотезы проверяется с помощью критериев значимости, или достоверности, т.е. специально выработанных случайных величин, функции распределения которых известны.

Другое дело варьирующие, случайные признаки и величины. Здесь приходится встречаться не с приращением или уменьшением функций, а с сопряжённой вариацией, выражения её в виде взаимосвязанных отклонений вариант от их средних.

Корреляционную зависимость для случайных величин принято оценивать через коэффициент корреляции.

Коэффициент корреляции ( r ) отражает степень, тесноту взаимосвязи между парой показателей, параллелизм в появлении пар показателей и их применение.

Коэффициент корреляции выражает долю общих причин, из всех возможных, определяющих развитие или проявление пары показателей.

 

СВОЙСТВА КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

1. Коэффициент корреляции – это отвлечённое число, лежащее в пределах от –1 до +1.

2. Если r=0, то корреляционной зависимости нет. В этом случае экспериментальные точки располагаются по кругу, а линия регрессии параллельна оси абсцисс.

 

Y   r = 0   x  

 

3. Чем сильнее связь между признаками, тем больше и величина коэффициента корреляции. Следовательно, если r>0, то с возрастанием одного значения показателя, возрастает и другое. Экспериментальные точки располагаются в виде эллипса вокруг линии регрессии.

Y y 0<r<1 -1<r<0     x x

 

Если r<0, то с нарастанием одного показателя, другой убывает.

4. Если коэффициент корреляции равен + - 1, то корреляционная зависимость превращается в функциональную (положительную или отрицательную) – экспериментальные точки располагаются на одной прямой.

 

y y r = -1,0 r = 1,0   x x


Обычно для каждого критерия составляется таблица, в которой содержаться критические точки, отвечающие определённым числам степеней свободы (n – 1) и принятом уровнем значимости (Р0). Уровень значимости - значение вероятности, при котором различия, наблюдаемые между выборочными показателями, можно считать несущественными, случайными. В исследовательской работе обычно принимается 5%-й уровень значимости, которому отвечает вероятность Р = 0,05 и нормированное отклонение неравно 1,96, если распределение критерия нормально. Например, если окажется, что Р0 >= 0,05, нулевая гипотеза сохраняется, отвергнуть её на 5%-ом уровне значимости нет оснований. Это значит, что разница, наблюдаемая между выборочными показателями, случайна. Если же Р0<0,05, нулевая гипотеза опровергается на 5%-ом уровне значимости, т.е. с вероятностью Р>0,95 разница между выборочными показателями считается статистически значимой, или достоверной. В более ответственных случаях применяется 1%-й уровень значимости, которому соответствуют Р0 = 0,01 и t = 2,58 для нормального распределения критерия, или ещё более высокий 0,1%-й уровень значимости, которому отвечает Р0 = 0,001 и t = 3,29.

Из параметрических критериев в педагогических исследованиях применяется главным образом t – критерий Стьюдента и f – критерий Фишера.

Рассмотрим метод сравнения средних арифметических с применением t – критерием Стьюдента.

Метод сравнения средних используется:

· при анализе критериев, отбора и ориентации

· при выяснении уровня развития различных показателей организма в возрастном плане, в квалификационном и т.д.

Цель – выяснить, имеются ли различия средних арифметических (одинаковых размерностей) по двум случайным выборкам.

Задачи: 1. Выявить, надёжно ли исходные случайные выборки представляют статистическое различие средних арифметических (хсред);

2. Определить, имеет ли существенное практическое значение степень установленного различия.

ПРИМЕР: в исследованиях предстояло выяснить, как влияют занятия спортом на функцию внешнего дыхания подростков 15-16 лет. Взяты две группы подростков – занимающихся спортом (25 человек) и не занимающихся спортом (25 человек). Измерялась скорость воздушной струи при форсированном вздохе. n1 = n2 = 25; x1 сред = 5,2л/с, s1 = 1,1л/с; x2 сред = 3,8 л/с, s2 = 0,8л/с.

Необходимо решить основную задачу – надёжно ли исходные выборочные данные представляют различие средних, т.е. нужно установить, принадлежат ли обе группы к одной генеральной совокупности или к разным (по данному показателю).

1 СПОСОБ:

Сравнивают доверительные интервалы ожидаемых значений средних (хсред) занимающихся и не занимающихся спортом по скорости дыхания.

1. Рассчитываем статистические ошибки средних: mх сред 1 = s1 / Ön1 = 1,1 / 5 = 0,2 л/сек, mх сред 2 = s2 / Ön2 = 0,8/ 5 = 0,16 л/с. mх сред 1 и mх сред 2 показывают, насколько выборочные средние x1 сред и x2 сред отличаются от истинных х1 сред N и х2 сред N на генеральной совокупности.

2. Задаём Рдов и Р0 : Рдов = 0,95 Þ Р0 = 0,05.

3. Определяем число степеней свободы первой и второй выборки: n|1 = n1 –1 = 24; n|2 = n2 – 1 = 24.

4. По таблице критических значений t-критерия Стьюдента определяем t st для первой и второй выборки: tst (1,2) = 2,064 = 2,1.

5. Расчёт границ доверительных интервалов: x N сред = х n сред + - mx сред tst. X1 N сред = 5,2 + - 0,2*2,1 = {хсред N 1B = 5,6 л/с и хсред N 1 Н = 4,8 л/с, х сред N 2 = 3,8 + - 0,16*2,1 = {xсред N 2 B = 4,1 л/с и х сред N 2 H = 3,5 л/с.

 

1 2

хсред

3,5 3,8 4,1 4,8 5,2 5,6

 

 

6. Статистические выводы. Если установлено, что границы доверительных интервалов для ожидаемых средних не пересекаются, то говорят, что с заданной доверительной вероятностью (Рдов) установлено надёжное статистическое различие средних. Значит, исходные выборочные данные надёжно (достоверно) представили различия между средними арифметическими величинами по функции дыхания между занимающимися и не занимающимися спортом.

ЗАМЕЧАНИЕ: если доверительные интервалы пересекаются, т.е. имеются одинаковые ожидаемые значения средних, то говорят, что исходные выборочные данные ненадёжно представили различия между средними. Это не означает, что между х1 серд и х2 сред нет различий, это значит, что нет надёжности и наши выборки не отразили их, значит даже нет смысла продолжать исследования.

7. Практические выводы – отрицательные или положительные выводы делаются только и только на достоверном результате сравнения. Если результаты сравнения средних не достоверны (исходные данные плохо представили различия средних), то предлагают увеличить число испытуемых, но практических выводов, ни положительных, не отрицательных не делают.

 

2 СПОСОБ:

Фундаментальный – через доверительный интервал для разности средних.

1. Определим разность средних: Дn = (x1 сред – х2 сред) = 5,2 – 3,8 = 1,4 л/с.

2. Находим ошибку репрезентативности разности средних: mД = Ö(n1 – 1)s22 + (n2 - 1)s12 / n1 + n2 –2 * n1 + n2 / n1 n2 , если n1¹ n2 <=30 если n1 = n2 (n1 ¹ n2 > 30): mД = Ömx сред 12 + mx 22 = Ö0,222 + 0,162 = 0,25 л/с.

3. (подготовительный) – задаём Рдов и Р0: Рдов = 0,05 Þ Р0 = 0,05.

4. Определим число степеней свободы: n| = n1 + n2 – 2 = 48.

5. Расчёт границ доверия истинных значений: DN = Dn + - mD * tst , значение tst находим по таблице для Р0 = 0,05, n| = 48 Þ tst = 2. DN = 1,4 + - 0,25*2 = 1,4 + - 0,5 = { DNB = 1,9(л/сек) ; DNH = 0,9(л/сек). 0,9<=DN<=1,9.

6. Статистические выводы – делаются по смыслу доверительного интервала. Поскольку границы доверительного интервала одинакового знака, т.е. всегда группа занимающихся спортом подростков по функциям дыхания превосходит, в среднем, группу не занимающихся, с вероятностью Рдов = 0,95, т.о. различия выборочных средних достоверно представляют различия генеральных средних (хN1сред и хN2сред). Замечания: если границы доверительного интервала для ожидаемых различий средних разного знака (+/-), то говорят, что различие средних недостоверно, и исходные данные (выборочные) ненадёжно представляют различия генеральных средних.

7. Практические выводы (строятся только на достоверных результатах сравнения, так же, как в способе №1).

 

3 СПОСОБ:

Используется более часто, более компактный. Сравнение средних по t-критерию Стьюдента исходя из нулевой статистической гипотезы (сопоставление t расчётного и табличного).

1. Найдём разницу средних D = x1сред – x1сред = 1,4 (л/сек).

2. Найдём ошибку репрезентативности разности средних: mD = х1сред – х2сред /Ön = 1,4 / 5 = 0,25 л/сек.

3. По нулевой гипотезе рассчитываем tst, такое по величине, при котором доверительный интервал включит в себя DN = 0 – это будет критическое значение tst , при котором различие средних станет недостоверным, ненадёжным: tрасч = D – DN / mD = 1,4 – 0 / 0,25 = 5,6.

4. Рдов = 0,95 Þ Р0 = 0,05.

5. n| = n1 + n2 – 2 = 48.

6. По таблице критических значений t-критерия Стьюдента находим tst табличное (tтабл): Рдов = 0,95 Þ Р0 = 0,05 Þ tтабл = 2.

7. Статистические выводы: если tst табл < | tрасч | , то доверительный интервал, построенный по второму способу, наверняка не захватит нулевых значений разности средних и она будет достоверна. В нашем случае tst табл < tst расч , т.к. 2 < 5,6 – различия достоверны:

 

 

D0 H D0 B

( ) D0

0 0,9 1,4 1,9

 

В нашем примере говорят, что нулевая гипотеза отвергается, значит различия достоверны.

Замечание: если tst табл больше или равно по модулю tst расч , то доверительный интервал ожидаемой разности средних захватывает нулевые значения t0 = 0, и результаты сравнения средних считаются недостоверными, нулевая гипотеза подтверждается.

8. Практические выводы – строятся так же, как в 1 и 2 способе.

 



2016-01-05 2258 Обсуждений (0)
СТАТИСТИЧЕСКИЕ СРАВНЕНИЯ 0.00 из 5.00 0 оценок









Обсуждение в статье: СТАТИСТИЧЕСКИЕ СРАВНЕНИЯ

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ...
Организация как механизм и форма жизни коллектива: Организация не сможет достичь поставленных целей без соответствующей внутренней...
Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (2258)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.007 сек.)