Структурные средние величины
К наиболее часто используемым структурным средним относятся статистическая мода и статистическая медиана. Статистическая мода - это наиболее часто повторяющееся значение величины X в статистической совокупности. Если X задан дискретно, то мода определяется без вычисления как значение признака с наибольшей частотой. В статистической совокупности бывает 2 и более моды, тогда она считается бимодальной(если моды две) илимультимодальной (если мод более двух), и это свидетельствует о неоднородности совокупности. Например, на предприятии работает 16 человек: 4 из них - со стажем 1 год, 3 человека - со стажем 2 года, 5 - со стажем 3 года и 4 человека - со стажем 4 года. Таким образом, модальный стаж Мо=3 года, поскольку частота этого значения максимальна (f=5). Если X задан равными интервалами, то сначала определяется модальный интервал как интервал с наибольшей частотой f. Внутри этого интервала находят условное значение моды по формуле: где Мо – мода; ХНМо – нижняя граница модального интервала; hМо – размах модального интервала (разность между его верхней и нижней границей); fМо-1 – частота интервала, предшествующего модальному; fМо+1 – частота интервала, следующего за модальным. Например, на предприятии 10 работников со стажем работы до 3 лет, 20 - со стажем от 3 до 5 лет, 5 работников - со стажем более 5 лет. Рассчитаем модальный стаж работы в модальном интервале от 3 до 5 лет: Мо = 3 + 2*(20-10)/(2*20-10-5) = 3,8 (года). Если размах интервалов h разный, то вместо частот f необходимо использовать плотности интервалов, рассчитываемые путем деления частот f на размах интервала h. Статистическая медиана – это значение величины X, которое делит упорядоченную по возрастанию или убыванию статистическую совокупность на 2 равных по численности части. В итоге у одной половины значение больше медианы, а у другой - меньше медианы. Если X задан дискретно, то для определения медианы все значения нумеруются от 0 до N в порядке возрастания, тогда медиана при четном числе N будет лежать посередине между X c номерами 0,5N и (0,5N+1), а при нечетном числе N будет соответствовать значению X с номером 0,5(N+1). Например, имеются данные о возрасте студентов-заочников в группе из 10 человек - X: 18, 19, 19, 20, 21, 23, 23, 25, 28, 30 лет. Эти данные уже упорядочены по возрастанию, а их количество N=10 - четное, поэтому медиана будет находиться между X с номерами 0,5*10=5 и (0,5*10+1)=6, которым соотвествует значения X5=21 и X6=23, тогда медиана: Ме = (21+23)/2 = 22 (года). Если X задан в виде равных интервалов, то сначала определяется медианный интервал (интервал, в котором заканчивается одна половина частот f и начинается другая половина), в котором находят условное значение медианы по формуле: где Ме – медиана; ХНМе – нижняя граница медианного интервала; hМе – размах медианного интервала (разность между его верхней и нижней границей); fМе – частота медианного интервала; ∑fМе-1 – сумма частот интервалов, предшествующих медианному. В ранее рассмотренном примере при расчете модального стажа (на предприятии 10 работников со стажем работы до 3 лет, 20 - со стажем от 3 до 5 лет, 5 работников - со стажем более 5 лет) рассчитаем медианный стаж. Половина общего числа работников составляет (10+20+5)/2 = 17,5 и находится в интервале от 3 до 5 лет, а в первом интервале до 3 лет - только 10 работников, а в первых двух - (10+20)=30, что больше 17,5, значит интервал от 3 до 5 лет - медианный. Внутри него определяем условное значение медианы: Ме = 3+2*(0,5*30-10)/20 = 3,5 (года). Также как и в случае с модой, при определении медианы если размах интервалов h разный, то вместо частот f необходимо использовать плотности интервалов, рассчитываемые путем деления частот f на размах интервала h. Также в статистике применяются такие структурные средние величины как квартиль и дециль. Статистический квартиль – это значение величины X, которое делит упорядоченную по возрастанию или убыванию статистическую совокупность на 4 равных по численности части. В итоге у одной половины значение больше медианы, а у другой - меньше медианы. Статистический дециль – это значение величины X, которое делит упорядоченную по возрастанию или убыванию статистическую совокупность на 10 равных по численности части. В итоге у одной половины значение больше медианы, а у другой - меньше медианы. Понятие вариации Средняя величина дает обобщенную характеристику изучаемой совокупности по некоторому варьирующему (изменяющемуся) признаку, т.е. показывает типичный для данных условий уровень этого признака. Поскольку средняя величина - абстрактная величина, то для характеристики структуры ряда привлекаются описательные показатели – мода и медиана. Однако в двух совокупностях средние, мода и медиана могут быть одинаковыми, но отдельные значения признака при этом могут близко примыкаться к средней и мало от нее отличаться или, наоборот, могут далеко отставать (стоять) от средней и сильно от нее отличаться. Нетрудно сделать важный вывод по совокупности: в первом случае средняя будет хорошо представлять (характеризовать) всю совокупность, во втором случае средняя будет плохо представлять всю совокупность. Оценки колеблемости отдельных значений от средней называют показателями вариации. В статистических исследованиях особый интерес представляет анализ систематической вариации, т.к. изучая силу и характер вариации в исследуемой совокупности можно оценить насколько однородной является данная совокупность в количественном, а иногда и качественном отношении, а следовательно насколько характерной является исчисленная средняя величина. Поэтому средние характеристики необходимо дополнять показателями, измеряющими отклонения от средних. Для всех показателей вариации общим является следующие:
Показатели вариации Вариацию можно определить как количественное различие значений одного и того же признака у отдельных единиц совокупности. Термин «вариация» имеет латинское происхождение - variatio, что означает различие, изменение, колеблемость. Изучение вариации в статистической практике позволяет установить зависимость между изменением, которое происходит в исследуемом признаке, и теми факторами, которые вызывают данное изменение. Вариация - это различие значений величин X у отдельных единиц статистической совокупности. Для изучения силы вариации рассчитывают следующие показатели вариации: размах вариации, среднее линейное отклонение, линейный коэффициент вариации, дисперсия, среднее квадратическое отклонение, квадратический коэффициент вариации. Размах вариации – это разность между максимальным и минимальным значениями X из имеющихся в изучаемой статистической совокупности: Недостатком показателя H является то, что он показывает только максимальное различие значений X и не может измерять силу вариации во всей совокупности. Cреднее линейное отклонение - это средний модуль отклонений значений X от среднего арифметического значения. Его можно рассчитывать по формуле средней арифметической простой - получим среднее линейное отклонение простое: Например, студент сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5. Средняя арифметическая = 4. Рассчитаем среднее линейное отклонение простое: Л = (|3-4|+|4-4|+|4-4|+|5-4|)/4 = 0,5. Если исходные данные X сгруппированы (имеются частоты f), то расчет среднего линейного отклонения выполняется по формуле средней арифметической взвешенной - получим среднее линейное отклонение взвешенное: Вернемся к примеру про студента, который сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5. Ранее уже была рассчитана средняя арифметическая = 4 и среднее линейное отклонение простое = 0,5. Рассчитаем среднее линейное отклонение взвешенное: Л = (|3-4|*1+|4-4|*2+|5-4|*1)/4 = 0,5. Линейный коэффициент вариации - это отношение среднего линейного отклонение к средней арифметической: С помощью линейного коэффициента вариации можно сравнивать вариацию разных совокупностей, потому что в отличие от среднего линейного отклонения его значение не зависит от единиц измерения X. В рассматриваемом примере про студента, который сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5, линейный коэффициент вариации составит 0,5/4 = 0,125 или 12,5%. Дисперсия - это средний квадрат отклонений значений X от среднего арифметического значения. Дисперсию можно рассчитывать по формуле средней арифметической простой - получим дисперсию простую: В уже знакомом нам примере про студента, который сдал 4 экзамена и получил оценки: 3, 4, 4 и 5, ранее уже была рассчитана средняя арифметическая = 4. Тогда дисперсия простая σ2 = ((3-4)2+(4-4)2+(4-4)2+(5-4)2)/4 = 0,5. Если исходные данные X сгруппированы (имеются частоты f), то расчет дисперсии выполняется по формуле средней арифметической взвешенной - получим дисперисю взвешенную: В рассматриваемом примере про студента, который сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5, рассчитаем дисперсию взвешенную: Д = ((3-4)2*1+(4-4)2*2+(5-4)2*1)/4 = 0,5. Свойства дисперсии: Свойство 1. Дисперсия постоянной величины равна нулю.
Если значения X - это доли совокупности, то для расчета дисперсии используют частную формулу дисперсии доли:
Популярное: Почему люди поддаются рекламе?: Только не надо искать ответы в качестве или количестве рекламы... Как вы ведете себя при стрессе?: Вы можете самостоятельно управлять стрессом! Каждый из нас имеет право и возможность уменьшить его воздействие на нас... Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ... ![]() ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (255)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |