Мегаобучалка Главная | О нас | Обратная связь


Показатели колеблемости признака



2020-03-17 233 Обсуждений (0)
Показатели колеблемости признака 0.00 из 5.00 0 оценок




 

В ходе анализа средних величин возникает вопрос степени колеблемости, степени вариации, скрывающейся за средней величиной. Для характеристики колеблемости варьирующего признака в изучаемой совокупности явлений применяются следующие показатели:

Размах вариации;

Среднее линейное отклонение;

Дисперсия;

Среднее квадратическое отклонение;

Коэффициент.

Размах вариации или размах колеблемости является наиболее простым измерителем вариации признака. Он равен разности между наибольшим (максимальным) и наименьшим (минимальным) значением варьирующего признака в данном ряду.

 

R = xmax - xmin.

 

При определении величины размаха вариации учитываются только два крайних значения признака, колеблемость же и распространенность (частота) его в этом показателе не находят отражения.

Среднее линейное отклонение является несколько более совершенной мерой вариации и характеризует колеблемость значений признака по всей совокупности явлений.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных отклонений варьирующего признака от его среднего значения. Так как алгебраическая сумма отклонений индивидуальных значений признака от средней арифметической всегда равна 0, то для расчета среднего линейного отклонения используется арифметическая сумма отклонений, т.е. суммируются абсолютные значения индивидуальных отклонений независимо от знака.

Среднее линейное отклонение  вычисляется по следующим формулам:

 

Для первичного ряда:

Для вариационного ряда:

Дисперсия s2 - средняя из квадратов отклонений вариантов значений признака от их средней величины. Дисперсия рассчитывается по следующим формулам:

Для первичного ряда:

 

 

для вариационного ряда:

 

 

Формулу для расчета дисперсии можно преобразовать:

 

,

 

т.е. дисперсия равна разности средней из квадратов и квадрата средней. Этой формулой пользуются машинной обработке исходных данных.

Дисперсия обладает рядом свойств, некоторые из них позволяют упростить ее вычисления:

дисперсия постоянной величины равна 0;

если все варианты значений признака уменьшить на одно и то же число, то дисперсия не уменьшится;

если все варианты значений признака уменьшить в одно и то же число раз (k раз), то дисперсия уменьшится в k2 раз.

Среднее квадратическое отклонение представляет собой среднюю, исчисленную на основе квадратов отклонений отдельных значений варьирующего признака от их среднего значения.

Среднее квадратическое отклонение s представляет собой корень квадратный из дисперсии:

Для первичного ряда:

 

 

Для вариационного ряда:

 

 

Размах вариации, среднее линейное и среднее квадратическое отклонение являются величинами именованными. Они имеют те же единицы измерения, что и индивидуальные значения признака.

Дисперсия и среднее квадратическое отклонение - наиболее широко применяемые показатели вариации. Объясняется это тем, что они входят в большинство теорем теории вероятности, служащих фундаментом математической статистики.

Расчет показателей вариации для предприятий, сгруппированных по среднегодовой стоимости основных фондов, показан в таблице.

 

Средняя годовая стоимость ОФ, млн. руб. Число предприятий f Средина интервала X’        
3,7-4,6 2 4,15 8,30 -1,935 3,870 7,489
4,6-5,5 4 5,05 20, 20 -1,035 4,140 4,285
5,5-6,4 6 5,95 35,70 -0,135 0,810 0,109
6,4-7,3 5 6,85 34,25 +0,765 3,825 2,926
7,3-8,2 3 7,75 23,35 +1,665 4,995 8,317
ИТОГО 20   121,70   17,640 23,126

 

 

Среднее линейное отклонение:

 

 

Среднее квадратическое отклонение:

 

Дисперсия:

 

Так как средняя величина колеблемости средней годовой стоимости основных фондов составляет:

По среднему линейному отклонению - 0,822 млн. руб.

По среднему квадратическому - 1,075 млн. руб.

Среднее квадратическое отклонение является мерилом надежности средней. Чем меньше среднее квадратическое отклонение, тем лучше средняя арифметическая отражает всю представляемую совокупность.

При сравнении колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях с различной величиной средней арифметической пользуются относительными показателями вариации. Эти показатели вычисляются как отношение абсолютных показателей вариации к средней арифметической (или медиане). Используя в качестве абсолютного показателя вариации размах, среднее линейное отклонение, среднее квадратическое отклонение, относительные показатели колеблемости:

 

Коэффициент осцилляции  -

 

отражает относительную колеблемость значений признака вокруг средней, крайних.

Относительное линейное отклонение

 

 

 

- характеризует долю усредненного значения абсолютных отклонений от средней величины.

 

Коэффициент вариации

 

Наиболее часто применяется показатель колеблемости - коэффициент вариации. Его используют не только для сравнительной оценки вариации, но и для характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%.

Для рассмотренного примера:

 

 

Оставалась на коэффициенте вариации, можно сделать вывод, что по размеру прибыли совокупность является однородной.

Если статистическая совокупность разбита на группы по какому-либо признаку, то для оценки влияния различных факторов, определяющих колеблемость индивидуальных значений признака, можно воспользоваться разложением дисперсии на составляющие: на межгрупповую и внутригрупповую дисперсии.

Общая дисперсия характеризует вариацию признака, которая зависит от всех условий в данной совокупности и вычисляется:

 

 


где -    общая средняя для всей изучаемой совокупности.

Межгрупповая дисперсия отражает вариацию изучаемого признака, которая возникает под влиянием признака фактора, положенного в основу группировки. Она характеризует колеблемость групповых (частных) средних около общей средней.

Межгрупповая дисперсия вычисляется по формуле:

 

,

 


где -     средняя по отдельным группам,

 - частота отдельных групп.

Средняя из внутригрупповых дисперсий характеризует случайную вариацию в каждой отдельной группе. Эта вариация возникает под влиянием других, не учитываемых факторов и не зависит от условия, положенного в основу группировки.

Она определяется по формуле:

 

 

Между общей дисперсией, средней из внутригрупповых дисперсий и межгрупповой d2 дисперсиями существует соотношение, определяемое правилом сложения дисперсий:

 

.

 

Рассмотрим правило сложение дисперсий на следующем примере.

По результатам маркетингового обследования туристических фирм, организующих недельные туры в Испанию в различные курортные города, получены следующие данные о вариации стоимости туров в сентябре 1997 г.

 

Месторасположение курорта Число турист. фирм, fi Средняя цена недельного тура, дол. Дисперсия цен тура в группе
Коста - Брава 7 528,57 2728,04
Коста-дель-Соль 6 588,33 8851,14
ИТОГО: 13 556,16 5554,08

 

Вариация цен в обследованной группе туристических фирм, обусловленная различием в месторасположении курорта будет характеризоваться величиной межгрупповой дисперсии.

Средняя цена тура по всем фирмам составила:

 

$

 

Тогда межгрупповая будет равна:

 

 

Вариация цен под влиянием всех прочих факторов, кроме месторасположения курорта, будет характеризоваться величиной средней из внутригрупповых дисперсий:

 

 

Вариация цен на недельные туры в Испанию, обусловленная влиянием всех факторов, формирующих уровень цен в заданной группе:

 

 

Правило сложения дисперсий имеет большую практическую значимость, т.к. позволяет выявить зависимость результатов от определяющих факторов соотношением межгрупповой и общей дисперсии - коэффициент детерминации.

 

 

Отсюда можно сделать вывод, что на 13,78% дисперсия цен на недельные туры объясняется различиями в месторасположении курорта, а на 86,22% - влиянием прочих факторов.

Таким образом, преобладающее влияние на вариацию цен недельных туров в Испанию оказывают прочие факторы.

В статистике наряду с показателем вариации количественного признака определяются показатели вариации альтернативного признака. Альтернативными являются признаками, которыми обладают одни единицы изучаемой совокупности и не обладают другие. Например: при, изучении качества изготовленной продукции можно разделить её на две группы годную и бракованную, т.е. в данном случае это два взаимно исключающих вариантов.

При статистическом выражении колеблемости альтернативных признаков наличие изучаемого признака обозначается 1, а его отсутствие - 0. Доля вариантов, обладающих изучаемым признаком обозначается р, а доля вариантов, не обладающих - q, следует

 

p + q = 1

 

Допустим, общее число единиц совокупности равно n. Число единиц обладающих признаком - f, тогда число единиц не обладающих дополнительными признаком будет равно n - f.

Учитывая изложенное

Значение переменнойЧастота повтора

 

f

n - f

Отсюда

 

Дисперсия

 

 

Средняя квадратичная равна

.

 

Например в результате контроля из 1000 готовых изделий 20 - бракованных.

Отсюда

 

1 - соответствует бракованным изделиям

0 - годной продукции

Процент барка равен .

Тогда величина дисперсии

 

Если признак принимает больше двух значений, то оценка вариации равна

 

,

 

где W - доля каждого признака.

Для получения приблизительного представления о форме распределения строят графики распределения (полигон и гистограмму). Число наблюдений, по которому строится эмпирическое распределение, обычно невелико. С увеличением числа наблюдений и одновременным уменьшением величины интервала зигзаги полигона начинают сглаживаться и в результате чего получается плавная кривая, которая называется кривой распределения.

Если кривая построена по данным наблюдения, то она называется эмпирической кривой, а если она отражает закономерность соотношения вариант и частот, то она называется теоретической кривой. Исследование закономерности (формы) распределения включает решение трёх последовательных задач:

выяснение общего характера распределения

выравнивание эмпирического распределения, которое состоит в том, что на основании эмпирического распределения строится кривая y=f (x)

проверка соответствия найденного теоретического распределения эмпирическому.

В практике статистического исследования встречаются различные распределения.

Однородные совокупности характеризуются, как правило, одновершинными распределениями. Многовершинность свидетельствует о неоднородности. Появление двух вершинной или асимметричной кривой означает, нарушение при изменении условий получения и обработки сведений в этом случае необходима перегруппировка данных.

Выявление общего характера распределения предполагает не только степень его однородности, а также вычисление показателей асимметрии и эксцесса.

Симметричным является распределение в котором частота любых двух вариантов равноотстоящих в обе стороны от центра распределения, равны между собой. Для симметричного распределения

 

.

 

Поэтому показатель асимметрии, основан на соотношении показателей центра распределения: чем больше разница между средними ( ) тем больше асимметрия ряда.

Для сравнительного анализа степени асимметрии нескольких распределений рассчитывают относительный показатель AS.

 

 

AS может быть положительным и отрицательным.

Положительная величина указывает на наличие правосторонней асимметрии

 

 

( )

 

 

Отрицательный знак свидетельствует о наличии левосторонней асимметрии

 

( )

 

Другим показателем асимметрии, предложенный шведским математиком Линбергом, рассчитывают по формуле:

 

AS = П - 50,

 

где П - процент тех значений признака, которые превосходят по величине среднюю арифметическую.

Наиболее точным и распространенным является показатель, основанный на определении центрального момента третьего порядка (в симметричном распределении его величина равна 0).

Моментом распределения называется средняя арифметическая тех или иных степеней отношения индивидуальных значений признака от определенной исходной величины.

 

,

 

где А - величина, от которой определяется отклонение

a - степень отклонения (порядок момента)

В зависимости от того, что принимают за величину А, различают три вида моментов:

Начальные моменты получают при А=0

 

 


Центральные моменты получают при А=

 

 

Условные моменты ma получают при А, не равной средней арифметической и отличной от нуля:

 

 

В статистической практике пользуются моментами превого, второго, третьего и четвертого порядков.

 

Моменты распределения порядка Начальные Центральные Условные
I
II

 

Начальные моменты второго, третьего и четвертого порядков так же, как и условные моменты самостоятельного значения не имеют, а используют для упрощенного вычисления центральных моментов.

Например, используя начальные моменты первого и второго порядка можно вычислить дисперсию по формуле:

 

.

 

Таким образом, показатель асимметрии может быть вычислен по формуле:

 

 

Применение этого показателя дает возможность не только определить степень асимметрии, но и ответить на вопрос о наличии или отсутствии асимметрии в распределении признака в генеральной совокупности.

Эта оценка делается при полюции след. показателя (сред. квадр. отклон)

 

 

Если отношение

 

,

 

а асимметрия несущественна и наличие может быть объяснено влиянием различных случайных обстоятельств.

Для симметричных распределений рассчитывается показатель эксцесса (островершинности).

Наиболее точным является показатель оснований на использовании центрального момента четвертого порядка.

 


 

 

На рисунке:

островершинное распределение (величина эксцесса положительная)

плосковершинное (величина эксцесса отрицательная)

кривая нормального распределения.

Эксцесс - выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. В нормальном распределении:

 

.

 

Оценка показателей асимметрии и эксцесса позволяет сделать вывод о том, можно ли отнести данное эмпирическое распределение к типу кривых нормального распределения, которое имеет следующие особенности:

кривая симметрична относительно максимальной ординаты, которая равна x=M0=Ml и величина

кривая приближается к оси абсцисс, продолжаясь в обе стороны до бесконечности. Следовательно, чем больше значения отклоняются от , тем реже они встречаются. Одинаковые по абсолютному значению, но противоположные по знаку, отклонения значений переменной х от  - равновероятны.

При =const и при увеличении s кривая становится более пологой. При s=const с изменением  кривая не меняет свою форму, а лишь сдвигается вправо или влево по оси абсцисс.


 

s1<s2<s3

 

В промежутке  находится 68,3% всех значений признака.

В промежутке находится 95,4% всех значений признака.

В промежутке находится 99,7% всех значений признака.


 

 

Нормальное распределение возможно в том случае, когда на величину признака влияет большое число случайных причин. Действие этих причин независимо, и ни одна из причин не имеет преобладающего влияния над другим.



2020-03-17 233 Обсуждений (0)
Показатели колеблемости признака 0.00 из 5.00 0 оценок









Обсуждение в статье: Показатели колеблемости признака

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Как вы ведете себя при стрессе?: Вы можете самостоятельно управлять стрессом! Каждый из нас имеет право и возможность уменьшить его воздействие на нас...
Почему человек чувствует себя несчастным?: Для начала определим, что такое несчастье. Несчастьем мы будем считать психологическое состояние...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (233)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.012 сек.)