Мегаобучалка Главная | О нас | Обратная связь


ПОНЯТИЕ ВАРИАЦИИ И ПОКАЗАТЕЛИ ЕЁ ХАРАКТЕРИЗУЮЩИЕ



2020-02-03 213 Обсуждений (0)
ПОНЯТИЕ ВАРИАЦИИ И ПОКАЗАТЕЛИ ЕЁ ХАРАКТЕРИЗУЮЩИЕ 0.00 из 5.00 0 оценок




Вариация возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов (условий), которые по-разному сочетаются в каждом отдельном случае. Таким образом, величина каждого варианта объективна.

К показателям вариации относятся:

Ø Размах вариации (R)- представляет собой разность между максимальным и минимальным значениями признака:

R= xmax - xmin                                                                                          (4)

Ø Среднее линейное отклонение(d) показывает отклонение индивидуальных значений признака от среднего по совокупности. Среднее линейное отклонение бывает двух видов:

Прямое:              ;                                           (5)

 

Взвешенное:            ;                                       (6)

 

Ø Дисперсия признака представляет собой средний квадрат отклонений вариантов от их средней величины, она вычисляется по формулам простой и взвешенной дисперсии (в зависимости от исходных данных).

Простая дисперсия:                                             (7)

Взвешенная дисперсия:                                          (8)

Ø Среднее квадратическое отклонение равно корню квадратному из дисперсии:

                                     (9)

Ø Коэффициент вариации представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической:

                                                                              (10)

Для характеристики среднего значения признака в вариационном ряду используются так называемые показатели центра распределения. К ним относятся средняя величина признака, мода и медиана.

Расчет средней величины признака в вариационном ряду осуще­ствляется по формуле средней арифметической взвешенной:

                   ,                                                          (11)

где хi — варианты признака; fi —частоты.

Мода — значение признака, наиболее часто встречающееся в изу­чаемой совокупности. В дискретном ряду модой является вариант с наибольшей частотой. В интервальном вариационном ряду мода рассчитывается по формуле:

         ,                                  (12)

где - нижняя граница модального интервала;

- модальный интервал;

, , - частоты в модальном, предыдущем и следующем за модальным интервалах (соответственно).

Модальный интервал — это интервал, имеющий наибольшую часто­ту.

Медиана — вариант, расположенный в середине упорядоченного вариационного ряда, делящий его на две равные части, таким обра­зом, что половина единиц совокупности имеют значения признака меньше, чем медиана, а половина — больше, чем медиана. В интер­вальном ряду медиана определяется по формуле:

,                                           (13)

где - нижняя граница медианного интервала;

 - половина общего числа наблюдений;

- сумма наблюдений до начала медиального интервала;

- число наблюдений в медианном интервале.

Медианный интервал — это интервал, в котором находится поряд­ковый номер медианы. Для его определения необходимо подсчитать сумму накопленных частот до числа, превышающего по­ловину объема совокупности.

 

 

1.4. МЕТОДЫ ИЗУЧЕНИЯ ВЗАИМОСВЯЗИ МЕЖДУ ЯВЛЕНИЯМИ

Для исследования взаимосвязи между явлениями используются следующие методы: [1]

1. Метод параллельных рядов, при котором факторы, характеризующие результативный признак, располагают в возрастающем или убывающем порядке, а затем прослеживают изменение величины результативного признака.

2. Метод аналитических группировок (см. пункт 1.2).

3. Графический метод. При построении графика по оси абсцисс отражаются значения факторного признак, а по оси ординат – результативного. Полученная совокупность называется полем корреляции и позволяет визуально оценить наличие связи, ее вид и интенсивность.

4. Корреляционный анализ, задачи которого сводятся к измерению тесноты известной связи между варьирующими признаками, определению неизвестных связей и оценке факторов, оказывающих наибольшее влияние на результативный признак.

5. Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой, или результативным признаком) обусловлено влиянием одной или нескольких независимых величин (факторов), а множество всех прочих факторов, также оказывающих влияние на зависимую величину, принимается за постоянные и средние значения. Но целесообразнее применять корреляционный и регрессионный анализы в совокупности.

Корреляционная связь может возникать в различных формах:

1. Парная корреляция — связь между двумя признаками (результативным и факторным).

2. Частная корреляция — зависимость между результативным и одним из факторных признаков при фиксированном значении других факторных признаков.

3. Однофакторная корреляция – зависимость между результативным признаком и одним факторным.

4. Многофакторная корреляция — зависимость результативного и двух или более факторных признаков, включенных в исследование.

Корреляционный анализ имеет своей задачей количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи). Теснота связи количественно выражается величиной коэффициентов корреляции.

Величина коэффициента корреляции служит также оценкой соответствия уравнения регрессии выявленным причинно-следственным связям.

Регрессия может быть однофакторной (парной) и многофакторной (множественной).

Уравнение линейной множественной регрессии имеет вид:

                   

                                (14)

где  — расчетные значения результативного признака;

х1, х2,, , хn — факторные признаки;

— параметры модели (коэффициенты регрессии).

Для нахождения параметров линейной множественной регрессии необходимо решить систему уравнений:

                                                                                                   (15)

Для практического использования моделей регрессии большое значение имеет их адекватность, т.е. соответствие фактическим статистическим данным.

Корреляционно-регрессионный анализ проводится для ограниченных по объему совокупностей, поэтому показатели регрессии и корреляции могут быть искажены влиянием случайных факторов. Общая оценка адекватности уравнения может быть получена с помощью дисперсионного F-критерия Фишера:

                                        (16)

 

где m - число параметров в уравнении регрессии.

Принято считать, что уравнение регрессии пригодно для практического использования, если >  не менее чем в 4 раза.

Показателем тесноты связи, устанавливаемой между результативными и двумя и более факторными признаками, является совокупный коэффициент множественной корреляции .

В случае оценки связи между результативным (у) и двумя факторными признаками (x1) и (х2) множественный коэффициент корреляции можно определить по формуле [2]:

 

                   (17)

где r - линейные коэффициенты корреляции (парные); подстрочные индексы показывают, между какими признаками они исчисляются.

Совокупный коэффициент множественной корреляции измеряет одновременное влияние факторных признаков на результативный. Его значение находятся в пределах от –1 до +1. Чем меньше наблюдаемые значения изучаемого показателя отклоняются от линии множественной регрессии, тем корреляционная связь является более интенсивной, а, следовательно, значение R ближе к единице.

Чтобы узнать, какая доля вариации изучаемого признака объясняется влиянием факторов, включенных в уравнение множественной регрессии, необходимо воспользоваться совокупным коэффициентом множественной детерминации (R2). Его значение находятся в пределах 0 до +1. Чем ближе R2 к +1, тем большая доля вариации изучаемого признака объясняется влиянием отобранных факторов.

ГЛАВА 2. ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ ДЛЯ АНАЛИЗА КАДРОВОГО ПОТЕНЦИАЛА НАУКИ РФ ПО ОБЛАСТЯМ

2.1. АНАЛИЗ ОДНОРОДНОСТИ СОВОКУПНОСТИ

Для проведения анализа используются средние величины, т.е. обобщающий показатель, характеризующий типичный уровень явления в конкретных условиях места и времени. Однако, для того, чтобы средний показатель был действительно типизирующим, он должен определяться только для совокупностей, состоящих из качественно однородных единиц. Поэтому первым этапом анализа будет определение, является ли данная совокупность однородной.

Сначала построим на основе данных (Приложение 1 таблица 1) ранжированный ряд по выбранному факторному признаку, которым является затраты на технологические инновации.

Результаты построения приведены в таблице 2.

Таблица 2 - Ранжированный ряд распределения областей РФ по сумме затрат на технологические инновации

Затраты на технологические инновации, млн. руб.

Затраты на технологические инновации, млн. руб.

Затраты на технологические инновации, млн. руб.

1

171,0

11

1154,8

21

3844,6

2

273,2

12

1191,9

22

4070,1

3

371,5

13

1197,8

23

4674,6

4

415,7

14

1360,3

24

5752,9

5

564,0

15

1482,9

25

6408,9

6

737,0

16

1983,4

26

7923,1

7

799,3

17

2123,7

27

8042,0

8

939,0

18

3204,0

28

11377,0

9

972,9

19

3386,5

29

25644,0

10

1127,4

20

3417,2

30

41032,8

 

 Затем определяем:

1) размах вариации по формуле 1: R = 41032,8 -171,0 = 40861,8 млн. руб.

2) с помощью формулы 2 число групп: n = 1+3,322lg30 = 6 групп

3) величину интервала по формуле 3: i = = 6810,3 млн. руб.

Отсюда, путем прибавления величины интервала к минимальному уровню признака в группе получим следующие группы областей по сумме затрат на технологические инновации (таблица 3).

Таблица 3 - Интервальный ряд распределения областей РФ по сумме затрат на технологические инновации

№ гр. Группы областей Число областей Середина интервала

1

171,0-6981,3

25

3576,2

2

6981,3-13791,6

3

10386,5

3

13791,6-20601,9

0

17196,8

4

20601,9-27412,2

1

24007,1

5

27412,2-34222,5

0

30817,4

6

34222,5-41032,8

1

37627,7

 

ИТОГО

30

-

 

Из интервального ряда видно, что 25 областей из 30 имеют минимальную сумму затрат на технологические инновации в интервале от 171,0 млн. руб. до 6981,3 млн. руб. И только 1 область имеет наибольшую сумму затрат от 34222,5 млн. руб. до 41032,8 млн. руб.

На основании построенного ранжированного ряда строится диаграмма Огива Гальтона (ПРИЛОЖЕНИЕ 2 рис.1).Интервальный ряд отражается в виде гистограммы (ПРИЛОЖЕНИЕ 2 рис.2).

Для определения однородности совокупности на основании интервального ряда рассчитаем среднюю арифметическую взвешенную, показатели вариации, моду, медиану.

Для расчета вышеуказанных показателей оформим таблицу 4.

Таблица 4 – Расчётные данные

№ группы Гр. областей по сумме затрат на технологические инновации Число областей Середина интервала xifi /xi-xвзв/ /xi-xвзв/fi (xi-xвзв)2fi

1

171,0-6981,3

25

3576,2

89403,8

2497,1

62427,8

155888958,8

2

6981,3-13791,6

3

10386,5

31159,4

4313,2

12939,6

55810823,9

3

13791,6-20601,9

0

17196,8

0,0

11123,5

0,0

0,0

4

20601,9-27412,2

1

24007,1

24007,1

17933,8

17933,8

321620823,8

5

27412,2-34222,5

0

30817,4

0,0

24744,1

0,0

0,0

6

34222,5-41032,8

1

37627,7

37627,7

31554,4

31554,4

995679528,3

 

ВСЕГО

30

-

182197,8

-

124855,5

1529000134,8

Используя данные таблицы, рассчитаем:

1) Среднюю арифметическую взвешенную по формуле 11:

= 6073,3 млн. руб.

2) Моду по формуле 12: интервал 171,0 - 6981,3 является модальным, т.к. характеризуется максимальной частотой (25), отсюда

Мо = 171,0+6810,3 ((25-0)/((25-0)+(25-1))) = 3645,6 млн. руб.

3) Медиану по формуле 13: т.к. Sm>полусуммы частот (25>15), то интервал у первой группы (171,0 - 6981,3) будет являться медианным, следовательно:

Ме = 171,0+6810,3 ((15-0)/25) = 4257,2 млн. руб.

4) Среднее линейное отклонение по формуле 6:  

= 4161,9 млн. руб.

5) Дисперсию по формуле 8:  

=50966671,2 млн. руб.

6) Среднее квадратическое отклонение по формуле 9:

=7139,1 млн. руб.

7) Коэффициент вариации по формуле 10: = 117,55%.

По результатам расчётов можно сделать вывод о том, что средний объём затрат на технологические инновации по рассматриваемой совокупности областей составляет 6073,3 млн. руб. Отклонение объёма затрат на технологические инновации по каждой группе от средней составляет 4161,9 млн. руб. Квадрат отклонений объёма затрат на технологические инновации каждой группы от средней составляет 50966671,2 млн. руб. Так как в задаче рассматривается финансовый коэффициент, то однозначного вывода об однородности совокупности сделать не можем. Совокупность будем считать условно-однородной.

Значение моды равное 3645,6 млн. руб. свидетельствует о том, что большинство областей имеет объём затрат на технологические инновации 3645,6 млн. руб. Значение медианы равное 4257,2 млн. руб. показывает, что половина областей имеет объём затрат на технологические инновации не выше 4257,2 млн. руб., а другая половина не ниже 4257,2 млн. руб.

 

2.2. АНАЛИТИЧЕСКАЯ И ТИПОЛОГИЧЕСКАЯ ГРУППИРОВКИ

Вторым этапом исследования будет построение аналитической и типологической группировок.

Для этого определим суммарное значение каждого показателя в группе и по результатам расчетов, делается сводная таблица, отражающая абсолютные показатели (ПРИЛОЖЕНИЕ 3 таблица 5).

На основании сводной таблицы строится аналитическая группировка, которая заключается в расчете средних значений показателей по группам и по области в целом (таблица 6).

Таблица 6 – Аналитическая группировка

№ гр.

Группы областей

Число областей

Затраты на технологические инновации, млн. руб.

Численность персонала, занятого научными исследованиями и разработками, чел.

Численность докторов наук, чел.

Численность кандидатов наук, чел.

Число организаций, выполнявших научные исследования и разработки

всего в среднем всего в среднем всего в средн. всего в средн. всего в средн.

1

171,0-6981,3

25

51624,6

2065,0

98122

3925

1626

65

7093

284

557

22

2

6981,3-13791,6

3

27342,1

9114,0

110743

36914

2130

710

7640

2547

129

43

3

13791,6-20601,9

0

0,0

0,0

0

0

0

0

0

0

0

0

4

20601,9-27412,2

1

25644,0

25644,0

369

369

51

51

66

66

101

101

5

27412,2-34222,5

0

0,0

0,0

0

0

0

0

0

0

0

0

6

34222,5-41032,8

1

41032,8

41032,8

14246

14246

102

102

402

402

254

254

 

ИТОГО

30

145643,5

77855,8

223480

55454

3909

928

15201

3298

1041

420

 

Анализ аналитической группировки показывает, что при увеличении объёма затрат на технологические инновации с 2065,0 млн. руб. в 1 группе до 41032,8 млн. руб. в 6 группе численность персонала, занятого научными исследованиями и разработками, численность докторов наук и численность кандидатов наук колеблются. Максимальная численность персонала, занятого научными исследованиями и разработками 36914 человек характерна для 2 группы. Наибольшая численность докторов и кандидатов наук  также характерна для 2 группы 710 и 2547 соответственно. А наибольшее число организаций, выполнявших научные исследования и разработки 254 – для 6 группы.

Далее, на основании табл. 3, объединяем первую и вторую группы и получаем низшую группу, третью группу оставляем без изменений и получаем среднюю группу, объединяем четвёртую, пятую и шестую группы и получаем высшую группу. Строим типологическую группировку, которая заключается в расчете средних значений показателей по группам и по области в целом. Находим значение показателей в полученных укрупненных группах и результаты сводим в таблицу 7.

Таблица 7 – Типологическая группировка

Показатели

Типологическая группировка

В среднем

низшая средняя высшая
Число областей 28 0 2

30

Затраты на технологические инновации, млн. руб. 399,3 0,0 33338,4

77855,8

Численность персонала, занятого научными исследованиями и разработками, чел. 1459 0 7308

55454

Численность докторов наук, чел. 28 0 77

928

Численность кандидатов наук, чел.

101

0

234

3298

Число организаций, выполнявших научные исследования и разработки

2

0

178

420

 

Анализ типологической группировки показывает, что объём затрат на технологические инновации в высшей типологической группе больше на 32939,1 млн. руб., чем в низшей группе. Численность персонала, занятого научными исследованиями и разработками в высшей группе больше на 5849 человек, чем в низшей. При этом численность докторов и кандидатов наук возрастает от низшей типологической группы к высшей, т.е. с 28 до 77 человек и с 101 до 234 человек. Число организаций, выполнявших научные исследования и разработки в высшей группе больше на 176, чем в низшей.

 

ГЛАВА 3. АНАЛИЗ КАДРОВОГО ПОТЕНЦИАЛА НАУКИ КАЛУЖСКОЙ ОБЛАСТИ

3.1. ДИНАМИКА ИЗМЕНЕНИЯ КАДРОВОГО ПОТЕНЦИАЛА НАУКИ КАЛУЖСКОЙ ОБЛАСТИ

Для статистического анализа будем использовать данные, приведённые в табл. 8, ПРИЛОЖЕНИЕ 4.

Первым этапом исследования является анализ кадрового потенциала науки Калужской области. Проведем анализ методом укрупнения интервалов, методом скользящей средней и методом аналитического выравнивания по прямой.

Рассчитаем аналитические показатели для основных факторных и результативного признака, используя формулы (табл. 9, ПРИЛОЖЕНИЕ 5). 

Первым шагом рассмотрим численность персонала, занятого научными исследованиями и разработками.

 Таблица 10 - Аналитические показатели численности персонала, занятого научными исследованиями и разработками

Год

Численность персонала, занятого научными исследованиями и разработками, чел.

Абсолютный прирост, убыль

Темп роста, %

Темп прироста, %

базисный

цепной

базисный

цепной

базисный

цепной

2003

13644

2004

10778

-2866

-2866

79,0

79,0

-21,0

-21,0

2005

10413

-3231

-365

76,3

96,6

-23,7

-3,4

2006

10708

-2936

295

78,5

102,8

-21,5

2,8

2007

10920

-2724

212

80,0

102,0

-20,0

2,0

2008

10386

-3258

-534

76,1

95,1

-23,9

-4,9

2009

10374

-3270

-12

76,0

99,9

-24,0

-0,1

ИТОГО:

77223

-3270

 

По результатам табл. 10 можно сделать вывод о том, что численность персонала, занятого научными исследованиями и разработками в 2009 году снизилась на 3270 человек  или на 24% по сравнению с 2003 годом. А по сравнению с предыдущим периодом снижение численности персонала, занятого научными исследованиями и разработками составило 12 человек или 0,1%. В остальные периоды наблюдается снижение численности персонала.

Далее рассчитываем средние показатели динамики:

1) средний уровень ряда:  чел.

2) средний абсолютный прирост:  чел.

3) средний темп роста:

4) средний темп прироста: %.

Расчеты показывают, что за период с 2003 года по 2009 год численность персонала, занятого научными исследованиями и разработками в среднем составила 11032 человек, при этом численность персонала, занятого научными исследованиями и разработками ежегодно в среднем снижается на 545 человек или 4,5%.

На результативный признак оказывают влияние ряд факторных признаков, значение которых также изменяются во времени.

Вторым шагом будет расчёт аналитических показателей численности докторов наук (табл. 11).

Таблица 11 - Аналитические показатели численности докторов наук

Год

Численность докторов наук, чел.

Абсолютный прирост, убыль

Темп роста, %

Темп прироста, %

базисный

цепной

базисный

цепной

базисный

цепной

2003

201

2004

203

2

2

101,0

101,0

1,0

1,0

2005

205

4

2

102,0

101,0

2,0

1,0

2006

210

9

5

104,5

102,4

4,5

2,4

2007

207

6

-3

103,0

98,6

3,0

-1,4

2008

201

0

-6

100,0

97,1

0,0

-2,9

2009

198

-3

-3

98,5

98,5

-1,5

-1,5

ИТОГО:

1425

-3

 

Из таблицы 11 видно, что численность докторов наук в 2009 году снизилась на 3 человека или на 1,5% по сравнению с 2003 годом. А по сравнению с предыдущим периодом снижение численности докторов наук составило также 3 человека или 1,5%. В остальные периоды наблюдается колебание численности докторов наук.

Далее рассчитываем средние показатели динамики:

1) средний уровень ряда:  чел.

2) средний абсолютный прирост:  чел.

3) средний темп роста:

4) средний темп прироста: %.

Расчеты показывают, что за период с 2003 года по 2009 год численность докторов наук в среднем составила 204 человека, при этом численность докторов наук ежегодно в среднем снижается на 1 человек или 0,3%.

Третьим шагом будет расчёт аналитических показателей численности кандидатов наук (табл. 12)

Таблица 12 - Аналитические показатели численности кандидатов наук

год

Численность кандидатов наук, чел.

Абсолютный прирост, убыль

Темп роста, %

Темп прироста, %

базисный

цепной

базисный

цепной

базисный

цепной

2003

988

2004

856

-132

-132

86,6

86,6

-13,4

-13,4

2005

787

-201

-69

79,7

91,9

-20,3

-8,1

2006

760

-228

-27

76,9

96,6

-23,1

-3,4

2007

773

-215

13

78,2

101,7

-21,8

1,7

2008

764

-224

-9

77,3

98,8

-22,7

-1,2

2009

751

-237

-13

76,0

98,3

-24,0

-1,7

ИТОГО:

5679

-237

 

По результатам табл. 12 можно сделать вывод о том, что численность кандидатов наук в 2009 году снизилась на 237 человек или на 24% по сравнению с 2003 годом. А по сравнению с предыдущим периодом снижение численности кандидатов наук составило 13 человек или 1,7%. В остальные периоды наблюдается колебание.

Далее рассчитываем средние показатели динамики:

1) средний уровень ряда:  чел.

2) средний абсолютный прирост:  чел.

3) средний темп роста:

4) средний темп прироста: %.

Расчеты показывают, что за период с 2003 года по 2009 год численность кандидатов наук в среднем составила 811 человек, при этом численность кандидатов наук ежегодно в среднем снижается на 40 человек или 4,5%.

Анализ динамики показателей заключается не только в расчете аналитических и средних показателей, но и характеристики основной тенденции за анализируемый период.

Для анализа основной тенденции мы будем использовать следующие методы:

- укрупнения интервалов;

- скользящей средней;

- аналитического выравнивания.

Результативный признак – численность персонала, занятого научными исследованиями и разработками Калужской области. Рассмотрим анализ основной тенденции по этому признаку (табл. 13)

Таблица 13 - Динамика численности персонала, занятого научными исследованиями и разработками

Год

Численность персонала, занятого научными исследованиями и разработками, чел.

Укрупнение интервала

Скользящая средняя

Сумма

Средняя

Сумма

Средняя

2003

13644

2004

10778

34835

11612

34835

11612

2005

10413

31899

10633

2006

10708

32041

10680

2007

10920

32014

10671

32014

10671

2008

10386

31680

10560

2009

10374

 

Таблица 14 - Метод аналитического выравнивания по прямой

Год

Численность персонала, занятого научными исследованиями и разработками, чел.

t

t2

yt

Yt

2003

13644

-3

9

-40932

12113

2004

10778

-2

4

-21556

11752

2005

10413

-1

1

-10413

11392

2006

10708

0

0

0

11032

2007

10920

1

1

10920

10672

2008

10386

2

4

20772

10311

2009

10374

3

9

31122

9951

Сумма

77223

0

28

-10087

77223

Находим: 1)

2020-02-03 213 Обсуждений (0)
ПОНЯТИЕ ВАРИАЦИИ И ПОКАЗАТЕЛИ ЕЁ ХАРАКТЕРИЗУЮЩИЕ 0.00 из 5.00 0 оценок









Обсуждение в статье: ПОНЯТИЕ ВАРИАЦИИ И ПОКАЗАТЕЛИ ЕЁ ХАРАКТЕРИЗУЮЩИЕ

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Как вы ведете себя при стрессе?: Вы можете самостоятельно управлять стрессом! Каждый из нас имеет право и возможность уменьшить его воздействие на нас...
Как построить свою речь (словесное оформление): При подготовке публичного выступления перед оратором возникает вопрос, как лучше словесно оформить свою...
Генезис конфликтологии как науки в древней Греции: Для уяснения предыстории конфликтологии существенное значение имеет обращение к античной...
Как выбрать специалиста по управлению гостиницей: Понятно, что управление гостиницей невозможно без специальных знаний. Соответственно, важна квалификация...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (213)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.013 сек.)