Методы измерения и анализа

2020-02-03

204

Обсуждений (0)

0.00 из 5.00 0 оценок

⇐ Предыдущая 123 4 5 6 Следующая ⇒

Социальной информации

Изучаемые статистические процессы и явления в сфере демографии, в социальной и политической областях, как правило, характеризуется внутренней структурой, которая с течением времени может изменяться. Динамика структуры вызывает изменение внутреннего содержания исследуемых объектов, приводит к изменению установившихся причинно-следственных связей. Именно поэтому изучение структуры и структурных сдвигов занимает важное место в курсе теории статистики.

В статистике под структурой понимают совокупность единиц, обладающих определенной устойчивостью внутригрупповых связей при сохранении основных признаков, характеризующих эту совокупность как целое. Основные направления изучения структуры включают:

а) характеристику структурных сдвигов отдельных частей совокупности за два и более периодов;

б) обобщающую характеристику структурных сдвигов в целом по совокупности;

в) оценку концентрации и централизации.

Рассмотрим последовательно эти направления исследования.

Частные показатели структурных сдвигов. Анализ структуры и ее изменений базируется на относительных показателях структуры – долях и удельных весах, представляющих собой соотношение размеров частей и целого. При этом как частные, так и обобщающие показатели структурных сдвигов могут отражать либо «абсолютное» изменение структуры в процентных долях или долях единицы (кавычки показывают, что данные показатели являются абсолютными по методологии расчета, но не по единицам измерения), либо ее относительное изменение в процентах или коэффициентах.

Абсолютный прирост удельного весаi-й части совокупности показывает, на сколько процентных пунктов возросла или уменьшилась данная структурная часть и j-й период по сравнению с (j-1) периодом:

;

где d_ij – удельный вес (доля) i-й части совокупности в j-й период;

d_ij-1 – удельный вес (доля) i-й части совокупности в j-1 период.

Знак прироста показывает направление изменения удельного веса данной структуры части («+» – увеличение, «–» – уменьшение), а его значение – конкретную величину этого изменения.

Темп роста удельного веса представляет собой отношение удельного веса i-й части совокупности в j-й период времени к удельному весу той же части в предшествующий период:

Темпы роста удельного веса выражаются в процентах и всегда являются положительными величинами. Однако, если в совокупности имели место какие-либо структурные изменения, часть темпов роста будет больше 100%, а часть – меньше.

Если изучаемая структура представлена данными за три и более периода, появляется необходимость в динамическом осреднении приведенных выше показателей, то есть в расчете средних показателей структурных сдвигов.

Средний «абсолютный» прирост удельного весаi-й структурной части показывает, на сколько процентных пунктов в среднем за какой-либо период (день, неделю, месяц, год и т.п.) изменяется данная структурная часть:

где n – число осредняемых периодов.

Сума средних «абсолютных» приростов удельных весов всех k структурных частей совокупности, так же как и сумма их приростов за один временной интервал, должна быть равна нулю.

Средний темп роста удельного веса характеризует среднее относительное изменение удельного веса i-й структурной части за n периодов и рассчитывается по формуле средней геометрической:

Подкоренное выражение этой формулы представляет собой последовательное произведение цепных темпов роста удельного веса за все временные интервалы. После проведения несложных алгебраических преобразований данная формула примет следующий вид:

При анализе структуры исследуемого объекта или явления за ряд периодов также можно определить средний удельный вес каждой i-й части за весь рассматриваемый временной интервал. Однако для его расчета одних лишь относительных данных об удельных весах структурных частей недостаточно, необходимо располагать еще и информацией о размерах этих частей в абсолютном выражении. Используя эти данные, средний удельный вес любой i-й структурной части можно определить по формуле:

где X_ij - величина i-й структурной части в j-й период времени в абсолютном выражении.

Обобщающие показатели структурных сдвигов. В отдельных случаях исследователю необходимо в целом оценить структурные изменения в изучаемом социальном явлении за определенный временной интервал, которые характеризуют подвижность или стабильность данной структуры. Как правило, это требуется для сравнения динамики одной и той же структуры в различные периоды или несколько структур, относящихся к разным объектам. Во втором случае число структурных частей у разных объектов необязательно должно совпадать.

Среди применяемых для этой цели обобщающих показателей наиболее распространен линейный коэффициент абсолютных структурных сдвигов, представляющий собой суму приростов удельных весов, взятых по модулю, деленную на число структурных частей:

Этот показатель отражает то среднее изменение удельного веса (в процентных пунктах), которое имело место за рассматриваемый временной интервал в целом по всем структурным частям совокупности.

Также применяют квадратический коэффициент «абсолютных» структурных сдвигов, который рассчитывается по формуле:

Линейный и квадратический коэффициенты «абсолютных» структурных сдвигов позволяют получить сводную оценку скорости изменения удельных весов отдельных частей совокупности. Для сводной характеристики интенсивности изменения удельных весов используется квадратический коэффициент относительных структурных сдвигов:

Данный показатель отражает тот средний относительный прирост удельного веса (в процентах), который наблюдался за рассматриваемый период.

Для сводной оценки структурных изменений в исследуемой совокупности в целом за рассматриваемый временной интервал, охватывающий несколько недель, месяцев, кварталов или лет, наиболее удобным является линейный коэффициент «абсолютных» структурных сдвигов за n периодов:

Этот показатель используется как для сравнения динамики двух и более структур, так и для анализа динамики одной и той же структуры за разные по продолжительности периоды времени.

Показатели концентрации и централизации. Одна из задач статистического анализа структуры заключается в определении степени концентрации изучаемого признака по единицам совокупности или в оценке неравномерности его распределения. Такая неравномерность может иметь место в распределении доходов по группам населения, жилой площади по группам семей и т.д. При исследовании неравномерности распределения изучаемого признака по территории понятие «концентрация» обычно заменяется понятием «локализация».

Оценка степени концентрации наиболее часто осуществляется по кривой концентрации Лоренца и рассчитываемым на ее основе характеристикам. Для построения кривой концентрации необходимо иметь частотное распределение единиц исследуемой совокупности и соответствующее ему частотное распределение изучаемого признака. При этом для удобства вычислений, как правило, разбиваются на равные группы – 10 групп по 10% единиц в каждой, 5 групп по 20% и т.д.

Наиболее известным показателем концентрации является коэффициент Джини, обычно используемый как мера дифференциации или социального расслоения:

;

где d_xi – доля i-й группы в общем объеме совокупности;

d_уi – доля i-й группы в общем объеме признака;

d^Н_уi – накопленная доля i-й группы в общем объеме признака.

Если доли выражены в процентах, данную формулу можно преобразовать:

для 10%-ного распределения –

;

для 20%-ного распределения -

Чем ближе к 1 (100%) значение данного показателя, тем выше уровень концентрации; при нуле мы имеем равномерное распределение признака по всем единицам совокупности.

Оценка степени концентрации также может быть получена на основе коэффициента Лоренца:

При использовании данного коэффициента можно оперировать как долями единицы, так и процентами. Коэффициент Лоренца изменяется в тех же границах, что и коэффициент Джини.

Если под концентрацией понимается степень неравномерности распределения изучаемого признака, не связанная ни с объемом совокупности, ни с численностью отдельных групп, то централизация означает сосредоточение объема признака у отдельных единиц. Обобщающий показатель централизации имеет следующий вид:

где m_i – значение признака i-й совокупности;

М – объем признака всей совокупности.

Максимальное значение, равное 1, данный коэффициент достигает в том случае, когда вся совокупность состоит только из одной единицы, обладающей всем объемом признака. Минимальное значение коэффициента приближается к нулю, но никогда его не достигает.

Исследуя общество, необходимо считаться со взаимосвязью наблюдаемых процессов и явлений. При этом полнота описания так или иначе определяется количественными характеристиками причинно-следственных связей между ними. Оценка наиболее существенных из них, а также воздействие одних факторов на другие является одной из основных задач статистики.

Количественная оценка связей социальных явлений осуществляется на основе расчета и анализа целого ряда коэффициентов.

Методы оценки тесноты связи подразделяются на корреляционные (параметрические) и непараметрические. Параметрические методы основаны на использовании, как правило, оценок нормального распределения и применяются в случаях, когда изучаемая совокупность состоит из величин, которые подчиняются закону нормального распределения.

Непараметрические методы не накладывают ограничений на закон распределения изучаемых величин. Их преимуществом является и простота вычислений.

Если изучается взаимосвязь двух качественных признаков, то используют комбинационное распределение единиц совокупности в форме так называемых таблиц взаимной сопряженности.

Рассмотрим методику анализа таблиц взаимной сопряженности на конкретном примере социальной мобильности как процесса преодоления замкнутости отдельных социальных и профессиональных групп населения. В таблице 1 приведены данные о распределении выпускников средних школ по сферам занятости с выделением аналогичных общественных групп их родителей.

Таблица 1
Занятия родителей	Число детей, занятых в				Всего
Занятия родителей	промыш-ленности	сельском хозяйстве	сфере обслуживания	сфере интеллекту-ального труда	Всего
1.промыш-ленность	40	5	7	39	91
2.сельское хозяйство	34	29	13	12	88
3.сфера обслуживания	16	6	15	19	56
4.сфера интеллекту-ального труда	24	5	9	72	110
Всего	114	45	44	142	345

Распределение частот по строкам и столбцам таблицы взаимной сопряженности позволяет выявить основные закономерности социальной мобильности: 42,9% детей родителей группы 1(промышленность) заняты в сфере интеллектуального труда (39 из 91); 38,9% детей, родители которых трудятся в сельском хозяйстве, работают в промышленности (34 из 88) и т.д.

Можно заметить и явную наследственность в передаче профессий. Так, из пришедших в сельское хозяйство 29 человек или 64,4% являются детьми работников сельского хозяйства; более чем у 50% в сфере интеллектуального труда родители относятся к той же социальной группе и т.д.

Однако важно получить обобщающий показатель, характеризующий тесноту связи между признаками и позволяющий сравнивать проявление связи в разных совокупностях. Для этой цели исчисляют, например, коэффициенты взаимной сопряженности Пирсона (С) и Чупрова (К):

;

где - показатель средней квадратичной сопряженности, определяемый путем вычитания единицы из суммы отношений квадратов частот каждой клетки корреляционной таблицы к произведению частот соответствующего столбца и строки:

, ;

К₁, К₂ – число групп по каждому из признаков.

Величина коэффициента взаимной сопряженности, отражающая тесноту связи между качественными признаками, колеблется в обычных для этих показателей пределах от 0 до 1.

Таблица 2
Занятия родителей	Число детей, занятых в
Занятия родителей	промыш-ленности	сельском хозяйстве	сфере обслужи-вания	сфере интеллекту-ального труда	Всего
А	1.	2.	3.	4.	5.	6.
1. промыш-ленность	40 1600 14,04	5 25 0,56	7 49 1,11	39 1521 10,71	91 - 26,42	0,2903
2. сельское хозяйство	34 1156 10,14	29 841 18,69	13 169 3,84	12 169 3,84	88 - 33,68	0,3827
3. сфера обслужи-вания	16 256 2,25	6 36 0,8	15 225 5,11	19 361 2,54	56 - 10,7	0,1911
4. сфера интеллек-туального труда	24 576 5,05	5 25 0,56	9 81 1,84	72 5184 36,51	110 - 43,96	0,3996
Итого (f_j)	114	45	44	142	345	1,264

Цифры в левом верхнем углу каждой клетки данной таблицы перенесены из предыдущей. Цифры в центре клеток представляют собой результат возведения частот в квадрат (f_ij²). Путем деления f_ij² на итоговые частоты соответствующих столбцов (f_j) получаем значения, которые записываем в нижнем правом углу каждой клетки.

Суммируя данные величин (из последнего, 6-го столбца), получим

;

Величина первого коэффициента свидетельствует о наличии достаточно заметной связи между изучаемыми признаками. Коэффициент Чупрова обычно дает более осторожную оценку связи.

Некоторые особенности имеет анализ взаимосвязи между двумя альтернативными признаками, который производится с помощью четырехклеточных таблиц.

Оценить тесноту связи между признаками можно с помощью коэффициентов взаимной сопряженности С или К. Но проще это сделать с помощью коэффициентов ассоциации и контингенции.

Для их вычисления составляется таблица, которая показывает связь между двумя явлениями, каждое из которых должно быть альтернативным, то есть состоящим из двух качественно отличных друг от друга значений признака (например, хороший, плохой). (Таблица 3)

Таблица 3
Таблица для вычисления коэффициентов ассоциации и контингенции
a	b	a+b
c	d	c+d
a+c	b+d	a+b+c+d

Коэффициенты вычисляются по формулам:ассоциации: ;

Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если К_а>0,5 или К_k>0,3.

В социальных исследованиях нередко встречаются ситуации, когда признак не выражается количественно, однако единицы совокупности можно упорядочить. Такое упорядочение единиц совокупности по значению признака называется ранжированием. Примером может быть ранжирование студентов по способностям, любой совокупности людей по профессии и т.д.

При ранжировании каждой единице совокупности присваивается ранг, то есть порядковый номер. При совпадении значения признака у различных единиц им присваивается объединенный средний порядковый номер. Например, если у 5-й и 6-й единиц совокупности значения признаков одинаковы, обе получат ранг, равный (5+6)/2=5,5.

Измерение связи между ранжированными признаками производится с помощью ранговых коэффициентов корреляции Спирмена (ρ) и Кендела (τ). Эти методы применимы не только для качественных, но и для количественных показателей, особенно при малом объеме совокупности, так как непараметрические методы ранговой корреляции не связаны ни с какими ограничениями относительно характера распределения признака.

Коэффициент корреляции рангов (коэффициент Спирмена) рассчитывается по формуле:

где d_i² – квадраты разности рангов признаков X и Y;

n – число наблюдений (число пар рангов).

Коэффициент Спирмена принимает любые значения в интервале [-1;1]. В случае отсутствия связи ρ=0. При прямой связи ρ – положительная правильная дробь, при обратной – отрицательная.

Значимость коэффициента корреляции рангов Спирмена проверяется на основе t-критерия Стьюдента. Расчетное значение критерия определяется по формуле:

Значение коэффициента корреляции считается статистически существенным, если t_ρ>t_kρ.

Кэнделлом предложен другой показатель измерения корреляционной связи, также с использованием рангов признаков:

Упрощение расчетов коэффициента Кендэлла достигается следующим образом.

Ряд наблюдений располагается в возрастающем порядке по признаку X с указанием соответствующих им рангов по признаку Y.

Упорядоченная таким образом последовательность наблюдений берется как исходная для построения квадратной матрицы (a_ij) размерностью n*n. Для дальнейшего потребуются только элементы, расположенные выше главной диагонали. Для заполнения матрицы по каждой паре наблюдений (I,j) сравниваем ранги признака Y:

Сумма элементов матрицы (a_ij), расположенных выше главной диагонали, и есть искомое значение S.

Далее производится расчет по приведенной ранее формуле.

При больших n между значениями ранговых коэффициентов фиксируется соотношение:

Преимущество ранговых коэффициентов корреляции Спирмена и Кендала в том, что с их помощью можно измерить и оценить связи как между количественными, так и между атрибутивными признаками, которые поддаются ранжированию.

Раздел 3

Выборочные исследования

2020-02-03

204

Обсуждений (0)

0.00 из 5.00 0 оценок

⇐ Предыдущая 123 4 5 6 Следующая ⇒

Обсуждение в статье: Методы измерения и анализа

Обсуждений еще не было, будьте первым... ↓↓↓