Мегаобучалка Главная | О нас | Обратная связь


Принципы построения статистических группировок и классификаций



2019-11-21 429 Обсуждений (0)
Принципы построения статистических группировок и классификаций 0.00 из 5.00 0 оценок




 

Построение статистических группировок предполагает решение ряда основных задач. Прежде всего, необходимо выбрать группировочный признак, затем определить число групп, на которые нужно разбить изучаемую совокупность, и зафиксировать границы интервалов группировки. На завершающей стадии необходимо для каждой группировки найти конкретные показатели или их систему, которые должны характеризовать выделенные группы.

Выбор группировочного признака является одним из самых важных и сложных вопросов теории статистической группировки.

Группировочным признаком называется признак, по которому единицы совокупности разбиваются на отдельные группы. Его часто называют основанием группировки.
От правильного выбора группировочного признака зависят выводы, которые получают в результате статистического исследования.

В качестве основания группировки необходимо использовать наиболее существенные признаки, которые теоретически обоснованы и отражают сущность изучаемых явлений в условиях поставленных целей и задач. В основание группировки могут быть положены как количественные, так и качественные признаки. Первые имеют числовое выражение (объем торгов, курс доллара в рублях, возраст человека, денежный доход семьи и т. д.), а вторые отражают состояние единицы совокупности: пол человека, его национальность, семейное положение, отраслевую принадлежность предприятия, его форму собственности и организационно-правовую форму и т. д.

После определения основания группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность. Число групп зависит от задач исследования и вида признака, положенного в основание группировки, численности совокупности, степени вариации признака.

При построении группировки по качественному (атрибутивному) признаку групп, как правило, будет столько, сколько имеется градаций, видов, состояний у этого признака. Например, в случае проведения группировки населения по полу можно образовать только две группы: мужчины и женщины.

От группировок следует отличать классификацию. Классификацией называется систематизированное распределение явлений и объектов на определенные группы, классы, разряды на основании их сходства и различия.

Отличительные черты классификации:

в основе классификации лежит качественный признак;

классификации стандартны: они устанавливаются органами государственной и международной статистики. Если в каждом конкретном исследовании строится своя группировка, то классификация едина для любого исследования независимо от того, проводят его органы государственной статистики или другие учреждения и ведомства (министерства, налоговые органы и т. п.);

классификации устойчивы. Они остаются неизменными в течение длительного времени. Однако если появляются новые группы единиц, их классы, разряды, то в классификации вносятся соответствующие изменения и дополнения.

Классификация, предопределяя важнейшие признаки группировки единиц совокупности, является основой группировок. В классификации точно определены все возможные группы и имеются подробные указатели, которые помогают отнести любую единицу объекта в ту или иную группу в каждом конкретном случае.

Таким образом, цель классификации – однозначно идентифицировать единицы совокупности, обеспечить эффективный поиск информации и ее систематизацию, достичь сопоставимости с международными стандартами.

Если группировка проводится по количественному признаку, то необходимо тщательно изучить экономическую (социальную) сущность изучаемого явления. Лишь после этого в соответствии с задачами исследования можно решать вопрос о числе групп, близких по значению к варьирующему признаку единиц совокупности.

При небольшом объеме совокупности не следует образовывать большое число групп, так как группы будут малочисленными. Поэтому показатели, рассчитанные для таких групп, не будут представительными и не позволят получить адекватную характеристику исследуемого явления.

Часто группировка по количественному признаку имеет задачу отразить распределение единиц совокупности по этому признаку. В данном случае количество групп зависит в первую очередь от степени колеблемости группировочного признака: чем больше его колеблемость, тем больше следует образовать групп. (Степень колеблемости признака измеряется показателями вариации, которые подробно будут рассмотрены далее). Чем больше групп, тем точнее будет воспроизведен характер исследуемого объекта. Однако слишком большое число групп затрудняет выявление закономерностей при исследовании социально-экономических явлений и процессов. Поэтому в каждом конкретном случае при определении числа групп следует исходить не только из степени колеблемости признака, но еще учитывать и особенности объекта, и цель исследования.

При использовании персональных компьютеров для обработки статистических данных группировка единиц объекта проводится с помощью стандартных процедур.

Одна из таких процедур основана на использовании следующей формулы Стерджесса для определения оптимального числа групп:

 

n = 1 + 3.322 × lgN, (1)

 

где n – число групп; N – число единиц совокупности.

Согласно формуле (1) выбор числа групп зависит от объема совокупности.

Недостаток формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основание группировки, близко к нормальному.

Другой способ определения числа групп основан на применении показателя среднего квадратического отклонения (σ). При этом весь диапазон изменения показателя предполагается равным. Если величина интервала равна 0,5 σ, то совокупность разбивается на 12 групп, а когда величина интервала равна 2/З σ и σ, то совокупность делится соответственно на 9 и 6 групп.

Однако при определении числа групп данными методами существует большая вероятность получения «пустых» или малочисленных групп. «Пустыми» считаются группы, в которые не попала ни одна единица совокупности. Поэтому данными формулами нельзя пользоваться механически. Их показания требуют корректировки.

После определения числа групп решается задача определения интервалов группировки.

Интервал группировки –это интервал значений варьирующего признака, лежащих в пределах определенной группы. Каждый интервал имеет свою ширину, верхнюю и нижнюю границы или хотя бы одну из них. Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей – наибольшее значение признака в нем. Ширина интервала (ее еще часто называют интервальной разностью) представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки, в зависимости от их величины, бывают равные и неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.

Если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то строят группировку с равными интервалами.

Величина равного интервала определяется по следующей формуле:

 

(2)

 

где R = XmaxXmin – размах вариации; Xmax, Xmin – максимальное и минимальное значение признака в совокупносчти; n – число групп.

Прежде чем определять размах вариации, из совокупности рекомендуется исключить аномальные наблюдения; это значит, если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное и минимальное значения, а значения, несколько превышающие минимум и несколько меньшие, чем максимум.

Полученную по формуле (2) величину называют шагом интер вала.

Существуют следующие правила его определения.

Если шаг интервала, рассчитанный по формуле (2), представляет собой величину, имеющую один знак до запятой (например, 0,66; 1,372; 5,8), то в этом случае полученные значения целесообразно округлить до десятых долей.

Когда рассчитанный шаг интервала имеет две значащие цифры до запятой и несколько знаков после запятой, то это значение надо округлить до целого числа. Пусть величина интервала, исчисленная по формуле (2), равна 12,785. Тогда это значение следует округлить до целого числа, т. е до 13.

В случае, когда рассчитанный шаг интервала представляет собой трехзначное, четырехзначное и так далее число, эту величину необходимо округлить до ближайшего числа, кратного 100 или 50. Например, 248 следует округлить до 250.

Пример. Пусть требуется произвести группировку с равными интервалами предприятий по стоимости основных фондов, при этом максимальное значение признака равна 2040 млн руб., а минимальное его значение – 290 млн руб. Совокупность включает 80 единиц. Согласно формуле (3.1) она должна быть разбита на 7 групп. Сначала найдем размах вариации (R):

 

R = 2040 – 290 = 1750 млн руб.

 

Затем определим величину интервала:

 

h = 1750/7 = 250 млн руб.

 

После этого построим интервалы групп (табл. 2).

Таблица 2

Вариант построения интервалов групп

 

Группа

Интервал

1-й вариант 2-й вариант
I от 290 до 540 до 540
II от 540 до 790 540 – 790
III от 790 до 1040 790 – 1040
IV от 1040 до 1290 1040 – 1290
V от 1290 до 1540 1290 – 1540
VI от 1540 до 1790 1540 – 1790
VII от 1790 до 2040 1790 и более

 

Чтобы не писать каждый раз от … до, границы групп обозначают следующим образом: 290 – 540, 540 – 790 и т. д.

Особенностью 1-гo варианта построения групп является то, что у всех групп имеются закрытые интервалы. Во 2-м варианте первая и последняя группы – это группы с открытыми интервалами.

Открытые – это те интервалы, у вторых указана только одна граница: верхняя – у первого, нижняя – у последнего. Ширина открытого интервала принимается равной ширине смежного с ним интервала.

Закрытыми называются интервалы, у которых обозначены о6е границы.

При группировке по количественному признаку границы интервалов могут быть обозначены по-разному. Если основанием группировки служит непрерывный признак, то одно и тоже значение признака выступает и верхней, и нижней границами у двух смежных интервалов. Таким образом, верхняя граница i-го интервала равна нижней границе i + 1-го интервала. Примером такой группировки служат интервалы, приведенные в табл. 3.7.

При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы объекта, значения признака у которых совпадают с границами интервалов. Например, во вторую или третью группу должно войти предприятие со стоимостью фондов 790 млн руб. Если нижняя граница формируется по принципу «включительно», а верхняя – по принципу «исключительно», то предприятие должно быть отнесено к третьей группе, в противном случае – ко второй. Для того чтобы правильно отнести к той или иной груше единицу объекта, у которой значение признака совпадает с границами интервалов, можно использовать открытые интервалы.

Если в основании группировки лежит дискретный признак, то нижняя граница i-гo интервала равна верхней границе i – 1-го интервала, увеличенной на 1.

Пример. Пусть совокупность состоит из 80 предприятий и ее надо разделить на группы по численности занятых. Минимальное и максимальное значения группировочного признака соответственно равны 290 и 2040 человек. В этом случае возможны следующие варианты построения групп (табл. 3).

Таблица 3

Варианты построения интервалов групп

 

Группа

Интервал

1-й вариант 2-й вариант
I от 290 до 540 до 540
II от 541 до 790 541 – 790
III от 791 до 1040 791 – 1040
IV от 1041 до 1290 1041 – 1290
V от 1291 до 1540 1291 – 1540
VI от 1541 до 1790 1541 – 1790
VII от 1791 до 2040 1791 и более

 

Неравные интервалы применяются в статистике, когда значения признака варьируют неравномерно и в значительных размерах, что характерно для большинства социально-экономических явлений, особенно при анализе макроэкономических показателей.

Неравномерные интервалы могут быть прогрессивно возрастающие или убывающие в арифметической или геометричекой прогрессии. Величина интервалов, изменяющихся в арифметической прогрессии, определяется следующим образом:

 

hi + 1 = hi + a; (3)

 

в геометрической прогрессии.

 

hi + 1 = hi × q, (4)

 

где a-константа – число, которое будет положительным при прогрессивно возрастающих интервалах и отрицательным при прогрессивно убывающих интервалах; q-константа – положительное число, которое при прогрессивно возрастающих интервалах будет больше 1, а при прогрессивно убывающих – меньше 1.

Пример. Если необходимо построить группировку предприятий отрасли по показателю выручки от реализации продукции, который варьирует от 300 млн руб. до 4000 млн руб., то строить группировку с равными интервалами нецелесообразно, потому что, как правило, совокупность предприятий любой отрасли промышленности, торговли включает большое число малых предприятий, имеющих небольшую выручку. С ростом выручки от реализации продукции значительно снижается число предприятий. Таким образом, распределение числа предприятий по величине выручки является неравномерным. Поэтому следует построить группировку с неравными интервалами (табл. 4)

Таблица 4

Построение групп с неровными интервалами

 

Группа Интервал
1 300 – 800
II 800 – 1300
III 1300 – 2000
IV 2000 – 2900
V 2900 – 4000

 

Величина каждого последующего интервала у этой группировки больше предыдущего на 200 млн руб., т. е. увеличивается в арифметической прогрессии.

При определении границ интервалов статистических группировок исходят из того, что изменение количественного признака приводит к появлению нового качества. В этом случае граница интервала устанавливается там, где происходит переход от одного качества к другому. Рамки границ зависят от условий места и времени. Например, группировка предприятий по числу занятых показывает, что в промышленности и строительстве предприятия со среднесписочной численностью работающих 73 – 100 чел. относятся к группе малых предприятий, а в отраслях непроизводственной сферы и в розничной
торговле – к крупным.

Поэтому, строя такую группировку, следует дифференцированно устанавливать границы интервалов для разных отраслей народного хозяйства. Это достигается путем использования группировок со специализированными интервалами. Специализированными называются интервалы, применяющиеся для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях.

При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых не будут ни прогрессивно возрастающими, ни прогрессивно убывающими. Такие интервалы называются произвольными. Произвольные интервалы часто используются при группировке рабочих по выработке продукции, предприятий по уровню рентабельности, прибыльности и др.

После определения группировочного признака и границ групп строится ряд распределения.

 



2019-11-21 429 Обсуждений (0)
Принципы построения статистических группировок и классификаций 0.00 из 5.00 0 оценок









Обсуждение в статье: Принципы построения статистических группировок и классификаций

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе...
Генезис конфликтологии как науки в древней Греции: Для уяснения предыстории конфликтологии существенное значение имеет обращение к античной...
Почему человек чувствует себя несчастным?: Для начала определим, что такое несчастье. Несчастьем мы будем считать психологическое состояние...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (429)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.008 сек.)