Распределение значений признака по диапазонам рассеяния признака относительно
12 Исходные данные
РЕЗУЛЬТАТИВНЫЕ ТАБЛИЦЫ И ГРАФИКИ Диаграмма 1 Аномальные значения признаков на диаграмме рассеяния
Таблица 2 Аномальные единицы наблюдения
Таблица 3 Описательные статистики
Таблица 4,а Предельные ошибки выборки
Таблица 4,б Предельные ошибки выборки
Таблица 5 Выборочные показатели вариации и асимметрии
Таблица 6 Выходная таблица инструмента ГИСТОГРАММА
Таблица 7 Интервальный ряд распределения предприятий по стоимости основных производственных фондов
Диаграмма 2
Анализ выборочной совокупности. Задача 1. На построенной диаграмме рассеяния (см. Диаграмма 1) визуально видно наличие аномальных точек. Это предприятие №25 (среднегодовая стоимость основных производственных фондов – 45 млн руб.; выпуск продукции – 224 млн руб.) и предприятие №31 (среднегодовая стоимость основных производственных фондов – 330 млн руб.; выпуск продукции – 53 млн руб.). Исключим аномальные единицы наблюдения из первичных данных. Внесем аномальные единицы наблюдения в таблицу 2.
Задача 2. На основе имеющихся данных составим таблицу Таблица 8 Описательные статистики выборочной совокупности
В таблицу внесены обобщающие статистические показатели совокупности, исчисляемые на основе анализа вариационных рядов распределения
Задача 3. 3,а. Если величина Vσ удовлетворяет условию 0%<Vσ≤40%, то степень колеблемости незначительна. В данной совокупности выполняется это условие. 0%<23,0663639≤40% 0%<23,79170449≤40% 3,б. Совокупность является количественно однородной по тому или иному признаку, когда выполняется неравенство Vσ≤33%. Коэффициенты вариации по каждому признаку удовлетворяют данному условию. Следовательно, совокупности являются количественно однородными. 3,в. Если , то значения признака неустойчивы. В них имеются «аномальные» выбросы.
Следовательно, несмотря на визуальное обнаружение и исключение нетипичных единиц наблюдения при выполнении задания 1, некоторые аномалии в первичных данных продолжают сохраняться. Аномалии следует выявить и удалить из выборки. Г. Обобщим данные и составим таблицу Таблица 9 Распределение значений признака по диапазонам рассеяния признака относительно
Согласно вероятностной теореме П.Л. Чебышева, следует ожидать, что независимо от формы распределения 75% значений признака будут находиться в диапазоне ( ), а 89% значений – в диапазоне ( ) В нормально распределенных и близких к ним рядах вероятные оценки диапазонов рассеяния значений признака таковы: - 68,3% войдет в диапазон ( ) - 95,4% попадет в диапазон ( ) (1) - 99,7% появится в диапазоне ( ) Соотношение (1) известно как правило «трех сигм». В нашем случае значения каждого из признаков отлично от правила «трех сигм». Значения второго признака ближе к правилу. Задача 4. 4,а. Размах вариации R= Х max -Х min . R для первого признака – 204 млн руб., для второго – 140 млн руб.. Размах вариации устанавливает предельное значение амплитуды колебаний признака. Среднее линейное отклонение по первому признаку равно 35,44, по второму - 28,42222222. В условиях симметричного и нормального, а также близких к ним распределениям между показателями σ и d имеет место равенство: d ≈ 0,8 σ. Первый признак: d ≈ 0,8*46,04815113 ≈ 36,838520904. Второй признак: d ≈ 0,8*34,06179026 ≈ 27,249432208 Рассчитанные по формуле значения приблизительно равны значениям, рассчитанным с помощью программы MS Excel. Дисперсия σ n 2 оценивает средний квадрат отклонений ( ). Величина σ очень чутко реагирует на вариацию признака (за счет возведения отклонений в квадрат) и органически вписывается в аппарат математической статистики (дисперсионный, корреляционный анализ и др.). Дисперсия первого признака (2120,432222) более, чем в 1,5 раза превосходит значение дисперсии второго признака (1160,205556). Среднее квадратическое отклонение σ показывает, насколько в среднем отклоняются индивидуальные значения признака хi от их средней величины . Так, индивидуальные значения первого признака отличаются от на 46,04815113 млн руб., а второго – на 34,06179026 млн руб.. 4,б. Совокупность является количественно однородной по тому или иному признаку, когда выполняется неравенство Vσ≤33%. Коэффициенты вариации по каждому признаку удовлетворяют данному условию. Следовательно, совокупности являются количественно однородными. 4,в. Для оценки надежности (типичности) средней величины х можно воспользоваться значением показателя вариации Vσ. Если его значение невелико, т.е. <40% (как в нашем случае), то индивидуальные значения признака хi мало отличаются друг от друга, единицы наблюдения количественно однородны и, следовательно, средняя арифметическая величина является надежной характеристикой данной совокупности. 4,г. Если As<0, то асимметрия левосторонняя, если As>0, то асимметрия правосторонняя. И для первого (0,708678471), и для второго (0,856286955) признака асимметрия левосторонняя. │As│>0,5. Следовательно, асимметрия существенная. Задача 5. Интервальный вариационный ряд распределения единиц совокупности по признаку представлен в таблице 7. Гистограмма и кумулята интервального ряда распределения предприятий изображены на Диаграмме 2. Для полученного интервального ряда значение моды рассчитывается по формуле: млн руб. Значение моды в таблице 3 – Мо=167 млн руб.. Для несгруппированных данных мода - это значение признака с наибольшей частотой появления. В интервальном ряду вычисление моды весьма условно. Поэтому между ними могут быть различия.
12
Популярное: Как вы ведете себя при стрессе?: Вы можете самостоятельно управлять стрессом! Каждый из нас имеет право и возможность уменьшить его воздействие на нас... Как выбрать специалиста по управлению гостиницей: Понятно, что управление гостиницей невозможно без специальных знаний. Соответственно, важна квалификация... Почему стероиды повышают давление?: Основных причин три... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (402)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |