Методические рекомендации и выполнение. 1.Для оценки показателей вариации каждого признака необходимо найти

2015-11-20

1079

Обсуждений (0)

0.00 из 5.00 0 оценок

⇐ Предыдущая 1 2 3 456 Следующая ⇒

1.Для оценки показателей вариации каждого признака необходимо найти . Вычисления произведем с помощью следующей таблицы 10;

где

Таблица 10

№ п/п	х₁	х₂	y	х₁²	х₂²	у²

	3,9	10,0		15,21
	3,9	14,0		15,21
	3,7	15,0		13,69
	4,0	16,0		16,00
	3,8	17,0		14,44
	4,8	19,0		23,04
	5,4	19,0		29,16
	4,4	20,0		19,36
	5,3	20,0		28,09
	6,8	20,0		46,24
	6,0	21,0		36,00
	6,4	22,0		40,96
	6,8	22,0		46,24
	7,2	25,0		51,84
	8,0	28,0		64,00
	8,2	29,0		67,24
	8,1	30,0		65,61

Продолжение таблицы 10


	8,5	31,0		72,25
	9,6	32,0		92,16
	9,0	36,0		81,00
	123,8			837,74
ср. знач	6,19	22,3	9,6	41,887	541,4	97,9
	1,9	6,6	2,4

Сравнивая значения средних квадратических отклонений и средних величин, определим коэффициенты вариации:

Приходим к выводу о повышенном уровне варьирования признаков, хотя и в допустимых пределах, не превышающих 35%. Совокупность предприятий однородна и для ее изучения могут использоваться метод наименьших квадратов и вероятностные методы оценки статистических гипотез.

Сводную таблицу основных статистических характеристик для одного или нескольких массивов данных можно получить с помощью инструмента анализа данных Описательная статистика.Для этого выполните следующие шаги:

1)введите исходные данные или откройте существующий файл, содержащий анализируемые данные;

2) в главном меню выберите пункты Сервис/ Анализ данных/Описательная статистика, после чего щелкните по кнопке ОК;

Рис.14 Диалоговое окно ввода параметров инструмента Описательная статистика

3) заполните диалоговое окно ввода данных и параметров вывода (рис. 14):

Входной интервал – диапазон, содержащий анализируемые данные, это может быть одна или несколько строк (столбцов);

Группирование – по столбцам или по строкам – необходимо указать дополнительно;

Метки – флажок, который указывает, содержит ли первая строка названия столбцов или нет;

Выходной интервал – достаточно указать левую верхнюю ячейку будущего диапазона;

Новый рабочий лист – можно задать произвольное имя нового листа.

Если необходимо получить дополнительную информацию Итоговой статистики, Уровня надежности, k-го наибольшего и наименьшего значений, установите соответствующие флажки в диалоговом окне. Щелкните по кнопке ОК.

Результаты вычисления соответствующих показателей для каждого признака представлены на рис. 15.

Рис. 15. Результат применения инструмента Описательная статистика

2. Значения линейных коэффициентов парной корреляции определяют тесноту попарно связанных переменных, использованных в данном уравнении множественной регрессии. Линейные коэффициенты частной корреляции оценивают тесноту связи значений двух переменных, исключая влияние всех других переменных, представленных в уравнении множественной регрессии. Матрицу парных коэффициентов корреляции переменных можно рассчитать, используя инструмент анализа данных Корреляция. Для этого:

1) в главном меню последовательно выберите пункты Сервис/Анализ данных/ Корреляция.Щелкните по кнопке ОК;

2) заполните диалоговое окно ввода данных и параметров вывода (см. рис.16);

3) результаты вычислений – матрица коэффициентов парной корреляции – представлены на рис. 17

Рис.16. Диалоговое окно ввода параметров инструмента Корреляция

Рис.17. Матрица коэффициентов парной корреляции

К сожалению, в ППП MS Excel нет специального инструмента для расчета линейных коэффициентов частной корреляции.

Линейные коэффициенты частной корреляции рассчитаем по рекуррентной формуле:

Значения коэффициентов парной корреляции указывают на весьма тесную связь выработки у как с коэффициентом обновления основных фондов – х₁, так и с долей рабочих высокой квалификации – х₂(r =0,9699 и r =0,9408). Но в то же время межфакторная связь r =0,9428 весьма тесная и превышает тесноту связи х₂ с у. В связи с этим для улучшения данной модели можно исключить из нее фактор х₂ как малоинформативный, недостаточно статистики надежный.

Коэффициент частной корреляции дают более точную характеристику тесноты связи двух признаков, чем коэффициенты парной корреляции, так как очищают парную зависимость от взаимодействия данной пары признаков с другими признаками, представленными в модели. Наиболее тесно связаны у и х₁: r =0,7335, связь у и х₂ гораздо слабее: а межфакторная зависимость х₁ и х₂ выше, чем парная у и х₂: Все это приводит к выводу о необходимости исключить фактор х₂ – доля высококвалифицированных рабочих – из правой части уравнения множественной регрессии.

Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи:

r =0,9699; r =0,7335; ; .

Именно по этой причине рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у которого теснота парной зависимости меньше, чем теснота межфакторной связи.

3. Вычисление параметров линейного уравнения множественной регрессии проводится с помощью инструмента анализа данных Регрессия.Она аналогична расчету параметров парной линейной регрессии, описанной в лабораторной работе №1, только в отличие от парной регрессии в диалоговом окне при заполнении параметра входной интервал Х следует указать не один столбец, а все столбцы, содержащие значения факторных признаков:

1) проверьте доступ к пакету анализа. В главном меню последовательно выберите Сервис/Надстройки. Установите флажок Пакет анализа

2) в главном меню выберите Сервис/Анализ данных/Регрессия. Щелкните по кнопке ОК(рис.18).

Рис. 18. Диалоговое окно Анализ данных

3) заполните диалоговое окно ввода данных и параметров вывода (рис.19):

Рис.19. Диалоговое окно ввода параметров инструмента Регрессия

Входной интервал Y – диапазон, содержащий данные результативного признака

Входной интервал Х – диапазон, содержащий данные факторов независимого признака

Метки – флажок, который указывает, содержит ли первая строка названия столбцов или нет;

Константа – ноль - флажок, указывающий на наличие или отсутствие свободного члена в уравнении;

Выходной интервал – достаточно указать левую верхнюю ячейку будущего диапазона;

Новый рабочий лист – можно задать произвольное имя нового листа.

Если необходимо получить информацию и графики остатков, установите соответствующие флажки диалоговом окне. Щелкните по кнопке ОК.

Результаты анализа представлены на рис. 20.

Рис.20. Результат применения инструмента Регрессия

По результатам вычислений составим уравнение множественной регрессии :

Значения случайных ошибок параметров b₀, b₁ и b₂ с учетом округления:

Они показывают, какое значение данной характеристики сформировалось под влиянием случайных факторов. Эти значения используются для расчета t-критерия Стьюдента:

Если значения t – критерия больше 2 – 3, можно сделать вывод о существенности данного параметра, который формируется под воздействием неслучайных причин. Здесь статистически значимыми являются b₀ и b₁, а величина b₂ сформировалась под воздействием случайных причин, поэтому фактор х₂, силу влияния которого оценивает b₂, можно исключить как несущественно влияющий, неинформативный.

На это же указывает показатель вероятности случайных значений параметров регрессии: если меньше принятого нами уровня (обычно 0,1; 0,05 или 0,01; это соответствует 10%; 5% или 1% вероятности), делают вывод о неслучайной природе данного значения параметра, т.е. о том, что он статистически значим и надежен. В противном случае принимается гипотеза о случайной природе значения коэффициентов уравнения. Здесь , что позволяет рассматривать х₂ как неинформативный фактор и удалить его для улучшения данного уравнения.

Величина b₀ оценивает агрегированное влияние прочих (кроме учтенных в модели факторов х₁ и х₂) факторов на результат y.

Величины b₁и b₂ указывают, что с увеличением х₁ и х₂ на единицу их значений результат увеличивается соответственно на 0,9459 и на 0,0856 млн руб. Сравнивать эти значения не следует, так как они зависят от единиц измерения каждого признака и потому несопоставимы между собой.

4. Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает F – критерий Фишера: .

По данным таблиц дисперсионного анализа, представленным на рис. 20

F_факт = 151,65. Вероятность случайно получить такое значение F – критерия составляет 0,0000, что не превышает допустимый уровень значимости 5%; об этом свидетельствует величина P – значения из этих же таблиц. Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т. е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи .

Значения скорректированного и нескорректированного линейных коэффициентов множественной детерминации приведены на рис. 20 в рамках регрессионной статистики.

Нескорректированный коэффициент множественной детерминации оценивает долю вариации результата за счет представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет 94,7% и указывает на весьма высокую степень обусловленности вариации результата вариацией факторов, иными словами – на весьма тесную связь факторов с результатом.

Скорректированный коэффициент множественной детерминации определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов в модели и потому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на весьма высокую (более 90%) детерминированность результата y в модели факторами х₁ и х₂.

5. Найдем частные F критерии для оценки целесообразности включения в модель фактора х₁ после фактора х₂ и фактора х₂после фактора х₁:

Частный F-критерий - F показывает статистическую значимость включения фактора х₂ в модель после того, как в нее включен фактор х₁.

F =2. Вероятность случайной природы его значения (Р- значение =0,1750) составляет 17,5% против принятого уровня значимости =0,05 (5%). Следовательно, включение в модель фактора х₂ – доля высококвалифицированных рабочих – после того, как в уравнение включен фактор х₁ – коэффициент обновления основных фондов – статистически нецелесообразно: прирост факторной дисперсии за счет дополнительного признака х₂ оказывается незначимым, несущественным; фактор х₂ включать в уравнение после фактора х₁ не следует.

Если поменять первоначальный порядок включая факторов в модель и рассмотреть вариант включая х₁ после х₂, то результат расчета частного F – критерия для х₁ будет иным. =19,80.

Вероятность его случайного формирования составила 0,04%, это значительно меньше принятого стандарта =0,05 (5%). Следовательно, значение частного F – критерия для дополнительно включенного фактора х₁ не случайно, является статистически значимым, надежным, достоверным: прирост факторной дисперсии за счет дополнительного фактора х₁ является существенным. Фактор х₁ должен присутствовать в уравнении, в том числе в варианте, когда он дополнительно включается после фактора х₂.

Общий вывод состоит в том, что множественная модель с факторами х₁ и х₂ с содержит неинформативный фактор х₂. Если исключить фактор х₂, то можно ограничиться уравнением парной регрессии.

6. Средние частные коэффициенты эластичности показывают, на сколько процентов от значения своей средней изменяется результат при изменении фактора на 1% от своей средней и при фиксированном воздействии на у всех прочих факторов, включенных в уравнение регрессии. Для линейной зависимости: , где b_j – коэффициент регрессии при х_j в уравнении множественной регрессии.

Здесь , .

По значениям частных коэффициентов эластичности можно сделать вывод о более сильном влиянии на результат у признака фактора х₁, чем признака фактора х₂: 0,6% против 0,2%.

Варианты заданий лабораторной работы №3

По 20 предприятиям региона (табл. 11) изучается зависимость выработки продукции на одного работника у (тыс. руб.) от ввода в действие новых основных фондов х₁ (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих х₂ (%).

Таблица 11

№	у	х₁	х₂
	7,0	3+0,1i	10+0,1j
	7,0	3+0,1i	14+0,1j
	7,0	3+0,08i	15-0,1j
	7,0	4-0,01i	16-0,1j
	7,0	3+0,09i	17+0,05j
	7,0	4+0,1i	19+0,05j
	8,0	5+0,05i	19+0,05j
	8,0	4+0,09i	20-0,05j
	8,0	5+0,04i	20-0,05j
	10,0	6+0,1i	20-0,05j
	9,0	6-0,01i	21+0,01j
	11,0	6+0,05i	22+0,01j
	9,0	6+0,1i	22+0,01j
	11,0	7+0,02i	25+0,1j
	12,0	8-0,01i	28-0,1j
	12,0	8+0,02i	29-0,1j
	12,0	8+0,01i	30+0,5j
	12,0	8+0,1i	31+0,5j
	14,0	9+0,1i	32-0,01j
	14,0	9-0,01i	36+0,01j

где i, j – две последние цифры номера зачетной книжки соответственно

Требуется:

1. Оценить показатели вариации каждого признака и сделать вывод о возможностях применения МНК для их изучения.

2015-11-20

1079

Обсуждений (0)

0.00 из 5.00 0 оценок

⇐ Предыдущая 1 2 3 456 Следующая ⇒

Обсуждение в статье: Методические рекомендации и выполнение. 1.Для оценки показателей вариации каждого признака необходимо найти

Обсуждений еще не было, будьте первым... ↓↓↓