В тех случаях, когда число наблюдений зависимости признака Y от Х невелико, группировать их нет необходимости, тем более, что в таких случаях совпадающих пар значений, как правило, не оказывается, т.е. различные значения признака Х и соответствующие им значения признака Y наблюдаются по одному разу. Естественно, отпадает необходимость находить условные средние и уравнение регрессии записывается теперь в виде . В частности, уравнение прямой регрессии по несгруппированным данным имеет вид . Все рабочие формулы для определения коэффициентов и являются частными случаями соответствующих формул для сгруппированных данных при условии S=t=n, и мало отличаются от последних. Приведем окончательный результат: уравнение прямой регрессии на имеет вид:
, коэффициент регрессии находится по формуле
где Оценка тесноты линейной связи характеризуется близостью к единице модуля коэффициента корреляции r: , где .Нахождение выборочного уравнения прямой регрессии по несгруппированным данным рассмотрим на следующем примере.
Пример 10. Приведены данные (табл. 8) о дозах внесения удобрений на 1 га посева зерновых (Х) и об урожайности зерновых культур в ц/га (Y). Требуется построить уравнение прямой линии регрессии на .Таблица 8
Х
1,0
4,1
3,8
3,9
1,2
3,9
4,1
0,8
0,7
1,3
Y
23,6
31,9
35,2
36,4
23,6
34,0
38,2
17,3
23,8
19,7
Решение. Во-первых, таблицу 8 запишем в порядке возрастания значений признака Х. Получим таблицу 9:
Х
0,7
0,8
1,0
1,2
1,3
3,8
3,9
3,9
4,1
4,1
Y
23,8
17,3
23,6
23,6
19,7
35,2
34,0
36,4
31,9
38,2
Построим диаграмму рассеивания, нанося точки на
координатную плоскость (рис. 6)
х
Рис. 6
Предполагая наличие линейной зависимости, построим прямую регрессии на . Все расчеты объединим в таблицу 10.
Таблица 10
0,7
23,8
0,49
16,66
566,44
20,35
0,8
17,3
0,64
13,84
299,29
20,8
1,0
23,6
1,0
23,6
556,96
21,7
1,2
23,6
1,44
28,32
566,96
22,6
1,3
19,7
1,69
25,61
388,09
23,05
3,8
35,2
14,44
133,76
1239,04
34,3
3,9
34,0
15,21
132,6
1156,0
34,75
3,9
36,4
15,21
141,96
1324,96
34,75
4,1
31,9
16,81
130,79
1017,61
35,65
4,1
38,2
16,81
156,62
1459,24
35,65
24,8
283,7
83,74
803,76
8564,59
283,6
2,48=
28,37=
8,374=
80,376=
856,459=
28,36
По данным таблицы 10. находим коэффициент регрессии:
уравнение прямой регрессии: или
(см. рис. 6) коэффициент корреляции:
. По шкале Чеддока значение r=0,935 означает наличие весьма высокой линейной зависимости.
Приложения.
Приложение 1. Значения функции
𝑥
0, 0
0,3989
0,3989
0,3989
0,3988
0,3986
0,3984
0,3982
0,3980
0,3977
0,3973
0, 1
0, 2
0, 3
0, 4
0,5
0, 6
0,7
ЗОИ
0, 8
0, 9
1, 0
1, 1
1, 2
1, 3
1, 4
1, 5
1, 6
1, 7
1, 8
1, 9
О584
2, 0
2, 1
2, 2
2, 3
2, 4
2, 5
2, 6
2, 7
2, 8
2, 9
3, 0
4, 0
Приложение 2. Значение функции Ф(𝑥)
Замечание: функция Ф(х)- нечётная, т.е. Ф(-х)=Ф(х).