r01 – общее влияние х1 на r133 – мера опосредованного влияния х1 через х3 на х0.
r01 = 0,4 + 0,47 0,25 = 0,52
r03 = 3 + r311, где r03 – общее влияние х3 на r311 – мера опосредованного влияния х3 через х1 на х0.
Лабораторная работа № 3.
Тема: «Дисперсионное отношение. Эмпирическая и аналитическая регрессии.»
Цель: выявление зависимости между признаками-факторами и признаком-результатом.
Таблица с исходными данными.
Таблица 1
Средний балл за¬чётки по итогам экзаменов за 1-ый курс (баллы) Посещаемость занятий на первом курсе (ч/нед)
Самообразование (доп. Курсы) (ч/нед) Подготовка к семинар¬ским заня¬тиям (ч/нед)
4,7 19,5 0 5
4,5 22 2 6
4,2 22 0 2
4,3 19,5 0 7
4,5 17,5 0 3
4,2 9,5 6 12
4,0 12,5 0 5
4,7 22 4 7
4,6 17,5 3 4
4,7 9,5 0 2
4,5 11,5 6 3
4,0 11,5 2 3
4,2 19,5 4 8
4,0 20,5 6 9
3,2 9,5 0 0
4,0 17,5 0 8
3,2 14,5 0 2
3,5 14,5 0 2
4,8 22 0 10
4,6 8,5 0 1
4,5 22 0 4
4,5 22 6 2
4,2 17,5 4 4
4,5 14,5 6 4
4,2 11,5 2 2
4,8 17,5 0 4
4,0 10,5 0 2
4,2 17,5 2 6
3,0 9,5 0 0
4,8 19,5 2 2
4,8 19,5 2 6
4,3 17,5 4 2
3,2 6,0 0 0
4,5 22 2 5
4,7 22 4 3
4,2 22 3 5
4,6 9,5 0 1
3,0 14,0 0 2
3,0 6,5 0 5
4,0 22 2 5
4,7 17,5 6 0
3,5 11,5 0 6
4,7 22 6 2
4,5 22 0 0
3,2 17,5 4 8
4,8 22 0 0
3,2 9,5 0 5
4,5 17,5 0 3
3,0 14,5 5 3
4,7 11,5 5 3
Рассматриваю первую пару признаков: признак-фактор—посещаемость занятий на 1 курсе (ч/нед) и признак-результат—средний балл зачётки по итогам экзаменов за 1 курс (баллы). Далее обосную взаимосвязь между ними.
Расчётная таблица №1
Таблица 2
Посещаемость занятий (ч/нед) Число наблюдений xi yi yi 2yi 2yi i yi - y (yi–y)2I
[6-10] 9 8,6 3,7 0,71 0,5 4,5 -0,5 2,25
[10-14] 8 11,5 4,1 0,38 0,14 1,12 -0,1 0,08
[14-18] 15 16,4 3,7 1,01 1,02 15,3 -0,5 3,75
[18-22] 18 19,6 4,4 0,31 0,09 1,62 0,4 2,88
Сумма 50 - - - - 22,54 - 8,96
Средняя - 15,3 4,0 - - 5,6 - 2,24
2y = ((yi–y)2I)
2y = 8,96 / 50 = 0,1792 (балла)2
E2y= (б2yiI) / I
E2y = (4,5 + 1,12 + 15,3 + 1,62) / 50 = 0,4508(балла)2
б2y = E2y + 2y = 0,4508 + 0,1792 = 0,63 (балла)2
2 = 2y / б2y = 0,1792 / 0,63 = 0,28 (0,28%)
построение аналитической регрессии.
yx = a + bx
xy = (xyI) / I = 62,52
б2x = 19,4 (ч/нед)2
b = (xy – x y) / б2x = (62,52 – 15,3 4,0) / 19,4 = 0,068
a = y – bx = 4,0 – 0,068 15,3 = 2,96
Линейное уравнение регрессии зависимости среднего балла зачётки за 1 курс от посещаемости: строим по двум точкам
yx = 2,96 + 0,068х
1. yx = 2,96 + 0,068 6 = 3,358
2. yx = 2,96 + 0,068 22 = 4,446
rxy = (xy – x y) / бxбy = 0,37
Корреляционное поле
Эмпирическая линия регрессии
Аналитическая линия регрессии
Распределение среднего балла зачётки за 1 курс по признаку-фактору—посещаемости занятий на 1 курсе.
Вывод: 2 свидетельствует о том, что 28% общей вариации результативного признака вызвано влиянием признака фактора—посещаемостью. Остальные 72% - вызваны влиянием прочих факторов. Можно сказать, что это слабая корреляционная зависимость. Интерпретируя параметр b, предполагаем, что для данной совокупности студентов с увеличением посещаемости занятий на 1 курсе на 1 ч/нед средний балл зачётки увеличивается на 0,068 балла. rxy говорит о том, что между признаком-результатом и признаком-фактором заметная линейная связь.
Рассматриваю вторую пару признаков:
Расчётная таблица № 2.
Таблица 3
Подготовка к семинарским занятиям (ч/нед) Число наблюдений xi yi yi 2yi 2yi i yi - y (yi–y)2i
[0-3] 20 1,2 3,78 0,63 0,39 7,8 -0,22 0,96
[3-6] 18 4,0 4,31 0,45 0,2 3,6 0,31 1,72
[6-9] 9 6,8 4,46 0,28 0,07 0,63 0,46 1,9
[9-12] 2 9,5 4,4 0,399 0,15 0,3 0,4 0,32
Сумма 50 - - - - 2,33 - 4,9
средняя - 3,5 4,0 - - 3,08 - 1,2
2y = ((yi–y)2I)
2y = 4,9 / 50 = 0,098 (балла)2
E2y= (б2yiI) / I
E2y = 12,33 / 50 = 0,25 (балла)2
б2y = E2y + 2y = 0,35 (балла)2
2 = 2y / б2y = 0,098 / 0,35 = 0,28 (0,28%)
= 0,53
построение аналитической регрессии.
yx = a + bx
xy = (xyI) / I
xy = 15,2
б2x = 7,2 (ч/нед)2
b = (xy – x y) / б2x = (15,2 – 3,5 4,0) / 7,2 = 0,16
a = y – bx = 4,0 – 0,16 3,4
Линейное уравнение регрессии зависимости среднего балла зачётки за 1 курс от подготовки к семинарским занятиям:
yx = 2,96 + 0,068х
x = 0 y = 3,4
x = 7 y = 4,5
rxy = (xy – x y) / бxбy = (15,2 – 14) / 2,6 = 0,46
Корреляционное поле
Эмпирическая линия регрессии
Аналитическая линия регрессии
Распределение среднего балла зачётки за 1 курс по признаку-фактору—подготовке к семинарским занятиям.
Вывод: 2 свидетельствует о том, что 28% общей вариации результативного признака вызвано влиянием признака фактора—подготовкой к семинарским занятиям. Остальные 72% - вызваны влиянием прочих факторов. Можно сказать, что это слабая корреляционная зависимость. Интерпретируя параметр b, предполагаем, что для данной совокупности студентов с увеличением подготовки к занятиям на 1 курсе на 1 ч/нед средний балл зачётки увеличивается на 0,16 балла. rxy говорит о том, что между признаком-результатом и признаком-фактором есть умеренная линейная связь.
Рассматриваю третью пару признаков:
Расчётная таблица № 3
Таблица 4
Самообразование (ч/нед) Число наблюдений xi yi yi 2yi 2yi i yi - y (yi–y)2i
0 25 0 4,07 0,68 0,46 11,5 -0,03 0,022
2 8 2 4,38 0,3 0,09 0,72 0,28 0,62
3 2 3 4,40 0,2 0,04 0,08 0,3 0,18
4 6 4 4,22 0,5 0,25 1,5 0,12 0,08
5 2 5 3,35 0,35 0,12 0,24 -0,75 1,16
6 7 6 3,3 0,40 0,16 1,12 0,2 0,28
Сумма 50 - - - - 15,88 - 2,34
средняя - 1,96 4,1 - - 0,31 - 0,39
2y = ((yi–y)2I)
2y = 2,34 / 50 = 0,046 (балла)2
E2y= (б2yiI) / I
E2y = 15,88 / 50 = 0,31 (балла)2
б2y = E2y + 2y = 0,31 + 0,046 = 0,36 (балла)2
2 = 2y / б2y = 0,046 / 0,36 = 0,13 (13%)
= 0,36
построение аналитической регрессии.
yx = a + bx
xy = (xyI) / I
xy = 8,22
б2x = 5,1 (ч/нед)2
b = (xy – x y) / б2x = (8,22 – 8,036) / 5,1 = 0,032
a = y – bx = 4,1 – 0,032 1,96 = 4,03
Линейное уравнение регрессии зависимости среднего балла зачётки за 1 курс от самообразования:
yx = 2,96 + 0,068х
x = 0 y = 3,4
x = 7 y = 4,5
rxy = (xy – x y) / бxбy = (8,2 – 8,036) / 2,25 0,6 = 0,12
Корреляционное поле
Эмпирическая линия регрессии
Аналитическая линия регрессии
Вывод: 2 свидетельствует о том, что 13% общей вариации результативного признака вызвано влиянием признака фактора—самообразованием. Можно сказать, что это очень слабая корреляционная связь. Зная коэффициент b, предполагаем, что для данной совокупности студентов с увеличением самообразования на 1 ч/нед средний балл зачётки увеличивается на 0,032 балла. rxy говорит о том, что между признаком-результатом и признаком-фактором есть слабая прямая линейная связь.
Министерство Высшего Образования РФ
Санкт-Петербургский Государственный Инженерно-Экономический Университет
|
|