(a) Найдите уравнение линии регрессии x на y, если линия проходит через (1, 4) и имеет градиент 2.
(b) Вычислите уравнение регрессии наименьших квадратов Y по X для следующих данных. Что такое коэффициент регрессии и что он означает?
X 5 6 8 10 12 13 15 16 17
Y 16 19 23 28 36 41 44 45 50
(Оригинал)
(a) Find the equation of the regression line of x on y if the line goes through (1, 4) and has gradient 2.
(b) Compute the least squares regression equation of Y on X for the following data. What is the regression coefficient and what does it mean?
X 5 6 8 10 12 13 15 16 17
Y 16 19 23 28 36 41 44 45 50
Ответы
(a) Чтобы найти уравнение линии регрессии x на y, мы можем использовать формулу y = mx + c, где m - градиент (slope) и c - точка пересечения с осью y (y-intercept).
У нас дана точка (1, 4) и градиент 2. Подставим эти значения в уравнение:
4 = 2 * 1 + c
Упростим:
4 = 2 + c
Вычтем 2 из обеих сторон:
2 = c
Таким образом, уравнение линии регрессии x на y будет y = 2x + 2.
(b) Чтобы вычислить уравнение регрессии наименьших квадратов Y по X, мы можем использовать метод наименьших квадратов. Этот метод позволяет найти линию, которая минимизирует сумму квадратов разностей между фактическими значениями Y и предсказанными значениями Y.
Для данного набора данных:
X: 5 6 8 10 12 13 15 16 17
Y: 16 19 23 28 36 41 44 45 50
Мы можем использовать формулу уравнения регрессии наименьших квадратов:
Y = aX + b
Где a - коэффициент регрессии (regression coefficient) и b - точка пересечения с осью Y (y-intercept).
Чтобы вычислить a и b, нам нужно использовать следующие формулы:
a = (nΣXY - ΣXΣY) / (nΣX^2 - (ΣX)^2)
b = (ΣY - aΣX) / n
Где n - количество наблюдений, ΣX - сумма значений X, ΣY - сумма значений Y, ΣXY - сумма произведений X и Y, ΣX^2 - сумма квадратов значений X.
Вычисляя значения, получаем:
n = 9
ΣX = 102
ΣY = 302
ΣXY = 4086
ΣX^2 = 1406
Подставляя значения в формулы, получаем:
a = (9 * 4086 - 102 * 302) / (9 * 1406 - 102^2) ≈ 2.426
b = (302 - 2.426 * 102) / 9 ≈ -4.963
Таким образом, уравнение регрессии наименьших квадратов Y по X будет Y ≈ 2.426X - 4.963.
Коэффициент регрессии (regression coefficient) a равен 2.426. Он показывает, насколько единица изменения в X влияет на изменение Y. В данном случае, каждое увеличение X на единицу приводит к примерно 2.426 единицам увеличения Y.
Он также может быть интерпретирован как угол наклона линии регрессии.