Лабораторная работа №2 по дисциплине «Дискретный анализ» по теме: «Множественная линейная регрессия»




НазваниеЛабораторная работа №2 по дисциплине «Дискретный анализ» по теме: «Множественная линейная регрессия»
Дата конвертации02.04.2013
Размер85.75 Kb.
ТипЛабораторная работа
МІНІСТЕРСТВО ОСВІТИ ТА НАУКИ УКРАЇНИ

ОДЕСЬКИЙ НАЦІОНАЛЬНИЙ ПОЛІТЕХНІЧНИЙ УНІВЕРСИТЕТ


Лабораторная работа № 2

по дисциплине

«Дискретный анализ»

по теме:

«Множественная линейная регрессия»

Вариант №8

Выполнила:

ст.гр ОИ-071

Коляда О.С.

Проверил:

Андриенко В.М.
Одеса 2010

Формулировка задачи.

Результаты наблюдений функционирования отрасли ( Y - валовой выпуск, X1 - фондоворуженность, X2- производительность труда) приведены в таблице. Предполагая, что валовой выпуск зависит линейно от фондовооруженности и производительности труда построить линейную регрессионную модель и сделать анализ модели.

Таблица 1.

Исходные данные

У

X1

X2

1233

2,61

6,1

1260

2,56

5,9

1502

2,67

6,7

1624

2,94

7,2

1695

3,08

7,2

1656

3,41

7,5

1779

3,59

7,8

1943

3,74

8,2

Теоретические основания к поставленной задаче

Рассмотрим случай, когда число переменных больше 2. В этом случае линейная модель имеет вид

, (1)

где - вектор ошибок наблюдений.

Введем следующие матричные обозначения :
где -вектор-столбец выборочных значений результирующего признака;

-матрица значений переменных , включая единичный столбец, отвечающий свободному члену;

- вектор –столбец всех параметров регрессии;

-вектор-столбец выборочных реализаций случайной составляющей,

M() = 0, cov

-независимы и имеют нормальное распределение с параметрами (0,).

В матричном виде модель записывается так:

Y = X + , (2)

Вектор параметров регрессии находят при условии минимизации ее ошибки по формуле:

, (3)

штрих здесь и далее означает транспонирование .

Остаточная сумма квадратов Qe вычисляется по формуле

Qe = (4)

(5)

Проверка гипотезы Н0: позволяет установить, находятся ли переменные во взаимосвязи с Y. Статистикой критерия для проверки гипотезы Н0 является соотношение

z=, (6)

если выборочное значение этой статистики > , то гипотеза

Н0 отклоняется; в противном случае следует считать , что взаимосвязи Y с переменными нет.

Границы доверительных интервалов для параметров j определяются по формуле

, j=1,2,…,m (7)

где - диагональный элемент матрицы .

При использовании модели (1) для представления данных необходимо решить вопрос целесообразности включения переменных в модель. для этого проверяются гипотезы Эти гипотезы могут быть проверены непосредственно по доверительным интервалам (7). Если доверительный интервал для накрывает нуль, то гипотеза

принимается и соответствующую переменную не целесообразно включать в модель, в противном случае отклоняется.

Коэффициент множественной корреляции определяется по формуле

R = . (8)

Таблица 2.

Дополнительная регрессионная статистика.

Величина

Описание

se1,se2,...,sen

Стандартные значения ошибок для коэффициентов m1,m2,...,mn.

seb

Стандартное значение ошибки для постоянной b (seb = #Н/Д, если конст имеет значение ЛОЖЬ).

r2

Коэффициент детерминации. Сравниваются фактические значения y и значения, получаемые из уравнения прямой; по результатам сравнения вычисляется коэффициент детерминации, нормированный от 0 до 1. Если он равен 1, то имеет место полная корреляция с моделью, т. е. нет различия между фактическим и оценочным значениями y. В противоположном случае, если коэффициент детерминации равен 0, то уравнение регрессии неудачно для предсказания значений y.

sey

Стандартная ошибка для оценки y.

F

F-статистика, или F-наблюдаемое значение. F-статистика используется для определения того, является ли наблюдаемая взаимосвязь между зависимой и независимой переменными случайной или нет.

d

Степени свободы. Степени свободы полезны для нахождения F-критических значений в статистической таблице. Для определения уровня надежности модели нужно сравнить значения в таблице с F-статистикой, возвращаемой функцией ЛИНЕЙН.

SSрег

Регрессионная сумма квадратов.

SSост

Остаточная сумма квадратов.

Данные при использовании Excel выводятся в следующую таблицу :

Таблица 3.

Результирующая таблица.




А

В

С

D

E

F

1











b

2














3


















4

F















5



















Компьютерная реализация однофакторного дисперсионного анализа





А

B

C

1

У

X1

X2

2

1233

2,61

6,1

3

1260

2,56

5,9

4

1502

2,67

6,7

5

1624

2,94

7,2

6

1695

3,08

7,2

7

1656

3,41

7,5

8

1779

3,59

7,8

9

1943

3,74

8,2


Рисунок 1. Исходные данные





А

B

C

10

379,2915

-141,957

-660,471

11

76,86593

133,5061

196,4601

12

0,971776

48,74074

#Н/Д

13

86,07792

5

#Н/Д

14

408983,7

11878,3

#Н/Д


Рисунок 2.Результирующие данные


= 379,2915

= 76,86593

= 0,971776

F = 86,07792

= 408983,7

= -141,957

= 133,5061

= 48,74074

= 5

= 11878,3
= - 660,471

=196,4601



Использование статистик F и r2

Уравнение множественной регрессии y = m1*x1 + m2*x2 + m3*x3 + m4*x4 + b теперь может быть получено из строки 10:



Коэффициент детерминации r2 равен 0,971776 (, что указывает на сильную зависимость между независимыми переменными и продажной ценой. Можно использовать F-статистику, чтобы определить, является ли этот результат (с таким высоким значение r2 ) случайным.

Предположим, что на самом деле нет взаимосвязи между переменными, просто статистический анализ вывел сильную взаимозависимость по взятой равномерной выборке 8 отраслей.

Если F-наблюдаемое больше, чем F-критическое, то взаимосвязь между переменными имеется. F-критическое можно получить из таблицы F-критических значений в любом справочнике по математической статистике. Для того, чтобы найти это значение, используя односторонний тест, положим уровень значимости 0,05, а для числа степеней свободы (обозначаемых обычно v1 и v2), положим

v1 = k = 2 и v2 = n - (k + 1) = 8 - (2 + 1) = 7

, где k - это число переменных, а n - число точек данных.

Из таблицы справочника F-критическое равно 4,74.

F-наблюдаемое равно 86,07792 (ячейка A18), что заметно больше чем F-критическое (4,74). Следовательно, полученное регрессионное уравнение полезно для определения валового выпуска продукции.

Вычисление t-статистики

Определим, имеет ли каждый коэффициент статистическую значимость для оценки валового выпуска: t-критическое с 7 степенями свободы и = 0,05 равно 1,895

tтабл0,95(7)=1,895

Полученные наблюдаемые t-значения для каждой из независимых переменных приводим в таблице :

Таблица 4.

Вычисление t-статистики

Переменная

t-наблюдаемое значение

фондоворуженность

-1,063

производительность

-3,362

t = m4 / se4 = -141,957/133,5061 = -1,063.

Поскольку абсолютная величина t, равная 1,063, меньше, чем 1,895, фондовооруженность — это не важная переменная для валового выпуска продукции. Аналогичным образом можно протестировать все другие переменные на статистическую значимость. Абсолютная величина для производительности = 3,362, это больше, чем 1,895 значит производительность полезная для определения валового выпуска продукции.

Литература.

    1. Попов А.А.

Excel: Практическое руководство, ДЕСС КОМ.-М.-2000.

  1. Дьяконов В.П., Абраменкова И.В. Mathcad7 в математике, физике и в Internet. Изд-во « Номидж», М.-1998, раздел 2.13. Выполнение регрессии.

  2. Л.А. Сошникова, В.Н. Томашевич и др. Многомерный статистический анализ в экономике под ред. В.Н. Томашевича.- М. –Наука, 1980.

  3. Колемаев В.А., О.В. Староверов, В.Б. Турундаевский Теория вероятностей и математическая статистика. –М. – Высшая школа- 1991.

  4. К Иберла. Факторный анализ.-М. Статистика.-1980.



Похожие:

Лабораторная работа №2 по дисциплине «Дискретный анализ» по теме: «Множественная линейная регрессия» iconЛабораторная работа №1. Отбор факторов для построения множественной линейной зависимости и оценка степени коллинеарности и мультиколлинеарности регрессоров
Множественная линейная регрессия – уравнение связи с несколькими независимыми переменными
Лабораторная работа №2 по дисциплине «Дискретный анализ» по теме: «Множественная линейная регрессия» iconТемы рефератов по эконометрике для магистров Множественная линейная регрессия Корреляционный анализ. Парные, частные и множественные коэффициенты корреляции Нелинейная регрессия
Оценивание параметров эконометрической модели при наличии автокорреляции в остатках
Лабораторная работа №2 по дисциплине «Дискретный анализ» по теме: «Множественная линейная регрессия» iconЛабораторная работа по дисциплине «Эконометрика» на тему: «Множественная регрессия»
Имеются данные (табл. ) об экономической деятельности 25 предприятий одной отрасли РФ в 1997 г
Лабораторная работа №2 по дисциплине «Дискретный анализ» по теме: «Множественная линейная регрессия» iconОценивание параметров линейной модели множественной регрессии Множественная регрессия
...
Лабораторная работа №2 по дисциплине «Дискретный анализ» по теме: «Множественная линейная регрессия» icon2. Линейная множественная регрессия
Другой вид уравнения множественной регрессии – уравнение регрессии в стандартизированном масштабе
Лабораторная работа №2 по дисциплине «Дискретный анализ» по теме: «Множественная линейная регрессия» iconЛабораторная работа 4 множественная регрессия цель работы Изучение методов расчета коэффициентов корреляции. Построение уравнения множественной регрессии
Изучение методов оценки параметров множественной регрессии и коэффициентов корреляции
Лабораторная работа №2 по дисциплине «Дискретный анализ» по теме: «Множественная линейная регрессия» iconКонтрольная работа по теме занятия Лабораторная работа по теме
Лабораторная работа по теме: «Кондуктометрическое определение степени и константы диссоциации слабого электролита»
Лабораторная работа №2 по дисциплине «Дискретный анализ» по теме: «Множественная линейная регрессия» iconЛабораторная работа Линейная функция и ее график
Постройте графики функций в программе «Graph16». Что общего у графиков каждой группы
Лабораторная работа №2 по дисциплине «Дискретный анализ» по теме: «Множественная линейная регрессия» iconЛабораторная работа №7 Нелинейная регрессия Цель работы: Изучить возможности matlab для сглаживания экспериментальной зависимости методом наименьших квадратов
Физические величины зачастую подчиняются зависимостям, отличным от линейных или полиномиальных
Лабораторная работа №2 по дисциплине «Дискретный анализ» по теме: «Множественная линейная регрессия» iconЛабораторная работа №4 Динамические модели Задание Оценить для двух рядов восемь типов моделей: статическая регрессия; процесс авторегрессии; модель опережающего показателя
Привести статистические характеристики по каждой модели и дать оценку адекватности модели
Разместите кнопку на своём сайте:
kurs.znate.ru


База данных защищена авторским правом ©kurs.znate.ru 2012
обратиться к администрации
kurs.znate.ru
Главная страница