Лабораторная работа №4 Регрессия и корреляция Подготовка к работе Изучить способы исследования взаимосвязи между двумя и более переменными с помощью линейной регрессии и корреляции. Контрольные вопросы




НазваниеЛабораторная работа №4 Регрессия и корреляция Подготовка к работе Изучить способы исследования взаимосвязи между двумя и более переменными с помощью линейной регрессии и корреляции. Контрольные вопросы
Дата конвертации09.03.2013
Размер84.18 Kb.
ТипЛабораторная работа




Лабораторная работа № 4

Регрессия и корреляция

1. Подготовка к работе

Изучить способы исследования взаимосвязи между двумя и более переменными с помощью линейной регрессии и корреляции.

2. Контрольные вопросы

2.1. Что такое линейная регрессия?

2.2. Подогнанная линия регрессии и уравнение регрессии. Предиктор.

2.3. Функции программы Excel для оценки регрессии.

2.4. Параметры регрессионного анализа.

2.5. Интерпретация результатов анализа изменчивости.

2.6. Как произвести проверку модели регрессии?

2.7. Что такое корреляция? Примеры корреляции.

2.8. Матрица корреляции.

2.9. Модель множественной корреляции.

2.10. Что такое F-распределение?

2.11. Как проверить результат множественной регрессии?

2.12. Отличие линейной регрессии от нелинейной.

2.13. Как осуществить проверку результатов множественной линейной регрессии?
3. Задания на выполнение лабораторной работы

3.1. Задание 1. Оценка и анализ регрессии

1) С помощью функции Excel произведите оценку регрессии на основе метода наименьших квадратов с учетом варианта (приложение 1).

2) Для выполнения данного задания использовать приложение 2 к лабораторной работе, в котором собраны данные о ценах на услуги телекоммуникационной компании и налогах на доход с данных услуг. Для этих данных необходимо:


  1. Создать диаграмму взаимосвязи между налогами на доход предоставляемых услуг и ценами на эти услуги с учетом варианта (цена на услуги выбирается с учетом варианта (таблица 1) по столбцам Цена1 и Цена2). Включите в диаграмму линию регрессии и значение R2. В какой степени изменчивость налогов на доход с услуг объясняется изменчивостью цен на услуги?

  2. Вычислите статистические параметры регрессии и создайте диаграмму остатков.

  3. Создайте диаграмму вероятностей распределения остатков. Есть ли на обеих диаграммах остатков какое-либо свидетельство нарушений допущений о регрессии?

  4. Создайте в рабочей книге две новые переменные с десятичными логарифмическими значениями налогов на доход с предоставляемых услуг и ценами на эти услуги. Повторите действия, выполненные на предыдущих этапах, но теперь для новых данных. Позволяет ли логарифмирование данных решить проблемы с нарушением допущений о регрессии для прежних данных? Какие проблемы остались нерешенными?

  5. Подытожьте полученные результаты и создайте отчет.

Таблица 1

№ вар.

1

2

3

4

5

6

7

8

9

10

11

12

13

14

страница

Неч

Чет

Неч

Чет

Неч

Чет

Неч

Чет

Неч

Чет

Неч

Чет

Неч

Чет

Цена усл. по Цена1 и Цена2

Среднее

Max

Min

Среднее

Max

Min

Среднее

Max

Min

Среднее

Max

Min

Min

Max

3.2. Задание 2. Корреляция

Для выполнения данного задания использовать приложение 2 к лабораторной работе, в котором собраны данные о ценах на услуги телекоммуникационной компании и налогах на доход с данных услуг с учетом четности варианта. Для этих данных необходимо:


  1. Вычислить коэффициент корреляции Пирсона для цен; для цены1 и налога; для цены2 и налога; для средней цены и налога. Какие выводы можно сделать?

  2. Создайте матрицу корреляции для всех переменных, на основе которой сделайте выводы о взаимосвязи между исследуемыми параметрами.

  3. Создайте матрицу точечных диаграмм корреляции (scatterplot matrix – SPLOM). Как интерпретировать полученную матрицу? Какая из полученных взаимосвязей наилучшая?

3.3. Задание 3. Множественная регрессия


Для выполнения данного задания использовать приложение 3 к лабораторной работе, в котором собраны данные о 35 моделях персональных компьютеров. Данные в рабочей книге содержат пять столбцов: в столбце Компания приводится имя компании; в столбце Надежность – рейтинг надежности компании; в столбце Ремонт – рейтинг ремонта; в столбце Тех. Поддержка – рейтинг технической поддержки; в столбце Желание купить снова – оценка желания еще раз сделать покупку в данной компании.

  1. Откройте рабочую книгу и создайте матрицу корреляции и соответствующую матрицу диаграмм корреляции для четырех числовых переменных.

  2. Какие компании имеют наибольшие и наименьшие значения переменной Желание купить снова?

  3. Выполните анализ регрессии переменной Желание купить снова по отношению к другим трем числовым переменным. Создайте диаграмму остатков для проверки предположений. Насколько успешно можно предсказать желание еще раз сделать покупку в данной компании? Удовлетворяют ли предположения о регрессии?

  4. Определите знак корреляции между переменными Желание купить снова и Ремонт. Что можно сказать о характере этой взаимосвязи? Обратите внимание на знак коэффициента перед переменной Ремонт. Что он значит для взаимосвязи между переменными Желание купить снова и Ремонт. Сравните выводы после анализа регрессии и выводы после корреляции этих переменных. Чем можно объяснить полученные результаты?

  5. Произведите проверку результатов множественной линейной регрессии.

4. Методические указания


Для выполнения лабораторной работы необходимо загрузить подключаемый модуль StatPlus. Кроме того, для корректного действия данного модуля нужно установить на компьютере региональный стандарт Английский (США). Для этого в системе Windows следует выбрать команду Пуск  Панель управления, затем в диалоговом окне Панель управления нужно выбрать элемент Язык и региональные стандарты, после чего во вкладке Региональные параметры диалогового окна Язык и региональные стандарты выбрать в списке элемент Английский (США).

Выполнение лабораторной работы целесообразно начинать с изучения приведенных в методических указаниях примеров.

4.1. Функции для оценки регрессии на основе метода наименьших квадратов

ОТРЕЗОК

Синтаксис:

ОТРЕЗОК(известные_значения_x;известные_значения_y)

Результат:

Вычисляет точку пересечения линии с осью y, используя известные_значения_x и известные_значения_y.

Аргументы:

Известные_значения_y    — это зависимое множество наблюдений или данных.

Известные_значения_x    — это независимое множество наблюдений или данных.

НАКЛОН

Синтаксис:

НАКЛОН(известные_значения_y;известные_значения_x)

Результат:

Возвращает наклон линии линейной регрессии для точек данных в аргументах известные_значения_y и известные_значения_x.

Аргументы:

Известные_значения_y    — массив или интервал ячеек, содержащих числовые зависимые точки данных.

Известные_значения_x    — множество независимых точек данных.

4.2. Анализ регрессии

После включения компьютера и загрузки операционной системы Widows для запуска Microsoft Excel необходимо активизировать команду в главном меню или активизировать соответствующую пиктограмму (ярлычок) на рабочем столе. После этого программа Excel загрузится в оперативную память и на экране будет открыта рабочая книга. Активизировать модуль StatPlus. Кроме того, в данной лабораторной работе понадобится модуль Пакета анализа (Analysis ToolPack). Для установки модуля Пакет анализа выберите меню Сервис – Надстройки. Установите флажок Пакет анализа.

Для создания диаграммы анализа регрессии необходимо выбрать меню Вставка  Диаграмма  Точечная диаграмма  Выбрать необходимый диапазон для анализа, состоящий из зависимой и независимой переменных.

После того, как будет получена точечная диаграмма необходимо, щелкнуть правой кнопкой мыши на точках диаграммы и выбрать команду Добавить линию тренда (Add Trendline) в контекстном меню.

Выбрать вкладку тип и выбрать тип Линейный.

Выбрать вкладку Параметры и установить флажки показывать уравнение на диаграмме и поместить на диаграмме величину достоверности аппроксимации.

Пример подогнанной линии регрессии показан на рисунке 1.


Рис. 1. Подогнанная линия регрессии

Величина R2 – величина достоверности аппроксимации, которая измеряет процентную долю изменчивости значений зависимой переменной, которая может объясняться изменениями независимой переменной. Величина R2 может изменяться от 0 до 1.

Для анализа регрессии используется инструменты модуля Пакет анализа (Analysis ToolPak)  Регрессия. Результат выполнения данной команды показан на рис.2.



Рис. 2. Результат выполнения команды Регрессия из пакета анализа данных

4.2. Функция вычисления корреляции и создание матриц корреляции

КОРРЕЛ

Синтаксис:

КОРРЕЛ(массив1;массив2)

Результат:

Возвращает коэффициент корреляции Пирсона между интервалами ячеек массив1 и массив2.

Аргументы:

Массив1    — это ячейка интервала значений.

Массив2    — это второй интервал ячеек со значениями.

Для создания матрицы корреляции для всех переменных необходимо выбрать команды меню StatPlusMultivariable AnalysisCorrelation Matrix1. Причем результат данной команды будет состоять из двух матриц: матрицы значений корреляции и матрицы p-значений (рис.3).



Рис. 3. Матрица значений корреляции и p-значений

Для создания матрицы точечных диаграмм корреляции (scatterplot matrix – SPLOM) необходимо выбрать команду меню StatPlus – Multi-variable charts – Scatterplot. В строках матрицы показана взаимосвязь каждой из переменных по отношению к другим. Пример сгенерированной матрицы представлен на рис.4.



Рис. 4. Матрица точечных диаграмм корреляции


1 Для создания матрицы корреляций с помощью программы Excel можно использовать команду модуля Пакет анализа. Для этого необходимо выбрать команду меню Сервис - Анализ данных и в диалоговом окне Анализ данных в списке Инструменты анализа найти и выделить элемент Корреляция.

Похожие:

Лабораторная работа №4 Регрессия и корреляция Подготовка к работе Изучить способы исследования взаимосвязи между двумя и более переменными с помощью линейной регрессии и корреляции. Контрольные вопросы iconПарная регрессия и корреляция
Парная регрессия представляет собой регрессию между двумя переменными – и, т е модель вида
Лабораторная работа №4 Регрессия и корреляция Подготовка к работе Изучить способы исследования взаимосвязи между двумя и более переменными с помощью линейной регрессии и корреляции. Контрольные вопросы iconЛабораторная работа 4 множественная регрессия цель работы Изучение методов расчета коэффициентов корреляции. Построение уравнения множественной регрессии
Изучение методов оценки параметров множественной регрессии и коэффициентов корреляции
Лабораторная работа №4 Регрессия и корреляция Подготовка к работе Изучить способы исследования взаимосвязи между двумя и более переменными с помощью линейной регрессии и корреляции. Контрольные вопросы iconЛабораторная работа №1 Тема: Регрессионный анализ. Уравнение линейной парной регрессии. Уравнение линейной парной регрессии выглядит следующим образом: Y=a 0 +а 1 X
Константу a0 также называют свободным членом, а угловой коэффициент коэффициентом регрессии. Параметры уравнения могут быть определены...
Лабораторная работа №4 Регрессия и корреляция Подготовка к работе Изучить способы исследования взаимосвязи между двумя и более переменными с помощью линейной регрессии и корреляции. Контрольные вопросы iconЛабораторная работа №1. Отбор факторов для построения множественной линейной зависимости и оценка степени коллинеарности и мультиколлинеарности регрессоров
Множественная линейная регрессия – уравнение связи с несколькими независимыми переменными
Лабораторная работа №4 Регрессия и корреляция Подготовка к работе Изучить способы исследования взаимосвязи между двумя и более переменными с помощью линейной регрессии и корреляции. Контрольные вопросы iconЗадание 1 Парная регрессия и корреляция Пример
Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации
Лабораторная работа №4 Регрессия и корреляция Подготовка к работе Изучить способы исследования взаимосвязи между двумя и более переменными с помощью линейной регрессии и корреляции. Контрольные вопросы iconОценивание параметров линейной модели множественной регрессии Множественная регрессия
...
Лабораторная работа №4 Регрессия и корреляция Подготовка к работе Изучить способы исследования взаимосвязи между двумя и более переменными с помощью линейной регрессии и корреляции. Контрольные вопросы iconЛабораторная работа № Временные ряды. Автокорреляция остатков. Метод скользящего среднего. Лабораторная работа № Автокорреляция остатков
Построить модель парной линейной регрессии, взяв в качестве зависимой переменной y – цены закрытия (столбец close), а в качестве...
Лабораторная работа №4 Регрессия и корреляция Подготовка к работе Изучить способы исследования взаимосвязи между двумя и более переменными с помощью линейной регрессии и корреляции. Контрольные вопросы iconЛабораторная работа №2: Прогнозирование с помощью функций регрессии Excel
Передвинуть границу оценки в будущее по временной оси можно с помощью одной из функций регрессии Excel
Лабораторная работа №4 Регрессия и корреляция Подготовка к работе Изучить способы исследования взаимосвязи между двумя и более переменными с помощью линейной регрессии и корреляции. Контрольные вопросы iconНовосибирск 2006 Тема: «Выбор наилучшей регрессии»
Общее назначение множественной регрессии состоит в анализе связи между несколькими независимыми переменными (называемыми также регрессорами)...
Лабораторная работа №4 Регрессия и корреляция Подготовка к работе Изучить способы исследования взаимосвязи между двумя и более переменными с помощью линейной регрессии и корреляции. Контрольные вопросы iconТема: Корреляционно-регрессионный анализ
Мнк*. Найти коэффициент парной корреляции и индекс корреляции. Построить линейную и степенную регрессии с помощью ппп excel или Stadia....
Разместите кнопку на своём сайте:
kurs.znate.ru


База данных защищена авторским правом ©kurs.znate.ru 2012
обратиться к администрации
kurs.znate.ru
Главная страница