Корреляционный анализ. Дисперсионный анализ

Автор работы: Пользователь скрыл имя, 17 Ноября 2015 в 12:11, лабораторная работа

Краткое описание

Цель работы:
Приобретение практических навыков по применению методов корреляционного анализа при обработке экспериментальных данных.
1 Краткие теоретические сведения
Важным разделом статистического анализа экспериментальных данных является корреляционный анализ, служащий для выявления взаимосвязей между данными выборок. Одна из наиболее распространенных задач статистического исследования состоит в изучении связи между исследуемыми переменными.

Прикрепленные файлы: 1 файл

9.doc

— 184.50 Кб (Скачать документ)

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РЕСПУБЛИКИ КАЗАХСТАН

Некоммерческое акционерное общество

«АЛМАТИНСКИЙ УНИВЕРСИТЕТ ЭНЕРГЕТИКИ И СВЯЗИ»

Кафедра электроснабжения промышленных предприятий

 

 

 

 

 

 

 

Лабораторная работа № 9

 

 

 

 

По дисциплине: «Теория и практика технического эксперимента»

На тему: «Корреляционный анализ. Дисперсионный анализ»

Специальность: электроснабжение промышленных предприятий

Выполнила: Кейикбаев А.А Группа МЭППп-15

№ зачетной книжки: 154М023

Принял:   Айткулов Н.С.

_________________ «____ » ____________ 2015 г.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Алматы 2015

Работа 9.1. Корреляционный анализ

Цель работы:

 Приобретение практических навыков  по применению методов корреляционного анализа при обработке   экспериментальных данных.

1 Краткие теоретические сведения

Важным разделом статистического анализа экспериментальных данных является корреляционный анализ, служащий для выявления взаимосвязей между данными выборок. Одна из наиболее распространенных задач статистического исследования состоит в изучении связи между исследуемыми переменными. Знание взаимозависимостей отдельных признаков дает возможность решать одну из кардинальных задач любого научного исследования: возможность предвидеть, прогнозировать развитие ситуации при изменении конкретных характеристик объекта исследования.

Проблема изучения взаимосвязей показателей различного рода является одной из важнейших в научном и статистическом анализе. В общем случае взаимосвязь между переменными может носить не функциональный, а вероятностный, стохастический характер. В этом случае нет строгой, однозначной зависимости между величинами.  Для изучения стохастических связей между переменными применяется корреляционный   и регрессионный анализ.

С помощью регрессионного анализа определяется форма  (характер) зависимости между случайной величиной Y и значениями одной или нескольких переменных величин X. С помощью корреляционного анализа   определяют степень связи между двумя случайными величинами X и Y. В качестве меры такой связи используется коэффициент корреляции.

Для оценки степени взаимосвязи большое распространение получил коэффициент линейной корреляции Пирсона, предполагающий нормальный закон распределения экспериментальных данных

Коэффициент корреляции (R) это параметр, характеризующий степень линейной взаимосвязи между двумя выборками. Коэффициент корреляции изменяется от -1 (строгая обратная линейная зависимость) до 1 (строгая прямая пропорциональная зависимость). При значении 0 линейной зависимости между двумя выборками нет.

На практике коэффициент корреляции принимает некоторые промежуточные значения между 1 и -1.

 Для оценки степени взаимосвязи рекомендуется руководствоваться следующими эмпирическими правилами. Если коэффициент корреляции по абсолютной величине (без учета знака) больше, чем 0,95, то можно считать, что между параметрами существует практически линейная зависимость (прямая - при положительном R и обратная - при отрицательном R).

 Если коэффициент корреляции R лежит в диапазоне от 0,8 до 0,95, говорят о сильной степени линейной связи между параметрами.

 Если 0,6 < R < 0,8, говорят о наличии линейной связи между параметрами. При R < 0,4 обычно считают, что линейную взаимосвязь между параметрами выявить не удалось.

В MS Excel для вычисления парных коэффициентов линейной корреляции используется специальная функция КОРРЕЛ. А для расчета коэффициентов корреляции между рядом переменных, так называемой корреляционной матрицы  используется процедура КОРРЕЛЯЦИЯ.

Задание  9.1  

Дано:

Имеются данные семимесячных наблюдений  о количестве грозовых дней и отключений  воздушной линии  6 кВ.

Требуется:

Используя функцию КОРРЕЛ  найти коэффициент корреляции  и оценить наличие взаимосвязи  между количеством грозовых дней и количеством срабатываний релейной защиты линии.

Рисунок 1 – Результаты задания 9.1

Задание  9.2  

Дано:

Имеются ежемесячные данные наблюдений за состоянием погоды  и данными срабатываний элементов автоматики и релейной защиты  на подстанции.

Требуется:

Используя процедуру  Корреляция,   найти коэффициенты корреляции  и оценить наличие связи  между количеством грозовых дней и количеством срабатываний релейной защиты и автоматики на исследуемой подстанции.

 

Рисунок 2 – Результаты задания 9.2

 

Работа 9.2. Дисперсионный анализ

 

Цель работы:

 Приобретение практических навыков  по применению методов регрессионного  анализа при обработке при  экспериментальных данных.

1 Краткие теоретические сведения

При исследовании взаимосвязей между выборками помимо корреляции различают также и регрессию. Регрессия используется для анализа воздействия на отдельную зависимую переменную значений одной или нескольких независимых переменных. Соответственно, наряду с корреляционным анализом еще одним инструментом изучения стохастических зависимостей является регрессионный анализ. С помощью регрессионного анализа устанавливается форма зависимости между случайной величиной Y (зависимой) и значениями одной или нескольких переменных величин (независимых), причем значения последних считаются точно заданными. Такая зависимость обычно определяется некоторой математической моделью (уравнением регрессии), содержащей несколько неизвестных параметров. В ходе регрессионного анализа на основании экспериментальных данных находят оценки этих параметров, определяются статистические ошибки оценок или границы доверительных интервалов и проверяется соответствие (адекватность) принятой математической модели экспериментальным данным. В линейном регрессионном анализе связь между случайными величинами предполагается линейной. В самом простом случае в линейной регрессионной модели имеются две переменные X и Y.

Можно сказать, что линейный регрессионный анализ заключается в подборе графика и его уравнения для имеющихся экспериментальных данных. Мерой эффективности регрессионной модели является коэффициент детерминации R2 ,  где R   коэффициент  линейной корреляции.

Коэффициент детерминации определяет, с какой степенью точности полученное регрессионное уравнение описывает (аппроксимирует) экспериментальные данные. Например,  R2=0,98 означает, что на 98%  значение Y определяется исследуемым фактором Х, а на 2 % - другими причинами (случайными факторами).

Если R2 > 0,95, то говорят о высокой точности аппроксимации. (Модель хорошо описывает явление). Если R2 лежит в диапазоне от 0,8 до 0,95, говорят об удовлетворительной аппроксимации (модель в целом адекватна описываемому явлению). Если R2 < 0,6, принято считать, что точность аппроксимации недостаточна и модель требует улучшения (введения новых независимых переменных, учета нелинейностей и т. д.).

 

В случае, когда рассматривается зависимость между одной зависимой переменной и несколькими независимыми   говорят о множественной линейной регрессии.

 В этом случае регрессионное уравнение имеет вид

где

- требующие определения коэффициенты при независимых переменных ;

           -  константа.

В регрессионном анализе все переменные, входящие в уравнение, должны иметь непрерывную, а не дискретную природу.

Для выполнения регрессионного анализа и получения коэффициентов регрессии используется процедура Регрессия из пакета анализа Excel.

Значимость  регрессионной модели  оценивается с помощью F - критерия Фишера. Если величина F-критерия значима (р < 0,05), то и регрессионная модель является значимой.

Достоверность отличия коэффициентов   от нуля проверяется с помощью критерия Стьюдента. В случаях, когда p > 0,05, коэффициент может считаться нулевым, а это означает, что влияние соответствующей независимой переменной на зависимую переменную статистически недостоверно, и эта независимая переменная может быть исключена из уравнения.

Задание    к работе

Дано:

Имеются данные о стоимости электроэнергии и цене на газ за исследуемый период  времени.

Требуется: С помощью процедуры  Регрессия из пакета анализа  найти  уравнение связи между ценой на  электроэнергию  и    газ за рассматриваемый период.

 

Рисунок 3 – Исходные данные работы 9.2

 

Рисунок 4 – Результаты работы 9.2

 

Рисунок 5 – График подбора

 

 

 


Информация о работе Корреляционный анализ. Дисперсионный анализ