Автор работы: Пользователь скрыл имя, 03 Мая 2013 в 13:09, курсовая работа
Слово корреляция ввел в употребление в статистику английский биолог и статистик Френсис Гальтон в конце в. Тогда оно писалось как «corelation» (соответствие), но не просто «связь» (relation), а «как бы связь», т.е. связь, но не привычной в то время функциональной форме. В науке вообще, а именно в палеонтологии, термин «корреляция» применил ещё раньше, в конце в., знаменитый французский палеонтолог (специалист по ископаемые останками животных и растений прошлых эпох) Жорж Кювель. Он ввел даже «закон корреляции» частей и органов животных.
Корреляционная связь существует там, где взаимосвязанные явления характеризуются только случайными величинами. Наличие корреляционных связей присуще многим общественным явлениям.
Введение……………………………………………………………………..3
1.Теоретическая часть:
1.1.Корреляционно-регрессионный анализ как объект статистического изучения ………………………………………………………………………………..4
1.2.Система статистических показателей, характеризующих корреляционно-регрессионный анализ………………………………………………… …..6
1.3Применение метода корреляционно-регрессионного анализа в
статистике ………………………………………………………………… 9
2. Расчетная часть…………………………………………………………..11
3. Аналитическая часть…………………………………………….………37
Заключение………………………………………………………………….42
Литература…………………………………………………
высшего профессионального образования
«Всероссийский заочный
(ВЗФЭИ)
Филиал ВЗФЭИ в г.Туле
КУРСОВАЯ РАБОТА
по дисциплине «Статистика»
вариант №8
«Корреляционно- регрессионный анализ взаимосвязей производственных показателей фирмы (на примере фондовооружённости и производительности труда)»
Содержание.
Введение…………………………………………………………
1.Теоретическая часть:
1.1.Корреляционно-
1.2.Система статистических показателей, характеризующих корреляционно-регрессионный анализ………………………………………………… …..6
1.3Применение метода корреляционно-регрессионного анализа в
статистике ………………………………………………………………… 9
2. Расчетная часть…………………………………………………………..
3. Аналитическая часть…………………………………………….………37
Заключение……………………………………………………
Литература……………………………………………………
Приложения……………………………………………………
Введение
Слово корреляция ввел в употребление в статистику английский биолог и статистик Френсис Гальтон в конце в. Тогда оно писалось как «corelation» (соответствие), но не просто «связь» (relation), а «как бы связь», т.е. связь, но не привычной в то время функциональной форме. В науке вообще, а именно в палеонтологии, термин «корреляция» применил ещё раньше, в конце в., знаменитый французский палеонтолог (специалист по ископаемые останками животных и растений прошлых эпох) Жорж Кювель. Он ввел даже «закон корреляции» частей и органов животных.
Корреляционная связь существует там, где взаимосвязанные явления характеризуются только случайными величинами. Наличие корреляционных связей присуще многим общественным явлениям.
Цель данной работы ознакомится с понятием корреляционно-регрессионного анализа, рассмотреть понятия, характеризующие его, узнать где и как можно применять метод корреляционно- регрессионного анализа.
1.1.Корреляционно-
Современная наука исходит из взаимосвязи всех явлений природы и общества. Объем продукции предприятия связан с численностью работников, мощностью двигателей, стоимостью производственных фондов и ещё многими признаками.
Невозможно управлять явлениями, предсказывать их развитие без изменения характера, силы и других особенностей связей, поэтому методы исследования, измерения связей составляют чрезвычайно важную часть методологии научного исследования, в том числе и статистического.
Различают два вида связи между различными явлениями и их признаками: функциональную и жестко детерминированную, с одной стороны, и статистическую или стохастически детерминированную – с другой. Строго определить различия этих типов связи можно тогда, когда они получают математическую формулировку.
Если с изменением значения одной из переменных вторая изменяется строго определенным образом, т.е. значению одной переменной обязательно соответствует одно или несколько точно заданных значений другой переменой, связь между ними является функциональной.
Стохастически детерминированная связь не имеет ограничений и условий, присущих функциональной связи. Если с изменением значения одной из переменных вторая может в определенных пределах принимать любые значения с некоторыми вероятностями, но её среднее значение или иные статистические (массовые) характеристики изменяются по определенному закону – связь является статистической. Иными словами, при статистической связи разным значениям одной переменной соответствует разные распределения значений другой переменой.
В настоящее время наука не знает более широкого определения связи. Все связи, которые могут быть измерены и выражены численно, подходят под определение «статистические связи», в том числе и функциональные. Последние представляют собой частный случай статистических связей, когда значения одной переменной соответствуют «распределения» значений второй, состоящие из одного или нескольких значений и имеющие вероятность, равную единице. Конечно, качественное различие действительно вероятных распределений и отдельных значений, имеющих вероятность единицы (достоверных), настолько велико, что хотя функциональные связи и подходят в широком смысле под определение статистической связи, все же с полным основанием можно говорить о двух типах связей.
Корреляционной связью называют важнейший частный случай статистической связи, состоящий в том, что разным значениям одной переменной соответствуют различные средние значения другой. С изменением значения признака x закономерным образом изменяется среднее значение признака y; в то время как в каждом отдельном случае значение признака y (с различными вероятностями) может принимать множество различных значений.
Если же с изменением значения признака x среднее значение признака y не изменяется закономерным образом, но закономерно изменяется другая статистическая характеристика (показатели вариации, ассиметрии, эксцесса и т.п.), то связь является не корреляционной, хотя и статистической.
Корреляционная связь между признаками может возникать разными путями. Важнейший путь- причинная зависимость результативного признака (его вариации) от вариации факторного признака.
Совершенно иная интерпретация необходима при изучении корреляционной связи между двумя следствиями общей причины. Данную корреляцию нельзя интерпретировать как связь причины и следствия;
Третий путь возникновения корреляции – взаимосвязь признаков, каждый из которых и причина и следствие.
Совершенно иная интерпретация необходима при изучении корреляционной связи между двумя следствиями общей причины.
Третий путь возникновения корреляции – взаимосвязь признаков, каждый из которых и причина, и следствие.
1.2. Система статистических показателей, характеризующих
корреляционно-регрессионный анализ
В соответствии с сущностью корреляционной связи её изучение имеет две цели:
1. Измерение параметров
2. измерение тесноты связи двух (или большего числа) признаков между собой.
Вторая задача специфична для статистических связей, а первая разработана для функциональных связей и является общей. Основным методом решения задачи нахождения параметров уравнение связи является метод наименьших квадратов, разработанный К.Ф. Гауссом. Он состоит в минимизации суммы квадратов отклонений фактически измеренных значений зависимой переменной y от ее значений, вычисленных по уравнению связи с факторным признаком (многими признаками) x.
Для изменения тесноты связи
применяется несколько
число групп по факторному признаку;
- число единиц совокупности;
- индивидуальные значения
- его средние групповые значения;
- его общее среднее значение;
- частота в j-й группе.
Формула (1) применяется при расчете показателя тесноты связи по аналитической группировке. При вычислении корреляционного отношения по уровню связи (уравнению парной или множественной регрессии) применяется формула (2):
где - индивидуальные значения y по уравнению связи.
Сумма квадратов в числителе – это объясненная связью с фактором x (факторами) дисперсия результативного признака y. Она вычисляется по индивидуальным данным, полученным для каждой единицы совокупности на основе уравнения регрессии.
Если уравнение выбрано
В числителе формулы (3) стоит сумма квадратов отклонений фактических значений признака от его индивидуальных расчетных значений, т.е. доля вариации этого признака, не объясняемая за счет входящих в уравнение связи признаков-факторов. Эта сумма не может стать раной нулю, если связь не является функциональной. При неверной формуле уравнения связи или ошибке в расчетах возрастают расхождения фактических и расчетных значений, и корреляционное отношение снижается, как логически и должно быть.
В основе перехода от формулы (2) к формуле (3) лежит известное правило разложения сумм квадратов отклонений при группировке совокупности:
Dобщ = Dмежгр + Dвнутригр
Согласно этому правилу можно вместо межгрупповой (факторной) дисперсии использовать разность:
Dобщ – Dвнутригр
что дает:
При расчете не по группировке, а по уравнению корреляционной связи (уравнению регрессии) мы используем формулу (3). В этом случае правило разложения суммы квадратов отклонений результативного признака записывается как:
Dобщ = Dобъяснена + Dост
уравнением
регрессии
Важнейшее положение, которое следует теперь усвоить любому, желающему правильно применять метод корреляционно-регрессионного анализа, состоит интерпретации формул (2) и (3). Это положение гласит:
Уравнение корреляционной связи измеряет зависимость между вариацией результативного признака и вариацией факторного признака (признаков). Меры тесноты связи измеряют долю вариации результативного признака, которая связана с вариацией факторного признака (признаков).
Интерпретировать корреляционны
Итак, строго говоря, метод корреляционно-регрессионного анализа не может объяснить роли факторных признаков в создании результативного признака. Это очень серьезное ограничение метода, о котором не следует забывать.
1.3.Применение метода корреляционно-регрессионного анализа
в статистике
Коренное отличие метода корреляционно-регрессионного анализа от аналитической группировки состоит в том, что корреляционно-регрессионный анализ позволяет разделить влияние комплекса факторных признаков, анализировать различные стороны сложной системы взаимосвязей. Если метод комбинированной аналитической группировки, как правило, не дает возможность анализировать более 3 факторов, то корреляционный метод при объеме совокупности около ста единиц позволяет вести анализ системы с 8-10 факторами и разделить их влияние.
Развивающиеся на базе корреляционно-регрессионного анализа многомерные методы (метод главных компонентов, факторный анализ) позволяют синтезировать влияние признаков (первичных факторов), выделяя из них непосредственно не учитываемые глубинные факторы (компоненты). Например, изучая корреляцию ряда признаков интенсификации сельскохозяйственного производства, таких, как фондообеспеченность, затраты труда на единицу площади, энергообеспеченность, внесение удобрений на единицу площади, плотность поголовья скота, можно синтезировать общую часть их влияния на уровень продукции с единицы площади или на производительность труда, получив обобщенный фактор «интенсификация производства», непосредственно не измеримый, не отражаемый единым показателем.