Автор работы: Пользователь скрыл имя, 10 Декабря 2011 в 23:01, контрольная работа
Одна из задач статистики – установление объективно существующих связей между явлениями. В процессе статистического исследования зависимостей вскрываются причинно следственные отношения между явлениями, что позволяет выявлять факторы (признаки), оказывающие существенное влияние на вариацию изучаемых явлений и процессов. Причинно-следственные отношения – это связь явлений и процессов, когда изменение одного из них – причины – ведет к изменению другого – следствия. Причина всегда предшествует следствию.
1 Виды и формы связей между явлениями …………………………………… 3
2 Статистические методы изучения связей …………………………………… 4
3 Основные задачи и предпосылки применения корреляционно-регрессионного анализа ………………………………………………………… 5
4 Показатели степени тесноты связи…………………………………………… 6
5 Список использованных источников …………………………………
– среднее квадратическое отклонение результативного признака.
Линейный
коэффициент корреляции изменяется
в пределах от -1 до +1. Знак при этом
коэффициенте указывает направление
связи. Знак “+” свидетельствует о прямой
связи, знак “-” – об обратной связи. Если
коэффициент корреляции равен 0, то величины
х и у независимы, т.е. х не оказывает
влияния на у. Если коэффикиент корреляции
равен
, то это означает, что все точки (х,
у) находятся на линии регрессии и зависимость
между х и у является функциональной.
Чем ближе коэффициент корреляции к
, тем связь теснее.
Количественные критерии оценки тесноты связи
Величина коэффициента корреляции | Характер связи |
До |
Практически отсутствует |
Слабая | |
Умеренная | |
Сильная |
Следует
иметь в виду, что величина линейного
коэффициента корреляции оценивает
тесноту связи рассматриваемых признаков
в ее линейной форме. Поэтому близость
линейного коэффициента корреляции к
нулю еще не означает отсутствие связи
между признаками. При иной спецификации
модели связь между признаками может оказаться
достаточно тесной.
2. Коэффициент детерминации – это квадрат линейного коэффициента корреляции
где – общая дисперсия признака у;
– дисперсия признака у, обусловленная фактором х.
Или
Т.к. коэффициент b измеряет среднее по совокупности отклонение y ( ) от его средней величины ( ) при отклонении признака x от своей средней величины ( ) на принятую единицу измерения, то сумма квадратов отклонений, обусловленных линейной регрессией составит:
Следовательно
где – индивидуальные значения результативного признака;
– индивидуальные значения результативного признака, рассчитанные по уравнению регрессии.
Коэффициент детерминации характеризует долю дисперсии результативного признака у, объясняемую регрессией, в общей дисперсии результативного признака:
Соответственно величина характеризует долю дисперсии результативного показателя, вызванную влиянием остальных не учтенных в уравнении регрессии факторов.
Если , то уравнением регрессии объясняется 80% дисперсии результативного признака, а на долю прочих, неучтенных факторов приходится 10% ее дисперсии (остаточная дисперсия). Величина коэффициента детерминации служит одним из критериев оценки качества линейной модели. Чем больше доля объясненной вариации, тем соответственно меньше роль прочих факторов, и, следовательно, линейная модель хорошо аппроксимирует исходные данные и ее можно воспользоваться для прогноза значений результативного признака.
3. Корреляционное отношение применяют для измерения тесноты связи между двумя признаками в случае наличия между ними линейной или нелинейной зависимости. Различают эмпирическое и теоретическое корреляционное отношение.
Эмпирическое корреляционное отношение не требует знания уравнения регрессии. Оно рассчитывается по данным групповых таблиц путем сопоставления межгрупповой и общей дисперсий результативного признака
где – общая дисперсия;
– межгрупповая дисперсия;
– средняя из внутригрупповых дисперсий.
Или после преобразований:
где – число групп по факторному признаку;
– число единиц совокупности;
– число единиц в j группе;
– индивидуальные значения результативного признака;
– групповые средние результативного признака;
– общая средняя результативного признака.
Теоретическое корреляционное отношение требует знания уравнения регрессии и рассчитанных по нему теоретических (расчетных) значений результативного признака.
где – дисперсия результативного признака, объясняемая регрессией;
– общая дисперсия результативного признака.
Или
Сумма квадратов в числителе – это объясненная связью с факторным признаком дисперсия результативного признака. Она вычисляется по индивидуальным данным, полученным для каждой единицы совокупности на основе уравнения регрессии.
Квадрат
корреляционного отношения
Теоретическое корреляционное отношение вычисляют и по другой формуле
или
В числителе стоит сумма квадратов отклонений фактических значений результативного признака от его индивидуальных расчетных значений, т.е. доля вариации результативного признака, не объясняемая за счет входящих в уравнение связи признаков-факторов. Эта сумма не может стать равной нулю, если связь не является функциональной.
В основе расчета корреляционного отношения ( ) лежит правило сложения дисперсий: общая дисперсия равна сумме межгрупповой дисперсии и средней из внутригрупповых дисперсий, т.е. .
В случае расчета корреляционного отношения не по группировке, а по уравнению регрессии ( ) правило принимает вид: .
Или
это можно записать как разложение
общей суммы квадратов
где в правой части первое слагаемое – сумма квадратов отклонений, объясненная регрессией, а второе слагаемое – остаточная сумма квадратов отклонений.
Корреляционное отношение принимает значения от 0 до 1. При его значении, равном 0, связь между признаками отсутствует; равном 1 – признаки связаны функционально. Промежуточные значения характеризуют степень тесноты связи.
Квадрат корреляционного отношения ( , ) соответствует по содержанию коэффициенту детерминации и интерпретируется как показатели доли вариации результативного признака, объясняемой за счет вариации факторного признака. Различие между эмпирическим и теоретическим корреляционными отношениями в том, что в эмпирическом корреляционном отношении связь признаков не абстрагируется от случайных влияний прочих факторов на вариацию , не связанных с .
Рассмотрим пример. Средняя часовая выработка 10 рабочих бригады 18 деталей при 3 детали. При этом выработка 4 рабочих, имеющих стаж работы менее 2-х лет, 15 деталей и 6 рабочих, имеющих стаж более 2 лет - 20 деталей. Определите эмпирическое корреляционное отношение.
Решение.
Эмпирическое корреляционное отношение:
По условию,
деталей – средняя часовая
выработка всех рабочих
- среднее квадратическое
деталей – средняя часовая выработка рабочих со стажем работы менее двух лет;
- доля рабочих со стажем работы менее двух лет в общей численности рабочих;
деталей – средняя часовая выработка рабочих со стажем работы более двух лет;
- доля рабочих со стажем работы более двух лет в общей численности рабочих.
Находим дисперсию групповых средних:
Общая дисперсия:
>0,7, следовательно, связь между
стажем работы и
Ответ:
в) 0,82.
СПИСОК
ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ