Автор работы: Пользователь скрыл имя, 12 Марта 2014 в 16:19, курс лекций
Особенности предмета
Количественная сторона общественных явлений изучается в неразрывной связи с качественной характеристикой
Количественная сторона общественных явлений изучается только в достаточной совокупности элементов, то есть для установления статистической закономерности должен действовать закон больших чисел
Явления изучаются в конкретных условиях места и времени
Y- функция
Для подбора важнейших факторов и их обоснования используют способ представления изучаемого явления в виде алгебраической суммы, частного от деления и произведения. Тогда комплексные факторы раскладываются на более простые и детальные.
Где Д- количество рабочих дней ® здоровье, дисциплина и выполнение государственных и общественных обязанностей;
Тсм ® уровень организации труда на предприятии и производственных процессов;
Пср.час- ® разряд рабочего, стаж, энерговооруженность и фондовооруженность.
К этим факторам для характеристики корреляционных связей предъявляют следующие требования:
– линейная парная корреляция
Уравнение связи выражает функциональную зависимость Y от x , и это можно допустить, если прочие факторы влияющие на Y не оказывают существенного влияния.
Если подтверждается корреляционная зависимость между признаками, то параметр b
приобретает большое смысловое значение, его называют коэффициентом регрессии . Он характеризует, в какой мере увеличивается Yx с ростом на единицу величины х .
Этот показатель может применяться в планировании, прогнозировании, нормировании.
Количественную зависимость Yx от параметра х можно выразить в относительных величинах для этого рассчитывается коэффициент эластичности :
Коэффициент эластичности показывает на сколько процентов увеличится Yx при изменении `х на 1% .
Тема: Оценка тесноты корреляционной связи
Кроме составления уравнения производится оценка интенсивности тесноты зависимости между коррелируемыми переменными. Тесноту связи измеряют с помощью коэффициентов корреляции ( они могут быть парными, частными , множественными) , с помощью корреляционного отношения ( в случае нелинейной зависимости ) . Как разновидность корреляционных отношений может применяться индекс корреляции . В случае линейной зависимости между двумя переменными применяют линейный коэффициент корреляции :
b – коэффициент регрессии в уравнении связи
sх – СКО факторного признака
sy – СКО результативного признака
Между r и корреляционным отношением в случае линейной зависимости существует тождество :
Линейный коэффициент корреляции принимает значение от (– 1; 1) . Он является отвлеченным числом, не зависящим от единиц измерения X и Y . Коэффициент показывает, на сколько sy изменится в среднем переменная Y при изменении величины X на sх , при условии влияния всех прочих учтенных и неучтенных факторов .
Чем выше значение r, тем теснее связь между переменными. Если коэффициент регрессии b- отрицательный, то и r будет со знаком «-», и это обозначает обратную взаимосвязь между признаками.
Если r =0, то это означает отсутствие линейной зависимости.
Если r=1, то это означает функциональную зависимость между x и y.
Кроме коэффициента корреляции для оценки тесноты взаимосвязи может применяться теоретическое корреляционное отношение. Этот показатель применим ко всем случаям корреляционной зависимости независимо от формы связи. Теоретическое корреляционное отношение – относительная величина, получающаяся в результате сравнения СКО в ряду выровненных значений результативного признака со СКО в ряду эмпирических значений результативного признака.
Учитывая, что сумма выравненных и эмпирических значений результативного признака совпадает ( åyx = å y ) и среднее значение признака у этих рядов одинаково и равно`y , то тогда
В основе определения теоретического корреляционного отношения лежит правило сложения дисперсий:
где - межгрупповая дисперсия,
`s2- внутригрупповая дисперсия
На основе этого правила можно определить остаточную групповую дисперсию :
Этот показатель используется для оценки силы тесноты связи .
Если h = 0 , то это значит, что признак у не коррелирован с х .
Чем ближе значение h к 1 , тем теснее связь между х и у.
Если h<0,3 – это говорит о малой тесноте зависимости между х и у.
Если 0,3<h<0,6 – средняя теснота связи.
Если 0,6<h<1 – связь сильная, существенная.
На практике корреляционное отношение применяют реже, чем коэффициенты корреляции. Это связано с тем, что этот показатель условно оценивает направление связи, а также требует построения группировочных таблиц с большим числом наблюдений, в случае нелинейной корреляции часто применяют коэффициент корреляции, но он дает несколько заниженные значения.
Многофакторный корреляционно- регрессионный анализ
Если в исследование вводятся несколько факторов-аргументов, то речь идет о множественной корреляции и корреляционно-регрессионный анализ позволяет оценить меру влияния на рассматриваемый результативный признак каждого из включенных в модель факторов.
Наиболее сложным вопросом является выбор формы связи, графически обосновать функцию очень сложно, поэтому используют способ перебора функций разных типов.
Часто модель сводится к линейной так как практически любую функцию многих переменных путем логарифмирования или замены переменных можно свести к линейному виду.
Пусть задана двухфакторная модель:
Линейное уравнение связи:
`
Необходимо определить параметры уравнения (а0,а1,а2).
а0 – свободный член, экономического смысла не несет.
а1,а2 – коэффициенты регрессии, показывают степень влияния соответствующего фактора на результативный при фиксированном положении остальных факторов, то есть с изменением каждого фактора на единицу, результативный показатель изменяется на соответствующий коэффициент регрессии.
Для нахождения параметров составляется система нормальных уравнений по способу наименьших квадратов.
При изучении множественных связей производится оценка тесноты зависимости результативного признака от всех факторных признаков. При этом могут рассчитываться следующие показатели:
Парные коэффициенты измеряют тесноту связи между двумя рассматриваемыми переменными. Расчет всех парных коэффициентов представляют матрицей, по которой производят их анализ. Важным вопросом здесь является выявление мультиколлинеарности, под которой понимается наличие очень близкой функциональной связи зависимости между факторным и результативным признаками.
Судят о мультиколлинеарности по величине парного коэффициента, если он выше 0,9 , то есть наличие мультиколлинеарности. Это явление снижает надежность оценок тесноты связи.
В зависимости от количества переменных, влияние которых исключается, частные коэффициенты корреляции могут быть различного порядка. При исключении влияния одной переменной рассчитывают коэффициент первого порядка, при исключении влияния двух переменных – коэффициент второго порядка. Причем парный коэффициент корреляции не равен соответствующему частному коэффициенту корреляции (частные обычно выше по абсолютной величине).
Например, при двухфакторной модели при исключении z частный коэффициент первого порядка рассчитывается:
Множественный коэффициент корреляции измеряет тесноту зависимости от совместных факторных признаков. В общем виде множественный коэффициент корреляции может быть определен как корреляционное отношение:
где d2 – дисперсия в ряду значений результативного признака, рассчитанных по уравнению регрессии.
s2 – в ряду эмпирических значений результативного признака.
Коэффициент корреляции положителен 0< R< 1.
Множественный коэффициент корреляции может определяться через b-коэффициенты и парные коэффициенты корреляции:
Лекция 12
Тема: Выборочные наблюдения
Выборочным называется наблюдение, при котором по характеристике некоторой части совокупности дается характеристика всей исследуемой совокупности. Этим обеспечивается репрезентативность выборочной совокупности. Репрезентативность - свойство представлять полную совокупность.
Выборочные наблюдения позволяют подтвердить данные сплошных наблюдений, подводить итоги, достаточно точно оценивать параметры совокупности.
Применяют в контроле качества продукции, характеристики использования оборудования, затрат рабочего времени, исследовании спроса населения, определения рыночных цен, определения жизненного уровня населения и т.д.
Полная совокупность называется генеральной (численность обозначают N). Выборочная (обследуемая) часть совокупности называется выборкой. Ее численность обозначают n.
При выборочных наблюдениях определяют две важные характеристики:
Доля – представляет собой относительную величину – частость, которую получают отношением числа единиц совокупности, наделенных интересующим признаком к общему числу единиц совокупности.
Долю определяют для альтернативно-варьирующего признака.
В генеральной совокупности – P
В выборочной совокупности - W
Важнейшим расчетным параметром в выборочном методе является ошибка выборки, под ней понимаются возможные пределы отклонений выборочной доли или средней величины в выборочных наблюдениях и в генеральной совокупности.
Ошибки в выборке классифицируются на:
Ошибки репрезентативности подразделяются на:
Систематические возникают, если предвзято выбираются лучшие или худшие единицы в выборку. Поэтому основной принцип выборочного наблюдения – случайность отбора. Она означает, что каждая единица имеет равную возможность попасть в выборку.
Случайные ошибки подразделяют на:
Они могут определяться и для средней величины и для доли. Случайные ошибки объясняются недостаточно равномерным представлением различных категорий единиц N, величина случайной ошибки в выборке зависит:
Для средней величины ошибка:
s2 – дисперсия признака в генеральной совокупности
Для измерения средней ошибки доли:
Для социально- экономических процессов повторная выборка организуется редко. Часто организуется бесповторная выборка, при которой раз выбранная единица не возвращается в N и численность N сокращается в процессе выборки. Тогда в приведенные формулы необходимо ввести дополнительный множитель (1- n/N).