Методы изучения взаимосвязей показателей таможенной статистики. Индексный метод в таможенной статистике

Автор работы: Пользователь скрыл имя, 02 Мая 2014 в 16:52, лекция

Краткое описание

1. Сущность и методы корреляционного анализа. Коэффициент корреляции.
2. Регрессивный и корреляционно-регрессивный анализ.
3. Использование индексов в таможенной статистике.
4. Особенности расчета индексных средних цен.

Прикрепленные файлы: 1 файл

Лекция.docx

— 147.72 Кб (Скачать документ)

Методы изучения взаимосвязей показателей таможенной статистики. Индексный метод в таможенной статистике

 

План:

  1. Сущность и методы корреляционного анализа. Коэффициент корреляции.
  2. Регрессивный и корреляционно-регрессивный анализ.
  3. Использование индексов в таможенной статистике.
  4. Особенности расчета индексных средних цен.

 

1. Сущность и методы корреляционного анализа. Коэффициент корреляции.

Исследование объективно существующих связей между явлениями - важнейшая задача статистики. В процессе статистического исследования зависимостей выявляются причинно-следственные отношения между явлениями. Причинно-следственные отношения - это такая связь явлений и процессов, когда изменение одного из них - причины ведет к изменению другого - следствия.

Признаки явлений и процессов по их значению для изучения взаимосвязи делятся на два класса факторные и результативные. Признаки, обуславливающие изменение других, связанных с ними признаков, называются факторными, или факторами (обозначают x). Признаки, изменяющиеся под воздействием факторных признаков, называют результативными (обозначают y).

Различают два вида связи между факторным и результативным признаками: функциональную и стохастическую.

Функциональная связь – это такая связь, при которой определенному значению факторного признака строго соответствует одно или несколько вполне определенных значений результативного признака. Функциональная связь, если она существует, проявляется во всех случаях наблюдения и для каждой конкретной единицы исследуемой совокупности. Такие связи обычно встречаются в точных науках.

Иного рода связи – стохастические – встречаются  в области экономических явлений, где на результативный признак взаимно действуют многие факторы и поэтому одному значению х соответствует целое распределение значений у. Такие связи проявляются не в каждом конкретном случае, а в общем, в среднем, при большом числе наблюдений.

Частным случаем стохастической связи является корреляционная связь, при которой изменение среднего значения результативного признака у обусловлено изменением факторного признака х. Корреляционная связь – это связь, проявляющаяся при большом числе наблюдений в виде определенной зависимости между средним значением результативного признака и признаками-факторами. Другими словами, корреляционную связь условно можно рассматривать как своего рода функциональную связь средней величины одного признака (результативного) со значением другого (или других). При этом, если рассматривается связь средней величины у с одним факторным признаком х, корреляция называется парной, а если факторных признаков два и более (х1, х2, х3 и т.д.)- множественной.

Задачей корреляционного анализа является количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи).

Для выявления наличия и характера корреляционной связи между двумя признаками в статистике используется ряд методов.

1. Рассмотрение параллельных данных (значений x и y в каждой из n единиц). Единицы наблюдения необходимо расположить по возрастанию значений факторного признака х и затем сравнить с ним (визуально) поведение результативного признака у.

2. Графический метод – это графическое изображение корреляционной зависимости. Для этого, имея n взаимосвязанных пар значений x и y и пользуясь прямоугольной системой координат, каждую такую пару изображают в виде точки на плоскости с координатами x и y. Совокупность полученных точек представляет собой корреляционное поле, а соединяя последовательно нанесенные точки отрезками, получают ломаную линию, именуемую эмпирической линией регрессии.

Визуально анализируя график, можно предположить характер зависимости между признаками x и y.

3. Коэффициент корреляции знаков (Фехнера) – простейший показатель тесноты связи, основанный на сравнении поведения отклонений индивидуальных значений каждого признака (x и y) от своей средней величины. При этом во внимание принимаются не величины отклонений (   ) и ( ), а их знаки («+» или «–»). Определив знаки отклонений от средней величины в каждом ряду, рассматривают все пары знаков и подсчитывают число их совпадений (С) и несовпадений (Н). Тогда коэффициент Фехнера рассчитывается как отношение разности чисел пар совпадений и несовпадений знаков к их сумме, т.е. к общему числу наблюдаемых единиц:

.        (1)

Очевидно, что если знаки всех отклонений по каждому признаку совпадут, то КФ=1, что характеризует наличие прямой связи. Если все знаки не совпадут, то КФ=–1(обратная связь). Если же åС=åН, то КФ=0. Итак, как и любой показатель тесноты связи, коэффициент Фехнера может принимать значения от 0 до 1. Однако, если КФ=1, то это ни в коей мере нельзя воспринимать как свидетельство функциональной зависимости между х и у.

4. Линейный коэффициент корреляции – самый популярный измеритель тесноты линейной связи между двумя количественными признаками x и y. Он основан на предположении, что при полной независимости признаков x и у отклонения значений факторного признака от средней ( ) носят случайный характер и должны случайно сочетаться с различными отклонениями ( ). При наличии значительного перевеса совпадений или несовпадений таких отклонений делается предположение о наличии связи между x и y.

В отличие от КФ в линейном коэффициенте корреляции учитываются не только знаки отклонений от средних величин, но и значения самих отклонений, выраженные для сопоставимости в единицах среднего квадратического отклонения t:

 (2)    и  .   (3)

Линейный коэффициент корреляции r представляет собой среднюю величину из произведений нормированных отклонений для x и у:

, (4) или  . (5)

Числитель формулы, деленный на n, представляющий собой среднее произведение отклонений значений двух признаков от их средних значений, называется коэффициентом ковариации – это мера совместной вариации факторного x и результативного y признаков:

 (6)

Недостатком коэффициента ковариации является то, что он не нормирован, в отличие от линейного коэффициента корреляции. Очевидно, что линейный коэффициент корреляции представляет собой частное от деления ковариации между х и у на произведение их средних квадратических отклонений:

.    (7)

Путем несложных математических преобразований можно получить и другие модификации формулы линейного коэффициента корреляции, например:

№ 1 ,  , (7.1)

,  . (7.2)

Линейный коэффициент корреляции может принимать значения от –1 до +1, причем знак определяется в ходе решения. Например, если , то r по формуле №1 будет положительным, что характеризует прямую зависимость между х и у, в противном случае (r<0) – обратную связь. Если , то r=0, что означает отсутствие линейной зависимости между х и у, а при r=1 – функциональная зависимость между х и у. Следовательно, всякое промежуточное значение r от 0 до 1 характеризует степень приближения корреляционной связи между х и у к функциональной. Существует эмпирическое правило (шкала Чэддока) для оценки тесноты связи, представленное в таблице 1.

Таблица 1.

Шкала Чэддока

|r|

Теснота связи

менее 0,1

отсутствует линейная связь

0,1 ÷ 0,3

слабая

0,3 ÷ 0,5

умеренная

0,5 ÷ 0,7

заметная

более 0,7

сильная (тесная)


Таким образом, коэффициент корреляции при линейной зависимости служит как мерой тесноты связи, так и показателем, характеризующим степень приближения корреляционной зависимости между х и у к линейной. Поэтому близость значения r к 0 в одних случаях может означать отсутствие связи между х и у, а в других свидетельствовать о том, что зависимость не линейная.

5. Подбор уравнения  регрессии представляет собой математическое описание изменения взаимно коррелируемых величин по эмпирическим (фактическим) данным. Уравнение регрессии должно определить, каким будет среднее значение результативного признака у при том или ином значении факторного признака х, если остальные факторы, влияющие на у и не связанные с х, не учитывать, т.е. абстрагироваться от них. Другими словами, уравнение регрессии можно рассматривать как вероятностную гипотетическую функциональную связь величины результативного признака у со значениями факторного признака х.

Уравнение регрессии можно также назвать теоретической линией регрессии. Рассчитанные по уравнению регрессии значения результативного признака называются теоретическими. Они обычно обозначаются или (читается: «игрек, выравненный по х») и рассматриваются как функция от х, т.е. = f(x).

Найти в каждом конкретном случае тип функции, с помощью которой можно наиболее адекватно отразить ту или иную зависимость между признаками х и у, — одна из основных задач регрессионного анализа. Выбор теоретической линии регрессии часто обусловлен формой эмпирической линии регрессии; теоретическая линия как бы сглаживает изломы эмпирической линии регрессии. Кроме того, необходимо учитывать природу изучаемых показателей и специфику их взаимосвязей.

Для аналитической связи между х и у могут использоваться виды уравнений, приведенные в таблице 2 (при условии замены t на x). Обычно зависимость, выражаемую уравнением прямой, называют линейной (или прямолинейной), а все остальные — криволинейными зависимостями.

 

 

Таблица 2.

Виды математических функций, используемые при выравнивании

Название функции

График функции

Формула

Прямая линия

 

Парабола 2-го порядка

или

 

Гипербола

 

Показательная

 

Степенная

 

Ряд Фурье

 (91)


Выбрав тип функции (таблица 2), по эмпирическим данным определяют параметры уравнения. При этом отыскиваемые параметры должны быть такими, при которых рассчитанные по уравнению теоретические значения результативного признака были бы максимально близки к эмпирическим данным.

Существует несколько методов нахождения параметров уравнения регрессии. Наиболее часто используется метод наименьших квадратов (МНК). Его суть заключается в следующем требовании: искомые теоретические значения результативного признака должны быть такими, при которых бы обеспечивалась минимальная сумма квадратов их отклонений от эмпирических значений, т.е.

. (8)

Поставив данное условие, легко определить, при каких значениях a0, a1 и т.д. для каждой аналитической кривой эта сумма квадратов отклонений будет минимальной. Воспользуемся формулой для нахождения параметров теоретической линии регрессии, заменив параметр t на x:

 (9)

Выразив из первого уравнения системы a0, получим:

. (9.1)

Подставив во второе уравнение первой системы, затем, разделив обе его части на n, получим:

. (9.2)

Применяя 3 раза формулу средней арифметической, получим: . (9.3)

Раскрыв скобки и перенеся члены без a1 в правую часть уравнения, выразим a1:

. (9.4)

Параметр a1 в уравнении линейной регрессии называется коэффициентом регрессии, который показывает на сколько изменяется значение результативного признака y при изменении факторного признака x на единицу.

6. Коэффициент  эластичности показывает, на сколько процентов изменяется в среднем результативный признак y при изменении факторного признака x на 1%. Он рассчитывается на основе уравнения регрессии:

, (10)

где – первая производная уравнения регрессии y по x.

Коэффициент эластичности – величина переменная, т.е. изменяется с изменением значений фактора x. Так, для линейной зависимости (11):

.         (12)

Изучение корреляционных связей сводится в основном к решению следующих задач:

1) изменение тесноты связи  между х и у с помощью специальных коэффициентов; эта часть исследование именуется корреляционным анализом.

2) определение уравнения  регрессии – математической модели  у = f(х), в которой среднее значение у рассматривается как функция х; эта часть исследования называется регрессионным анализом.

Последовательность решения задач может меняться.

 

2. Регрессивный и корреляционно-регрессивный анализ.

Теснота связи количественно выражается величиной коэффициентов корреляции, которые давая количественную характеристику тесноты связи между признаками, позволяют определять «полезность» факторных признаков при построении уравнения множественной регрессии.

Информация о работе Методы изучения взаимосвязей показателей таможенной статистики. Индексный метод в таможенной статистике