Метод корреляционно-регрессионного анализа в статистическом изучении рекламной деятельности

Автор работы: Пользователь скрыл имя, 19 Марта 2013 в 12:36, курсовая работа

Краткое описание

Целью курсовой работы является корреляционно-регрессионный анализ в статистическом изучении рекламной деятельности,
Исходя из цели, были обозначены следующие задачи:
- дать краткую характеристику рекламной деятельности;
- изучить основные методы изучения связи корреляционно-регрессионного анализа;
- рассмотреть статистические методы исследования рекламной деятельности на конкретных примерах.

Содержание

Введение…………………………………….....…………………......…..…3
I. Теоретическая часть…...………………………...…….…………...…....5
1.1. Краткая характеристика рекламной деятельности………………….5
1.2. Статистическое моделирование связи методом корреляционного и регрессионного анализа…………………………………………………….…….7
II. Расчетная часть.......................................................................................18
III. Аналитическая часть.............................................................................31
Заключение..................................................................................................39
Список использованной литературы........................................................42

Прикрепленные файлы: 1 файл

V_9-3.doc

— 618.50 Кб (Скачать документ)

где   - коэффициент множественной корреляции; - коэффициент множественной корреляции результативного фактора (y) со всеми за исключением исследуемого.

Таблица 1

Атрибутивные оценки тесноты выявленной зависимости переменных

Значение показателя корреляции

Атрибутивная оценка тесноты связи

До 0,3

0,3-0,5

0,5-0,7

0,7-0,9

0,9 и более

Слабая

 Умеренная

 Заметная 

Тесная 

Весьма тесная


 Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой или результативным признаком), обусловлено влиянием одной или нескольких независимых величин (факторных признаков).

Одной из проблем построения уравнений  регрессии является их размерность, то есть определение числа факторных признаков, включаемых в модель. Их число должно быть оптимальным. Сокращение размерности за счет исключения второстепенных, несущественных факторов позволяет получить модель, быстрее и качественнее реализуемую. В то же время, построение модели малой размерности может привести к тому, что она будет недостаточно полно описывать исследуемое явление или процесс.

При построении моделей регрессии  должны соблюдаться следующие требования:

1.  Совокупность исследуемых  исходных данных должна быть однородной и математически описываться непрерывными функциями.

2. Возможность описания моделируемого  явления одним или несколькими  уравнениями причинно-следственных связей.

3. Все факторные признаки должны  иметь количественное (числовое) выражение.

4.  Наличие достаточно большого  объема исследуемой совокупности (в последующих примерах в целях упрощения изложения материала это условие нарушено, т.е. объем очень мал).

5.  Причинно-следственные связи  между явлениями и процессами  должны описываться линейной или приводимой к линейной форме зависимостью.

6. Отсутствие количественных ограничений  на параметры модели связи.

7. Постоянство территориальной  и временной структуры изучаемой  совокупности.

Соблюдение данных требований позволяет построить модель, наилучшим образом описывающую реальные социально-экономические явления и процессы.

Парная регрессия позволяет  получить аналитическое выражение  связи между двумя признаками: результативным и факторным.

Определить тип  уравнения можно, исследуя зависимость графически, однако существуют более общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, то это свидетельствует о том, что связь между ними линейная, а при обратной связи - гиперболическая. Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболическая или степенная регрессия.

Оценка параметров уравнений регрессии (а0, a1, и а2 - в уравнении параболы второго порядка) осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности и нахождении параметров модели (а0, a1), при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:

Система нормальных уравнений для  нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:

где n — объем исследуемой совокупности (число единиц наблюдения).

В уравнениях регрессии параметр а0 показывает усредненное влияние на результативный признак неучтенных в уравнении факторных признаков. Коэффициент регрессии a1 показывает, на сколько в среднем изменяется значение результативного признака при увеличении факторного признака на единицу собственного измерения.

Изучение связи между тремя  и более связанными между собой  признаками носит название множественной (многофакторной) регрессии:

Построение моделей множественной  регрессии включает несколько этапов:

1.   Выбор формы связи (уравнения  регрессии);

2.   Отбор факторных признаков;

3.   Обеспечение достаточного  объема совокупности.

Выбор типа уравнения затрудняется тем, что для любой формы зависимости  можно выбрать целый ряд уравнений, которые в определенной степени будут описывать эти связи. Примерами многофакторных моделей могут служить:

  1. линейная модель

;

в частности, для двух факторных  признаков линейная модель имеет  вид:

;

  1. степенная модель

частным случаем которой является производственная функция Кобба - Дугласа

;

3) показательная  модель

;

4) параболическая  модель

;

5) гиперболическая  модель

.

и другие виды моделей.

Важным этапом построения уже выбранного уравнения  множественной регрессии является отбор и последующее включение факторных признаков.

С одной стороны, чем больше факторных признаков  включено в уравнение, тем оно  лучше описывает явление. Однако модель размерностью 100 и более факторных  признаков сложно реализуема и требует больших затрат машинного времени. Сокращение размерности модели за счет исключения второстепенных, экономически и статистически несущественных факторов способствует простоте и качеству ее реализации. В то же время построение модели регрессии малой размерности может привести к тому, что такая модель будет недостаточно адекватна исследуемым явлениям и процессам.

Проблема отбора факторных признаков для построения моделей взаимосвязи может быть решена на основе интуитивно-логических или многомерных математико-статистических методов анализа.

Наиболее приемлемым способом отбора факторных признаков  является шаговая регрессия (шаговый  регрессионный анализ). Сущность метода шаговой регрессии заключается  в реализации алгоритмов последовательного  «включения», «исключения» или «включения-исключения» факторов в уравнение регрессии и последующей проверке их статистической значимости. Алгоритм «включения» заключается в том, что факторы поочередно вводятся в уравнение так называемым «прямым методом». При проверке значимости введенного фактора определяется, на сколько уменьшается сумма квадратов остатков и увеличивается величина множественного коэффициента корреляции (R2). Одновременно используется и алгоритм последовательного «исключения», сущность которого заключается в том, что исключаются факторы, ставшие незначимыми по статистическим критериям.

Фактор является незначимым, если его включение в  уравнение регрессии только изменяет значения коэффициентов регрессии, не уменьшая суммы квадратов остатков и не увеличивая их значения. Если при включении в модель соответствующего факторного признака величина множественного коэффициента корреляции увеличивается, а коэффициента регрессии не изменяется (или меняется несущественно), то данный признак существенен и его включение в уравнение регрессии необходимо. В противном случае, фактор нецелесообразно включать в модель регрессии.

При построении модели регрессии возможна проблема мультиколлинеарности, под  которой понимается тесная зависимость  между факторными признаками, включенными  в модель ( ).

Наличие мультиколлинеарности между  признаками вызывает:

- искажение величины параметров модели, которые имеют тенденцию к завышению, чем осложняется процесс определения наиболее существенных факторных признаков;

- изменение смысла экономической интерпретации коэффициентов регрессии.

В качестве причин возникновения мультиколлинеарности между признаками можно выделить следующие:

- изучаемые факторные признаки являются характеристикой одной и той же стороны изучаемого явления или процесса. Например: показатели объема производимой продукции и среднегодовой стоимости основных фондов одновременно включать в модель не рекомендуется, так как они оба характеризуют размер предприятия;

- факторные признаки являются составляющими элементами друг друга.

Например: показатели выработки продукции  на одного работающего и численность  работающих одновременно в модель включать нельзя, так как в основе расчета  показателей лежит один и тот  же показатель - численность работающих на предприятии.

- факторные признаки по экономическому смыслу дублируют друг друга.

Устранение мультиколлинеарности может реализовываться через  исключение из корреляционной модели одного или нескольких линейно-связанных  факторных признаков или преобразование исходных факторных признаков в новые, укрупненные факторы.

Вопрос о том, какой из факторов следует отбросить, решается на основании  качественного, логического анализа изучаемого явления, а также на основе анализа тесноты связи между результативным (у) с каждым из сильно коллинеарно связанных факторных признаков. Из дальнейшего анализа целесообразно исключить тот факторный признак, связь которого с результативным наименьшая.

Качество уравнения регрессии  зависит от степени достоверности  и надежности исходных данных и объема совокупности. Исследователь должен стремиться к увеличению числа наблюдений, так как большой объем наблюдений является одной из предпосылок построения адекватных статистических моделей.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  1. Расчетная часть

Задание 1 

Имеются следующие выборочные данные (выборка 5%-ная механическая) о среднедневных расходах на рекламу и числе покупателей в день по 30 однородным торговым предприятиям, тыс. руб.:

№ предприятия п/п

Расходы на рекламу, тыс. руб.

Число покупателей, чел.

№ домохозяйства п/п

Расходы на рекламу, тыс. руб.

Число покупателей, чел.

1

3,4

55

16

3,4

42

2

7,0

68

17

2,9

52

3

1,1

31

18

5,2

59

4

2,8

44

19

5,2

65

5

4,1

56

20

4,2

60

6

6,5

70

21

4,2

61

7

1,7

35

22

4,0

54

8

2,6

47

23

4,3

62

9

5,4

60

24

7,9

78

10

4,8

61

25

5,6

63

11

8,0

82

26

5,5

64

12

2,1

38

27

8,1

86

13

2,3

49

28

5,7

65

14

4,0

58

29

8,2

91

15

6,1

68

30

6,0

66

Информация о работе Метод корреляционно-регрессионного анализа в статистическом изучении рекламной деятельности