Автор работы: Пользователь скрыл имя, 23 Октября 2013 в 19:16, курсовая работа
Мета: формування базових знань з основ застосування ймовірнісно – статистичного апарата для розв’язування теоретичних і практичних економічних задач.
В результаті вивчення дисципліни студент повинен вміти:
- використовувати у своїй практичній діяльності набуті знання щодо застосовування статистичних методів для дослідження економічних явищ;
- проаналізувати та сформулювати постановку економічної задачі з використанням найпростіших кореляційних методів;
ВСТУП……………………………………………………………………………….3
РОЗДІЛ I
ЗАГАЛЬНА ХАРАКТЕРИСТИКА ТЕОРІЇ КОРЕЛЯЦІЇ………………5
1.1.Теорія кореляційного дослідження…………………………………………..5
1.2.Характеристика методів і критеріїв встановлення залежності між змінними…………………………………………………………………………….15
1.3.Лінійна регресія……………………………………………………………...21
1.3.1.Критерій Фішера…………………………………………………….23
1.3.2.Дисперсія…………………………………………………………….23
1.3.3.Коефіцієнти кореляції………………………………………………24
1.4.Виробнича регресія………………………………………………………….27
1.5.Моделі парної регресії та їх дослідження………………………………….36
РОЗДІЛ II
ПРАКТИЧНА РЕАЛІЗАЦІЯ ТЕОРІЇ КОРЕЛЯЦІЇ…………………...47
2.1. Реалізація лінійної регресії на прикладі задач……………………………47
2.2. Реалізація застосування методу найменших квадратів на прикладах…..50
2.3.Застосування методу лінійної регресії на прикладі………………….......54
ВИСНОВОК………………………………………………………………………..58
ВИКОРИСТАНА ЛІТЕРАТУРА………………………………………………..59
Найпростіше зіставлення 2 груп містить у собі джерела ряду артефактів, характерних для кореляційного дослідження. По-перше, виникає проблема рандомізації груп — вони повинні чітко розділятися за обраним критерієм, по-друге, реальні виміри відбуваються не одночасно, а різночасно.
По-третє, добре, якщо тестування
усередині групи проводять
Стать без особливих зусиль (у тому числі без хірургічного впливу) поміняти сьогодні не можна, але можна перейти з однієї навчальної групи в іншу, а також з класу у клас.
Якщо дослідник задався метою порівняти дві навчальні групи за рівнем успішності, він повинний подбати про те, щоб не відбулося їх «перемішування» у ході дослідження.
Ефект неодночасності вимірів у двох групах (у випадку припущення значимості цього фактора) можна було б «забрати» уведенням двох контрольних груп, але тестувати їх теж прийдеться іншим часом. Зручніше розділити первинні групи навпіл.
Обробка результатів для виявлення ефекту послідовності здійснюється методом двофакторного аналізу 2x2. Порівняння природних (нерандомізірованих) груп ведеться по тім же плані.
2. Одномірне дослідження однієї групи в різних умовах. План цього дослідження аналогічний попередньому. Але по своїй суті він близький до експерименту, так як умови, у яких знаходиться група, розрізняються. У випадку кореляційного дослідження ми не керуємо рівнем незалежної перемінної, а лише констатуємо зміну поводження індивіда в нових умовах. Прикладом може слугувати зміна рівня тривожності дітей при переході з дитячого саду в 1-й клас школи; група та сама, а умови різні.
Головні артефакти цього плану — кумуляція ефектів послідовності і тестування. Крім того, що спотворює вплив на результати може робити ремінний фактор (ефект природного розвитку).
Схема цього плану виглядає дуже просто: АО1 ВО2, де А и В — різні умови. Випробувані можуть відбиратися з генеральної популяції випадковим образом або представляти собою природну групу.
Обробка даних зводиться
до оцінки подібності між результатами
тестування в умовах А и В. Для
контролю ефекту послідовності можна
зробити збалансування і
У цьому випадку ми можемо розглядати А и В як вплив, а план — як квазіексперимент.
3. Кореляційне
дослідження попарно
4. Для перевірки
гіпотези про статистичний зв'
Дані дослідження представлені у формі матриці: т х п, де т — кількість випробуваних, п — тести. Матриця «сирих» даних обробляється, підраховуються коефіцієнти лінійної кореляції. Виходить матриця виду т х п, де п — число тестів. У клітинках матриці — коефіцієнти кореляції, по її діагоналі — одиниці (кореляція тесту із самим собою). Матриця симетрична щодо цієї діагоналі. Кореляції оцінюються на статистичні розходження в такий спосіб: спочатку r переводиться в Z-оцінки, потім для порівняння r застосовується t-критерій Стьюдента. Значимість кореляції оцінюється при її зіставленні з табличним значенням. При порівнянні rексп. і rтеор. приймається гіпотеза про значиму відмінність кореляції від випадкової при заданому значенні точності (а = 0,05 або а - 0,001). У деяких випадках виникає необхідність обчислення множинних кореляцій, приватних кореляцій, кореляційних відносин або редукції розмірності — зменшення числа параметрів.
Для зменшення числа обмірюваних параметрів використовуються різні методи латентного аналізу. Застосуванню їх у психологічному дослідженні присвячена безліч публікацій. Головною причиною артефактів, що виникають при проведенні багатомірного психологічного тестування, є реальний фізичний час. При аналізі даних кореляційного дослідження ми відволікаємося від неодночасності проведених вимірів. Крім того, вважається, що результат наступного виміру не залежить від попереднього, тобто не існує ефекту переносу.
Перелічимо основні артефакти, що виникають у ході застосування цього плану:
1. Ефект послідовності
— попереднє виконання одного
тесту може вплинути на результ
2. Ефект навчання —
при виконанні серії різних
тестових іспитів в учасника
експерименту може
3. Ефекти фонових впливів
і «природного» розвитку
4. Взаємодія процедури
тестування і складу групи
виявляється при дослідженні
неоднорідної групи:
5. Структурне кореляційне дослідження.
Від попередніх
варіантів ця схема
Пояснемо цей випадок прикладом. Допустимо, нам необхідно перевірити гіпотезу про те, чи впливає стать батька і стать дитини на подібність або розходження їхніх особистісних рис, наприклад рівня нейротизму по Айзенку. Для цього ми повинні провести дослідження реальних груп — родин. Потім обчислюються коефіцієнти кореляції рівнів тривожності батьків і дітей. Виходять 4 основних коефіцієнти кореляції: 1) мати-дочка; 2) мати-син; 3) батько-дочка; 4) батько-син, і дві додаткових: 5) сини-дочки; 6) мати-батько. Якщо нас цікавить лише порівняння подібності-розходження першої групи кореляцій, а не дослідження асортативності, то ми будуємо 4-клітинну таблицю 2 х2.
Кореляції піддаються - перетворенню і порівнюються по t-критерію Стьюдента.
Тут приведений найпростіший приклад структурного кореляційного дослідження. У дослідницькій практиці зустрічаються більш складні версії структурних кореляційних досліджень. Найчастіше вони проводяться в психології індивідуальності (Б. Г. Ананьев і його школа), психології праці і навчання (В. Д. Шадриков), психофізіології індивідуальних розходжень (Б. М. Теплов, В. Д. Небилицин, В. М. Р Салов і ін.), психосемантике (В. Ф. Петренко, А. Г. Шмельов і ін.).
6. Лонгітюдне кореляційне дослідження. Лонгітюдне дослідження - варіант квазіекспериментальних дослідницьких планів. Що впливає на перемінну психолога, що проводить лонгітюдне дослідження, вважає час. Воно є аналогом плану тестування однієї групи в різних умовах. Тільки умови вважаються константними. Результатом будь-якого тимчасового дослідження є побудова тимчасового тренда вимірюваних перемінних, що можуть бути аналітично описаний тими або іншими функціональними залежностями.
Лонгітюдне кореляційне
дослідження будується за планом
тимчасових серій з тестуванням
групи через задані проміжки часу.
Крім ефектів навчання, послідовності
і т.д. у лонгітюдному дослідженні
варто враховувати ефект
Структурне лонгітюдне дослідження відрізняється від простого лонгітюда тим, що нас цікавить не стільки зміна центральної тенденції або розкиду який-небудь перемінної, скільки зміна зв'язків між перемінними. Такого роду дослідження широко поширені у психогенетиці.
Обробка й інтерпретація
даних кореляційного дослідженн
«випробувані» х «тести»
Первинна обробка полягає в підрахунку коефіцієнтів статистичного зв'язку між двома і більш перемінними. Вибір міри зв'язку визначається шкалою, за допомогою якої зроблені виміри.
1. Якщо виміри зроблені
по дихотомічній шкалі, то для
підрахунку тісноти зв'язку
2. Дані представлені
в порядковій шкалі. Мірою зв'
Часто для обробки
даних, отриманих за допомогою шкали
порядку, використовують коефіцієнт рангової
кореляції Спірмена, що є модифікацією
коефіцієнта Пірсона для
3. Дані отримані по
шкалі інтервалів, або відносин.
У цьому випадку
Нарешті, якщо дослідник думає, що зв'язку між перемінними нелінійні, він обчислює кореляційне відношення, що характеризує величину нелінійної статистичної залежності двох перемінних.
Кореляційне дослідження завершується висновком про статистичну значимість установлених (або невстановлених) залежностей між перемінними.
Кореляційний зв'язок представляє собою частковий випадок статистичного зв'язку М(Y|X = x) = y(x), тобто математичне очікування змінної Y, при умові, що випадкова величина Х приймає значення х.
(2.1)
Коефіцієнт кореляції [2, 78-80 ст.] показує тісноту лінійного зв'язку між двома вибірками випадкових величин. Його значення змінюється від -1 (мал. 1.1, rxy = -0,8), що відповідає зворотному зв'язку, до +1 (мал. 1.2, rxy = 0,8), що відповідає прямо пропорційного зв'язку (значення 0, означає відсутність зв'язку - мал. 1.3).
Малюнок 1.1. Приклад зворотньої кореляційної залежності
Малюнок 1.2. Приклад прямої кореляційної залежності
Малюнок 1.3. Приклад діаграми розсіювання при відсутності зв'язку між змінними
Оскільки ми маємо справу з випадковими величинами, однієї величини коефіцієнта парної кореляції для висновку недостатньо. Необхідно перевірити, чи значимо він відрізняється від нуля. Це можна зробити за допомогою критерію Стъюдента. Фактично перевіряється гіпотеза про рівність коефіцієнта кореляції кулю. Для цього розраховується критериальное значення по формулі:
(2.2)
де r - значення коефіцієнта кореляції, a N - кількість спостережень.
Якщо розрахункове значення t (tpac) більше табличного, узятого з N - 2 ступенями волі, нульова гіпотеза відкидається. Це означає, що коефіцієнт кореляції значимий відрізняється від нуля (з обраним рівнем значимості). Напівширина довірчого інтервалу для коефіцієнта кореляції визначається по формулі:
(2.3)
де N - число спостережень, по яких розраховується коефіцієнт кореляції; r - значення коефіцієнта кореляції; tn-2p - табличне значення критерію Стьюдента, узятого з N - 2 ступеня волі.
Зауваження. Слід пам'ятати, що коефіцієнт кореляції показує міру тільки лінійоного зв'язку. Тому у випадках, коли залежність між змінними носить більш складний характер, коефіцієнт кореляції буде показувати відсутність зв'язку. Приклад - на мал. 1.4. між змінними існує залежність другого порядку (описується квадратним рівнянням), тоді як коефіцієнт кореляції буде близьким до нуля. Тому, для виявлення складних залежностей між змінними використовують інші статистичні методи, зокрема регресійний аналіз.
Малюнок 1.4. Приклад нелінійного зв'язку між змінними