Автор работы: Пользователь скрыл имя, 22 Декабря 2010 в 11:09, реферат
К числу самых своеобразных и трудноосваиваемых методов сбора социологической информации относится эксперимент. Уже одно название этого метода, имеющего весьма громкое звучание, завораживает и вызывает особое уважение.
Введение………………………………………………………………………….. 3 1. Определение и виды эксперимента…………………………………………...4
1. Основные принципы экспериментирования в социальных науках……..4
2. Основные экспериментальные планы с контрольной группой рандомизацией…………………………………………………………….10
2. Многомерные и факторные эксперименты: общий обзор………………..21
Заключение……………………………………………………………………….24
Список использованной литературы…………………………………………...26
Приложение
R О1 Х О2
R
О3
где R — процедура рандомизации (случайного распределения по группам), О1,2 — уровни установок в экспериментальной группе до и после просмотра фильма X, O3,4 — уровни установок в контрольной группе, не смотревшей фильма. Использование контрольной группы позволяет устранить некоторые важнейшие угрозы валидности эксперимента. Во-первых, если бы исследователь отказался от использования контрольной группы и ограничился тестированием, т. е. измерением установок «до-после» просмотра, то обнаруженные изменения в уровне установок можно было бы приписать влиянию на испытуемых самого по себе факта участия в эксперименте.
Испытуемые,
возможно, осознавали, что они отобраны
для важного исследования и стремились
некоторым образом
В психологическом тестировании и экспериментальной психологии это называют «эффектом морской свинки» или «мотивом экспертизы». Иногда применяют термин, возникший в медицине, где при клинических испытаниях новых фармакологических средств и методов лечения часто наблюдают «эффект плацебо», т. е. заметное улучшение статуса у многих участников контрольной группы, в которой вместо реального воздействия использовались индифферентные средства и нейтральные врачебные манипуляции. В социологии самое популярное обозначение систематического смещения, возникающего из-за реакции испытуемых на ситуацию эксперимента — это «хоуторнский эффект».
В так называемых хоуторнских экспериментах (по названию промышленного предприятия в Чикаго) исследовались организационные и социально-психологические факторы, влияющие на производительность труда.
Исследователи обнаружили, что эффект роста производительности труда в бригадах сохранялся даже при отсутствии собственно экспериментального воздействия. Предположительной причиной этого явления был рост группового самосознания у участников эксперимента.
«Хоуторнский эффект» — это угроза валидности, связанная с особенностями экспериментальной группы.
Еще одна угроза валидности выводов, которую позволяет преодолеть описываемый план эксперимента, также связана с особенностями групп, а именно — с процессом отбора для участия в эксперименте. Если бы мы отказались от предварительного тестирования и случайного распределения испытуемых по экспериментальной и контрольной группам, мы совершили бы методическую ошибку, весьма характерную для любых экспериментов с добровольцами. Очень часто исследователи отбирают испытуемых для участия в специальной программе обучения или в новаторском организационном проекте, основываясь на изъявленном ими желании, а затем сравнивают результаты, показанные участниками оцениваемой программы, с результатами какой-либо другой доступной группы (или даже случайной выборки из соответствующей генеральной совокупности), не участвовавшей в такого рода программе. Однако такое сравнение некорректно: само по себе желание участвовать в эксперименте часто свидетельствует о изначально более высокой мотивации, осведомленности или интеллекте. Эти факторы сами по себе, или взаимодействуя с главной независимой переменной Х, могут объяснить значимые различия в результатах, показанных экспериментальной группой. В только что описанном примере сравнение группы добровольцев, пожелавших посмотреть антивоенный фильм, с прочими студентами, может вести к завышенной оценке воздействия просмотра, если добровольцы изначально проявляют больший интерес к политическим проблемам. Лишь случайное распределение добровольцев по контрольной и экспериментальной группам при соблюдении «непрозрачности» такого распределения для всех испытуемых (участники обеих групп должны считать, что они подвергаются некоторому экспериментальному воздействию) позволяет судить о роли независимой переменной X возникновении межгрупповых различий.
Вышеописанные угрозы валидности связаны преимущественно с особенностями групп, проявляющимися на стадии отбора или в ходе эксперимента. Однако рандомизация позволяет справиться и с некоторыми угрозами валидности, исходящими от переменных внешнего окружения, фона. К фоновым относятся, в частности, «возможные влияния времени года или событий, возникающих на институциональном уровне», а также факторы естественного развития — «все те биологические или психологические процессы, которые независимо от конкретных внешних событий систематически изменяются с течением времени». Испытуемые взрослеют, обучаются, устают, улучшают свои результаты при повторных тестированиях и т. п., что может сказываться на их результатах.
Однако если такие посторонние влияния не оказывают избирательного воздействия только на членов экспериментальной группы, они будут вносить вклад лишь в случайную ошибку, а не в систематическое смещение. Иными словами, они будут с равной вероятностью распределены между случайным образом отобранными участниками контрольной и экспериментальной групп. План типа RT1-2C позволяет обеспечить случайный и равновероятный характер внешних, фоновых воздействий на контрольную и экспериментальную группу. Более того, он позволяет «вычесть» величину фонового влияния и оценить чистый основной эффект: если внешнее влияние все же имело место, оно в равной степени подействовало на показатели и экспериментальной, и контрольной групп; следовательно, разность между средними значениями первого и второго замеров уровня зависимой переменной в контрольной группе (О4 ¾ О3) нужно вычесть из аналогичной разности значений зависимой переменной, зафиксированной в экспериментальной группе (О2 ¾ O1), т. е.:
êХ ê = ( О2 ¾ O1) ¾ ( О4 ¾ О3),
при этом
предварительное и
Систематическая угроза валидности, связанная с фоновыми факторами, может все же возникнуть и при использовании рандомизации и контрольной группы. Это происходит тогда, когда фоновые факторы взаимодействуют с независимой переменной (или некоторыми ее уровнями). Природу такого взаимодействия легко понять на примере исследования, в котором изучается влияние тревожности, возникающей в ситуации неопределенности, на успешность решения сложных задач. В такого рода экспериментах для создания ситуации неопределенности и повышения реактивной тревожности (независимые переменные) часто используют неясные инструкции, косвенные негативные оценки действий испытуемого, высказываемые лицами, проводящими эксперимент (типа «Ну-ну, посмотрим, как Вы сможете это использовать»), а также предварительные серии, где испытуемому приходится решать заведомо неразрешимые задачи. Разумеется, всем этим воздействиям (X) подвергаются лишь члены экспериментальной группы. Если испытуемые — это студенты, которым в силу случайного стечения обстоятельств через неделю предстоит сдавать экзамены, или сотрудники подразделения фирмы, ожидающие скорой переаттестации, то эти факторы «фона» будут взаимодействовать с независимыми переменными, не только суммируясь с ними, но и усиливая их эффект. Негативные подкрепления, получаемые в ходе эксперимента, будут восприниматься значительно острее накануне экзаменационной сессии или переаттестации, а связанная с этими событиями фоновая тревожность и неопределенность будет взаимодействовать с тревожностью и неопределенностью, создаваемыми преднамеренно.
Оценить чистый эффект взаимодействия с помощью сравнения с результатами контрольной группы вышеописанным способом в данном случае невозможно, так как взаимодействие фоновых смещений с основным эффектом происходит лишь там, где имеет место экспериментальное воздействие X. В контрольной группе приближающееся неприятное событие также может повлиять на результаты итогового замера или даже обоих замеров, но оно не будет взаимодействовать, «перемножаться» с воздействием независимой переменной (такое взаимодействие можно описать в более точных терминах, однако это требует введения некоторых статистических понятий). Для оценки величины взаимодействия фоновых смешивающих переменных с основным эффектом нужны более сложные экспериментальные планы. Некоторые из них будут обсуждаться ниже.
Иногда имеет смысл воспользоваться упрощенным вариантом описанного плана с рандомизацией и контрольной группой, а именно планом с рандомизацией без предварительного тестирования (RTC), который схематически выглядит следующим образом:
R Х О1
R
Привлекательность этого плана заключается прежде всего в его экономичности. Если при распределении испытуемых между группами и уровнями воздействия использовалась истинная вероятностная процедура, то проведение предварительного тестирования — как в плане КТ1-2С — лишь увеличивает стоимость эксперимента, не оказывая существенного влияния на качество получаемых данных. По сути, правильно осуществленная рандомизация (R) — это наилучшая гарантия отсутствия изначального смещения между группами (т. е. равенства исходных среднегрупповых значений зависимой переменной О в контрольной и экспериментальной группах). Кроме того, в широкомасштабных социологических исследованиях, а также в прикладных исследованиях в области педагогики и социальной работы, проведение и предварительных, и повторных измерений зависимой переменной (политических установок, криминального поведения и т. п.) часто неосуществимо либо ведет к возникновению реакции на саму процедуру тестирования. Если, к примеру, мы изучаем влияние участия в предвыборной групповой дискуссии на последующую поддержку политических партий, то предварительное измерение политических установок может повлиять на активность опрошенных в ходе самой дискуссии и их последующие установки.
Можно заключить, что план RTC предпочтителен всегда, когда нежелательно повторное предъявление весьма специфичных по содержанию и схожих по форме тестов, вопросов, измерительных процедур. Иными словами, этот план заслуживает широкого применения в социологических и оценочных исследованиях. Кроме того, он является самым приемлемым средством проведения так называемых методических экспериментов, в которых оценивается эффективность различных видов опроса, способов заполнения и форматов анкет и т. п. План RTC использовался, в частности, в одном из практически ориентированных социальных экспериментов по совершенствованию системы правоохранительных и пенитенциарных учреждений, проводившихся в США в 1960¾70-е гг.
В 1961 г. Федеральное бюро пенитенциарных учреждений США начало трехлетний эксперимент, целью которого было изучить воздействие поддерживающего консультирования и специальных реабилитационных программ на поведение мальчиков-подростков, находящихся в исправительных учреждениях. Местом проведения эксперимента стала специальная школа-колония для несовершеннолетних правонарушителей.
При проведении рандомизации мальчиков случайным образом распределяли между отрядами, где проводился эксперимент, и отрядами, служившими контрольными (каждый отряд жил в отдельно расположенном корпусе). В экспериментальных отрядах было увеличено количество воспитателей, проводились специальные индивидуальные и групповые консультации, использовалась система вознаграждений за хорошее поведение. В контрольных группах применялись обычные методы воспитания и обучения, а также традиционные наказания за нарушение внутреннего распорядка.
Результаты эксперимента показали, что мальчики из экспериментальных групп раньше покидали спецшколу, лучше успевали в учебе, вели себя адаптивнее. Не было обнаружено значимых различий в показателях рецидивной преступности для подростков из экспериментальных и контрольных групп, освобожденных из школы-колонии, однако ребята из экспериментальных групп значительно отличались от ребят из контрольных групп по показателю тяжести вновь совершенных преступлений (первые, в случае рецидива, совершали менее тяжкие преступления). По результатам эксперимента было принято решение о внедрении экспериментальной коррекционной программы во всех подразделениях школы.
Еще один популярный план с рандомизацией и контрольной группой — это план Соломона. План Соломона — это расширенный вариант плана RT1-2C, позволяющий проконтролировать и оценить эффекты естественного развития и фона, а также определить взаимодействие эффекта тестирования с основным воздействием X. Здесь наряду с экспериментальной и контрольной группами с предварительным тестированием используются экспериментальная и контрольная группы без предварительного тестирования (как в плане RTC). Схематически это выглядит следующим образом:
R
O1
X О2
R О3 О4
R X О5
R
Очевидно, что если главный эффект X реален, то даже при наличии существенного эффекта тестирования («хоуторнского эффекта») будут выполняться четыре неравенства: O2>O1; О2>О4; О5>О6; О5>О3. Оценкой сравнительной величины эффекта предварительного тестирования (без взаимодействия с X) может служить величина разности О6¾О3. Сравнение О6 с О1 и О3 позволяет оценить влияние фоновых факторов и факторов естественного развития.
До сих пор мы обсуждали содержательные аспекты проверки экспериментальной гипотезы о наличии главного эффекта X с помощью различных планов эксперимента, а также преимущества разных планов для обеспечения разных аспектов валидности. Очевидно, однако, что в каждом конкретном эксперименте величина главного эффекта, т. е. наблюдаемого различия результатов экспериментальной и контрольной группы, будет варьировать не только под воздействием независимой переменной, но и просто в результате действия различных случайных возмущений. Конечно, если бы наш эксперимент был идеален и абсолютно надежен (см. выше), то при каком угодно числе повторений мы бы всегда получали одну и ту же истинную оценку величины воздействия (при отсутствии или контроле смешивающего влияния дополнительных переменных). Однако реальные эксперименты — особенно, как уже говорилось, эксперименты в социальных науках — не бывают и не могут быть идеальными и безупречно надежными. Следовательно, перед исследователем всегда стоит задача статистической оценки значимости полученных результатов.
Вероятностным «воплощением» содержательной экспериментальной гипотезы является статистическая гипотеза. Принятие или непринятие статистической гипотезы — необходимое, но недостаточное условие принятия или отвержения содержательной гипотезы, проверяемой в эксперименте. Проверяемая в конкретном эксперименте статистическая гипотеза всегда формулируется как гипотеза о том, что при бесконечном количестве повторений этого эксперимента среднее различие между экспериментальной и контрольной группами (или между воздействием разных уровней независимой переменной) равнялось бы нулю. Такую статистическую гипотезу, фактически сводящуюся к утверждению о случайном характере наблюдаемых в реальном эксперименте различий, называют нулевой гипотезой, или нуль-гипотезой (Н0). Отвержение или неотвержение нуль-гипотезы позволяет говорить о том, что в данном эксперименте содержательная гипотеза подтвердилась, либо подтвердилась противоположная ей альтернативная гипотеза, либо не было получено подтверждения ни одной из них.