Понятие оперантного научения. Бихевиоризм Скиннера: определение теории оперантного обусловливания и основы поведенческой психологии

Оперантный бихевиоризм Б. Ф. Скиннера был подчинен главной задаче – предсказывать и контролировать поведение конкретных индивидов.

Основные положения теории Б. Ф. Скиннера:

Поведение можно достоверно определить, предсказать и проконтролировать условиями окружения. Понять поведение, значит, проконтролировать его и наоборот.

Не принял идею о личности или самости, которая стимулирует и направляет поведение.

Делал упор на интенсивном анализе характерных особенностей прошлого опыта человека и уникальных врожденных способностей.

Изучение личности включает в себя нахождение своеобразного характера взаимоотношений между поведением организма и результатами, подкрепляющими его.

Считал, что люди зависимы от прошлого опыта.

Б. Ф. Скиннер рассматривал организм человека как «черный ящик». Поведение является только функцией его последствий или правомерных отношений «S – R». Он рассматривал личность только как набор форм реакций, которые характерны для данного поведения. Личность индивида состоит из относительно сложных, но, тем не менее, независимо приобретенных реакций. Чтобы понять поведение, нужно только понять опыт прошлого научения человека.

В системе Б. Ф. Скиннера поведение состоит из специфических элементов – оперантных реакций . Он признавал два основных типа поведения:

респондентное как ответ на знакомый стимул,

оперантное , определяемое и контролируемое результатом, следующим за ним.

Оперантное обусловливание, по Б. Ф. Скиннеру, обозначает особый путь образования условных рефлексов, заключающийся в подкреплении спонтанно возникающей у субъекта реакции, а не стимула (в отличие от «классического» павловского пути). Подкрепление – ключевая концепция системы автора. Подкрепляющие стимулы можно разделить на стимулы первичные и вторичные. Первичные – сами по себе обладают подкрепляющими свойствами (например, пища, вода, комфорт). Вторичные стимулы (например, деньги, внимание, одобрение и пр.) – событие или объект, которые приобретают свойство осуществлять подкрепление посредством тесной ассоциации с первичным подкреплением.

Б. Ф. Скиннер не считал необходимым рассматривать внутренние силы или мотивационные состояния человека в качестве причинного фактора поведения, а сосредотачивался на взаимоотношениях между определенными явлениями окружения и открытым поведением. Он придерживался мнения, что личность - это не что иное, как определенные формы поведения, которые приобретаются посредством оперантного научения.

  • 6.1.1. Определение оперантного обусловливания
  • 6.1.2. Принципы оперантного обусловливания
  • 6.1.3. Режимы подкрепления
  • 6.1.4. Рост и развитие личности
  • 6.1.5. Психопатология
  • 6.1.6. Достоинства и недостатки теорий научения

Психологические понятия - научение, обучение, учение описывают широкий круг явлений, связанных с приобретением опыта, знаний, навыков, умений в процессе активного взаимоотношения субъекта с предметным и социальным миром - в поведении, деятельности, общении.

  • Когда речь идет о научении , то исследователь имеет в виду такие аспекты этого процесса как:
    • постепенность изменения;
    • роль упражнения;
    • специфику научения по сравнению с врожденными особенностями индивида.

Обычно термины обучение и учение обозначают процесс приобретения индивидуального опыта, а термин "научение" описывает и сам процесс , и его результат .
Итак, научение (обучение, учение) - процесс приобретения субъектом новых способов осуществления поведения и деятельности, их фиксации и/или модификации. Изменение психологических структур, которое происходит в результате этого процесса, обеспечивает возможность дальнейшего совершенствования деятельности.
Известны классические концепции научения. Это, например, учение И.П. Павлова (1849-1936) об образовании условных рефлексов. В результате одного или нескольких предъявлений индифферентного разграничителя (условного стимула) и следующего за ним безусловного стимула (пищи), который вызывает безусловную, врожденную реакцию (слюноотделение), индифферентный раздражитель сам начинает вызывать реакцию. В процессе установления временной связи безусловный стимул выполняет функцию подкрепления, условный - сигнальное значение, а рефлекс способствует адаптации организма к меняющимся условиям среды.
Впервые закономерности научения, установленные экспериментальными методами, были установлены в рамках бихевиоризма. Эти закономерности, или "законы обучения", сформулированы Э. Торндайком и дополнены, а также модифицированы К. Халлом, Э. Толменом и Э. Газри.

  • Ими являются:
    • Закон готовности : чем сильнее потребность, тем успешнее научение. Закон выводится на основе установления связи между потребностью и научением.
    • Закон эффекта : поведение, которое приводит к полезному действию, вызывает снижение потребности и поэтому будет повторяться.
    • Закон упражнения : при прочих равных условиях повторение определенного действия облегчает совершение поведения и приводит к более быстрому выполнению и снижению вероятности ошибок. Позже Торндайк показал, что не всегда упражнение, повторение способствует упрощению навыка, хотя при моторном научении это фактор является очень важным, способствуя модификации поведения.
    • Закон недавности : лучше заучивается тот материал, который предъявляется в конце серии. Этот закон противоречит эффекту первичности - тенденции к лучшему заучиванию материала, который предъявляется в начале процесса научения. Противоречие устраняется при формулировке закона "эффект края". U-образная зависимость степени заученности материала от его места в процессе научения отражает этот эффект и называется "позиционной кривой".
    • Закон соответствия : существует пропорциональное отношение между вероятностью ответа и вероятностью подкрепления.
  • Теперь обратимся к теориям научения в психологии личности.
    Теории исходят из двух положений:
  1. Всякое поведение усваивается в процессе научения.
  2. В целях соблюдения научной строгости при проверке гипотез необходимо соблюдать принцип объективности данных. В качестве переменных, которыми можно манипулировать, выбираются внешние причины (пищевое вознаграждение), в отличие от "внутренних" переменных в психодинамическом направлении (инстинкты, защитные механизмы, Я-концепция), которыми манипулировать нельзя.

В теориях научения (И.П. Павлов) приспособление рассматривается как аналог развития человека. Оно может осуществляется разными путями, например посредством классического обусловливания по Павлову.

  • При этом были исследованы важные феномены:
    • Генерализация - условная реакция на первоначально нейтральный стимул распространяется и на другие стимулы, похожие на условный раздражитель (страх, возникший на конкретную собаку, затем распространяется на всех собак).
    • Дифференцировка - специфичная реакция на похожие стимулы, которые различаются по степени подкрепления (например, дифференцировка реакций на круг и эллипс).
    • Угашение - разрушение связи между условным стимулом и реакцией, если он не сопровождается подкреплением.

Типичный эксперимент заключался в том, что собаку закрепляли ремнями, ограничивая ее движение, затем включали свет. Через 30 секунд, после того как зажигался свет, в рот собаки клали немного пищи, что вызывало слюноотделение. Сочетание включения света и пищи повторяли несколько раз. Через какое-то время свет, изначально выступавший индифферентным раздражителем, сам по себе начинал вызывать реакцию слюноотделения.
Аналогичным образом можно выработать условные оборонительные реакции на первоначально нейтральные стимулы. В первых исследованиях по оборонительному обусловливанию на собаку надевали специальную упряжь, чтобы удерживать ее в станке, а к лапе прикрепляли электроды. Подача электрического тока (безусловный раздражитель) на лапу вызывала отдергивание лапы (безусловный рефлекс), которое было рефлекторной реакцией животного. Если непосредственно перед ударом током несколько раз звонил звонок, то постепенно звук сам по себе был способен вызывать оборонительный рефлекс отдергивания лапы.
По терминологии И.П. Павлова, пища (или удар током) были безусловными раздражителями, а свет (или звук) - условным. Слюноотделение (или отдергивание лапы) при появлении пищи (или ударе током) были названо безусловным рефлексом, а слюноотделение на включение света (или отдергивание лапы на звук) - условным. Реакции, которые изучал Павлов, стали называть ответными, или респондентными, поскольку они автоматически возникали вслед за известными стимулами (пищей, ударом тока). Ведущим в модели И.П. Павлова является стимул, манипуляция которым приводит к возникновению новых форм поведения.
Итак, классическое обусловливание - это процесс, открытый И.П. Павловым, благодаря которому первоначально нейтральный стимул начинает вызывать реакцию из-за своей ассоциативной связи со стимулом, автоматически порождающим ту же самую или похожую реакцию.
Теория, разработанная Б.Ф. Скиннером (1904-1990), носит название теории оперантного обусловливания . Он говорил, что ученый, как и всякий другой организм, является продуктом уникальной истории. Поприще, которое он выберет для себя в качестве предпочтительного, частично будет зависеть от его личной биографии.
Интерес к формированию и модификации поведения возник у Скиннера после знакомства с работой И.П. Павлова "Условные рефлексы" и статьей (критической по своей направленности) Бертрана Рассела. Статьи последнего не только не оттолкнули от павловских идей, но, наоборот, усилили их влияние.
Скиннер ставил перед собой цель объяснить механизмы научения у человека и животных (крыс и голубей) на основе ограниченного набора базовых принципов. Основная идея состояла в том, чтобы управлять средой, контролировать ее, получая при этом упорядоченные изменения. Он говорил: "Проконтролируйте условия (среду), и вам откроется порядок".

Беррес Фредерик Скиннер был одним из самых известных психологов своего времени. Именно он стоял у истоков направления, которое сегодня в науке называется бихевиоризмом. Даже сегодня его теория научения играет важную роль в психологии, педагогике, менеджменте.

Эксперименты ученого

Теория Скиннера подробно изложена в одном из его основных трудов, который носит название «Поведение организмов». В нем ученый излагает принципы так называемого оперантного обусловливания. Проще всего понять эти принципы, рассмотрев один из наиболее типичных экспериментов ученого. Вес крысы снижали до 80-90 % от обычного. Она помещается в особое устройство, которое носит название скиннеровского ящика. В нем предоставлена возможность совершать только те действия, которые наблюдающий экспериментатор может видеть и контролировать.

У ящика имеется отверстие, через которое животному подается пища. Чтобы получить питание, крыса должна нажать на рычаг. Данное нажимание в теории Скиннера называется оперантной реакцией. Как крысе удается нажать на этот рычаг - посредством лапы, носа, а может быть, хвоста, - не имеет никакого значения. Оператная реакция в эксперименте остается той же, так как она вызывает лишь одно следствие: крыса получает еду. Поощряя животное пищей за определенное число нажиманий, исследователь формирует устойчивые способы реагирования у животного.

Формирование поведения по Скиннеру

Оператная реакция в теории Скиннера является произвольным и целенаправленным действием. Но Скиннер определяет эту целенаправленность в терминах обратной связи. Иными словами, на поведение воздействуют определенные последствия животного.

Скиннер был согласен со взглядами ученых Уотсона и Торнадайка на двоякую природу психического развития. Они считали, что на формирование психики оказывают влияние два типа факторов - социальные и генетические. При оперантном обучении подкрепляются особые операции, которые совершаются субъектом. Иными словами, генетические данные выступают основой, на которой выстраивается социально обусловленное поведение. Поэтому развитие, полагал Скиннер, представляет собой научение, обусловленное определенными стимулами внешней среды.

Скиннер также считал, что может использоваться не только для осуществления контроля за поведением других субъектов, но и в отношении собственного поведения. Самоконтроля можно добиться посредством создания особых условий, в которых желательное поведение будет подкрепляться.

Положительное подкрепление

Оперантное научение в теории подкрепления Скиннера базируется на активных действиях субъекта («операциях»), осуществляемых в определенной среде. Если некое спонтанное действие становится полезным для восполнения определенной потребности или достижения цели, оно подкрепляется позитивным результатом. Например, голубь может научиться комплексному действию - игре в пинг-понг. Но только в том случае, если эта игра становится средством получить пищу. Поощрение в теории Скиннера получило название подкрепления, поскольку именно оно подкрепляет наиболее желаемое поведение.

Последовательное и пропорциональное подкрепление

Но голубь не может научиться игре в пинг-понг, если экспериментатор не будет формировать у него данное поведение путем дискриминационного научения. Это означает что отдельные действия голубя подкрепляются ученым последовательно, избирательно. В теории Б. Ф. Скиннера подкрепление может быть или распределенным случайно, происходя через определенные временные промежутки, или происходить в определенных пропорциях. Поощрение, распределенное случайно в виде периодических денежных выигрышей, провоцирует у людей развитие игровой зависимости. Поощрение, которое происходит через определенные интервалы времени - зарплата - способствует тому, что человек остается на определенной службе.

Пропорциональное поощрение в теории Скиннера представляет собой настолько мощное подкрепление, что животные в его экспериментах практически загоняли себя до смерти, пытаясь заработать побольше вкусной пищи. В отличие от подкрепления поведения, наказание является отрицательным подкреплением. С помощью наказания невозможно научить новой поведенческой модели. Оно только заставляет субъекта постоянно избегать известных операций, за которыми следует наказание.

Наказание

Применение наказания, как правило, имеет негативные побочные эффекты. В теории научения Скиннера обозначены следующие следствия наказания: высокий уровень тревожности, недоброжелательность и агрессивность, уход в себя. Иногда наказание вынуждает индивида прекратить вести себя определенным образом. Но его недостаток заключается в том, что оно не способствует формированию положительного поведения.

Наказание нередко вынуждает субъекта не отказаться от нежелательной модели поведения, а только лишь трансформировать его в скрытую форму, которая не подвергается наказанию (например, это может быть распитие спиртных напитков на работе). Разумеется, есть немало случаев, когда наказание представляется единственным методом подавления социально опасного поведения, которое угрожает жизни или здоровью других людей. Но в обычных ситуациях наказание является малоэффективным средством воздействия, и его необходимо по возможности избегать.

Плюсы и минусы теории оперантного обучения Скиннера

Рассмотрим основные достоинства и недостатки концепции Скиннера. Ее плюсы заключаются в следующем:

  • Строгая проверка гипотез, контроль дополнительных факторов, влияющих на эксперимент.
  • Признание важности ситуативных факторов, параметров внешней среды.
  • Прагматический подход, который позволил создать эффективные психотерапевтические процедуры для преобразования поведения.

Минусы теории Скиннера:

  • Редукционизм. Поведение, демонстрируемое животными, полностью сводится к анализу поведения человека.
  • Низкая валидность по причине проведения опытов в лабораторных условиях. Результаты экспериментов сложно перенести в условия естественной среды.
  • Не уделяется внимание когнитивным процессам в процессе формирования определенного вида поведения.
  • Теория Скиннера не дает стабильных, устойчивых результатов на практике.

Концепция мотивации

Скиннером была также создана и теория мотивации. Ее основная идея заключается в том, что стремление повторить то или иное действие обусловлено последствиями данного действия в прошлом. Наличие определенных стимулов вызывает определенные действия. Если последствия того или иного поведения являются положительными, то субъект будет вести себя в подобной ситуации в будущем аналогично.

Его поведение повторится. Но если последствия определенной стратегии отрицательны, то в будущем он или не будет реагировать на определенные стимулы либо поменяет стратегию. Теория мотивации Скиннера сводится к тому, что многократные повторения определенных результатов приводят к формированию у субъекта конкретной поведенческой установки.

Личность и концепция научения

С точки зрения Скиннера, личность представляет собой тот опыт, который приобретается индивидом в течение жизни. В отличие, к примеру, от Фрейда, сторонники концепции научения не считают необходимым задумываться над психическими процессами, которые скрываются в разуме человека. Личность в теории Скиннера - это продукт, по большей части сформированный внешними факторами. Именно социальное окружение, а не явления внутренней психической жизни, определяют личностные особенности. Человеческую психику Скиннер считал «черным ящиком». Невозможно детально исследовать эмоции, мотивы и инстинкты. Поэтому их необходимо исключить из наблюдений экспериментатора.

Теория оперантного научения Скиннера, над которой ученый работал в течение многих лет, должна была подытоживать его обширные исследования: все, что делает человек, и чем он является в принципе, определено историей полученных им наград и наказаний.

"Культура - это хитроумное сплетение подкреплений"

(Б. Скиннер)

1. Структурная единица и стимульные события оперантного поведения.

2. Законны оперантного обусловливания, по Э.Торндайку.

3. Подкрепляющее и аверсивное поведение в Скиннеровском подходе.

4. Контроль обусловливания и угасания оперантного поведения.

Если респондентное поведение, возникающее на основе классического обусловливания (И.П. Павлов, Дж. Уотсон) называется обусловливанием типа S, то ключевой ​структурной единицей скиннеровского​​ подхода является реакция . Реакции можно ранжировать от простых рефлекторных (например, слюноотделение на пищу, вздрагивание на громкий звук) до сложного паттерна поведения (например, решение математической задачи, скрытые формы агрессии). Реакция – это внешняя, наблюдаемую часть поведения, которую можно связать с событиями окружающей среды .

Теория инструментального, или О. о. связана с именами Торндайка (Thorndike E. L.) и Скиннера (Skinner В. F.). В отличие от принципа классического обусловливания (S->R), они разработали принцип О. о. (R->S), согласно которому поведение контролируется его результатами и последствиями. Основной путь воздействия на поведение, исходя из этой формулы, - влияние на его результаты.

Для различения стимула классического условного рефлекса и стимула инструментального условного рефлекса Скиннер предложил обозначать первый как Sd (дискриминантный стимул), а второй - Sr (pecпондентный стимул). Sd - стимул, по времени предшествующий определенной поведенческой реакции, поэтому взят термин лат. discriminatio «ущемление», то есть предвзятость, насилие. Sr - то есть сообщающий стимул, подкрепляющий определенную поведенческую реакцию и по времени следующий за ней.

Хотя в повседневной жизни эти стимулы часто совмещены в одном объекте, они могут быть разделены путем анализа с целью систематизации и определения последовательности мер воздействия на модифицируемое поведение. При использовании оперантных методов управление результатами поведения осуществляется для воздействия на само поведение. Поэтому здесь очень важен этап функционального анализа или поведенческой диагностики. Задача этого этапа состоит в определении подкрепляющей значимости окружающих пациента объектов, установлении иерархии их подкрепляющей силы.

Сущность процесса научения – это установление связей (ассоциаций) реакций с событиями внешней среды.

В своем подходе к научению Б.Ф. Скиннер проводил различие между реакциями, которые вызываются четко определенными стимулами (например, мигательный рефлекс в ответ на дуновение воздуха), и реакциями, которые нельзя связать ни с одним стимулом . Эти реакции второго типа порождаются самим организмом и называются оперантами .

Другой отличительной особенностью теории Б.Ф. Скиннера была идея о том, что на поведение воздействуют стимульные события , которые наступят после него, а именно - его последствия. Так как этот тип поведения предполагает, что организм активно воздействует на окружение с целью изменить события каким-то образом, Б.Ф. Скиннер определил его как оперантное поведение. Он также называл его обусловливание типа R, чтобы подчеркнуть

воздействие реакции на будущее поведение.

2. Законны оперантного обусловливания Э.Торндайка.

На научные воззрения Б.Ф. Скиннера большое влияние оказали экспериментальные работы, выполненные Э.Л. Торндайком, яразработавшим объективную, механистическую теорию научения, в которой основное влияние уделялось внешнему поведению.

В результате проведенных исследований Э.Л Торндайк (T.L. Thomdike, 1905) обобщил в нескольких законах:

Закон эффекта: любое действие, вызывающее в данной ситуации удовлетворение, ассоциируется с данной ситуацией, так что, когда она возникает вновь , появление этого действия становится более вероятным, чем прежде. Напротив, любое действие, вызывающее дискомфорт, отделяется от данной ситуации, так что, когда он возникает вновь, появление этого действия становится менее вероятным любое действие, вызывающее удовлетворение, ассоциируется с данной ситуацией, так что, когда она возникает вновь, появление этого действия становится более вероятным, чем прежде. Позднее Э.Л. Торндайк провел исследование закона эффекта в рамках экспериментов, в которых в качестве испытуемых привлекались люди. Результаты исследований показали, что поощрение реакции действительно приводит к ее укреплению, но наказание не дает очевидного негативного результата для проведения параллели. Это побудило Э.Л. Торндайка пересмотреть закон эффекта, чтобы сделать больший акцент на поощрении, нежели на наказании.

Закон упражнения : согласно этому закону утверждается, что в каждой конкретной ситуации любая реакция начинает ассоциироваться с этой ситуацией. Чем чаще реакция проявляется в той или иной ситуации, тем теснее становится ассоциативная связь. И напротив, если реакция в течение длительного времени не практикуется, то ассоциативная связь ослабевает. Иначе говоря, повторение ответной реакции в конкретной ситуации приводит к ее усилению. Более поздние исследования убедили Э.Л. Торндайка в том, что благоприятные последствия реакции (то есть ситуация, которая приносит удовлетворение) являются более эффективными, чем простое многократное повторение.

Закон готовности - упражнения изменяют готовность организма к проведению нервных импульсов.

Закон ассоциативного сдвига - если при одновременном действии раздражителей один из них вызывает реакцию, то другие приобретают способность вызывать ту же самую реакцию.

3. Подкрепляющее и аверсивное поведение в Скиннеровском подходе

Добивается улучшения производственных показателей через модификацию поведения персонала. Внешне она выглядит как манипулирование личностью. Люди повторяют поведение, которое приносило удовлетворение, и избегают поведения, которое доставляло им неприятности. У любого действия или поведения есть последствия - негативные (их в будущем станут избегать) и позитивные (их станут повторять).

Теория Скиннера предлагает такие способы модификации поведения (например, персонала), как положительное и отрицательное подкрепление, гашение и наказание.

Подкрепление - воздействие с помощью стимулов на текущее поведение людей.

Суть положительного подкрепления состоит в том, что поощряются действия, имеющие позитивную направленность, например, творческое отношение к работе.

При отрицательном подкреплении поощряется отсутствие действий с негативной направленностью, например прогулов.

Отмена ношения Пенджабов на рабочих местах в Эмиратах была вызвана прогулами сотрудниц в закрывающих лицо культовых одеждах. В данном случае, модификация поведения мусульманок контролируется аверсивным стимулом, cледующим сразу за нежелательным поведением.

На поведение сотрудников можно и не обращать внимания. Тогда происходит так называемое гашение , когда при отсутствии подкрепления отрицательных или положительных действий они сами по себе затухают.

Наконец, наказанием является прямое воздействие на человека, направленное на пресечение негативных действий, недопущение их в будущем. Оно может иметь вид материального взыскания (штрафы, санкции), снижения социального статуса в коллективе, понижения в должности и т.п.

Наблюдая за процессом оперантного обусловливания,

Б.Ф. Скиннер, как и Толмен, приходит к выводу о том, что стимулы окружающей среды (СОС) не принуждают организм вести себя определенным образом и не побуждают его действовать. Исходная причина поведения находится в самом организме (О у Толмена). Б.Ф. Скиннер писал: «Не существует внешнего побуждающего стимула к оперантному поведению, оно просто происходит, осуществляется. С точки зрения теории оперантного обусловливания операнты порождаются организмом. Собака идет, бежит, «возится» с кем-то; птица летит; обезьяна прыгает с дерева на дерево; человеческий детеныш лепечет. В любом случае поведение происходит без воздействия какого-то специального побуждающего стимула... С. М. Соловьев первым описал истинную историю немотивированного вызова на дуэль Пушкиным Дантеса. Оказывается, уже после ранения Великий поэт с неистовой яростью недрожащей рукой смог воспроизвести выстрел в противника, став, таким образом, causa sai, причиной в себе своей смерти. При этом, отец 4-х детей не подумал об их будущем, а также жене, оставленной с 90-тысячным долгом. Это зависимость, не от внешних обстоятельств и врагов (царь, барон Геккерн , Дантес), но от собственного гнева.

Производить оперантное поведение – заложено в биологической природе организма» . История с Пенджабом иллюстрирует непосредственно данную биологическую свободу человека по отношению ко всякому контролю. "Не заменит ветку золотая клетка".

Оперантное поведение (вызванное оперантным научением) определяется событиями, которые следуют за реакцией. То есть за поведением идет следствие, и природа этого следствия изменяет тенденцию организма повторять данное поведение в будущем. Например, катание на роликовой доске, игра на фортепиано, метание дротиков и написание собственного имени - это образцы оперантной реакции, или операнты, контролируемые результатами, следующими за соответствующим поведением. Это произвольные приобретенные реакции, для которых не существует стимула, поддающегося распознаванию . Б. Скиннер говорил, что бессмысленно рассуждать о происхождении оперантного поведения, так как нам неизвестны стимул или внутренняя причина, ответственная за его появление. Оно происходит спонтанно . Если последствия благоприятны для организма, тогда вероятность повторения операнта в будущем усиливается. Когда это происходит, говорят, что последствия подкрепляются, и оперантные реакции, полученные в результате подкрепления (в смысле высокой вероятности его появления) обусловились: R < S. Сила позитивного подкрепляющего стимула таким образом определяется в соответствии с его воздействием на последующую частоту реакций, которые непосредственно предшествовали ему .

И напротив, если последствия реакции не благоприятны и не подкреплены, тогда вероятность получить оперант уменьшается. Б.Ф. Скиннер полагал, что, аверсивное поведение контролируется негативными последствиями. По определению, негативные, или аверсивные (неприятные) последствия ослабляют поведение , порождающее их, и усиливают поведение, устраняющее их. Так, культурное поведение, подверженное Sd, по сути, аверсивное, ущемленное, контролируемое "хитросплетениями авторитарных вводных". АВЕРСИВНЫЙ СТИМУЛ - Любой стимул, имеющий вредные свойства. Это обычно выявляется операционально. Событие или физическое ощущение, которое человек считает неприятным и воспринимает как наказание включается в программу МОДИФИКАЦИИ ПОВЕДЕНИЯ, строящейся на том, что аверсивный стимул непосредственно следует за нежелательным поведением, которое психотерапевт или социальный работник желает устранить. В прошлом такие стимулы включали электрошок, вдыхание паров аммиака, употребление лимонного сока(?). Современные бихевиористы ратуют за естественные раздражители, в частности выражение неодобрения, вообще не используют аверсивные стимулы как манипулятивные и непродуктивные, разрабатывая альтернативные программы в процессе сотрудничества со своими клиентами и их семьями. Аверсивное поведение отрабатывается только в связи экстримальными условиями научения. Так, Стэ́нфордский тюре́мный экспериме́нт - психологический эксперимент, который был проведён в 1971 году американским психологом Филиппом Зимбардо. Эксперимент представляет собой психологическое исследование реакции человека на ограничение свободы, на условия тюремной жизни и на влияние навязанной социальной роли на поведение.

Добровольцы играли роли охранников и заключенных и жили в условной тюрьме, устроенной в подвале факультета психологии. Заключенные и охранники быстро приспособились к своим ролям, и, вопреки ожиданиям, стали возникать по-настоящему опасные ситуации. В каждом третьем охраннике обнаружились садистские наклонности, а заключенные были сильно морально травмированы и двое раньше времени были исключены из эксперимента. Эксперимент был закончен раньше времени.

Согласно радикальной точке зрения профессора, возможно объяснить и контролировать любое поведение человека. Несмотря на интерес к наукам, Скиннер никак не мог вписаться в студенческую жизнь. Как он признавался позднее, больше всего его раздражали спорт и обязательное посещение церкви. Не отличавшегося крупным телосложением студента прессинговали в хоккее и баскетболе и сгоняли вместе со стадом одногруппников в церковь по выходным. Видимо, именно тогда, прочитав ещё и Дарвина с Павловым, Скиннер уверовал, что люди ничем не отличаются от животных.

4. Изучение обусловливания и угасания оперантного поведения

Б.Ф. Скиннер считал, что оперантное поведение характерно для повседневного научения. Поскольку поведение, как правило, носит оперантный характер, то наиболее эффективным подходом к науке о научении является изучение обусловливания и угасания оперантного поведения.

Для того чтобы изучать оперантное поведение в лаборатории, Б.Ф. Скиннер придумал простую процедуру, названную свободным оперантным методом. Классическая экспериментальная демонстрация заключалась в нажатии на рычаг в скиннеровском ящике, или, как его называл сам автор, аппарате оперантного формирования условных рефлексов.

В эксперименте крыса, лишенная пищи, помещалась в ящик и получала полную возможность исследовать его. Сначала крыса демонстрировала множество оперантов: ходила, принюхивалась, почесывалась, чистила себя и мочилась. Такие реакции не вызывались никаким узнаваемым стимулом; они были спонтанны. В ходе исследований она неизбежно должна была задеть рычажок (педаль), который приводил в действие механизм, выдвигающий полочку с пищей. Так как реакция нажатия рычага первоначально имела низкую вероятность возникновения, ее следует считать чисто случайной по отношению к питанию; то есть нельзя предсказать, когда крыса будет нажимать на рычаг, и невозможно заставить ее делать это. После получения нескольких порций пищи, которые должны были служить подкреплением, у крысы довольно быстро формировался условный рефлекс. Следует обратить внимание, что поведение крысы (нажатие на рычаг) оказывает независимое воздействие па окружающую среду и является инструментом приобретения пищи, то есть приобретет, в конце концов, высокую вероятность проявления в такой особой ситуации. Зависимая переменная в этом эксперименте проста и понятна: это скорость реакции.

Оказывается, «Скиннеровский ящик» испытали на себе не только крысы, но и его создатель! Скиннер спал в подвале собственного дома в жёлтом пластиковом контейнере (почти бочка Диогена), соблюдая строгий режим дня и установив сам для себя «контролируемую среду». Положительным подкреплением для него была музыка и написание статей.

Помимо основного научного труда «Поведение организмов» Скиннер успел написать и издать по итогам своего «кризиса среднего возраста» художественный роман-утопию «Уолден-два» о жизни сельской общины по законам бихевиоризма. «Многое в жизни Уолден Два взято из собственной жизни, - признавался Скиннер.

Скиннер старался быть не только писателем-«инженером душ», но и активным социальным инженером, например, обучая людей с помощью специально созданных программ. Результаты исследований результативности различных способов воздействия:

поощрение улучшает работу в 89% случаев;

наказание улучшает работу в 11% случаев;

наказание ухудшает работу в 11% случаев;

угрозы на 99% игнорируются.

Идеи Скиннера вполне пришлись по душе ученикам и студентам, ведь по мысли Скиннера доля неправильных ответов при работе с тестами не должна превышать 5%, чтобы не пропадало положительное подкрепление.

Если говоришь ребенку 2- лет "это нельзя", он ответит "льзя-льзя". А ты после того, как что-либо нельзя, тут же скажи, что можно!!! Все гениальное просто!

Концепция «программированного обучения», оказала влияние… на создание многочисленных компьютерных игр и симуляторов. Ведь получение нового уровня или награды - ничто иное, как виртуальный «корм», ещё глубже затягивающий в игру.

Б.Ф. Скиннер

Оперантное поведение

Рефлексы, как условные, так и всякие другие, главным образом связаны с внутренними физиологическими процессами в организме. Однако чаще всего нас интересует такое поведение, которое имеет определенное воздействие на окружающий мир. Оно возникает в результате столкновения человека с необходимостью решать задачи, выдвигаемые жизнью. Кроме того, его специфические характеристики также представляют интерес для теории. Последствия поведения могут играть роль обратной связи для организма. В этом случае они изменяют вероятность осуществления поведения, породившего их. В английском языке много слов, имеющих отношение к данному эффекту, например «поощрение» и «наказание», но ясное представление о нем мы можем получить только в результате проведения эксперимента.

КРИВЫЕ НАУЧЕНИЯ

В 1898 г. Э. Л. Торндайком была предпринята одна из первых серьезных попыток изучить изменения, обусловливаемые последствиями поведения. Его эксперименты возникли на основе дискуссии, которая впоследствии заинтересовала многих ученых. Ч. Дарвин, настаивавший на преемственности видов, подверг сомнению уникальность человека и его способность думать. В печати распространилось большое количество анекдотов, в которых говорилось о проявлении животными «силы разума». Но распространение особенностей, ранее характеризующих только поведение человека на поведение животных, привело к постановке новых вопросов. Указывали ли наблюдаемые факты на психические процессы или эти очевидные проявления мышления могут быть объяснены иначе? В конце концов отпала необходимость в представлении о внутренних мыслительных процессах. Должно было пройти много лет, прежде чем тот самый вопрос о специфичности поведения человека не возник вновь, но эксперименты Торндайка и его» объяснение мышления (reasoning) животных явились важным шагом в этом направлении.

Если кошка помещается в ящик, из которого она может выбраться, открыв задвижку, она может проявить много видов поведения, некоторые из которых могут оказаться эффективными. Торндайк установил,. что при многоразовом помещении кошки в ящик успешное поведение наступало все быстрее и быстрее, и это продолжалось до тех пор, пока оно не стало предельно простым и быстрым. Кошка решала свою задачу, как разумное человеческое существо, хотя, возможно, и не так быстро. Однако Торндайк не видел за этим «мыслительных процессов» и утверждал, что они ненужны для объяснения. Он описал свои результаты, указав на то, что поведение кошки было «запечатлено» (stamped in), поскольку оно сопровождалось открытием двери.

Тот факт, что поведение запечатлевается или сопровождается определенными последствиями, Торндайк назвал «законом эффекта». В своих экспериментах. он установил, что в рамках одной и той же ситуации определенное поведение протекает все более и более стабильно в отличие от других поведенческих проявлений. Фиксируя промежутки времени, которые требовались кошке для того, чтобы выбраться из ящика, он построил «кривую научения». Эта ранняя попытка описать поведенческий процесс количественно, аналогично описанию физических и биологических процессов, рассматривалась как важный шаг вперед. Он раскрыл процесс, который развертывался в течение длительного времени и который был доступен для наблюдения. Итак, Торндайк сделал открытие. С тех пор было получено много кривых, которые легли в основу многих психологических работ, посвященных научению.

Однако кривые научения не описывают сущность запечатления. Критерий Торндайка - время, необходимое животному для того, чтобы выбраться из клетки, - был связан с устранением других видов поведения, и его кривая зависела от ряда различных действий, которые могла выполнять кошка в определенном ящике. Форма кривой также зависела от поведения, которое было «успешным», и от того, был ли это редкий или обычный способ поведения в данном ящике. Можно сказать, что кривая научения, построенная таким образом, отражает свойства ящика с задвижкой, а не поведение кошки. Это положение распространяется на многие другие устройства, разработанные для изучения научения. Различные лабиринты, через которые белые крысы и другие животные учатся проходить, «ящики выбора», в которых животные научаются различать свойства, или паттерны стимулов, аппараты, посредством которых представляется последовательность стимулов, подлежащих усвоению при изучении памяти человека, - все они порождают различные кривые научения.

Усредняя многие показатели индивидов, мы можем сгладить эти кривые настолько, насколько хотим. Более того, кривые, полученные в различных условиях, могут иметь определенные общие свойства. Например, при измерении данным способом научение обычно «имеет негативную характеристику убыстрения» - улучшение выполнения наступает все более и более медленно до тех пор, пока оно вовсе не прекращается. Однако из этого не следует, что негативная акселерация характеризует сущность процесса. Предположим по аналогии, что мы наполнили стеклянный сосуд песком и так его перемешали, что песчинки одного и того же размера равномерно распределились внутри него. Если мы слегка встряхнем сосуд, то песчинки перераспределяются. Большие песчинки окажутся наверху, маленькие - внизу. Этот процесс также характеризуется негативной акселерацией. Сначала смесь перераспределяется быстро, но по мере приближения к его завершению процессы в распределении наступают реже и реже. Такая кривая может оказаться совершенно ровной и воспроизводимой, но один лишь этот факт не имеет большого значения. Кривая зависит от определенных процессов взаимодействия песчинок различного размера, от силы сотрясения, сосуда и т. д., но в то же самое время она прямо не отражает сами эти процессы.

Кривые научения показывают, как различные виды поведения, порождаемые в сложных ситуациях, отбираются, закрепляются и реорганизуются. Базисный: процесс запечатления отдельного акта осуществляет это изменение, но в самом изменении он прямо не отражен.

ОПЕРАНТНОЕ ОБУСЛОВЛИВАНИЕ

Для понимания сущности закона эффекта Торндайка нам необходимо дать четкое определение понятия «вероятность реакции». Это очень важное понятие, но, к сожалению, очень трудное. При обсуждении поведения человека мы часто апеллируем к тенденциям «расположенности» вести себя определенным образом. Почти в каждой теории поведения используются такие термины, как «потенциал возбуждения», «сила привычки» или «детерминирующая тенденция». Но как мы наблюдаем тенденцию? И как можно ее замерить?