Теория оперантного научения» Б.Ф. Скиннера

В основании теории оперантного обусловливания Скиннера лежит тот простой факт, что не всегда действия живого существа являются реакцией на ту или иную комбинацию внешних воздействий - стимулов. Довольно часто (по мнению Скиннера , в большинстве случаев) поведение выглядит так, как будто бы ему не предшествуют никакие видимые стимулы. В знаменитых опытах Скиннера лабораторная крыса помещалась в пустой ящик с педалью внутри (так называемый "ящик Скиннера ") и получала полную свободу действий. В процессе хаотичного исследования ящика крыса неизбежно задевала педаль и получала порцию пищи. После нескольких случайных нажатий на педаль у крысы формировалась новая форма поведения, которая не была связана ни с какими предшествующими стимулами. Теперь, проголодавшись, крыса целенаправлено следовала к педали и, нажав на нее - получала желаемое. Таким образом, ключевое отличие оперантного обусловливания от классического состоит в том, что в случае оперантного обусловливания живой организм своим поведением активно воздействует на окружающую среду и сталкивается с теми или иными последствиями. В случае формирования условного рефлекса такого воздействия не наблюдается. Животные в опытах Павлова были специально, в целях соблюдения чистоты эксперимента, лишены какой-либо возможности влиять на окружение. В этом смысле оперантное поведение активно и направлено на исследование окружающего мира, респондентное поведение реактивно и лишь следует тем или иным воздействиям, в процессе классического обусловливания, приобретшим для организма определенное сигнальное воздействие. Но сама по себе исследовательская активность ничего не дает - она лишь увеличивает шансы встретить те или иные последствия. То, каким образом видоизменяется поведение, зависит в первую очередь от характера последствий - от того, будут эти последствия приятными или неприятными. Приятные последствия Скиннера называл "подкреплением". Экспериментируя с разными типами подкрепления, Скиннер вывел одну бесспорную и всегда воспроизводимую закономерность: образцы поведения (операнты), вслед за которыми следуют приятные последствия, в будущем встречаются чаще. Крыса чаще нажимает на педаль, если непосредственно вслед за этим действием она получает кусочек пищи. Голубь, помещенный в клетку, на полу которой имеется красное пятно, лишь случайным образом может клюнуть в него. Но если сразу вслед за этим он получит пищу - зернышко, то этот оперант (действие в расчете на успех) будет чаще встречаться в будущем. Человек, которого вкусно накормят в одном из ресторанов города, будет чаще ходить в этот ресторан, даже если он довольно далеко расположен от дома. Эту закономерность Скиннер назвал "законом выгоды (приобретения)", иногда его еще называют первым законом оперантного научения . Закон приобретения означал для Скиннера и его последователей следующее: если перед терапевтом или учителем встает задача сформировать новые привычки, новые образцы поведения, то единственный способ, который дает предсказуемые и надежные результаты, состоит в том, что мы специально создаем позитивные последствия для так называемого "целевого" поведения, т.е. поведения, с которым мы бы хотели чаще встречаться впредь. Подкрепляя это поведение, мы обязательно добьемся своего: это поведение будет встречаться чаще.

Введение

Основной постулат теории научения состоит в том, что почти всякое поведение усваивается в результате научения. Например, любая психопатология понимается как усвоение неадаптивного поведения или как неудача при усвоении адаптивного поведения. Вместо того чтобы говорить о психотерапии, сторонники теорий научения говорят о модификации поведения и о поведенческой терапии. Нужно модифицировать или изменять конкретные действия, вместо того чтобы разрешать внутренние конфликты, лежащие в основе этих действий, или реорганизовывать личность. Так как большинство видов проблемного поведения было когда-то усвоено, от них можно отказаться или как-то их изменить, используя специальные процедуры, основанные на законах обучения.

Еще более существенной чертой этих подходов является ориентация на объективность и научную строгость, на проверяемость гипотез и экспериментальный контроль переменных.

Сторонники теории научения манипулируют параметрами внешней среды и наблюдают последствия этих манипуляций в поведении. Теории научения иногда называют психологией S-R (стимула - реакции ).

Научение - (обучение, учение) - процесс приобретения субъектом новых способов осуществления поведения и деятельности, их фиксации и/или модификации. Изменение психологических структур, которое происходит в результате этого процесса, обеспечивает возможность дальнейшего совершенствования деятельности.

Теории научения в психологии исходят из двух основных положений:

  • - Всякое поведение усваивается в процессе научения.
  • - В целях соблюдения научной строгости при проверке гипотез необходимо соблюдать принцип объективности данных. В качестве переменных, которыми можно манипулировать, выбираются внешние причины (пищевое вознаграждение), в отличие от "внутренних" переменных в психодинамическом направлении (инстинкты, защитные механизмы, Я-концепция), которыми манипулировать нельзя.

К закономерностям научения относятся:

  • - Закон готовности: чем сильнее потребность, тем успешнее научение.
  • - Закон эффекта: поведение, которое приводит к полезному действию, вызывает снижение потребности и поэтому будет повторяться.
  • - Закон упражнения: при прочих равных условиях повторение определенного действия облегчает совершение поведения и приводит к более быстрому выполнению и снижению вероятности ошибок.
  • - Закон недавности: лучше заучивается тот материал, который предъявляется в конце серии. Этот закон противоречит эффекту первичности - тенденции к лучшему заучиванию материала, который предъявляется в начале процесса научения. Противоречие устраняется при формулировке закона "эффект края". U-образная зависимость степени заученности материала от его места в процессе научения отражает этот эффект и называется "позиционной кривой".
  • - Закон соответствия: существует пропорциональное отношение между вероятностью ответа и вероятностью подкрепления.

Существуют три основные теории научения:

  • - теория классического обусловливания И.П. Павлова;
  • - теория оперантного обусловливания Б.Ф. Скиннера;
  • - теория социального научения А. Бандуры.

Теория классического обусловливания берет свое начало с учения И.П. Павлова (1849-1936) об образовании условных рефлексов. Иван Петрович Павлов (1849-1936) был русским физиологом, который в ходе своих исследований процесса пищеварения разработал метод изучения поведения и принципы научения, оказавшие глубокое воздействие на всю психологическую науку.

В конце XIX - начале XX в. Павлов занимался исследованием секреции желудочного сока у собак. В ходе этих экспериментов он, среди прочего, вкладывал некоторое количество корма в пасть собаки и измерял, сколько слюны выделяется в результате. Случайно он обратил внимание на то, что после нескольких таких опытов собака начинает выделять слюну на определенные стимулы еще до того, как пища попадает ей в рот. Слюноотделение "происходило в ответ на такие сигналы, как появление миски с едой или появление человека, который обычно приносил пищу. Другими словами, стимулы, которые первоначально не приводили к данной реакции (так называемые нейтральные стимулы), затем могли вызывать слюноотделение из-за того, что ассоциировались с кормом, который автоматически заставлял собаку выделять слюну. Это наблюдение натолкнуло Павлова на идею проведения выдающихся исследований, в результате которых был открыт процесс, получивший название процесса выработки классического условного рефлекса, или процесса классического обусловливания.

Принципы классического обусловливания. И.П. Павлов первым открыл, что респондентное поведение может быть классически обусловленным. Суть процесса классического обусловливания состоит в том что изначально нейтральный стимул начинает вызывать реакцию благодаря своей ассоциативной связи со стимулом, который автоматически (безусловно) порождает такую же или очень похожую реакцию.

Иначе говоря, еда, в случае с собакой, рассматривается как безусловный стимул (БС), а слюноотделение - как безусловная реакция или безусловный рефлекс (БР). Это происходит потому, что слюноотделение - автоматическая, рефлекторная реакция на пищу. Нейтральный стимул - например, звонок - не вызовет слюноотделения. Однако если в ряде опытов непосредственно перед предложением пищи звонит звонок, то его звук сам по себе, без следующего за ним появления пищи может вызвать реакцию слюноотделения. В этом случае речь идет о процессе обусловливания, так как слюноотделения происходит вслед за звонком без предъявления пищи. В этом смысле звонок можно отнести к условным стимулам (УС) а слюно отделение - к условным реакциям, или условным рефлексам (УР).

На основании вышеизложенного можно сказать, что основная схема условного рефлекса И.П. Павлова S - > R, где S - стимул R реакция Из данной схемы видно, что основной путь управления ведением - это управление предъявлением стимулов, вызывающий определенную реакцию, внешним окружением, контроль над ним Организуя определенным образом окружение, вырабатывая условные рефлексы, можно формировать определенное поведение у человека.

Элементами классического обусловливания при этом являются - безусловный стимул (БС), безусловная реакция (БР), условный стимул (УС) и условная реакция (УР).

И.П. Павлов показал, что формирование условного рефлекса подчиняется ряду требований:

  • - важнейшим из них является смежность (совпадение по времени индифферентного и безусловного раздражителей, с некоторым опережением индифферентного раздражителя);
  • - не менее важным условием является повторение (многократное сочетание индифферентного и безусловного раздражителей).

Несмотря на то, что вначале Павлов проводил экперименты на животных, другие исследователи начали изучать основные процессы классического обусловливания на людях.

Теория оперантного обусловливания связана с именами Эдварда Ли Торндайка (E. L. Thorndike) и Берреса Скиннера (B. F. Skinner). В отличие от принципа классического обусловливания (S->R), они разработали принцип оперантного обусловливания (R->S), согласно которому поведение контролируется его результатами и последствиями. Основной путь воздействия на поведение, исходя из этой формулы, - влияние на его результаты.

теория научение условный рефлекс

Как уже и говорилось ранее, респондентное поведение - это версия Б.Ф. Скиннера павловского представления о поведении, которое он называл обусловливанием типа S, чтобы подчеркнуть важность стимула, который появляется до реакции и выявляет ее. Однако Скиннер полагал, что в целом поведение животных и человека нельзя объяснять в терминах классического обусловливания. Скиннер делал акцент на поведении, не связанном с какими-либо известными стимулами. Он утверждал, что в основном на ваше поведение воздействуют стимульные события, которые наступят после него, а именно - его последствия. Так как этот тип поведения предполагает, что организм активно воздействует на окружение с целью изменить события каким-то образом, Скиннер определил его как оперантное поведение. Он также называл его обусловливание типа Я., чтобы подчеркнуть воздействие реакции на будущее поведение.

Итак, ключевая структурная единица бихевиористского подхода в целом и скиннеровского подхода в особенности - это реакция. Реакции можно ранжировать от простых рефлекторных реакций (например, слюноотделение на пищу, вздрагивание на громкий звук) до сложного паттерна поведения (например, решение математической задачи, скрытые формы агрессии).

Реакция - это внешняя, наблюдаемая часть поведения, которую можно связать с событиями окружающей среды. Сущность процесса научения - это установление связей (ассоциаций) реакций с событиями внешней среды.

В своем подходе к научению Скиннер проводил различие между реакциями, которые вызываются четко определенными стимулами (например, мигательный рефлекс в ответ на дуновение воздуха), и реакциями, которые нельзя связать ни с одним стимулом. Эти реакции второго типа порождаются самим организмом и называются операн-тами. Скиннер считал, что стимулы среды не принуждают организм вести себя определенным образом и не побуждают его действовать. Исходная причина поведения находится в самом организме.

Оперантное поведение (вызванное оперантным научением) определяется событиями, которые следуют за реакцией. То есть за поведением идет следствие, и природа этого следствия изменяет тенденцию организма повторять данное поведение в будущем. Например, катание на роликовой доске, игра на фортепиано, метание дротиков и написание собственного имени - это образцы оперантной реакции, или операнты, контролируемые результатами, следующими за соответствующим поведением. Это произвольные приобретенные реакции, для которых не существует стимула, поддающегося распознаванию. Скиннер понимал, что бессмысленно рассуждать о происхождении оперантного поведения, так как нам неизвестны стимул или внутренняя причина, ответственная за его появление. Оно происходит спонтанно.

Если последствия благоприятны для организма, тогда вероятность повторения операнта в будущем усиливается. Когда это происходит, говорят, что последствия подкрепляются, и оперантные реакции, полученные в результате подкрепления (в смысле высокой вероятности его появления), обусловились. Сила позитивного подкрепляющего стимула таким образом определяется в соответствии с его воздействием на последующую частоту реакций, которые непосредственно предшествовали ему.

И напротив, если последствия реакции не благоприятны и не подкреплены, тогда вероятность получить оперант уменьшается. Скиннер полагал, что, следовательно, оперантное поведение контролируется негативными последствиями. По определению, негативные, или аверсивные последствия, ослабляют поведение, порождающее их, и усиливают поведение, устраняющее их.

Оперантное научение можно представить как процесс обучения, основанный на связи раздражитель-реакция-подкрепление, в рамках которой поведение формируется и поддерживается в силу тех или иных его последствий.

Примером оперантного поведения служит ситуация, встречающаяся почти в каждой семье, где есть маленькие дети, а именно - оперантное научение поведению плача. Как только маленькие дети испытывают боль, они плачут, и немедленная реакция родителей - выразить внимание и дать другие позитивные подкрепления. Так как внимание является подкрепляющим фактором для ребенка, реакция плача становится естественно обусловленной. Однако плач может возникать и тогда, когда боли нет. Хотя большинство родителей утверждают, что они могут различать плач от расстройства и плач, вызванный желанием внимания, все же многие родители упорно подкрепляют последний.

В 1969 году Альберт Бандура (1925) - канадский психолог выдвинул свою теорию личности, названную теорией социального обучения.

А. Бандура критиковал радикальный бихевиоризм, который отрицал детерминанты поведения человека, возникающие из внутренних когнитивных процессов. Для Бандуры индивиды не являются ни автономными системами, ни простыми механическими передатчиками, оживляющими влияния окружения - они обладают высшими способностями, которые позволяют им предсказывать появление событий и создавать средства для осуществления контроля над тем, что влияет на их повседневную жизнь. Учитывая, что традиционные теории поведения могли быть неверными, это давало скорее неполное, чем неточное объяснение поведению человека.

С точки зрения А. Бандуры, люди не управляются интрапсихическими силами и не реагируют на окружение. Причины функционирования человека нужно понимать в терминах непрерывного взаимодействия поведения, познавательной сферы и окружения. Данный подход к анализу причин поведения, который Бандура обозначил как взаимный детерминизм, подразумевает, что факторы предрасположенности и ситуационные факторы являются взаимозависимыми причинами поведения.

Функционирование человека рассматривается как продукт взаимодействия поведения, личностных факторов и влияния окружения.

Проще говоря, внутренние детерминанты поведения, такие как вера и ожидание, и внешние детерминанты, такие как поощрение и наказание, являются частью системы взаимодействующих влияний, которые действуют не только на поведение, но также на различные части системы.

Разработанная Бандурой модель-триада взаимного детерминизма показывает, что хотя на поведение влияет окружение, оно также частично является продуктом деятельности человека, то есть люди могут оказывать какое-то влияние на собственное поведение. Например, грубое поведение человека на званом вечере может привести к тому, что действия присутствующих рядом людей будут, скорее, наказанием, а не поощрением для него. Во всяком случае, поведение изменяет окружение. Бандура также утверждал, что благодаря своей необычайной способности использовать символы люди могут думать, творить и планировать, то есть они способны к познавательным процессам, которые постоянно проявляются через открытые действия.

Каждая из трех переменных в модели взаимного детерминизма способна влиять на другую переменную. В зависимости от силы каждой из переменных доминирует то одна, то другая, то третья. Иногда наиболее сильны влияния внешнего окружения, иногда доминируют внутренние силы, а иногда ожидание, вера, цели и намерения формируют и направляют поведение. В конечном итоге, однако, Бандура полагает, что по причине двойной направленности взаимодействия между открытым поведением и окружающими обстоятельствами люди являются и продуктом, и производителем своего окружения. Таким образом, социально-когнитивная теория описывает модель взаимной причинности, в которой познавательные, аффективные и другие личностные факторы и события окружения работают как взаимозависимые детерминанты.

Предвиденные последствия. Исследователи научения делают акцент на подкреплении как на необходимом условии для приобретения, сохранения и модификации поведения. Так, Скиннер утверждал, что внешнее подкрепление обязательно для научения.

А. Бандура, хотя и признает важность внешнего подкрепления, но не рассматривает его как единственный способ, при помощи которого приобретается, сохраняется или изменяется наше поведение. Люди могут учиться наблюдая или читая, или слыша о поведении других людей. В результате предыдущего опыта люди могут ожидать, что определенное поведение будет иметь последствия, которые они ценят, другое - произведет нежелательный результат, а третье - окажется малоэффективным. Наше поведение, следовательно, регулируется в значительной мере предвиденными последствиями. В каждом случае мы имеем возможность заранее вообразить последствия неадекватной подготовки к действию и принимаем необходимые меры предосторожности. Посредством нашей способности представлять действительный исход символически будущие последствия можно перевести в сиюминутные побудительные факторы, которые влияют на поведение во многом так же, как и потенциальные последствия. Наши высшие психические процессы дают нам способность предвидения.

В центре социально-когнитивной теории лежит положение о том, что новые формы поведения можно приобрести в отсутствие внешнего подкрепления. Бандура отмечает, что многое в поведении, которое мы демонстрируем, приобретается посредством примера: МЫ просто наблюдаем, что делают другие, а затем повторяем их действия. Этот акцент на научении через наблюдение или через пример, а не на прямом подкреплении, является наиболее характерной чертой теории Бандуры.

Саморегуляция и познание в поведении. Другой характерной чертой социально-когнитивной теории является то, что важную роль она отдает уникальной способности человека к саморегуляции. Устраивая свое непосредственное окружение, обеспечивая когнитивную поддержку и осознавая последствия своих собственных действий, люди способны оказывать некоторое влияние на свое поведение. Разумеется, функции саморегуляции создаются и не так уж редко поддерживаются влиянием окружения. Таким образом, они имеют внешнее происхождение, однако не следует преуменьшать тот факт, что однажды установившись, внутренние влияния частично регулируют то, какие действия выполняет человек. Далее, Бандура утверждает, что высшие интеллектуальные способности, например способность оперировать символами, дают нам мощное средство воздействия на наше окружение. Посредством вербальных и образных репрезентаций мы производим и сохраняем опыт таким образом, что он служит ориентиром для будущего поведения. Наша способность формировать образы желаемых будущих результатов выливается в бихевиоральные стратегии, направленные на то, чтобы вести нас к отдаленным целям. Используя способность к оперированию символами, мы можем решать проблемы, не обращаясь к методу проб и ошибок, можем, таким образом, предвидеть вероятные последствия различных действий и соответственно изменять наше поведение.

Заключение

Термином научение обозначают относительно постоянное изменение поведенческого потенциала в результате практики или приобретенного опыта. В этом определении содержатся три ключевые элемента:

  • 1) совершившееся изменение обычно отличается устойчивостью и длительностью;
  • 2) изменение претерпевает не само поведение, а потенциальные возможности для его осуществления (субъект может научиться чему-то не изменяющему его поведение в течение долгого времени или не влияющему на него вообще никогда);
  • 3) научение требует приобретения некоторого опыта (так, оно не происходит просто в результате взросления и роста).

Отталкиваясь от работ Павлова и Торндайка, ранние представители "теории научения", господствовавшей в психологической науке Соединенных Штатов Америки практически всю первую половину XX века, направляли свои изыскания на инструментальное поведение. Они исследовали те его виды, которые влекли за собой последствия. Изучению подвергалось, например, поведение крысы, перемещающейся по лабиринту для нахождения выхода и получения пищи. При этом измеряли такие величины, как количество времени, требующееся крысе для достижения цели в ходе каждой из повторяющихся попыток. Аналогично исследованию Торндайка, процедура состояла в том, что крыса помещалась в начало лабиринта, а затем производилась оценка ее продвижения к выходу. Главным анализируемым показателем было количество попыток, требующихся крысе для того, чтобы она, наконец, смогла пройти весь лабиринт, не совершая ошибок (таких, как попадание в тупиковые коридоры).

Представители теории научения несколько отошли от строгого бихевиоризма. Они использовали такие понятия, как научение, мотивация, движущие силы, побуждения, психическое торможение, которые обозначали невидимое поведение. По утверждению выдающегося теоретика научения Кларка Халла (1884-1952), эти понятия являются научными настолько, насколько их можно определить в терминах наблюдаемых операций (см. Hull, 1943). Например, операциональное определение наличия голода или "потребности в насыщении" можно выдвинуть исходя из количества часов пищевой депривации, испытываемой крысой перед экспериментом, или из снижения веса тела крысы относительно нормального. В свою очередь, операциональное определение научения можно дать в терминах прогрессирующего снижения от попытки к попытке количества времени, необходимого крысе для достижения выхода из лабиринта (или кошке для освобождения из проблемного ящика). Теперь теоретики могли задаться такими требующими исследования вопросами, как: "Происходит ли обучение быстрее, если усиливается мотив удовлетворения пищевой потребности"? Оказывается, происходит, но лишь до определенного момента. После этого момента у крысы просто не остается сил, чтобы пройти лабиринт.

Исследователи научения изобретали формулы для научения и поведения посредством усреднения поведения большого числа отдельных испытуемых и постепенно выводили общие "законы" научения. Одним из них является классическая кривая научения, распространяющаяся на многие типы поведения человека, которая показана. Так, научение некоторому навыку, например игре на музыкальном инструменте, характеризуется быстрым улучшением мастерства на начальных этапах, но затем темпы улучшения все более и более замедляются. Предположим, что ребенок учится играть на гитаре. Сначала он быстро развивает гибкость и послушность пальцев, навыки перебора струн и выставления аккордов; но если ему и суждено стать виртуозом, то это потребует немало лет практики. Кривая научения довольно хорошо подходит для иллюстрации возникновения многих сложных навыков человека, несмотря на то, что ее создали на основании наблюдений за улучшением прохождения лабиринта крысами с течением времени.

Некоторые другие закономерности, выявленные представителями классической теории научения, также распространяются на поведение человека. Однако существует и большой ряд тех из них, которые не подлежат такому переносу. От поиска универсальных для всех видов животных принципов обучения, по большей части, отказались в пользу видоспецифических принципов.

Оперантный бихевиоризм Б. Ф. Скиннера был подчинен главной задаче – предсказывать и контролировать поведение конкретных индивидов.

Основные положения теории Б. Ф. Скиннера:

Поведение можно достоверно определить, предсказать и проконтролировать условиями окружения. Понять поведение, значит, проконтролировать его и наоборот.

Не принял идею о личности или самости, которая стимулирует и направляет поведение.

Делал упор на интенсивном анализе характерных особенностей прошлого опыта человека и уникальных врожденных способностей.

Изучение личности включает в себя нахождение своеобразного характера взаимоотношений между поведением организма и результатами, подкрепляющими его.

Считал, что люди зависимы от прошлого опыта.

Б. Ф. Скиннер рассматривал организм человека как «черный ящик». Поведение является только функцией его последствий или правомерных отношений «S – R». Он рассматривал личность только как набор форм реакций, которые характерны для данного поведения. Личность индивида состоит из относительно сложных, но, тем не менее, независимо приобретенных реакций. Чтобы понять поведение, нужно только понять опыт прошлого научения человека.

В системе Б. Ф. Скиннера поведение состоит из специфических элементов – оперантных реакций . Он признавал два основных типа поведения:

респондентное как ответ на знакомый стимул,

оперантное , определяемое и контролируемое результатом, следующим за ним.

Оперантное обусловливание, по Б. Ф. Скиннеру, обозначает особый путь образования условных рефлексов, заключающийся в подкреплении спонтанно возникающей у субъекта реакции, а не стимула (в отличие от «классического» павловского пути). Подкрепление – ключевая концепция системы автора. Подкрепляющие стимулы можно разделить на стимулы первичные и вторичные. Первичные – сами по себе обладают подкрепляющими свойствами (например, пища, вода, комфорт). Вторичные стимулы (например, деньги, внимание, одобрение и пр.) – событие или объект, которые приобретают свойство осуществлять подкрепление посредством тесной ассоциации с первичным подкреплением.

Б. Ф. Скиннер не считал необходимым рассматривать внутренние силы или мотивационные состояния человека в качестве причинного фактора поведения, а сосредотачивался на взаимоотношениях между определенными явлениями окружения и открытым поведением. Он придерживался мнения, что личность - это не что иное, как определенные формы поведения, которые приобретаются посредством оперантного научения.

Американский психолог Скиннер создал экспериментальное устройство, которое известно как “ящик Скиннера”. Отличительной особенностью этого ящика было то, что животное, помещенное в него, не воспринимало предмета удовлетворения свой потребности. Например, голодная крыса (излюбленный объект бихевиористов) не видела пищи. Другими словами, эта ситуация, в какой-то мере, моделировала естественные условия поиска корма. Внутри ящика находилось устройство, благодаря воздействию на которое, например, крыса могла получить кусочек пищи, автоматически подававшийся в особую кормушку, встроенную в одну из стенок клетки. Поведение крысы в такой экспериментальной ситуации было практически таким же, как у кошки в проблемной клетке Э.Торндайка. После серии случайных успехов голодное животное научалось сразу же нажимать на педаль, как только его помещали в эту ситуацию. Решающее движение (нажатие на педаль) Скиннер назвал операцией . На основании этих экспериментов ученый создал известную теорию оперантного научения, которая оказала очень большое влияние на психологию ХХ века. Можно выделить следующие положения этой теории.

Первое положение. Оперантное научение – это такое научение, которое происходит на основе подкрепления реакций, относящихся к типу оперантов .

Скиннер выделил в репертуаре животных и человека два типа движений – респонденты и операнты. Респондентами он назвал реакции, которые сразу же вызываются самыми обычными раздражителями . К ним можно отнести, например, коленный рефлекс в ответ на удар по чашечке, рефлекс слюноотделения на появление пищи во рту и т.д. Подобного рода движения лежат в основе реактивного поведения, то есть, поведения, совершаемого в ответ на определенный стимул . Оперантами Скиннер назвал такие реакции животных организмов, которые не связаны жестко с каким-либо раздражителем . Но эти движения могут связаться с определенным стимулом после периода научения. Например, нажатие крысой на педаль относится к оперантам, так как до научения эта реакция не проявлялась при виде педали. После научения восприятие животным этого стимула приводит к появлению соответствующего движения. Таким образом, под оперантным поведением надо понимать спонтанные действия животного в ответ на незнакомую (проблемную) ситуацию . Скиннер предположил, что на основе реакций типа респондентов вырабатываются классические условные рефлексы, а на основе оперантов – инструментальные рефлексы.

Отличия между инструментальным и условно-рефлекторным научением.

Между условными и инструментальными рефлексами существуют и другие существенные различия, благодаря которым их выделяют в особые группы научения. Можно выделить следующие важные отличия. Условный рефлекс вырабатывается путем образования ассоциации между специфическим стимулом (безусловным раздражителем) и индифферентным (нейтральным), а инструментальный рефлекс – путем образования ассоциации между определенным поведением и его последствиями . То есть, в инструментальном рефлексе связаны реакция животного и подкрепляющий стимул, а в условном рефлексе – два стимула, условный и безусловный. Животное при выработке условного рефлекса, как было уже сказано, выступает в качестве достаточно пассивного участника событий , а при инструментальном научении оно находится в состоянии целенаправленной деятельности . Другими словами, животное в обоих случаях отличается по степени активности. Имеются также отличия в угасании. Инструментальные рефлексы не угасают, если во время их выработки подкрепление в ряде случаев не дается ; классические рефлексы такой стойкости не обнаруживают. Если одни исследователи акцентировали внимание на различии этих двух форм научения, то другие утверждали, что эти различия незначительны по сравнению с их общими особенностями. В обоих случаях происходит выработка условной реакции в результате специфической ассоциации , и в обоих случаях эта реакция угасает при отсутствии подкрепления. Более того, существует мнение, что инструментальные и условные рефлексы – это не разные виды научения, а разные аспекты одного и того же процесса приобретения опыта, который только и встречается в естественных условиях. Даже в лаборатории при выработке реакции одного типа трудно создать условия, которые исключали бы возможность выработки реакций другого типа. Так, например, образование слюноотделительного условного рефлекса на звук может сопровождаться определенными двигательными реакциями (собака навостряет уши, поворачивается к источнику звука, начинает облизываться). Такая двигательная активность в ответ на звук может стать условной инструментальной реакцией. С субъективной точки зрения собака может “думать”, что именно совершение этих движений приводит к появлению пищи. Если она не будет их делать в ответ на появление звука, то она и не получит корма. В данном случае в результате научения образуется такая цепочка событий. Условный стимул (звук) приводит к появлению инструментального рефлекса (набор двигательных реакций, связанных с ожиданием пищи), вслед за этим безусловный стимул (пища) приводит к появлению условной реакции (слюноотделения). Идея о том, что инструментальный и условный рефлекс составляют нечто целое при ассоциативном научении, подтверждается тем фактом, что, если при выработке условного рефлекса реакции скелетных мышц отсутствуют (например, искусственно заблокированы), то выработка этого рефлекса сильно затрудняется. Другими словами, разделение рефлексов на условные и инструментальные является искусственным (правда, удобным для научного анализа), а в природе они составляют единый механизм ассоциативного приспособления к изменениям во внешней среде. То есть, это детали единого механизма, который при изъятии одной из составляющих начинает работать не эффективно или вообще прекращает функционировать. Правда, можно сделать предположение, что этот механизм у низкоорганизованных и малоактивных животных обладает в большей степени условно-рефлекторной природой, чем у высокоорганизованных. “Инструментальная надстройка”, вероятно, появилась в эволюции позже. Показано, что способность к выработке инструментальных рефлексов в ряду беспозвоночных животных появляется у кольчатых червей, а у позвоночных – у костистых рыб. Тогда как, классические условные рефлексы могут вырабатывать уже плоские черви и низшие позвоночные.


Второе положение. Любое научение возможно только при наличии подкрепления .

Скиннер определил подкрепление, исходя из закона эффекта Э.Торндайка. Но, как истинный представитель бихевиоризма, он убрал из него субъективное понятие, связанное с состоянием удовлетворения . Под подкреплением Скиннер понимал любое событие, которое, сочетаясь с каким-либо видом поведения, будет делать его более частым . Например, для голодной крысы в скиннеровском ящике подкреплением будет подача пищи. При этом не важно, что субъективно испытывает в этот момент животное. В качестве подкрепления могут выступать не только биологические, но и социальные факторы, например, признание общества, похвала, слава и т.д.

Как будет показано дальше, подкрепление не является обязательным условием любого научения. Например, этот компонент отсутствует в латентном научении, а также в импринтинге. В этом отношении крайняя позиция в понимании Скиннером роли подкрепления является ошибочной.

Третье положение. Подкреплением можно создать любое поведение .

Скиннер, опираясь на это положение своей теории, разработал способ формирования поведения путем последовательных приближений , который эффективно используется в дрессировке животных. Этот способ состоит в том, что весь путь от исходного поведения до конечной реакции, который исследователь стремится выработать у животного, разбивается на несколько этапов. После этого нужно последовательно и систематически подкреплять каждый из этих этапов, постепенно приближаясь к нужной форме поведения. Например, посмотрим, как с помощью этого способа можно научить голубя клевать маленький кружок на стенке ящика Скиннера. Сначала голубю дают зернышко только тогда, когда он заходит в ту половину клетки, где находится кружок. Далее его начинают вознаграждать в том случае, если он не только зайдет в нужную половину, но и повернет голову по направлению к кружку. На третьем этапе ему дают корм тогда, когда он не только совершает действия, выученные на первых двух этапах, но и прикасается к кружку на стенке ящика. Таким образом, при таком методе обучения к очередному этапу переходят лишь тогда, когда уже сформировалась поведенческая реакция, необходимая на предыдущем этапе. Скиннер, считал, что таким способом можно сформировать любое поведение. Он научал голубя описывать круги по ящику, ложиться на спину, становится обеими лапками на развернутое крыло или повисать в воздухе на высоте 5 см и т.д. Более того, он научал голубей разным играм. Так он описывает, как “голубя тренировали пускать деревянный шар по миниатюрному желобу в направлении расставленных игрушечных кеглей, толкая его резким боковым движением клюва. Результат поразил нас… Это зрелище произвело такое впечатление на Бреленда, что он отказался от многообещающей карьеры в области психологии и стал платным дрессировщиком”.

Это положение теории Скиннера также оказалось далеким от действительности. В дальнейшем было установлено, что животных можно научить не всему. Способность к научению у разных видов животных строго соответствует экологическим ограничениям, типичным для образа жизни данного вида. Так некоторые виды ассоциаций создаются у одних видов животных легче, чем у других. Например, крысы лучше ассоциируют звуки, запахи и тактильные ощущения, птицы же исследуют мир, пользуясь глазами и клювом. Другими словами, животное можно научить только тому, на что оно в принципе способно. Все формы поведения, которые не совпадают с биологической природой организма, очень трудно поддаются дрессировке или вообще не вырабатываются. Так примата никогда не научить говорить человеческим языком по той простой причине, что их голосовой аппарат не способен к воспроизведению членораздельных звуков. Более подробно влияние биологических факторов на научение будет рассмотрено ниже.

Четвертое положение. Поведение животного всецело зависит от внешней среды, от системы внешних подкрепляющих факторов .

В одной из своих философских работ, которая называется “По ту сторону свободы и достоинства”, Скиннер выдвинул положение о том, что свобода – это иллюзия. Человек, как и животное, полностью зависит от окружающей среды, влияющей на его поведение через совокупность подкрепляющих факторов. Человек думает, что он свободен в выборе своего поведения, что он сам решает свою судьбу. Но, на самом деле, в этом отношении он похож на крысу в ящике Скиннера. Крыса тоже думает, что она самостоятельно добивается пищи, что она свободна в своем выборе поведения. На самом деле она делает только то, чего хочет от нее экспериментатор (внешняя среда для человека), который может подкреплять или не подкреплять ту или иную реакцию. Также человеческое общество подкрепляет одни, выгодные для него, формы поведения индивида и не подкрепляет другие, которые могут это общество разрушить. То есть, наше поведение такое, каким хочет его видеть внешний мир, тот социум, в котором живет человек. Скиннер говорил, что путем разумного подкрепления можно создать гармоничных и оптимально развитых для общества людей. Он даже попытался создать особые “коммуны”, в которых, так называемые, “планификаторы” путем системы подкрепления отбирали и культивировали только те формы поведения подопытных людей, которые, с точки зрения Скиннера, обеспечивают выживание и развитие человеческого общества. В конце концов, эти коммуны распались, чем развеяли философские следствия скиннеровской теории научения. Есть в человеке нечто, что заставляет идти его за свои идеи на костер, создавать шедевры музыки, архитектуры… Ведь, наверное, не только ради хлеба создавал Бетховен свои гениальные произведения. Вероятно, у него была какая-то внутренняя страсть, стремление выразить себя через божественные звуки музыкальной гармонии. Что это? Неужели только общество заставляло его так поступать, доводя до само истощения?

Введение

Актуальность темы исследования. В начале 21 века психология бихевиоризма получает все более и более широкое распространение в России. Ситуация перехода от советской системы к западному пути развития вызвала у большинства людей огромные социальные и идеологические потрясения, связанные с лишением чувства принадлежности к могучему государству, потерей консолидирующей и возвышающей общественной идеи, девальвацией нравственных ценностей и т. д.

Круг внимания бихевиоризма как раз и составляет проблематика человека, поставленного перед необходимостью самостоятельно, в смятении и сомнениях, определять свою идентичность и ценности, ради которых он живет. Развитие собственной индивидуальности становится одновременно и задачей, и способом справиться с новой социальной реальностью.

Общая ситуация в психологии, характеризующаяся движением от естественнонаучной парадигмы к гуманитарной, от объясняющего подхода к понимающему, от изучения человека, как изолированного объекта к рассмотрению неразрывной связи человека и мира также способствует развитию и распространению бихевиоризма и стремлению к активному обмену идеями с ней со стороны других психологических направлений.

Цель данной работы заключается в обосновании вопроса об особенностях бихевиористической концепции научения.

Бихевиористическая концепция научения

Теория оперантного обусловливания Б. Скиннера

В переводе с английского бихевиоризм означает «поведение». Именно оно стало центральным предметом внимания этого направления.

Бихевиоризм признавал наличие сложного поведения, которое объяснял комбинациями цепочек стимулов и реакций. Собственно их изучение также входило в главные задачи течения.

Научение (обучение,учение) - процесс приобретения субъектом новых способов осуществления поведения и деятельности, их фиксации и/или модификации. Столяренко Л.Д. Основы психологии. - Ростов-на-Дону: Феникс,2006. - С. 68-72. Изменение психологических структур, которое происходит в результате этого процесса, обеспечивает возможность дальнейшего совершенствования деятельности.

Впервые закономерности научения, установленные экспериментальными методами, были установлены в рамках бихевиоризма. Теория, разработанная Б.Ф. Скиннером(1904-1990),носит название теории оперантого обусловливания.

Скиннер ставил перед собой цель объяснить механизмы научения у человека и животных (крыс и голубей) на основе ограниченного набора базовых принципов. Основная идея состояла в том, чтобы управлять средой, контролировать ее, получая при этом упорядоченные изменения. Он говорил: « Проконтролируйте условия, среду, и вам откроется порядок» Скиннер Б. Оперантное поведение //История зарубежной психологии:Тексты.М: АсТ,2006.С.60-82 4.

Процедура обучения получила название - «оперантное обусловливание».

Она заключалась в стремлении экспериментатора установить связь между стимулом (S) и реакцией (R) посредством подкрепления - поощрения или наказания. В схеме стимул-реакции (S-R) ключевой для Скиннера была именно реакция. Реакции рассматривались с точки зрения простоты-сложности. Простая -слюноотделение, отдергивание руки; сложная - решение математической задачи, агрессивное поведение.

Оперантное обусловливание - это процесс, посредством которого характеристики реакции детерминируются последствиями этой реакции. Осуществление оперантного поведения заложено в биологической природе организма. Научение рассматривалось Скиннером как процесс.

Подкрепление является одним из принципом обусловливания. Уже с младенческого возраста, Согласно Скиннеру, поведение людей можно регулировать с помощью подкрепляющих стимулов Скиннер Б. Оперантное поведение// История зарубежной психологии:Тексты.М.АсТ,2006. С,60-82 5. Существуют два разных вида подкрепления. Некоторые,например, еда или устранение боли, называются первичными подкреплениями, т.к. они обладают естественной подкрепляющей силой. Другие подкрепляющие стимулы (улыбка, внимание взрослого,одобрение,похвала) являются обусловленными подкрелениями. Они становятся таковыми в результате частого сочетания с первичными подкреплениями.

Оперантное обусловливание опирается в основном на положительное подкрепление, т.е. на такие последствия реакций, которые их поддерживают или усиливают,например,пища, денежное вознаграждение,похвала. Тем не менее, Скиннер подчеркивает важность негативного подкрепления,которое приводит к угасанию реакции. Такими подкрепляющими стимулами могут быть физическое наказание, моральное воздействие,психологическое давление.

Кроме подкрепления, принципом обусловливания является его незамедлительность. Было обнаружено, что в начальной стадии эксперимента можно довести реакцию до наивысшего уровня только в том случае,если подкреплять ее немедленно. Иначе, реакция, начавшая было формироваться, быстро угаснет.

При оперантном, также как и при респондентном обусловливании, наблюдается генерализация стимулов. Генерализация - это возникшая в процессе обусловливания ассоциативная связь реакции со стимулами, похожая на первоначальную выработку условного рефлекса. Примерами генерализации являются - страх перед всеми собаками, который сформировался вследствие нападения какой- то одной собаки, положительная реакция ребенка (улыбка, произнесение слов « папа» при контакте с мужчинами похожих на его отца, движение на встречу и проч.)

Формирование реакции представляет собой очень сложный процесс. Реакция не возникает сразу и вдруг, она оформляется постепенно, по мере осуществления ряда подкреплений. Последовательное подкрепление - это выработка сложных действий с помощью подкрепления действий, которые постепенно все больше становятся похожими на ту окончательную форму поведения, которую предполагалось сформировать. Сплошное поведение формируется в процессе подкрепления отдельных элементов поведения, которые в совокупности складываются в сложные действия.

Были выделены такие режимы подкрепления: непрерывное подкрепление - предъявление подкрепления каждый раз, когда субъект дает желаемую реакцию; прерывистое или частичное подкрепление. Для более строгой классификации режимов подкрепления было выделено два параметра - временное подкрепление и пропорциональное подкрепление. В первом случае подкрепляют только тогда, когда истек срок, в течение которого необходимо выполнить соответствующую деятельность, во втором: подкрепляют за объем той работы (количества действий), которая должна быть произведена.

На основе двух параметров были описаны четыре режима подкрепления: Уотстон Дж. Поведение как предмет психологии (бихевиоризм и необихевиоризм)// хрестоматия по истории психологии / Под ред. П.Я.Гальперина, А. Н. Ждан.- М.:Изд-во МГУ,1980.-С.34-44. 6

Режим подкрепления с постоянным соотношением. Подкрепление осуществляется в соответствии с установленным объемом реакций. Примером такого режима может быть оплата труда за определенный, постоянный объем работ.

Режим подкрепления с постоянным интервалом. Подкрепление производится только тогда, когда твердо установленный, фиксированный временной интервал истек. Например, ежемесячная, понедельная, почасовая оплата, отдых после жестко установленного времени физической или умственной работы.

Режим подкрепления с вариативным соотношением. В этом режиме организм подкрепляется на основе какого - то в среднем предопределенного числа реакций.

Режим подкрепления с вариативным интервалом. Индивид получает подкрепление после того, как проходит неопределенный интервал.

Скиннер говорил об индивидуальности подкреплений, о вариативности развития того или иного навыка у разных людей, а также у разных животных. Более того само подкрепление носит уникальный характер, т.к. уверенно нельзя сказать, что у данного человека или животного оно может выступать в качестве подкрепления.

По мере того, как ребенок развивается, его реакции усваиваются и остаются под контролем подкрепляющих воздействий со стороны окружающей среды. В виде подкрепляющих воздействий выступают - пища, похвала, эмоциональная поддержка и др. он считает, что овладение речью происходит по общим законам оперантного обусловливания. Ребенок получает подкрепление при произнесении определенных звуков. Подкреплением служит не пища и вода, а одобрение и поддержка взрослых.

С точки зрения психологии научения нет необходимости искать объяснение симптомов болезни в скрытых глубинных причинах. Патология, согласно бихевиоризму, не недуг, а либо (1) результат неусвоенной реакции, либо (2) усвоенная неадаптивная реакция.

Изменение поведения также построено на принципах оперантного обусловливания, на системе модификации поведения и сопряженных с ним подкреплений.

Изменения поведения может происходить вследствие самоконтроля. Самоконтроль включает в себя две взаимозависимые реакции: Уфимцева О.В. Бихевиоризм. - М.:Наука,2008. С.178 7

Контролирующая реакция, которая воздействует на среду, изменяя вероятность возникновения вторичных реакций(«уход» чтобы не выразить «гнев»; удаление пищи, чтобы отвыкнуть от переедания).

Контролирующая реакция, направленная на наличие в ситуации стимулов, которые могут сделать желательное поведение более вероятным (наличие стола для осуществления учебного процесса).

Изменение поведения может происходить и вследствие осуществления поведенческого консультирования. Во многом этот тип консультирования базируется на принципах научения.

Достоинства:

Стремление к строгой проверке гипотез, эксперименту, контролю дополнительных переменных.

Признание роли ситуативных переменных, параметров среды и их систематическое изучение.

Прагматический подход к терапии, позволил создать важные процедуры для изменения поведения.

Недостатки:

Редукционизм - сведение принципов поведения, полученных на животных к анализу поведения человека.

Низкая внешняя валидность вызвана поведением экспериментов в лабораторных условиях, результаты которых трудно перенести в естественные условия.

Игнорирование когнитивных процессов при анализе S-R связей.

Большой разрыв между теорией и практикой.

Поведенческая теория не дает стабильных результатов.