Миллер и Доллард в работе «Социальное научение и подражание» (Miller, Dollard, 1941) отказываются от старой традиции определять подражание как инстинкт, от подхода к нему как к унитарному процессу. Они рассматривают подражание как объект инструментального научения и объясняют его соответствующими законами. Проблема первых умозрительно-спекулятивных социально-психологических теорий переносится ими на экспериментальный уровень.
   Здесь необходимо сделать отступление, отметив, что Миллер и Доллард первыми в бихевиористской ориентации попытались перейти к теории социального научения. Их основные допущения, сложившиеся под влиянием позиции Халла, модифицированной ими, включают постулирование четырех фундаментальных факторов всякого научения: драйва, сигнала, реакции, вознаграждения. Сигналы и побуждения рассматриваются в словаре Миллера и Долларда как два аспекта одного явления – стимула. Любой стимул может приобрести характер побуждения, если он становится достаточно сильным, чтобы вынудить организм действовать. Любой стимул может стать сигналом благодаря своему отличию от других стимулов. Сигналы определяют, когда, где произойдет реакция и какой она будет. В словаре Миллера и Долларда определение сигнала в какой-то мере синонимично определению дискриминативного стимула.
   В своей схеме социального научения авторы вводят среди прочих вторичных побуждений побуждение подражать, имитировать. По их мнению, одним из наиболее важных классов сигналов в ситуации социального научения является поведение других. Наблюдая открытые поведенческие реакции модели на определенные сигналы, одни из которых ведут к вознаграждению, а другие – нет, наблюдатель приобретает, согласно Миллеру и Долларду, определенную иерархию ценностей сигналов.
   Для того чтобы какая-то реакция на определенный сигнал могла быть вознаграждена и выучена, она должна прежде всего произойти. Авторы исходят из предположения, что индивиды владеют неким изначальным «внутренним» репертуаром реакций. Научение происходит, когда определенная реакция вознаграждается в присутствии дифференцирующего сигнала. Таким образом, объектом научения оказывается не реакция, уже составляющая часть поведенческого репертуара индивида, а связь между специфическим сигналом и определенной реакцией. У авторов получается, что новое поведение – это новые комбинации «старых» реакций. Подобная позиция является весьма уязвимой в вопросе о природе новых реакций. Отметим, что Миллер и Доллард рассматривают реакции и открытые, и скрытые, причем вторые предшествуют первым, как это вообще характерно для представителей медиаторного подхода.
   Придавая большое значение механизму научения путем проб и ошибок, Миллер и Доллард обращают внимание на возможность с помощью подражания ограничить пробы и ошибки, приблизиться к правильному пути через наблюдение поведения другого.
   Главная функция вознаграждения, или подкрепления, согласно Миллеру и Долларду, – редукция силы драйва. Именно поэтому природа побуждения определяет природу вознаграждения. Соответственно первичные побуждения уменьшаются в силе первичными подкреплениями; вторичные, или приобретаемые, – вторичными. Одобрительный кивок, например, – это вторичное подкрепление, которое уменьшает приобретенную потребность в социальном одобрении.
   Итак, в целом парадигма всех ситуаций научения, включая подражание, представляет, по Миллеру и Долларду, следующую цепочку: сигнал → внутренняя реакция → драйв → внешняя реакция → вознаграждение. Миллер и Доллард раскрывают неоднозначность термина «подражание». По их мнению, он используется в трех случаях. Во-первых, для обозначения «тождественного» поведения. Такое поведение часто лишь внешне выглядит подражанием, а в действительности может представлять одинаковые реакции на одинаковые стимулы у двух индивидов, причем каждый из них безотносительно к другому научился такому реагированию, то есть «тождественное» поведение может быть результатом подражания, а может и не быть таковым. Этот случай не рассматривается авторами обстоятельно. Второй случай – «парнозависимое» поведение. Оно часто имеет место в диадическом взаимодействии, в котором поведение одной стороны, являющейся, как правило, старше или искуснее другой, служит дискриминативным сигналом для другой – для наблюдателя (то есть наблюдатель вознаграждается за ту же реакцию, что и модель). Наконец, третий случай – копирующее поведение, которое предполагает специфическое руководство со стороны модели поведением наблюдателя. «Модель говорит и показывает наблюдателю, какие реакции и сигналы релевантны задаче, и через непрерывную коррекцию тренирует его представлять ту же реакцию, что и модель» (Miller, Dollard, 1941, p. 137). По сути, авторы используют одинаковые понятия для объяснения приобретения двух последних форм имитации. Однако обычно именно вторая парадигма идентифицируется с необихевиористской интерпретацией подражания.
   Основной тезис Миллера и Долларда следующий: подражающее поведение имеет место, если индивид вознаграждается, когда он подражает, и не вознаграждается, когда не подражает. Авторами вполне определенно подчеркивается роль подкрепления как необходимого предшествующего условия приобретения имитирующего поведения.
   В этом моменте данный подход весьма созвучен предложенной Скиннером интерпретации подражания в принципах оперантного подхода. У Скиннера поведение модели также видится наблюдателем как дискриминативный стимул для подкрепления. Поведение же модели наделяется этой дискриминативно-стимульной функцией через дифференцированное подкрепление ее различных реакций на сигналы. Наблюдатель соответственно вознаграждается за каждое приближение к реакции модели. Однако весь эмпирический материал Скиннера, в отличие от Миллера и Долларда, получен исключительно в экспериментах с животными. Его выводы о поведении человека построены преимущественно на аналогии, которая, как известно, не является методом доказательства[2].
   Миллер и Доллард в подтверждение своих положений приводят данные серий экспериментов, проведенных параллельно на крысах альбиносах и маленьких детях. Одна группа голодных крыс вознаграждалась, если следовала и том же направлении, что и «лидер»; другая группа вознаграждалась за следование в противоположном «лидеру» направлении. В этих условиях первая группа научилась подражать «лидеру», а вторая – не подражать ему. Сами «лидеры» поворачивали влево или вправо, поскольку в конце левого или правого поворота в лабиринте помещалась белая карточка, а заранее они были натренированы находить пищу около нее. Эксперименты показали, что происходила генерализация научения подражанию или неподражанию. В частности, животные, которые научились подражать «лидерам» – белым крысам, подражали и черным крысам без какой-либо дополнительной тренировки; животные, которые научились подражать, будучи «мотивированными» голодом, подражали и когда их «мотивировали» жаждой. Получая вознаграждение за копирование «лидера» в выполнении одной задачи, они обнаруживали тенденцию копировать его поведение в других ситуациях. Параллельные эксперименты с детьми, как пишут Миллер и Доллард, дали аналогичные результаты.
   Параметры, вычлененные Миллером и Доллардом для всякой ситуации научения, в случае парнозависимого поведения приложимы, по их мнению, для описания и поведения модели, и поведения наблюдателя. Это можно увидеть из следующего примера.
   Два брата играют в ожидании возвращения домой отца. Обычно отец приходит с конфетой для каждого. Старший, играя, слышит звук шагов у входа. Для него это служит сигналом возвращения отца. Реагируя на сигнал, он бежит к входу. Для младшего ребенка звуки шагов отца еще не служат отличительным сигналом и поэтому не «воодушевляют» его бежать. И часто он продолжал играть, когда старший убегал навстречу отцу. Но в данном случае младший брат побежал за старшим и каждый получил от отца по конфете. В следующих подобных случаях младший будет чаще бежать, просто увидев бегущего брата. Продолжая получать подкрепление конфетой, поведение младшего стабилизируется: он будет бежать, глядя на брата, во всех случаях, даже если место и время будут варьировать. Таким образом, он научается подражать старшему брату, но шаги отца еще не приобрели для него характера сигнала. Схематично Миллер и Доллард представляют это следующим образом:
 
 
   Итак, с точки зрения Миллера и Долларда, научение имитации аналогично научению бегать. По их мнению, в модели парнозависимого поведения могут быть интерпретированы с некоторыми модификациями другие процессы социального влияния, например конформность, изменение аттитюдов.
   Если Миллер и Доллард первыми в необихевиористской ориентации предприняли попытку «приближения к теории социального научения», то сейчас таких попыток существует несколько. Важно подчеркнуть, что многие из них – это различные вариации парадигмы парнозависимого поведения Миллера и Долларда. Основные направления вариаций следующие:
   1. Элиминируется требование о том, чтобы наблюдатель реагировал открыто. Это случай «нереагирующего, но вознаграждаемого наблюдателя». Интерес исследователей сосредоточен здесь на оценке влияний на поведение наблюдателя таких компонентов поведения модели, как реакция – вознаграждение.
   2. Элиминируется и требование о том, чтобы наблюдатель открыто реагировал, и требование о его вознаграждении. Это случай «нереагирующего, невознаграждаемого наблюдателя». Данное направление исследований представлено в работах Бандуры, Уолтерса, Росса, Розенбаума.
   3. Элиминируется, как во втором случае, реакция наблюдателя и его вознаграждение, а также эксплицитное вознаграждение поведения модели. Исследовательское внимание фокусируется на реакции модели как сигнале для наблюдателя. Такой подход характерен для А. Бандуры.
   Знакомство с подходом Миллера и Долларда позволяет отметить заслугу этих авторов в постановке на экспериментальной основе проблем агрессии и подражания как важного механизма социально-психологического взаимодействия. В рамках необихевиористской ориентации они впервые обратились к исследованиям, испытуемыми в которых выступили люди. Строгая процедура практиковавшегося ими лабораторного эксперимента, с одной стороны, гарантирует строгость полученных данных, но, с другой стороны, делает уместной постановку всех тех проблем, которые подняты в современной социальной психологии вокруг лабораторного эксперимента.
   Однако отмеченные моменты касаются частных сторон данного подхода. Основным же в оценке является анализ исходных методологических принципов. В отношении принципов данного подхода можно сказать, что они продемонстрировали свою узость в интерпретации изучаемых явлений. Доказательством существования такого рода несостоятельности являются, в частности, и те поиски, которые отмечают современные линии развития данного подхода. Для них характерно все большее «смягчение» фундаментальных принципов бихевиоризма, в частности отказ от сведения психической реальности лишь к наблюдаемому поведению, привлечение к анализу в той или иной форме когнитивных переменных. Такого рода эволюция бихевиоризма особенно ярко просматривается в работах Бандуры.

1.1.2.2. Подход А. Бандуры

   Бандура называет свой подход социобихевиоральным и противопоставляет его предшествующим приложениям теории научения к вопросам просоциального и девиантного, то есть отклоняющегося от следования социальным нормам, поведения. По его мнению, эти приложения (он имеет в виду теории социального научения Миллера и Долларда, Скиннера, Роттера) страдают тем, что основываются «на ограниченном ряде принципов, установленных и поддержанных в основном исследованиями научения у животных в ситуациях с одной персоной» (Bandura, Walters, 1965, p. 11). Он полагает, что «для адекватного рассмотрения социальных явлений необходимо расширить и модифицировать эти принципы, ввести новые принципы, установленные и подтвержденные исследованиями приобретения и модификации человеческого поведения в диадической и групповой ситуациях» (там же, p. 1).
   Таким образом, с самого начала Бандура выступил противником столь характерных для бихевиоризма произвольных экстраполяций данных из мира животных на социальный мир.
   Кроме того, неудовлетворенность исследователя предшествующими подходами касается их неспособности решить проблему возникновения действительно новых форм поведения. По его мнению, инструментальное обусловливание и подкрепление должны рассматриваться скорее как выбор реакции среди уже имеющихся в поведенческом репертуаре индивида, нежели как ее приобретение. Это характерно, как мы видели, для позиций Миллера и Долларда: способность личности к реакции существует прежде, чем она научилась ей через подражание. У Скиннера процедура приобретения новых образцов поведения включает позитивное подкрепление тех элементов опять же наличных реакций, которые имеют сходство с окончательной формой желаемого поведения; компоненты реакции, имеющие мало подобия с этим поведением или не имеющие такового вовсе, остаются неподкрепляемыми. С этой точки зрения новые реакции никогда не возникают вдруг, они всегда являются исходом относительно длительного процесса оперантного обусловливания. Согласно теории социального научения Роттера, вероятность того, что данное поведение будет иметь место в конкретной ситуации, определяется двумя переменными – субъективным ожиданием, что соответствующее поведение будет подкреплено, и ценностью подкрепления для субъекта. Подход Роттера «предполагает существование иерархии реакций, которые имеют тенденцию происходить в различных ситуациях с варьирующими степенями вероятности; таким образом, он совершенно неадекватен для объяснения возникновения реакции, которая еще не выучена и, следовательно, имеет нулевую вероятностную ценность» (там же, p. 2).
   По-иному Бандура трактует и роль подкрепления в научении. Он рассматривает подкрепление, скорее, как фактор, способствующий научению, а не вызывающий его. С его точки зрения, во-первых, наблюдатель может научаться новым реакциям, просто наблюдая поведение модели; во-вторых, необязательно ставить реакцию модели и реакцию наблюдателя в условия подкрепления. Многочисленные исследования, в том числе полевые, Бандуры и его коллег показали, что подкрепляющие последствия могут служить активизации поведения, приобретенного в условиях неподкрепляемого наблюдения. Подчеркивая, что подкрепление не играет доминантной роли в приобретении новых реакций, Бандура отводит ему центральную роль в усилении и поддержании (сохранении) различных поведенческих тенденций.
   Образцы поведения могут приобретаться, по мнению Бандуры, через прямой личный опыт, а также через наблюдение поведения других и его последствий для них, то есть через влияние примера. Бандура вычленяет следующие возможные направления влияния модели на наблюдателя[3]:
   1) посредством наблюдения поведения модели могут приобретаться новые реакции;
   2) через наблюдение последствий поведения модели (его вознаграждения или наказания) может усиливаться или ослабляться сдерживание поведения, которому наблюдатель ранее научен, то есть существующее у наблюдателя поведение модифицируется благодаря наблюдению модели;
   3) наблюдение поведения другого (модели) может облегчить реализацию реакций, ранее приобретенных наблюдателем.
   Вопрос о научении через наблюдение Бандура считает весьма важным, в частности в связи с тем, что «теория должна объяснить не только, как приобретаются образцы реакций, но и как регулируется и поддерживается их выражение» (Bandura, 1973, р. 44). С его точки зрения, «выражение ранее выученных реакций может социально регулироваться через действия влиятельных моделей» (там же, р. 43). Таким образом, функция научения посредством наблюдения (наблюдающего научения) в схеме Бандуры оказывается достаточно широкой.
   Большое внимание Бандура уделяет парадигме научения в отсутствие открытой реакции у наблюдателя. В этом случае, по его мнению, реакция модели ведет к «внутренним» воображаемым реакциям наблюдателя, которые могут восстанавливаться, когда наблюдатель помещается в «поведенческое поле». Эти воображаемые реакции наблюдателя, символически обозначенные, служат внутренними сигналами, опосредующими внешнюю реакцию наблюдателя. Они становятся дискриминативными стимулами для открытого поведения.
   Сам Бандура называет свою теорию социального научения медиаторно-стимульной ассоциативной теорией. Она исходит из того, что «человеческое функционирование основывается на трех регуляторных системах»: предшествующих стимулах, влияниях обратной связи, поступающей от реакции, когнитивных процессах. Соотношение, постулируемое между этими тремя переменными, таково, что первые две являются основными. «Когнитивные события, однако, не функционируют как автономные причины поведения. Их природа, их наличие находятся под контролем стимула и подкрепления» (там же, р. 53). Таким образом, обращение к когнитивным детерминантам поведения оказывается у Бандуры видимым отступлением от кредо бихевиоризма, поскольку эта нетрадиционная для данного подхода переменная всецело ставится в зависимость, под контроль традиционных переменных – стимула и подкрепления.
   Характеризуя стимулы в качестве первого контролирующего фактора поведения, Бандура особое внимание уделяет таким сигналам, как поведение других. «Среди многочисленных сигналов, влияющих на поведение людей в любой данный момент, нет более эффективных, чем действия других… Действия других приобретают свойства направлять реакцию через селективное подкрепление во многом так же, как это делают физические и символические сигналы в несоциальных формах. Когда поведение других продуцирует вознаграждаемые исходы, сигналы модели становятся мощными детерминантами аналогичного поведения у наблюдателя» (там же, р. 46).
   Вторая контролирующая система включает влияния обратной связи главным образом в форме подкрепляющих последствий поведения. «Поведение экстенсивно контролируется его последствиями. Реакции, которые порождают невознаграждаемые или наказуемые последствия, имеют тенденцию быть отброшенными, а те, которые приводят к вознаграждаемым исходам, остаются и усиливаются» (там же, р. 47). Бандура полагает, что человеческое поведение невозможно полностью понять без исследования регуляторного влияния подкрепления. С его точки зрения, неверно отождествлять подкрепление с «осязаемыми вознаграждениями и наказаниями». В качестве подкреплений в межличностных отношениях выступают внимание, отвержение, словесное одобрение или выговор и т. д. Именно благодаря приобретению подкрепляющих функций они регулируют межличностные взаимодействия.
   Много внимания в своем анализе Бандура уделяет такому виду подкрепления, как наблюдаемое подкрепление. Поведение людей находится под влиянием не только прямо испытываемых последствий, но и многократно наблюдаемых действий других: вознаграждаемых, игнорируемых или наказуемых. Наблюдаемое подкрепление влияет на поведение во многом таким же образом, как и подкрепление собственных исходов: наблюдаемые вознаграждения в целом усиливают, а наблюдаемые наказания уменьшают в наблюдателях следование поведению модели. Кроме того, по мнению Бандуры, «наблюдаемые последствия дают также референтные стандарты, которые определяют, приобретут ли отдельные исходы позитивную или негативную ценность… Таким образом, через процессы социального сравнения наблюдение исходов реакции у других людей может решительно изменить эффективность прямых подкреплений» (Bandura, 1973, р. 47). В качестве важного источника подкрепления Бандура рассматривает не только внешний исход, но и реакцию самооценки. Сравнительные исследования показывают, что люди могут управлять своим поведением посредством самоподкрепления так же или лучше, чем посредством последствий, возникающих из внешних источников.
   Третья система регуляции и контроля поведения в теории научения Бандуры – когнитивная. Она исходит из того, что действия не всегда предсказуемы из внешних источников влияния – предшествующих стимулов и последствий реакции. Для этого варианта теории научения характерен не отказ от признания когнитивных переменных и их влияния на поведение, а, скорее, «сдвиг фокуса от внутренних детерминант к детальному анализу внешних влияний» (там же, р. 41).
   Когнитивную регуляцию поведения Бандура считает особенно важной в ситуации научения через наблюдение. Здесь «личность наблюдает образчик поведения или читает о нем, но не демонстрирует его открыто, пока не возникнут соответствующие обстоятельства» (там же, р. 52).
   В данном случае моделируемые, то есть заимствуемые у модели, действия приобретаются поначалу в символической форме. Эти «внутренние модели внешнего мира», по определению Бандуры, конструируются из наблюдаемых примеров и информации, получаемой от обратной связи в ситуациях проб и ошибок, и служат для руководства более поздним открытым действием. В символической же форме проверяются и возможные альтернативные ходы действия, а затем отбрасываются или сохраняются «на основе подсчитанных последствий». Наилучшее символическое решение претворяется в реальность. Таково вкратце, по мнению Бандуры, место когнитивной регуляции поведения: она подчинена контролю стимула и подкрепления – основных переменных в его схеме.
   Бандура попытался реализовать сформулированные им принципы научения, в частности, в исследовании агрессивного поведения. Этой проблеме посвящена специальная работа, которая так и называется: «Агрессия: анализ с позиции теории социального научения» (там же). Бандура считает, что теория фрустрации – агрессии недостаточна для объяснения агрессивного поведения. По его мнению, широкое принятие представления о фрустрации – агрессии, возможно, в большей степени следует отнести на счет его простоты, чем на счет его предсказательной силы. Несмотря на приверженность принципам научения, «теоретики драйва» не сформулировали адекватной исходной позиции для анализа агрессии с точки зрения социального научения. Бандура видит сходство данного подхода с психоаналитическим, проявляющееся в их пессимистической тональности: и в том и в другом случае человек рассматривается как обремененный источником агрессивной энергии, которая требует периодического выхода.
   Бандура предлагает другой подход, содержащий «более оптимистический взгляд на способность человека уменьшить уровень человеческой деструктивности» (там же, р. 59). Он вычленяет проблему приобретения (через научение) «поведения с деструктивным потенциалом», с одной стороны, и с другой – проблему факторов, «определяющих, будет ли личность реализовывать то, чему она научена». Схематически он противопоставляет свой подход другим подходам следующим образом:
 
 
   С точки зрения Бандуры, фрустрация – это только один и необязательно наиболее важный фактор, влияющий на агрессивное поведение. «Фрустрация наиболее вероятно должна провоцировать агрессию в людях, которые научены отвечать на отвратительное обхождение (aversive treatment) агрессивными установками и действиями…» – замечает Бандура (Bandura, 1973, р. 58). По его мнению, «агрессия вообще лучше объяснима на основе вознаграждающих ее последствий, чем на основе фрустрирующих условий и наказаний, которые она навлекает» (там же, р. 39).