Карен Прайор. Нe рычите на собаку!
Эта книга о том, как обучать кого угодно: человека или животное, старого или молодого, самого себя или других — и чему угодно. Как добиться, чтобы кот спрыгнул с кухонного стола, а бабушка перестала ворчать; как управлять поведением домашних животных, детей, начальства и друзей; как улучшить свои достижения в теннисе, гольфе, математике, развить память? Все это можно достичь, используя принципы обучения с подкреплением. Эти принципы являются такими же непреложными законами природы, как законы физики. Они лежат в основе всех ситуаций обучения, точно так же, как падение яблока основано на законах гравитации. При попытке изменить чье-либо поведение, будь то собственное или чужое, мы используем эти законы, независимо от того, знаем мы их или нет. Чаще всего мы их применяем неправильно. Мы запугиваем, спорим, принуждаем, лишаем чего-либо. Мы ругаем окружающих, когда дела идут плохо, и забываем похвалить, когда все хорошо. Мы грубы и нетерпеливы с детьми, друг с другом, даже сами с собой, и потом сожалеем об этой грубости. Зная лучшие способы управления поведением, мы достигли бы своей цели быстрее, к тому же без нервотрепки, но мы не представляем, как это сделать. Мы попросту не можем привести в соответствие те приемы, которыми современные дрессировщики достигают успеха, с законами положительного подкрепления. Какой бы ни была наша задача — заставить ли четырехлетнего малыша вести себя тихо при посторонних, отучить ли щенка грызть дома все что попало, тренировать ли спортивную команду, выучить ли стихотворение — она решается быстрее, легче, веселее, если вы знаете, как пользоваться положительным подкреплением. Законы подкрепления просты: их можно за десять минут записать на школьной доске и за час выучить. Применение их в основном зависит от ситуации, обучение с подкреплением подобно игре, в которой надо быстро соображать. Каждый может быть тренером, но некоторые от природы способны к этому больше, чем другие. Вам вовсе не обязательно отличаться каким-то особым терпением, быть сильной личностью, не требуется и особого подхода к детям и животным, можно не обладать и тем, что цирковой дрессировщик Франк Бук называет силой человеческого взгляда. Вам надо только знать, что вы делаете. Всегда были люди с интуитивным пониманием того, как применять законы дрессировки. Мы называем их талантливыми учителями, блестящими военачальниками, выдающимися тренерами, гениальными дрессировщиками. Мне приходилось наблюдать за некоторыми театральными режиссерами и многими дирижерами симфонических оркестров, которые очень умело использовали в своей работе подкрепление. Эти одаренные воспитатели не нуждаются в книге о том, как использовать законы, управляющие обучением. Однако для всех нас остальных — простых смертных, — кто вслепую пытается совладать с плохо управляемым питомцем, вступает в конфликт с ребенком или сослуживцем, знание законов подкрепления может сослужить хорошую службу. Обучение с подкреплением — это вовсе не система наград и наказаний; современные тренеры даже не используют этих терминов. Награды и наказания приходят обычно после того, как действие совершено, часто спустя длительное время, как, например, в уголовном суде. Они могут повлиять, а могут и не повлиять на будущее поведение, но они, безусловно, не могут воздействовать на уже совершенное действие. Подкрепление — будь то "положительное" , то, к чему надо стремиться, например, улыбка или ласка, или "отрицательное" — то, чего надо избегать, подобно рывку поводка или нахмуренным бровям — происходит именно во время поведения, на которое надо воздействовать. Подкрепление изменяет поведение только тогда, когда дается в правильно выбранный момент.
Впервые я услышала об обучении с положительным подкреплением на Гавайях, куда в 1963 году я была приглашена старшим тренером дельфинария "Жизнь моря". Раньше я дрессировала собак и лошадей, пользуясь традиционными методами, но дельфины — другое дело; на животное, которое просто уплывает от тебя, не воздействуешь поводком, уздечкой или даже кулаком. Положительное подкрепление — в основном ведро с рыбой — единственное, чем мы располагаем. Психологи в общих чертах познакомили меня с принципами обучения с подкреплением. Искусство применения этих принципов я постигла при работе с дельфинами. Имея биологическое образование и всю жизнь интересуясь поведением животных, я оказалась очарованной не столько дельфинами, сколько моим с ними взаимным общением во время дрессировки. То, чему я обучилась, работая с дельфинами, я стала применять и в дрессировке других животных. И я начала замечать, как эта система входит в мою повседневную жизнь. Например, я перестала кричать на своих детей, потому что заметила, что крик не помогает. Подмечать поведение, которое мне нужно, и сразу подкреплять его — это гораздо более действенно, да к тому же еще и сохраняет мирные отношения в семье.
Тот опыт, который я извлекла из дрессировки дельфинов, имеет солидное теоретическое обоснование. В этой книге я постаралась держаться подальше от теоретизирования, так как, насколько мне известно, правила по применению этих теорий обычно не описываются наукой и, с моей точки зрения, ученые часто неправильно ими пользуются. Но основные законы уже твердо установлены и должны приниматься во внимание при обучении.
Основа этой теории по разным источникам известна как модификация поведения, теория подкрепления, оперантное обусловливание, бихевиоризм, психология поведения и т.д.; это тот раздел психологии, который принес мировую известность Б.Ф.Скиннеру, профессору Гарвардского университета.
Я не знаю другой современной области науки, которую бы в такой степени поносили, не понимали, переиначивали, неправильно истолковывали и неверно использовали. Одно только имя Скиннера приводит в ярость тех, кто является поборником "свободной воли" в качестве характеристики, отделяющей человека от животного. Для тех, кто воспитан в гуманистических традициях, воздействие на поведение человека при помощи своего рода осознанной техники кажется непоправимо безнравственным, несмотря на тот очевидный факт, что все мы пытаемся влиять на поведение друг друга любыми попавшимися под руку средствами.
Пока гуманисты нападали на бихевиоризм и самого Скиннера с таким же жаром, с каким когда-то правоверные обрушивались на еретиков, бихевиоризм превратился в громадный раздал психологии, которым занимаются целые факультеты в университетах, он широко применяется в клинике, бихевиористы издают специальные журналы и созывают международные конгрессы бихевиоризму обучают на специальных курсах, в нем возникает ряд доктрин и разных течений, ему посвящаются целые горы литературы. Это принесло определенную пользу обществу. Некоторые болезни — например, аутизм — оказались более чувствительны к формированию и подкреплению, чем к любым другим воздействиям. Многие врачи успешно разрешали эмоциональные проблемы своих пациентов, используя приемы бихевиоризма. Большая эффективность простого изменения поведения по сравнению со скорпулезным копанием в источниках его происхождения — по крайней мере в некоторых обстоятельствах — способствовала возникновению семейной терапии, в которой рассматривается поведение каждого "иена семьи, а не только того, чье страдание наиболее очевидно. Обучающие машины и программированные учебники, разработанные на основе Скиниероаской теории, были первыми попытками разбить обучение на этапы и поощрять обучающегося за правильные ответы. Эти ранние механизмы были неуклюжими, но именно они были предвестниками компьютерного обучения, которое оказалось не только высокоэффективным, благодаря совершенству выбора времени подкрепления компьютером, но и висело в процесс обучения веселые нотки в связи с забавным характером подкрепления (фейерверки, танцующие роботы). Программы подкрепления, использующие жетоны и талоны, которые можно накопить и обменять на конфеты, сигареты или какие-то льготы, были установлены в психиатрических лечебницах и некоторых других учреждениях. Нет недостатка в программах аутотренинга, позволяющих следить за весом и изменением других привычек в нужную сторону, и все они основаны на положительном подкреплении. Интересным применением подкрепления для тренировки физиологических реакций является биологическая обратная связь. Академические ученые изучили мельчайшие аспекты обуславливания. Например, одно исследование показывает, что если вы составляете таблицу, чтобы следить за своими успехами в выполнении какой-либо саморазвивающей программы, то вы скорее выработаете новые привычки, если будете ежедневно не ставить в клеточке соответствующей графы крестик, а сплошь ее зачеркивать. Обрастание деталями преследует конкретные психологические цели, но я не смогла извлечь из них большой пользы для обучения. Тренинг представляет собой петлю, двустороннюю связь, в которой события на одном конце изменяют события на другом, точно так же, как это происходит в кибернетической системе с обратной связью, хотя многие психологи рассматривают свою работу, как нечто, что они дела ют по отношению к субъекту, а не совместно с ним. Для настоящего тренера наиболее интересными и потенциально наиболее плодотворными событиями в процессе обучения являются идеосинкразические и неожиданные ответы, которые может дать каждый испытуемый, хотя почти во всех научных работах стремятся игнорировать и свести к минимуму индивидуальные реакции. Изобретение методов, которые Скиннер назвал "формирование" для последовательного изменения поведения и реализация этих методов — процесс творческий. Несмотря на это, психологическая литература изобилует программами формирования, которые Настолько невообразимы, чтобы не сказать неуклюжи, что, с моей точки зрения, представляют собой жестокое и необычное наказание. Возьмем, например, приводимый в одном из последних научных журналов метод борьбы с ночным самопроизвольным мочеиспусканием, который включает не только установку специальных датчиков влажности в детской постели, но и присутствие врача, проводящего ночь рядом с ребенком! При этом авторы указывают, что этот способ дорого обходится семье. А какова же его цена для психики ребенка? Такой способ "поведенческого" решения вопроса подобен попытке бить мух лопатой. Прежде чем двигаться дальше, я должна извиниться перед всеми профессиональными бихевиористами, которые обеспокоены моим лихим использованием терминологии теории подкрепления. Словарь Скиннера имеет несколько элегантных определений, таких, как оперантное обучение, которое подчеркивает, что субъект является оператором, а не только пассивным участником, или последовательное приближение, предполагающее постепенный характер процедуры формирования навыков. Однако, обучая тренингу, я обнаружила, что люди спотыкаются об эту непривычную терминологию. Чтобы четко изложить предмет, вы должны обучить двум вещам; самой сущности работы и подходящему способу ее обсуждения. По мере распространения из университета в университет Скиннеровская терминология подверглась некоторой модификации; то, что одни называют условными стимулами, другие предпочитают именовать различительными стимулами, а третьи употребляют жаргонное выражение "S-дельта". Этот специфический словарь все время разрастается. Поэтому я пожертвовала научной точностью ради такой терминологии, которая, как мне кажется будет понятной. Шопенгауэр сказал однажды, что каждая оригинальная идея сначала осмеивается, потом на нее яростно нападают, и, наконец, она принимается как нечто само собой разумеющееся. Насколько мне известно, теория подкрепления не является исключением. Несколько лет назад Скиннера повсюду высмеивали за то, что он продемонстрировал формирование навыка, обучив пару голубей играть в пинг-понг. Теплая, комфортабельная, самоочищающаяся, полная забав комната, которую он оборудовал для своих маленьких дочерей, была высмеяна, как антигуманный, аморальный и еретический "ящик для ребенка", чуть ли не тюремная камера. До сих пор ходят слухи, что его дочери сошли с ума, хотя на самом деле они выросли прекрасными работниками и очень славными людьми. И, наконец, сейчас многие образованные люди относятся к теории подкрепления как к некому пустяку, который они понимают и знают вдоль и поперек. Фактически же большинство людей ее не понимает, иначе бы они не вели себя так скверно с окружающими. В течение многих лет, с тех пор, как я начала заниматься экспериментами по тренировке дельфинов, я читала лекции и писала о правилах подкрепления для научных и профессиональных кругов, а также для широкой публики. Я обучала этому виду тренинга в высшей школе и в колледжах, я работала с выпускниками университетов, домохозяйками и служителями зоопарков, с членами моей семьи и друзьями. Я наблюдала и изучала работу дрессировщиков всех возможных типов: от ковбоев до спортивных тренеров, — и заметила, что принципы подкрепляемого обучения постепенно проникают повсюду. Голливудские дрессировщики животных называют использование метода позитивного подкрепления "аффективной тренировкой" и используют эту технику, чтобы вырабатывать такие типы поведения, которых нельзя добиться силой — например, как в рекламном телеролике, где бык спокойно прогуливается по китайской лавке. Сегодня многие спортивные тренеры используют позитивное подкрепление и формирование, а не полагаются на старинный метод кнута, и при этом результаты их воспитанников значительно улучшаются. Однако нигде я не обнаружила правил теории подкрепления, описанных таким образом, чтобы ими можно было непосредственно пользоваться на практике. В этой книге я объясняю эти правила так, как я их понимаю, а также поясняю, где я считаю нужным их применять, а где, по-моему мнению, это невозможно и нецелесообразно. Тренировка с подкреплением не разрешает всех проблем — она не увеличит ваш счет в банке, не спасет от неудачной женитьбы, не поможет в случаях тяжелых заболеваний психики. Некоторые ситуации, например, плач ребенка, не имеет отношения к проблеме тренировки и требуют других методов разрешения. Некоторые типы поведения человека и животных имеют генетические компоненты, которые трудно или невозможно изменить тренировкой. Ряд проблем просто не стоит того, чтобы тратить время на тренировку. Но во многих случаях, когда жизнь бросает человеку вызов, ставит задачи и посылает неприятности, правильное использование подкрепления может оказаться полезным. Практическое использование позитивного подкрепления в одной ситуации может побудить вас использовать его и в других. Как раздраженно сказал один исследователь дельфинов, с которым я работала: "Человеку нельзя разрешать заводить детей, прежде чем он не сумеет обучить цыпленка", подразумевая, что опыт достижения результатов в обучении существа, к которому невозможно применить силу, должен показать вам, что для воспитания ребенка вы так же не нуждаетесь в применении силы. Я заметила, что у большинства дельфиньих тренеров, использующих навыки позитивного подкрепления в своей ежедневной работе, чрезвычайно милые и приятные дети. Эта книга не обеспечит вам милых детей. И она не обещает дать вам какие-либо специфические результаты или навыки. Что она даст вам, так это фундаментальные принципы, лежащие в основе любого обучения, и некоторые основные установки творческого применения этих принципов в различных ситуациях. Другими словами она даст вам искусство тренировки. Она может помочь вам преодолеть те неприятности, которые беспокоили вас в течение многих лет, или достичь успехов в трудных для вас делах. Она, конечно, поможет вам, если вы того пожелаете, и обучить цыпленка.
В теории подкрепления, по-видимому, существует естественный порядок, и в книге главы идут в той последовательности, в которой происходят процессы тренировки, от простого к сложному, как при реальном обучении, и это та самая последовательность, при которой наиболее легко овладеть профессией тренера. Книга построена таким образом, чтобы постепенно складывалось разумное понимание процесса тренировки при помощи позитивного подкрепления. Однако, так как эта теория широко применяется на практике, то в пяти главах книги в качестве примеров приводятся различные жизненные ситуации, в которых позитивное подкрепление играет положительную роль.
I. ПОДКРЕПЛЕНИЕ: ЛУЧШЕ, ЧЕМ ВОЗНАГРАЖДЕНИЕ
Что такое положительное подкрепление
Положительное подкрепление — это событие, совпадающее с каким-либо действием и ведущее к увеличению вероятности повторного совершения этого действия.
Запомните это положение. В нем заложен секрет успешного обучения.
Существуют два вида подкрепления: положительное и отрицательное. Положительное подкрепление — это нечто, желаемое субъектом: пища, ласка или похвала. Негативное подкрепление — это то, чего субъект хотел бы избежать: шлепок, нахмуривание бровей, неприятный звук (предупреждающий зуммер в машинах, который раздается, если вы забыли пристегнуть ремень безопасности, — это отрицательное подкрепление).
Поведение, которое уже встречается вне зависимости от того, насколько оно спорадично, всегда можно усилить с помощью положительного подкрепления. Если вы зовете щенка, и он подходит к вам, а вы его ласкаете, то в дальнейшем подход щенка на зов становится все более и более надежным даже безо всякого другого обучения. Предположим, что вы хотите, чтобы кто-то позвонил вам — ваш отпрыск, родитель или любимый. Если он или она не звонит, то тогда уж ничего не поделаешь. Самое главное в обучении с подкреплением то, что вы не можете подкрепить поведение, которое не встречается. С другой стороны, если вы всегда проявляете радость, когда любимые вам звонят, то это значит что их поведение положительно подкрепляется, вероятность частоты их звонков, очевидно, увеличится. Конечно, если вы примените отрицательное подкрепление — "Почему ты не позвонил, почему я должна тебе звонить, ты мне никогда не звонишь" и т.д., замечания, которые вызывают раздражение, — вы создаете ситуацию, при которой звонящий избегает неприятностей тем, что не звонит; фактически вы обучаете их не звонить. Простое введение положительного подкрепления за поведение является наиболее элементарной частью этого вида обучения. В научной психологической литературе встречаются такие выражения: "Были использованы поведенческие методики" или "Проблема была решена с помощью поведенческого подхода". Обыкновенно это означает, что они отдают предпочтение положительному подкреплению перед другими использованными ими методами. Это совсем не означает, что они использовали весь арсенал приемов, описанных в этой книге; они могут и не знать о них. Однако введение положительного подкрепления часто является единственно необходимым мероприятием. Кстати, например, наиболее действенный способ приучить ребенка не мочиться в постель — лично похвалить его и выразить свое удовольствие, если утром простынки оказались сухими. Положительное подкрепление можно применить и к себе. В Шекспировской студии, которую я в свое время посещала, я встретила юриста с Уолл-стрит, которому было под пятьдесят и который был страстным любителем игры в сквош (игра, в которую играют ракетками и мягким мячом в закрытых кортах). Однажды он услышал, как я рассказываю об обучении, и уходя заметил, что можно испробовать положительное подкрепление на его игре в сквош. Вместо того что бы как обычно сокрушаться об ошибках, он попробует воз награждать себя за хорошие удары. Через две недели я снова встретила его. "Как сквош?" — спросила я. На его лице потаилось выражение заинтересованности и радости, что нечасто бывает с юристами с Уолл-стрит. "Сначала я чувствовал себя жутким дураком, — ответил он, — говоря: "Хорошо, Пит, молодец!" при каждом удачном ударе. Черт возьми, когда я тренировался один, я даже поглаживал себя по спине. Но затем моя игра начала улучшаться. И сейчас я на четыре ранга выше в клубной лестнице, чем был когда-либо раньше. Я побеждаю тех, у которых прежде не мог выиграть даже очко. И получаю гораздо больше удовольствия. С тех пор как я не ору на себя все время, я не кончаю игру злым и разочарованным. Если удар не получился, ничего страшного, следующие будут хорошими. И я обнаруживаю, что мне просто смешно, когда кто-нибудь другой делает ошибку, бесится, бросает ракетку — я знаю, что это не улучшит его игру, я только улыбаюсь. Какой жестокий противник. И это сразу же как только перешел на положительное подкрепление. Подкрепление относительно, не абсолютно. Дождь является положительным подкреплением для уток, отрицательным для кошек, довольно безразличен, по крайней мере во влажную погоду, для коров. Пища не является положительным подкреплением, если вы сыты. Улыбки и похвалы могут быть непригодными в качестве подкрепления, если субъект хочет вывести вас из себя. В качестве подкрепления надо выбирать нечто желаемое субъектом. Для любой тренировочной ситуации полезно иметь набор подкреплений. В океанариумах "Жизнь моря" косаток подкрепляют множеством способов: рыбой (их пища), поглаживанием или почесыванием различных частей тела, вниманием окружающих, игрушками и т.д. Все представления — это действия, при которых животное никогда не знает, какое поведение будет подкреплено в следующий раз и каким будет подкрепление; эти "сюрпризы" так интересны для животных, что представления могут идти почти без стандартных подкреплений рыбой; животные получают пищу в конце дня. Необходимость постоянного перехода от одного подкрепления к другому увлекательна и интересна и для тренеров. Положительное подкрепление приносит пользу и при взаимоотношениях между людьми. Оно лежит в основе искусства делать подарки: точно угадать, что будет иметь подкрепляющее действие (правильный выбор является подкреплением и для делающего подарок). У нас чаще всего принято доверять выбор подарков женщинам. Я даже знаю одну семью, в которой мать покупает рождественские подарки всем и ото всех. И очень забавно, когда рождественским утром братья и сестры говорят: "Смотрите, это Биллу от Энни", хотя все знают, что Энни тут ни при чем. Но это не совершенствует у детей навыка выбирать способы поощрения других. В нашем мире человек, выработавший в себе наблюдательность в отношении положительного подкрепления, имеет большие преимущества перед другими. Как мать, я сделала все, чтоб мои сыновья научились делать подарки. Например, однажды, когда они были еще маленькими — семь и пять лет, я повела их в довольно фешенебельный магазин и предложила каждому выбрать по платью для их младшей сестренки. Им понравилось, развалясь в плюшевых креслах, одобрять или не одобрять платья, которые она примеряла, как нравится какому-нибудь миллионеру помогать своей подружке выбирать норковую шубку. Их маленькая сестренка тоже получила удовольствие. Так, благодаря этому и подобным упражнениям, урок был усвоен: как по-настоящему проникнуться интересом к тому, что хочет другой человек, как находить радость в поисках положительного подкрепления для тех, кого любишь.
Отрицательное подкрепление
Психологи спорят по поводу определения отрицательного подкрепления. Для наших целей отрицательное подкрепление можно определить как то, что субъект будет стараться избегать. Отрицательные подкрепления имеют градации от слегка неприятных стимулов — едва заметный сквозняк от кондиционера в ресторане, который все-таки заставляет вас перейти за другой столик, — до всевозможных крайностей, например удара электрическим током. Наказание происходит после поведения, на которое оно должно воздействовать. Таким образом, вы не можете избежать наказания, изменив взгляды или поступки, так как неправильное поведение уже осуществилось. Малыш, которого отшлепали за плохой табель успеваемости, может в дальнейшем учиться лучше или хуже, но уже не сможет изменить того табеля, который он уже принес. Напротив, отрицательное подкрепление можно остановить или избегнуть сиюминутным изменением поведения. Допустим, сидя в гостиной у тетушки, я случайно положила ноги на кофейный столик. Тетушка неодобрительно поднимает брови. Я ставлю ноги на пол. Ее лицо мягчеет. Я чувствую облегчение. И поскольку я смогла остановить сигнал нерасположенности, совершившееся поведение было подкреплено. Я усвоила: в тетушкином доме держи ноги по дальше от мебели. Поведение может быть полностью сформировано на основе отрицательного подкрепления, как в большинстве случаев традиционной дрессировки животных: лошадь учится поворачивать налево, когда тянут за левый повод, потому что поворот прекращает неприятное давление; лев вспрыгивает на тумбу, чтобы избежать назойливого хлыста или острой палки, которые держат около его морды.
В общем, термин "подкрепление" в этой книге относится к положительному подкреплению; если я захочу обсудить отрицательное подкреняение, я оговорю это особо. Вообще же оба вида подкрепления подчиняются одинаковым правилам применения. Например, ошибка во времени подачи подкрепления не даст результатов (или результаты будут плохими) при использовании как одного, так и другого метода подкрепления.
Время подачи подкрепления
Как уже говорилось, подкрепление должно совершаться в связи с действием, которое предполагается видоизменить. Подкрепление — это информация. Оно говорит субъекту, что именно вам нравится. Когда субъект пытается обучиться, информационное содержание подкрепления становится важнее самого подкрепления. В тренировке спортсменов или при обучении танцоров именно восклицания инструктора "Да!" или "Хорошо!", отмечающие нужное движение, а не разбор тренировки или репетиции в раздевалке дают требующуюся информацию. Запоздалое подкрепление является наибольшим недочетом начинающего дрессировщика. Собака садится, но к тому времени, когда хозяин говорит: "Хорошая собака", собака уже снова стоит. За что, думает животное, его хвалят? За то, что оно встает. Если у вас возникают трудности в дрессировке, первый вопрос, который надо себе задать, не запаздывает ли ваше подкрепление. Если вы при работе с животным вдруг застряли в самый разгар дела, то иногда полезно, чтоб кто-нибудь со стороны понаблюдал за запаздыванием подкреплений.
Мы всегда слишком запаздываем подкрепляя друг друга. "Послушай, дорогая, вчера вечером ты выглядела замечательно", — звучит совсем не так, как та же фраза, сказанная вовремя. Отсрочка подкрепления может даже оказать вреднее воздействие ("А что, разве я сейчас не выгляжу замечательно?"). Мы свято верим, что сила слов перекроет ошибки во времени подкрепления. Слишком раннее подкрепление тоже неэффективно. В зоопарке Бронкса служители замучились с гориллой. Им было нужно, чтобы она выходила в вольер, чтобы можно было почистить внутреннюю клетку, но она взяла манеру сидеть в дверном проеме, и, обладая недюжинной силой, не давала закрываться скользящей двери. Когда же служители клали пищу снаружи или подманивали ее бананами, горилла либо не обращала на них внимания, либо хватала пищу и бежала обратно к своей двери, прежде чем ту успевали закрыть. Дрессировщика, работавшего при зоопарке, попросили разобраться. Он объяснил служителям, что размахивание бананами и подбрасывание пищи было попыткой подкрепить действие, которое еще не совершилось. Это называется взяточничеством. Надо было не замечать животное, пока оно сидело в дверях, но подкреплять пищей, если оно выйдет оттуда самостоятельно. Проблема была решена.
Мне кажется, что иногда и детей мы подкрепляем слишком рано, находясь под ложным впечатлением, будто мы их подбадриваем ("Молодец, хорошо, ты уже почти все сделала правильно"). Возможно, при этом мы подкрепляем попытки. Но существует разница между попыткой сделать что-то и выполнением этого. Причитания типа "я не могу" иногда отражают фактическое положение вещей, но они могут являться и признаками того, что часто подкреплялись просто попытки. Вообще, подкрепление поведения, которое еще не совершилось, — подарками, обещаниями, комплиментами или чем-нибудь в этом роде — ни капельки не подкрепляет это поведение. Если что-то и подкрепляется, так это поведение, совершающееся в данное время: вероятнее всего — выпрашивание подкрепления. Соблюдение времени очень важно и при обучении с отрицательным подкреплением. Лошадь учится поворачивать налево, когда тянут за левый повод, но только если после поворота натяжение ослабевает. Прекращение натяжения является подкреплением. Вы садитесь на лошадь, пришпориваете ее, и она движется вперед — тогда вам надо перестать ее пришпоривать (если, конечно, вы не хотите, чтобы она двигалась быстрее). Начинающие наездники часто тычут лошадь в бока непрерывно, как будто шпоры это своего рода педаль газа в автомобиле, необходимая для движения. Пришпоривание не прекращается и тем самым не несет никакой информации для лошади. Так в школах верховой езды появляются лошади с железными боками, которые передвигаются черепашьим шагом независимо от того, как часто их пришпоривают.
То же происходит и с людьми, к которым постоянно придираются и бранят родители, начальство или учителя. Если отрицательное подкрепление не прекращается в момент достижения желаемых результатов, то оно не является подкреплением и не несет информации. Оно становится как буквально, так и в терминах теории информации "шумом".
Когда я смотрю по телевизору футбол или бейсбол, я всегда поражаюсь замечательной своевременности подкреплений, вновь и вновь получаемых игроками. Как только забивают гол или бегун пересекает финишную линию, рев толпы сигнализирует полное одобрение; а только посмотрите на бешеный обмен взаимоподкреплений игроков в тот момент, когда счет открыт или игра выиграна. С артистами, особенно с киноактерами, дело обстоит совершенно иначе. Даже на сцене аплодисменты раздаются после того, как работа кончается. У артистов кино не существует своевременного подкрепления, за исключением редкого отзыва режиссера или оператора об их работе или рукопожатия; письма поклонников и положительные рецензии, приходящие спустя недели и месяцы, бледнеют в сравнении с неистовством американского стадиона в минуту успеха. Нет ничего удивительного, что некоторые звезды кино проявляют болезненную страсть к низкой лести, и сенсациям; работа может совершенно не удовлетворять, если подкрепления, даже самые блестящие, всегда опаздывают.
Величина подкрепления
Начинающие тренеры, использующие пищевое подкрепление при работе с животными, часто не знают, какова должна быть величина каждого подкрепления. Ответ таков: чем меньше, тем лучше. Чем меньше подкрепление, тем быстрее животное съест его. Это не только экономит время, но и позволяет дать большее количество подкреплений за один сеанс, прежде чем животное насытиться. В 1979 г. Национальный зоопарк в Вашингтоне, штат Колумбия, пригласил меня в качестве консультанта для обучения группы работников зоопарка технике положительного подкрепления. Одна из смотрительниц в моей группе жаловалась, что обучение панды продвигается у нее очень медленно. Мне показалось это странным, потому что интуитивно я чувствовала, что панды — эти большие, прожорливые, активные животные — должны легко поддаваться обучению с пищевым подкреплением. Я понаблюдала за ее занятиями и обнаружила, что, когда смотрительнице удавалось добиться какого-либо движения, она давала панде целую морковку. Панда долго смаковала каждую морковку, поэтому в течение пятнадцати минут отведенного ей драгоценного времени она зарабатывала только три подкрепления (а кроме того, морковь ей надоедала). Один ломтик моркови на подкрепление был бы лучше.
Вообще, подкрепление величиной в один глоток животного вполне достаточно для поддержания его заинтересованности — одно-два зернышка для цыпленка, кубик мяса в 6 мм для кошки, половина яблока для слона. Особо любимой пищи можно давать и еще меньше — например чайную ложку зерна для лошади. Служители Национального зоопарка обучали белых медведей многим полезным вещам, таким, как переход по команде в другую клетку, используя изюминки.
Основное правило дрессировщика заключается в том, что если вы собираетесь провести в день одно занятие, то можете рассчитывать на хорошую работу животного примерно за четверть его дневного рациона, остальное дается после окончания работы. Если же вам надо провести три или четыре занятия в день, то дневную порцию пищи надо разделить примерно на восемьдесят частей и за один сеанс давать двадцать или тридцать. Восемьдесят подкреплений, видимо, являются максимумом, способным заинтересовать субъекта в течение дня. (Может быть, поэтому слайдовая кассета содержит восемьдесят слайдов; по крайней мере, когда лектор просит демонстратора показать вторую кассету слайдов, я тяжело вздыхаю.)
Размер подкрепления зависит также от сложности задачи. В океанариуме "Жизнь моря" мы сочли необходимым давать каждому [дельфину] по большой макрели за их олимпийские 6—7-метровые вертикальные прыжки. Они просто отказывались делать это за обычное вознаграждение в виде двух маленьких корюшек. У людей почти всегда более трудная работа вознаграждается лучше. А если этого нет, то как мы ненавидим тяжелую работу, если нам приходится ее делать.
Большой куш
Одним из наиболее полезных приемов пищевого или какого-либо другого подкрепления для человека и животных является получение куша. Это награда, которая во много, иногда в 10 раз больше обыкновенного подкрепления и являющаяся сюрпризом для субъекта. В рекламном агентстве, где я когда-то работала, бывали официальные вечера на Рождество, а также неофициальные праздники по поводу окончания большой работы или заполучения нового клиента. Но у председателя правления была еще привычка устраивать в год один-два абсолютно неожиданных вечера. Внезапно в середине дня он проносился по всем комнатам конторы, крича, чтоб все кончали работу. Коммутаторы выключались, появлялась процессия поставщиков провизии, музыканты, буфетчики, шампанское, копченая семга, и все это только для нас и безо всякой особенной причины. Это было неожиданным кушем для пятидесяти человек. Я думаю, что это очень способствовало поднятию духа коллектива. Куш можно использовать и для того, чтоб отметить внезапное озарение. Один мой знакомый наездник, когда лошадь впервые проделывает какой-нибудь сложный маневр, соскакивает с нее, освобождает от седла и уздечки и свободно выпускает на манеж — куш полной свободы, который часто, по-видимому, может привести к образованию новой линии поведения. Как ни странно, получение всего одного куша может так же улучшить ответы непокорного, испуганного или сопротивляющегося субъекта, который вообще не проявлял нужного поведения. В океанариуме "Жизнь моря" мы проводи ли исследования по заданию ВМС США, в которых дельфин получал подкрепление за новые реакции, осуществляемые вместо старого, ранее выработанного поведения. Испытуемой была понятливая самочка по имени Хоу, которая редко давала новые ответы. Когда ей не стало удаваться получать подкрепления за свои действия, она стала неактивной, и в конце концов в течение одного занятия за двадцать минут не дала ни одного ответа. Наконец, тренер кинул ей пару рыбок "ни за что". Явно ошарашенная такой щедростью, Хоу снова стала активной и вскоре выполнила движение, которое можно было подкрепить, что привело к несомненному прогрессу на последующих занятиях. Я сама бывала в таком же положении, как этот дельфин. Когда мне было пятнадцать лет, самым большим удовольствием для меня были уроки верховой езды. Конюшни, где я занималась, продавали билеты, каждый на десять уроков; по своим деньгам я могла позволить себе один билет в месяц. В то время я жила с отцом, Филиппом Уили, и мачехой, Рики; и хотя они относились ко мне очень хорошо, я вступила в один из тех периодов юности, когда беспрерывно целыми днями бываешь невыносимо грубым и противным. Однажды вечером супруги Уйди, которые были любящими и изобретательными родителями, сказали, что они ужасно устали от моего поведения и поэтому решили меня наградить. И они презентовали мне ослепительно новый, дополнительный бесплатный билет на верховую езду. Один из них не поленился съездить на конюшни, чтобы купить его. Поразительно! Незаслуженный куш. Как мне помнится, я с ходу переменилась, и Рики Уйди подтвердила это много лет спустя, когда я писала эту книгу. Почему назаработанный куш может оказать такое внезапное и далеко идущее влияние, я не совсем понимаю. Может быть, со временем кто-нибудь напишет диссертацию по этому поводу и объяснит нам это. Я только знаю, что дополнительный билет на верховую езду мгновенно снял у меня сильные чувства угнетенности и обиды, и я подозреваю, что и дельфин чувствовал то же самое.
Условное подкрепление
Очень часто, особенно при работе с пищевым подкреплением, его невозможно дать в тот момент, когда субъект делает то, что хотели бы поощрить. Если я учу дельфина прыгать, то я никак не могу дать ему рыбку в тот момент, когда он находится в воздухе. Если за каждым прыжком следует брошенная рыбка (отставленное подкрепление), то у животного в конце концов образуется связь между прыжком и едой, и оно будет прыгать чаще. Однако это не несет информации о том, какой из аспектов прыжка мне нравится. На какую высоту? С каким прогибом? Может, надо войти обратно в воду со всплеском? Таким образом, потребуется очень много повторений, чтобы животное установило, какой именно прыжок я имела в виду. Чтобы обойти эту трудность, мы используем условное подкрепление. Условное подкрепление представляет собой какой-либо изначально ничего незначащий сигнал — звук, свет, движение, — который умышленно связывают с подачей подкрепления. Тренеры дельфинов остановили свой выбор на полицейском свистке: его хорошо слышно даже под водой и он не связывает руки, чтобы можно было давать сигналы и бросать рыбу. С другими животными я обычно использую "сверчка", десятицентовую игрушку, которая щелкает, когда на нее нажимаешь, или особые поощряющие слова, выбранные и приберегаемые для использования в качестве условного подкрепления: "хорошая собака", "хорошая лошадка". Школьные учителя часто прибегают к некоторым таким ритуальным и тщательно нормированным словам похвалы — "замечательно" или "очень хорошо", — за которые дети страстно работают и ждут их. Наша жизнь изобилует условными подкреплениями. Нам нравится слышать, как звонит телефон или видеть набитый почтовый ящик, даже если половина звонков неинтересна и большая часть корреспонденции — утиль, потому что множество случаев научили нас связывать звонок или конверт с хорошим. Нам нравится рождественская музыка, и мы ненавидим запах зубного кабинета. Мы храним окружающие нас вещи — картины, посуду, трофеи — не потому, что они красивы или полезны, а потому, что они напоминают нам о временах, когда мы были счастливы, или о людях, которых мы любили. Они представляют собой условные подкрепления. Практически дрессировка животных с использованием положительного подкрепления почти всегда должна начинаться с выработки условного подкрепления. Прежде чем начать выработку поведения как такового, пока субъект еще ничего особенного и не делает, вы учите его понимать значимость условного подкрепления, сочетая его с пищей, поглаживанием иди другим истинным подкреплением. Иногда, по крайней мере при работе с животными, вы можете уловить, когда субъект начинает узнавать ваш сигнал, означающий "Хорошо!". Видно, как животное вздрагивает при действии условного подкрепления и начинает искать истинное подкрепление. После выработки условного подкрепления в ваших руках оказывается реальный способ сообщения животному, что в его поведении вас интересует. Чтобы разговаривать с животными, вам не обязательно быть доктором Дулиттлом, можно очень многое сказать таким выработанным подкреплением. Условные подкрепления приобретают чрезвычайную силу. Так как информация "Ты прав" сама по себе представляет ценность, она не обязательно должна сопровождаться первичным подкреплением. Фактически использование пищи, ласки или чего-нибудь в этом роде можно практически свести к нулю, а условное подкрепление будет приносить прекрасные результаты. Я видела, как морские млекопитающие долго работали после насыщения за условные подкрепления, а лошади и собаки работают по часу и более с маленьким или безо всякого безусловного подкрепления. Люди конечно же тоже могут бесконечно работать за деньги, являющиеся ничем иным как условным подкреплением, обозначением вещей, которые на них можно купить, особенно люди, которые уже заработали гораздо больше денег, чем они когда-либо смогут действительно потратить, и, следовательно, пристрастившиеся к условному подкреплению. Действие условного подкрепления можно усилить, сочетая его с несколькими безусловными подкреплениями. В данный момент субъект может не хотеть, скажем, есть, но если тот же подкрепляющий звук или слово были умышленно связаны еще и с водой или другими потребностями или приятными моментами, он сохраняет свое действие и в этом случае. Мои кошки слышат слова "хорошая киса!", когда получают ужин, когда их гладят, когда их впускают в дом и выпускают из дома, когда они проделывают маленькие трюки и получают за них вознаграждение. В результате я могу использовать эти слова для поощрения кошки, спрыгивающей с кухонного стола, и нет нужды сопровождать его каким-либо безусловным подкрепдением. Быть может, причина того, что деньги оказывают на нас такое подкрепляющее действие, кроется в том, "что они могут связываться практически с чем угодно. Это чрезвычайно обобщенное условное подкрепление. Как только вы выработали условное подкрепление, вы должны пользоваться им осторожно, не разбрасывать без толку, иначе его сила уменьшится. Дети, которые ездили на моих уэльских пони, очень скоро научились говорить: "Хорошая лошадка!" только когда хотели подкрепить поведение. Если им просто хотелось выразить свою привязанность, они могли болтать с пони, как угодно, не употребляя этих слов. Однажды девочка, которая только что присоединилась к их компании, начала гладить пони, приговаривая: "Ты хорошая лошадка!". Трое остальных тотчас же ополчились на нее: "Ты за что ему это говоришь? Он же ничего не сделал!". Подобным же образом можно и должно окружить заботой и вниманием детей, супруга, родителей, любимых и друзей безотносительно к какому-нибудь определенному поведению, но необходимо приберечь что-то специально в качестве условного подкрепления чего-либо определенного. Существует множество реальных событий, заслуживающих похвалы, подкрепления, которым щедро обмениваются в счастливых семьях. Однако фальшивая или незначимая награда вскоре вызывает негодование даже у маленьких детей и теряет всякую силу в качестве подкрепления. Можно выработать и условное отрицательное подкрепление, которое может быть очень полезным. Дети и многие животные часто моментально реагируют на резкое, громкое слово запрета, которое ничем не сопровождается. Возможно, оно является первичным или безусловным подкрепле нием. Но некоторые животные — особенно этим славятся кошки — игнорируют окрики и брань. Одна моя подруга со вершенно безуспешно пыталась отучить свою кошку царапать кушетку, используя в качестве отрицательного подкрепления возглас "Нет!". Однажды в кухне она уронила большой латунный поднос, случайно упавший почти рядом с кошкой, и, когда раздался громкий грохот подноса, воскликнула: "Нет!". Кошка была страшно напугана, подпрыгнула вверх, подняв шерсть дыбом. В следующий раз, когда кошка начала драть кушетку, хозяйка крикнула: "Нет!", у кошки сделался испуганный вид, и она тотчас же перестала. Двух-трех повторений ставшего условным слова оказалось достаточно, чтобы навсегда прекратить это поведение.
Режимы подкрепления
Бытует неправильный взгляд, что если вы начали вырабатывать поведение с помощью положительного подкрепления, то должны продолжать его применение на протяжении всей дельнейшей жизни субъекта, если этого не будет, то поведение исчезнет. Это неверно: постоянное под крепление необходимо только на стадиях обучения. Вы можете несколько раз вознаградить годовалого ребенка за пользование горшком, но как только поведение заучено, предмет обучения сам о себе позаботится. Мы даем или должны давать начинающему множество подкреплений — обучение ребенка езде на велосипеде идет под настоящий поток: "Правильно, крепче держи руль, у тебя получилось, хорошо!" Но вы будете выглядеть довольно глупо (а ребенок решит, что вы сошли с ума), если вы будете продолжать хвалить его после того как навык установился. Для того чтобы поддерживать уже выученное поведение на определенном уровне надежности, не только не надо подкреплять его все время, а даже, наоборот, следует прекратить регулярные подкрепления и перейти на эпизодическое использование подкрепления, подаваемого в случайном и не предсказуемом порядке. Это и есть то, что психологи называют вариабельным режимом подкрепления. Вариабельный режим гораздо более эффективен для поддержания поведения, чем постоянный, предсказуемый. Один психолог объяснил это мне так: если у вас машина новая и всегда хорошо заводилась, а однажды, когда вы сели в нее, повернули ключ, она не завелась, то вы, может быть, и попробуете завести ее еще несколько раз, но скоро решите, что что-нибудь не в порядке, и позвоните в гараж. Поведение, состоящее в поворачивании ключа, при отсутствии ожидаемого немедленного подкрепления быстро угаснет. С другой стороны, если у вас вместо машины старая консервная банка, которая еще ни разу не заводилась с первой попытки, и каждый раз требуется целая вечность для того, чтобы привести ее в движение, вы можете продолжать попытки ее завести в течение получаса; ваше поведение по поворачиванию ключа происходит в низковероятностном режиме подкрепления и поэтому сильнейшим образом поддерживается. Если давать дельфину рыбку за каждый прыжок, то скоро прыжки станут невысокими, небрежными, лишь бы отделаться. Если теперь перестать давать рыбу, дельфин тут же перестает прыгать. Но, если после того как животное научилось прыгать за рыбку, начать подкреплять первый прыжок, затем третий и так далее наугад, поведение будет поддерживаться на более высоком уровне: не получив подкрепления, животное станет прыгать чаще, стараясь угадать счастливый номер, и прыжки могут даже усилиться. В свою очередь это позволит подкреплять выборочно наиболее сильные прыжки, - то есть посредством вариативного режима совершенствовать деятельность. Но даже некоторые профессиональные дрессировщики не могут правильно использовать вариативный режим положительного подкрепления; многим эта концепция представляется особенно трудной, не укладывающейся в голове. Нам понято, что нет нужды продолжать наказывать за неправильное поведение, если оно прекратилось, но почему бы не вознаграждать постоянно за правильное поведение. Мы не так уверены в этом только когда ставим целью добиться с помощью положительного подкрепления улучшения дисциплины. Действенность вариатавного подкрепления лежит в основе всех азартных игр. Если каждый раз, опустив в автомат 5 центов, будете получать десять, то скоро вы потеряете к этому интерес. Да, вы будете делать деньги, но какой это нудный способ! Людям нравится играть с автоматом именно потому, что невозможно предугадать заранее, то ли ничего не получишь, то ли какую-то мелочь, то ли сразу кучу денег, и когда именно будет это подкрепление (это может быть только один самый первый раз). Почему одни люди втягиваются в азартную игру, а другие могут поиграть и бросить, это уже другой вопрос, но для тех, кто попался на крючок, этим крючком стал вариативный режим положительного подкрепления. Чем длительнее интервалы между подкреплениями в вариативном режиме, тем сильнее он стимулирует поведение. Однако режимы с длительными интервалами работают против вас, когда вы пытаетесь угасить поведение. Если поведение не подкреплять совсем, то скоро появится тенденция к его угасанию; но если оно все-таки время от времени подкрепляется — неважно сколь эпизодично — одна сигарета, одна рюмка, одна поблажка ворчуну или нытику — и поведение вместо того, чтобы угасаться, может быть значительно усилено режимом с длительными интервалами между подкреплениями. Всем встречались люди, которые непонятным образом привязаны к супругам или любовникам, которые с ними плохо обращаются. Мы привыкли думать, что так бывает только с женщинами — она чувствует влечение к тому, кто груб, невнимателен, эгоистичен и даже жесток, она его все равно любит, — но это случается и с мужчинами. Каждый знает людей, которые после развода или другого рода утраты одного негодяя находят другого, в точности похожего на предыдущего. Являются ли эти люди вечными жертвами по каким-либо глубоким психологическим причинам? Возможно. Но, может быть, они — жертвы режима с длительными интервалами между подкреплениями? Если вы вступили в связь с очаровательным, обаятельным, интересным в сексуальном плане, веселым и внимательным человеком, а затем он становится все более несговорчивым, даже обидчивым, но все же время от времени проявляет свои хорошие качества, вы станете жить ради этих все более редких моментов, когда вы получаете это прекрасное подкрепление: полное очарования, обаяния, привлекательности и веселья внимание. И парадоксально с точки зрения здравого смысла, но закономерно с точки зрения теории обучения, что чем реже и непредсказуемей становятся такие моменты, тем сильнее становится их подкрепляющий эффект, и тем дольше ваша линия поведения будет сохраняться. Кроме того, легко понять, почему человек, однажды оказавшийся в таких отношениях, часто ищет их повторения: ему может казаться, что во взаимоотношениях с нормальным человеком, который сдержан и доброжелателен большую часть времени, не хватает остроты того редкого, страстно желаемого и потому вдвойне действенного подкрепления. Посмотрите на ситуацию с точки зрения человека, управляющего поведением: я могу держать ее (его) в безоговорочном подчинении, так, "Чтобы она (он) делала все, что я захочу, ради моего удобства и спокойствия, до тех пор пока я даю ей (ему) все, что она (он) хочет... изредка. Это один из способов, которыми сутенеры держат в повиновении своих девочек. Конечно, это крепкие путы, но однажды жертва осознает, что сила "очарования" по крайней мере отчасти зависит от режима подкрепления, и спокойно уйдет от этого типа отношений и поищет что-то другое.
Исключения из правила вариативного подкрепления
Лишь в одном случае не следует прибегать к вариативному режиму подкрепления, после того как поведение заучено, — это когда оно направлено на решение своего рода головоломки или теста. При одном из видов дрессировки собака должна выбирать из нескольких разнородных предметов тот, который побывал в руках у хозяина и хранит его запах. При этом необходимо каждый раз говорить собаке, что она выбрала правильно, чтобы в следующий раз она знала, что надо делать. В тестах на различение, — скажем, идентификация более высокого из двух звуков — необходимо подкреплять каждый правильный ответ испытуемого, чтобы он был постоянно информирован о том, какую задачу он решает (подойдет, конечно, и условное подкрепление). Когда мы отгадываем Кроссворд или составляем картинку-загадку, мы получаем подкрепления за правильные догадки, так как только они являются "подходящими". Если бы при составлении картинки-загадки можно было вставить в одну ячейку несколько кусочков, то положительного подкрепления за правильный выбор, который является обязательной обратной связью в любой ситуации выбора, не получалось бы.
Долговременные программы поведения
В дополнение к вариативному режиму подкреплений можно ввести и закрепленный, при котором субъект знает, что он должен работать определенное время или выполнить определенный комплекс поведенческих реакций за каждое подкрепление. Например, подкрепляя каждый шестой прыжок, можно сделать так, что дельфин будет прыгать шесть раз подряд, и вскоре получим стабильные серии из шести прыжков. Трудность работы с фиксированным режимом подкрепления состоит в том, что первые ответы в сериях не подкрепляются и возникает тенденция к уменьшению затрачиваемых на них усилий. У прыгающего дельфина со временем все прыжки, кроме последнего, который действительно подкрепляется, уменьшаются. Это отрицательное влияние фиксированного режима подкреплений является важным фактором во многих видах человеческой деятельности — например на заводском конвейере. Чтобы получить подкрепление, необходимо работать в течение определенного времени, но так как подкрепление дается в фиксированном режиме, независимо от качества выполнения, человек совершенно естественно стремится делать то наименьшее количество работы, которое позволяет не выпасть из игры, особенно низкая производительность может быть в начальный период работы. Зарплата по пятницам является фиксированным подкреплением, делающим понедельник тяжелым днем. У дельфинов поддержать поведение поможет случайное подкрепление первого или второго прыжка, помимо шестого. У людей могут быть эффективны различные виды прогрессивных оплат или других подкреплений (например, награды), тесно связанные с качеством и количеством продукции и выдаваемые неодновременно с обычным подкреплением. Применяя либо фиксированный, либо вариативный режимы подкрепления можно оттренировать чрезвычайно длинные цепи поведенческих реакций. Можно добиться того, что цыпленок будет клевать кнопку сто и более раз за каждое зернышко пшеницы. Для людей также можно привести много примеров отставленного вознаграждения. Один психолог шутит, что самым длительным режимом неподкрепляемого поведения в человеческой жизни является учеба в школе. При режимах подкрепления с чрезвычайно длительными интервалами иногда создаются ситуации, которые не приносят организму полезного результата. Для цыпленка это определяется обменными процессами: когда на клевание кнопки он начинает тратить больше энергии, чем может восстановить при получении пшеничного зерна, поведение начинает угасать — цена работы падает так низко, что ее просто становится незачем делать. Конечно, так часто бывает и с людьми. Другое явление, встречающееся при очень длительных интервалах между подкреплениями, — замедленный старт. Начав клевать, цыпленок совершает эти действия с постоянной частотой, так как каждый удар приближает его к подкреплению, но было отмечено, что по мере того, как увеличиваются интервалы между подкреплениями, он стремится "отложить" начало реакции на более длительный срок. Это и называется "отсроченное начало поведения с долговременной программой" и очень распространено в жизни людей. В любой долгосрочной задаче, начиная с уплаты подоходного налога и кончая уборкой гаража, можно придумать бесконечное количество причин для того, чтобы не начать дело безотлагательно. Написание чего-либо, иногда даже просто письма, тоже поведение с долгосрочной программой. Когда оно уже начато, все идет прекрасно. Но так трудно заставить себя сесть и начать! Джеймс ТУрбер находил, что начать статью настолько трудно, что иногда он обманывал свою жену (которая по понятным причинам была чрезвычайно заинтересована в том, чтобы он писал статьи, так как доход с них шел на оплату квартиры), лежа все утро на диване в кабинете и читая книгу, которую он держал в одной руке, а другой стучал по клавишам пишущей машинки. Феномен отстроченного начала перевешивал явное положительное подкрепление в виде денег, а симуляция печатанья на машинке, по крайней мере, предотвращала отрицательное подкрепление упреков жены. Один из способов преодоления феномена отсроченного начала заключается в том, чтобы вводить какое-либо подкрепление именно за старт, так же, как я эпизодически подкрепляю у своих дельфинов первый или второй прыжок в серии из шести. Я успешно применяла этот прием и в самовоспитании. В течение нескольких лет один или два раза в неделю я посещала вечерние занятия, что требовало много времени — три часа занятий и по часу на дорогу в один конец. Каждый раз, когда приближалось 5 часов, появлялось сильнейшее искушение не ездить. Но потом я обнаружила, что, если я разобью поездку — первую часть дела — на пять этапов: путь до станции метро, посадка в поезд, пересадка на другой, автобус до университета и, наконец, восхождение по лестнице до аудитории, и подкреплю каждое из этих начальных поведений после его выполнения маленьким кусочком шоколада, который я очень люблю, но обычно не ем, я стала способна вытащить себя из дома, а через несколько недель была в состоянии проделать весь путь на занятия без шоколада и без внутренней борьбы.
Суеверия: случайные подкрепления
В реальной жизни подкрепления возникают на каждом шагу и часто представляют собой лишь случайное стечение обстоятельств. Один биолог, изучавший ястребов, заметил, что если ястреб поймал под каким-либо кустом мышь, то в течение недели, а иногда и больше, он будет ежедневно проверять этот куст; вероятность его полета именно над этим местом обусловлена силой подкрепления. Попробуйте пройти мимо мусорной корзины, тщательно к ней не приглядываясь, если накануне - нашли в ней пять долларов. Случайное подкрепление полезно для ястреба; вообще можно сказать, что поведение животных эволюционировало так, что каждый вид обладает возможностью извлекать пользу из любого подкрепления. Однако многие случайные подкрепления не сопровождаются полезным результатом, но тем не менее могут оказать сильное влияние на поведение. Когда поведение не связано с последующими событиями, но в мозгу субъекта связывается с ними в качестве необходимого условия их осуществления, говорят о суеверном поведении. Пример этого — человек, грызущий карандаш. Если во время экзамена вам случится взять в рот карандаш и тут же вам придет в голову правильный ответ или хорошая мысль, то такое подкрепление может изменить ваше поведение: хорошие мысли пришли, когда грыз карандаш, таким образом, это действие подкрепляется. Когда я училась в колледже, у меня не было ни одного карандаша, не покрытого отметинами от зубов, — на особенно трудных экзаменах я иногда перегрызла карандаш пополам. Я была уверена, что это помогало мне думать. В действительности же это было всего лишь случайно обусловленное поведение. То же самое можно сказать отношении определенной одежды или совершении некого ритуала перед тем как взяться за какое-либо дело. Я видела одного бейсболиста, который совершал девятичленную цепочку действий каждый раз, когда готовился подать мяч: дотрагивался до кепки, касался мячом перчатки, сдвигал кепку вперед, тер ухо, сдвигал кепку назад, шаркал ногой и т.д. В трудные моменты он мог повторить все девять действий дважды, никогда не нарушая их порядок: Эта последовательность действий совершалась очень быстро, комментаторы никогда не останавливались на ней — но тем не менее она представляет собой сложное суеверное поведение. "Суеверия" часто возникают при дрессировке животных. Животное может руководствоваться в своих ответах такими критериями, которые вы и не собирались вводить, но которые часто случайно совпадали с подкреплениями и образовали условную связь. Например, животное может считать, что чтобы получить подкрепление, оно должно находиться в определенном месте, повернуться в какую-либо сторону или особым образом сидеть. Когда вы захотите, чтобы оно работало в новом месте или при другой ориентации, внезапно загадочным образом все поведение ломается, и пойди пойми почему это произошло. Поэтому гораздо лучше, как только поведение начинает формироваться, начинать разнообразить варианты условий, которые не представляются вам важными, чтобы не возникло какого-либо случайного обусловливания, которое впоследствии будет вам мешать. Более всего следите, чтобы не образовывались случайные временные связи. Как животное, так и люди очень хорошо чувствуют временные интервалы. Однажды я была совершенно уверена, что обучила двух морских свинок прыгать по команде (по сигналу моей руки), пока один из посетивших нас ученых не доказал мне с секундомером в руке, что они прыгают каждые двадцать девять секунд. Это у меня произошло случайное обусловливание подачи команды с очень большой регулярностью, а они воспользовались этим вместо той информации, которой они должны были пользоваться по моему предположению. Многие потомственные дрессировщики находятся просто в плену суеверного способа мышления и поведения. Среди них я встречала некоторых, которые говорили, что дельфины предпочитают людей, одетых в белое, что мулов необходимо бить, что медведи не любят женщин и т.д. Это относится и к тем, кто работает с людьми и считает, например, что на пятиклассников необходимо кричать и что наказание необходимо, чтобы добиться уважения. Такие воспитатели находятся во власти традиции, они вынуждены всегда работать одними и теми же способами, так как не могут разделить действенных методов от того, что является просто суеверием. Эта слабость, или смешение, обнаруживается у представителей многих профессий — в образовании, технике, военном деле, но в большей мере, пожалуй, в медицине. Ужас сколько всего назначается пациенту не потому, что это обладает целебными свойствами, а просто потому, что так всегда делали или все сейчас делают. Каждый, кто хоть раз лежал в больнице, может вспомнить с полдюжины примеров ненужных действий, которые представляют собой не более как суеверное поведение. Интересно, что суеверное поведение не исчезает, если вы просто указываете на его неэффективность; будучи очень сильно заученным, оно соответственно сильно оберегается. Попробуйте поговорить с врачом о его привычке использовать неэффективное или даже вредное лечение, и вы полу чите отпор в соответствующих выражениях; я уверена, что и тот бейсболист с девятиступенчатым суеверным выражением нервного возбуждения будет яростно противиться всякому, кто предложит ему играть в мяч, скажем, без кепки, до которой он четырежды дотрагивается. Единственный способ избавиться от суеверного поведения — это убедиться, что оно не связано с подкреплением. Мой сын Тэд очень любит фехтование. Два-три раза в неделю он ходит на тренировку, а по выходным часто ездит на соревнования. Однажды во время поединка с сильным партнером он почувствовал себя подавленным, потому что оставил дома свою любимую шпагу. Он проиграл матч. Потом он понял, что ощущение подавленности, очевидно, гораздо больше влияет на его действия, чем та шпага, которой он пользуется, а следовательно, иметь "любимую" шпагу— суеверие. Тэд выявлял и боролся с любым суеверным поведением, которое могло бы связаться с фехтованием. Он обнаружил у себя много таких пунктиков, начиная с привязанности к некоторым предметам одежды до внутреннего убеждения, что на его бой может повлиять приснившийся сон, спор или даже отсутствие фруктового сока на соревнованиях. Систематически анализируя каждое из этих обстоятельств, он разорвал одну за другой свою зависимость от них, так как понял, что это суеверия. И в результате теперь он выходит на каждый бой спокойным и уверенным, если даже перед этим ему снился кошмар про опоздание на поезд, потерю снаряжения, баталии с таксистами, если даже он фехтует одолженной шпагой в тренировочном костюме и в разных носках.
Чего можно добиться с помощью положительного подкрепления
Вот несколько примеров того, чего добились мои знакомые с помощью положительного подкрепления: Джуди, дизайнер по профессии, чтобы оставаться в форме, поступила в вечерний рисовальный класс при соседнем университете, где занятия происходили раз в неделю; из двадцати человек в классе большинство тоже были дизайнерами, либо коммерческими художниками. Преподаватель на неделю задавал домашнюю работу, выполнением которой многие из этих занятых людей себя не утруждали. Преподаватель каждый раз по десяти, а то и более минут разглагольствовал о слабом выполнении домашних заданий. Устав от того, что их без конца бранили, Джуди предложила преподавателю подкреплять тех. Кто принес домашние работы, вместо того чтобы вправлять мозги тем, кто не сделал их. Так он и поступил, подкрепляя своих учеников публичной похвалой за каждое выполненное задание. К третьей неделе в классе не только улучшилось настроение, но и возросло число выполнивших домашнее задание с одной трети до трех четвертей класса. Шеннон, студентка колледжа, пришла в гости к одним знакомым и застала такую сцену. Четверо взрослых безуспешно и не без некоторого риска для себя пытались удержать немецкую овчарку и полечить ее больное ухо. Шеннон, которая не особенно любит собак, но изучает роль положительного подкрепления, достала из холодильника немного сыра и за пять минут научила собаку сидеть смирно, пока она без посторонней помощи обработала ей ухо. Молодая женщина вышла замуж за человека, который очень любил распоряжаться и командовать. Хуже того, и его отец, который жил с ними, тоже взялся помыкать невесткой. Эту историю рассказывала мне мать девушки. Она была в ужасе, когда впервые увидела, что приходится терпеть ее дочери. "Не беспокойся, мама, — сказала дочь, — поживем — увидим". Дочь взяла за правило как можно меньше реагировать на команды и резкие реплики, и одновременно подкреплять послушанием и живостью реакции любое проявление вежливости и внимания со стороны мужчин. За год она превратила их в очень славных людей. Теперь, когда она приходит домой, они встречают ее улыбками, и оба с радостью соглашаются помочь с покупками. Одна восьмиклассница, жившая в городе, любила по выходным брать свою собаку на загородные прогулки, но собака часто убегала очень далеко и не возвращалась на зов, особенно когда наступала пора ехать домой. Однажды во время прогулки, когда, бегая туда-сюда, собака сама подходила к девочке, та начала очень живо на это реагировать — хвалить, гладить, болтать, обнимать, возиться с собакой. Когда пришло время ехать домой, девочка позвала собаку, и та с радостью подошла к ней. Громадное радушие в качестве положительного подкрепления, очевидно, перевесило обычное продление собакой своей свободы. Больше на прогулках неприятностей с ней не было. Новый администратор одного грозного босса прикинул, что из его работы может являться подкреплением для босса — например принесение бумаг на подпись, — и старался как можно чаще приурочить это дело ко времени, когда босс не был в ярости. Босс стал спокойнее и, подписывая бумаги, стал даже отпускать шутки. Некоторые люди создают особые типы подкреплений, чтобы заслужить их, другие готовы многим пожертвовать. Аннет, неработающая женщина, имеющая взрослых детей и живущая за городом, была бы практически оторвана от мира, если бы не обилие друзей, которые звонят ей по телефону каждую неделю, а то и чаще, чтобы поделиться новостями. Это не только соседи или родственники, звонят и многие занятые работающие, женщины, живущие далеко. И я одна из них. Почему же мы все звоним Аннет? Если у вас плохие новости — вы заболели гриппом, у вас грядет ревизия или няня вашего ребенка переехала в Кливленд, — вы получите у Аннет сочувствие и совет; но так поступит и любой друг при хороших же новостях от Аннет получаешь необычайное подкрепление. Сообщите ей, что банк открыл вам кредит, она не просто скажет: "Колоссально!". Она точно расскажет чем вы это заработали и заслужили. "Вот видишь? — откликнется Аннет. — Вспомни, как ты много работала, чтобы обеспечить хорошую сумму кредита. Вспомни все неприятности, которые у тебя были с телефонной компанией и с получением билета на самолет. Это тебе награда; в тебе признали деловую женщину. Для этого надо было делать правильные шаги, и ты их делала. Я просто горжусь тобой!" Невероятно! Это больше, чем одобрение, это подкрепление за прошлые усилия, которые в данное время кажутся в основном неудачами. Аннет принимает хорошие новости не с точки зрения "удачи", а превращает их в подкрепление. Это конечно же подкрепляет вашу склонность звонить Аннет.
Организованное подкрепление
Собрания участвующих в распродаже, клубы организации рекламы, курсы Дейдла Карнеги, общество контроля за собственным весом, да и большинство организаций, в которых происходит групповое обучение самоусовершенствованию используют в основном влияние подкрепления индивидуума группой. Похвала, медали, церемонии награждения и другие формы группового признания являются мощными подкреплениями, используемыми иногда с большим воображением. Директор фирмы, занимающейся распродажей, желая вознаградить свою "команду" за удачный год, арендовал футбольный стадион, устроил большой праздник для служащих старших администраторов и членов их семей; он сделал так, что комиссионеры выбегали на поле через туннель для игроков, а на табло под аплодисменты всех присутствующих вспыхивали их имена. Несколько лет назад я посещала курсы хозяйствования Вернера Эрхарда, программа не лишена духа торгашества, но с точки зрения обучения это, как мне кажется остроумное, а часто даже блестящее применение формирования и подкрепления. Программа, называлась, и я думаю справедливо, тренировкой. Руководитель назывался тренером. Целью формирования было лучше познать самого себя, а основным подкреплением были не реплики тренера, а поведение всей группы, не имеющее словесного выражения. Чтобы групповое поведение стало подкреплением, 250 человек, составлявших группу, просили аплодировать каждому выступавшему независимо от того, понравилась ли им речь или нет. Таким образом, с самого начала застенчивые были ободрены, смелые вознаграждены, и все выступления, как проникновенные, так и бессодержательные получили признание группы. Поначалу аплодисменты были не более чем обязанностью. Но скоро они стали действительно коммуникативным средством, выражающим не степень удовольствия, как в театре, а оттенки чувств и значений. Например, в нашей группе, а я полагаю, что такое бывает в каждой подобной группе, был заядлый спорщик, который часто подвергал сомнению то, что говорил тренер. Когда это произошло в третий или четвертый раз, тренер вступил с ним в спор. Всем было ясно, что с точки зрения логики любитель споров на этот раз был в общем-то прав. Но поскольку спор тянулся и тянулся, всем остальным в аудитории было все равно, кто прав. Все 249 человек желали только одного: чтобы он замолчал и сел на место. Правила игры, то есть формирующие правила, не позволяли нам протестовать или сказать ему, чтобы он замолчал. Но постепенно всеобщее молчание дошло до его сознания. Мы видели, что он начинает понимать, что никому нет дела до того, что он прав. Может бьпъ, не всегда надо доказывать свою правоту. Мало-помалу он погрузился в молчание и сел. Группа немедленно разразилась целой бурей аплодисментов, выражавших сочувствие и понимание наряду с сердечным облегчением — очень мощное положительное подкрепление озарения, которое пришло к спорщику. Случаи обучения такого типа, в которых важную роль играют поведенческие аспекты, а не словесное выражение, безумно трудно объяснить постороннему. Эрхард, подобно учителю дзен, часто прибегает к афоризмам; в случае описанного выше спорщика говорится так: "Когда ты прав, с тебя требуется только одно — быть правым". Это значит, что не обязательно нравиться или вызывать другие приятные чувства: только быть правым. Если бы мне пришлось привести этот афоризм на вечеринке, на которой кто-нибудь распинается, человек, окончивший курсы, посмеялся бы, да и любой хороший современный тренер посмеялся бы, но большинство присутствующих решило бы, что я не в своем уме или пьяна. Озарение при тренировке не требует словесного выражения.
Самоподкрепление
Одним из наиболее полезных практических применений подкрепления является самоподкрепление. Мы им часто пренебрегаем, отчасти потому, что это не приходит нам в голову, отчасти, потому что склонны требовать от себя гораздо больше, чем от других. Как сказал один мой знакомый министр: "Немногие имеют столь низкие критерии, что по ним легко жить". В результате мы часто по нескольку дней не расслабляемся, переходя от одной задачи к другой, от нее к третьей, не замеченные и неотблагодаренные даже самими собой. Не говоря уже о подкреплении себя за изменение какой-либо привычки или приобретение нового навыка, какое-либо подкрепление необходимо и просто для будничной жизни; лишение себя подкреплений, мне кажется, — один из факторов повышения нервозности и депрессий.
Вы можете подкрепить себя здоровыми способами — часом досуга, прогулкой, разговором с друзьями или хорошей книгой; или нездоровыми — сигаретами, виски, пищей, от которой толстеют, наркотиками, сидением допоздна и т.д. Мне нравится высказывание актера Рута Гордона: "Актер должен получать комплименты. Если мне приходится долго обходиться без комплиментов, я хвалю себя сам, и это хорошо хотя бы потому, что при этом я уверен в искренности".
II. ПРОЦЕСС ВЫРАБОТКИ: ФОРМИРОВАНИЕ ВЫСШИХ ФОРМ ПОВЕДЕНИЯ БЕЗ ПРИНУЖДЕНИЯ И БОЛИ
Что такое процесс выработки
Подкрепить поведение, которое уже имеется, чтобы оно возникало чаще, — это понятно, но как обучающим заставить своих подопечных делать то, что случайно может ни когда и не возникнуть? Как заставить собаку сделать сальто назад или дельфина прыгнуть через обруч?
Когда дело касается собак, делающих сальто, дельфинов, прыгающих через обруч, или людей, бросающих баскетбольный мяч в кольцо, то эти действия уже совершаются в процессе выработки. Выработка же состоит в том, чтобы использовать малейшую тенденцию изменений поведения в нужном направлении и шаг за шагом сдвигать ее к поставленной цели. На лабораторном жаргоне это называется последовательное приближение. Процесс выработки возможен потому, что поведение живых существ вариабельно. Что бы живое существо ни делало, в одних случаях оно выполняет это более энергично, чем обычно, а в других случаях — наоборот. Неважно, сколь сложно и трудно то окончательное поведение, которое вы хотите выработать, вы всегда можете, установить ряд последовательных целей, найти какое-либо поведение, которое осуществляется уже сейчас, и использовать его как первый шаг. Например представим, что я решила обучить цыпленка "танцевать". Я могу начать с наблюдения за естественными движениями цыпленка и давать ему подкрепление всякий раз, как он повернется налево. Скоро первая цель будет достигнута: цыпленок начнет поворачиваться налево гораздо чаще, а вследствие вариабельности эти повороты будут то меньшими, то большими. Теперь я могу избирательно подкреплять только более выраженные движения налево — например поворот на четверть круга. Когда эти движения станут преобладающими, естественная вариативность обусловит то, что некоторые повороты будут совершаться менее, чем на четверть круга, а некоторые будут приближаться к половине круга. Я могу повысить критерий, выдвинуть новую задачу и начать отбирать повороты на полкруга и более. Когда цыпленок обучится совершать несколько полных поворотов на большой скорости за одно подкрепление, я могу считать, что достигла своей конечной цели — танцующего цыпленка. Мы все хорошо знакомы с выработкой поведения, являясь участниками или объектами этого процесса. - Попросту говоря, большая часть воспитания ребенка — процесс выработки поведения. Обучение различным физическим навыкам — от тенниса, до печатанья на машинке — представляет из себя в основном выработку поведения. Мы находимся в процессе выработки или, по крайней мере, стараемся что- либо выработать всякий раз, когда упражняемся в чем-либо, начиная от публичного выступления, кончая игрой на фортепьяно. Мы находимся в процессе выработки и тогда, когда пытаемся изменить свое поведение — бросить курить, быть менее застенчивым, лучше распоряжаться деньгами. Достигли или не достигли мы успеха в формировании 'ка кого-либо поведения у себя или кого-то другого, в конечном счета зависит не от нашего искусства, а от настойчивости. Музыкальный критик газеты "Нью-Йорк Таймс" писал об одном европейском дирижере, который не будучи великим музыкантом добивался необыкновенной музыки, заставляя свой оркестр репетировать каждый концерт в течение целого года. Большинство из нас может достичь определенного совершенства почти в любой деятельности, если потратить на это достаточно времени. Но это скучно. Разве мы не хотим всегда обучиться новому — катанию на лыжах, игре на пианино, как и любой другой деятельности — как можно быстрее? Конечно, хотим, и вот тут все дело в правильной выработке навыка. Далее, разве мы не предпочитаем избежать вообще или сократить до минимума повторения? Опять-таки, конечно же, но некоторые физические навыки требуют повторения, потому что мускулы "учатся" медленно, и требуется многократное повторение движений, прежде чем они станут совершаться с легкостью. Но даже в этом случае хорошо спланированная программа выработки может свести до минимума необходимую тренировку и сделать значимым каждый момент практических занятий тем самым чрезвычайно ускоряя совершенствование И наконец, в спорте, музыке и других творческих устремлениях вы можете захотеть развить не только стабильное выполнение навыка, но и выполнение на том наивысшем уровне, который доступен вам или тому, кого вы обучаете В этом случае правильное использование законов направленной выработки может быть решающим.
Способы и приемы или закономерности
Есть два аспекта выработки: первый способ и приемы, то есть последовательность шагов, необходимых для выработки типа поведения, и второй — закономерности или правила, предписывающие, как, когда и почему эти типы поведения должны подкрепляться.
Большинство тренеров, большинство книг о тренировке и большинство тех, кто обучает тренеров,- имеет дело пото[м] исключительно со способом или приемом. "Возьмите в руки клюшку для гольфа как показано на рисунке", "Подведите прицел винтовки под нужное место мишени", "Никогда не наклоняйтесь в горах", "Взбивайте яйца металлическим венчиком по часовой стрелке" Это прекрасно. Эти приемы обычно складываются годами при участии многих людей, путем проб и ошибок, и поэтому они оптимальны. В самом деле вы будете более уверенно сидеть на лошади, если пятки у вас опущены, а мяч для гольфа будет послан вами дальше, если вы хорошенько отклонитесь в сторону замаха. Если вы заинтересованы в том, чтобы овладеть каким-либо навыком, я могу вас уверить, что вы извлечете максимум возможного от устоявшихся приемов выполнения действий, которые включаются в данный навык, почерпнув это из книг, от преподавателей, инструкторов и наблюдая или изучая действия других людей. Другую сторону выработки составляют закономерности, которые регулируют сам процесс обучения: когда надо поднажать, когда подослабить обучение; как наиболее эффективно повышать критерии, что делать, если возникли затруднения, и, вероятно, самое главное — когда остановиться. В этих вопросах обычно полагаются на интуицию и опыт тренеров или инструкторов, на случай или удачу. Между тем именно успешность применения этих закономерностей определяет разницу между просто хорошим и великим преподавателями, между радостным, быстрым и успешным обучением и обучением, приводящим к срывам, медленным, скучным и неприятным. Хороший процесс выработки, а не только хорошие приемы, делают обучение эффективным.
Десять правил выработки
С моей точки зрения существуют десять правил, управляющих процессом выработки. Некоторые — по крайней мере четыре первых — берут начало из психологических лабораторий и установлены экспериментально. Другие, насколько мне известно, даже не являлись предметом специального изучения, но рассматриваются всеми, кто имел дело с выработкой поведения, как неотъемлемая особенность: вы всегда знаете (обычно слишком поздно), когда вы нарушили одно из них. Я перечислю эти правила, а затем несколько подробнее остановлюсь на каждом из них:
1. Повышайте критерий небольшими градациями, чтобы у субъекта всегда была реальная возможность выполнить требуемое и получить подкрепление.
2. В конкретный промежуток времени отрабатывайте что-нибудь одно, не пытайтесь формировать поведение по двум критериям одновременно.
3. Прежде чем увеличивать или повышать критерий, пользуйтесь подкреплением текущего уровня ответа, т.е. подкрепляйте любое исполнение данного действия, имеющегося в данный момент.
4. Вводя новый критерий, временно ослабьте старые.
5. Будьте впереди того, кого вы обучаете: полностью планируйте свою программу выработки так, чтобы в случае внезапного успеха обучаемого, вы знали, что следует подкреплять далее.
6. Не меняйте тренеров на "середине реки"; у вас может быть несколько инструкторов на одного обучающегося, но придерживайтесь одной программы выработки на каждый из типов поведения.
7. Если одна процедура выработки не приносит успеха, найдите другую, существует столько же способов добиться нужного поведения, сколько инструкторов, способных их придумать.
8. Не кончайте тренировку, не дав положительного подкрепления, это соответствует наказанию.
9. Если навык ухудшается, "возвратитесь к детскому саду", быстро повторите весь процесс выработки с серией легких подкреплений.
10. Оканчивайте, по возможности, каждую тренировку на высокой ноте и в любом случае останавливайтесь, оставаясь впереди обучаемого.
1.Повышайте критерий небольшими градациями, чтобы у субъекта всегда была реальная возможность выполнить требуемое и получить подкрепление. Практически это означает, что, когда вы увеличиваете требования или повышаете критерий подкрепления, вы должны это делать в пределах, доступных в данный момент субъ екту. Если ваша лошадь берет барьер в два фута, иногда имея фуг в запасет вы можете увеличить барьер до двух с полови ной футов. Поднять его до трех футов, значит искать себе неприятностей: животное способно на это, но пока не в со стоянии обеспечить стабильности. А повысить барьер до трех с половиной футов означает накликать несчастье.
То, насколько быстро вы можете увеличить критерий, не зависит от фактических возможностей субъекта, нынешних или будущих, никогда не исходите из того, что лошадь боль шое существо с сильными ногами, способное взять восьми футовое препятствие, или из того, что она обычно перепры гивает через четырехфутовый забор на пастбище. Быстрота увеличения критерия зависит от того, насколько хорошо ва ше взаимодействие в процессе выработки, каковы ваши пра вила подкрепления.
Каждый раз, как вы увеличиваете критерий, вы меняете правила. Субъекту должна быть дана возможность обнаружить это; несмотря на изменение правил, при некотором увеличении усилий, субъект должен продолжать получать под крепление (но при этом в некоторых случаях выполнение действия на прежнем уровне становится неэффективным).
Это может быть усвоено только в процессе ознакомления с подкреплением на новом уровне.
Если вы повышаете критерий так сильно, что субъекту надо совершить усилия значительно большие, чем он ранее совершал для вас — неважно делал или не делал он это для себя, — вы сильно рискуете. Поведение может быть сорвано.
У прыгуна могут появиться дурные привычки, такие, как останавливаться перед барьером или сбивать его. Привычки, подавление которых потребует много времени. Самый быстрый — а иногда единственный — способ сформировать поведение — это увеличивать критерии такими ступенями, чтобы субъекту легко давалось постоянное улучшение поведения. Непрерывный прогресс, даже дюйм за дюймом, приведет вас к поставленной цели гораздо быстрее, чем попытки форсировать быстрый прогресс с риском потерять все выработанное поведение.
Однажды мне пришлось встретиться с одним отцом, допустившим в этом серьезную ошибку. Так как сын-подросток очень плохо учился, он отобрал у него обожаемый всеми подростками мотоцикл до улучшения отметок. Мальчик стал заниматься лучше, его оценки улучшились, с F и D до D и С.-Однако вместо того, чтобы поощрить этот прогресс, отец сказал, что оценки еще недостаточно хорошие, и продолжал придерживаться своего запрета. Эта эскалация критерия была слишком резкой, мальчик совсем перестал заниматься. Более того, он стал очень недоверчивым.
2. В конкретный промежуток времени отрабатывайте что-нибудь одно, не пытайтесь формировать поведение по двум критериям одновременно. Под этим я не подразумеваю, что вы не можете работать над многими различными типами поведения в один и тот же период времени. Безусловно, вы можете это. Во время любого занятия мы можем сначала немного поработать над качеством, затем над скоростью —в теннисе над ударом слева, затем над ударом справа, затем над работой ног и т.д. Это избавляет от монотонности. Хорошие преподаватели все время меняют работу, оставляя данную задачу, как только в ней достигнут успех, и переходят к другой. Однако, когда вы работаете над данным типом поведения, вы должны пользоваться в каждый данный отрезок времени одним и только одним неизменным критерием. Допустим, что я обучаю дельфина делать фонтан брызг, и один раз не дам ему подкрепление, потому что фонтан недостаточно велик, а другой раз — потому что он направлен не в ту сторону, в итоге у животного не будет ключа к расшифровке того, что я хочу от него. Одно подкрепление не может содержать двух типов информации: я должна сначала довести высоту фонтана до удовлетворяющей меня отметки, а затем формировать его направление вне зависимости от высоты, до тех пор, пока оно тоже не будет заучено; только когда оба критерия установлены, я могу-требовать соблюдения обоих.
У этого правила множество практических применений. Если задачу можно расчленить на отдельные компоненты, которые затем формируются раздельно, обучение пойдет гораздо быстрее. Рассмотрим обучение удару в гольфе, отправляющему мяч в лунку. Попадет ли мяч в лунку зависит от правильности расстояния, на которое послан мяч, — чтобы оно не было меньше, чем расстояние до лунки, и чтобы мяч не перелетел через нее ~ и от направления удара, чтоб мяч не уходил ни в одну, ни в другую сторону от лунки. Если я собираюсь обучиться удару, я буду практиковаться в этих навыках раздельно. Я бы положила на траву пучок шнура длиной в несколько футов и стала бы тренироваться, посылая мяч вдоль него сначала с расстояния двух, затем четырех, шести, десяти футов и т.д. Я могла бы сделать из шнура круг и стала тренироваться попадать в него с определенного расстояния, постепенно уменьшая размер круга, до тех пор, пока не смогла бы надежно попадать в очень маленькую цель. Только когда меня будут удовлетворять мои навыки удара по мячу как для посылки его на нужное расстояние, так и в заданном направлении, я их объединю и, сделав большую цель, начну менять расстояние, а затем стану уменьшать цель и, снова
меняя расстояние, добьюсь попадания в маленькую цель с различных дистанций. Затем по мере улучшения навыка удара я могу добавлять новые критерии, по одному в каждый конкретный момент времени.
Это поможет мне стать превосходным или по крайней мере очень хорошим игроком в гольф в зависимости от моей настойчивости и пределов зрительно-моторной координации. Это обеспечит мне, безусловно в пределах моих возможностей, надежность попадания мячом в лунку. Я утверждаю,
что любой игрок в гольф, пользуясь такой однозадачной программой выработки, за несколько выходных достигнет большего, чем за целое лето бессистемной тренировки, волей-неволей надеясь достичь каждым ударом и правильности расстояния, и правильности направления.
Часто нам не удается добиться прогресса в каком-либо навыке, хотя мы много упражняемся, потому, что мы пытаемся сразу улучшить две или более стороны деятельности.
Нужно подумать: одно ли свойство характеризует данное поведение? Нельзя ли его расчленить и работать отдельно над различными критериями? Когда вы займетесь этими вопросами, большинство проблем решаться сами собой.
3. Прежде чем увеличивать или повышать критерий, пользуйтесь вариативной шкалой подкреплений имеющегося в данный момент уровня ответа.
Вы помните о вариативной шкале подкреплений? Как только поведение усвоено, вы должны начать подкреплять его не каждый раз, чтобы поддерживать его на данном уровне. Это правило составляет суть процесса выработки. Когда вы можете позволить себе подкреплять данный уровень поведения случайным образом и сохранять уверенность в получении его, вы получаете свободу в использовании подкреплений только за лучшие проявления данного поведения. Такое селективное подкрепление "сдвинет" нормальное или среднее поведение в сторону того улучшения, которое вам желательно. Хорошая выработка представляет из себя серию чуть заметных переходов между непрерывным подкреплением - когда достигнут новый уровень выполнения - и вари ативным подкреплением - когда достижение закрепилось и создалась возможность избирательного подкрепления еще более хороших ответов.
Иногда смена стабильных и вариативных шкал происходит очень быстро, составляя два-три подкрепления на каждом уровне. Вероятность этого особенно велика, если у субъекта внезапно наступает "озарение" - он начинает понимать конечную цель, и улучшение поведения становится
спонтанным. В этом случае введение вариативной шкалы столь значимо для обучения, что это необходимо постоянно помнить и все время контролировать, не забуксовала ли, не перестала ли приносить успех ваша программа выработки.
4. Вводя новый критерий, временно ослабьте старые.
Допустим, вы учитесь играть в сквош (что-то вроде тенниса) и успешно работаете над одной целью - послать мяч туда, куда вы хотите. Теперь вы хотите поработать над скоростью, но, когда вы усиливаете удар, мяч летит куда попало. Забудьте на некоторое время о точности и просто ударяйте по мячу. Когда вы научитесь управлять скоростью мяча, точность скоро восстановится.
То, что раз выучено, не забывается, но под подавляющим воздействием нового критерия старое, хорошо выученное поведение иногда временно уходит в сторону. Однажды я видела дирижера, который пришел в состояние крайнего раздражения во время генеральной репетиции оперы, потому что певцы хора делали одну ошибку за другой, они как будто забыли всю свою твердо выученную вокальную партию. Причиной было то, что они в первый раз надели тяжелые костюмы, их поставили на подмостки и заставили двигаться во время пения: привыкание к новым условиям временно перекрыло выученное ранее поведение. К концу репетиции их музыкальное мастерство восстановилось без дополнительных репетиций. Дрессировщики дельфинов называют это "синдромом нового бассейна". Когда вы помещаете дельфина в новый бассейн, для вас не должно быть неожиданностью, что он "забудет" все, что знал, пока не привыкнет к новой обстановке. Следует помнить, что ругать себя или других за ошибки в выученном поведении, совершаемые при новых обстоятельствах, непедагогично. Ошибки обычно исправляются в скором времени сами по себе, а выговоры огорчают,
а иногда фиксируют внимание на ошибках, которые становятся постоянными.
5. Ведите ученика за собой.
Планируйте программу выработки так, что, если субъект совершит в обучении неожиданный скачок вперед, вы должны знать, что подкреплять далее. Однажды' я в течение двух дней обучала только что пойманного дельфина прыгать через препятствие, выступающее над водой на несколько дюймов. Когда поведение прочно установилось, я подняла барьер еще на несколько дюймов, животное тотчас же прыгнуло, и с такой легкостью, что я скоро снова подняла барьер уже на гораздо большую высоту; через пятнадцать минут этот новичок прыгал на восемь футов.
Такого рода "рывок" выработки может произойти в любой момент. Этот феномен наблюдается как у людей, так и у многих видов разумных животных. Я считаю, что тут дело в инсайте (внезапное озарение): субъект внезапно осознает ваши цели, исходя из которых вы добиваетесь его действий (в
данном случае - прыгнуть как можно выше), и делает это.
Киты-касатки славятся своим предвосхищающим обучением. У их дрессировщиков в ходу одна и та же шутка: касатку не надо дрессировать, достаточно записать программу поведения на доске и вывесить ее в воде, и киты будут следовать этому предписанию.
Дрессировщики могут встретиться с осложнениями только в том случае, если они оказываются неподготовленными к неожиданному улучшению. Если вы тренируете переход от стадии А к Б, а субъект внезапно чисто выполняет стадию В уже с двух подкреплений, вы должны предусмотреть подкрепление стадии Г и Д, иначе в дальнейшем вам нечего будет подкреплять.
"Рывок" часто эмоционально очень значим для субъекта; даже животные, по-видимому, испытывают удовольствие от "ага!" познания, и часто впадает в состояние явно повышенного настроения. Таким образом, "рывок" - это блистательная возможность добиться значительного прогресса в кратчайшие сроки. Быть не готовым к нему и держать субъект на низком уровне обучения только потому, что вы не знаете, что делать дальше, -лучший способ потратить зря время, а в худшем случае может отбить охоту к обучению и вызывает отвращение у субъекта, который станет в будущем работать без особого желания.
За очень редкими исключениями наша школьная система построена так, чтобы помешать детям обучаться в их собственном темпе - наказываются не только медленные ученики, у которых не хватает времени на обучение, но и слишком быстро обучающиеся, которые не получают дополнительного подкрепления, когда быстрая сообразительность продвигает их вперед. Если ты мгновенно понял, о чем толкует учитель математики, твоей наградой может стать мучение от скуки в течение часов или даже недель, пока все остальные мало-помалу постигнут это. Поэтому нет ничего удивительного в том, что улица более привлекательна как для наиболее быстрых, так и для медленных.
6. Не меняйте тренеров на полпути.
В процессе выработки какого-либо поведения вы рискуете значительным регрессом, если перепоручаете своего ученика другому преподавателю. Не важно, сколь скрупулезно обсуждены критерии перед передачей дела, поскольку и индивидуальные установки, и время реакций, и прогноз успеха будут слегка отличаться, и в итоге субъект утрачивает подкрепления до тех пор, пока не привыкнет к этим отличиям.
Конечно, у каждого обучающегося может быть много различных учителей - мы не испытываем затруднений от того, что один обучает нас французскому, другой - арифметике, третий - футболу. Но то конкретное поведение, которое должно быть разучено, требует только одного учителя в каждый
конкретный момент времени. На тех стадиях выработки, когда навык образован наполовину, постоянное повышение критерия осуществляется лучше, если процесс формирования данного поведения находится в одних руках. Допустим, если
у вас двое детей и одна собака, и оба хотят обучать собаку, то разрешите им это, но пусть каждый работает над различными, каждый над своими трюками, и тем избавьте бедную собаку от большой неразберихи.
Те, кто хочет учиться, будут учиться при наихудших условиях.
В Колумбийском университете был поставлен получивший в настоящее время широкую известность эксперимент по "языку обезьян", в котором шимпанзе обучали словарю американского знакового языка и другим кодам; в эксперименте принимал участие детеныш шимпанзе по имени Ним Шимрски. По бюджетным и другим соображениям, у бедняжки за трехлетний период было чуть ли не сто "учителей" знакового обозначения. Студенты и экспериментаторы были разочарованы, поскольку Ним не демонстрировал твердых доказательств использования реального "языка". А именно, он, по-видимому, никогда не строил предложений. Но он выучился распознавать и понимать более трехсот символов - существительных, глаголов и т.д., что при данных обстоятельствах, с моей точки зрения, является поразительным. То же самое происходит с некоторыми детьми, которые переходят из школы в школу, проходя через бесконечную смену учителей, приемов и методов обучения, и тем не менее обучаются. Но есть более хорошие способы.
Единственный случай, когда вам следует подумать о смене преподавателя посредине процесса выработки, это, конечно, когда обучение зашло в тупик. Если обучение идет плохо или совсем не идет, то вам нечего терять от перемены.
7. Если одна процедура выработки не приводит к успеху, попробуйте другую.
Поразительно, до чего люди бывают привержены к неэффективной системе, будучи убежденными, что повторение одного и того же даст результаты. Для выработки любого поведения существует столько же способов, сколько инструкторов, способных их придумать. Например, при обучении детей плаванию надо сделать так, чтоб они не боялись и чувствовали себя спокойно под водой. В качестве первого шага формирования этого навыка одни тренеры велят им выдувать в воду воздух, пуская пузыри, другие - быстро опускать в воду и поднимать обратно лицо, а третьи - прыгать в воде, пока они не отважатся просто присесть, чтобы вода закрыла их. Любой хороший тренер, видя, что ребенку скучно или его пугает этот метод, перейдет на другой; одни и те же методы выработки не равноценны для разных индивидуумов.
Дрессировщики, передающие свое искусство от поколения к поколению, такие, например, как цирковые дрессировщики, часто не могут этого усвоить. Их методы дрессировки отточены несколькими поколениями и передаются от одного к другому - вот способ научить медведя кататься на велосипеде, а вот способ обучить льва издавать рык (если хотите знать - надо выдернуть несколько волосков из его гривы). Эти передаваемые из поколения в поколение "рецепты" считаются лучшими способами, а иногда таковыми и являются, но они часто рассматриваются и как единственные способы, что является причиной того, что цирковые представления чрезвычайно похожи друг на друга.
Однажды один телевизионный деятель, который ставил шоу в океанариуме "Жизнь моря", пригласил меня посетить их ферму в Вирджинии и посмотреть, как тренируют лошадей. Эта знаменитость был превосходным наездником и тренером и у него было несколько прекрасно обученных лошадей. Мы наблюдали, как учили лошадь кланяться, или становиться на одно колено при помощи традиционного метода, включавшего двух людей и множество веревок и кнутов; при помощи этого метода лощадь многократно заставляли становиться на одно колено до тех пор, пока она не научилась опускаться на него сама.
Я сказала, что необязательно делать это таким образом, и утверждала, что могу научить лошадь кланяться, даже не прикасаясь к животному (один из вариантов: нарисовать на стене красное пятно; использовать пищу в качестве условного подкрепления выработки у лошади касания коленом пятна, затем постепенно снижать пятно, приближая его к полу, чтобы лошади пришлось встать на колени, чтобы коснуться его и заработать подкрепление). Телевизионная звезда пришла в негодование от такого наглого заявления - что за мысль!
Если бы существовал другой способ научить лошадь кланяться, он бы знал об этом - нам пришлось два или три раза обойти вокруг сарая, чтоб он немного поостыл.
8. Не кончайте урок без положительного подкрепления, это равносильно наказанию.
Это не относится к той несистематической (хотя очень значимой и продуктивной) выработке, которая происходит в домашних условиях, - поощрение учения в школе, гостеприимство, подбадривание детей; здесь подкрепление происходит от случая к случаю, без особых правил. Однако в более официальной ситуации - скажем, на уроке или при выработке поведения у какого-либо животного - преподаватель должен уделять свое внимание ученику или классу до конца урока. Это более, чем просто хорошие манеры или хорошая самодисциплина; это - хорошее обучение. Когда субъект старается заработать подкрепление, он, так сказать, вступает в контакт с преподавателем. Если преподаватель начинает болтать с кем-либо из присутствующих, выходит, чтобы поговорить по телефону, иди просто мечтает, контакт нарушается. Подкрепление не поступает, хотя обучающийся и не сделал ошибки. Это приносит больше вреда, чем если бы преподаватель просто упустил хороший шанс для подкрепления. Это может плохо сказаться даже на хорошо отработанном поведении, которое осуществляется в это время. Конечно, если вы хотите упрекнуть ученика, перестать обращать на него внимание - лучший способ сделать это.
Дрессировщики дельфинов называют это "тайм-аут" и используют для коррекции неправильного поведения. Забрать корзину с рыбой и уйти на минуту - один из способов сказать дельфину: "Нет!" или: "Неправильно!" Обычно это оказывается очень эффективным - не следует думать, что дельфины не могут огорчаться или раскаиваться, они это могут. Лишение внимания - мощный инструмент, поэтому не применяйте его без должной осторожности и несправедливо.
9. Если выученное поведение ухудшается, пересмотрите процедуру выработки.
Иногда навык или поведение портятся, а иногда создается видимость их полной потери. Нам всем знакомо это чувство, когда пытаемся говорить на иностранном языке, вспомнить стихотворение или поехать на велосипеде после многолетнего перерыва: это очень выбивает из колеи. Иногда внешние обстоятельства временно полностью, уничтожают хорошо выученное поведение- например, в состоянии испуга невозможно произнести заученную речь, неудачное падение резко нарушает ваши навыки скалолазанья. Иногда на первоначальное обучение накладывается и мешает ему последующее обучение, создавая путаницу - вы стараетесь найти испанское слово, а всплывает немецкое.
Самый быстрый способ исправить такое ухудшение - не биться об него головой, заставляя субъект делать это до тех пор, пока результат не покажется вам удовлетворительным или пока вы не дадите подкрепление, а вернуться к началу процесса выработки и "очень быстро снова пройти весь путь, давая подкрепление в новых условиях (спустя двадцать лет, на публике и т.д.) и применяя по одному-два подкрепления на каждом уровне. В океанариуме "Жизнь моря" мы называли это "вернуться в детский сад", и такой прием часто восстанавливал ухудшившееся поведение до нормального уровня за десять-пятнадцать минут. Конечно, так мы всегда и поступаем, когда повторяем материал перед экзаменом или освежаем память, заглянув в текст, прежде чем выходим на трибуну. Полезно помнить, что если вы в состоянии в большей или меньшей степени воспроизвести исходный процесс выработки, то такое повторение одинаково полезно и для физических, и для умственных навыков Оно действенно как у животных, так и у людей.
10. Прекращайте работу, оставляя за собой лидирующее положение. -
Сколько должен продолжаться каждый сеанс выработки?
Частично это зависит от промежутка времени, в течение которого субъект сохраняет внимание. Кошки часто начинают проявлять беспокойство после, примерно, двенадцати подкреплений, поэтому пяти минут может быть достаточно. Собаки и лошади могут работать дольше. У людей продолжительность различных уроков традиционно равна часу, а занятия футболом, научные семинары и разные другие мероприятия часто длятся целый день.
Когда остановиться, не столь важно, как на чем остановиться. Вы должны всегда прекращать работу, сохраняя ведущее положение. Это относится и ко всему уроку, и к отдельным частям его, когда вы кончаете работать над одним типом поведения и переходите к другому. Вы должны совершать переход на высокой ноте - т.е. сразу как только достигнут успех.
Последнее совершенное действие всегда закрепляется в сознании субъекта; вы должны быть уверены, что это хорошее, вознаграждаемое выполнение. А часто происходит так, что мы получаем три-четыре хороших ответа - собака прекрасно ищет и подает предмет, прыгун в воду впервые выполнил прыжок полтора оборота, певец правильно исполнил трудный пассаж - и мы так возбуждены, что хотим видеть или делать это скова и снова. И мы повторяем это или стараемся повторить, и очень скоро субъект устает, поведение ухудшается, неожиданно возникают ошибки, происходят коррекции и подбадривания, и урок идет насмарку. Наездники-любители поступают так всегда. Вот почему я терпеть не могу смотреть, как люди обучают своих лошадей прыгать; как часто они далеко заходят за черту, где следует остановиться, когда животное выполнило действие хорошо, и прежде, чем поведение не начало снова ухудшаться.
Будучи тренером вы должны, если это необходимо, затавлять себя останавливаться на хорошем ответе. Иногда это требует выдержки. Но на следующем уровне вы можете обнаружить, что принос предмета, сальто при прыжке в воду или вокальное упражнение выполнены не только так же хорошо, как последнее на прошлом уроке, но значительно лучше.
Психологи называют это "латентным обучением". В процессе тренировки возникает некоторый стресс, хотя бы от желания сделать лучше. Этот стресс может влиять на выполнение действия, маскируя реально имеющееся обучение.
В начале следующего урока, прежде чем возникнет стресс, выполнение действия может в действительности быть на шаг впереди по сравнению с тем уровнем, на котором остановились, и тогда вы получаете то, что гораздо более достойно подкрепления.
Формирование поведения таким способом, конечно, противоположно обучению при помощи муштры и повторений. Оно может обеспечить не только стабильный прогресс, но абсолютно безошибочное обучение, и оно может идти чрезвычайно быстро. Однажды я так приучила пони к уздечке за пятнадцать минут, двигаясь непрерывно взад-вперед, формируя пять задач (вперед, остановка, налево, направо и назад). При этом я подкрепляла успех в каждой из них. Как ни странно, возможность такого быстрого обучения зависит от вашей готовности отказаться от временных рамок и постановки специфической цели, цели быстрого прогресса. Вместо этого вы должны быть просто готовы остановиться, оставаясь впереди. Феномен Дзен.
Иногда вы не можете кончать каждый урок на высокой ноте. Возможно, что слушатели оплатили час занятий, и они хотят использовать весь этот час, хотя наилучшее время для окончания урока было достигнуто раньше. А может, урок идет не слишком хорошо, чтобы обеспечить наивысший подъем, и вот-вот наступит усталость. В этом случае наиболее мудро окончить урок чем-нибудь легким, что гарантирует получение подкрепления, чтобы весь урок в целом запомнился как подкрепленный. Дрессировщики дельфинов часто оканчивают длительные, требующие напряжения занятия легкой игрой в мяч; обучающие верховой везде иногда используют разные игры, например салочки. Самым нецелесообразным приемом является введение новых задач или материала в конце занятий, вследствие чего оно заканчивается серией неадекватных и неподкрепляемых ответов. Когда я была ребенком, мои уроки музыки всегда кончались таким способом; это очень обескураживает, и я до сих пор не могу играть на пианино.
Обучающие игры
Даже если вы знаете и понимаете принципы выработки, вы не можете применять их, без предварительной практики.
Выработка это не словесный процесс, это невербальный навык - развертывающийся во времени процесс взаимосвязанного поведения, наподобие танца, ухаживания или серфинга. Поэтому его нельзя до конца познать с помощью чтения, размышления или разговоров. Вы должны выполнять его.
Одним из простых и завораживающих способов развить навыки выработки являются обучающие игры. Я использовала эти игры, обучая технике дрессировки. Многие тренеры играют в них из спортивного интереса; они интересны и для развлечения гостей.
Для игры необходимо по крайней мере два человека: обучающийся и тренер. Оптимально количество шесть человек, потому что тогда каждый может побывать и испытуемым и тренером, прежде чем группа утомится; большая группа, например класс или лекционная аудитория, тоже возможна, потому что наблюдать за этим почти так же увлекательно, как участвовать.
Вы отсылаете испытуемого из комнаты. Остальные выбирают тренера и поведение, которое должно быть сформулировано: например, написать свое имя на доске, попрыгать или взобраться на стул. Испытуемый приглашается в комнату, и его просят двигаться по комнате и производить любые движения; тренер свистком подкрепляет движения в направлении желаемого действия. Я предпочитаю, по крайней мере при первых нескольких подкреплениях, придерживаться правила, чтобы "подопытный" должен был возвращаться к дверям после каждого подкрепления начинать действия заново; это, по-видимому, препятствует развитию у некоторых испытуемых тенденции просто останавливаться в том месте, где было получено последнее подкрепление. И никаких разговоров.
Смех, вздохи и другие проявления эмоций допускаются (разрешаются), но инструкции и обсуждения исключаются до тех пор, пока не достигнуто задуманное поведение.
Обычно обучающие игры протекают довольно быстро. Вот пример: мы вшестером играем в комнате у одного из друзей.
Руфь соглашается быть подопытной, очередь Анны быть тренером. Руфь выходит из комнаты. Мы решаем, что поведение должно состоять в том, чтобы включить лампу, стоящую на столике у кушетки.
Руфь приглашается назад и начинает двигаться по комнате. Когда она поворачивается в сторону лампы, Анна свистит. Руфь возвращается на "старт" (дверь в комнату), затем целенаправленно движется к точке, где получила подкрепление, и останавливается. Свистка нет. Она делает попытку сдвинуться с места сначала в сторону от лампы. Попрежнему свистка не слышно, Руфь снова начинает ходить. Когда она снова направляется к лампе, Анна свистит. Руфь возвращается к двери, а затем снова к тому новому месту, где она только что слышала свисток, но на этот раз она продолжает двигаться вперед. Удача: свисток! Не возвращаясь к двери, она еще немного проходит вперед и слышит свисток, как раз когда проходит мимо конца стола. Она останавливается. Стучит по краю стола. Свистка нет. Разводит руками, свистка нет. Одна рука слегка касается абажура, Анна свистит. Руфь начинает ощупывать со всех сторон абажур - двигать, поворачивать, качать: свистка нет. Руфь опускает руку под абажур. Свисток. Руфь снова опускает руку под абажур и производит очень знакомое действие, имеющее какую-то цель, она осуществляет эту цель и включает лампу. Анна свистит, а мы все аплодируем.
Но не всегда все идет так гладко, даже если поведение простое и знакомое. Если вернуться к только что проделанному эксперименту, то надо сказать, что Анна нашла хорошее решение при обучении, воздержавшись от поДкреПления, когда Руфь пошла в сторону от места, где получила подхрепление первый раз, двигаясь в неверном направлении.
Однако, если бы Руфь снова пошла к тому месту и остановилась бы, у Анны могли бы возникнуть затруднения.
Вот пример обучающей игры, в которой встречается больше затруднений. Я вела занятия по приемам дрессировки в старшем кЛассе школы. Леонард был подопытным, а Бет тренером. На этот раз поведение состояло в том, чтобы включить свет выключателем, расположенным на стене.
Леонард пошел в комнату и начал по ней двигаться, а Бет быстро обучала его подходить к стене, на которой находился выключатель. Однако Леонард начал, свое движение, держа руки в карманах: после нескольких подкреплений за движение с руками в карманах, их там как будто приклеили. Он толкал стену, поворачивался и прислонялся к ней, он даже прислонился к выключателю, но казалось, что он не замечал выключателя и ни разу не вынул рук из карманов.
Наблюдая это, я думала, что если бы была возможность заставить Леонарда ощупывать стену рукой, он заметил бы выключатель и зажег бы свет. Но как вынуть эти руки из карманов? Бет "подловила" с помощью свистка сгибание ног в коленях в то время, когда Леонард стоял спиной к стене, и скоро обучила его тереться спиной о стенку около выключателя. Остальные ученики начали хихикать, так как поняли, что, сдвинув эти движения в сторону, Бет может заставить Леонарда нажать выключатель спиной и тем самым достичь результата случайно, если уж не получается преднамеренно. Но это был медленный процесс, а мы стали замечать, что Леонард начинает расстраиваться и сердиться.
"Можно я попробую?" - спросила Марта. Бет взглянула на меня вопросительно, я кивнула, класс согласился с видимой неохотой, и Марта вынула свой собственный свисток (подкрепление в виде владения свистком производилось в условиях очередности). Марта отправила Леонарда назад на стартовую позицию у двери, а затем поставила стул недалеко от выключателя на расстоянии примерно фута от стены, уселась на него сама и кивнула Леонарду, чтобы он начинал. Он тотчас же кинулся к стене, где его так часто подкрепляли, следуя мимо Марты и видимо игнорируя ее новое положение. Когда он проходил мимо нее, она быстро выставила ногу, дав ему подножку.
Руки Леонарда вылетели из кармана и уперлись в стену, чтобы предотвратить падение; как только руки коснулись стены, раздался свисток. Леонард застыл. Он глядел на Марту.
Она смотрела в пространство, чтобы не давать ему никакого намека. Он начал осторожно похлопывать по стене; она это действие подкрепила. Он снова похлопал по стене и на этот раз посмотрел на то, что делает; она снова это подкрепила.
Затем мы все увидели, как Леонард внезапно посмотрел на выключатель. Все затаили дыхание. У него напряглась спина от внезапного осознания, и он включил свет. Бурные аплодисменты.
Все участвующие в обучающей игре, будь то участники или зрители, получают урок почти при каждом подкреплении. Прежде всего тренер должен уяснить, что точность времени подачи подкрепления превыше всего. Предположим, испытуемый приближается к выключателю, но в этот момент, когда тренер дает свисток, поворачивается в сторону от него. Ладно, думает тренер, я подловлю его в следующий раз. А теперь, предположим, испытуемый возвращается на стартовую позицию, затем быстро направляется в сторону выключателя и поворачивается от него. Увы! Тренер сформировал этот поворот. И все, а не только тренер, видят, насколько критично дать свисток чуть раньше, пока желаемое поведение в действительности осуществляется.
Испытуемый должен уяснить, что при этой форме обучения мозг - не помощник. Совершенно безразлично, что вы об этом думаете; если вы просто передвигаетесь, коллекционируя свистки, ваше тело поймет, что делать, без вашей помощи. Это поистине мучительный опыт для ярких интеллектуальных людей. У них имеется тенденция замирать, услышав свисток, и пытаться анализировать, что они делали.
То, что они этого не знают, и то, что их незнание ничего не значит, их шокирует. Однажды мы с моей коллегой Шери Диш обучали психолога Рональда Шустермана ходить по комнате заложив руки за спину в течение примерно минуты - довольно длительный период без подкрепления, но он был очень прилежен до тех пор, пока собравшиеся не пришли к мнению о том, что мы полностью сформулировали поведение, и не разразились аплодисментами (что является подкреплением для тренера и почти всегда возникает спонтанно). Рон, который во время своих исследований много работал с обучением животных и который опрометчиво считал, что его самого нельзя "выдрессировать", не подозревал, что его сцепленные за спиной руки являются сформированным поведением, а не просто надпороговым выражением мышления.
То, что при этом происходит, не является разновидностью макиавеллевского обучения с подкреплением, но случай привычной ошибки, когда считается, что словесная коммуникация наиболее важна и что обучение не может произойти без использования языка или по крайней мере некоего вербального осмысливания. Опыт невербального обучения особенно полезен для тех, кто использует массу словесных инструкций в своей профессиональной деятельности: учителей, терапевтов, инспекторов. Побывав "животным", вы сможете проникнуться симпатией, даже сочувствием к любому субъекту, который осуществляет формируемое вами поведение, но не отдает себе отчета, что от него ожидается, и поэтому легко впадает в ошибки. Вы сможете быть терпеливыми по отношению к животному (или ребенку, или больному), которое срывается и впадет в ярость, когда то, что он считал правильным действием, оказывается неподходящим, это непредвиденное осложнение у человеческих существ может вызвать слезы. И если вы однажды в эксперименте осуществили невербальное формирование поведения у взрослого человека, вы не будете с такой легкостью говорить при обучении и тренировке в реальной жизни, что субъект (неважно, животное или студент) "ненавидит меня", или "нарочно старается вывести меня из себя", или "глуп", или "должно быть, болен сегодня". Во время этого эксперимента, в котором каждый участвует с собственного согласия и по желанию, становится совершенно очевидно, что если что-то идет не так, то это зависит от процесса обучения, а не от того, кого обучают.
Озарение, которое возникает от этой игры у профессионалов, тоже достаточно забавно (и все остальные в тот же момент, что и вы, чувствуют ваше озарение - вы его не можете скрыть, а с другой стороны, вас окружает забавное сочувствие). Очарование игры, используемой просто как времяпровождение, состоит в том, что в нее может играть любой человек без какой-либо предварительной подготовки.
Некоторые люди обладают удивительными способностями к этому. Как показывает мой опыт, обладающие хорошей интуицией, творческие, чрезвычайно эмоциональные люди становятся большими дрессировщиками, а спокойные, наблюдательные люди - прекрасными подопытными - как раз наоборот, чем можно предположить. И,- наконец, достаточно только взглянуть на комнату, заполненную народом, поглощенным происходящим процессом формирования (действия), когда все, кроме подопытного, сидят не шелохнувшись, а тело и мозг тренера сконцентрированы на задаче, чтобы увидеть, что этот эксперимент достоин кисти художника или пера писателя: это творчество. За исключением театра, ощущение творчества редко является групповым. И уже только с одной этой точки зрения обучающая игра представляет ценность.
Мы провели несколько запоминающихся раундов обучающей игры в океанариуме "Жизнь моря", особенно запомнилась одна, в которой философ Грегори Батесон, который будучи подопытным у нескольких дрессировщиков дельфинов убедительно доказал, что его невозможно обучить, и не потому, что он стоял без движения - думал, а потому, что предлагал такое бесконечное разнообразие ответов, что просто засыпал ими дрессировщика. Другой интересный для меня раунд этой игры состоялся однажды после завтрака, на котором присутствовали шесть деловых женщин, мало знакомых друг с другом и не связанных общностью работы. После двух часов игры, в которой психотерапевт оказалась превосходным "животным", а танцовщица диско - блестящим "тренером, мы расстались, узнав друг друга много лучше и к тому же питая друг к другу большую симпатию.
В 1980 г. я вела курс экспериментальной дрессировки у группы студентов одного из колледжей в Нью-Йорке. Мы играли в обучающую игру в классе, а основное ядро, состоящее из полдюжины наделенных дьявольским воображением девиц, начали играть в обучающую игру дома междусобой, работая обычно парами и формируя экзотические формы поведения, такие, как подниматься по лестнице задом наперед. В колледже их научили, с моей точки зрения, успешно, аналитическому мышлению, и они все очень тщательно продумывали как до, так и после каждого эксперимента по формированию (поведения) и энергично взялись за формирование поведения со смаком, присущим шестнадцатилетним. Они тут же принялись дрессировать родителей, применять положительное подкрепление для учителей и превращать неприятные сборища в веселые компании, избирательно подкрепляя желательное поведение. Ни до, ни после я никогда не встречала группу, с такой быстротой усвоившую как саму технику, так и ее возможности.
Ускорение процесса формирования: введение
мишеней, подражание, моделирование
Профессиональные дрессировщики используют ряд приемов, чтобы ускорить процесс формирования. Три из них, которые вам могут быть полезны, это введение мишеней, подражание и моделирование.
При введении мишеней, которые часто используются - при дрессировке морских львов и других животных, участвующих в представлениях, вы обучаете животное толкать носом мишень — скажем, кнопку на конце шеста или просто руку дрессировщика, сжатую в кулак. Затем, перемещая мишень и заставляя животное просто следовать за ней и толкать ее, вы можете получить все виды поведения, даже такие, как подъем на лестницу, прыжки или вертикальные стойки, следование за дрессировщиком, вход и выход из транспортировочной клетки и т.д. По сути дела мы используем мишень, когда хлопаем себя по бедру, подзывая собаку. Это движение, видимо, привлекает собак, а когда они приближаются, мы подкрепляем это поведение лаской. Похлопывание рукой по сидению, при приглашении кого-либо сесть рядом, тоже один из видов мишени. Группы японских туристов не теряют друг друга в толпе гораздо более высокорослых людей, следуя за флагом, который держит над толпой их гид — снова мишень. Использование для этих целей штандартов и знамен в битвах является традиционным.
Подражание в природе свойственно некоторым животным и птицам, а также людям. Молодые особи всех видов учатся большинству из того, что они должны знать, наблюдая, а затем копируя поведение старших. В то время как психологи часто считают "обучение при помощи наблюдения" признаком разумности животного — у приматов оно хорошо выражено, у некоторых других животных плохо, — я думаю, что наличие или отсутствие этой способности у того или иного вида зависит от его экологии, т.е. ее роли в естественных условиях жизни, а не разума как такового. У некоторых птиц способность подражать поведению выражена чрезвычайно сильно. В Англии синицы выучились открывать оставляемые у дверей молочные бутылки, доставать из них сливки, этот навык с помощью подражания с такой быстротой распространился, что крышки молочных бутылок пришлось переделывать.
Собаки мало способны к обучению при наблюдении; когда они делают то же, что и другие собаки, то обычно это потому, что отвечают на одни и те же стимулы, а не потому, что подражают. С другой стороны, кошки, которые, согласно мнению зоопсихологов, имеют более низкий уровень умственных способностей, прекрасные подражатели. Выражение "сорусаt" неслучайно. Если вы обучаете какому-либо трюку — скажем, звонить в колокольчик, чтобы пустили в дом, одну из кошек в доме, то и другие кошки вполне могут этому научиться без вашего обучения. Кошки могут даже подражать другим видам. Однажды вечером моя дочь в течение часа обучала своего пуделя сидеть на детском кресле-качалке и раскачиваться, используя в качестве подкрепления мелко нарезанную ветчину. Одна из кошек за этим наблюдала.
Когда урок окончился, кошка по собственному почину вскочила на кресло и стала его раскачивать по всем правилам, поглядывая на нас в ожидании своей доли ветчины, которая конечно же была честно заработана.
Я думаю, что эта сильно выраженная тенденция к подражанию объясняет, почему кошки не могут спускаться с деревьев. Лазанье вверх происходит более или менее автоматически: оно, как говорят биологи, является поведением с "жесткими связями". Когти при этом выпускаются, и кошка взбегает по дереву. Однако, чтобы спуститься вниз, кошке следует двигаться хвостом вперед, при этом загнутые вниз - когти тоже могут сослужить службу, но это, вероятно, навык, требующий обучения, или поведение с "гибкими связями" Я могу утверждать, потому что мне лично (посреди ночи, стоя на верхушке приставной лестницы) пришлось обучать кошку спускаться с дерева хвостом вперед. Я сделала это, чтобы в будущем избавить себя от горестных воплей застрявшей на дереве кошки, и действительно сформированное поведение сохранилось — она никогда больше не застревала на деревьях (хотя продолжала на них взбираться). Я думаю, что в природе кошки учатся тому, как поворачиваться и спускаться хвостом вперед, от своих матерей, лазая вместе с ними по деревьям, но поскольку мы их отнимаем от матерей в таком нежном возрасте — шесть-восемь недель, — эта возможность обучения через копирование утрачивается.
Дельфины обладают выраженной тенденцией подражать друг другу, что облегчает процесс дрессировки. Чтобы получить выполнение одного и того же действия несколькими дельфинами, вы можете сформировать поведение у одного из них, а затем давать подкрепление другим за каждую попытку подражать. В неволе детеныши дельфинов часто разучивают трюки взрослых задолго до того как сами дорастут до подкрепления рыбой, и во многих океанариумах накопился опыт обучения "дублеров" — животных, непосредственно не задействованных, но наблюдающих за другими, участвующими в представлении. Было доказано, что они выучивали типы поведения, требуемые для представления, даже не получая за их выполнение подкрепления. Очевидно, для диких дельфинов возможность подражать своим сородичам-дельфинам должна быть важна для выживания.
Мы можем и должны использовать подражание, когда для этого представляется возможность, при обучении людей физическим навыкам — танцам, катанию на лыжах, теннису и т.д. Человеку, показывающему действия, лучше стоять рядом или спиной к обучаемым, так, чтобы они могли следовать за его движениями, не выполняя каких-либо умственных преобразований. Чем меньше требуется разъяснений и чем меньше используется словесных описаний, тем лучше пойдет подражание. В некоторых случаях, если вы хотите обучить навыку, выполняемому правой рукой (скажем, вязанию) левшу, вы должны сесть к нему или к ней лицом и таким способом добиться, чтобы, подражая вам, обучающийся выполнял движения, являющиеся зеркальным отражением ваших.
Конечно, большая часть сформированного поведения наших детей обязана своим происхождением подражанию. Они видели, что и как мы делаем, то и делают сами, как в хорошем, так и в плохом. Не так давно утром на почте трое маленьких детей устроили такую свалку, что с трудом можно было слышать что-либо кроме этого шума. Их мать, стоявшая в очереди, несколько раз громко кричала, прежде чем ей удалось усмирить их и призвать к тишине. "А как бы вы заставили детей вести себя тихо?" — спросила она работницу почты. "Постарайтесь сами говорить тише", — справедливо ответила почтальон. Обозреватель Юдифь Мартин ("Мисс Манеры") считает, что когда обучаешь хорошим манерам детей, то в течение всего периода обучения — "от рождения до свадьбы" — все в доме должны есть аккуратно, разговаривать вежливо и по крайней мере проявлять хотя бы видимость интереса к делам и словам других.
Третий прием ускорения формирования — моделирование — (лепка) состоит в том, чтобы заставить обучающегося выполнять пассивно (двигать им как марионеткой) действие, которое должно быть разучено. Игроки в гольф проделывают это, когда обхватывают рукой новичка сзади, берутся за клюшку и делают клюшкой, находящейся в руке обучаемого, нужный замах. Некоторые из исследователей, которые обучали обезьян знаковому языку, применяли моделирование очень широко. Обучающий держит руки молодого шимпанзе и кладет их нужным образом или делает нужное движение; в конце концов обезьяна запоминает их и будет выполнять спонтанно. Моделирование составляло секрет "живых статуй" — циркового представления, очень популярного на грани нынешнего и прошлого веков, в которой люди и лошади принимали позы знаменитых произведений живописи и скульптуры, — на публику производила впечатление эта неподвижность. Когда загорался свет, возникали картины типа войск Наполеона при Ватерлоо, застывшие в своем движении, причем не только люди, но и лошади с шеями, изогнутыми дугой, с передними ногами, поднятыми в воздух, как будто окаменевшие. Мне говорили, что это достигалось с помощью массирования лошадей в течение нескольких часов, пока они совершенно не расслаблялись, и тогда, как глине, им придавали нужные позы, подкрепляя удержание этих поз.
Я всегда несколько сомневаюсь в отношении применения моделирования как методики обучения, несмотря на то, что оно широко используется. Пока субъект не начнет выполнять какие-либо действия или по крайней мере не делает попыток их выполнять без того, чтобы его поддерживали, подталкивали или двигали им, я не уверена, что происходит какое-либо значительное обучение. Часто все, чему субъект при этом обучается, — это позволит вам им манипулировать: собака, которую учат подносить дичь, обучится разрешать вам держать закрытым ее рот, когда в нем поноска, но, когда вы его отпустите, она ее бросит; начинающий ходить ребенок, будучи посажен на высокий стульчик, сидит на нем спокойно до тех пор, пока удерживаете его, но поднимается и начинает вылезать, как только вы отпустите руку. В данном случае обучается тот, кто лепит поведение, — обучается держать или вести в течение все более и более длительного времени.
Существует мнение, что если производить с субъектом одно и то же действие в течение длительного времени или достаточно часто, то в конце концов он усвоит, как действовать. Иногда это так, но в действительности может пройти очень много времени, а на пути от подталкивания до само
стоятельного выполнения необходимо озарение: "Ага! Они хотят, чтобы я делал это сам". Это слишком высокий спрос с животного. И даже если ваш подопытный своего рода Эйнштейн, повторение в надежде на то, что блеснет озарение, является бесплодной тратой ценного дрессировочного времени. Чтобы моделирование работало, его надо сочетать с формированием поведения. Когда вы ставите субъекта в определенную ситуацию или вынуждаете производить движения, вы откликаетесь на его малейшую попытку начать нужное движение, и эту попытку вы подкрепляете. Челюсти собаки хотя бы слабо сомкнулись на поноске, замах игрока в гольф стал более плавным, руки молодого шимпанзе сами по себе пришли в движение, и вы поощряете этот момент.
Кроме того, вы можете сформировать новый навык при уменьшении моделирующих влияний. Комбинация моделирования и выработки часто оказывается очень эффективным способом обучения какому-либо поведению, но при этом работает комбинация, а не одно моделирование.
Особые ученики
Можно формировать поведение почти любого существа.
Психологи обучали крошечных детей движением руки гасить и зажигать свет в комнате. Можно обучать птиц. Можно формировать поведение рыб. Однажды я обучала большого краба-отшельника звонить в колокольчик, собирающий к обеду, дергая клешней за шнурок. (Фокус заключался в том, чтобы дать крабу пищу в тот момент, когда клешня, двигающаяся бесцельно, коснется шнурка. Я пользовалась длинным анатомическим Пинцетом, чтобы подносить кусочки креветки прямо к его челюстям.) Профессор Гарвардского университета Рихард Хернетейн рассказывал, что однажды он обучал морского гребешка хлопать раковиной за пищевое вознаграждение. Дрессировщики морских млекопитающих любят хвастаться что они могут обучить любое животное выполнить любое действие, для которого у него имеются физические и умственные возможности, и насколько мне известно, это так и есть.
Одним из результатов занятий по формированию поведения, особенно если они приносят обучаемому успех, является увеличение продолжительности удерживания внимания; фактически вы формируете продолжительность участия. Однако некоторые организмы, как и следует ожидать, не обладают способностью к длительному удерживанию внимания. От незрелых организмов — щенков, жеребят, детей — никогда нельзя требовать более трех-четырех повторений данного действия, попытки выжать что-либо сверх этого могут отбить схоту или испугать. Это не значит, что незрелые организмы не могут обучаться. Они учатся все время, но короткими периодами.
Один знакомый капитан рыболовного судна обучал свою четырехмесячную внучку выполнять просьбу "Дай пять!", и то, как малыш с энтузиазмом шлепал своей ладошкой по его лапе, наподобие приветствия музыкантов джаза, никогда не оставляло зрителей равнодушными. Но он добился этого несколькими, почти моментальными "уроками"
Но биологические объекты вынуждены обучаться не только в детстве. Некоторые типы поведения одним видам даются с легкостью, а другим они трудны. Свиньям, например, по-видимому, трудно переносить что-либо во рту, но они с легкостью обучаются толкать предмет пятачками. Большин ство пород собак выведено, по-видимому, с определенными поведенческими тенденциями: вряд ли кому-либо потребуется обучать колли пасти овец, так как необходимое поведение уже установлено и даже усилено с помощью отбора; но вы зададите себе трудную задачу, если решите научить пасти овец бассета. Некоторым навыкам гораздо легче обучиться на определенных этапах развития; детеныша мангуста можно приручить и превратить в восхитительное домашнее животное в возрасте шести недель, но не позже. Обычно считается, что люди усваивают языки легче в детском возрасте, нежели во взрослом, хотя лингвисты недавно обнаружили, что взрослые, которые хотят работать, могут, вероятно, выучить новый язык быстрее, чем большинство детей и подростков. Поведением, которому, я думаю, действительно очень трудно обучиться взрослым людям, является плавание. Мы являемся одним из тех немногочисленных видов, для которых плавание не является естественным, и хотя вы можете обучить взрослого держаться на воде и делать правильные движения, я никогда не видела, чтоб кто-либо мог резвиться и хорошо чувствовать себя на глубине, если не был обучен плаванию в детстве.
А как насчет того, чтобы формировать свое поведение?
Существуют всевозможные программы изменения собственного поведения: бросаем курить, следим за своим весом и т.д. Большинство этих программ опирается в основном на метод формирования поведения, обычно называемый модификациями поведения, они могут быть или не быть успешными. Трудность, как мне кажется, состоит в том, что вы должны сами себе давать подкрепление. Но когда вы подкрепляете сами себя, исчезает элемент неожиданности — ученик всегда знает, чего стоит тренер. При этом очень просто сказать: "Черт с ней, с еще одной звездочкой в моей карточке, я лучше выкурю сигарету".
Доказано, что любая программа самовоспитания может служить лишь некоторым людям. Другие могут добиться успеха, только попробовав три или четыре различные программы или после нескольких повторений данного метода. Фактически такие люди могут успешно изменить свою привычку или покончить с пристрастием, но вряд ли это получится с первого раза. Некоторым может в значительной мере помочь внушение или самовнушение. Редактор одного крупного издательства рассказывал мне, что он смог избавиться от очень сильной привычки к курению, научившись от гипнотизера способности впадать в легкий транс с помощью самовнушения и повторять как заклинание фразу вроде "Я не хочу курить" всякий раз, когда он чувствовал непреодолимое желание взять сигарету. По его представлению этот
прием "создавал завесу" между ним и сигаретой; облегчение и поздравление себя с победой, когда желание проходило, служило подкреплением. Возможно, такие методы самовнушения привлекают к работе тренера подсознание, что позволяет несколько отделиться от самого субъекта, который представлен сознательной сферой, и тем самым сделать как отрицательное, так и положительное подкрепление более эффективным.
Во время написания этой книги я из любопытства опробовала несколько формальных программ формирования поведения: две, направленные на групповое обучение, и две программы самоусовершенствования, направленные на то, чтобы бросить курить, обучиться медитации, следить за весом и правильно тратить деньги. Все они были умеренно успешными, но не всегда сразу; некоторые начинали давать результаты только примерно через год. Я обнаружила, что единственным наиболее успешным приемом самоподкрепления является постоянная регистрация результатов, которая может быть использована во всех четырех программах.
Нужно было вести регистрацию так, чтобы улучшение было видно сразу. Я использовала графики. С их помощью моя виновность за упущения могла уменьшаться при взгляде на график, на котором было видно, что несмотря ни на что я сейчас нахожусь на более высоком уровне, чем шесть месяцев тому назад. Еще, может быть, далеко до совершенства, но "кривая", или наклонная линия, графика шла в нужном направлении, и это является зримым доказательством улучшения; и хотя это само по себе является слабым, медленно действующим подкреплением, оно создает достаточную мотивацию, чтобы продолжать мои занятия.
Одним из видов формирования собственного поведения, который прекрасно работает, является обучение с помощью компьютера. В программу компьютера могут быть заложены забавные подкрепления, и вследствие этого обучение идет быстро и весело. Оно становится многообещающим применением законов положительного подкрепления.
Выработка поведения без помощи слов
В обычных ситуациях обучения, таких, как уроки тенниса, субъект знает, что ее или его обучают, и обычно охотно включается в этот процесс. Поэтому вам не обязательно дожидаться нужной реакции и подкреплять ее. Вы можете без особого вреда словами направлять поведение: "Делай так. Хорошо. Теперь повтори дважды. Хорошо". Однако в нестандартных ситуациях лучше обойтись без инструкций и (словесных) обсуждений. Предположим, ваш сосед по комнате — неряха, который повсюду разбрасывает грязную одежду, а словесные внушения — выговоры, просьбы — все остается без результатов. Можно ли выработать аккуратность?
Возможно.
Конечно, вы должны наметить план выработки, начальный и промежуточные ходы, при помощи которых вы достигнете желаемой цели. Например, чтобы грязное белье каждый раз клалось в корзину, вы можете начать с одного носка и в один прекрасный день "направить" поведение, открыв крышку корзины и сделав так, что носок вот-вот выпадет на пол. Подкрепление может быть словесное, тактильное или любое другое, которое, как вам кажется, скорее всего найдет отклик или будет благосклонно принято вашим соседом. Люди не глупы, они изменяют свое поведение, чтобы получить подкрепление. Даже если раскидывание грязных вещей является своеобразным актом агрессии в отношении вас ("Собери мою одежду, пижон!"), используя положительное подкрепление, вы можете получить устойчивый и зримый процесс в сторону, которую вы считаете приемлемым уровнем аккуратности.
Однако в использовании процесса формирования существуют две ловушки. Первая состоит в том, что легче заметить ошибки, чем улучшение, и поэтому для таких вербальных существ, каковыми являемся мы, гораздо проще негодовать, когда критерий не достигнут, чем давать подкрепление, когда он достигнут. И это может свести на нет прогресс.
Вторая опасность состоит в том, что если вы предполагаете сформировать чье-либо поведение, то очень заманчиво поболтать об этом. А такие разговоры - могут все разрушить. Если вы говорите: "Ты получишь награду" — за то, что положил белье в корзину, не куришь марихуану, тратишь меньше денег или за что-либо другое, — вы лишь совершаете подкуп или даете обещание, а не истинное подкрепление; при обучении, идущем по вашему плану, человек может иногда ему противиться и нарочно поступать не так как нужно. Чтобы добиться результатов, надо осуществлять формирование поведения, а не говорить о нем.
А если вам удалось сформировать чье-либо поведение, то в дальнейшем также лучше этим не хвастаться. Некоторые этого совершенно не понимают и постоянно подчеркивают свою роль — в лучшем случае это проявляется в опеке, а это лучший способ нажить себе в лице субъекта врага на всю жизнь. Кроме того, если вы помогли кому-то улучшить какой-либо навык или избавиться от плохой привычки, меняя в качестве подкрепления собственное поведение, на кого падает основная тяжесть работы? На субъекта. Умные родители никогда не раззванивают повсюду о том благе, которое они совершили, воспитывая своих, детей. Во-первых, мы все знаем, что эта работа никогда не кончается, а во-вторых, дети заслуживают похвалы — хотя бы за то, что выдерживают все педагогические ошибки, которые мы совершаем.
Так как формирование поведения людей может или даже должно происходить в несловесной форме, то некоторые воспринимают это как своего рода злонамеренные манипуляции. Мне кажется, что это не от недопонимания. Причина того, что формирование должно быть невербальным, состоит в том, что мы имеем дело с поведением, а не с идеями, и не только с чьим-нибудь поведением, но и со своим собственным.
Однако поскольку вы можете формировать поведение людей без того, чтобы то, что вы делаете, доходило до их сознания, и поскольку, не имея формального согласия на то, чтобы быть обученным, как это бывает при уроках игры в теннис, вы едва ли не осязаны формировать людское поведение на невербальном уровне, то не возникает ли возможность заставлять людей совершать ужасные вещи?
Конечно, да, особенно если вы в качестве отрицательного подкрепления используете такие резко неприятные стимулы, которые вызывают истинный страх и даже ужас. В лабораторных условиях психологи обнаружили феномен названный "выученная беспомощность". Если животное обучено избегать неприятного стимула, такого как удар электрического тока, при помощи нажима на рычаг или перемещения в другую часть клетки, где нет абсолютно никаких способов избежать удара тока, оно постепенно прекращает все попытки отделаться от неприятности. Оно становится полностью податливым и пассивным, и может даже лежать и получать наказания даже тогда, когда снова появляется путь к свободе. Аналогом этого феномена у людей возможно является "промывание мозгов". Если человек подвергается строгой изоляции и неизбывному страху или боли, и если неприятные стимулы в последующем используются в качестве отрицательного подкрепления, то в тех случаях, когда человек может избегнуть или прекратить их действие, изменив поведение, — ну, тогда... животные обычно погибают, а люди оказываются более стойкими, и некоторые начинают делать все что угодно, чтоб избежать отрицательного подкрепления.
Фотографии заложницы, держащей автомат при ограблении банка, тому доказательство. Но так как захватившим ее в плен не понадобилось никакой книги о том, как этого добиться, то не лучше ли каждому из нас в качестве защиты от таких происшествий понимать, как действуют законы фор-
мирования поведения?
III. УПРАВЛЕНИЕ С ПОМОЩЬЮ СТИМУЛОВ.
ВЗАИМОДЕЙСТВИЕ БЕЗ ПРИНУЖДЕНИЯ
Все, что вызывает какую-либо поведенческую реакцию, называется стимулом. Некоторые стимулы способны вызывать реакции без какого-либо обучения или тренировки: мы вздрагиваем от громкого звука, моргаем от яркого света, нас тянет в кухню, когда до нас доносится аппетитный запах; животные поступают точно так же. Такие звуки, свет и запахи называются безусловными, или первичными, стимулами.
Другие стимулы заучиваются благодаря ассоциации. Сами по себе они могут ничего не значить, но становятся выделяемыми сигналами для поведения; сигналы светофора заставляют нас стоять или идти, мы вскакиваем, чтобы снять трубку зазвонившего телефона, на шумной улице оборачиваемся, услышав свое имя и т.д., и т.д. Ежедневно мы отвечаем на множество выученных сигналов. Они называются условными, или вторичными, стимулами.
При формальном тренинге львиная доля усилий приходится на образование условных сигналов. Сержант, занимающийся строевой подготовкой со взводом новобранцев, и хозяин собаки на дрессировочной площадке в равной-мере стремятся сделать в основном так, чтобы обучающиеся повиновались командам, которые в действительности являются условными сигналами. Фокус не в том, что собака может сидеть, а человек останавливаться, фокус в том, что это делается четко и по команде. Вот что мы называем повиновением — не просто выполнение действия, но гарантия того, что оно будет выполнено по сигналу. Психологи называют это "поставить поведение под контроль стимулов". Это вырабатывается с трудом, выработка основывается на правилах, а правила нуждаются в проверке.
А что, если у вас нет в мыслях становиться хозяином собаки и вы не собираетесь тренировать спортивную команду?
Вам все равно может пригодиться понимание того, что такое стимульный контроль. Например, если ваши дети бездельничают и не вдут на ваш зов, вы плохо владеете стимульным контролем. Если вы руководите людьми и вам иногда приходится два или три раза повторять -приказ или инструкцию, прежде чем они будут выполнены, то значит у вас проблемы со стимульным контролем. Разве не случается, что вы говорите: "Я тебе уже однажды сказала, я говорила тебе тысячу раз, не..." (Не хлопай дверью, или не клади мокрый купальник на кровать, или что-либо в этом роде.) Когда сказать один или тысячу раз недостаточно, поведение не управляется стимулами.
Иногда может казаться, что мы обладаем стимульным контролем когда в действительности этого нет. Мы предполагаем, что сигналу или команде должны подчиниться, а этого не происходит. Самой распространенной реакцией на это является усиление сигнала. Так, официант не понимает вашего французского? Говорите громче. Чаще всего это не помогает. Субъект должен распознавать сигнал, иначе безразлично, кричите ли вы что есть мочи или даже ревете с помощью усилительной аппаратуры рок-ансамбля, на вас будут смотреть невидящим взором.
Другой реакцией человека на игнорирование условного сигнала является бешенство, которое действует только в том случае, если субъект проявляет преднамеренное непослушание, не давая твердо заученного ответа на хорошо выученный сигнал. При этом иногда, показав характер, можно получить хорошее поведение.
Бывает, что субъект отвечает правильно, но с очень большой задержкой или через пень-колоду. Часто неуклюжие ответы на команды определяются тем, что субъект не обучен отвечать быстро. Без положительного подкрепления не только за правильный, но и за проворный ответ на сигнал у субъекта нет шансов усвоить, что успех приносит быстрое повиновение стимулам. При этом поведение в действительности не контролируется стимулами.
Реальная жизнь изобилует плохой организацией управления с помощью стимулов. Как только один человек пытается проявить власть, другой оказывается в опасности проявить "непослушание" В действительности проблема состоит в непонимании команд или сигналов, которым он поэтому не может повиноваться Это примеры плохой коммуникации или нечеткого управления с помощью стимулов.
Правила управления с помощью стимулов
Для того, чтобы управлять с помощью сигналов, надо сформировать нужное поведение, а затем, когда оно осуществляется, делать так, чтобы оно происходило во время или сразу после какого-либо определенного сигнала. Этот стимул затем становится ключом, или сигналом, поведения.
Например, предположим, что вы заставляете собаку садиться, надавливая на крестец и подтягивая за ошейник. Это безусловные стимулы, они действуют без обучения. Затем вы подкрепляете любое самостоятельное проявление собакой этой позы, формируя соответствующее поведение. Делая это, вы произносите команду "Сидеть!", которая первоначально ничего не значит для собаки (конечно, подойдет и любое другое слово на любом языке). Когда собака усвоит, что вам иногда надо, чтобы она села, она иногда станет выполнять это действие во время или после предъявления сигнала, или условного стимула, команды "Сидеть!". В конце концов она начнет выполнять действие точно в соответствии с тем, что ей приказывают.
Теперь поведение находится под контролем стимула, не так ли? Еще нет. Проделана только половина работы. Животное следует также обучить — и это специальная тренировочная задача — не садиться без команды. Установление управления поведением стимулами не является завершенным, пока оно совершается и в отсутствии условного сигнала.
Это, конечно, не означает, что собака должна целый день стоять, пока вы не скомандуете: "Сидеть!". Она может садиться сколько ей вздумается. Однако во время тренировок или работы, когда предполагается использование условных стимулов, "пуск" и "стоп" сигналы должны быть твердо установлены, чтобы выполнение команды было надежным.
Итак, полный контроль с помощью стимулов определяется четырьмя условиями, к каждому из которых следует относиться как к самостоятельному разделу тренировочной задачи, самостоятельному пункту программы выработки.
1 Поведение всегда осуществляется сразу после подачи условного стимула (собака садится, "когда ей приказывают).
2. Поведение никогда не возникает в отсутствие стимула
(во время занятий или работы собака никогда не садится спонтанно).
3. Поведение никогда не наблюдается в ответ на другие стимулы (если вы говорите: "Лежать!", собака не должна садиться).
4. Никакое другое поведение не возникает в ответ на данный стимул (когда вы говорите. "Сидеть!" собака не должна ложиться или скакать и лизать ваше лицо)
Только когда все четыре условия соблюдаются, собака действительно полностью и окончательно понимает команду "Сидеть!". Теперь вы действительно управляете ею с помощью стимула.
Где в реальной жизни мы используем или нуждаемся в таком полном управлении с помощью стимулов. Ну к примеру, в музыке. Дирижеры оркестра часто создают очень сложную систему сигнального управления, а на репетиции дирижер может встретиться с самыми разнообразными неправильными реакциями. Например, он может дать сигнал означающий одно, — скажем, "форте", усиление звучания и не получить его, может быть, вследствие того что еще недостаточно прочно установлено значение сигнала. Или он может и не давать сигнала усиления, а тем не менее получить слишком большую интенсивность звука. Особенно этим отличаются духовые инструменты классических оркестров, Рихард Штраус в юмористическом своде правил для начинающих дирижеров говорил: "Никогда не подбадривайте взглядом играющих на духовых инструментах" Дирижер может дать сигнал, требующий другого, — допустим, "престо" а вместо'
увеличения темпа получить усиление звучания солисты теноры проделывают это весьма часто Наконец, дирижер может требовать включения большего числа исполнителей, а вместо этого получить множество ошибок, так происходит с хористами-любителями. Каждый тип неправильного ответа на условный стимул должен быть исправлен с помощью тренировки, прежде чем дирижер будет уверен, что у него или у нее адекватное сигнальное управление.
Так же жизненно важно сигнальное управление в военном деле. Занятия по строевой подготовке с новобранцами — утомительное и трудоемкое дело, и им самим оно может казаться трудным и бессмысленным, но оно выполняет очень важную функцию. Строевая подготовка не только вырабатывает точные реакции на строевые команды, что даст возможность командирам с легкостью приводить в движение большие группы людей, но она также вырабатывает навык ответа на условный сигнал вообще: повиновение команде, которое в конце концов является не столько умственным актом, сколько выученным умением, являющимся решающим, а часто и жизненно важным для солдата. С тех пор как были придуманы армии, строевая подготовка являлась способом выработки этого навыка.
Что может быть сигналом?
Условным стимулом — выученным сигналом может быть все, абсолютно все, что может быть воспринято. Флаги, свет, слова, прикосновения, вибрация, хлопки пробок шампанского — короче говоря, безразлично, какой сигнал вы используете Коль скоро субъект может воспринимать его, сигнал может быть использован для вызова выученного поведения.
Дельфинов обычно тренируют с помощью воспринимаемых зрением сигналов, руки, но я знаю одного слепого дельфина, который выучил много разных типов поведения в ответ на различные прикосновения. Пастушьих собак обычно дрессируют с помощью сигналов, поданных рукой и голосом. Однако в Новой Зеландии с ее широкими просторами,
где собака может находиться очень далеко, в качестве условного сигнала используют пронзительные свистки, которые слышны на большем расстоянии, чем голос. Когда новозеландский пастух продает такую собаку, покупателем может оказаться человек, живущий за много миль; так как свистки невозможно записать на бумаге, то старый хозяин обучает нового командам по телефону.
У рыб можно выработать условный рефлекс на звуки или свет — мы все знаем, как аквариумные рыбки устремляются к поверхности, если постучать по стеклу или включить свет. А человеческие существа могут выработать условные связи практически на все что угодно.
В тренировочной ситуации полезно, чтобы для всех субъектов были одни и те же ключи и сигналы, чтобы не только дрессировщик, но и другие люди могли вызывать данное поведение. Поэтому дрессировщики склонны строго следовать традициям в использовании условных стимулов. Во всем мире
лошади под седлом начинают движение, когда вы толкаете их пятками в бока, и останавливаются, когда вы натягиваете поводья. Верблюды в зоопарке Бронц ложатся, когда слышат команду "Каш!", даже если рядом с ними никого нет, включая их дрессировщика, говорящего по-арабски; и любой человек знает, что надо сказать, чтобы верблюд лег.
И то, что живущих в Нью-Йорке верблюдов можно с тем же успехом обучить ложиться при словах "Спокойно, крошка!", не имеет ни малейшего значения.
Поэтому-то профессиональные дрессировщики не могут понять, что многие условные стимулы выбраны произвольно. Однажды в платной конюшне я работала с молодой лошадью на корде, обучая ее команде "Вперед!". Тренер конюшни смотрел на это с отвращением и наконец сказал: "Так ничего не выйдет — лошади не понимают "Вперед!", надо цокать". Потом взял веревку у меня из рук, сказал: "Тцо-тцо" и стеганул жеребенка по крупу свободным концов веревки, что естественно тотчас же вызвало движение вперед.
"Понятно?" — сказал он, считая свои слова доказанными.
Я поняла. С тех пор, воспитывая моих пони, я обучала их слушаться не только моих команд, но и любой возможной системы понуканий, окриков, применяемой другими дрессировщиками. Это избавило меня от неприятностей и заставило говорить обо мне как о подающем надежды дрессировщике-любителе. По крайней мере мне не приходилось переделывать моих сигналов!
Обучить пони двум системам команд не только возможно, но и легко. В то время, как на каждый отдельный сигнал вам надо получать только какое-либо одно поведение, вполне достижимо получение одного и того же поведения на несколько условных сигналов. Например, в переполненном людьми помещении оратор может потребовать тишины, воскликнув: "Тихо!", или встать и, подняв руку, жестом призвать к молчанию.
А если присутствующие шумят и при этом находятся в некотором подпитии и, следовательно, отличаются рассеянным вниманием, поможет позвякивание ложкой по стакану. Мы все обучены осуществлять данное поведение в ответ на любой из, по крайней мере, трех этих стимулов.
Введение второго условного стимула для выученного поведения называется переносом стимулов. Чтобы добиться переноса, вы предъявляете старый стимул — допустим, команду, поданную голосом, — как всегда, и новую команду — скажем, сигнал, поданный рукой, — и подкрепляете ответ; затем постепенно делаете старый стимул все менее и менее заметным и одновременно привлекаете внимание к новому, делая его очень выраженным, пока на новый стимул не будете получать столь же хороший ответ, даже тогда, когда старый стимул не предъявляется вовсе. Обычно этот процесс идет несколько быстрее, чем выработка ответа на первоначальный стимул; когда уже выработано "Выполняй это действие" и "Выполняй это действие по команде", то легче выработать "Выполняй это действие также по другой команде".
Интенсивность сигнала и стирание стимулов
Не существует определенных требований к интенсивности и величине условного сигнала, вызывающего ответ. Первичные, или безусловные, стимулы, дают градуальный ответ в зависимости от интенсивности: реакция на резкий, колющий удар сильнее, чем на булавочный укол, и чем громче внезапный шум, тем сильнее мы вздрогнем. Однако условному стимулу достаточно быть узнану, чтобы вызвать полный ответ. Вы видите красный свет и останавливаете машину; быстрее или медленнее вы это делаете не зависит от размера светофора. До тех пор, пока вы распознаете сигнал, вы знаете, что делать. Поэтому, как только стимул заучен, возможно не только получить его перенос, но также постепенно его уменьшать, пока он не станет едва различим, но попрежнему будет давать те же результаты. Возможен случай, когда вы можете получать результаты при таких слабых сигналах, которые не видны постороннему глазу. Это называется "стирание" стимулов.
Мы пользуемся стиранием постоянно: то, что поначалу должно быть очень массированным стимулом ("Дик, нельзя сыпать песок на головы другим детям", — говорим мы, вытаскивая Дика из песочниц), со временем превращается в чуть заметный сигнал (просто поднять брови иди погрозить пальцем). Дрессировщики животных иногда добиваются поразительных, просто волшебных результатов с помощью стертых стимулов. Один из самых забавных номеров, которые я видела, проделывал попугай в Парке диких животных в Сан-Диего. Он разражался истерическим хохотом в ответ на чуть заметное движение руки дрессировщика. Представьте себе возможности этого трюка: "Педро, что ты думаешь о шляпе этого человека?" — "Ха-ха-ха!". Поскольку публика не замечает сигнал, единственное выученное попугаем поведение кажется результатом разумного сардонически-язвительного ответа на вопрос; а на самом деле это был четкий ответ на очень ослабленный стимул, а сардонический ум, если и присутствовал, то принадлежал дрессировщику, а может быть, сценаристу.
Однако лучшие примеры обусловливания, стирания и переноса стимулов мне приходилось наблюдать не в мире дрессированных животных, а на репетициях симфонических оркестров. Будучи певцом-любителем, я занималась в нескольких оперных и симфонических хорах, которые часто управлялись заезжими дирижерами. В то время как многие из сигналов, которые подают дирижеры музыкантам, являются более или менее стандартизованными, у каждого из дирижеров есть свои собственные сигналы, и их значение должно быть усвоено в очень короткое время — время на репетицию часто лишь немногим превосходит время на выступление. Однажды на репетиции симфонии Малера "Воскрешение", как раз в тот момент, когда басы собирались вступить с обычной оглушительной силой, я увидела, как дирижер предъявил безусловный сигнал, предупреждавший: "Вступайте мягче", изобразив на лице страшную тревогу, пригнувшись к земле и заслонив лицо рукой, как бы защищаясь от удара. Все поняли смысл переданного сообщения, и в следующие несколько минут дирижер смог ослабить сигнал и уменьшить интенсивность звучания всех частей хора с помощью предостерегающего взгляда, легкого движения спины, имитирующего припадание к земле, или чуть заметного отголоска от прежнего жеста, и наконец, только вздрагивание плеч. Столь же часто дирижеры осуществляют перенос стимулов, сочетая какой-либо известный или самоочевидный жест — скажем, - поднятие ладони кверху для обозначения "Громче" — с незнакомым жестом, таким, как присущий только ему наклон головы или поворот тела — однажды, сидя слева от дирижера среди альтов, я наблюдала дирижерский жест, управляющий громкостью звучания альтов с помощью левой брови.
Одним из результатов введения управления с помощью стимулов является усиление внимания субъекта, необходимое, если он хочет получить подкрепление за правильный ответ, особенно, если стимулы подвергаются стиранию. Бывает, что субъект способен воспринять столь слабые сигналы, в которых не отдает себе отчета сам дрессировщик, подающий их. Классический пример этого — Умный Ганс, лошадь, живущая в Германии. Это было в начале века; ее считали гениальной. Ударами копыт она могла считать, производить арифметические действия, складывать из букв слова и даже извлекать квадратные корни; правильные ответы, конечно, подкреплялись лакомством. Хозяин, в прошлом школьный учитель, был совершенно уверен, что обучил лошадь читать, думать, заниматься математикой и вступать в общение. И действительно лошадь "отвечала" на вопросы даже в отсутствие хозяина. Многие ученые мужи приезжали в Берлин изучать Умного Ганса и убеждались в его гениальности. И лишь одному из психологов удалось показать, что лошадь ориентируется на какой-то сигнал, и, если никто из присутствующих не знает ответа, удары копыта носят неопределенный характер. Потребовалось длительное время и дальнейшее исследование, против которого восставали те, кто был убежден в гениальности лошади; чтобы показать, что сигналом к прекращению ударов копыта был легкий подъем головы хозяина или любого другого человека, задающего вопрос, когда достигалось правильное число, это движение, первоначально усиливаемое широкополой шляпой, которую носил учитель, теперь было столь малым, что его почти не было видно (никому, кроме Умного Ганса), но оно почти не поддавалось подавлению произвольным усилием. Вот поэтому лошадь могла ориентироваться, когда прекращать удары копытом, наблюдая за любым человеком, а не только за хозяином. Феномен Умного Ганса стал нарицательным для любого случая, когда внешне поразительное поведение, начиная от разума животного, кончая психическими явлениями, на самом деле управляется какими-либо мельчайшими или стертыми проявлениями поведения экспериментатора, ставшими условными стимулами для субъекта.
Условные стимулы, вызывающие отвращение
Единственным случаем, где сила условного стимула, по-видимому, имеет значение, является обычно дрессировка домашних животных — рывок за поводья или привязь, легкий удар по бокам лошади — все это размытый вариант первоначального безусловного стимула, резкого рывка или толчка, сильного удара рукой, которые вызывают ответ, не требующий обучения. Поэтому, если слабый стимул не действует, создается впечатление, что ответ возрастает, если вы усилите стимул. Однако попытки осуществить это на практике встречают большие затруднения.
Выученные сигналы и первоначальные стимулы совершенно различны по своей природе, а новички обычно это не учитывают. Если они не получают ответа, скажем, на легкий рывок, они дергают чуть сильнее, затем еще немного сильнее, и все совершенно без пользы, так как лошадь или собака с той же возрастающей силой тянут в другую сторону.
Профессиональные дрессировщики имеют обыкновение работать над сигналом и применять силу раздельно; они дают условный стимул, и если животное ему не повинуется, они, минуя все градации, немедленно вызывают нужное поведение чрезвычайно сильным неприятным стимулом, способным "освежить память", как выражается один дрессировщик лошадей. Такую же функцию выполняет парфорс в дрессировке собак. При умении даже небольшой человек, используя такой ошейник, может добиться такого рывка, который будет достаточен, чтобы свалить с ног датского дога.
Имея в запасе эти первичные стимулы, можно быстро получить хороший ответ на очень слабые рывки, и, как замечает английская дрессировщица Барбара Вудхаус, это в конечном счете гораздо лучше, чем постоянно дергать и тянуть за шею бедное животное к каким-то промежуточным и бессмысленным целям.
Время отставления
Чтобы добиться точности ответа на условный стимул, полезно применять прием ограничения времени отставления.
Допустим, ваш подопечный обучился совершать какое-либо действие в ответ на условный сигнал, но обычно имеется некоторый интервал времени между предъявлением стимула и ответом субъекта. Вы пригласили людей на ужин, и они немного запоздали, или ваш слон после сигнала к остановке
постепенно замедляет ход и наконец останавливается.
Если вы хотите, то, используя ограничение времени отставания, можете в процессе тренировки так сократить этот интервал, что поведение будет возникать так быстро, как это только физически возможно.
Вы начинаете с того, что устанавливаете нормативный интервал, с которым обычно наблюдается поведение; затем вы подкрепляете только то поведение, которое совершается в течение этого интервала. Поскольку живые существа характеризуются вариабельностью, некоторые ответы будут выходить за пределы интервала и за них не будет даваться подкрепление. Например, если вы подаете ужин точно в назначенное в приглашении время, а не ждете опоздавших, то они рискуют получить все холодное или застать меньший выбор.
Когда вы подобным образом установите временной интервал и будете давать подкрепление только на его протяжении, то скоро вы обнаружите, что постепенно все ответы начинают наблюдаться в его пределах и ни один не выходит за него. Теперь вы снова можете подтянуть гайки. Достаточно ли пятнадцати минут, чтобы семья собралась? Начните подавать на стол через двенадцать минут после того, как всех позвали, или через десять. Как быстро вы будете закручивать гайки, должно быть точно определено; как и при каждом процессе выработки желательно находиться в тех пределах, в которых наиболее часто наблюдается данное поведение.
Животные и люди имеют очень развитое чувство времени и чрезвычайно четко реагируют на выработку времени отставания, но дрессировщик не должен полагаться на авось.
Пользуясь часами или даже секундомером, если хотите, чтобы выработка отставления работала на вас. Для поведения ближайших окружающих, включая себя, сократите время ответа, скажем, с пяти тактов до двух. И конечно, если вы работаете с людьми, не обсуждайте ваши действия; вы не получите ничего, кроме возражений. Просто делайте и смотрите, что получается.
В 1960 г. в океанариуме "Жизнь моря" одним из наиболее эффектных номеров, всегда привлекавших внимание, была группа из шести небольших дельфинов, выполнявших различные акробатические трюки в воздухе синхронно. Они совершали различные прыжки и повороты в ответ на подводные звуковые сигналы. Первоначально, когда сигналы только вводились, прыжки, вращения и все остальные действия, которые от них требовались, возникали спорадически с интервалами пятнадцать-двадцать секунд. Но использовав секундомер и установив фиксированное отставание, мы смогли снизить время реакции до двух с половиной секунд. Каждое животное знало, что получить рыбу можно только выскочив в воздух и совершив нужный прыжок или вращение в течение двух с половиной секунд после начала сигнала.
В результате дельфины располагались вокруг подводного источника звука навострив уши, и когда включался сигнал, поверхность бассейна просто взрывалась их телами, извергающимися в воздух; это было действительно зрелище. Однажды, сидя среди зрителей, я была поражена, услыхав, как какой-то человек профессорского вида, - по-видимому психолог, безапелляционно объяснял своим спутникам, что единственный способ, который мы могли применить, чтобы добиться такой реакции, является удар электрического тока.
В реальной жизни ограничение времени отставания является попросту тем временем, которое вы считаете нужным ждать, пока просьба или инструкция будут выполнены. Родителей, начальников, и учителей, которые проявляют последовательность в выработке определенного временного интервала реакции, обычно считают хорошими, заслуживающими того, чтобы с ними иметь дело, даже если отставание — временное "окно", в течение которого должно осуществляться поведение, которое будет подкреплено, — очень короткое.
Предвосхищение
Наиболее частым недостатком в управляемом сигналами поведении является предвосхищение: как только сигнал усвоен, субъект так стремится продемонстрировать требуемое поведение, что совершает его раньше, чем подается сигнал.
Термин, описывающий это проявление, заимствован из опережающего поведения у людей при состязаниях в беге — опережая выстрел, фальстарт, ложная тревога. Люди, которые опережают указания и просьбы других, обычно считаются нетерпеливыми, выскочками или подобострастными; это очень раздражающая привычка, а вовсе не добродетель.
На соревнованиях по выучке с доберман-пинчерами часто бывают неприятности. Хотя эти собаки прекрасно поддаются дрессировке, они столь возбудимы, что предвосхищают команды по малейшим намекам и начинают работать прежде, чем им в действительности приказывают, теряя при этом баллы. Предвосхищение является обычной ошибкой лошадей, с которых бросают лассо на родео. Предполагается, что ковбой и лошадь должны ждать за барьером, пока не пустят бычка, но возбужденная лошадь перескакивает барьер раньше сигнала.
Ковбой иногда думает, что у него лошадь с высокими ходовыми качествами, но на самом деле это просто недостаточно выработанное управление с помощью сигналов.
Другой чрезвычайно распространенный случай предвосхищения — офсайт в американском футболе. Один из игроков так нетерпелив, что продвигается на территорию другой команды до того, как подан сигнал игры, за что команду наказывают.
С практической точки зрения ликвидировать предвосхищение можно, вводя тайм-ауты. Если субъект предвосхищает сигнал, и если это нежелательно, прекратите, всякую работу. Не давайте сигналов и ничего не делайте целую минутy. Каждый раз как субъект опередит выстрел, останавливайте часы. За нетерпение вы наказываете отставлением возможности работать. Это вызывает очень эффективное подавление опережения команды, в то время как выговоры, наказание или повторение могут оказаться вовсе недейственными.
Стимулы в качестве подкрепления: поведенческие цепи
Как только стимул становится условным сигналом, происходит интересная вещь: он превращается в подкрепление. Вспомните звонок на перемену в школе. Звонок на перемену является сигналом, условным сигналом, означающим: "Вы свободны, идите и играйте". А кроме того, он воспринимается как подкрепление — дети рады, когда слышат его, и если бы они смогли сделать что-либо, чтоб заставить его прозвенеть скорее, они бы это сделали. Теперь представьте себе звонок на перемену, который не звонит, если в классе нет тишины. Ко времени перемены у вас будет очень тихий класс.
Условный стимул — предвестник подкрепления, и поэтому он становится желаемым событием. Желаемое событие — это само по себе уже подкрепление, а потому вы с успехом можете подкреплять поведение, давая условный стимул другого поведения. Например, я вознаграждаю кошку лакомством, когда она подходит ко мне по команде — она этому научается и выполняет это. Теперь, если я буду говорить: "Ко мне" и вознаграждать ее за реакцию всякий раз как увижу ее - на камине, то скоро окажется, что кошка, стремясь получить лакомство, будет забираться на камин. Как вы помните, с точки зрения кошки, она обучает меня давать ей лакомство. Для этого она нашла способ заставлять меня произносить: "Ко мне". Теперь допустим, что я обучаю ее вспрыгивать на камин, когда я жестом показываю на него, подкрепляя правильные ответы либо пищей, либо командой "Ко мне". Затем я буду жестом указывать на камин всякий раз, когда: а) я знаю, что кошка голодна и б) когда она случайно перевернется через спину...
Я выработала цепное поведение.
Поведенческие цепи — очень распространенное явление.
В реальной жизни мы часто производим серии связанных действий, состоящих из многих отдельных поведенческих актов. Не надо далеко ходить за примерами — работа плотника или уборка квартиры — неплохая иллюстрация. Мы ожидаем, что и наши питомцы будут вести себя так же: "Подойди", "Сядь", "Ляг", "Следуй за мной" и так далее без перерыва и без видимого подкрепления. Эти длительные рады действий являются цепным поведением. В противоположность другим длительным действиям эти могут выполняться часами, сотни раз без напряжения, без сбоев, без задержек, поскольку каждый акт в действительности подкрепляется возможностью выполнить следующее, действие цепочки, и так до заключительного подкрепления выполнением всего дела, всей цепи.
Однако поведенческие цепи рвутся и поведение рассыпается на элементы, если в цепочку вклинивается невыученный поведенческий акт, или действие, не находящееся под контролем стимулов. Вы не можете подкрепить субъекта сигналом, если он этот сигнал не распознает или не может выполнить то, что этот сигнал требует. Отсюда следует, что цепное поведение следует всегда вырабатывать с конца. Начинайте с последнего действия в цепи, удостоверьтесь, что оно усвоено и сигнал к его выполнению хорошо узнается, лишь потом переходите к разучиванию предпоследнего действия и т.д. Например, если при заучивании стихотворения, мелодии, текста речи, роли в пьесе вы разделите задания, скажем, на пять частей и начнете запоминать их в обратном порядке, с конца — вы всегда будете двигаться от того, что вы знаете слабее, к тому, что знаете более прочно, от материала, в котором вы не совсем уверены, к материалу, хорошо уже усвоенному, имеющему подкрепляющее действие. Запоминание материала в том порядке как он написан и должен воспроизводиться приводит к необходимости постоянно продираться от знакомой тропы в сторону более трудного и неизвестного, что - является неподкреплением. Подход к запоминанию материала как к цепному поведению не только убыстряет процесс запоминания, но и делает его более приятным.
Поведенческие цепи — это особое понятие. Я часто сама спотыкалась на них, чувствуя, что надо вернуться к концу ряда, так как я не могу заставить животное, ребенка или себя выполнить кажущуюся простой последовательность действий, пока я не понимала, что пыталась выработать цепное поведение не с того конца. Когда делают пирог, - то глазурью его украшают в последнюю очередь, но если вы хотите обучить ребенка получать удовольствие от приготовления пирога, начните с того, что попросите "помочь" украсить его глазурью.
Пример цепного поведения: обучение собаки игре в фризби (пчелку)
Один мой нью-йоркский знакомый каждый выходной ходил со своим золотистым спаниелем в Центральный парк, чтобы играть в "пчелку". Он рассказывает мне, что сплошь и рядом встречает людей, безуспешно пытающихся обучить своих собак этой игре. Это досадно, потому что игра в "пчелку" прекрасный способ тренировки собаки в городе. По сравнению с простым мячом "пчелка" летит медленнее и по неопределенной траектории, возможно, больше напоминает реальную дичь, заставляет собаку совершать прыжки в попытках поймать ее, что доставляет удовольствие и хозяину. И, наконец, игра в "пчелку" позволяет хозяину, оставаясь на одном месте, заставлять собаку бегать.
Люди жалуются, что, когда они бросают "пчелку", собака наблюдает за ее полетом, продолжая оставаться на месте, хотя если ее раззадорить, то она будет прыгать, пытаясь схватить "пчелку", когда та пролетает мимо. В этой игре два дрессировочных момента: первый состоит в том, чтобы обучить собаку, на какое расстояние она должна отбегать за "пчелкой". Второй состоит в том, что данная игра — цепное поведение: сначала собака гонится за "пчелкой", затем ловит "пчелку", наконец, несет ее назад хозяину, чтобы он снова кинул ее. Поэтому каждому элементу этого сложного поведения следует обучать отдельно, и последнее действие в цепи, принос, должно быть выработано первым.
Вы можете обучить приносу с очень маленьких расстояний даже в доме, используя предмет, который легко носить, скажем, старый носок. Большинство охотничьих собак приносят предметы сами, без обучения, собак некоторых пород, таких, как бульдоги, боксеры, необходимо обучать класть апорт около хозяина или отдавать его в руки, поскольку они предпочитают игры, в которых бы вещи у них отбирали.
Когда по команде собака будет приносить предметы, обучите ее ловить "пчелку". Сначала заставьте собаку как можно сильнее заинтересоваться "пчелкой", двигая ее у самой морды. Позвольте ей несколько раз взять игрушку в рот и добейтесь, чтобы она отдала вам ее обратно, при этом, конечно, бурно поощряйте ее за возврат. Затем подбросьте игрушку в воздух, позвольте собаке завладеть ею в прыжке и заставьте отдать обратно. Затем вы тут же снова подбрасываете игрушку в воздух и бурно радуетесь, когда собака ее поймает. И теперь вы на прямой дороге к получению великолепного игрока в "пчелку".
Расстояние бросков постепенно увеличивается, и собаке необходимо научиться следить за "пчелкой" и перемещаться так, чтобы поймать ее. Это требует тренировки, поэтому может понадобиться пара выходных, чтобы заставить собаку отходить на семь-восемь метров. Некоторым очень быстрым собакам удается оказываться точно на месте и ловить "пчелку" на таком большом расстоянии, на какое вы сможете ее забросить. Мне приходилось встречать необыкновенных собак, которые могли поймать "пчелку" на другом конце футбольного поля. Создавалось впечатление, что собаки получают удовольствие от точности своей оценки места падения.
Блестящий бег или фантастические захваты в прыжках с переворотом, которые вызывают восторг зрителей, - тоже доставляют собаке радость. Тем не менее, поймав "пчелку", собака несет ее вам, поскольку последнее звено цепи разучено первым и поскольку именно это действие приводит к подкреплению, будь то ваша похвала или другой бросок. Разумеется, если вы будете невнимательны и собака будет систематически не получать похвалы или следующего броска не будет, принос подвергнется затуханию. И еще, когда собака слишком устает и не хочет больше играть, она начинает все хуже и хуже приносить "пчелку", медлит с возвращением и бросает ее на полпути. Это означает, что пора остановиться — вы оба уже взяли от игры все.
Генерализованное управление с помощью
Стимулов.
С большинством животных приходится сначала немного повозиться, чтобы установить управление их поведением с помощью стимулов, но часто к тому времени, как берете под контроль сигналов третий или четвертый тип поведения, оказывается, что животное как бы обобщает, у него появляется нечто вроде понимания идеи. Выучив три-четыре условных поведенческих акта, большинство субъектов, по-видимому, начинают распознавать определенные события в качестве сигналов, каждый из которых означает свой тип поведения, и что получение подкрепления зависит от правильного распознавания и ответа на сигналы. С этого момента введение условных сигналов становится простым. У субъекта уже имеется общая картина, и все что ему надлежит сделать — это научиться классифицировать новые сигналы и ассоциировать их с правильным поведением. Если вы, как дрессировщик, поможете питомцу, сделав это понятным, последующее обучение может идти само собой много быстрее, чем трудные начальные шаги.
У людей обобщение происходит еще быстрее. Если вы вознаградили за ответ только на одну выученную команду, люди очень скоро начинают давать ответы и на другие команды, чтобы заслужить подкрепление. Мой друг Ли, учитель математики шестого класса школы в одном из непривилегированных районов Нью-Йорка, каждый учебный год начинает с того, что обучает школьников выбрасывать жевательную резинку, как только он попросит их об этом. Никакого принуждения. Просто: "Все, внимание, жевательную резинку изо рта. Хорошо! Стоп! Подождем, у Дорин она еще есть... великолепно! Она ее вынула. Молодец, Дорин!". Он говорит детям, что после урока они могут снова взять жевательную резинку (используя в качестве подкрепления слова "Класс свободен!"). Это может показаться фривольным и даже глупым (поскольку это стоит Ли вида жующих челюстей, чего он терпеть не может), но Ли установил, что этот первый опыт подготавливает его класс к тому, что выполнение его просьб создает возможность подкрепления. Конечно, подобно хорошему дрессировщику китов, он использует разнообразные подкрепления, помимо хороших отметок и собственной похвалы, включая игры, одобрение сверстников, более ранее окончание урока, даже раздачу жевательной резинки. И конечно, сначала он уделяет много времени жевательной резинке, вместо того, чтобы уделять его десятичным дробям, дети думают, что он помешан на резинке. Но дети так же придают значение его словам и считают, что имеет смысл делать то, что хочет Ли.
Другие учителя думают, что у Ли врожденное умение поддерживать тишину в классе, а директор считает его хорошим "дисциплинщиком". Что же касается Ли, то он считает детей достаточно сообразительными, чтобы обобщить свои реакции, и любит их за это. А жевательная резинка тут ни при чем.
Провалы преднаучения
и вспышки раздражения
Установление контроля над поведением с помощью стимулов часто порождает интересный феномен, который один из тренеров назвал "провалом преднаучения". Вы сформировали поведение и теперь пытаетесь сделать его управляемым с помощью стимулов. Но когда вам кажется, что субъект уже проявляет способность отвечать на стимулы, он внезапно перестает отвечать не только на стимулы, но и вообще давать нужные реакции. Он ведет себя так, будто никогда и не слышал о действиях, которые вы сформировали.
Этот момент полностью обескураживает тренера. Вот вы очень изобретательно научили цыпленка танцевать, а теперь хотите, чтобы он танцевал только, когда вы поднимаете правую руку. Цыпленок смотрит на вашу руку, но не танцует.
Или же он может стоять на месте, когда вы подаете сигналы, и начинать интенсивно отплясывать, когда никакого сигнала не было.
Если вы построите график этой последовательности, то увидите постоянно идущую кверху линию, отражающую увеличение процента правильных ответов (т.е. ответов на сигналы), которая затем резко снижается, ибо соответственно правильность ответов падет до нуля (когда вы имеете букет отсутствия ответов и неправильных ответов). Однако если вы продолжаете упорно работать, затем внезапно наступает озарение: вдруг, совершенно случайно, субъект скачком начинает отвечать на команды действительно идеально — вы поднимаете руку, цыпленок танцует. Поведение управляется стимулами.
На мой взгляд, происходит вот что: сначала субъект выучивает сигнал, не осознавая этого, дрессировщик видит только обнадеживающую тенденцию медленного нарастания правильного выполнения команд. Но затем субъект замечает (!) сигнал и осознает, что на него надо как-то отвечать, чтобы получить подкрепление. В этот период он уделяет большее внимание сигналу, чем проявляемому поведению. Конечно, при этом ответ отсутствует, так же как и подкрепление. Когда же, по случайному стечению обстоятельств, или в результате упорства тренера, субъект однажды осуществит реакцию при наличии сигнала и получит подкрепление, у него "возникнет картина". С этого момента он "знает", что означает сигнал, и отвечает на него правильно и уверенно.
Я понимаю, что говорю по этому поводу много таких слов, как "отдает себе отчет", "знает" в отношении того, что происходит в голове субъекта, которые большинство психологов считают неприменимыми к животным. Однако при дрессировке животных иногда так оно и есть, что уровень правильных ответов постепенно нарастает, хотя внешне ничего существенного не происходит; трудно сказать, с какого момента, если таковой вообще существует, животное начинает осмысленно отдавать себе отчет в том, что делает. Но наличие провала преднаучения, по моему мнению, является отражением осознания, вне зависимости от того, какие процессы в это вовлекаются. Я могла обнаружить ярко выраженное проявление провала преднаучения (а следовательно, и своего рода сдвиг осознания) в данных Мишеля Уолкера, исследователя из Гавайского университета, ставившего эксперименты по сенсорному различению у тунца, одного из наиболее разумного вида рыб, но в конце концов только рыбы.
Для субъекта провал преднаучения — время наибольших огорчений. Мы все знаем, как расстраивает борьба с тем, что понимаем только наполовину (общеизвестный пример — математические понятия), зная только то, что по-настоящему их не понимаем. Часто субъект бывает настолько расстроен, что проявляет гнев и агрессивность. Дети разражаются слезами и тычут в учебник математики карандашом. Дельфины многократно выпрыгивают из воды и шлепаются о ее поверхность со страшным шумом. Лошади размахивают хвостом и норовят лягнуть. Собаки рычат. Доктор Уолкер обнаружил, что если при выработке распознавания стимула он допускает, что его подопытные тунцы и совершают ошибки и не получают подкрепления более сорока пяти секунд, они настолько расстраиваются, что выпрыгивают из бассейна.
Я пришла к тому, что стала называть эти проявления преднаучения вспышками раздражения. Мне кажется, что вспышки раздражения возникают потому, что субъект, считавший себя всегда правым, вдруг обнаруживает, что он ошибается (раз за разом), а причина этого неясна... пока. У людей вспышки раздражения в период преднаучения, по-видимому, часто происходят в моменты, когда бросается вызов привычным представлениям, которых длительно придерживались, а где-то в глубине души субъект знает (!), что в новой информации кроется некая правда. Именно распознание того, что выученное ранее не совсем верно, по-видимому, и приводит к неистовым возражениям, чрезмерным ответам, которые намного превышают степень несогласия, спорам, скандалам, которые могут казаться по наитию наиболее подходящими и вероятными к случаю. Иногда, рассказывая о подкреплении в научных кругах, я вызывала, большую, чем предполагала, враждебность со стороны представителей других дисциплин, начиная от психологов, занимающихся познавательными процессами, кончая нейрологами и представителем высшего духовенства. Я часто подозреваю, что гневные слова являются симптомом преднаучения.
Я всегда сожалею, когда вижу приступы плохого настроения, связанного с преднаучением, даже у тунцов, потому что при определенных навыках можно провести субъекта по пути обучения, не вызывая столь большого раздражения. Однако я пришла к убеждению, что вспышки раздражения в период преднаучения являются четким индикатором того, что вот-вот произойдет истинное обучение. Если вы отойдете в сторонку и дадите ему отшуметь как ливню, то вслед за этим может появиться радуга.
Применение управления с помощью сигналов
Никому не нужно постоянно управлять или быть управляемым с помощью условных стимулов или выученных сигналов, живые существа — это не машины. В действительности реакция на выученный сигнал представляет собой усилие, причем такое усилие, которое не только не должно, но и не может поддерживаться постоянно.
Большую часть времени у начальника нет надобности держать подчиненных радом. Если дети бездельничают, а вы не очень спешите, то вы можете сами расслабиться. Служащим, которые и так уже работают с полной отдачей, не нужны приказы и инструкции. Ни нас самих, ни других людей не должны опутывать ненужные правила и регламентации: они вызывают только сопротивление.
Совершенно очевидно, что управление с помощью стимулов используется, чтобы дети стали воспитанными, домашние животные слушались, персонал был надежным и т.д.
Очень своеобразное управление с помощью стимулов необходимо также для многих видов коллективной деятельности, таких, как марширующие колонны, танцевальные ансамбли, спортивные команды. Отвечать на выработанную систему выученных сигналов доставляет определенное удовольствие, даже животным, по-видимому, это нравится. Я думаю, эте происходит оттого, что стимулы становятся подкреплениями, как в поведенческой цепи, так что, когда овладеваешь всеми типами поведения и сигналами, осуществление ответов имеет сильное подкрепляющее действие. Словом, это интересно.
Отсюда то удовольствие от участия в управляемой стимулами групповой деятельности, как, например, согласованный танец, игра в футбол, хоровое пение и игра в оркестре.
Когда мы видим какой-либо пример прекрасно управляемого сигналом поведения, начиная с фигур высшего пилотажа, исполняемых группой истребителей, до класса хорошо умеющих вести себя детей, то, желая похвалить их, используем понятие дисциплины. "Они поистине хорошо дисциплинированы" или "Этот учитель знает, как
поддерживать дисциплину". Однако понятие о дисциплине включает применение наказания, которое, как мы видели, совершенно не нужно при установлении управления с помощью стимулов.
В обиходе сторонниками дисциплины считаются инструктор, родитель, тренер, которые требуют совершенного исполнения и наказывают за любое отклонение, а совсем не те, кто добивается совершенства, подкрепляя улучшения в его сторону. И именно поэтому люди, задавшиеся целью установить "дисциплину", часто пытаются управлять с помощью стимулов на основе: "Делай, что я скажу, иначе..." Поскольку субъект должен ошибиться или не послушаться, чтобы узнать, что значит "иначе", и поскольку тогда становится уже слишком поздно этого не совершать, то этот распространенный подход вовсе не так хорош.
Истинное, изящное управление сигналами, установленное с помощью подкрепления, может делать то, что мы считаем дисциплиной субъекта. Однако кто должен стать действительно дисциплинированным так это тренер.
Да, но с чего начать? Что, если вы живете и работаете среди людей, которые являются закоренелыми неслухами?
Вот система Карен Прайор эффективного воздействия в тяжелом случае.
Карен Прайор (видя мокрые плавки и полотенце Юного Гостя на кушетке в гостиной): Пожалуйста, снимите свои мокрые вещи с кушетки и повесьте на сушилку.
Юный Гость: 0'кей, минуточку.
К.П. (подходит к Ю.Г. и стоит рядом с ним молча).
Ю.Г. В чем дело?
К.П. Пожалуйста, снимите свой мокрый купальник с кушетки и повесьте на сушилку (NB: не прибавляя: "Сейчас же!", "Сию минуту!", "Я сказала" или что-нибудь в этом роде. Я обучаю этого человека выполнять просьбы с первого раза, а не ждать, когда сигнал будет усилен дальнейшими деталями ими угрозами.)
Ю.Г. Вот еще, если вы так спешите, то почему бы вам не сделать это самим?
К.П. (Любезная улыбка, но никакого ответа. Я жду момента подкрепить желаемое поведение. Препирательство со мной не является желаемым поведением, поэтому я пренебрегаю им.)
Ю.Г. Ладно, ладно (Встает, идет к кушетке, забирает вещи, бросает их в комнату, где стирают.)
К.П. В сушилку.
Ю.Г. (Ворчит, поднимает и вешает вещи на сушку.)
К.П. (Широкая улыбка, искренне, без издевки) Благодарю вас!
В следующий раз, когда мне будет нужно попросить юного гостя что-нибудь сделать, возможно, мне потребуется всего лишь взглянуть на него, чтобы вызвать действие. Мало-помалу он станет одним из тех домочадцев, которые быстро исполняют мои просьбы, а я со своей стороны - буду платить ему тем же, буду выполнять то, что он просит, если это выполнимо, и буду стараться не просить его делать более, чем он должен.
Знание того, как добиться управления с помощью стимулов, не прибегая к крику и принуждению, в равной мере облегчает жизнь всем — воспитателю и обучаемому. Когда моя дочь Гейл поступила в высшую школу, ей пришлось ставить учебную пьесу, ежегодно для этого выбирали кого-либо из студентов.
IV. ОТУЧЕНИЕ:
КАК ИСПОЛЬЗОВАТЬ ПОДКРЕПЛЕНИЕ,
ЧТОБЫ ИЗБАВИТЬСЯ ОТ НЕЖЕЛАТЕЛЬНОГО
ПОВЕДЕНИЯ
Итак, вы знаете о том, как сформировать новое поведение, а как вам избавиться от нежелательного поведения, которое уже имеется?
Люди и животные всегда совершают то, что с нашей точки зрения лучше бы они не делали. Дети устраивают потасовку и кричат в машине. Собака лает всю ночь. Кошки дерут когтями мебель. Ваш сосед по комнате всюду разбрасывает грязные вещи. От кого-нибудь из родственников слышишь постоянные придирки с требованием телефонных звонков. Все это — нежелательные виды поведения.
Существует восемь способов избавиться от нежелательного вида поведения. Всего восемь. И не важно, является ли это поведение укоренившимся, как в случае неряшливого соседа по комнате, или внезапным, как в случае детей, бесчинствующих в машине. Все, что вы можете предпринять по этим поводам, будет вариацией на тему одного из восьми методов.
(Я не касаюсь здесь сложных сочетаний поведенческих проблем, которые возникают у человека с психическими нарушениями или у непредсказуемо свирепой собаки; я рассматриваю только отдельные проявления нежелательного поведения.)
Вот эти восемь методов.
Метод 1. "Убить зверя". Это безусловно подействует. Вам никогда больше не придется снова иметь дело с данным поведением у данного субъекта.
Метод 2. Наказание. (Предпочитаемо всеми, хотя оно почти никогда не приносит действительной пользы.)
Метод 3. Отрицательное подкрепление.
Метод 4. Угашение: поведению предоставляется возможность исчезнуть самому по себе.
Метод 5. Выработка несовместимого поведения. (Этот метод имеет особую значимость для спортсменов и владельцев домашних животных.)
Метод 6. Добиться, чтобы данное поведение совершалось по сигналу. (В последующем вы перестанете давать этот сигнал. Это наиболее изощренный метод, применяемый тренерами дельфинов для того, чтобы избавиться от нежелательного поведения.)
Метод7. "Формирование отсутствия": подкрепляется все что угодно, кроме нежелательного поведения. (Вежливый способ превратить неприятных родственников в приятных.)
Метод 8. Смена мотивации. (Это основной и самый лучший способ.)
Видно, что есть четыре "злых волшебника", или отрицательных метода, и четыре "добрых волшебника", или методы, использующие положительное подкрепление. У каждого своя роль. Я собираюсь привести "за" и "против" каждого из методов по очереди, а также некоторые истории и обстоятельства, в которых данный метод оказывался действенным.
В рассмотрение каждого метода я включу повторяющийся набор знакомых всем проблем (шумливая собака, раздражительный спутник жизни и т.д.) и примеры того, как каждая из проблем может быть решена данным методом.
Я не считаю, что все эти решения применимы. Например, я думаю, что пригласить ветеринара, чтобы заставить собаку прекратить лаять, перерезав голосовые связки (метод 1), является отвратительным решением проблемы собаки, лающей по ночам. Я утверждаю это, несмотря на то, что мой дядя Джон Слэтер прибег к этому решению, и я вынуждена была согласиться, когда соседи стали жаловаться на лай его морских львов. Конечно, немногие держат морских львов у себя в плавательном бассейне.
Вероятно, в этом случае можно было бы найти какой-то другой способ.
Я не могу сказать, какой из восьми методов вам надо выбрать, чтобы избавиться от данной конкретной помехи. Вы тренер, вам и решать.
Метод 1. "Убить зверя"
Это действует безотказно. С данным субъектом у вас наверняка больше не возникнет этой поведенческой проблемы. Фактически это широко распространенный и всеми признаваемый метод борьбы с собаками, загрызающими овец.
Метод 1 является высшей мерой наказания. Каковы бы ни были моральные или другие подтексты (аспекты) высшей меры наказания, но если казнить убийцу, он больше не совершит преступления. Методом 1 избавляются от поведения, временно или навсегда избавляясь от того, кто его совершает.
Увольнение служащего, развод с супругом, переселение в другую комнату от неряшливого соседа — все это метод 1.
С другими людьми могут возникнуть новые проблемы, но того субъекта, чьим поведением вы сыты по горло, больше нет, и с ним исчезло данное поведение.
Метод 1 довольно жесток, но иногда вполне адекватен, когда проступок слишком велик для того, чтобы иметь продолжение и не представляется возможности для его легкого изменения. Допустим, например, что кто-то из ваших родителей, супруг (или ребенок) бьют вас. Некоторые находят из этого выход в реальном уничтожении того человека, и в крайних случаях самозащита может быть оправдана. Уход из дома — тоже разрешение проблемы методом 1, но более гуманное.
Однажды у меня была кошка, у которой появилась привычка прокрадываться по ночам в кухню и мочиться на конфорку плиты. Запах, когда на следующий день вы, ничего не подозревая, включали одну из этих конфорок, был совершенно невыносимым. Кошка могла свободно выходить на улицу, я никогда не поймала ее на месте преступления, а если конфорки закрывались, она мочилась на то, чем они были закрыты. Я не могла понять побуждающих ее причин, и в конце концов ее пришлось усыпить. Метод 1.
Существует много простых и широко распространенных модификаций метода 1: отправить ребенка в его комнату, когда он вмешивается в разговор взрослых; привязать собаку, чтобы она не гонялась за машинами; посадить того или иного человека в тюрьму на различный срок. Мы привыкли считать такие меры наказанием (Метод 2), и они могут рассматриваться, а могут и не рассматриваться субъектом как наказание, но они являются приемами метода 1. В их основе лежит то, что они прекращают данное поведение, физически лишая субъекта возможности его осуществления или избавляясь от присутствия самого субъекта.
Самое важное, что нужно усвоить относительно метода 1., это то, что он ничему не учит субъекта. Не допустить того, чтобы субъект проявил данное поведение — с помощью изоляции, тюремного заключения, развода, казни на электрическом стуле, — не многому учит субъекта. Казалось бы, что человек, попавший в тюрьму за кражу, дважды подумает, прежде чем снова украсть, но мы знаем, что очень часто этого не происходит; мы можем быть уверены лишь в том, что он не стянет ваш телевизор, пока находится под замком.
Поведение не обязательно бывает рассудочным. Если оно уже сложилось как способ получения подкрепления, и если мотивация и обстоятельства, вызывающие поведение присутствуют, то весьма вероятно, что оно проявится снова.
Пока субъект находится в изоляции, никакого переучивания в отношении данного поведения не происходит; нельзя изменить поведение, которое не осуществляется. Ребенок, запертый в своей комнате, может быть, чему-нибудь и научится (вероятно, обижаться и бояться вас), но при этом он не учится тому, как вступить в вежливый разговор. Отпустите собаку с привязи, и она тут же снова начнет гоняться за машинами.
Тем не менее у метода 1 есть своя роль. Часто он даст наиболее практичное решение вопроса, и не обязательно связан с жестокостью. Мы часто пользуемся своего рода временным лишением свободы, когда у нас нет времени обучать или наблюдать за субъектом; мы, например, сажаем детей в манеж, и в течение некоторого непродолжительного времени большинство детей не протестует против этого. Вице-президент американского клуба собаководства рассказывал мне, что пользуется проволочным вольером на кухне в своей квартире при выращивании дома щенков. Щенков надо научить когда и где оправляться, что достигается тем, что их выносят в подходящее место, прежде чем они сделают это, и вознаграждают за то, что они там оправились. Но невозможно следить за щенками постоянно. Этот кинолог помещает своих щенков в клетку на ночь, когда ему надо уйти или когда он занят; там они могут делать лужи безнаказанно. Они ничему не учатся, но и не делают луж на ковре. Положительное подкрепление может происходить только тогда, когда хозяин присутствует и может дать его, но метод 1 предотвращает неприятности лишением свободы.
Этот же владелец собак сажал на ночь в клетку, находящихся в доме трех взрослых терьеров, чтобы воспрепятствовать им вытворять то, что они никогда не делают днем: скулить под дверью спальни, грызть мебель, перевертывать корзины с мусором. Собаки совсем не обижались на это и весьма охотно отправлялись "в постель". Возможно, собакам тоже надо отдохнуть от нас.
Примеры применения метода 1. "Убить зверя"
Метод 1 в некотором смысле решает проблему, но его применимость в каждой данной ситуации относительна.
Поведение |
Метод воздействия |
Сосед по комнате повсюду разбрасывает грязные вещи |
Сменить соседа |
Собака на дворе лает всю ночь |
Убрать собаку (застрелить, продать и т.п.) |
Дети слишком шумят в машине |
Пусть идут домой пешком. Пусть едут на автобусе. Поручить возить их кому-нибудь другому |
Супруг обычно возвращается домой в плохом настроении |
Развестись |
Неправильный удар при игре в теннис |
Прекратить играть в теннис |
Бастующий или ленивый служащий |
Уволить его |
Отвращение к благодарственным письмам |
Никогда не пишите благодарственных писем. Может быть, тогда люди перестанут посылать вам подарки |
Кошка влезает на кухонный стол |
Выставьте кошку за дверь, или избавьтесь от нее |
Грубый водитель автобуса вывел вас из себя |
Выйдите из автобуса и садитесь на следующий |
Взрослый отпрыск, который по вашему мнению должен жить самостоятельно, хочет снова поселиться вместе с вами |
Скажите "нет" и настаивайте на этом |
Метод 2. Наказание
Это излюбленный метод всех. Если поведение неправильное, мы прежде всего думаем о наказании. Ругаем ребенка, шлепаем собаку, урезываем зарплату, налагаем штраф на компанию, преследуем инакомыслящих, вторгаемся в страну и т.д. Но наказание — довольно грубый способ изменения доведения. Фактически в большинстве случаев наказание не помогает вовсе.
Прежде чем рассмотреть, что можно и чего нельзя достичь наказанием, отметим, что происходит, когда оно применено и не возымело действия. Допустим, мы наказали ребенка, собаку или служащего за какое-либо поведение, а это поведение возникает снова. Разве мы говорим "Хм, наказание не подействовало, не попробовать ли что-нибудь другое?" Нет. Мы усиливаем наказание. Если выговор не помогает, пробуем шлепок. Если ваш ребенок принес дневник с плохими отметками, у него отбирается велосипед. А если в следующий раз дневник снова плохой, у него отбирается и льдянка. Ваши служащие не проявляют должной расторопности. Пригрозите им. Не помогает? Урежьте их зарплату.
По-прежнему никакого результата? Прекратите выплату жалования, оштрафуйте, отдайте под суд! Плетка не изменяет поведения еретика? Можно попробовать испанский сапог или дыбу.
Самое страшное в усилении наказания то, что этому поистине нет предела. Поиски такого наказания, которое было бы действенным, не встречается у обезьян и слонов, но занимает людей во все времена, известные истории, а может быть, даже и с доисторических времен.
Одна из причин, почему наказание обычно не действует, заключается в том, что оно не совпадает по времени с нежелательным поведением; оно возникает после, а иногда, как в случае, судебного законодательства, много позже. Поэтому у субъекта может не образоваться связь между наказанием и своими прежними действиями; у животных этой связи не образуется никогда, людям тоже это обычно не дается. Если бы каждый раз при краже у вора отрывался палец, а неправильно запаркованная машина вспыхивала, я думаю, что воровство и штрафы за паркование практически не существовали бы.
Даже если субъекты понимают, за что их наказали, они не могут в настоящее время уменьшить себе наказание только потому, что не могут изменить своих действий в прошлом. Сейчас вы ничего не можете сделать с плохими оценками в дневнике, которые уже получили, поэтому ребенку, которого родители наказывают, ничего не остается, как получить наказание.
При методе 2, так же как при методе 1, субъект не учится тому, как изменить поведение. Наказание не научит ребенка, как получить более высокие оценки. Большее, на что может рассчитывать наказывающий, это что у ребенка изменится мотивация: ребенок попытается изменить будущее поведение, чтобы избежать будущего наказания.
Научиться изменять будущее поведение, чтобы в будущем избежать его последствий — выше понимания большинства животных. Если охотник ловит свою легавую собаку, предназначенную для охоты на птицу, и лупит за то, что она гонялась за кроликами, то собака не ведает, какое именно из предыдущих действий вызывает наказание. Она станет больше бояться хозяина, что с этих пор может позволить ему отзывать собаку, когда она гоняет кроликов. Сама по себе порка не повлияет на травлю, кроликов.
Между прочим, кошки, по-видимому, особенно тупы по части ассоциирования наказаний со своими преступлениями. Подобно птицам, они просто пугаются и ничему не учатся, когда их запугивают, вот почему считается, что дрессировать кошек трудно. Их действительно нельзя обучать карательными методами, но они сама живость при обучении на положительном подкреплении.
Наказание или угроза его не помогает субъекту в научении изменять текущее поведение. Если нежелательное поведение имеет такую сильную мотивацию, что субъекту необходимо его продолжение (красть пищу, когда голоден, быть членом какой-либо группы в подростковом возрасте), то наказание и его угрозы учат его не попадаться. В режиме наказания неуловимость быстро нарастает — печальная ситуация в семейной установке, но не столь сильно выраженная в обществе в целом. Кроме того, влияние повторяющегося или жестокого наказания имеет некоторые очень неблаговидные стороны: страх, ярость, чувство обиды, даже ненависть в наказываемом, а иногда и в наказывающем тоже. Эти душевные состояния не способствуют обучению (если только у вас нет цели обучить субъекта страху, ярости и ненависти — эмоций, которые иногда специально развиваются у террористов).
Одна из причин, почему мы считаем наказание действенным, это та, что иногда поведение, приведшее к наказанию, прекращается — если субъект понял, какое из действий наказуемо, если мотивация данного действия невелика, если боязнь будущего наказания велика, и наконец, самое главное, если субъект может контролировать поведение (например, наказание не может помочь, когда ребенок мочится в постель). Но ребенка, которой как следует отругали, когда он впервые раскрасил цветным карандашом стену, можно вполне успешно отучить портить дом. Человек, который смошенничал с подоходным налогом и был за это оштрафован, может и не попытаться сделать это снова.
Наказание может успешно прекратить какое-либо поведение при его зарождении, если оно замечено рано и не превратилось в укоренившуюся привычку, и если наказание само по себе является для субъекта новостью, неожиданностью, к которой человек или животное не потеряли чувствительности.
За все время моего воспитания родители наказали меня всего дважды (и то лишь отругав), раз в шесть лет за мелкую кражу и раз в пятнадцать лет, за то что пропустила школу и заставила всех волноваться, думая, что меня похитили. Чрезвычайная редкость наказания в значительной степени способствовала успеху. Оба типа поведения прекратились тут же.
Если наказание оказалось эффективным для прекращения поведения, то такая последовательность событий является мощным подкреплением для наказывающего. В дальнейшем наказывающий стремится вновь прибегнуть к наказанию. Меня всегда поражала возникающая у некоторых людей великая вера в действенность наказания. Я видела, ее проявление и защиту со стороны борющихся за дисциплину — школьных учителей, великолепных спортивных тренеров, властных босов, благонамеренных родителей. Их собственное наказующее поведение может поддерживаться мизерными успехами, тонущими в трясине не столь уж хороших результатов, и может длительно существовать, несмотря на то, что логика свидетельствует об обратном — несмотря на наличие в той же самой школе других учителей, других тренеров, руководителей других предприятий, других генералов, президентов или родителей, пример которых показывает, что можно добиться таких же или лучших результатов совершенно без применения наказания.
Наказание часто используется как своего рода реванш.
Наказывающему может и не быть дела до того, изменится или нет поведение жертвы, он или она лишь берут реванш, и иногда даже не над самим наказуемым, а над обществом в целом. Вспомните о косных чиновниках, которые со скрытым удовольствием с помощью чуть заметных приемов затягивают или препятствуют вам в получении разрешения, ссуды или пропуска в библиотеку; вы оказываетесь наказанными, да и они тоже.
Наказание является подкреплением для наказывающего, так как оно демонстрирует и способствует сохранению доминирующего положения. До того момента, когда парень вы растет настолько, что сможет оказать сопротивление своему грубому отцу, отец считает себя сильнейшим (главным) и является таковым на самом деле. Это в действительности может являться одной из главных побудительных причин, лежащих в основе стремления человека к применению наказания: установить и сохранить доминантное положение наказывающий может быть прежде всего заинтересован не в определенном поведении, но в получении доказательств своего главенствующего положения.
Иерархия доминантности, борьба за нее и ее проверка являются наиболее существенной чертой всех социальных групп, начиная со стаи гусей и кончая правительствами. Но, по-видимому, только люди научились пользоваться наказанием для того, чтобы прежде всего получать вознаграждение в виде главенствующего положения. Поэтому, когда вы собираетесь применить наказание, подумайте, хотите ли вы, чтоб собака, ребенок, супруг, служащий изменили данное поведение? В этом случае — это проблема обучения, и вы должны отдавать себе отчет об ограниченности наказания как обучающего приема. Или вы действительно хотите отыграться? В этом случае вам следует подыскать более полезное самоподкрепление.
А может, на самом деле вы хотите, чтобы собака, ребенок, супруг, служащий, народ соседней страны и т.д. не проявляли неповиновения? В чем бы это ни проявлялось, вы хотите, чтобы субъект перестал идти против вашей воли и суждений? В этом случае это борьба за доминантное положение, и это лежит на вашей совести.
Чувство вины и стыд
Чувство вины и стыд являются формами самонаказания. Трудно найти другое столь же неприятное чувство, как холодная рука чувства вины, сжимающая ваше сердце; этот тип наказания является чисто человеческим изобретением. Некоторые животные, в первую очередь, конечно, собаки, могут проявлять смущение или стыд (например, если случайно напачкают в доме). Но, я думаю, нет таких, которые тратят время на переживание чувства вины за прошлые действия.
Степень вины, которую мы относим к себе, варьирует в широких пределах. Один. человек чувствует релаксацию и удовлетворение, совершив преступление, а другой чувствует вину, держа во рту жевательную резинку. Множество людей не испытывают чувства вины и стыда в своей каждодневной жизни, и не из-за своего совершенства и не из-за своей полной бесчувственности, но потому, что они реагируют на собственное поведение по-разному. Если в прошлом они совершали что-либо, что доставило им неприятности, они не повторят это вновь. Другие повторяют одну и ту же ошибку снова и снова — ведут себя глупейшим образом в обществе, говорят гадости тем, кого любят, — несмотря на то, что на
следующий день всегда испытывают чувство невероятного стыда. В качестве метода изменения поведения стыд стоит в одном ряду с поркой и любым другим видом наказания — он не очень эффективен, так как приходит слишком поздно.
Так что, если вы являетесь человеком, наказывающим себя таким образом (а большинство из нас склонны к этому, вспоминая о том, что делали в раннем детстве), вы должны отдавать себе отчет, что это решение вопроса методом 2, и совсем не обязательно является тем, что вам надо. У вас могут быть веские основания хотеть избавиться от поведения, которое вызывает у вас чувство виновности, но тогда вы сможете достичь больших успехов с помощью другого метода или комбинации методов, а не самонаказанием.
Примеры применения метода 2. Наказание
Он редко оказывается эффективным, и его эффект снижается при повторении, но имеет широкое применение.
Поведение |
Метод воздействия |
Сосед по комнате повсюду разбрасывает грязные вещи |
Кричите и бранитесь. Пригрозите отобрать и выбросить вон его одежду или же сделайте это |
Собака на дворе лает всю ночь |
Выйдите, ударьте ее или облейте водой из шланга, когда она лает (NB: не исключено, что собака будет так рада видеть вас, что забудет о наказании.) |
Дети слишком шумят в машине |
Прикрикните на них. Пригрозите. Повернитесь и дайте затрещину |
Супруг обычно возвращается домой в плохом настроении |
Станьте на путь борьбы. Сожгите обед. Сердитесь, ругайтесь, плачьте |
Неправильный удар при игре в теннис |
Проклинайте все на свете, выходите из себя, корите себя за каждый неверный удар |
Бастующий или ленивый служащий |
Ругайте, распекайте, главным образом перед всеми остальными. Пригрозите снизить зарплату, или же сделайте это |
Отвращение к благодарственным письмам |
Накажите себя оттягиванием дела и одновременно чувством вины. (Это не поможет, но вы можете попробовать.) |
Кошка влезает на кухонный стол |
Отлупите и/или выгоните из кухни |
Грубый водитель автобуса вывел вас из себя |
Запомните его номер, напишите жалобу в автобусную компанию, добивайтесь, чтобы его перевели на другую работу, чтоб он получил выговор или чтобы его уволили |
Взрослый отпрыск, который по вашему мнению должен жить самостоятельно, хочет снова поселиться вместе с вами |
Разрешите этому взрослому ребенку жить у вас, но сделайте его или ее жизнь совершенно невыносимой |
Метод 3. Отрицательное подкрепление
Отрицательным подкреплением является любое неприятное событие или стимул, пусть даже весьма слабый, действие которого можно прекратить или избежать, изменив поведение. Когда на поле с электрическим ограждением корова касается ограды носом, то получает удар электрического тока, но как только она отпрянет назад, действие тока прекращается. Они научается избегать ударов тока с помощью того, что не подходит к ограде. Избегание загородки было подкреплено, но подкрепление было не положительным, а отрицательным.
Жизнь изобилует отрицательными подкреплениями. Мы изменяем положение тела, когда становится неудобно сидеть на стуле. Мы стремимся скорее войти в дом, когда идет дождь. Некоторые люди считают, что запах чеснока возбуждает аппетит, другие же находят его отвратительным. Стимул становится отрицательным подкреплением только в том случае, если он воспринимается субъектом как неприятный и если изменение поведения направлено на уменьшение неприятных ощущений.
Отличие отрицательного подкрепления от наказания заключается в том, что отрицательное подкрепление, подобно положительному, происходит во время поведения, а не после него, и может быть "включено" изменением поведения. Как вы видели в первой главе, почти все традиционные методы дрессировки животных строились на применении отрицательного подкрепления. Лошадь обучается поворачивать налево, когда тянут за левую вожжу, потому что этим она может ослабить давление мундштука на левый угол рта. Слоны, волы, верблюды и другие вьючные животные обучаются двигаться вперед, останавливаться, поднимать тяжести и т.д. чтобы избежать натяжения повода, тычка или удара стека, стрекала или кнута. Отрицательное подкрепление очень подходящий метод формирования поведения и может применяться столь же эффективно, как положительное, поскольку его применение одномоментно с поведением и стимулы "шпыняния" прекращаются дрессировщиком, когда реакция правильна.
По отношению друг к другу люди постоянно применяют отрицательное подкрепление: строгий взгляд, нахмуренные брови, неодобрительное замечание. Некоторые применяют отрицательное подкрепление слишком часто. Жизнь некоторых детей, супругов и даже родителей представляет собой постоянное ежедневное усилие вести себя так, чтобы избежать отрицательных подкреплений от тех, кого они любят. Слишком частое применение отрицательного подкрепления, не скомпенсированное возможностью положительного подкрепления, может привести к появлению нежелательных черт личности, не обязательно страха и ярости, создаваемых наказанием, но робости, неуверенности в себе, тревожности. Если вы не хотите, чтобы ребенок, который очень старается не вызывать ваше неудовольствие не стал эмоционально неполноценным, он должен иметь успешный опыт в доставлении вам удовольствия.
Даже среди взрослых тот руководитель, офицер или тренер, которые хотят усовершенствования от подчиненных и при этом в основном высказывают неудовольствие, могли бы добиться лучших результатов, если бы наряду с этим существовала также возможность положительного подкрепления. Умудренные опытом взрослые могут вытерпеть большое количество отрицательных подкреплений, но даже и они становятся мрачными, если, кроме этого, они ничего не получают. Сочетание положительного и отрицательного подкреплений гораздо более эффективно.
Тренер баскетбольной команды, выступавшей с огромным успехом, стал знаменит своей жесткостью и даже грубостью. Некоторые из игроков не смогли вынести такого режима и ушли из команды. Однажды вечером я видела этого человека по телевизору. Хотя на первый взгляд он казался чрезвычайно грозным, в его взаимодействии с командой то и дело встречались очень отчетливые положительные подкрепления — одобрительный взгляд, дружеский шлепок, — а отрицательное подкрепление прекращалось тотчас же как выполнение действия улучшалось. В моральном отношении команда выглядела великолепно.
Единственный случай, когда отрицательное подкрепление предпочтительнее любого позитивного подхода, это когда мы имеем дело с сознательным и преднамеренным отклонением поведения. Если вы совершенно уверены в том, что субъект знает, что должно быть сделано, а делает вместо этого что-либо другое, чтоб, скажем, просто посмотреть, что из этого выйдет, тогда знак вашего неодобрения — нахмуренный лоб, замечание, натяжение поводка или вожжи, прекращение занятий, выговор — должны последовать незамедлительно и быть четкими. Это единственный случай, когда сильное отрицательное подкрепление, возможно, и не вызовет чувства обиды. Даже животные знают, когда они пытаются вывести вас из себя, и получают удовлетворение от того, что им дают понять, что это нельзя. В особенности это касается детей, которые чувствуют себя увереннее, если знают границы дозволенного. Если ребенок нарочно преступает эти пределы, то отрицательное подкрепление дает ему нужную информацию о положении границ дозволенного.
Секрет применения отрицательного подкрепления состоит в том, чтоб научиться прекращать его, когда поведение субъекта улучшилось хоть немножко. Некоторые матери и учителя делают это интуитивно правильно. Четырехлетний малыш в ярости выкрикивает: "Я тебя ненавижу, я тебя ненавижу" и лупит кулаками по ногам матери. Негативное подкрепление со стороны матери состоит в том, что она перестает обращать на ребенка внимание и начинает заниматься своими делами. Когда ярость сменяется сопением и потерянным видом, мать сейчас же снова обращает свое внимание на ребенка, обнимает, прижимает к себе, меняет тему разговора.
Психолог может сказать, что на самом деле в приведенном выше примере сработал метод 4 — затухание, что поведение сошло на нет, так как не приводило ни к какому результату. Но мне кажется, что когда на маленького ребенка перестают обращать внимание, это для него результат; это сильный отрицательный стимул, который может быть применен наравне с любым другим отрицательным подкреплением.
Другой секрет применения отрицательного подкрепления состоит в уверенности в том, что субъект воспринимает его как следствие собственных действий, а не ваше произвольное действие. Предположим, у вас есть большая лохматая собака, которая любит спать в комнате на диване. Если вы ей убедительно показываете, что вам это не безразлично, собака может быстро научиться соскакивать с дивана, заслышав ваше приближение, потому что боится наказания, но отлупить ее, застав на диване, еще не значит управлять ее поведением в ваше отсутствие. Есть один старый прием, который иногда помогает в этом случае: поставьте на диван несколько маленьких мышеловок. Когда собака вспрыгнет на диван, мышеловки сработают, испугают, а может, и ударят собаку. Собственное действие собаки привело к отрицательному подкреплению, и эта первая неудача может оказаться достаточной, чтобы отучить украдкой забираться на диван. (Я спешу добавить, что это скорее всего подействует только на глупых собак. Хотя я не могу позволить себе предположить любителям собак список пород, на которых этот прием подействует, я скажу лишь, что для некоторых пород он может оказаться совсем не эффективным. Хозяин одного боксера, применивший этот прием, рассказывал, что его собака, увидев мышеловки, стащила покрывало со спинки дивана, накрыла им ммшеловки, разрядила их, а затем легла на диван поверх покрывала.)
Существуют такие категории субъектов, на которых отрицательное подкрепление не действует и совершенно не подходит для них, например младенцы. Каждая мать знает, что практически невозможно изменить активное поведение малыша с помощью отрицательного подкрепления — сделать так, чтобы малыш, начавший ходить, не хватал побрякушки с кофейного столика бабушки, постоянно повторяя: "Нельзя!" или шлепая его по ручонке каждый раз, когда он это делает. Гораздо лучше применить метод 8 (смена мотивации) поместив эти предметы вне досягаемости, или метод 5 переключение на несовместимую деятельность), дав ему какую-нибудь другую игрушку Маленьким детям просто несвойственно легкое приобретение неприятного опыта, но они могут с легкостью обучаться с помощью положительного подкрепления Можно сказать, что дети рождаются для того, чтобы радоваться, а не повиноваться.
Щенки тоже имеют склонность к более легкому научению с помощью положительного подкрепления, а отрицательное подкрепление сбивает их с толку и пугает. Вот почему большинство дрессировщиков не начинает обучение выполнению формальных команд, раньше чем собака достигнет шестимесячного возраста. С помощью лакомства и ласки вы можете обучить щенка ходить в ошейнике и на поводке следовать за вами на прогулке, но наденьте на него затягивающуюся цепочку и начните настаивать на том, чтоб он научился ходить рядом, сидеть, стоять, и прежде чем вы успеете его чему-нибудь научить, у вас будет затерроризированный и запуганный щенок. Нужно время, чтобы научиться реагировать на отрицательное подкрепление, а младенчество слишком быстротечно.
Есть и другая категория субъектов, которые не поддаются воздействию отрицательного подкрепления: это дикие животные. Каждый, кто когда-либо имел дело с питомцем из диких животных — оцелотом, волком, енотом и т.д., — знают что они не воспринимают команды. Чрезвычайно трудно например, научить волка ходить на поводке, даже если вырастите его с очень раннего возраста и он совершенно ручной Если вы натягиваете поводок, он автоматически начинает тянуть вперед, а если вы очень настаиваете и натягиваете поводок слишком сильно, волк, несмотря на то, что он обычно спокоен и контактен, впадает в панику и старается удрать.
Возьмите на поводок ручную выдру, и либо вы будете идти туда, куда хочет выдра, либо она будет бороться с поводком изо всех сил. Создается впечатление, что нельзя найти ту золотую середину, когда легкий рывок можно использовать для выработки послушания.
То же самое относится и к дельфинам. При всей своей хваленой способности к обучению они всему либо сопротивляются, либо всеми силами стараются улизнуть. Толкните дельфина, и он толкнет вас. Попытайтесь перегнать дельфинов из одного бассейна в другой с помощью сети; если они почувствовали, что пространство вокруг них сужается, смелые бросаются в атаку на сеть, а робкие в бессильном страхе кидаются на дно бассейна. Нужно с помощью положительного подкрепления обучать дельфинов спокойно плыть перед сетью; но даже если вы это сделали, почти при любой манипуляции с сетью один человек должен стоять наготове, чтобы в случае надобности броситься в воду и освободить животное, которое запуталось в сети, прежде чем оно утонет.
Психолог Гарри Фрэнк предполагает, что это сопротивление отрицательному подкреплению составляет принципиальное различие между дикими и одомашненными животными. Все одомашненные животные восприимчивы к отрицательному подкреплению — их можно погонять, заставлять, выгонять вон, и вообще оказывать разное давление. Мы, люди, преднамеренно или случайно с помощью направленного отбора выработали у них эту особенность. В конце концов, корова, которую нельзя пасти и гнать, которая, подобно волку или дельфину, либо сопротивляется неприятным воздействиям, либо впадает в панику и спасается бегством, эта корова кончит тем, что останется на ночь вне загона и будет съедена львом; или же поскольку она всем досаждает, то скорее всего она будет зарезана и съедена людьми. Ее гены не сохранятся в генофонде популяции.
Послушание, выражающееся либо в готовности получать удары, либо в отсутствии моментальной реакции "сопротивляйся или убегай", при котором отрицательное подкрепление умеренной силы может быть использовано для корреляции обучения, заложено в наших домашних животных. За одним исключением — кошка. Научить, например, кошку ходить на поводке поистине очень трудно; сходите на представление, в котором участвуют кошки, и вы увидите, что даже профессиональные дрессировщики с этим не связываются — кошек носят на руках, их сажают в клетку, но они не ходят на поводке.
Гарри Фрэнк предполагает, что это потому, что кошка не является истинно домашним животным и поэтому у нее отсутствует восприимчивость к отрицательному подкреплению. Может быть также, что кошка является комменсалом, животным, которое, подобно крысе и таракану, разделяет с нами жилище, извлекая из этого выгоду. Но скорее кошка является симбионтом — животным, общение которого с нами приносит взаимную выгоду — от нас она получает пищу, кров, ласку, кошка же ловит у нас мышей, забавляет нас, мурлычет. Однако работы и послушания нет. Это может объяснить нелюбовь некоторых людей к кошкам: их страшит неуправляемость.
Для всех кошконенавистников скажу, существует одно отрицательное подкрепление, которое на кошку действует: брызнуть водой ей в мордочку. Однажды на обеде, на который я надела свое новое черное шерстяное платье, белая ангорская кошка хозяйки дома без конца вспрыгивала мне на колени. Хозяйка находила это очень милым, но мне совсем не хотелось, чтобы мое платье было в белых кошачьих волосах. Когда она на меня не глядела, я окунула пальцы в бокал с вином и брызнула кошке в мордочку. Она тотчас же исчезла и больше не возвращалась: тонкое и полезное отрицательное подкрепление.
Примеры метода 3. Отрицательное подкрепление
Отрицательное подкрепление может быть эффективным в ряде ситуаций. Способ, описанный здесь для ситуации с машиной, действует очень хорошо, особенно если дети очень устали и их нельзя переключить на какую-либо другую деятельность типа игр или пение песен (метод 5).
Поведение |
Метод воздействия |
Сосед по комнате повсюду разбрасывает грязные вещи |
Выключите IV или задержите обед до тех пор, пока вещи не будут собраны. (Прекратите отрицательное подкрепление, когда согласие достигнуто; подкрепляйте на первых порах даже вялые усилия.) |
Собака на дворе лает всю ночь |
Направить на собачью будку сильный пучок света. Выключите свет как только собака перестанет лаять |
Дети слишком шумят в машине |
Когда уровень шума достиг болевого порога, тормозите и останавливайте машину, читайте книгу. Не обращайте внимания на протесты по поводу остановки, это тоже шум. Трогайтесь, когда восстановится тишина |
Супруг обычно возвращается домой в плохом настроении |
Повернитесь и выйдите из комнаты как только тон его или ее голоса будет вам неприятен. Возвратитесь и проявите внимание тотчас же как только голос смолк или стал нормальным |
Неправильный удар при игре в теннис |
Пусть тренер или кто-нибудь из зрителей фиксирует каждый плохой удар словами "ай-ай-ай" или "нет" каждый раз как вы его сделали |
Бастующий или ленивый служащий |
Усильте контроль и делайте выговор всякий раз как уровень работы снижается |
Отвращение к благодарственным письмам |
Отрицательное подкрепление возникает автоматически со стороны друзей и тех, кого вы любите. Тетя Алиса сообщит вам, что она очень обеспокоена тем, что вы не получили новый шарф, а ваша семья дает вам понять, что вы должны написать тете Алисе. Вся информация будет вам передана в тонах, имеющих отчетливую отрицательную окрашенность |
Кошка влезает на кухонный стол |
Воспользуйтесь пистолетом, стреляющим водой, или просто примите угрожающую позу, сочетая это со зловещим "нельзя". Это слово является условным отрицательным подкреплением. Кошка не будет влезать на стол, правда только в вашем присутствии |
Грубый водитель автобуса вывел вас из себя |
Протестуйте. Играйте на любом обстоятельстве, которое позволяет вам требовать учтивости, таких, как пожилой возраст, юность, неопытность |
Взрослый отпрыск, который по вашему мнению должен жить самостоятельно, хочет снова поселиться вместе с вами |
Взрослый отпрыск, который по вашему мнению должен жить самостоятельно, хочет снова поселиться вместе с вами Пусть он возвращается, но берите с него как с постороннего плату за жилье, питание, дополнительные услуги, в том числе за стирку белья и сидение с ребенком, чтоб он уехал по финансовым соображениям |
Метод 4. Угашение
Если вы обучили крысу нажимать на рычаг для получения пищевого подкрепления, а затем отключили аппарат подачи пищи, крыса сначала очень часто нажимает на рычаг, затем все реже и реже, пока, наконец, не прекратит это совсем, Поведение "угасло".
Термин "угашение" идет из психологических лабораторий. Он предполагает исчезновение не животного, а поведения, которое пропадает само собой вследствие отсутствия подкрепления, подобно сгорающей свечке.
Поведение, которое не приводит ни к каким результатам — ни к хорошим, ни к плохим, а именно ни к каким, — скорее всего затухнет. Но не всегда это означает, что вы можете игнорировать поведение и оно исчезнет. Поведение пренебрегающего его результатами человеческого существа есть уже само по себе результат существа, совершающего столь асоциальное действие, поэтому не всегда можно рассчитывать на угашение поведения другого человека и даже животного, не обращая на него внимание. К тому же крыса, нажимающая на рычаг, делает это в лабораторных условиях; внешние стимулы здесь сведены до минимума. А поведение человеческих существ не осуществляется в вакууме.
И тем не менее игнорирование может дать результат. Однажды я наблюдала, как Томас Шиллере, дирижер симфонического оркестра, проводил репетицию в Нью-йоркской филармонии. Ужасный дирижер — но и оркестр тоже ужасный. Когда Шипперс подошел к пюпитру, оркестр был настроен на несерьезный лад: деревянные духовые инструменты стонали: "Я хотел бы быть в Дикси", а скрипка человеческим голосом говорила: "Ox-ox". Шипперс проигнорировал эти дурачества, и они вскоре угасли.
В человеческих взаимоотношениях угасание, с моей точки зрения, больше всего применимо к речевому поведению — хныканью, ворчанию, надоеданию с просьбами, угрозам. Если эти типы поведения не приведет ни к какому результату, не выводят вас из себя, они угасают. Помните, что вывести кого-либо из себя может служить положительным подкреплением. Брат, который повергает сестру в ярость, дергая за косичку, получает подкрепление. Если вы на работе вспылили на кого-нибудь, кто занимает более высокое служебное положение, то он или она в выигрыше. Даже животным это известно. Сразу вспоминаются таксы и скотчи — породы собак, у которых взятие реванша является хорошо развитым и осмысленным типом поведения — делать назло. Вы пробовали уехать на выходной, не взяв с собой собаку? Когда вы вернетесь, то несмотря на то, что в ваше отсутствие с ней хорошо гуляли, она нагадит вам на постель.
Вы можете избить ее до полусмерти, но такое проявление ярости будет ей только наградой.
Mы часто ненароком подкрепляем поведение, которое нам хотелось бы угасить. Хныканье у детей является поведением, которое вырабатывается с помощью родителей. Каждый ребенок, который устал, голоден, находится в дискомфорте, может скулить как щенок. Однако словом "нытик" называется ребенок, чьи родители достигли такой высокой степени самоконтроля, что могут вынести чрезвычайно длительное нытье, прежде чем окончательно потеряют терпение и скажут: "Хорошо, я дам тебе это проклятое мороженое; ну, теперь замолчишь?" Мы забываем или не понимаем, что случайное подкрепление — любое подкрепление, хорошее или плохое, — способствует сохранению поведения.
Однажды в Блумингдэле[Супермаркет — прим. Перев.] я видела хорошенькую девчушку лет шести, которая привела свою мать, бабушку и весь отдел белья в полный ступор виртуозным применением "но ты сказала, ты обещала, я не хочу..." и т.д. Насколько я понимаю, ребенок устал от магазина, и, возможно, не без основания. А может, у нее вообще было неважное самочувствие. Ей хотелось уйти, а она усвоила, что добиться желаемого можно нытьем, которое всегда случайным образом подкреплялось.
Что делать, если вам на день навязали чьего-нибудь ребенка-нытика? Вот что делаю в этих случаях я. Как только протесты или жалобы начинают произноситься тем характерным для нытья гнусавым тоном, я сообщаю ребенку, что нытье на меня не действует. (Это обычно даст ему или ей пищу для размышлений, поскольку они не думают об этом, как о нытье, а считают это логичным и великолепным средством убеждения.) Как только нытье прекратилось, я спешу с подкреплением в виде похвалы или объятия. Если ребенок забыл и снова начинает ныть, мне обычно удастся прекратить это поднятием бровей или уничтожающим взглядом.
На самом деле нытики часто бывают умненькими детьми, и с ними бывает приятно и интересно, когда они отказываются oт этой своей игры и нытье угашается.
Когда имеешь дело с поведением, имеющим словесное выражение, то одной из проблем является наш необычайный пиетет к языку. Слова обладают почти магическими свойствами. В тех ситуациях, когда нас запугивают, надоедают просьбами или нытьем, и особенно во время семейных ссор, мы склонны обращать внимание на сказанные слова, а не на поведение. На фразу: "Но ты же обещал" следует ответ: "Нет, я не обещал" или: "Я знаю, но я должен завтра ехать в Чикаго, поэтому не могу сделать то, что сказал, как ты этого не понимаешь?" и т.д., и т.п.
Мы должны отделять слова, которые говорятся, от поведения. Например, когда муж и жена ссорятся, действием является борьба. Предмет же ссоры часто является скрытым спектаклем. Вы можете оспаривать все на свете, можете произносить совершенно справедливые слова (врачам приходится выслушивать бесконечное количество вариаций на эту тему), но при этом все время в стороне остается само поведение — борьба.
Мало того, что мы с легкостью втягиваемся в словесное выражение конфликта ("Он сказал, что я — трус, а я не трус"), мы часто не замечаем того, что сами подкрепляем его. И не только тем, что позволяем привести себя в ярость. Возьмем, к примеру, мужа, который всегда приходит домой в плохом настроении и который хочет сейчас же получить свой мартини (или пиво) и следом сразу же ужин. Чем более он раздражен, тем больше торопится жена подать требуемое, ведь правда? Что на самом деле она подкрепляет?
Раздражительность.
Если манера поведения жены веселая, она не проявляет поспешности в удовлетворении требований мужа, не заламывает себе руки и не расстраивается, то это в значительной степени делает раздражительность и прочие проявления настроения и характера — безрезультатными. С другой стороны, ледяное молчание, ответные крики или наказание, наоборот, могут им восприниматься как результаты и, следовательно, могут оказывать подкрепляющее действие.
Игнорируя поведение, не игнорируя при этом человека, можно сделать так, что многие неприятные проявления угаснут сами собой, потому что не будет никакого результата: ни хорошего, ни плохого. Поведение станет бесполезным. Враждебность требует невероятной энергии, и если от нее нет пользы, то от нее обычно быстро избавляются.
Многие типы поведения сами по себе совершаются в ограниченных временных рамках. Когда детей, собак или лошадей впервые после длительного периода ограничения свободы и бездействия выпускают на улицу, им страшно хочется бегать и играть. Если вы попытаетесь это ограничить, вам понадобится немало усилий. Чаще гораздо проще бывает просто разрешить им какое-то время побегать, пока это поведение не затухнет само по себе, прежде чем вы их призовете к дисциплине или начнете вырабатывать ее. Тренеры лошадей называют это "пусть дурь выйдет". Умные тренеры отпускают на несколько минут молодых лошадей на ринге полягаться, побрыкаться, побегать, прежде чем они огорчат их и заставят работать. Разминка перед тренировкой или футбольной игрой служит примерно тем же целям. Помимо того, чтобы заставить мышцы работать, что уменьшает вероятность растягиваний и травм, это "общая двигательная активность" оттягивает излишки энергии, при этом беготня и возня угасятся и наездники или игроки смогут уделить большей внимание самой тренировке.
Привыкание является способом угашения безусловных реакций. Если на субъекта оказывает влияние неприятный стимул, которого нельзя избежать и с которым ничего нельзя поделать, то реакция избегания на него скорее всего угаснет, он перестанет реагировать на этот стимул, не станет обращать на него внимание, как будто бы его совсем не существует. Это называется привыканием. Первое время я считала, что уличный шум в моей нью-йоркской квартире просто непереносим, но постепенно, подобно большинству ньюйоркцев, я научилась спать под сирены, пронзительные крики, уборку мусора и даже звуки столкновения машин.
Я привыкла. Полицейских лошадей иногда тренируют, привязав в лежачем положении и подвергая множеству безвредных, но беспокоящих влияний, таких, как открывание зонтиков, хлопанье газетами, громыхание консервными банками и т.д. Так как лошади не могут пошевелиться, они настолько привыкают к пугающим зрительным и звуковым раздражителям, что в дальнейшем что бы им ни преподнесла улица они остаются невозмутимыми.
Примеры метода 4. Угашение
Метод 4 бесполезен для искоренения хорошо отработанного, самоподкрепляемого поведения. Тем не менее он хорош для борьбы с нытьем, дурным настроением, поддразниванием. Даже маленькие дети могут усвоить — и это открытие доставляет им удо-
вольствие — что они могут прекратить поддразнивания со стороны более старших детей, просто никак не реагируя на них.
Поведение |
Метод воздействия |
Сосед по комнате повсюду разбрасывает грязные вещи |
Подождите, пока он повзрослеет |
Собака во дворе лает всю ночь |
Этот тип поведения самоподкрепляется и редко угасает сам по себе |
Дети слишком расшумелись в машине
|
Определенный уровень шума естествен и безвреден; пусть он будет, они от этого устанут |
Супруг обычно возвращается домой в плохом настроении |
Следите, чтобы его грубости не давали никаких результатов: ни хороших, ни плохих |
Неверный удар при игре в теннис
|
Работайте над другими ударами, движениями ног и т.д., старайтесь сделать так, чтобы специфическая ошибка сошла на нет из-за того, что на ней перестают концентрировать внимание |
Бастующий или ленивый служащий
|
Если неправильная форма поведения является способом привлечения внимания перестаньте обращать внимание. Забастовка, однако, может быть самоподкрепляемой |
Отвращение к благодарственным письмам
|
Этот тип поведения обычно угасает с возрастом. Жизнь становится так полна обременительными обязанностями, такими, как оплата чеков, налогов, что по сравнению с этим открытки с благодарностями начинают рассматриваться как отдых |
Кошка влезает на кухонный стол
|
Пренебрегите этим поведением. Оно не исчезнет, но вы можете преуспеть в угащении собственного неприятия кошачьей шерсти в еде |
Грубый водитель автобуса вывел вас из себя |
Не обращайте внимания на водителя, оплатите проезд и забудьте инцидент |
Взрослый отпрыск, который по вашему мнению должен жить самостоятельно, хочет снова поселиться вместе с вами |
Рассматривайте это как временную меру и уповайте на то, что взрослый ребенок уедет от вас как только его финансовое положение улучшится или кризис минует |
Метод 5. Выработка несовместимого
поведения
Здесь вступают добрые феи: позитивные методы, позволяющие избавиться от нежелательного поведения.
Одним из изящных методов является обучение субъекта выполнению другого действия, физически несовместимого с нежелательным.
Например, некоторые не любят, когда собаки побираются у стола. Я сама этого терпеть не могу — ничто не может так испортить мне аппетит как собачье пыхтение, несчастные глаза и тяжелая лапа у меня на колене в тот момент, когда я собираюсь положить в рот кусок мяса.
Решением этого вопроса методом 1 будет выставить собаку из столовой или запереть в другой комнате на время еды. Но существует также возможность управлять попрошайничеством выработкой несовместимого поведения — например обучить собаку лежать на пороге столовой пока люди едят. Первым делом вы обучаете собаку ложиться, постепенно добиваясь того, чтобы это поведение контролировалось стимулами. Затем вы можете сделать так, чтобы собака во время вашей еды выполняла команду "Иди, ляг!", укладываясь в любом месте. Вы подкрепляете это поведение пищей, когда тарелки пусты. Отойти и лечь несовместимо с попрошайничеством у стола; собака физически не может быть одновременно в двух местах, и поэтому попрошайничество угасает.
Однажды я видела дирижера симфонического оркестра, который продемонстрировал блестящее использование несовместимого поведения во время репетиции оперы. Внезапно хор вступил в диссонанс с оркестром. Казалось, что они запомнили один из тактов в несколько укороченном виде. Поняв в чем дело, дирижер выискал звук "з" в тексте этого такта и попросил хор усилить этот звук. Получилось забавное жужжание, но удлинение этого звука было несовместимым с ускоренным исполнением данного такта, и проблема была решена.
Я впервые воспользовалась Методом 5, когда столкнулась с потенциально очень серьезной проблемой у дельфинов. В океанариуме "Жизнь моря" в представлении, идущем в открытом бассейне, одновременно участвовали три типа исполнителей: группа из шести маленьких изящных вертящихся дельфинов, громадная самка афалина по имени Ало и хорошенькая девушка с Гавай, которая плавала и играла с дельфинами в одной из частей представления. Вопреки общепринятому мнению, дельфины не всегда дружелюбны, а афалина особенно склонна к тому, чтоб похулиганить и по-
дразнить. Ало, двухсотсемидесятикилограммовая афалина, начала изводить пловчиху, когда та спускалась в воду, она бросалась под нее и подкидывала в воздух или же хлопала ее по голове хвостовым плавником. Это терроризировало девушку, и в самом деле было очень опасно.
Нам не хотелось выводить Ало из представления, так как прыжки и удары по воде делали ее звездой. Мы начали конструировать небольшой загон, в котором ее можно было бы запирать, пока выступает пловчиха — решение вопроса по методу 1, — а тем временем начали вырабатывать несовместимое поведение. Мы сделали так, чтоб Ало нажимала на подводный рычаг, расположенный в другом конце бассейна, и получала в награду за это рыбу.
Ало с энтузиазмом выучилась по нескольку раз за каждую рыбку нажимать на рычаг; она даже принялась охранять рычаг от других дельфинов. И во время представлений тренер Ало опускал рычаг в воду и подкреплял его нажимание все время пока пловчиха была в воде и играла с вертунами.
Ало не могла нажимать свой рычаг и одновременно находиться посреди бассейна и атаковать пловчиху; эти два поведения были несовместимы. К счастью, Ало предпочитала нажимать на рычаг, чем издеваться над пловчихой, так что это поведение угасло (пловчиха, однако, никогда полностью не доверяла этому фокусу и была полностью спокойна только тогда, когда Ало была за надежной решеткой).
Выработка несовместимого поведения является хорошим способом преодоления неправильных ударов в теннисе, а также любых других двигательных навыков, выработавшихся неверным образом. Мышцы "обучаются" медленно, но прочно; если что-либо вошло в ваш двигательный стереотип, это трудно переделать. (Уроки фортепьяно в детстве приносили мне одно расстройство, потому что было такое впечатление, что в каждой фразе мои пальцы заучивали по неверной ноте, и я каждый раз спотыкалась на этом месте.) Единственный способ преодолеть это — выработать несовместимое поведение. Если взять в качестве примера неверный удар в теннисе — то прежде всего надо разложить в уме движение на составные части — поза, положение, движение ног, начало движения, его продолжение, окончание — и очень медленно воспроизвести каждый элемент движения или повторить какой-либо один элемент. Поработайте над совершенно другим ударом, серией новых движений. Когда мышцы начнут осваивать новую комбинацию, можно соединить движение и убыстрить темп.
Когда вы начнете использовать движение в игре, на полной скорости, то первое время вы не должны обращать внимание на то, куда летит посланный вами мяч; отрабатывайте только структуру движения. Теперь в вашем распоряжении должно быть два удара — старый, неправильный, и новый.
Они несовместимы, вы не можете выполнить два удара одновременно. Но хотя вам никогда не удастся полностью освободиться от старого стереотипа, вы можете свести его к минимуму, заменяя новым. Когда этот двигательный навык станет прочным, вы снова можете сосредоточить свое внимание на том, куда летит мяч. И надо ожидать, что при более техничном ударе мяч тоже будет вести себя лучше. (Точно так же я подходила к решению проблем, возникающих при обучении игре на фортепьяно.)
Выработка несовместимого поведения очень полезна для исправления собственного поведения, особенно, когда дело касается эмоциональных состоянии, таких, как печаль, беспокойство, чувство одиночества. Некоторые типы поведения совершенно несовместимы с чувством жалости к себе: танцы, хоровое пение, любая интенсивная двигательная активность, даже бег. Вы не можете быть заняты ими и в то же время барахтаться в несчастье. У вас ужасное настроение? Испробуйте метод 5.
Пример метода 5. Выработка несовместимого поведения
Понимающие люди часто используют этот метод. Пение и игра в машине избавляют как родителей, так и детей от скуки. Развлечения, отвлечения, занятия приятными вещами являются хорошей альтернативой при многих напряженных жизненных ситуациях.
Поведение |
Метод воздействия |
Сосед по комнате повсюду разбрасывает грязные вещи
|
Купить корзину дня белья и поощрять соседа, когда он кладет белье в корзину. Стирайте белье вместе, сделайте так, что наполнение ящика станет поводом к общению. Забота о чистоте белья несовместима с пренебрежением к нему |
Собака во дворе лает всю ночь
|
Обучите ее ложиться по команде; собаки, подобно большинству из нас, редко лают лежа. Кричите команду через окно или установите в собачьей будке переговорное устройство. Вознаграждайте похвалой |
Дети слишком расшумелись в машине
|
Пойте песни, рассказывайте разные истории, играйте в игры: "Привидение", "Я слежу за всем своим глазочком", "20 вопросов", "Найди земляной орешек" и т.д. Даже трехлетний малыш может распевать "Найди земляной орешеек". Это несовместимо с перебранкой и криками. |
Муж обычно приходит домой в плохом настроении
|
Приурочьте к моменту его возвращения домой какую-нибудь приятную деятельность, несовместимую с брюзжанием, например игру с детьми, занятие любимым делом. Неплохо полчасика провести в уединении. Мужу необходимо переключение на домашнюю жизнь |
Неправильный удар при игре в теннис |
Отработайте заменяющий его совершенно новый удар (см. текст) |
Бастующий или ленивый служащий
|
Поручите ему или ей работать быстрее или упорнее над каким-либо определенным заданием; наблюдайте и похвалите, когда работа завершена |
Нелюбовь к написанию благодарственных писем
|
Выработайте несколько заместительных видов поведения: если кто-либо посылает вам чек, напишите несколько благодарственных слов на его обороте, когда получите по нему деньги, об остальном позаботится банк. В отношении других видов подарков, позвоните отправителю в тот же день и скажите спасибо. Тогда вам никогда не придется писать писем |
Кошка влезает на кухонный стол
|
Обучите кошку сидеть в кухне на стуле, используя ласку и пищевое подкрепление. Очень старательная или голодная кошка может так привязаться к стулу, что его можно далеко отставить от плиты, и кошка будет там, где вам это нужно, а не на столе |
Грубый водитель автобуса вывел вас из себя
|
Ответьте на ворчание и ругань, приветливым взглядом, милой улыбкой и какой-либо расхожей вежливой фразой: "Доброе утро" или, если водитель действительно бранит вас: "Спасибо, все в порядке". Такой сбивающий с толку, несоответствующий ситуации ответ иногда восстанавливает вежливый тон |
Взрослый отпрыск, который с вашей точки зрения может жить самостоятельно, хочет обратно вернуться к вам |
Помогите ему или ей найти другое местожительство, даже если вам на первых порах придется платить за него |
Метод 6. Связать поведение с определенным
сигналом
Это своего рода уловка. Он оказывает действие в ряде случаев, когда больше ничего не помогает.
Аксиомой теории обучения является то, что организм обучается совершать действие в ответ на определенный ключевой стимул, и поведение начинает подчиняться стимулу только тогда, когда он есть — в его отсутствие поведение начинает угашаться. Эту естественную закономерность можно использовать для того, чтобы избавиться от любого типа нежелательного поведения, сделав так, чтобы оно осуществлялось только по сигналу, а затем перестав давать этот сигнал. Впервые я открыла для себя этот изящный метод, когда приучала дельфина носить светонепроницаемые наглазники. Мы хотели продемонстрировать действие сонара, т.е. эхолокацию у дельфина в наших представлениях для широкой публики в океанариуме "Жизнь моря". Мне нужно было обучить самца по кличке Макуа носить на глазах резиновые чашечки присосок и, временно лишившись зрения, обнаруживать и находить расположенные под водой предметы, используя эхолокационную систему. Сейчас такой номер постоянно включается во все представления океанариума.
Наглазники не причиняли вреда Макуа, но он их невзлюбил. Постепенно у него выработалась привычка, завидев в моих руках чашечки присосок, удирал" на дно бассейна и отсиживаться там. Он отлеживался там по пять минут кряду, слегка пошевеливая хвостом и наблюдая за мной сквозь воду.
Я рассудила, что бессмысленно пытаться заставить подниматься его на поверхность, пугая, толкая шестом, глупо также пробовать подкупить или подманить его. Поэтому однажды, когда он в очередной раз удирал от меня на дно, я подкупила его свистком и бросила несколько рыбешек. Макуа выпустил "пузырь удивления" — пузырь воздуха размером с баскетбольный мяч, — который у дельфинов обозначает "А?", и подошел, чтобы съесть свою рыбу. Вскоре он заныривал с целью получения пищевого подкрепления.
Затем я ввела подводный источник звука, являвшейся условным сигналом, и давала подкрепление, только когда дельфин заныривал по сигналу. Конечно же он перестал заныривать в отсутствие ключевого стимула. Заныривание перестало быть проблемой; тогда я снова вернулась к обучению плавать в наглазниках, он воспринял наглазники безропотно.
Я применяла этот метод также, чтобы утихомирить детей, расшумевшихся в машине. Если вы отправляетесь в какое-либо удивительное место — скажем цирк, — дети могут шуметь, потому что они возбуждены, слишком возбуждены для того, чтобы к ним можно было применить метод 5, орать и петь песни. В этих радостных обстоятельствах вам не хочется применять и метод 3, отрицательное подкрепление, состоящее в том, чтобы свернуть на обочину и остановить машину. Вот когда пригодится метод 6: сделать так, чтоб поведение управлялось сигналом. "Так, каждый устраивает как можно больший шум, начали!" (Сами тоже поднимаете шум.)
С полминуты это всех очень забавляет, затем это надоедает.
Двух или трех повторений обычно бывает более чем достаточно, чтобы обеспечить необходимое спокойствие на всю оставшуюся дорогу. Можно сказать, что устраивать шум по команде доставляет удовольствие, а можно сказать, что поведение осуществляющееся по сигналу, имеет склонность к угасанию в его отсутствие.
Дебора Скиннер, дочь психолога Б.Ф.Скиннера, поделилась со мной блестящим применением метода 6 с целью отучать собак скулить под дверью. У нее была маленькая собачка, которая, когда ее выпускали гулять, начинала лаять и скулить под дверью, вместо того, чтобы идти и делать свои дела. Дебора сделала небольшой картонный даск, одна сторона которого была покрашена в белый, другая — в черный цвет, и повесила его на дверную ручку снаружи. Когда круг был повернут черной стороной, никакой лай не мог заставить людей, находившихся в доме, открыть дверь. Когда круг был повернут белой стороной, собаку сразу же впускали. Собака быстро обучилась не утруждать себя понапрасну, пытаясь войти обратно в дом при черном сигнале. Когда Дебора находила, что собачка пробыла на улице положенное время, она приоткрывала дверь, переворачивала сигнальный круг, а затем впускала собачку как только она попросится.
Я испробовала Деборин сигнал дверной ручки, когда моя дочь приобрела щенка карликового пуделя. Питер был очень маленькой собачкой, в два месяца он едва достигал шести дюймов (15 см) в высоту, и было действительно небезопасно отпускать его бегать на улице одного без присмотра. Когда я бывала занята, а Гэйл в школе, я запирала его в ее комнате, снабдив едой, питьем, газетами и одеялом.
Конечно, как только он оставался один взаперти, он поднимал ужасный скандал. Я решила воспользоваться Дебориной уловкой и ввести сигналы, по которым на лай следовал и не следовал ответ. Я подхватила первую попавшуюся под руки вещь — маленькое полотенчико — и повесила на внутреннюю ручку двери. Когда полотенце висело на ручке, никакие вопли не приводили к желаемому результату. Когда полотенце снималось, щенячье требование компании — свободы удовлетворялось.
Щенок тут же понял это и перестал волноваться, когда полотенце было на дверной ручке. Единственно, о чем я должна была помнить, чтобы сохранить данное поведение, так это не выпускать щенка, когда позволяли обстоятельства, без того, чтобы сначала приоткрыть дверь, снять полотенце, закрыть ее и подождать, когда щенок начнет лаять, и только тогда выпускать его, тем самым устанавливая контроль над лаем с помощью сигнала (в данном случае отсутствие полотенца являлось сигналом к тому, что лай будет положительно подкреплен), и таким образом, всякий другой лай угашался.
Это превосходно действовало в течение трех дней. А затем утром внезапно снова послышались шумные требования Питера. Я открыла дверь и обнаружила, что он нашел способ преодолеть это препятствие своими собственными крошечными силами, он сдернул полотенце с дверной ручки. А если полотенце на полу, он почувствовал себя в полном праве требовать свободу.
Примеры метода 6.
Связать поведение с определенным сигналом
Рассуждая логически, этот метод не должен был бы работать, но он может оказаться поразительно эффективным, и иногда его действие почти мгновенно.
Поведение |
Метод воздействия |
Сосед по комнате повсюду разбрасывает грязные вещи |
Устройте соревнование по беспорядку. Посмотрите, какой кавардак вы вдвоем можете устроить за десять минут. (Эффективное средство, иногда неряшливый человек, увидев, как выглядит большой беспорядок, будет в дальнейшем распознавать и убирать более мелкие беспорядки — рубашку, пару носок — они могут по-прежнему действовать вам на нервы, но раньше ваш сосед их просто не замечал |
Собака во дворе лает всю ночь |
Обучайте собаку лаять по команде "Голос!" и давайте за это пищевое подкрепление. В отсутствие команды никакого лая не будет |
Дети слишком расшумелись в машине |
Сделайте так, чтобы шум поднимался по команде (см. текст) |
Супруг обычно возвращается домой в плохом настроении
|
Выберите время и дайте повод для брюзжания; скажем, в 17 часов сядьте и посидите десять минут. В течение этого времени поощряйте любые проявления недовольства проявлением внимания и заинтересованности. Игнорируйте все проявления недовольства до и после этого времени |
Неверный удар при игре в теннис
|
Если вы будете давать себе команду сделать неверный удар и научитесь совершать его с заранее поставленной целью, то может быть неверный удар исчезнет, когда вы не будете давать себе соответствующей команды. Не исключено |
Бастующий или ленивый служащий
|
Учредите время, когда можно валять дурака. Это очень забавный и эффективный прием, который использовал руководитель одного рекламного агентства, в котором мне довелось когда-то работать |
Нелюбовь к написанию благодарственных писем
|
Купите блокнот-памятку, бумагу, марки, ручку, адресную книгу и красную коробочку. Положите все эти приспособления в коробочку. Когда получите подарок, запишите имя дарителя в блокнот-памятку, положите его на коробку и поставьте ее себе на подушку кровати или на обеденный стол, и не ложитесь спать или не садитесь есть, до тех пор, пока стоит коробка, сигнализирующая вам о том, что надо написать письмо, заклеить конверт, приклеить марку и отправить его |
Кошка влезает на кухонный стол
|
Обучите кошку по сигналу вспрыгивать на стол, а также по сигналу спрыгивать с него (это производит впечатление на гостей). Затем вы можете выработать длительность времени, в течение которого она ожидает сигнала (естественно, это время должно длиться весь день) |
Грубый водитель автобуса вывел вас из себя |
Связывать это поведение с каким-либо сигналом не рекомендуется |
Взрослый отпрыск, который с вашей точки зрения должен жить самостоятельно, хочет снова вернуться к вам'
|
Когда выросшие дети навсегда оставят дом, приглашайте их в гости, дайте понять, что они могут приходить только по вашему приглашению. Затем отмените приглашения |
Метод 7. Выработка отсутствия
определенного поведения
Этот прием очень полезен в тех случаях, когда вам не надо получить от субъекта какую-то определенную деятельность, и вы просто хотите, чтоб он прекратил имеющийся тип поведения. Например, наполненные брюзжанием и упреками телефонные звонки родственников, которых вы любите и не хотите причинить вред, применив метод 1, положив телефонную трубку, или методы 2 или 3, браня или высмеивая. '
Зоопсихолог Гарри Фрэнк, который приручал волчат, беря их в дом на дневное время, решил подкреплять лаской и вниманием любую деятельность, кроме разрушительной. Оказалось, что единственным времяпрепровождением в человеческом жилище, при котором не грызлись кушетки, телефонные провода, ковры и прочее, было лежание на кровати; и должным порядком мирно текли вечера, когда Гарри, его жена и трое значительно подросших молодых волков возлежали на семейной кровати и смотрели десятичасовую передачу новостей. Это метод 7.
Я пользовалась методом 7, чтобы изменить способ своей матери общаться по телефону. Будучи тяжело больной в течение ряда лет, моя мать находилась в частной лечебнице. Я навещала ее, когда могла, но основное наше общение происходило по телефону. Многие годы эти телефонные звонки доставляли мне неприятности. Разговоры большей частью, а иногда и исключительно, касались ее проблем — болезни, одиночества, отсутствия денег. Действительные страдания, которые я была не в силах облегчить. Ее жалобы переходили в слезы, слезы — в обвинения, обвинения злили меня. Общения были столь тягостны, что я старалась избегать телефонных звонков.
Затем мне пришло в голову, что можно найти гораздо лучший способ. Я начала следить за своим собственным поведением во время этих телефонных звонков. Я применила метод 4 и метод 7. Я сознательно стала стремиться к тому, чтобы ее жалобы и слезы подвергались угашению — метод 4, — отвечая на них только: "А", "Хм", "Да, да". Чтобы не достигалось никакого результата — ни положительного, ни отрицательного. Я не вешала трубку, не взрывалась; делала так, чтобы ничего не происходило. Затем я подкрепляла все, что не было жалобой: вопросы о детях, новости в лечебнице, разговоры о погоде, книгах, друзьях. На эти разговоры я откликалась с энтузиазмом. Метод 7.
К моему изумлению, после двенадцати лет конфликтов, за два месяца соотношение слез и недомоганий в наших еженедельных телефонных разговорах поменялось местами с приятной болтовней и смехом. Тревоги матери, с которых начинались телефонные разговоры — "Послала ли ты чек? Разговаривала ли с доктором?. Не позвонишь ли ты моему агенту по социальному страхованию?" — превратились из навязчивых жалоб в обыкновенные просьбы. Отныне остальное время разговора было заполнено болтовней, воспоминаниями, шутками.
В юности моя мать была и теперь опять превратилась в очаровательную, остроумную женщину. В течение всей последующей жизни я очень любила беседовать с нею лично и по телефону.
"Не является ли это уж слишком большим проявлением умелого управления?" — спросил меня однажды мой друг психиатр. Безусловно. То, что происходило со мной прежде, тоже являлось чрезвычайно умелым управлением. Может быть, некоторые врачи сумели бы меня уговорить обращаться со своей матерью по-другому, или ее со мной, а может, и нет. По-видимому, гораздо проще было четко сформулировать цель метода 7. Что в действительности подкрепляется?
Все, кроме того, что вам нежелательно.
Примеры метода 7.
Выработка отсутствия нежелательного поведения
Этот метод требует некоторых умственных усилий в течение определенного периода времени, но зачастую является лучшим способом изменить прочно укоренившееся поведение.
Поведение |
Метод воздействия |
|
Сосед по комнате повсюду разбрасывает грязные вещи |
Купите пива или пригласите гостей другого пола как только в комнате все убрано или сосед устроил стирку |
|
Собака во дворе лает всю ночь |
Выйдите на улицу несколько раз за ночь и дайте ей подкрепление, когда она молчит десять, двадцать минут, час и т.д. |
|
Дети слишком расшумелись в машине |
Дождитесь момента, когда будет тихо, и скажите: "Вы сегодня так тихо себя ведете, что я намерена зайти с вами к Макдональду" (произнесите это, когда вы будете находиться неподалеку от закусочной, чтобы исполнить ваше обещание тут же, прежде чем снова поднимется шум!) |
|
Муж обычно приходит домой в плохом настроении |
Придумайте несколько приятных сюрпризов и удивите его ими как только его настроение будет хорошим |
|
Неправильный удар при игре в теннис |
Не обращайте внимания на плохой удар и поощряйте себя за хорошие. (Это действительно поможет) |
|
Бастующий или ленивый служащий |
Поощряйте каждый выход за обычный его уровень, когда работа выполнена на самом деле удовлетворительно. (Это не должно продолжаться всю жизнь, только до тех пор, пока не установится новый уровень) |
|
Нелюбовь к написанию благодарственных писем
|
Вознаграждайте себя походом в кино каждый раз, когда вы, получив подарок, тут же написали и отправили благодарственное письмо |
|
Кошка влезает на кухонный стол
|
Дать кошке лакомства, когда она не находится на столе, имеет смысл только тогда, когда в ваше отсутствие дверь на кухне закрыта, с тем чтобы пребывание на столе не могло стать самоподкрепляемым |
|
Грубый водитель автобуса оскорбил и вывел вас из себя
|
Если вы ежедневно ездите на автобусе с этим водителем, то, любезно поздоровавшись с ним утром, когда он не пребывает в дурном настроении, можно за одну-две недели наладить отношения |
|
Взрослый отпрыск, который по вашему мнению должен жить самостоятельно, хочет снова вернуться к вам
|
Поощряйте взрослых детей, когда они заводят собственный дом. Не подвергайте критике их ведение хозяйства, выбор квартиры, ее обстановку, выбор друзей, иначе они могут решить, что вы правы и жить в вашем доме лучше |
Метод 8. Смена мотивации
Исчезновение мотивации какого-либо поведения зачастую является самым приятным и эффективным методом. Человек, у которого достаточно еды, не станет воровать краюшку хлеба. Меня всегда приводит в содрогание вид матери, чей малыш устроил скандал в супермаркете, а она дергает его за руку, пытаясь заставить замолчать. Конечно, можно ее понять — скандал ставит всех в неудобное положение, и рывок за руку является хорошо отработанным способом встряхнуть ребенка и заставить его замолчать, и гораздо менее привлекающий к себе внимание, чем окрик иди шлепок (но как любой ортопед может вам сказать, это также очень верный способ получить вывих локтевого или плечевого сустава у маленького ребенка). Дело обычно бывает в том, что малыш хочет есть, а вид и запах такого количества пищи является для него сверхсильным раздражителем. Мало кому из молодых матерей есть на кого оставить ребенка, когда она идет за покупками, а работающим матерям и тем более. приходится делать покупки прямо перед ужином, когда и они сами устали и голодны, а поэтому и раздражительны. Решить проблему можно, накормив малыша перед тем как идти или по дороге за покупками; чтобы привести в порядок расстроенные чувства малыша, матери, служащего, уплатившего взносы, да и любого раздраженного человека, достаточно что-нибудь положить в рот. Некоторые типы поведения самоподкрепляемы — т.е. сам процесс является подкреплением. Примеры тому — жевание резинки, курение, сосание пальца. Лучшим способом избавиться от этих типов поведения у себя или кого-либо другого является смена мотивации. Будучи ребенком я отказалась от жевательной резинки, потому что тетя сказала мне, что девочке, жующие резинку, выглядят вульгарно, а не выглядеть "вульгарно" было для меня намного важнее, чем получить удовольствие от жевания резинки. Курильщики отказываются от своей привычки, когда мотивы для курения начинают удовлетворяться другими способами или когда мотив для прекращения — скажем, опасение заболеть раком — перекрывает подкрепляющее действие самого курения. Сосание пальца прекращается тогда, когда уровень уверенности ребенка в самом себе возрастает настолько, что он не нуждается больше в самоподдержании комфортного состояния. Чтобы менять мотивацию, необходимо точно знать, что она собой представляет, а мы зачастую знаем это очень плохо. Мы очень склонны к поспешным выводам: "Она не выносит мой характер", "У шефа на меня зуб", "Из этого ребенка ничего хорошего не выйдет". Часто мы даже не осознаем наших собственных побудительных мотивов. Частично именно поэтому появились профессии психолога и психиатра. Если даже у нас самих нет никаких нездоровых мотиваций, мы платим дорогой ценой за всеобщее внимание к СКРЫТЫМ мотивациям, особенно когда нам приходится вверять себя медицине. Проблемы чисто физиологического свойства, если только это не совершенно очевидно, излишне часто считаются эмоциональными по своей природе и лечатся как таковые без глубокого обследования реальной физиологической причины. Я встречала одного бизнесмена, которого лечили амфетамином, чтобы снять у него "чувство" переутомления, когда он был на самом деле переутомлен чрезвычайно напряженной работой. В городе Вест Кост недавно с полдюжины докторов поставили одной женщине диагноз неврастении и лечили ее транквилизаторами, т.е. не видели реальных физиологических причин наблюдаемых у нее симптомов. Она кончила бы свою жизнь в больнице для душевнобольных, если бы седьмой доктор не обнаружил, что она не симулирует болезнь, а на самом деле медленно погибает от отравления угарным газом из-за утечки в отопительной системе ее дома. Я сама несколько раз попадала к врачам, которые давали мне нагоняй и рецепт на транквилизаторы, когда это было совсем не нужно — и я говорила врачу об этом, это были начальные стадии депрессивных состояний. Конечно, иногда истинный мотив состоит в том, чтобы обрести необходимую уверенность, и тогда, (особенно если обещание облегчения исходит от сильной личности, которой доверяют) транквилизатор или даже таблетка сахара, или плацебо, может принести успокоение, снизить давление и облегчить состояние. Святая вода и благословение тоже могут это сделать, если вы в них верите. Так называемый эффект плацебо тоже, вероятно, способствует поддержанию чар широко практикующих врачей. Ничего плохого я в этом не вижу. Мотивация, состоящая в необходимости приобретения уверенности заложена в природе человека. При различных обстоятельствах самое трудное вычленить мотивацию, а не делать сразу поспешные выводы. Одним из способов это сделать является наблюдение за тем, что же в действительности способствует изменению поведения, а что не способствует. Вот вам совет: если у .вас иди вашего друга имеются затруднения в поведенческом плане, хорошенько подумайте о возможных мотивах этого поведения. Не забывайте возможности таких причин, как голод, болезнь, одиночество или страх. Если есть возможность устранить основополагающую причину и таким способом снять или изменить мотивацию, вы должны что сделать.
Мотивация и депривация
Мотивация представляет собой безбрежное море, исследованию которого ученые посвящают целые жизни. В основном эта тема выходит за рамки данной книги, но поскольку мотивацию необходимо было затронуть в связи с нежелательным поведением, то, может быть, сейчас самое время обсудить один из приемов обучения, который используется для повышения уровня мотивации: депривацию. Теория гласит, что если животное работает за положительное подкрепление, то чем более необходимо это подкрепление, тем интенсивней и надежней его работа. У лабораторных крыс и голубей часто вырабатывают условные рефлексы на пищевом подкреплении. Чтобы поднять уровень их мотивации, их содержат на снижен ном пищевом рационе. Обычно им дают столько пищи, чтобы поддерживать их вес на уровне 85% от нормального. Это называется пищевой депривацией.
Депривация стала столь обычным приемом в экспериментальной психологии, что когда я начала эксперименты с обучением, то считала ее необходимостью при работе с крысами и голубями. Понятно, что мы не использовали депривацию у дельфинов. Наши дельфины в конце каждого дня получали еды столько, сколько могли съесть, несмотря на то, заработали они ее или нет, потому что если дельфины получают недостаточное количество пищи, часто бывает так, что они заболевают и погибают. Тогда я вспомнила, что я ведь вполне успешно пользовалась подкреплением пищей и лаской у пони и детей, без того чтобы сначала снизить проявляемую к ним любовь или кормление. Может быть, пищевая депривация необходима только для мелких животных, таких, как крысы и голуби? Однако тренеры океанариума "Жизнь моря" вырабатывали на пищевом подкреплении различные типы поведения у свиней, цыплят, пингвинов, даже рыб и осьминогов, и никому из них даже не приходило в голову сначала морить бедное животное голодом. ' Но я по-прежнему продолжала думать, что депривация может быть необходима при некоторых видах дрессировки, поскольку она так широко используется... пока я не увидела морских львов Дэйва Багера. Сама я никогда не работала с морскими львами, на первый взгляд мне показалось, что они работают только за рыбу, что они не вступают в контакт и презирают тренера. Мне казалось также, что обучению поддаются только молодые животные. Все работающие животные, которых я видела, были относительно невелики, от 100 до 200 фунтов (45 — 90 кг), а морские львы в природе достигают гораздо больших размеров. Дэйв Багер, директор и тренер океанариума "Мир моря" во Флориде, показал мне такое, что я и не могла вообразить. Его морские львы с тем же успехом, как за рыбу, работали за подкрепление в виде общения и тактильных стимулов, и конечно же и за условные подкрепления и при вариативной шкале подкреплений. Следовательно, их не надо было морить голодом, чтобы заставить выступить; во бремя и после дневного представления морские львы могли получать столько рыбы, сколько им было необходимо. В результате морские львы не огрызались — не проявляли раздражительности, как это бывает с любым голодным животным. Они были дружелюбны по отношению к тем людям, которых знали, и с удовольствием давали себя трогать. Я была поражена, когда увидела, как тренеры в обеденный перерыв загорают в од ной куче со своими морскими львами, причем молодые люди лежали на широченных боках зверей, а головы других морских львов лежали у них на коленях. Другим результатом неприменения пищевой депривации было то, что эти морские львы росли... и росли! Дэйв предполагал, что большинство дрессированных морских львов в прошлом были маленькими не из-за своего юного возраста, а из-за заморенности. Актеры "Мира моря" весили 600, 700, 800 фунтов (270—360 кг). Они были очень подвижными, не тучными, но они были громадными, как это и определено природой. И они работали интенсивно. Пять и более представлений в день были превосходны. Теперь я думаю, что попытки повысить мотивацию любым типом депривации не только не необходимы, но и вредны. Снижение нормального уровня питания, внимания, общения или чего-либо другого, что субъект любит и в чем нуждается, прежде чем начать процесс обучения — и исключительно с целью сделать подкрепление более действенным, заставив субъекта в нем больше нуждаться, — является лишь слабой отговоркой дня плохой дрессировки. Может быть, ею следует пользоваться в лабораторных условиях, но в реальных условиях только хорошее обучение создает высокую мотивацию, и ничего больше.
Примеры метода 8. Смена мотивации
Если вы можете найти способ это сделать, этот способ всегда действует и является самым лучшим.
Поведение |
Метод воздействия |
|||||
Сосед по комнате повсюду разбрасывает грязные вещи
|
Наймите горничную или домработницу, которая наводила бы порядок и стирала белье, так чтобы ни вам, ни вашему соседу по комнате не надо было этим заниматься. Это может быть наилучшим решением, если вы со своим соседом по комнате являетесь мужем и женой и оба работаете. Иначе неряшливый человек может сделать аккуратного более небрежным |
|||||
Собака во дворе лает всю ночь
|
Лающей собаке одиноко, страшной скучно. Занимайтесь и уделяйте ей внимание днем, с тем чтобы собака устала и спала ночью, или возьмите еще одну собаку, чтобы они спали ночью вдвоем |
|||||
Дети слишком расшумелись в машине
|
Усиление шума и ссор часто является следствием голода и усталости. Запаситесь соком, фруктами, печеньем, подушками для приятного проведения времени по дороге из школы до дома. А при длительном путешествии рекомендуется через каждый час останавливаться на десять минут и побегать (это полезно и родителям) |
|||||
Супруг обычно возвращается домой в плохом настроении
|
Посодействуйте смене работы. Если причина кроется в голоде и усталости, встречайте его у порога крекерами с сыром и чашкой горячего бульона. Если дело в стрессе, один или два бокала вина могут быть решением проблемы |
|||||
Неверный удар при игре в теннис
|
Перестаньте пытаться потрясти мир победами на теннисном корте. Играйте для собственного удовольствия. (Не применимо для теннисистов мирового класса — а может, применимо?) |
|||||
Бастующий или ленивый служащий
|
Платите за сделанную работу, а не за часы, проведенные на работе. Оплата, ориентированная на конечный результат, иногда очень эффективна для служащих — выходцев с Востока. Это принцип постройки сарая: все работают как ненормальные, пока поставленная задача не завершена, затем все расходятся. Голливудские фильмы делаются таким способом |
|||||
Нелюбовь к написанию благодарственных писем
|
Мы не любим это занятие, так как это цепное поведение (см. метод 6), и поэтому трудно начать, особенно потому, что в конце этого действия нас не ждет положительное подкрепление (ведь мы уже получили подарок!). Часто мы откладываем это дело, потому что считаем, что должны написать доброе, умное и совершенное по фирме письмо. Но 'ли не так: все что должен знать адресат, так это что вы благодарны ему или ей за знак внимания. Вычурные слова в благодарственных открытках не более нужны, чем вычурная каллиграфия на чеке. Своевременность ответа — вот что важно |
|||||
Кошка влезает на кухонный стол
|
Почему кошка влезает на стол? 1) ищет пищу, поэтому убирайте пищу со стола, 2) кошка любит валяться на высоком месте, откуда ей видно, что делается вокруг Устройте полку или подставку, которая была бы выше поверхности стола, расположенную достаточно близко, чтобы вам было удобно ласкать кошку и чтобы обеспечивался хороший обзор кухни, и кошка скорее всего предпочтет это место |
|||||
Грубый водитель автобуса оскорбил и вывел вас из себя
|
Не давайте поводов для проявления грубости: приготовьте заранее мелочь, знайте куда вы едете, не мешайте выходу, не задавайте бесконечных вопросов, с сочувствием относитесь к вынужденным остановкам и т.д. Водители автобусов проявляют раздражительность оттого, что пассажиры могут быть труднопереносимыми |
|||||
Взрослый отпрыск, который по вашему мнению должен жить самостоятельно, хочет снова поселиться вместе с вами
|
Взрослые люда, имеющие друзей, самоуважение, цель жизни, работу и крышу над головой, обычно не хотят жить с родителями. Помогите своим детям обрести первые три условия в тот период, когда они растут, и они, как правило, сами позаботятся о работе и крыше над головой. Тогда вы сможете остаться друзьями |
Преодоление привычек, имеющих сложный характер
В таблицах, приведенных в данной главе, я показала, как каждый из восьми методов может быть применен для решения определенных поведенческих проблем. Для некоторых случаев существует один или два способа решения, которые имеют преимущества перед другими. Для собаки, которая лает по ночам от страха или одиночества, пустить ее внутрь дома или завести еще одну собаку обычно вполне достаточно, чтобы се лай раздавался только в случаях настоящей тревоги. Что касается других проблем, то в зависимости от условий могут подойти различные методы. Детей можно удержать от шума в машине несколькими способами, смотря по обстоятельствам. Существуют, однако, другие поведенческие проблемы, в основе которых лежит множественная мотивация, которые чрезвычайно укоренились и не поддаются воздействию какого-либо одного из методов — проявления стресса в виде кусания ногтей, дурная привычка к хроническим опозданиям, появление зависимого поведения, такого, как курение. Эти типы поведения могут быть снижены или -преодолены сбалансированным использованием восьми методов, а для того чтобы приостановить данное поведение, нужна комбинация нескольких методов (опять-таки я веду речь о поведенческих проблемах у относительно здоровых людей, а не у лиц с психическими заболеваниями или травмами). Рассмотрим некоторые примеры отклонений поведения, требующих комплексного подхода.
Кусание ногтей
Кусание ногтей является одновременно проявлением стрессового состояния и способом моментального получения разрядки. У животных такой тип активности называется заместительным поведением. Собака в ситуации напряженности — например, когда незнакомый человек пытается ее погладить — может внезапно сесть и начать чесаться. Две лошади, принимающие угрожающие позы в борьбе за доминантное положение, внезапно начинают щипать траву. Заместительное поведение очень часто имеет характер приведения себя в порядок (груминг — самоухаживание, самочистка). У животных в условиях ограничения свободы это поведение может так часто повторяться, что ведет к самокалеченью. Птицы чистят перышки до тех пор, пока не выщипают их все до лысин; кошки разлизывают лапу до ран. Кусание ногтей (так же как выдергивание волос, чесание и другие виды чистящего поведения) у людей тоже могут привести к таким крайностям, и даже боль не может прекратить это поведение. Поскольку данное поведение действительно мгновенно переключает со стрессовой ситуации, оно становится само подкрепляемым и может совершаться даже тогда, когда ни какого стресса нет. Иногда положительный результат дает метод 4 — угашение. Данная привычка постепенно исчезает, когда человек становится старше, у него появляется большая уверенность в себе. Но на это могут потребоваться годы. Метод 1 — сделать так, чтобы грызть ногти было бы невозможно, скажем, надевать перчатки, и метод 2 — наказание предъявлением обвинений и выговоров — не обучит того, кто грызет ногти другому поведению. Метод 3 — отрицательное подкрепление — намазать ногти чем-либо неприятным на вкус — может оказаться эффективным, только если данная привычка сама постепенно исчезает (это относится также и к сосанию пальца). Если у вас есть эта привычка, то лучшим способом от нее избавиться является комбинация всех четырех позитивных методом Сначала, используя метод 5 — несовместимое по ведение, — приучитесь ловить себя в начале этого занятия, и всякий раз, когда ваша рука тянется ко рту, отдергивайте ее и производите какое-либо другое действие. Сделайте четыре глубоких вздоха. Выпейте стакан воды. Попрыгайте. Потянитесь. Вы не сможете кусать ногти и одновременно выполнять эти действия (а каждое из них само по себе способствует снятию напряжения). Тем временем разработайте метод 8 — смена мотивации. Снизьте общий уровень стресса в вашей жизни. Поделитесь своими тревогами с теми, кто может оказать реальную по мощь. Уделяйте большее внимание физическим упражнением, которые, как правило, способствуют тому, что человек начинает смотреть на свои проблемы проще. Вы также можете формировать отсутствие данного поведения (метод 7), вознаграждая себя колечком или хорошим маникюром, как Только сначала один, а затем и другой ноготь достаточно от растут (даже если вам поначалу придется бинтовать палец). Вы можете также принять великолепную рекомендацию психолога Дженнифсра Джэймса об обусловливании данно го поведения: в течение целого дня, каждый раз, когда вы ловите себя на том, что кусаете ногти, пишите, что тревожит вас в данный момент Затем выберите вечером минут двадцать, сядьте и непрерывно кусайте ногти, тревожась по поводу всех пунктов своего списка. Со временем вы сможете свести время кусания ногтей к нулю, особенно если этот прием вы будете сочетать с другими, описанными выше.
Систематическое опоздание
Люди, у которых сложная, требующая отдачи жизнь, иногда опаздывают потому, что им многое надо сделать и они должны пытаться как-то втиснуть все дела в имеющееся время — это работающие матери, люди, занявшиеся новым, быстро расширяющимся делом, некоторые врачи и т.д. У других людей опоздание становится правилом Вне зависимости от того, заняты они или нет Поскольку некоторые люди, даже занимающиеся делами мирового масштаба, безукоризненно пунктуальны, следует предположить, что те, кто часто опаздывает, подсознательно выбирают именно такой тип поведения Некоторые склонны считать, что медлительность должна сама себя изживать, по типу отрицательного подкрепления — вы пропустили половину фильма, вечер, на который пришли, почти окончен, человек, которого вы заставили ждать, в ярости. Но это скорее наказание, а не негативное подкрепление, потому что эти следствия наступают уже после того поведения, которое необходимо изменить, и которое состоит не в том, что вы поздно пришли, а в том, что вы недостаточно рано вышли для того, чтобы быть вовремя. Постоянно опаздывающие люди обычно имеют в запасе удивительные оправдания, с помощью которых они добиваются положительного подкрепления в виде прощения (которые формируют их навыки отыскания оправданий и фактически подкрепляют опоздания) Наиболее быстрым способом преодолеть опоздания является метод 8 — смена мотивации. У людей много причин для опоздания Одна из них — страх: вам не хочется в школу, и поэтому вы копаетесь. Другая — претензия на сочувствие: "Ах, я бедняжка, на меня столько навьючили, что я не справляюсь со своими обязанностями". Опоздания могут быть выражением неприязни — когда вы подсознательно не хотите быть со ждущими вас людьми, — и демонстративное опоздание, когда вы показываете, что у вас есть гораздо более важные дела, чем появление в данном месте.
На самом деле не слишком важно, какие мотивы действу ют в данном случае. Единственное, что надо сделать, чтобы перестать опаздывать, это изменить мотивацию, решив, что приходить вовремя при всех обстоятельствах должно всегда преобладать над другими соображениями. Железно! И вам ни когда не придется нестись сломя голову к самолету или снова пропускать назначенную встречу. На основании поздно при шедшего жизненного опыта вот как я исцелила от этой привычки себя. Приняв решение, что точность отныне имеет первостепенное значение, я обнаружила, что ответы на вопросы: "Хватит ли мне времени на парикмахерскую до начала заседания", или: "Могу ли втиснуть еще одно дело до зубного врача?", или: "Должна ли я ехать в аэропорт прямо сейчас?" — становятся автоматическими. Ответы всегда бывали такими: нет, нет и да. Время от времени я еще иногда оступалась, но постепенно выбор точности значительно упростил мою жизнь, а также жизнь семьи, друзей и сослуживцев. Если смены мотивации вам недостаточно, вы можете добавить метод 5 — выработку несовместимого поведения, — назначая себе более раннее время прибытия (возвращения книги). Или же дополните методом 7 — формирование отсутствия, — вознаграждайте сами себя, и пусть ваши друзья вознаграждают вас за то, что для других является нормой, а от вас требует специальных усилий за неопоздание. И по пробуйте метод 6 — подчинить опоздание внешнему сигналу. Выберите несколько событий, на которые вы действительно хотите опоздать, объявите о том, что вы собираетесь опоздать, и после этого действительно придите позже. Поскольку поведение по сигналу имеет тенденцию затухать в отсутствие сигнала, то гарантированная преднамеренность опоздания может способствовать угашению "случайных" или бессознательных опозданий в тех случаях, когда вы действительно должны быть вовремя.
Вредные привычки
Пристрастие к потреблению различных веществ — сигарет, алкоголя, кофеина, наркотиков и т.д. — оказывают физиологические эффекты, способствуют удержанию вас на крючке и приводят к возникновению тяжелых абстинентных симптомов, если вам приходится обходиться без данного вещества. Но существует также большое число поведенческих составляющих этих пристрастий. Некоторые люди ведут себя как наркоманы, включая проявления абстинентных симптомов, по отношению к относительно безвредным веществам, таким как чай, содовая шипучка, шоколад, или к такому времяпрепровождению как бег или еда. Некоторые могут давать ход и останавливать вредные привычки. Например, у большинства курильщиков потребность закурить возникает регулярно с точностью часового механизма, и они впадают в неистовство, если их лишить сигарет. Но некоторые правоверные иудеи могут интенсивно курить шесть дней в неделю, а затем полностью обходиться без сигарет в субботу и не терзаться этим. Помимо физического состояния большинство вредных привычек дают временное уменьшение психического напряжения, вследствие чего они принимают характер заместительной деятельности, что усиливает трудность их преодоления. Но поскольку вредные привычки имеют выраженные поведенческие составляющие, то теоретически можно допустить, что к любой вредной привычке можно подойти как поведенческой проблеме, применив один или более из восьми предложенных методов, и иметь некоторую, вероятность получения положительных результатов. Почти все программы реабилитации от вредных привычек, начиная с клинического лечения алкоголизма, базируются в основном на методах 1 и 8. Вожделенное вещество становится физически недоступно, а лечение сводится к попыткам найти другой источник удовлетворения пациента — повышение уровня самооценки, самоанализа, профессионального мастерства. — смена мотивации, которая определяет потребности. Многие способы лечения основываются также на методе 2, — наказание, — что обычно делается с помощью напоминания об ошибках, чем пробуждается чувство вины. Однажды я Испытала на себе программу, отучающую от курения, которая очень хорошо помогала, несмотря на то, что я часто хитрила. Когда я мошенничала, например выкуривала взятую у кого-нибудь сигарету во время напряженного делового совещания, я испытывала сильное чувство вины; на следующий день я ужасно страдала от этой вины и была практически больна. Но это не останавливало меня в следующий раз; методы 2 и 3 — наказание и отрицательное подкрепление — были для меня не очень действенными. Но на некоторых они действуют. Программы похудения часто подчеркивают не столько общественное поощрение за потерю килограммов, сколько стыд перед своими знакомыми за их набор, и некоторые стремятся к тому, чтобы избежать возможности этого стыда.
Значительную часть вредных привычек составляет ритуальное поведение. Само действие — будь то еда, курение или что-либо другое — непроизвольно попадается на удочку внешних сигналов, которые становятся пусковыми. Время дня может вызывать у вас желание выпить, звонит телефон — и вас тянет зажечь сигарету, и т.д. Систематическое выявление всех этих сигналов и угашение поведения несовершением действия на каждый из них, по одному в каждый отдельный момент времени, явится существенным вкладом метода 4 в пре одоление вредной привычки. Иногда это может быть какой- либо очень простой прием, например убрать с глаз долой пепельницу, а иногда для этого требуется полная смена окружающей обстановки, переезд в новые условия, где нет ни чего общего со старыми привычными пусковыми сигналами (прошедшие лечение наркоманы, употреблявшие героин, не удерживаются, если сразу после лечения попадают в обстановку жизни на привычных улицах). Отрицательное подкрепление усиленно предлагалось в качестве поведенческого метода борьбы с вредными привычками. К алкоголикам, например, подключались электроды, через которые подавался удар электрического тока в момент когда они подносили ко рту стакан алкогольного напитка; существуют лекарственные средства, которые вызывают рвоту при потреблении алкоголя. Подобно большинству отрицательных подкреплений, эти средства действуют только тог да, когда поблизости есть кто-либо, кто может их приме нить, и лучше, если это является (для пациента) непредвиденным. Подобно большинству вредных привычек, алкоголизм не очень-то легко поддается действию одного изолированного метода. Мне кажется, что путь к преодолению вредной привычки у себя самого — и это является одной из тех ситуаций, где человек может являться самым лучшим воспитателем самого себя, — лежит в изучении всех восьми методов и отыскании способа применения каждого из них за исключением наказания.
V. ПОДКРЕПЛЕНИЕ В ПОВСЕДНЕВНОЙ ЖИЗНИ
В начале этой книги, рассматривая теорию Скиннера, я уже говорила, что любая оригинальная идея сначала отвергается, потом подвергается яростным нападкам, и, наконец, принимается как аксиома. Я думаю, что в эволюции любой идеи есть и четвертая фаза: идея не только принимается, но и осознается, удерживается в умах и претворяется в действиях. И это, как я вижу, происходит с положительным подкреплением, и особенно среди людей, которые выросли на идеях Скиннера, витавшими в воздухе, а именно людей, родившихся после 1950 г. Они приобрели привычку пользоваться положительным подкреплением и формировать поведение без страха и колебаний, как нынешние дети приняли компьютеры, которые иногда страшат их родителей. Они распространили эти приемы среди своих старших партнеров, а те со свойственным им энтузиазмом заразили ими окружающих. Разрешите привести несколько наиболее ярких примеров.
Подкрепление в спорте
Судя по моим случайным наблюдениям, тренировки в большинстве командных видов спорта — например, профессиональный футбол, — продолжают старую добрую неандертальскую традицию: множество лишений, наказание, фаворитизм, оскорбление на словах и в мыслях. Однако в тренировочном мире в индивидуальных видах спорта по-видимому происходят радикальные изменения. Фактически именно один из симптомов этого переворота побудил к написанию этой книги. На обеде в округе Весчестер штат Нью-Йорк, я
сидела рядом с теннисистом-профессионалом, тренировавшем хозяйку дома, приятным молодым человеком из Австралии. Он сказал мне: — Я слышал, что вы тренируете дельфинов. Вы знаете о Скиннере и всех этих штуках? -Да. — Тогда скажите мне, где достать книгу о Скиннере, которая помогла бы мне усовершенствоваться в качестве тренера. Я знала, что такой книги нет. Почему ее не было, до сих . пор остается для меня загадкой, и я решила написать ее. И вот она перед вами. Между тем я раздумывала над удиви тельным фактом о том, что этот человек и, возможно, многие другие ему подобные точно знали, что им было нужно. Это означало, что существовали люди, которые уже ухватились за обучение с подкреплением и хотят знать о нем побольше. ; В то время я жила в Нью-Йорке. Частично в качестве : разнообразия в ограниченной рамками дома сидячей городской жизни, а частично из-за любопытства дрессировщика я . начала посещать занятия по нескольким видам физической 1; культуры, начиная от уроков по выживанию, парусного спор-, та, лыж (как горных, так и равнинных) до фигурного катания и танцев. К моему удивлению, только один из инструкторов, под чьим руководством я работала (преподаватель класса труда) опирался на насмешки и угрозы для того, чтобы вызвать нужное поведение. Все остальные использовали своевременное положительное подкрепление, а часто и чрезвычайно остро- умные методики формирования поведения. Это полностью расходилось с воспоминаниями о моих прежних занятиях "физкультурой — балетных классах, уроках верховой езды, гимнастикой в школе и колледже — ни в одном из них я не блистала и всегда боялась этих занятий в той же степени, что и наслаждалась ими. Например, катание на коньках. В детстве я посещала уроки фигурного катания в школе, отличавшейся хорошими результатами обучения. Тренер показывал нам, что делать, а затем мы над этим бились, пока не достигали результата, а тренер корректировал осанку, положение рук и призывал нас стараться еще больше. Я так и не выучила "внешнее лезвие" — скольжение по кругу, скажем на левой ноге с перенесением тяжести тела на внешний край левой ноги. Поскольку это — основа большинства фигур, я не особенно далеко продвинулась. Сейчас я посетила несколько занятий в теперешней школе фигурного катания в Нью-Йорке, которая организована одним из олимпийских тренеров. Работающие там инструкторы используют одни и те же методы обучения и для взрослых и для детей — никаких упреков и ругани, а лишь немедленное подкрепление за каждое свершение, а таких маленьких успехов предостаточно. Каждое из простейших движений, которыми должен овладеть фигурист, разбивается на легко выполнимые промежуточные элементы, начиная с того, как упасть и снова подняться. Скольжение на одной ноге? Все просто: оттолкнитесь от стенки, ноги держите параллельно, скользите на двух ногах; на очень короткое время поднимаете одну ногу, опустив ее, поднимаете другую, затем повторяете то же самое, но держите ногу поднятой чуть подольше, и так далее. Через десять минут класс, начавший с нуля, включая толстых, слабых, нетвердо стоящих на ногах, очень маленьких и очень старых скользит на одной ноге, а на всех лицах написано крайнее изумление и чуть ли не восторг. Я даже не заметила, как выработанный на втором занятии "перекрестный" шаг разрешил мои детские проблемы с равновесием, пока во время свободного катания после занятий не обнаружила, что весело огибаю углы, скользя на внешней стороне конька. И более того! К третьему занятию я могла делать вращение, настоящее вращение, как фигуристы на экране телевизора, и частые прыжки с поворотом, о которых я не смела мечтать в детстве (им начинают обучать совсем без затей вдоль стенки). Какое замечательное открытие! Трудность обучения таким навыкам проистекала не из-за требований к физическим качествам начинающих спортсменов, а из-за отсутствия хороших методик обучения. Другой пример — катание на горных лыжах. Появление пластиковых лыж и лыжных ботинок сделало лыжи доступными для масс, а не только для выдающихся спортсменов. Но на склоны гор эти массы были приведены новыми методами обучения, при которых на первых порах используются короткие лыжи и формируется каждый тип необходимого поведения (наклон, поворот, остановка и, конечно, падение и вставание на ноги) с помощью серии маленьких, легко выполнимых элементов, отмечаемых положительным подкреплением. Я поехала в Аспен, взяла три урока катания на лыжах и скатилась с ровной горы. Наиболее сильные ученики нашего начинающего класса к концу недели одолевали и промежуточные склоны. Отдельные учителя, которые добивались быстрых результатов, существовали всегда. Что, по-моему, изменилось за последние одно-два десятилетия, так это то, что принципы достижения быстрых результатов стали как бы сами собой разумеющимися в стандартных приемах обучения. "Вот способ быстрого обучения катанию на лыжах: не кричите на начинающие постепенно переходите от первого к десятому этапам, хвалите и подкрепляйте успехи на каждом из этапов, и большинство из них через три дня будут на склонах". Когда большинство инструкторов стали пользоваться выработкой и подкреплением и соответственно достигать быстрых результатов, остальные поняли, что и они должны перейти к новым методам — хотя бы просто для того, чтобы, оказаться конкурентоспособными. Это происходит во всех видах индивидуального спорта, что свидетельствует об увлечении тренеров прагматизмом (дословно: полезностью). Обучение двигательным навыкам становится приятным и радостным занятием.
Подкрепление в бизнесе
В нашей стране труд и управление традиционно стояли на противоположных позициях. Мысль о том, что все принимают участие в общей игре, никогда не была особенно популярна в американском бизнесе. Практика бизнеса исходила из того, что каждая из сторон старается получить от другой как можно больше, а дать как можно меньше. Конечно, на" самом деле это молчаливо подразумевалось исходными позициями обучения, но некоторые администрации склонялись к другим подходам. В шестидесятые годы получили популярность "бережное обучение" и другие социально-психологические подходы, ставившие целью просветить администрацию по вопросам нужд и чувств сотрудников и служащих. Но можно быть сколь угодно хорошо осведомленным, но не знать при этом, как же решать каждую конкретную проблему. Положение в бизнесе таково, что одни занимают более высокое, другие более низкое положение, одни получают распоряжение, другие их отдают. В США ситуация в большинстве случаев не напоминает семейную и не должна быть таковой. Поэтому семейственный тип разрешения межличностных конфликтов на работе не проходит. Среди последних публикаций о бизнесе меня в последнее время заинтересовали несколько сообщений, где описаны наиболее эффективные подходы, где используется подкрепление — от наиболее простых до совершенно блестящих. Например, один из консультантов по менеджменту советует в случае, если необходимо временно освободить от работы часть персонала, определить 10% худших и 20% лучших работников. Вы освобождаете самых слабых работников, но вы так же должны обязательно обеспечить 20% лучших, при этом они должны знать, что их оставляют потому, что они прекрасно работают. Очень здравая мысль. Помимо того, что вы убережете своих лучших работников от нескольких бессонных ночей и очень существенно положительно их подкрепите при вызывающих тревогу обстоятельствах, вы к тому же побуждаете средних работников либо стремиться к подкреплению, которое, как они видят, получено лучшими, либо хотя бы не попасть в низшую группу — кандидатов на вылет. Подкреплением для менеджеров среднего уровня и среднего возраста может быть более интересная работа на их теперешнем месте, вместо перспективы повышения — с более высокой ответственностью они могут и не справиться (а могут и не желать занять более высокий пост, особенно если это связано с переездом). Одна компания, занимающаяся компьютерной техникой, выплачивает денежные премии некурящим и тем, кто бросил курить, и в этом есть большой смысл: продукция, которую они выпускают, может быть испорчена частицами дыма. Другие способы подкрепления, находящие все большее применение, включают свободный выбор часов работы, так называемую "гибкую систему" (к ней особенно стремятся работающие матери), работу в самоуправляемых коллективах и вознаграждение за проделанную работу, а не за потраченное на нее время. Все эти приемы управления делают упор на то, что работник действительно считает подкрепляющим — то, что нужно людям, а не только дает прибыль. Программы, нацеленные на снижение себестоимости и повышение темпа работы — программы, которые по существу пытаются заставить работников работать лучше — куда менее эффективны, чем проекты, которые помогают работникам выполнять дело лучше и получать за вознаграждение. Корпорации, пользующиеся положительным подкреплением, часто видят результаты, когда оказываются в критической ситуации. Великолепный пример — авиакомпания Дельта, которая всегда славилась заботой о своих служащих. Во время спада 1981 года несмотря на значительные убытки, Дельта отказалась сократить кого-либо из своих 37000 служащих. Фактически это привело к
тому, что в целом по компании зарплата повысилась на 8%. В прочно установившемся Климате положительного подкрепления работники привыкли мыслить в том же духе; они поменялись местами с администрацией и подкрепили компанию, создав фонд и купив новый самолет, Боинг-767 стоимостью 30 млн. долларов.
Подкрепление в мире животных
На протяжении всей книги я рассказывала о том, как теория подкрепления позволяет профессиональным дрессировщикам формировать поведение у тех существ, к которым про сто не может быть применена сила: кошек, пум, цыплят, птиц в воздухе, слонов в посудной лавке. Обучение с подкреплением открыло новые горизонты, которые, как мне кажется, мы только начинаем исследовать с целью создания полезного действенного партнерства с новыми неодомашненными видами животных. Оно даст возможность животным продемонстрировать нам такие свои возможности, о которых в других условиях мы, возможно, никогда и не узнали бы. Военно-морские силы США занимают передовые позиции в деле развития новых способов использования диких животных, начиная от охраны портов дельфинами до спасения гриндами локаторов. На учебном полигоне в Калифорнии, где вода слишком глубока, мутна и холодна для пловцов-людей, ВМС США обычно используют для обнаружения и обратной транспортировки отстрелянных ракет группу дрессированных морских львов. Ученый Джим Симмонс, работающий в ВМС, проводил эксперименты с голубями, выступавшими в роли корректировщиков в спасательных операциях вода — воздух. Голубей, перевозимых на легких самолетах, обучали клевать кнопку, если они видели желтый, оранжевый или красный предмет (цвета спасательных жиле-tob и плотов). Поскольку острота зрения и работоспособность голубей значительно превышают таковую у людей — спасателей, особенно при бурном море, то я береговая охра- на и Военно-воздушные силы США в настоящее время про- водят полевые испытания "Проекта Морского Поиска" с участием голубей. Единственное но, как сказал один из коман диров береговой охраны:
- Где же мне взять опытных, высококвалифицированных исследователей, которые будут педантично кормить цыплят? Доктор М.Вильярд, ученик Скиннера, разработал систему дрессировки небольших обезьян в качестве помощников для людей с параличами конечностей. Обученные при помощи положительного и отрицательного подкрепления, обезьяны по словесной команде научились включать и выключать свет, переключать каналы на телевизоре, переворачивать страницы, приносить некоторые предметы, ставить и вынимать кассеты в плейере и даже кормить с ложки больного. Они берут в доме все, что угодно, весь день активны и могут сами улечься спать ночью. Услужливость обезьян, в отличие, скажем, от собак-поводырей, связана не с длительным разведением, направленным на отбор служебных качеств, а с действенностью обучения с подкреплением. (При этом между инвалидом и обезьяной-нянькой могут возникнуть истинная привязанность и доверит). В данный момент мы, как мне кажется, даже не можем предугадать, какие еще животные могут начать взаимодействовать с нами в следующих десятилетиях и какие у них могут быть выработаны полезные навыки. Одно из преимуществ подкрепляемого обучения состоит в том, что вам не надо выдумывать какое-либо действие за животное, а потом обучать его выполнению; вы можете подкреплять все, что животное случайно продемонстрирует, и посмотреть, что при этом выйдет. Никто и в мыслях не имел, что обыкновенные тюлени могут "разговаривать", но в аквариуме Новой Англии дрессировщики заметили, что спасенный людьми тюлень Гувер как будто бы подражает звукам. Подражание звукам человеческой речи было сформировано с помощью подкрепления, и вскоре Гувер уже "говорил" не сколько фраз. — Поздоровайся с дамой, Гувер.
Гувер (гортанным басом, но очень отчетливо):
— Привет, дорогая, как поживаешь?
Это забавно слушать, и, кроме того, представляет неподдельный научный интерес для зоологов и биоакустиков.
Для меня как биолога, занимающегося поведением, наиболее ценными удивительным аспектом подкрепляемого обучения является то окно, которое оно приоткрывает в разум животного. Десятилетиями было модно отрицать наличие у животных разума и чувств, и в этом, возможно, был некоторый смысл: это позволило нам избавиться от множества суеверий, переоценок ("Моя со бака понимает каждое мое слово") и неверных истолкований. Но затем появились этологи во главе с Конрадом Лоренцем, которые показали, что у животных есть внутренний мир — они испытывают гнев, страх и т.д. — и что
он проявляется в очень четких позах, выражениях и движениях', которые можно узнать и истолковать. Когда вы с животным можете видеть друг друга, а каждый из вас защищен от неожиданного физического столкновения и травм (допустим — животное находится в клетке или загоне, а вы снаружи), то животное вольно проявлять любые внутренние состояния, вызываемые дрессировочным взаимодействием. Часто животные начинают проявлять по отношению к дрессировщику социальное поведение — от знаков приветствия до вспышек раздражения. Ничего не зная о данном виде, но зная, как любое из животных склонно реагировать на различные дрессировочные ситуации, можно за полчаса тренировки узнать о природе социальных сигналов данного вида больше, чем за месяц наблюдения за тем, как животное взаимодействует со своими собратьями. Например, если я вижу, что дельфин выпрыгивает из воды и со страшными брызгами плюхается обратно в группу других дельфинов, я могу только спекулятивно рассуждать на тему о том, почему он это делает; но если на одном из занятий я забуду подкрепить то, что ранее всегда подкрепляла, и дельфин выпрыгивает из воды и плюхается так, что вымочит меня с ног до головы, я могу говорить с достаточной определенностью, что хотя бы в некоторых случаях прыжки с брызгами, по-видимому, являются проявлением агрессивности... и вдобавок очень эффективным. Можно сказать даже больше. Вовлекая дикое животное в некоторую несложную процедуру обучения, можно получить беглое, но поразительное впечатление о том, что может быть названо видовым темпераментом — о том как не только данный индивид, но и все представители данного вида склонны реагировать на вызовы, бросаемые им окружающими условиями. Преподавая дрессировку смотрителям Национального Зоопарка, я демонстрировала "приемы на многих различных видах. Я стояла по одну сторону загородки, используя в качестве условного сигнала свисток я перебрасывая пищу через ограду; животные на своей стороне передвигались почти свободно. Белые медведи оказались невероятно настойчивыми и упорными. Один медведь, который случайно получил подкрепление в то время, как он сидел неподвижно, принял это за предложение "сидячего" ответа; с текущими по морде слюнями и не отрывая взгляда от дрессировщика, он мог неподвижно сидеть по полчаса и более, ожидая подкрепления. Возможно, что для животного, которое подкрадывается по плавучим льдам к тюленям, такое упорство и терпение имеет важное значение для выживания. Я даже и не предполагала войти внутрь загона для слонов в Национальном Зоопарке, несмотря на то, что с теми, кто за ними постоянно ухаживает, они ведут себя очень послушно. Но с помощью смотрителя Джима Джонса я провела пару занятий по "свободной" дрессировке через прутья ограды с молодой индийской слонихой по имени Шанти. Я решила обучить ее бросать фризби, и начать с того, чтоб она его возвращала. Шанти тут же придумала 101 игру с фризби, в большинстве своем шумные (Джим сказал мне, что сланы любят шуметь). Шанти держала фризби в хоботе и хлопала им о стенку, проводила им по решетке, наслаждаясь получавшимся при этом треском, как ребенок, играющий палочкой, или водила ею взад-вперед ногой по полу. Она меня очень позабавила. Шанти быстро обучилась приносить мне фризби в ответ на звук свистка и лакомство из ведерка. Она также быстро научилась останавливаться каждый раз чуточку подальше; так чтоб мне приходилось тянуться дальше в загон, чтоб взять фризби. Когда я не поддалась на это, она шлепнула меня по руке. Когда мы с Джимом оба накричали на нее (отрицательное подкрепление, отражающее неодобрение, к которому слоны очень чувствительны), она начала возвращать фризби старательнее, но притворилась, что забыла, как брать морковку. Целую минуту она ощупывала хоботом морковку в моей руке, многозначительно поглядывая на ведерко, чтобы дать мне понять, что она предпочитает яблоки и батат, которые лежали в нем же. Когда я проявила понятливость и покладистость на этот счет и начала давать предпочитаемые подкрепления, она тут же продолжила использование того же самого приема — ощупывая хоботом висячий замок на двери ее клетки и бросая на меня красноречивые взгляды, она пыталась меня заставить открыть его. Слоны не просто находчивы, слоны сверхъестественно находчивы.
Во время дрессировочных занятий выявляется видовой характер у очень многих видов животных. Когда я случайно не дала подкрепление гиене, то вместо того чтоб разозлиться или перестать работать,, она превратилась в само очарование, уселась передо мной, улыбаясь и хихикая, как меховой Джони Карсон. Обучая волка обходить вокруг куста, росшего в его вольере, я допустила ту же оплошность, пропустила подкрепление, которое должна была дать; Волк оглянулся, посмотрел через плечо мне в глаза долгим осмысленным взглядом, затем побежал, сделав круг вокруг куста, и заработал при этом сразу все содержимое моего кармана; он "про сек" ситуацию, возможно, решив, что я продолжаю игру, поскольку я за ним наблюдаю, и решил попробовать угадать, что же сработает. Волки — настоящие игроки. Если гиены — комедианты, то волки — викинги. Иногда животные прекрасно понимают значение подкрепления. Мелани Бонд, заведующая отделом человекообразных обезьян в Национальном Зоопарке, начала подкреплять шимпанзе Хэма за разнообразные виды поведения. Однажды он, вместо того, чтоб есть лакомства, стал их собирать, чтобы, как предположила Мелани, съесть их на улице. Однако, когда Хэм увидел, что Мелани пошла, наконец, открывать дверцу, чтобы выпустить его, он знал, что надо делать: он протянул ей стебель сельдерея. Я могу симпатизировать биологам, которые стремятся наблюдать естественное поведение животных, .не нарушая и не вмешиваясь в него каким-либо способом, и тем самым отвергают такое сильное вмешательство, как дрессировку. Я могу понять экспериментальных психологов, которые из бегают любых предположений, построенных только на основании наблюдений за животными и не подтвержденных измерениями, хотя не симпатизирую им. Но я остаюсь убежденным приверженцем того, что дрессировочные занятия представляют богатую почву для соединения обоих подходов и что полевые и лабораторные исследования, которые не могут использовать или не используют этот инструмент, значительно проигрывают. Искусно примененные формирование поведения и под крепление могут иметь огромное значение для того, чтобы добраться до внутреннего мира тех людей, к которым других ' подходов просто нет. Моя подруга Беверли работала врачом в учебном заведении для детей со сложными отклонениями развития — детей, страдающих одновременно глухотой и слепотой, или параличом и задержкой развития. Она создала устройство, которое в ответ на звуки, улавливаемые микро фоном, генерировало цветовые пятна, образующие рисунок. Дебби, отстававшая в умственном развитии вследствие церебрального паралича, у которой отсутствовали движения и которая днем и ночью безразлично и неподвижно лежала в кровати, засмеялась, когда впервые увидела световые пятна. Она услышала свой усиленный микрофоном голос, увидела, что пятна при этом стали ярче, и моментально обучилась возможности самой вызывать танец световых пятен, продолжая смеяться и издавать звуки. Открытие, сделанное Дебби и состоявшее в том, что она может вызывать появление интересующего ее события, дало возможность врачу начать обучать Дебби общению. Относительно другого ребенка, у которого был врожденный дефект черепа и который всегда был вынужден носить специальный шлем, считали, что он полностью лишен зрения, так как он передвигался на ощупь и не реагировал ни на Какие зрительные стимулы. Беверли побудила его издавать звуки перед ее микрофоном, подкрепляя его тем, что он слышал свой собственный голос значительно усиленным. Затем она поняла, что мальчик ориентируется также -и по вспыхивающим световым пятнам — и издает звуки все более и более продолжительное время, заставляя пятна плясать. Он мог видеть достаточно четко. А коль скоро персонал узнал об этом, у них появился новый "канал", по которому можно было войти в контакт и помочь ребенку. В условиях данной учебного заведения эта обучающая игрушка нашла свой конец на полке шкафа. У Беверли была всего лишь магистрская степень и от нее не ожидалось создание нового метода коррекции. Не было научных статей, доказывавших, что цветовые светящиеся пятна дают улучшение при сложных отклонениях, а отклонение от проторенной дорожки возмущало других сотрудников. Но не в этом дело, а в том, что обучение с подкреплением Может пролить свет на многое — не только на данного субъекта, но и на то, что его окружает — и иногда это происходит за считанные мгновения во время обучения.
Подкрепление в обществе
Иногда создается впечатление, будто бы бихевиористы утверждают, что все поведение человека является результатом обучения и подкрепления, а все человеческие болезни, от войн до бородавок, можно исцелить правильным использованием подкрепления. Это, конечно, не так. Поведение является богатой смесью внешних и внутренних ответов, как выученных, так и невыученных. Как это известно каждой матери, индивидуальные особенности являются врожденными (биолог Т.С.Шнейрла показал наличие индивидуальных особенностей поведения даже у насекомых). Далее, громадная часть того, что мы делаем и чувствуем, является результатом нашей эволюции в качестве общественных животных. В это входит наше стремление к взаимодействию и взаимной поддержке ("реципрокный альтруизм"), а также наклонность к агрессивным реакциям, если кто-либо посягает на наши идеалы или собственность ("защита ореола"). А кроме того, то что делается или говорится в данный момент, может в значительной степени зависеть от физического состояния, оцениваемого либо согласно прошлому опыту, либо прогнозу на будущее: человек, который очень голоден или мерзнет, может вести себя совсем не так, как тогда, когда он находится в комфортных условиях, вне зависимости от других обстоятельств.
Таким образом, метод подкрепления имеет свои ограничения, и я не вижу в этом ничего плохого. Наше понимание поведения представляется мне в виде трех сцепленных колец, наподобие торгового знака пива Ballantine. В одном круге располагаются такие бихевиористы, как Скиннер, и все, что нам известно об обучении и познавательных способностях; в другом круге находятся этологи, такие как Лоренц, и все, что мы знаем о биологической эволюции поведения; а в треть ем круге — поведение, которое мы еще не совсем, понимаем, например, игра. И часть каждого круга по своему содержанию перекрывается с двумя другими. Поскольку общество не ограничивается только обменом подкреплений, социальные эксперименты, включающие под крепление в регулировании групповых отношений, дают не однозначные результаты. Например, использование подкрепления в структурированных группах — скажем в тюрьме, больнице или колонии, может провалиться по вине любого, использующего это подкрепление. Один из моих друзей-психологов рассказывал мне о системе поощрительных талонов для малолетних правонарушителей, которая прекрасно работала при экспериментальной проверке проекта, но полностью провалилась и даже вызвала протест и возмущение, когда была перенесена в другое учреждение. Выяснилось, что на ставники, как и предусматривалось инструкцией, раздавали подкрепление 1а посещение уроков и другое желательное по ведение, но, вручая талоны, они не улыбались. И эта маленькая ошибка была расценена (и я думаю, совершенно справедливо) юными правонарушителями как оскорбление, и все усилия пошли насмарку. Индивидуальное и групповое подкрепление использовалось для поощрения не только какого-то определенного типа поведения, но и разных социально значимых качеств — например, чувства ответственности. Качества, обычно считающиеся "врожденными", тоже могут подвергаться корригированию. Вы можете, например, подкреплять творческие способности. Когда мой сын Мишель посещал школу искусств и жил в мансарде в Манхэттене, он подобрал брошенного котенка и подкреплял его за "сообразительность", за любое действие, которое его забавляло. Я не знаю, как кот это понял, но он превратился в самого необыкновенного кота — уверенного в себе, внимательного, преданного и готового на всякие очаровательные штучки даже в зрелом возрасте. В океанариуме "Жизнь моря" мы формировали творческое поведение у двух дельфинов (этот эксперимент сейчас вошел во многие руководства), достигая этого подкреплением любого нового производимого животным действия, которое раньше не подкреплялось. Скоро животные это поняли и начали "изобретать" новые типы поведения, часто довольно забавные. Одни индивиды, у которых развивают творческие способности, становятся более неординарными, другие — менее. Вообще даже среди животных степень творческих возможностей и воображения заложена от природы. Но обучение "сдвигает" этот уровень для каждого, так что любой индивид может улучшить творческие способности вне зависимости от исходного уровня. Общество, и особенно систему образования, часто критикуют за то, что они подавляют творческие способности, вместо того, чтобы развивать их. Я думаю, что, хотя такая критика и обоснована, но нужно понимать, что общество заинтересовано в сохранении Status quo. Как только те "творческие" дельфины познали цену новаторства, они превратились в сущих непосед, стали открывать ворота между бассейнами, таскать реквизит и всячески проказничать. Инициативные люди непредсказуемы, и, возможно, общество может вытерпеть лишь определенный процент таких людей. Если бы все стали вести себя, как наши "творческие" дельфины, мы бы никогда ничего не достигли. Поэтому довольно часто индивидуальная нестандартность подавляется в угоду групповым стандартам норм поведения. Может быть, лишь смелость, необходимая для защиты таких устремлений, приводит некоторых из новаторов к успеху. Я думаю, что важное значение теории подкрепления для общества состоит не в изменении отдельных видов поведения или реформировании учебных заведений, а в том влиянии, которое само по себе оказывает положительное подкрепление на отдельных индивидов. Подкрепление — это информация, информация о том, что то, что вы делаете, приводит к результату. Если у нас есть информация о том, как заставить окружающую среду подкреплять нас, значит, мы эту среду контролируем, и мы больше ей неподвластны. В самом деле от успешности этого до некоторой степени зависит наше приспособление к жизни, достигнутое в ходе эволюции. Таким образом, индивидам нравится обучаться с помощью подкрепления не по тем причинам, которые лежат на поверхности — получение пищи или другого вознаграждения, а потому, что они в этом процессе действительно обретают некоторый контроль над происходящим. А причина того, что людям нравится изменять поведение других с помощью подкрепления, состоит в том, что ответная реакция доставляет удовольствие. Глядя на то, как радуются животные, как сияют глаза малышей люди расцветают и начинают сиять — от радости, вызванной успешностью собственных усилий; этот положительный результат сам по себе является мощным подкреплением. Некоторых людей возможность получения хороших результатов захватывает полностью. Любопытным, но очень важным следствием обучения с помощью подкрепления является то, что между субъектом и тренером возникает взаимная привязанность. Когда я работала в "Жизни моря", несколько раз получалось так, что не-прирученнь1й дельфин во время обучения с пищевым подкреплением внезапно становился абсолютно послушным, разрешал себя гладить, требовал всеобщего внимания, и это безо всяких попыток с нашей стороны "приручить" его или обучить именно этому поведению. Я наблюдала, что это происходило и с лошадьми, иногда в течение одного тренировочного занятия, это же случалось и со многими животными в зоопарке, которые сами по себе ни в коей мере не отличаются ласковостью и не могут быть превращены в домашних питомцев. Животные вели себя так, как будто бы любили своего тренера-дрессировщиаса. А у тренера, тоже очень быстро возникает привязанность. Я с уважением вспоминаю слониху Шанти и волка Д'Ар-таньяна, и даже этот болван, белый медведь, вызывает у меня теплые чувства. Я считаю, что это происходит потому, что успех тренировочного взаимодействия вовлекает участников в единую атмосферу взаимного подкрепления. Тренер является для субъекта источником интереса, волнения, подкрепления, смены условий жизни, а ответы субъекта интересны и являются подкреплением для тренера, и таким образом возникает реальная связь. Не зависимость, а именно связь. Это товарищи в битве за жизнь.
На уровне человеческих взаимоотношений правильное использование положительного подкрепления может дать существенный эффект. Оно может привести к развитию и усилению семейных взаимоотношений, укрепить дружбу, ободрить детей и обучить их в свою очередь превратиться в изобретательных и умелых источников подкрепления. Оно способствует искусству половых отношений, так как секс помимо всего прочего является взаимным обменом положительных подкреплений. Если двое достигли успехов во взаимном подкреплении, они скорее всего будут счастливой парой. Хорошо использовать подкрепление — это не значит без разбору расточать награды или никогда не говорить "нет". Такое неправильное представление о положительном подкреплении возникает довольно часто. Однажды, наблюдая за матерью, везущей по улице малыша в прогулочной коляске, я заметила, что всякий рас, как он начинал проявлять признаки беспокойства, мать останавливалась, вынимала мешочек со всякими вкусностями: виноградом, орехами— и совала малышу что-нибудь в рот, хотя он, видимо, не был голоден и иногда отпихивал ее руку. Стараясь поступать правильно, она добросовестно подкрепляла беспокойное поведение малыша. Она даже не проверяла, не является ли причиной беспокойства малыша непорядок в одежде или какой-либо другой дискомфорт. Никто из нас не представляет собой совершенства, и я не считаю, что мы должны все время думать о подкреплениях. Я предполагаю, что во взаимоотношениях с другими людьми сдвиг к положительным реакциям от резкости, яростных споров и упреков, которые являются стилем многих домов и организаций, повлияет не только на индивидов, вовлеченных в эти контакты, но и распространится вовне, изменяя соотношение сил в обществе. Мне кажется, что американское общество, несмотря на все свои свободы, является обществом карательным. Мы несем груз Кальвинистского отрицания, которое окрашивает все наши учреждения и большинство наших суждений вне зависимости от нашей индивидуальной сущности. Переключение на положительное подкрепление может стать поразительным событием. В 1981 г. маленький городок в штате Аризона, отчаявшись удержать лучших школьных учителей, учредил фонд из местных средств и выдал денежные премии пяти учителям, выбранным по итогам голосования среди специалистов и общественности; сумма этих вознаграждений равнялась в некоторых случаях месячному заработку. Деньги вручались на церемонии окончания высшей школы, и ученики стоя аплодировали учителям. К третьему году осуществления программы, она, по-видимому, пошла на пользу как ученикам, так и учителям. Ученики этой школы, которые представляли по своему составу весьма смешанную группу из представителей разных рас и этнических групп, богатых и бедных слоев населения, завоевали высокое место при национальном тестировании. Что мне кажется существенным в этой истории, так это не способ поощрения лучших учителей, что само по себе является неплохой идеей, а то, что это событие получило широкую огласку и стало новостью в национальном масштабе. Переход к положительному подкреплению был тогда в нашей культуре новой идеей. Но общество быстро ее приняло. Можно предположить, что на следующий год поступят сведения из других городов, что и они провели подобное мероприятие. Процесс этого принятия может охватить жизнь одного, двух или трех поколений. Я подозреваю, что положительное под крепление, будучи облечено в теорию, которая дает возможность анализировать причины неправильного хода событий, является той самой идеей, которая слишком заразительна для умов, чтобы ее развитие приостановилось. Я полагаю, что большинство бихевиористов со мной согласятся - хотя они, конечно, считают, что это произойдет совсем скоро.
Пожалуй, основное, что вызывает возражения против бихевиоризма у людей гуманитарного склада ума — это подтекст: "все происходящее в обществе может и должно управляться подкреплением" (сейчас это уже работает, но работает плохо). Мне кажется, что это необоснованные страхи. Воображаемое общество Скиннера, построенное исключительно на различных типах подкрепления, не должно, с моей точки зрения, точки зрения биолога, функционировать. Идеалистические общества, существующие в воображении или в реальности, иногда не принимают в расчет или пытаются приуменьшить такие биологические явления, как конфликты. Мы являемся в конце концов общественными животными, и в качестве таковых должны устанавливать иерархию. Соперничество внутри группы за более высокий статус — по всем направлениям, а не только по санкционированным и предписанным — является абсолютно неизбежным и фактически выполняет важную социальную функцию: будь то утопическое общество или табун лошадей, существование развитой иерархии направлено на сглаживание конфликтов. Ты знаешь свое место, и незачем продолжать рычать, доказывая его. Я предчувствую, что индивидуальный и групповой статус, как и многие другие человеческие потребности и тенденции, слишком сложны, чтобы их опровергать или отвергать с помощью спланированной системы подкрепления, по крайней мере в обозримом будущем. В свою очередь, бихевиористов беспокоит то, что в обществе они видят много ситуаций, в которых правильное использование подкрепления могло бы дать хороший эффект, а вместо этого мы с дурацким упорством продолжаем выбирать неправильные решения. Например, мы предоставляем вооружение и помощь странам, которые, как мы надеемся, будут к нам после этого более расположены. Продолжаем! Подкрепление кого-либо в надежде на собственную выгоду никогда не работает; это приводит к обратным результатам даже на простейшем уровне: "Она пригласил меня на праздник только для того, чтобы получить подарок, терпеть ее не могу"; "Тетушка Тишш чрезвычайно мила сегодня, интересно, что старая бестия хочет на этот раз"). И я не знаю, лучше ли наша жесткость в отношении стран, ведущих себя неправильно. А что, если им все равно? А если их первейшей задачей является досадить нам? Я понимаю, что это может быть упрощением, но я все же полагаю, что бесконечное повторение такого поведения нации, о кагором любой дрессировщик крысы может сказать, что оно не приведет к достижению цели, является непростительным простодушием. Нация, так же как и каждый отдельный индивидуум, должны постоянно задавать себе основной вопрос тренера: что в действительности я подкрепляю? Законы подкрепления — мощное орудие. Но свод правил гораздо более гибок, чем некоторые предполагают и даже более гибок, чем иным хотелось бы. Чтобы подкрепление действовало, оно должно быть вовлечено в процесс постоянного изменения, постоянной обратной связи, постоянного роста. Применяющий подкрепление начинает осознавать дуалистическую, двустороннюю природу этого общения. Он больше узнает о других и, неизбежно, лучше познает себя. Можно сказать, что тренировка является тем процессом, который требует одновременного присутствия внутри и вне собственной шкуры. Кто обучает и кто обучается? Оба меняются местами и оба учатся. Некоторые видят в теории подкрепления способ контроля, манипулирования или ограничение свободы личности или общества. Но изменения общества должны начинаться с изменения отдельных личностей — со сдвигов, которые принесут личную пользу — точно так же, как видовые изменения должны начинаться на уровне одного гена. Социальные изменения не могут быть навязаны сверху — по крайней мере навязаны надолго (произведение "1984 год" Оруэлла написано неверно с биологической - точки зрения). Живые существа имеют право не только на пищу и убежище, но и на подкрепляющее окружение. Использование и понимание подкрепления является тем индивидуальным опытом. Который может пойти всем на пользу. Совершенно не ограничивая нас, оно открывает дорогу для приобретения нового опыта, и будучи осознанным, усиливает не механические аспекты жизни, а богатство и удивительное разнообразие всего поведения.