Страница:
Т.Ч. Я бы сказала вот что, что человечество, обретя то, что некоторые исследователи называют «знаковой грамотностью», и сюда включается не только письменность как таковая, но вообще возможность что бы то ни было фиксировать отдельно от индивидуального мозга, обрело то, что, опять же в некоторых работах, называется «внешней памятью». То есть в нас есть то, с чем мы и умрём, а есть общечеловеческий, общепланетарный запас знаний, который хранится в архивах, музеях, библиотеках, видео– и кино– и так далее -теках. Но фокус в том, что этот багаж растёт стремительно по экспоненте даже не каждый год, а чуть ли не каждую неделю. И мы сейчас сталкиваемся с ситуацией, всё человечество сталкивается с ситуацией, что может не хватить жизни на то, чтобы просто набрать тот объём знаний даже в своей области, не говоря о более широкой, вот о чём вы говорите.
П.Т. Об истории я бы сказал так. Известно, что в этих устных обществах историческая память, скажем, три поколения, не дальше. И потом пропадают и наступают новые события. И тогда вопрос заключается в том, а нужно ли нам больше исторической памяти, нежели три поколения? Я бы сказал, что, может быть, в этих обществах и не очень нужно. Эти линеарные гипотезы никогда не оправдываются. Хорошо помню, на втором, кажется, курсе, посмотрев в библиотеке на эти полки с научными журналами, думал, что их постоянно выходит всё больше и больше. И будет время, когда они не поместятся в этом помещении, будет новое помещение и тогда будет время, когда книжная полка будет вокруг земного шара, так скажем.
А.Г. Интернет.
П.Т. Прошло пару десятилетий, и нашли совершенно другое решение той проблемы, то есть компьютерная память.
Т.Ч. Но это же дела не меняет, это просто материально решилось иначе. Количество информации-то…
П.Т. Да, но я просто хотел сказать, что эти линеарные гипотезы, мне тогда в голову не приходило, что может быть другой носитель где-то, то, что огромное количество книг можно на одной маленькой пластинке записывать…
Т.Ч. Но это решает только геометрический вопрос, больше никакой.
П.Т. Нет, по-моему, это, я хочу сказать, что эти… такие гипотезы, что нечто уйдёт в бесконечность, эти книжные полки, до этого наступит новое решение, это касается и вопросов образования. Тут также накапливается бесконечное количество знаний, и каждый преподаватель думает, что вот именно то, что он преподаёт, это уж точно дети должны выучить. Это совсем бесперспективно, потому что держать детей в школе больше 12-ти лет невозможно. Я думаю, что одно направление, в котором дело пойдёт, это будут обучать не столько конкретным знаниям, сколько научному мышлению, опять-таки. Естественно, на примерах. Есть области, которые надо знать обязательно, какие-то области надо подробно знать, чтобы чувствовать, что…
Т.Ч. Например, логику.
П.Т. Да. Но и, скажем, тоже биологию или психологию. Надо иметь какое-то представление и способ мышления.
Поисковое поведение животных
Участники:
Валентин Анатольевич Непомнящих – кандидат биологических наук, г. Борок, Ярославская обл.
Александр Аркадьевич Жданов – доктор физико-математических наук
Александр Гордон: Доброй ночи! Человек научился справляться с задачами, которые нужно поставить перед интеллектом «искусственным», пока в кавычках, пока в двойных кавычках, когда эти задачи хорошо формализованы. И этот, с позволения сказать, интеллект находится в хорошо организованной искусственной среде. И примеры тому, скажем, шахматные компьютеры, которые иногда выигрывают у людей, находясь с ними на одном уровне, скажем так, игры. Но когда речь идёт о создании машины или интеллекта, который должен поставить не чётко сформулированную формальную задачу, да ещё в среде, совершенно незнакомой, неформализованной, не искусственной, вот здесь мы пока сталкиваемся с огромными трудностями, а без этого об искусственном интеллекте, подобном человеческому, речи, конечно, идти не может. Это первый шаг, который нам предстоит сделать и с которым очень хорошо справляются все живые организмы на земле, включая бактерий. Почему у них это получается, а у нас пока не очень, мы сегодня и попробуем поговорить. Итак, почему?
Валентин Непомнящих: Да, действительно, почему? Представим себе такую задачу. На некую планету послан робот, точнее – автономный робот, то есть такой, который не нуждается в управлении со стороны человека. И пусть перед ним поставлена очень расплывчатая задача, которую на самом деле любой геолог поймёт: нужно пройти по некоторой территории и собрать геологические образцы – скажем, с наибольшим содержанием урана. При этом заранее никак не оговаривается, какое содержание следует считать большим, а какое – маленьким. Нужно это решить по ходу дела. Естественно, времени у робота мало, запасов энергии тоже мало, поэтому способности обучаться, если даже они есть у предполагаемого робота, мало чем ему помогут. Он должен на ходу пользоваться какими-то правилами поиска, которые можно назвать эвристиками. И здесь, конечно, имеет смысл посмотреть, как животные решают задачи поиска.
Есть такое насекомое – ручейник, личинка которого живёт на дне водоёмов и строит домик-трубку из песка и других материалов. Личинка фактически как раз решает задачу, о которой мы говорим. Трубку построить нужно очень быстро, потому что она нужна для дыхания и защиты от хищников. А если трубка повреждена частично, например, обрезана в эксперименте, то её нужно быстро восстановить, и у личинки нет времени разбираться и проводить исследование, как распределён материал в водоёме или в экспериментальной установке: где частицы материала более подходящие, а где – менее подходящие. Нужно просто собирать материал. Тем не менее, она с этой задачей справляется.
Я, собственно говоря, и хотел начать с того, чтобы представить вам этого ручейника. Я думаю, уже сейчас можно показать его домик, чтобы это было видно. Домик – это просто трубка. Ручейники того вида, о котором я говорю, могут делать домики из песка или из плоских частиц или каких-нибудь листьев. Здесь показан домик из песка, но на самом деле личинки «любят» частицы большего размера, чем песчинки, и при этом предпочитают плоские частицы. Причина такого предпочтения проста. Они сшивают частицы белковой нитью – паутиной. Естественно, чем больше частицы, тем меньше швов между ними, тем меньше затраты паутины, и меньше, следовательно, затраты энергии. Соответственно, личинкам желательно выбрать там, где они находятся в момент поломки домика, такие частицы, которые позволят им сэкономить эту нить.
Мы проводили эксперименты, чтобы изучить, как личинки это делают. Это чисто лабораторные эксперименты, но, поскольку личинка почти слепая и не использует зрение во время поиска, лабораторный эксперимент довольно хорошо имитирует то, что происходит в ручье.
Александр Жданов: В данном случае речь идёт о том, что ручейник должен найти крупную частицу, да?
В.Н. Да, он должен, говоря человеческим, антропоморфным языком, «решить», какие частицы достаточно крупные, а какие можно отбросить. Для того чтобы упростить наблюдение, мы использовали вместо песка скорлупки, кусочки яичной скорлупы, большие и маленькие. Ручейник должен был выбирать между этими скорлупками. Вот как он это делает. Поскольку ручейник слепой, он должен ощупать частицу передними ногами (можно показать, как это он делает) и оценить её размер, форму, гладкость и многие другие параметры. Мы будем говорить пока просто о размере и форме. В конце концов, ручейник цели достигает. Вот здесь показан готовый уже домик, он сделан, как видите, из частиц примерно одинакового размера.
А.Г. А вы предлагали ему совсем разные частицы? От очень мелких до очень больших?
В.Н. Да, разные. Они различались по площади в восемь раз (по длине стороны, соответственно, они различались меньше). Ручейник не всегда использует самые большие частицы, бывают ошибки, но в целом он умеет делать правильный выбор и очень быстро.
А.Г. Но поскольку время ограничено, это значит, что он не перебирает все песчинки или все кусочки для того, чтобы понять, какие частицы отбирать.
В.Н. Совершенно верно. Вот в этом-то как раз его секрет. Он может частицу взять и за угол, и за широкую сторону. И он должен в каждый момент времени решать, стоит ли с ней дальше возиться или нет. Полное обследование частицы занимает несколько минут. Ручейник должен каждую сторону ощупать, проверить, есть ли там грязь, есть ли там трещины. Но ручейники, как правило, этого не делают. Они могут частицу быстро покрутить и выбросить, а могут оценивать долго. Почему это происходит?
С точки зрения внешнего наблюдателя, ручейник генерирует своего рода гипотезы. Например, если ему попадается хорошая, большая частица и он прикрепит её к домику, а следующая частица будет плохая, то ручейник будет ощупывать её очень долго. Это выглядит так, будто ему хочется, чтобы частица была хорошая. Именно такое ощущение создаётся у наблюдателя. Ручейнику жалко расстаться с частицей. Потом он её всё равно выкинет, но время он потеряет. Вроде бы совершенно неразумное поведение. С другой стороны, тоже есть довольно неразумное поведение: когда ручейнику попадается мелкая частица, он её выбрасывает и начинает искать рядом другие частицы (напомню, что ручейник всё делает вслепую). Если теперь он найдёт крупную частицу, но схватит её за угол, то дальше уже не станет её проверять, а выбросит. То есть ручейник ведёт себя так, как будто он верит, что после плохого будет тоже плохое. Что получается?
А.Ж. Валентин Анатольевич, можно я здесь немножко прерву. Если смотреть на это насекомое как на распознающую систему, то здесь напрашивается такой аналог: процесс распознавания требует некоторого управления. Этот процесс можно прекратить раньше, можно продолжить измерительные эксперименты, но потратить лишнюю энергию на эти эксперименты – уменьшить риск ошибки, но потратить энергию. Всё время надо…
А.Г. Балансировать.
А.Ж. В этом заключается баланс: как бы поменьше сделать экспериментов, но как бы повысить риск правильного распознавания. Да?
А.Г. И где здесь оптимум тогда получается?
А.Ж. Вот то, что ручейник делает, показывает, что он как-то этот оптимум нащупал и эту стратегию он и проводит. Как в данном конкретном случае.
В.Н. Я бы сказал так (конечно, это моё личное мнение): можно, конечно, попытаться найти этот оптимальный баланс, используя те средства, которые есть у ручейника. Баланс между затратами энергии и использованием самых лучших частиц. Но я хочу напомнить, что у ручейника ситуация не такая, чтобы искать оптимум, ему нужно просто быстро найти приличные частицы. То есть, ему достаточно решить задачу удовлетворительно, а вовсе не оптимально. И, может быть, алгоритм поиска, о котором я говорил, не нацелен на оптимизацию поведения, а нацелен на то, чтобы просто решить задачу удовлетворительно.
А.Ж. То есть, если я правильно понимаю, речь идёт о том, что здесь мы наблюдаем не выработку алгоритма поиска, а применения алгоритма уже готового. Алгоритм сам, видимо, был найден раньше. Но этот алгоритм обеспечивает эффективный поиск нужной частицы. Да? То есть, результатом поиска является не алгоритм поведения, а результатом является поиск крупных частиц.
В.Н. Да, поиск в буквальном смысле.
А.Г. Насколько я понял, ключевым словом в вашем рассуждении было слово «сценарий», то есть ручейник действует по какому-то сценарию, выстраивает гипотезу о том, что будет дальше.
В.Н. Да, и делает это на основании, в общем-то, случайного события. Случайно ему попадается либо большая частица, либо малая. На основании этого краткого отдельного события, опять-таки антропоморфным языком говоря, ручейник выстраивает гипотезу о том, что и дальше будут попадаться однотипные (либо большие, либо малые) частицы. Это предсказание распространяется не только на одну следующую частицу, и результат этого предсказания получается такой: когда частицы разного размера смешаны совершенно случайно, то протокол эксперимента показывает, что прикрепления частиц и отказы от них следуют сериями. То есть, имеется тенденция повторять прикрепления одно за другим. А после отказа появляется тенденция повторять отказы.
Но, несмотря на это, общий результат поиска всё же таков, что ручейник всё-таки прикрепляет в основном приличные частицы. Почему он использует такой алгоритм, почему такие гипотезы выдвигает? Дело в том, что в природе не бывает случайного распределения чего бы то ни было. В реальных ручьях и плоские частицы и круглые, и мелкие и крупные не перемешаны случайно. Наоборот, однородные частицы собраны в определённых местах, в зависимости от течения, в зависимости от глубины. Поэтому, если ручейник где-то находит хорошие частицы, то в реальной жизни это означает, что здесь нужно остаться и искать дальше. Мы провели такой эксперимент, который бы при систематическом исследовании среды завёл бы ручейника в тупик. Просто он не смог бы найти то, что ему нужно. Можно показать, как это выглядело: экспериментальная установка, которая представляла собой просто небольшой коридор, который весь был засыпан песком, но на одном его небольшом участке вперемешку с песком были и скорлупки.
А.Ж. Валентин Анатольевич, правильно ли я понимаю, что речь идёт вот о чём. Алгоритм, который отрабатывает ручейник, построен не на той гипотезе, что искомые частицы распределены равномерно случайно, а он построен на гипотезе, что эти частицы в среде распределены неравномерно.
А.Г. Произвольно сгруппированы.
В.Н. Где-то они собраны…
А.Ж. Эти события, что называется, коррелируют между собой.
В.Н. Да, алгоритм поиска базируется на этой гипотезе, которую откуда-то знает ручейник, точнее, его поведение «знает». Мы, может быть, к этому ещё вернёмся, а в эксперименте происходит вот что.
Если бы ручейник попал за пределы участка со скорлупой и стал бы проверять каждую песчинку, то он увяз бы в песке и в буквальном, и в переносном смысле, потому что песчинок в коридоре – тысячи. Но ручейник действует иначе. Если он находится на участке со скорлупой и находит скорлупку, то он её приклеивает, а затем начинает ощупывать частицы вокруг себя. Есть два варианта результатов этого поиска. Либо он находит, в конце концов, ещё скорлупку, приклеивает её и процесс повторяется, а ручейник остаётся на месте. Или же ему выпадает такая неудача, что вместо скорлупки он находит несколько песчинок подряд. Сначала ручейник с ними долго возится, потому что, как я говорил, он «ждёт» чего-то от них. Потом это опробование каждой очередной частицы становится всё короче и короче, и, в конце концов, ручейник сдвигается с места и начинает ползти. И вот когда он натыкается на скорлупку во время такого движения, шансов на то, что он не то что её прикрепит, а даже просто станет её пробовать, осматривать, вернее, ощупывать, гораздо меньше. Даже если он и берёт скорлупку, то может её бросить тут же, не успев разобраться, а что это такое.
А.Г. Ничего хорошего он не ждёт от неё.
В.Н. Да, ничего хорошего не ждёт.
А.Ж. То есть, он уже чего-то ожидает, он уже какую-то гипотезу выдвинул.
В.Н. Что получается в результате? Ручейник может выйти за пределы участка со скорлупой и двигаться дальше по коридору. Ещё раз повторю, что если бы он начал пробовать песчинки в коридоре, то застрял бы там надолго. Но, как правило, ручейник их не пробует, а очень быстро пробегает этот коридор, потому что не ждёт ничего хорошего. Конечно, он иногда может взять какую-то песчинку и тут же бросить её. Иногда может даже приклеить, если она более плоская, чем другие. Но это исключения, и ручейник, в конце концов, возвращается на участок со скорлупой. И здесь, когда он натыкается на скорлупку, то чаще всего её берёт. Но, тем не менее, из-за того что он двигается и «ничего хорошего не ждёт», ручейник может и проскочить несколько раз этот участок. Но опять-таки, эксперименты с десятками личинок показывают, что они в целом, строят свои домики на этом участке и строят из скорлупок. Другими словами, эта не очень, казалось бы, рациональная стратегия предсказания по единичным событиям позволяет ручейникам в целом выигрывать.
Мы это проверяли, построив математическую модель, где правила поведения, о которых я говорю, были заложены в программу. И модель подтвердила, что этих правил достаточно для того, чтобы ручейники собирались и строили именно на том участке, где есть скорлупки. Здесь, естественно, возникает такой вопрос: когда мы моделируем, мы вводим правила, но это ничего не говорит о механизме управления поведением, то есть о том, откуда берутся эти правила. Единственное, что можно здесь сделать, с моей точки зрения, – это предложить следующую аналогию.
Есть динамические системы, так называемые нелинейные системы (одна из них здесь изображена), поведение которых может быть очень сложным – несмотря на то, что сама система описывается очень простым уравнением. В зависимости от величины параметра «А» (показано на рисунке), переменная в уравнении может изменяться сложным образом, как периодически, так и не периодически. И поведение системы оказывается одновременно и случайным, и предсказуемым. Оно случайно в том смысле, что невозможно предсказать, в какой момент времени произойдёт переход от больших значений переменной к малым значениям. В то же время, поведение системы упорядочено: мы видим, что большие и малые значения идут друг за другом сериями.
Здесь есть аналогия с ручейником, у которого реакции тоже повторяются сериями. Пусть эта аналогия поверхностная, но пока я буду на ней, так сказать, настаивать. Далее, если некий внешний сигнал (некая положительная величина) прибавляется к параметру «А», то затем переменная надолго увеличивается, несмотря на то, что сигнал – коротенький. Это – ещё одна аналогия с ручейником: одна частица может надолго изменить его поведение. Конечно, такого простого уравнения недостаточно для того, чтобы моделировать поведение целого ручейника. Всё-таки его поведение сложнее: он и берёт частицы, и крутит их.
А.Ж. Но вы сейчас моделируете какую-то одну составляющую.
В.Н. Да, и мы решили пойти несколько более простым путём: моделировать не ручейника, а некую условную инфузорию, которая движется в условном пространстве и находит там участки с пищей. Пища – это просто химические вещества, которые инфузория может в буквальном смысле всасывать. Никакого сложного пищевого поведения здесь не нужно. Когда на эту инфузорию не действуют никакие сигналы, то её поведение определяется единственным уравнением, а траектория её движения получается такая, что в ней чередуются почти прямые пробеги с петлями. Эти петли (опять-таки с точки зрения внешнего наблюдателя), можно интерпретировать как отыскивание какого-то места в пространстве.
А.Ж. То есть, идёт такой локальный поиск, который чередуется с крупными перемещениями в попытке найти какое-то или более богатое «месторождение».
В.Н. На данном этапе, когда нет никаких сигналов, искать, собственно говоря, нечего. Я хотел бы подчеркнуть, что это поведение, чередование таких спонтанных поисков на одном месте…
А.Ж. Очень красивая картинка. Этот спонтанный поиск, эти вот петли, узлы такие. И длинные эти пробеги. Очень красиво.
В.Н. Это поведение на самом-то деле типично для многих животных. И не только инфузорий, но и для червей, для насекомых – для таких животных, не слишком крупных, для которых можно построить экспериментальную установку, в которой нет никаких сигналов, освещение и все внешние факторы распределены равномерно.
Теперь мы вводим в это пространство пищу: у нас есть три участка, на слайде это можно показать. На одном участке концентрация пищи маленькая, на другом – большая, а между ними находится пустой участок. И вот наша условная инфузория начинает поиск с бедного участка. В какой-то момент ей не везёт, не попадается пищевых веществ. В результате инфузория перестаёт описывать петли на этом участке и начинает двигаться прямо. Здесь работает простая система, показанная раньше, которая из одного режима поведения переходит в другой режим: вместо больших значений переменной, которые обеспечивают поворот, теперь наблюдаются малые значения, соответствующие прямому пробегу. Поэтому инфузория теперь летит прямо, пролетает пустое место и попадает на богатый участок. Конечно, она может и уйти из богатого участка. Однако на богатом участке пища сосредоточена плотнее, там меньше вероятность серии неудач, и поэтому, в конце концов, инфузории скапливаются на богатых участках.
Так, собственно, поступают и реальные инфузории – я хотел бы подчеркнуть сходство поведения модели с реальными организмами. Мало того, с помощью такой простой системы можно добиться ещё более богатого поведения, если добавить к ней разные сенсоры, разные органы чувств. Вот на следующем слайде, например, показана ориентация…
А.Ж. А можно остановиться на этом слайде на секундочку. Хочется обратить внимание на то, что эта картинка характерна не только для инфузорий, для рассматриваемых здесь объектов, а это вообще житейская картина. Когда мы обсуждали в передаче наши проблемы, возникла очень хорошая аналогия с человеком, который тоже ищет, где лучше и где глубже. Допустим, он ищет в пределах своего города, находит всё, что может, а когда решает, что всё здесь уже найдено, то он совершает какую-то миграцию.
А.Г. Скачок в пространстве.
А.Ж. Да. И там опять начинает локальный поиск. После чего может последовать опять такой длинный бросок куда-то. Очень интересно. То есть, этот алгоритм реализуется, видимо, на многих, на разных уровнях управления, для разных объектов, и мне он кажется очень интересным.
В.Н. Вот здесь я хотел бы добавить, что, конечно, этот алгоритм, это порождение гипотез действительно аналогично у разных организмов. Но это не значит, что механизм порождения гипотез всегда один и тот же. Пока что мы рассматриваем поведение очень простенького уравнения. Вся проблема-то в том, что в таком виртуальном пространстве, такую виртуальную инфузорию довольно легко имитировать. А вот когда речь идёт о животном уже с нервной системой, сложной, которое не просто двигается, но ещё манипулирует предметами, решает задачу не просто поиска в физическом пространстве, а поиска в каком-то пространстве возможностей, всё становится сложнее. Понятно, что в этих случаях работает более сложная система. Аналогией здесь, может быть, полезно руководствоваться, но сама аналогия не является моделью.
Я продолжу, чтобы закончить с этой инфузорией. Здесь показана её ориентация на источник запаха. Источник показан кружком, а инфузория двигается к нему такими вот зигзагами. Почему так происходит? Дело в том, что мы ввели в модель сенсор, который воспринимает разницу между раздражением на данный момент времени и предыдущий момент времени. Чем больше эта разница, тем больше подавляется тенденция модели к поворотам. Собственно говоря, таков же механизм ориентации у реальных инфузорий и бактерий. Что делает наша инфузория? Вместо того чтобы всё время корректировать свой путь к источнику запаха, она генерирует гипотезы, хотя это звучит как преувеличение. Вот пример: если разница между последовательными раздражениями положительна, то инфузория бросается прямо вперёд, хотя это может увести её в сторону от источника запаха.
А.Г. «Что-то пахнет, по-моему, там». И рванула, да?
В.Н. Да. И она опомнится только тогда, когда рассогласование между направлением движения и целью будет очень сильным. Затем она скорректирует своё движение, может быть, опять неточно. Но, в конце концов, она приходит к этому источнику. Расчёты показывают, что на самом деле такое поведение экономнее и быстрее, чем если бы она всё время пыталась…
А.Г. Идти по прямой к этой цели.
В.Н. Да. Она просто тратила бы время на постоянную коррекцию своего движения. Кроме того, модель также предполагала, что во время поворота, как любое физическое тело, инфузория движется медленнее, чем когда она летит прямо. Но это…
А.Ж. А вот во время такого большого броска, она уже не принимает решений, да? То есть она просто отрабатывает уже принятое решение совершить бросок.
В.Н. Да, и в этой модели, в этой динамической системе происходит это очень просто, потому что сигнал подавляет переменную, управляющую поворотом, так что инфузория не может повернуть. А когда наступает сильное рассогласование, сигнал становится отрицательным. И тогда система начинает снова работать. Она снова начинает искать. И снова выбирает какое-то направление.
Когда инфузория достигает цели, она там не останавливается, а начинает обыскивать окрестности источника запаха (на этом рисунке это, может быть, не очень сильно выражено). Результат этого поведения такой: если в пространстве есть много других источников, и некоторые издают более сильный запах, то у инфузории есть шанс найти другой, лучший источник.
Этот способ ориентации, на самом деле, существует и у реальных бактерий, они ориентируются с помощью именно таких бросков. Здесь серой полосой показан разрыв в градиенте запаха, как и бывает в реальной жизни. Но наша инфузория тоже проскакивает разрыв…
П.Т. Об истории я бы сказал так. Известно, что в этих устных обществах историческая память, скажем, три поколения, не дальше. И потом пропадают и наступают новые события. И тогда вопрос заключается в том, а нужно ли нам больше исторической памяти, нежели три поколения? Я бы сказал, что, может быть, в этих обществах и не очень нужно. Эти линеарные гипотезы никогда не оправдываются. Хорошо помню, на втором, кажется, курсе, посмотрев в библиотеке на эти полки с научными журналами, думал, что их постоянно выходит всё больше и больше. И будет время, когда они не поместятся в этом помещении, будет новое помещение и тогда будет время, когда книжная полка будет вокруг земного шара, так скажем.
А.Г. Интернет.
П.Т. Прошло пару десятилетий, и нашли совершенно другое решение той проблемы, то есть компьютерная память.
Т.Ч. Но это же дела не меняет, это просто материально решилось иначе. Количество информации-то…
П.Т. Да, но я просто хотел сказать, что эти линеарные гипотезы, мне тогда в голову не приходило, что может быть другой носитель где-то, то, что огромное количество книг можно на одной маленькой пластинке записывать…
Т.Ч. Но это решает только геометрический вопрос, больше никакой.
П.Т. Нет, по-моему, это, я хочу сказать, что эти… такие гипотезы, что нечто уйдёт в бесконечность, эти книжные полки, до этого наступит новое решение, это касается и вопросов образования. Тут также накапливается бесконечное количество знаний, и каждый преподаватель думает, что вот именно то, что он преподаёт, это уж точно дети должны выучить. Это совсем бесперспективно, потому что держать детей в школе больше 12-ти лет невозможно. Я думаю, что одно направление, в котором дело пойдёт, это будут обучать не столько конкретным знаниям, сколько научному мышлению, опять-таки. Естественно, на примерах. Есть области, которые надо знать обязательно, какие-то области надо подробно знать, чтобы чувствовать, что…
Т.Ч. Например, логику.
П.Т. Да. Но и, скажем, тоже биологию или психологию. Надо иметь какое-то представление и способ мышления.
Поисковое поведение животных
22.07.03
(хр.00:50:02)
Участники:
Валентин Анатольевич Непомнящих – кандидат биологических наук, г. Борок, Ярославская обл.
Александр Аркадьевич Жданов – доктор физико-математических наук
Александр Гордон: Доброй ночи! Человек научился справляться с задачами, которые нужно поставить перед интеллектом «искусственным», пока в кавычках, пока в двойных кавычках, когда эти задачи хорошо формализованы. И этот, с позволения сказать, интеллект находится в хорошо организованной искусственной среде. И примеры тому, скажем, шахматные компьютеры, которые иногда выигрывают у людей, находясь с ними на одном уровне, скажем так, игры. Но когда речь идёт о создании машины или интеллекта, который должен поставить не чётко сформулированную формальную задачу, да ещё в среде, совершенно незнакомой, неформализованной, не искусственной, вот здесь мы пока сталкиваемся с огромными трудностями, а без этого об искусственном интеллекте, подобном человеческому, речи, конечно, идти не может. Это первый шаг, который нам предстоит сделать и с которым очень хорошо справляются все живые организмы на земле, включая бактерий. Почему у них это получается, а у нас пока не очень, мы сегодня и попробуем поговорить. Итак, почему?
Валентин Непомнящих: Да, действительно, почему? Представим себе такую задачу. На некую планету послан робот, точнее – автономный робот, то есть такой, который не нуждается в управлении со стороны человека. И пусть перед ним поставлена очень расплывчатая задача, которую на самом деле любой геолог поймёт: нужно пройти по некоторой территории и собрать геологические образцы – скажем, с наибольшим содержанием урана. При этом заранее никак не оговаривается, какое содержание следует считать большим, а какое – маленьким. Нужно это решить по ходу дела. Естественно, времени у робота мало, запасов энергии тоже мало, поэтому способности обучаться, если даже они есть у предполагаемого робота, мало чем ему помогут. Он должен на ходу пользоваться какими-то правилами поиска, которые можно назвать эвристиками. И здесь, конечно, имеет смысл посмотреть, как животные решают задачи поиска.
Есть такое насекомое – ручейник, личинка которого живёт на дне водоёмов и строит домик-трубку из песка и других материалов. Личинка фактически как раз решает задачу, о которой мы говорим. Трубку построить нужно очень быстро, потому что она нужна для дыхания и защиты от хищников. А если трубка повреждена частично, например, обрезана в эксперименте, то её нужно быстро восстановить, и у личинки нет времени разбираться и проводить исследование, как распределён материал в водоёме или в экспериментальной установке: где частицы материала более подходящие, а где – менее подходящие. Нужно просто собирать материал. Тем не менее, она с этой задачей справляется.
Я, собственно говоря, и хотел начать с того, чтобы представить вам этого ручейника. Я думаю, уже сейчас можно показать его домик, чтобы это было видно. Домик – это просто трубка. Ручейники того вида, о котором я говорю, могут делать домики из песка или из плоских частиц или каких-нибудь листьев. Здесь показан домик из песка, но на самом деле личинки «любят» частицы большего размера, чем песчинки, и при этом предпочитают плоские частицы. Причина такого предпочтения проста. Они сшивают частицы белковой нитью – паутиной. Естественно, чем больше частицы, тем меньше швов между ними, тем меньше затраты паутины, и меньше, следовательно, затраты энергии. Соответственно, личинкам желательно выбрать там, где они находятся в момент поломки домика, такие частицы, которые позволят им сэкономить эту нить.
Мы проводили эксперименты, чтобы изучить, как личинки это делают. Это чисто лабораторные эксперименты, но, поскольку личинка почти слепая и не использует зрение во время поиска, лабораторный эксперимент довольно хорошо имитирует то, что происходит в ручье.
Александр Жданов: В данном случае речь идёт о том, что ручейник должен найти крупную частицу, да?
В.Н. Да, он должен, говоря человеческим, антропоморфным языком, «решить», какие частицы достаточно крупные, а какие можно отбросить. Для того чтобы упростить наблюдение, мы использовали вместо песка скорлупки, кусочки яичной скорлупы, большие и маленькие. Ручейник должен был выбирать между этими скорлупками. Вот как он это делает. Поскольку ручейник слепой, он должен ощупать частицу передними ногами (можно показать, как это он делает) и оценить её размер, форму, гладкость и многие другие параметры. Мы будем говорить пока просто о размере и форме. В конце концов, ручейник цели достигает. Вот здесь показан готовый уже домик, он сделан, как видите, из частиц примерно одинакового размера.
А.Г. А вы предлагали ему совсем разные частицы? От очень мелких до очень больших?
В.Н. Да, разные. Они различались по площади в восемь раз (по длине стороны, соответственно, они различались меньше). Ручейник не всегда использует самые большие частицы, бывают ошибки, но в целом он умеет делать правильный выбор и очень быстро.
А.Г. Но поскольку время ограничено, это значит, что он не перебирает все песчинки или все кусочки для того, чтобы понять, какие частицы отбирать.
В.Н. Совершенно верно. Вот в этом-то как раз его секрет. Он может частицу взять и за угол, и за широкую сторону. И он должен в каждый момент времени решать, стоит ли с ней дальше возиться или нет. Полное обследование частицы занимает несколько минут. Ручейник должен каждую сторону ощупать, проверить, есть ли там грязь, есть ли там трещины. Но ручейники, как правило, этого не делают. Они могут частицу быстро покрутить и выбросить, а могут оценивать долго. Почему это происходит?
С точки зрения внешнего наблюдателя, ручейник генерирует своего рода гипотезы. Например, если ему попадается хорошая, большая частица и он прикрепит её к домику, а следующая частица будет плохая, то ручейник будет ощупывать её очень долго. Это выглядит так, будто ему хочется, чтобы частица была хорошая. Именно такое ощущение создаётся у наблюдателя. Ручейнику жалко расстаться с частицей. Потом он её всё равно выкинет, но время он потеряет. Вроде бы совершенно неразумное поведение. С другой стороны, тоже есть довольно неразумное поведение: когда ручейнику попадается мелкая частица, он её выбрасывает и начинает искать рядом другие частицы (напомню, что ручейник всё делает вслепую). Если теперь он найдёт крупную частицу, но схватит её за угол, то дальше уже не станет её проверять, а выбросит. То есть ручейник ведёт себя так, как будто он верит, что после плохого будет тоже плохое. Что получается?
А.Ж. Валентин Анатольевич, можно я здесь немножко прерву. Если смотреть на это насекомое как на распознающую систему, то здесь напрашивается такой аналог: процесс распознавания требует некоторого управления. Этот процесс можно прекратить раньше, можно продолжить измерительные эксперименты, но потратить лишнюю энергию на эти эксперименты – уменьшить риск ошибки, но потратить энергию. Всё время надо…
А.Г. Балансировать.
А.Ж. В этом заключается баланс: как бы поменьше сделать экспериментов, но как бы повысить риск правильного распознавания. Да?
А.Г. И где здесь оптимум тогда получается?
А.Ж. Вот то, что ручейник делает, показывает, что он как-то этот оптимум нащупал и эту стратегию он и проводит. Как в данном конкретном случае.
В.Н. Я бы сказал так (конечно, это моё личное мнение): можно, конечно, попытаться найти этот оптимальный баланс, используя те средства, которые есть у ручейника. Баланс между затратами энергии и использованием самых лучших частиц. Но я хочу напомнить, что у ручейника ситуация не такая, чтобы искать оптимум, ему нужно просто быстро найти приличные частицы. То есть, ему достаточно решить задачу удовлетворительно, а вовсе не оптимально. И, может быть, алгоритм поиска, о котором я говорил, не нацелен на оптимизацию поведения, а нацелен на то, чтобы просто решить задачу удовлетворительно.
А.Ж. То есть, если я правильно понимаю, речь идёт о том, что здесь мы наблюдаем не выработку алгоритма поиска, а применения алгоритма уже готового. Алгоритм сам, видимо, был найден раньше. Но этот алгоритм обеспечивает эффективный поиск нужной частицы. Да? То есть, результатом поиска является не алгоритм поведения, а результатом является поиск крупных частиц.
В.Н. Да, поиск в буквальном смысле.
А.Г. Насколько я понял, ключевым словом в вашем рассуждении было слово «сценарий», то есть ручейник действует по какому-то сценарию, выстраивает гипотезу о том, что будет дальше.
В.Н. Да, и делает это на основании, в общем-то, случайного события. Случайно ему попадается либо большая частица, либо малая. На основании этого краткого отдельного события, опять-таки антропоморфным языком говоря, ручейник выстраивает гипотезу о том, что и дальше будут попадаться однотипные (либо большие, либо малые) частицы. Это предсказание распространяется не только на одну следующую частицу, и результат этого предсказания получается такой: когда частицы разного размера смешаны совершенно случайно, то протокол эксперимента показывает, что прикрепления частиц и отказы от них следуют сериями. То есть, имеется тенденция повторять прикрепления одно за другим. А после отказа появляется тенденция повторять отказы.
Но, несмотря на это, общий результат поиска всё же таков, что ручейник всё-таки прикрепляет в основном приличные частицы. Почему он использует такой алгоритм, почему такие гипотезы выдвигает? Дело в том, что в природе не бывает случайного распределения чего бы то ни было. В реальных ручьях и плоские частицы и круглые, и мелкие и крупные не перемешаны случайно. Наоборот, однородные частицы собраны в определённых местах, в зависимости от течения, в зависимости от глубины. Поэтому, если ручейник где-то находит хорошие частицы, то в реальной жизни это означает, что здесь нужно остаться и искать дальше. Мы провели такой эксперимент, который бы при систематическом исследовании среды завёл бы ручейника в тупик. Просто он не смог бы найти то, что ему нужно. Можно показать, как это выглядело: экспериментальная установка, которая представляла собой просто небольшой коридор, который весь был засыпан песком, но на одном его небольшом участке вперемешку с песком были и скорлупки.
А.Ж. Валентин Анатольевич, правильно ли я понимаю, что речь идёт вот о чём. Алгоритм, который отрабатывает ручейник, построен не на той гипотезе, что искомые частицы распределены равномерно случайно, а он построен на гипотезе, что эти частицы в среде распределены неравномерно.
А.Г. Произвольно сгруппированы.
В.Н. Где-то они собраны…
А.Ж. Эти события, что называется, коррелируют между собой.
В.Н. Да, алгоритм поиска базируется на этой гипотезе, которую откуда-то знает ручейник, точнее, его поведение «знает». Мы, может быть, к этому ещё вернёмся, а в эксперименте происходит вот что.
Если бы ручейник попал за пределы участка со скорлупой и стал бы проверять каждую песчинку, то он увяз бы в песке и в буквальном, и в переносном смысле, потому что песчинок в коридоре – тысячи. Но ручейник действует иначе. Если он находится на участке со скорлупой и находит скорлупку, то он её приклеивает, а затем начинает ощупывать частицы вокруг себя. Есть два варианта результатов этого поиска. Либо он находит, в конце концов, ещё скорлупку, приклеивает её и процесс повторяется, а ручейник остаётся на месте. Или же ему выпадает такая неудача, что вместо скорлупки он находит несколько песчинок подряд. Сначала ручейник с ними долго возится, потому что, как я говорил, он «ждёт» чего-то от них. Потом это опробование каждой очередной частицы становится всё короче и короче, и, в конце концов, ручейник сдвигается с места и начинает ползти. И вот когда он натыкается на скорлупку во время такого движения, шансов на то, что он не то что её прикрепит, а даже просто станет её пробовать, осматривать, вернее, ощупывать, гораздо меньше. Даже если он и берёт скорлупку, то может её бросить тут же, не успев разобраться, а что это такое.
А.Г. Ничего хорошего он не ждёт от неё.
В.Н. Да, ничего хорошего не ждёт.
А.Ж. То есть, он уже чего-то ожидает, он уже какую-то гипотезу выдвинул.
В.Н. Что получается в результате? Ручейник может выйти за пределы участка со скорлупой и двигаться дальше по коридору. Ещё раз повторю, что если бы он начал пробовать песчинки в коридоре, то застрял бы там надолго. Но, как правило, ручейник их не пробует, а очень быстро пробегает этот коридор, потому что не ждёт ничего хорошего. Конечно, он иногда может взять какую-то песчинку и тут же бросить её. Иногда может даже приклеить, если она более плоская, чем другие. Но это исключения, и ручейник, в конце концов, возвращается на участок со скорлупой. И здесь, когда он натыкается на скорлупку, то чаще всего её берёт. Но, тем не менее, из-за того что он двигается и «ничего хорошего не ждёт», ручейник может и проскочить несколько раз этот участок. Но опять-таки, эксперименты с десятками личинок показывают, что они в целом, строят свои домики на этом участке и строят из скорлупок. Другими словами, эта не очень, казалось бы, рациональная стратегия предсказания по единичным событиям позволяет ручейникам в целом выигрывать.
Мы это проверяли, построив математическую модель, где правила поведения, о которых я говорю, были заложены в программу. И модель подтвердила, что этих правил достаточно для того, чтобы ручейники собирались и строили именно на том участке, где есть скорлупки. Здесь, естественно, возникает такой вопрос: когда мы моделируем, мы вводим правила, но это ничего не говорит о механизме управления поведением, то есть о том, откуда берутся эти правила. Единственное, что можно здесь сделать, с моей точки зрения, – это предложить следующую аналогию.
Есть динамические системы, так называемые нелинейные системы (одна из них здесь изображена), поведение которых может быть очень сложным – несмотря на то, что сама система описывается очень простым уравнением. В зависимости от величины параметра «А» (показано на рисунке), переменная в уравнении может изменяться сложным образом, как периодически, так и не периодически. И поведение системы оказывается одновременно и случайным, и предсказуемым. Оно случайно в том смысле, что невозможно предсказать, в какой момент времени произойдёт переход от больших значений переменной к малым значениям. В то же время, поведение системы упорядочено: мы видим, что большие и малые значения идут друг за другом сериями.
Здесь есть аналогия с ручейником, у которого реакции тоже повторяются сериями. Пусть эта аналогия поверхностная, но пока я буду на ней, так сказать, настаивать. Далее, если некий внешний сигнал (некая положительная величина) прибавляется к параметру «А», то затем переменная надолго увеличивается, несмотря на то, что сигнал – коротенький. Это – ещё одна аналогия с ручейником: одна частица может надолго изменить его поведение. Конечно, такого простого уравнения недостаточно для того, чтобы моделировать поведение целого ручейника. Всё-таки его поведение сложнее: он и берёт частицы, и крутит их.
А.Ж. Но вы сейчас моделируете какую-то одну составляющую.
В.Н. Да, и мы решили пойти несколько более простым путём: моделировать не ручейника, а некую условную инфузорию, которая движется в условном пространстве и находит там участки с пищей. Пища – это просто химические вещества, которые инфузория может в буквальном смысле всасывать. Никакого сложного пищевого поведения здесь не нужно. Когда на эту инфузорию не действуют никакие сигналы, то её поведение определяется единственным уравнением, а траектория её движения получается такая, что в ней чередуются почти прямые пробеги с петлями. Эти петли (опять-таки с точки зрения внешнего наблюдателя), можно интерпретировать как отыскивание какого-то места в пространстве.
А.Ж. То есть, идёт такой локальный поиск, который чередуется с крупными перемещениями в попытке найти какое-то или более богатое «месторождение».
В.Н. На данном этапе, когда нет никаких сигналов, искать, собственно говоря, нечего. Я хотел бы подчеркнуть, что это поведение, чередование таких спонтанных поисков на одном месте…
А.Ж. Очень красивая картинка. Этот спонтанный поиск, эти вот петли, узлы такие. И длинные эти пробеги. Очень красиво.
В.Н. Это поведение на самом-то деле типично для многих животных. И не только инфузорий, но и для червей, для насекомых – для таких животных, не слишком крупных, для которых можно построить экспериментальную установку, в которой нет никаких сигналов, освещение и все внешние факторы распределены равномерно.
Теперь мы вводим в это пространство пищу: у нас есть три участка, на слайде это можно показать. На одном участке концентрация пищи маленькая, на другом – большая, а между ними находится пустой участок. И вот наша условная инфузория начинает поиск с бедного участка. В какой-то момент ей не везёт, не попадается пищевых веществ. В результате инфузория перестаёт описывать петли на этом участке и начинает двигаться прямо. Здесь работает простая система, показанная раньше, которая из одного режима поведения переходит в другой режим: вместо больших значений переменной, которые обеспечивают поворот, теперь наблюдаются малые значения, соответствующие прямому пробегу. Поэтому инфузория теперь летит прямо, пролетает пустое место и попадает на богатый участок. Конечно, она может и уйти из богатого участка. Однако на богатом участке пища сосредоточена плотнее, там меньше вероятность серии неудач, и поэтому, в конце концов, инфузории скапливаются на богатых участках.
Так, собственно, поступают и реальные инфузории – я хотел бы подчеркнуть сходство поведения модели с реальными организмами. Мало того, с помощью такой простой системы можно добиться ещё более богатого поведения, если добавить к ней разные сенсоры, разные органы чувств. Вот на следующем слайде, например, показана ориентация…
А.Ж. А можно остановиться на этом слайде на секундочку. Хочется обратить внимание на то, что эта картинка характерна не только для инфузорий, для рассматриваемых здесь объектов, а это вообще житейская картина. Когда мы обсуждали в передаче наши проблемы, возникла очень хорошая аналогия с человеком, который тоже ищет, где лучше и где глубже. Допустим, он ищет в пределах своего города, находит всё, что может, а когда решает, что всё здесь уже найдено, то он совершает какую-то миграцию.
А.Г. Скачок в пространстве.
А.Ж. Да. И там опять начинает локальный поиск. После чего может последовать опять такой длинный бросок куда-то. Очень интересно. То есть, этот алгоритм реализуется, видимо, на многих, на разных уровнях управления, для разных объектов, и мне он кажется очень интересным.
В.Н. Вот здесь я хотел бы добавить, что, конечно, этот алгоритм, это порождение гипотез действительно аналогично у разных организмов. Но это не значит, что механизм порождения гипотез всегда один и тот же. Пока что мы рассматриваем поведение очень простенького уравнения. Вся проблема-то в том, что в таком виртуальном пространстве, такую виртуальную инфузорию довольно легко имитировать. А вот когда речь идёт о животном уже с нервной системой, сложной, которое не просто двигается, но ещё манипулирует предметами, решает задачу не просто поиска в физическом пространстве, а поиска в каком-то пространстве возможностей, всё становится сложнее. Понятно, что в этих случаях работает более сложная система. Аналогией здесь, может быть, полезно руководствоваться, но сама аналогия не является моделью.
Я продолжу, чтобы закончить с этой инфузорией. Здесь показана её ориентация на источник запаха. Источник показан кружком, а инфузория двигается к нему такими вот зигзагами. Почему так происходит? Дело в том, что мы ввели в модель сенсор, который воспринимает разницу между раздражением на данный момент времени и предыдущий момент времени. Чем больше эта разница, тем больше подавляется тенденция модели к поворотам. Собственно говоря, таков же механизм ориентации у реальных инфузорий и бактерий. Что делает наша инфузория? Вместо того чтобы всё время корректировать свой путь к источнику запаха, она генерирует гипотезы, хотя это звучит как преувеличение. Вот пример: если разница между последовательными раздражениями положительна, то инфузория бросается прямо вперёд, хотя это может увести её в сторону от источника запаха.
А.Г. «Что-то пахнет, по-моему, там». И рванула, да?
В.Н. Да. И она опомнится только тогда, когда рассогласование между направлением движения и целью будет очень сильным. Затем она скорректирует своё движение, может быть, опять неточно. Но, в конце концов, она приходит к этому источнику. Расчёты показывают, что на самом деле такое поведение экономнее и быстрее, чем если бы она всё время пыталась…
А.Г. Идти по прямой к этой цели.
В.Н. Да. Она просто тратила бы время на постоянную коррекцию своего движения. Кроме того, модель также предполагала, что во время поворота, как любое физическое тело, инфузория движется медленнее, чем когда она летит прямо. Но это…
А.Ж. А вот во время такого большого броска, она уже не принимает решений, да? То есть она просто отрабатывает уже принятое решение совершить бросок.
В.Н. Да, и в этой модели, в этой динамической системе происходит это очень просто, потому что сигнал подавляет переменную, управляющую поворотом, так что инфузория не может повернуть. А когда наступает сильное рассогласование, сигнал становится отрицательным. И тогда система начинает снова работать. Она снова начинает искать. И снова выбирает какое-то направление.
Когда инфузория достигает цели, она там не останавливается, а начинает обыскивать окрестности источника запаха (на этом рисунке это, может быть, не очень сильно выражено). Результат этого поведения такой: если в пространстве есть много других источников, и некоторые издают более сильный запах, то у инфузории есть шанс найти другой, лучший источник.
Этот способ ориентации, на самом деле, существует и у реальных бактерий, они ориентируются с помощью именно таких бросков. Здесь серой полосой показан разрыв в градиенте запаха, как и бывает в реальной жизни. Но наша инфузория тоже проскакивает разрыв…