θ).
Предложенная Рейхенбахом запись для эгоцентрических слов при всей ее
кажущейся парадоксальности полезна в том отношении, что в ней явно
раскрываются скрытые в значении каждого из этих слов ссылки на данный
конкретный акт речи (передачу сообщения θ), вне которого понять их
нельзя. Проблема их определения сводится в простейших случаях к проблеме
выработки логических средств записи прямой речи.
Рейхенбах приходит к выводу, что в определенном смысле эгоцентрические
слова -- это псевдослова, так как разные случаи их употребления не
равнозначны. Значение этих слов может быть объяснено не на самом
естественном языке, а лишь на другом языке (метаязыке), на котором мы
описываем этот естественный язык. Но и на этом метаязыке мы можем только
описать тот отрывок прямой речи, ссылка на который определяет данное
употребление эгоцентрического слова. Такое логическое прояснение смысла
эгоцентрических слов весьма важно и для исследования некоторых парадоксов,
занимавших уже умы мыслите, лей Греции, а в XX веке оказавшихся одной из
главных проблем математической логики.
Парадокс лжеца состоит в одновременной истинности и ложности следующего
утверждения: "Это утверждение, которое я сейчас делаю, ложно". Г. Вейль
заметил, что в естественном языке парадокс зависит от эгоцентрических слов
это, я, сейчас, которые взрывают смысл высказывания [127]. В этом смысле
можно согласиться с известной формулировкой логика Пеано -- создателя весьма
совершенных способов построения искусственного логического языка,
оригинальность которых однако, долгое время затрудняла понимание работ Пеано
и журнала, издававшегося им на этом языке Пеано о другом отчасти сходном
парадоксе еще в начале нашего века сказал, что "он относится не к
математике, а к лингвистике" Но именно математика в XX веке много сделала
для понимания сути парадоксов тем самым помогая уяснить и лингвистическою их
сторону.
Современная формулировка парадокса лжеца совпадает с афоризмом Тютчева:
"Мысль изреченная есть ложь" [55] В высказывании "Я лжец" в явном виде
парадокс еще не выступает (потому что лжец однажды и мог бы сказать правду)
Но поскольку к каждому утверждению θ в естественном языке ρ силу
его субъективности можно добавить "Я утверждаю, что Θ", это
высказывание по языковым правилам оказывается равнозначным "Я утверждаю, что
я лжец".
Из этого видно, что в естественном языке парадокс вызывается
субъективностью языка, благодаря которой в самом высказывании содержатся
отсылки к нему самому -- в эгоцентрических словах. Поэтому и способ явной
логической записи этой особенности эгоцентрических слов, предложенный
Рейхенбахом, существен для уяснения причин возникновения парадоксов в
высказываниях на естественном языке.
Возможность построения такой машины, которая могла бы употреблять
"эгоцентрические слова" ("переключатели") так же, как их употребляют люди,
обсуждалась Расселом [128, с. 105-- 106]. По мысли Рассела, машина, которая
добавляла бы к словесному описанию испытываемых ею воздействий слово это
(это-- красный цвет, это -- синий цвет и т. п.), не воспроизводила бы
существенных черт человеческого речевого поведения В самом деле, в данном
случае это -- всего лишь добавление к последующим словам. По словам Рассела,
с таким же успехом можно было бы построить машину, которая бы добавляла к
тем же обозначениям цветов бессмысленное слово -- абракадабра
красный цвет, абракадабра синий цвет и т. п. [128, с. 105]. Можно
заметить, что то же самое справедливо и в отношении той модели естественного
языка, согласно которой к каждому высказыванию можно добавить предшествующее
ему Я утверждаю,
что...
По Расселу, машина приблизилась бы к моделированию человеческой речевой
деятельности, если бы через некоторое время после первого опыта машина могла
бы описать его словами То был красный цвет [128, с. 105] Соответствующий
физиологический механизм, лежащий в основе употребления слова то человеком,
Рассел описывает как отсрочку словесной реакции на стимул, оговариваясь (с
полным на то основанием), что эта схема еще слишком груба
В качестве простейшего примера, противоречащего схеме Рассела, можно
сослаться на распространенные у многих народов анекдоты о тугодумах, которые
не сразу реагируют на смешной рассказ.
Неважно, каков реальный промежуток физического времени между стимулом
(в этом случае -- смешным рассказом) и реакцией (смехом или словами
тугодума). Важно, воспринимает ли говорящий этот стимул как актуальный для
себя в момент, когда он на него реагирует Поэтому описание эгоцентрических
слов, в которых отчетливо проявляется субъективность естественного языка, в
терминах строго объективных (например, с помощью интервала физического
времени между стимулом и словесной реакцией на этот стимул) не соответствует
сути описываемого явления. Для понимания языкового времени (как и вообще
переключателей -- эгоцентрических слов) оказывается необходимым учитывать и
различия между правым полушарием, ориентире ванным на настоящее, и левым,
занятым планированием будущего.
Вообще оказалось недостаточным рассмотрение естественного языка как
словесных реакций человека на стимулы внешней среды, особенно популярное в
американской науке середины нашего века Это убедительно показал Н. Хомский.
Еще раньше Н. А. Бернштейн заметил, что язык не может быть описан с помощью
подобной упрощенной схемы.
Н. А Бернштейн обратил внимание на значение таких элементов языка
(названных им "словами-операторами", что согласуется с пониманием термина
"оператор" в искусственных языках), которые сами по себе ничего не
обозначают, но указывают на различные отношения в речи. Наличие таких слов в
языке, по мысли Н. А. Бернштейна, противоречит замыслу описать его просто
как множество элементов Ε (сигналов), отображающих некоторые другие
множества / (сигналов стимулов, происходя
щих из внешней среды). В качестве примеров фраз, не поддающихся такому
объяснению, Н. А. Бернштейн приводил высказывания, содержащие
эгоцентрические слова: ты мыслишь, мы помыслим и т. п. [18].
По мысли Н. А. Бернштейна, развитой потом во многих работах наших
ученых, сам естественный язык представляет собой модель мира.
Эгоцентрические слова предполагают такую модель, где в центре при разговоре
находится сам говорящий.
ПОЧЕМУ СЛОВО "ЭТОТ" НЕПОНЯТНО РОБОТУ
В ходе разговора человека с роботом, поднимающим кубики, в Лаборатории
искусственного интеллекта, произошел такой обмен репликами. На приказание
Grasp the pyramid (Схвати эту пирамиду) робот, оставшийся бездеятельным,
возразил: / don't understand, which pyramid you mean (Я не знаю, какую из
пирамид ты имеешь в виду). Робот ничего не будет делать до тех пор, пока
человек не объяснит ему, какую из трех пирамид (красную, синюю или зеленую)
он должен взять. Определенный артикль the в английской фразе (как и
указательное местоимение эту в русском переводе) -- эгоцентрическое слово:
говорящему ясно, какую из пирамид он имеет в виду, в устном разговоре он
может пояснить это жестом, показать на предмет, но роботу эгоцентрическое
слово непонятно.
В этом разговоре машина понимает только те случаи употребления
определенного артикля, где он относится к предметам, в данной ситуации
единственным. По этой же причине машина правильно употребляет и понимает
местоимения I (я) и you (вы), потому что они в этой предельно упрощенной
ситуации всегда относятся только к самой машине и к одному и тому же
человеку, с ней говорящему. При таком употреблении местоимений,
принципиально отличном от обычного их использования, они аналогичны
собственным именам. Робот еще находится на уровне мальчика, называющего себя
"Петя" ("Петя играет" и т. п.). Робот умеет только переворачивать I (я) и
you (вы), употребляя их то по отношению к себе, то по отношению к своему
единственному собеседнику. Но в реальном общении I и you могут относиться к
разным собеседникам, иногда многочисленным.
Для того, чтобы машина правильно понимала естественный язык, должны
были бы быть, построены правила "переключения" всех эгоцентрических слов и
форм на ситуацию каждого данного акта речевого общения. Каждый
"индивидуальный знак" (θ) по-новому определяет другие зависящие от него
по своему значению эгоцентрические слова.
В рассуждении Рассела интересна мысль о роли времени и памяти для
моделирования значений эгоцентрических слов. Можно попытаться выяснить,
сколько таких индивидуальных знаков θ или высказываний хранится обычно
в памяти человека. Приблизительную оценку этой величины может дать то, что
например, каждый школьник помнит обычно свои разговоры с товарищами и их
ответы на уроках за последние дни, а лектор помнит вопросы, заданные ему
после лекции или на семинаре. Как видно из текстов евангелий и из мемуарной
литературы нового времени, при большом внимании к другому человеку можно
запомнить буквально все его основные высказывания на протяжении очень
длительного времени. По отношению не только к близким, но и к далеким
знакомым, употребление эгоцентрических слов в последующих актах речи зависит
от сохраняющихся в памяти предшествующих θ. Достаточно в качестве
простого примера сослаться на то, что люди всегда помнят, с кем они на Вы, с
кем на ты, и переход с одной формы обращения на другую отмечается обычно
социальным обрядом (например, пьют на брудершафт).
Если воспользоваться сравнением языка с шахматной игрой, к которому
часто прибегают математики и логики вслед за Гильбертом и лингвисты вслед за
Соссюром, то употребление языка человеком в обществе можно было бы сравнить
со многими партиями, разыгрываемыми гроссмейстерами одновременно на разных
досках. Хотя в реальном языковом общении каждый следующий "ход" в одной из
партий (каждый разговор с новым собеседником) может и отделяться большим
временем от всех предыдущих, в памяти эти партии (разговоры) должны
храниться одновременно (все ходы записываются). Поэтому модель сеанса
одновременной игры на разных досках и модель языкового общения в основном
тождественны. Благодаря смысловым особенностям эгоцентрических слов человек
обычно справляется с такой задачей.
Приведенная выше схема разговора робота, играющего в кубики, с
человеком [115] содержит предельное упрощение за счет сведения обоих
собеседников к паре постоянных партнеров. Поэтому эгоцентрические слова (я,
ты) в такой схеме :водятся к ярлыкам (собственным именам), тождественным
одному из партнеров. Если же представить себе реальные возможности общения
на естественном языке многих людей с вычислительной машиной в режиме
разделения времени (когда машина может одновременно обмениваться сообщениями
с целым рядом потребителей), то одну из существенных трудностей при общении
может представить понимание машиной эгоцентрических слов.
При общении машины со многими людьми практически существенной задачей
может оказаться различение каждого участвующего в обмене информацией.
Человек различает своих собеседников не благодаря эгоцентрическим словам, а
вопреки им (к каждому из собеседников приложимы одни и те же личные
местоимения). При опознании индивидуального человека вычислительной машиной
были бы полезны не личные местоимения, а способы типа "собственной песни"
или позывных, как каждый из нас умеет отличить знакомых по голосу, например
при разговоре по телефону; согласно новейшим экспериментальным данным, эта
функция выполняется "неречевым" -- правым полушарием [25]; моделирование ее
на автомате -- анализаторе речи наталкивается на значительные трудности
[30]. Высказывания, начинающиеся с я, означают всего лишь "источник данного
сообщения" и не могут способствовать опознанию данного лица иначе как путем
его отождествления с автором или источником сообщения.
Трудности (по-видимому, на сегодняшний день едва ли легко преодолимые),
которые возникли бы при попытке обучения машины пониманию предложений,
содержащих эгоцентрические слова, можно было бы пояснить на примере
изречения Декарта я мыслю, следовательно, я существую. Логический анализ
этого высказывания приводит к выводу, что оно содержит квантор существования
( $ ): существует мысль. Очевидно, изречение Декарта могло бы
быть сообщено машине (или проанализировано ею самой) в форме: В источнике
настоящего сообщения существует мысль, следовательно, источник настоящего
сообщения существует. В этой форме сохранено эгоцентрическое слово
"настоящий" ("настоящее сообщение" употребляется в смысле индивидуального
знака -- θ). Можно себе представить, что каждое вводимое в машину
сообщение нумеруется, т. е. индивидуальные знаки хранятся в памяти,
закодированные соответствующими числами (это в точности соответствует идее
Рейхенбаха, предлагавшего считать номер каждого θ индивидуальным знаком
для этого θ).
Пусть изречение Декарта закон ровано как θi. Тогда само сообщение
θl должно быть понято следующим образом: В источнике сообщения θi
существует мысль, следовательно, источник сообщения θi существует
(принципы формализованного изложения этой идеи намечены еще в XVII веке
Спинозой в книге "Основы философии Декарта, доказанные геометрическим
способом").
Для обучения машины естественному языку в нее необходимо ввести
некоторые предпосылки понимания значения слов (другой возможностью является
формирование самой машиной системы
таких предпосылок, иначе говоря, определенной модели мира, по некоторым
вводимым в нее исходным данным). К этим предпосылкам безусловно должно
относиться и предположение, что у каждого вводимого в машину сообщения есть
некоторый источник. В таком случае вторая половина изречения θi
автоматически следует из самого наличия сообщения θi, введенного в
машину. Что же касается первой половины, его интерпретация машиной зависит
от понимания слова мысль. Если, как это представляется возможным, это слово
понимается как равнозначное "переработке информации", то первая половина
сообщения θi будет понята как указание на наличие переработки
информации б самом источнике сообщения θi. Это, по-видимому, также
должно соответствовать некоторым предпосылкам понимания языка. В той мере, в
какой сообщение θi может быть понято машиной, оно все оказывается
выводимым из предпосылок понимания языка и в этом смысле не несет никакой
новой информации.
СООБЩЕНИЕ И ЕГО АВТОР
Определение смысла эгоцентрических слов невозможно без отождествления
источника данного сообщения θ с конкретным лицом. Но само это
отождествление происходит чаще либо через это же сообщение θ (как в
примере с изречением Лютера, разобранным Рейхенбахом), либо через
предшествующие сообщения, исходившие от того же источника. Большинство имен
незнакомых ему лично людей, известных современному интеллигентному человеку,
он определяет как авторов определенных сочинений (характерны обычные
определения в кроссвордах: "Роман русского писателя XIX века" и т. п.).
В "Ревизоре" Гоголя Хлестаков в сцене хвастовства перед городничихой и
ее дочерью приписывает себе множество популярных в те годы литературных
сочинений:
"Хлестаков... Все это, что было под именем барона Брамбеуса, "Фрегат
Надежды" и "Московский телеграф"... все это я написал.
Анна Андреевна. Скажите, так это вы были Брамбеус?
Хлестаков. Как же, я им всем поправляю статьи. Мне Смирдин дает за это
сорок тысяч.
Анна Андреевна. Так, верно и "Юрий Милославский" ваше сочинение?
Хлестаков. Да, это мое сочинение.
Анна Андреевна. Я сейчас догадалась.
Марья Антоновна. Ах, маменька, там написано, что это господина
Загоскина сочинение.
Анна Андреевна. Ну вот: я и знала, что даже будешь спорить.
Хлестаков. Ах да, это правда, это точно Загоскина; а есть другой "Юрий
Милославский", так тот уж мой.
Анна Андреевна. Ну, это, верно, я ваш читала..."
Рассмотрим языковые высказывания двух видов: Я это написал
(θι) и Загоскин -- автор "Юрия Милославского" (θ2). Первое
сообщение (θ1) утверждает, что x -- источник сообщения θ1, ранее
был источником некоторого письменного сообщения θk (обозначено
эгоцентрическим словом это). Во втором предложении (θ2) утверждается,
что лицо у, носящее собственное имя Загоскин, является автором письменного
сообщения θl, известного под заглавием "Юрий Милославский". Сходство
обоих высказываний, θ1 и θ2, заключается в том, что оба они
утверждают связь автора (источника) с некоторыми сообщениями. Различие между
ними состоит в эгоцентрическом характере высказывания θ1. Каждое из
этих высказываний может быть записано на логическом языке с помощью
йота-оператора: обозначая автора (источник сообщения) как А, можно записать
Различие между θ1 и θ2 обнаруживается в логической записи, из
которой видно, что в θ1) утверждается двойное авторство x -- по
отношению к θk и к θ1. Β θ2 утверждается, что существует
один и только один индивид, который является автором θl -- "Юрия
Милославского" и этот индивид тот же самый, что и Загоскин (на специальном
языке математической логики можно сказать, что у имен Загоскин и автор "Юрия
Милославского" -- один денотат). Хлестаков сперва нарушает эту предпосылку
правильного понимания языка, а потом выходит из положения, объявляя, что
есть два разных романа с таким названием, а у них два автора: у одного
(θl) -- Загоскин, а у другого (θk) -- сам Хлестаков.
Следует подчеркнуть, что исключительная сложность и величина сообщения
типа Θ, составляющего целую книгу, делает в принципе невозможной в
логической записи передачу всего такого сообщения в знаковых кавычках width=54 height=18 src="http://lib.ru/NTL/KIBERNETIKA/IWANOW_W/odd_even_070.jpg"> т. е. передачу
прямой речи. Это касается не только письменного сообщения, но и
достаточно обширных устных. Следовательно, утверждения авторства относятся
обычно не к самим сообщениям, а к другим индивидуальным объектам, их
обозначающим (к заглавиям на письменном естественном языке).
Той же практической невозможностью повторить все сообщение в целом
объясняется то, что в библиотечных каталогах
большинстве справочно-библиографических изданий письменные сообщения
кодируются условно их заглавиями и авторами. Именно это и создает те особые
трудности переработки растущего множества научных изданий, для частичного
преодоления которые издаются реферативные журналы и разрабатываются
информационно-логические машины.
ПАМЯТЬ КУЛЬТУРЫ
Современное общество характеризуется наличием специальной памяти
коллектива (в частности, книгохранилищ, архивов, дискотек, фильмотек и т.
п.). В ней хранится огромное число письменных и иных сообщений с указанием
их авторов. Количество и сложность всего этого массива сообщений вызвало к
жизни документалистику -- дисциплину, изучающую этот массив и способы его
организации (в документалистику в широком смысле входит библиотечное и
архивное дело и книговедение).
Ученый, работающий в какой-либо из бурно развивающихся областей
современного знания, решает задачу, отчасти сходную с описанной выше моделью
сеанса игры со многими партнерами (в режиме разделенного времени). Но число
партий, разыгрываемых ученым, обычно существенно больше, чем при
повседневном устном общении. Он должен постоянно следить за потоком научных
сообщений в своей области и нескольких (а иногда и многих) пограничных с ней
областях.
Трудности усугубляются разнообразием языков, на которых эти сообщения
печатаются, многочисленностью (иногда и редкостью) соответствующих журналов.
Поэтому естественна попытка облегчить труд ученого: часть этой непосильной
вспомогательной работы перелагается на вычислительную машину.
Предполагается, что сообщения в какой-либо определенной области (например, в
органической химии, где существенную трудность может представить обнаружение
вновь синтезированного соединения в списках уже ранее описанных) могут
храниться в информационно-логической машине (или комплексе таких машин), к
которой ученый может по мере необходимости обращаться за справками. Число
конкретных достижений за 20 с лишним лет напряженной работы в этой области
еще не очень велико, хотя в ряде стран машины помогают уже в обработке
патентов и в решении некоторых других задач, связанных с поиском информации
в большом массиве документов. Уже начинают выходить научные журналы
(например, американский "Журнал вычислительной лингвистики"),
приспособленные к обработке на машинах.
Размеры всей информации, накопленной в печатных изданиях
и рукописях человечеством, до настоящего времени оцениваются примерно
как 1014 бит (двоичных единиц информации). Этот расчет,
предложенный чл.--корр. АН СССР Η С. Кардашевым [129], основан на том,
что общее число всех печатных изданий и рукописей на Земле составляет около
108; в каждой из книг содержится в среднем 106 бит
(что равно среднему объему оперативного запоминающего устройства современной
вычислительной машины). Однако несомненно, что значительная часть этой
информации может быть представлена существенно более сжатым образом, что в
первом приближении дает величину порядка 1011 бит.
Число нейронов в мозге каждого человека превышает 1010, а
согласно новейшим данным число нейронных соединений суще ственно превышает
число самих нейронов, доходя до 1015-- 1016 Поэтому
современные работы по оценке информации, накопленной всем человечеством,
приводят к неожиданному и парадоксальному результату: вся эта информация в
принципе может быть усвоена и переработана мозгом одного человека.
Но эта возможность, теоретически существующая, реализуется в известной
мере только у немногих людей Для более широкой реализации этих потенциальных
возможностей необходима более разумная организация всею комплекса наших
знаний.
Эта же задача ставится и при использовании вычислительных (в частности,
информационно-логических) машин для хранения научной информации. Ясно,
например, что оперативную память машины объемом порядка 10е бит
было бы неразумно занимать одной книгой, которая при введении ее в машину на
естественном языке заполнила бы весь этот объем. Между тем для переработки
научной информации этот наименее экономный способ оказывается и наименее
эффективным.
Машина может успешно оперировать с этой информацией в случае ее
представления на особом искусственном языке, который вместе с тем позволил
бы и гораздо более сжато хранить в машине весь этот объем данных. Задача,
следовательно, сводится к разумной перекодировке накопленного массива
информации: книгу имеет смысл держать не в виде той (буквенной) информации,
которая характерна для левого полушария (а именно количество этой информации
и можно оценить в битах), а в виде комплекса значений, специфических для
правого полушария (и представляющих существенные трудности для
количественной оценки).
Основная трудность усвоения всей этой информации как машиной, так и
одним человеком, заключается в том, что до сих пор она сохранилась и
передавалась не в виде единой системы знаний, а в качестве суммы текстов
разных авторов. Научная ин
формация в библиотеках хранится в виде множества сообщений θ1,
θ2,.. θn, при n→ ∞), принадлежащих определенным
авторам. Внутри каждого такого сообщения содержится обычно значительное
число повторений (в пересказе или в цитатах) предшествующих сообщений. Текст
θm содержит обычно ссылки на тексты θj, θj+1, ... θm-1
или частичное (а иногда и полное) повторение этих текстов. В некоторых
гуманитарных науках сообщения о предшествующих сообщениях составляют
существенную часть всего научного текста; то же самое относится и к обзорным
статьям или монографиям по любой области знания
Уже этим обусловливается значительное число повторов, делающих
существенную долю научных текстов избыточной. Повторы нельзя считать
оправданными даже и с точки зрения помехоустойчивости сообщений при их
передаче во времени: история науки показывает, что чаще всего такие
повторяющиеся от работы к работе (и в этом смысле помехоустойчивые, легко
доходящие до следующих поколений) утверждения позднее оказываются
устаревшими (а в конечном счете ложными), тогда как единичные (и не
повторяющиеся в других трудах) высказывания в дальнейшем могут подтвердиться
и найти развитие.
В качестве примера можно вспомнить о судьбе многочисленных идей
Лейбница, который, по словам Винера, был предшественником кибернетики, и,
как теперь признается многими,-- предвестником также и современной
математической логики, семиотики, новейшей лингвистики. Большинство наиболее
заме чательных мыслей Лейбница частично оставались в рукописи еще долгое
время после его смерти, и лишь недавно -- больше, чем через 200 лет после
Предложенная Рейхенбахом запись для эгоцентрических слов при всей ее
кажущейся парадоксальности полезна в том отношении, что в ней явно
раскрываются скрытые в значении каждого из этих слов ссылки на данный
конкретный акт речи (передачу сообщения θ), вне которого понять их
нельзя. Проблема их определения сводится в простейших случаях к проблеме
выработки логических средств записи прямой речи.
Рейхенбах приходит к выводу, что в определенном смысле эгоцентрические
слова -- это псевдослова, так как разные случаи их употребления не
равнозначны. Значение этих слов может быть объяснено не на самом
естественном языке, а лишь на другом языке (метаязыке), на котором мы
описываем этот естественный язык. Но и на этом метаязыке мы можем только
описать тот отрывок прямой речи, ссылка на который определяет данное
употребление эгоцентрического слова. Такое логическое прояснение смысла
эгоцентрических слов весьма важно и для исследования некоторых парадоксов,
занимавших уже умы мыслите, лей Греции, а в XX веке оказавшихся одной из
главных проблем математической логики.
Парадокс лжеца состоит в одновременной истинности и ложности следующего
утверждения: "Это утверждение, которое я сейчас делаю, ложно". Г. Вейль
заметил, что в естественном языке парадокс зависит от эгоцентрических слов
это, я, сейчас, которые взрывают смысл высказывания [127]. В этом смысле
можно согласиться с известной формулировкой логика Пеано -- создателя весьма
совершенных способов построения искусственного логического языка,
оригинальность которых однако, долгое время затрудняла понимание работ Пеано
и журнала, издававшегося им на этом языке Пеано о другом отчасти сходном
парадоксе еще в начале нашего века сказал, что "он относится не к
математике, а к лингвистике" Но именно математика в XX веке много сделала
для понимания сути парадоксов тем самым помогая уяснить и лингвистическою их
сторону.
Современная формулировка парадокса лжеца совпадает с афоризмом Тютчева:
"Мысль изреченная есть ложь" [55] В высказывании "Я лжец" в явном виде
парадокс еще не выступает (потому что лжец однажды и мог бы сказать правду)
Но поскольку к каждому утверждению θ в естественном языке ρ силу
его субъективности можно добавить "Я утверждаю, что Θ", это
высказывание по языковым правилам оказывается равнозначным "Я утверждаю, что
я лжец".
Из этого видно, что в естественном языке парадокс вызывается
субъективностью языка, благодаря которой в самом высказывании содержатся
отсылки к нему самому -- в эгоцентрических словах. Поэтому и способ явной
логической записи этой особенности эгоцентрических слов, предложенный
Рейхенбахом, существен для уяснения причин возникновения парадоксов в
высказываниях на естественном языке.
Возможность построения такой машины, которая могла бы употреблять
"эгоцентрические слова" ("переключатели") так же, как их употребляют люди,
обсуждалась Расселом [128, с. 105-- 106]. По мысли Рассела, машина, которая
добавляла бы к словесному описанию испытываемых ею воздействий слово это
(это-- красный цвет, это -- синий цвет и т. п.), не воспроизводила бы
существенных черт человеческого речевого поведения В самом деле, в данном
случае это -- всего лишь добавление к последующим словам. По словам Рассела,
с таким же успехом можно было бы построить машину, которая бы добавляла к
тем же обозначениям цветов бессмысленное слово -- абракадабра
красный цвет, абракадабра синий цвет и т. п. [128, с. 105]. Можно
заметить, что то же самое справедливо и в отношении той модели естественного
языка, согласно которой к каждому высказыванию можно добавить предшествующее
ему Я утверждаю,
что...
По Расселу, машина приблизилась бы к моделированию человеческой речевой
деятельности, если бы через некоторое время после первого опыта машина могла
бы описать его словами То был красный цвет [128, с. 105] Соответствующий
физиологический механизм, лежащий в основе употребления слова то человеком,
Рассел описывает как отсрочку словесной реакции на стимул, оговариваясь (с
полным на то основанием), что эта схема еще слишком груба
В качестве простейшего примера, противоречащего схеме Рассела, можно
сослаться на распространенные у многих народов анекдоты о тугодумах, которые
не сразу реагируют на смешной рассказ.
Неважно, каков реальный промежуток физического времени между стимулом
(в этом случае -- смешным рассказом) и реакцией (смехом или словами
тугодума). Важно, воспринимает ли говорящий этот стимул как актуальный для
себя в момент, когда он на него реагирует Поэтому описание эгоцентрических
слов, в которых отчетливо проявляется субъективность естественного языка, в
терминах строго объективных (например, с помощью интервала физического
времени между стимулом и словесной реакцией на этот стимул) не соответствует
сути описываемого явления. Для понимания языкового времени (как и вообще
переключателей -- эгоцентрических слов) оказывается необходимым учитывать и
различия между правым полушарием, ориентире ванным на настоящее, и левым,
занятым планированием будущего.
Вообще оказалось недостаточным рассмотрение естественного языка как
словесных реакций человека на стимулы внешней среды, особенно популярное в
американской науке середины нашего века Это убедительно показал Н. Хомский.
Еще раньше Н. А. Бернштейн заметил, что язык не может быть описан с помощью
подобной упрощенной схемы.
Н. А Бернштейн обратил внимание на значение таких элементов языка
(названных им "словами-операторами", что согласуется с пониманием термина
"оператор" в искусственных языках), которые сами по себе ничего не
обозначают, но указывают на различные отношения в речи. Наличие таких слов в
языке, по мысли Н. А. Бернштейна, противоречит замыслу описать его просто
как множество элементов Ε (сигналов), отображающих некоторые другие
множества / (сигналов стимулов, происходя
щих из внешней среды). В качестве примеров фраз, не поддающихся такому
объяснению, Н. А. Бернштейн приводил высказывания, содержащие
эгоцентрические слова: ты мыслишь, мы помыслим и т. п. [18].
По мысли Н. А. Бернштейна, развитой потом во многих работах наших
ученых, сам естественный язык представляет собой модель мира.
Эгоцентрические слова предполагают такую модель, где в центре при разговоре
находится сам говорящий.
ПОЧЕМУ СЛОВО "ЭТОТ" НЕПОНЯТНО РОБОТУ
В ходе разговора человека с роботом, поднимающим кубики, в Лаборатории
искусственного интеллекта, произошел такой обмен репликами. На приказание
Grasp the pyramid (Схвати эту пирамиду) робот, оставшийся бездеятельным,
возразил: / don't understand, which pyramid you mean (Я не знаю, какую из
пирамид ты имеешь в виду). Робот ничего не будет делать до тех пор, пока
человек не объяснит ему, какую из трех пирамид (красную, синюю или зеленую)
он должен взять. Определенный артикль the в английской фразе (как и
указательное местоимение эту в русском переводе) -- эгоцентрическое слово:
говорящему ясно, какую из пирамид он имеет в виду, в устном разговоре он
может пояснить это жестом, показать на предмет, но роботу эгоцентрическое
слово непонятно.
В этом разговоре машина понимает только те случаи употребления
определенного артикля, где он относится к предметам, в данной ситуации
единственным. По этой же причине машина правильно употребляет и понимает
местоимения I (я) и you (вы), потому что они в этой предельно упрощенной
ситуации всегда относятся только к самой машине и к одному и тому же
человеку, с ней говорящему. При таком употреблении местоимений,
принципиально отличном от обычного их использования, они аналогичны
собственным именам. Робот еще находится на уровне мальчика, называющего себя
"Петя" ("Петя играет" и т. п.). Робот умеет только переворачивать I (я) и
you (вы), употребляя их то по отношению к себе, то по отношению к своему
единственному собеседнику. Но в реальном общении I и you могут относиться к
разным собеседникам, иногда многочисленным.
Для того, чтобы машина правильно понимала естественный язык, должны
были бы быть, построены правила "переключения" всех эгоцентрических слов и
форм на ситуацию каждого данного акта речевого общения. Каждый
"индивидуальный знак" (θ) по-новому определяет другие зависящие от него
по своему значению эгоцентрические слова.
В рассуждении Рассела интересна мысль о роли времени и памяти для
моделирования значений эгоцентрических слов. Можно попытаться выяснить,
сколько таких индивидуальных знаков θ или высказываний хранится обычно
в памяти человека. Приблизительную оценку этой величины может дать то, что
например, каждый школьник помнит обычно свои разговоры с товарищами и их
ответы на уроках за последние дни, а лектор помнит вопросы, заданные ему
после лекции или на семинаре. Как видно из текстов евангелий и из мемуарной
литературы нового времени, при большом внимании к другому человеку можно
запомнить буквально все его основные высказывания на протяжении очень
длительного времени. По отношению не только к близким, но и к далеким
знакомым, употребление эгоцентрических слов в последующих актах речи зависит
от сохраняющихся в памяти предшествующих θ. Достаточно в качестве
простого примера сослаться на то, что люди всегда помнят, с кем они на Вы, с
кем на ты, и переход с одной формы обращения на другую отмечается обычно
социальным обрядом (например, пьют на брудершафт).
Если воспользоваться сравнением языка с шахматной игрой, к которому
часто прибегают математики и логики вслед за Гильбертом и лингвисты вслед за
Соссюром, то употребление языка человеком в обществе можно было бы сравнить
со многими партиями, разыгрываемыми гроссмейстерами одновременно на разных
досках. Хотя в реальном языковом общении каждый следующий "ход" в одной из
партий (каждый разговор с новым собеседником) может и отделяться большим
временем от всех предыдущих, в памяти эти партии (разговоры) должны
храниться одновременно (все ходы записываются). Поэтому модель сеанса
одновременной игры на разных досках и модель языкового общения в основном
тождественны. Благодаря смысловым особенностям эгоцентрических слов человек
обычно справляется с такой задачей.
Приведенная выше схема разговора робота, играющего в кубики, с
человеком [115] содержит предельное упрощение за счет сведения обоих
собеседников к паре постоянных партнеров. Поэтому эгоцентрические слова (я,
ты) в такой схеме :водятся к ярлыкам (собственным именам), тождественным
одному из партнеров. Если же представить себе реальные возможности общения
на естественном языке многих людей с вычислительной машиной в режиме
разделения времени (когда машина может одновременно обмениваться сообщениями
с целым рядом потребителей), то одну из существенных трудностей при общении
может представить понимание машиной эгоцентрических слов.
При общении машины со многими людьми практически существенной задачей
может оказаться различение каждого участвующего в обмене информацией.
Человек различает своих собеседников не благодаря эгоцентрическим словам, а
вопреки им (к каждому из собеседников приложимы одни и те же личные
местоимения). При опознании индивидуального человека вычислительной машиной
были бы полезны не личные местоимения, а способы типа "собственной песни"
или позывных, как каждый из нас умеет отличить знакомых по голосу, например
при разговоре по телефону; согласно новейшим экспериментальным данным, эта
функция выполняется "неречевым" -- правым полушарием [25]; моделирование ее
на автомате -- анализаторе речи наталкивается на значительные трудности
[30]. Высказывания, начинающиеся с я, означают всего лишь "источник данного
сообщения" и не могут способствовать опознанию данного лица иначе как путем
его отождествления с автором или источником сообщения.
Трудности (по-видимому, на сегодняшний день едва ли легко преодолимые),
которые возникли бы при попытке обучения машины пониманию предложений,
содержащих эгоцентрические слова, можно было бы пояснить на примере
изречения Декарта я мыслю, следовательно, я существую. Логический анализ
этого высказывания приводит к выводу, что оно содержит квантор существования
( $ ): существует мысль. Очевидно, изречение Декарта могло бы
быть сообщено машине (или проанализировано ею самой) в форме: В источнике
настоящего сообщения существует мысль, следовательно, источник настоящего
сообщения существует. В этой форме сохранено эгоцентрическое слово
"настоящий" ("настоящее сообщение" употребляется в смысле индивидуального
знака -- θ). Можно себе представить, что каждое вводимое в машину
сообщение нумеруется, т. е. индивидуальные знаки хранятся в памяти,
закодированные соответствующими числами (это в точности соответствует идее
Рейхенбаха, предлагавшего считать номер каждого θ индивидуальным знаком
для этого θ).
Пусть изречение Декарта закон ровано как θi. Тогда само сообщение
θl должно быть понято следующим образом: В источнике сообщения θi
существует мысль, следовательно, источник сообщения θi существует
(принципы формализованного изложения этой идеи намечены еще в XVII веке
Спинозой в книге "Основы философии Декарта, доказанные геометрическим
способом").
Для обучения машины естественному языку в нее необходимо ввести
некоторые предпосылки понимания значения слов (другой возможностью является
формирование самой машиной системы
таких предпосылок, иначе говоря, определенной модели мира, по некоторым
вводимым в нее исходным данным). К этим предпосылкам безусловно должно
относиться и предположение, что у каждого вводимого в машину сообщения есть
некоторый источник. В таком случае вторая половина изречения θi
автоматически следует из самого наличия сообщения θi, введенного в
машину. Что же касается первой половины, его интерпретация машиной зависит
от понимания слова мысль. Если, как это представляется возможным, это слово
понимается как равнозначное "переработке информации", то первая половина
сообщения θi будет понята как указание на наличие переработки
информации б самом источнике сообщения θi. Это, по-видимому, также
должно соответствовать некоторым предпосылкам понимания языка. В той мере, в
какой сообщение θi может быть понято машиной, оно все оказывается
выводимым из предпосылок понимания языка и в этом смысле не несет никакой
новой информации.
СООБЩЕНИЕ И ЕГО АВТОР
Определение смысла эгоцентрических слов невозможно без отождествления
источника данного сообщения θ с конкретным лицом. Но само это
отождествление происходит чаще либо через это же сообщение θ (как в
примере с изречением Лютера, разобранным Рейхенбахом), либо через
предшествующие сообщения, исходившие от того же источника. Большинство имен
незнакомых ему лично людей, известных современному интеллигентному человеку,
он определяет как авторов определенных сочинений (характерны обычные
определения в кроссвордах: "Роман русского писателя XIX века" и т. п.).
В "Ревизоре" Гоголя Хлестаков в сцене хвастовства перед городничихой и
ее дочерью приписывает себе множество популярных в те годы литературных
сочинений:
"Хлестаков... Все это, что было под именем барона Брамбеуса, "Фрегат
Надежды" и "Московский телеграф"... все это я написал.
Анна Андреевна. Скажите, так это вы были Брамбеус?
Хлестаков. Как же, я им всем поправляю статьи. Мне Смирдин дает за это
сорок тысяч.
Анна Андреевна. Так, верно и "Юрий Милославский" ваше сочинение?
Хлестаков. Да, это мое сочинение.
Анна Андреевна. Я сейчас догадалась.
Марья Антоновна. Ах, маменька, там написано, что это господина
Загоскина сочинение.
Анна Андреевна. Ну вот: я и знала, что даже будешь спорить.
Хлестаков. Ах да, это правда, это точно Загоскина; а есть другой "Юрий
Милославский", так тот уж мой.
Анна Андреевна. Ну, это, верно, я ваш читала..."
Рассмотрим языковые высказывания двух видов: Я это написал
(θι) и Загоскин -- автор "Юрия Милославского" (θ2). Первое
сообщение (θ1) утверждает, что x -- источник сообщения θ1, ранее
был источником некоторого письменного сообщения θk (обозначено
эгоцентрическим словом это). Во втором предложении (θ2) утверждается,
что лицо у, носящее собственное имя Загоскин, является автором письменного
сообщения θl, известного под заглавием "Юрий Милославский". Сходство
обоих высказываний, θ1 и θ2, заключается в том, что оба они
утверждают связь автора (источника) с некоторыми сообщениями. Различие между
ними состоит в эгоцентрическом характере высказывания θ1. Каждое из
этих высказываний может быть записано на логическом языке с помощью
йота-оператора: обозначая автора (источник сообщения) как А, можно записать
Различие между θ1 и θ2 обнаруживается в логической записи, из
которой видно, что в θ1) утверждается двойное авторство x -- по
отношению к θk и к θ1. Β θ2 утверждается, что существует
один и только один индивид, который является автором θl -- "Юрия
Милославского" и этот индивид тот же самый, что и Загоскин (на специальном
языке математической логики можно сказать, что у имен Загоскин и автор "Юрия
Милославского" -- один денотат). Хлестаков сперва нарушает эту предпосылку
правильного понимания языка, а потом выходит из положения, объявляя, что
есть два разных романа с таким названием, а у них два автора: у одного
(θl) -- Загоскин, а у другого (θk) -- сам Хлестаков.
Следует подчеркнуть, что исключительная сложность и величина сообщения
типа Θ, составляющего целую книгу, делает в принципе невозможной в
логической записи передачу всего такого сообщения в знаковых кавычках width=54 height=18 src="http://lib.ru/NTL/KIBERNETIKA/IWANOW_W/odd_even_070.jpg"> т. е. передачу
прямой речи. Это касается не только письменного сообщения, но и
достаточно обширных устных. Следовательно, утверждения авторства относятся
обычно не к самим сообщениям, а к другим индивидуальным объектам, их
обозначающим (к заглавиям на письменном естественном языке).
Той же практической невозможностью повторить все сообщение в целом
объясняется то, что в библиотечных каталогах
большинстве справочно-библиографических изданий письменные сообщения
кодируются условно их заглавиями и авторами. Именно это и создает те особые
трудности переработки растущего множества научных изданий, для частичного
преодоления которые издаются реферативные журналы и разрабатываются
информационно-логические машины.
ПАМЯТЬ КУЛЬТУРЫ
Современное общество характеризуется наличием специальной памяти
коллектива (в частности, книгохранилищ, архивов, дискотек, фильмотек и т.
п.). В ней хранится огромное число письменных и иных сообщений с указанием
их авторов. Количество и сложность всего этого массива сообщений вызвало к
жизни документалистику -- дисциплину, изучающую этот массив и способы его
организации (в документалистику в широком смысле входит библиотечное и
архивное дело и книговедение).
Ученый, работающий в какой-либо из бурно развивающихся областей
современного знания, решает задачу, отчасти сходную с описанной выше моделью
сеанса игры со многими партнерами (в режиме разделенного времени). Но число
партий, разыгрываемых ученым, обычно существенно больше, чем при
повседневном устном общении. Он должен постоянно следить за потоком научных
сообщений в своей области и нескольких (а иногда и многих) пограничных с ней
областях.
Трудности усугубляются разнообразием языков, на которых эти сообщения
печатаются, многочисленностью (иногда и редкостью) соответствующих журналов.
Поэтому естественна попытка облегчить труд ученого: часть этой непосильной
вспомогательной работы перелагается на вычислительную машину.
Предполагается, что сообщения в какой-либо определенной области (например, в
органической химии, где существенную трудность может представить обнаружение
вновь синтезированного соединения в списках уже ранее описанных) могут
храниться в информационно-логической машине (или комплексе таких машин), к
которой ученый может по мере необходимости обращаться за справками. Число
конкретных достижений за 20 с лишним лет напряженной работы в этой области
еще не очень велико, хотя в ряде стран машины помогают уже в обработке
патентов и в решении некоторых других задач, связанных с поиском информации
в большом массиве документов. Уже начинают выходить научные журналы
(например, американский "Журнал вычислительной лингвистики"),
приспособленные к обработке на машинах.
Размеры всей информации, накопленной в печатных изданиях
и рукописях человечеством, до настоящего времени оцениваются примерно
как 1014 бит (двоичных единиц информации). Этот расчет,
предложенный чл.--корр. АН СССР Η С. Кардашевым [129], основан на том,
что общее число всех печатных изданий и рукописей на Земле составляет около
108; в каждой из книг содержится в среднем 106 бит
(что равно среднему объему оперативного запоминающего устройства современной
вычислительной машины). Однако несомненно, что значительная часть этой
информации может быть представлена существенно более сжатым образом, что в
первом приближении дает величину порядка 1011 бит.
Число нейронов в мозге каждого человека превышает 1010, а
согласно новейшим данным число нейронных соединений суще ственно превышает
число самих нейронов, доходя до 1015-- 1016 Поэтому
современные работы по оценке информации, накопленной всем человечеством,
приводят к неожиданному и парадоксальному результату: вся эта информация в
принципе может быть усвоена и переработана мозгом одного человека.
Но эта возможность, теоретически существующая, реализуется в известной
мере только у немногих людей Для более широкой реализации этих потенциальных
возможностей необходима более разумная организация всею комплекса наших
знаний.
Эта же задача ставится и при использовании вычислительных (в частности,
информационно-логических) машин для хранения научной информации. Ясно,
например, что оперативную память машины объемом порядка 10е бит
было бы неразумно занимать одной книгой, которая при введении ее в машину на
естественном языке заполнила бы весь этот объем. Между тем для переработки
научной информации этот наименее экономный способ оказывается и наименее
эффективным.
Машина может успешно оперировать с этой информацией в случае ее
представления на особом искусственном языке, который вместе с тем позволил
бы и гораздо более сжато хранить в машине весь этот объем данных. Задача,
следовательно, сводится к разумной перекодировке накопленного массива
информации: книгу имеет смысл держать не в виде той (буквенной) информации,
которая характерна для левого полушария (а именно количество этой информации
и можно оценить в битах), а в виде комплекса значений, специфических для
правого полушария (и представляющих существенные трудности для
количественной оценки).
Основная трудность усвоения всей этой информации как машиной, так и
одним человеком, заключается в том, что до сих пор она сохранилась и
передавалась не в виде единой системы знаний, а в качестве суммы текстов
разных авторов. Научная ин
формация в библиотеках хранится в виде множества сообщений θ1,
θ2,.. θn, при n→ ∞), принадлежащих определенным
авторам. Внутри каждого такого сообщения содержится обычно значительное
число повторений (в пересказе или в цитатах) предшествующих сообщений. Текст
θm содержит обычно ссылки на тексты θj, θj+1, ... θm-1
или частичное (а иногда и полное) повторение этих текстов. В некоторых
гуманитарных науках сообщения о предшествующих сообщениях составляют
существенную часть всего научного текста; то же самое относится и к обзорным
статьям или монографиям по любой области знания
Уже этим обусловливается значительное число повторов, делающих
существенную долю научных текстов избыточной. Повторы нельзя считать
оправданными даже и с точки зрения помехоустойчивости сообщений при их
передаче во времени: история науки показывает, что чаще всего такие
повторяющиеся от работы к работе (и в этом смысле помехоустойчивые, легко
доходящие до следующих поколений) утверждения позднее оказываются
устаревшими (а в конечном счете ложными), тогда как единичные (и не
повторяющиеся в других трудах) высказывания в дальнейшем могут подтвердиться
и найти развитие.
В качестве примера можно вспомнить о судьбе многочисленных идей
Лейбница, который, по словам Винера, был предшественником кибернетики, и,
как теперь признается многими,-- предвестником также и современной
математической логики, семиотики, новейшей лингвистики. Большинство наиболее
заме чательных мыслей Лейбница частично оставались в рукописи еще долгое
время после его смерти, и лишь недавно -- больше, чем через 200 лет после