Силлогистика Аристотеля. Более полное, чем на страницах этой книги, изложение силлогистики и ее модификаций можно найти в традиционных учебниках логики, например в [23, 24]. Рассказ «Пампукская хрюря» заимствован из [24], а цитата о скотном дворе, иллюстрирующая закон логического тождества, – из [25]. Заметим, что законы силлогистики неоднократно подвергались критике как специалистами по математической логике (особенно закон исключенного третьего, отказ от которого привел к появлению интуиционистской и конструктивной логик, обходящихся без него), так и философами, специализирующимися в области диалектической логики.
Интересные результаты, связанные с психологическими особенностями восприятия людьми силлогистических умозаключений, приведены в [26]. В этой же работе излагаются результаты исследований психологов, объясняющие феномен неправильного восприятия тех или иных фигур силлогизмов.
В работе [27] рассмотрен вопрос о влиянии межполушарной асимметрии человеческого мозга на реализацию силлогистических выводов. Оказалось, что способность к такому выводу есть порождение левополушарного мышления. При функцировании лишь правого полушария испытуемые затруднялись в силлогистическом выводе и пытались подменить его рассуждениями эмпирического типа, опирающимися на практический опыт. Вот один из примеров, приведенных в [27]. Испытуемым предлагается силлогизм
Испытуемый с функционирующим левым и не функционирующим правым полушариями: «Да, в Приморске белые ночи, раз на той же широте». Другой испытуемый, у которого левое полушарие не функционирует: «Все равно не знаю, какие там ночи, кто его знает, где этот Приморск». В этих экспериментах левое полушарие выступает как победитель, но в экспериментах с пониманием метафор, описанных в этой же работе, оно уступает пальму первенства правому полушарию. Это еще раз подчеркивает важность обоих типов мышления для реализации человеческих рассуждений.
Расширения силлогистики Аристотеля. Попытки расширения традиционной силлогистики Аристотеля за счет включения в нее условных высказываний, отрицательных высказываний и ряда других форм высказываний делались почти с самого начала возникновения силлогистики. В упоминавшихся уже исследованиях [21, 22] можно найти немало примеров этого. И в наше время попытки создания различных расширений силлогистики продолжаются [23, 24, 28–31]. В книге [28], написанной со свойственным автору знаменитых приключений Алисы блеском, читатель найдет немало занимательных соритов, два из которых вошли в текст данного раздела. Заметим, что тот подход к силлогистике, который принят у Льюиса Кэррола, во многом близок к тому, как моделируются рассуждения в исчислениях, описанных в третьей главе.
Моделирование силлогистики. Несмотря на многочисленные попытки построить автоматическую систему, способную делать правильные силлогистические выводы, такие системы не получили широкого распространения. В основном это связано с тем, что неавтоматизированным остается начальный этап – перевод текстов посылок в нормальную форму. Автоматизировать его непросто. Для этого необходимо иметь развитую систему трансформаций предложений для языка. В работе [32] эта проблема обсуждается весьма подробно. В частности, в ней рассматриваются и трансформационные преобразования для введения кванторов, чтобы привести высказывания к нормальной форме. Тем не менее, хотя имеются значительные успехи в области трансформационных грамматик для естественных языков, все еще не существует развитых лингвистических процессоров, которые были бы эффективны при моделировании силлогистики.
В качестве примера совсем недавней попытки создания силлогистической машины можно указать на спецпроцессор, имитирующий силлогистический вывод, разработанный в г. Краснодаре специалистами из Кубанского государственного университета. Время проверки одного силлогизма на истинность или время построения заведомо истинного силлогизма в этом спецпроцессоре составляет 0,02 с. Однако в этом спецпроцессоре также нет автоматического преобразования посылок в нормальную форму и нет средств, позволяющих выявлять связи между различными фактами, например выявлять противоречивость посылок, когда она носит не синтаксический, а семантический характер (для этого также требуется иметь развитую трансформационную грамматику, устанавливающую синонимию высказываний). Таким образом, в этом спецпроцессоре реализуются лишь те процедуры, которые характерны для двух блоков модели силлогистического вывода, показанной на рис. 18, расположенных над блоком «База фактов».
Интересно отметить, что новое – это часто полностью забытое старое. В газете «Русские ведомости» 16 апреля 1914 года была опубликована заметка «Мыслительная машина». В ней говорилось: «В субботу, 19-го апреля, в большой аудитории Политехнического музея состоится публичная лекция проф. А.Н. Шукарева на тему „Познание и мышление“. Во время лекции будет демонстрирована мыслительная машина, аппарат, который позволяет воспроизвести механически процесс человеческой мысли, т.е. выводить заключения из поставленных посылок. Машина была впервые построена математиком Джевонсом и усовершенствована автором лекции. Результаты ее операций получаются на экране в словесной форме». Машина Шукарева была создана в Харьковском университете, а через 70 лет специалисты Кубанского университета, используя новую технику, повторили работу своего предшественника. Изложение истории создания логической машины Шукарева можно найти в [33]. В этой же работе говорится и о другой логической машине, созданной П.Д. Хрущевым.
Забытые науки. Возрождение этих наук только начинается. Поэтому на русском языке пока нет книг, в которых отражался бы современный уровень их понимания. Лишь книга [34] дает сведения о том, как использовались схемы рассуждений в алхимии. Эти рассуждения во многом определялись принципами установления аналогий, о которых мы говорили в четвертой главе. Некоторые сведения о приемах герменевтики и экзегетики можно получить из популярной статьи [35], опубликованной не так давно. Укажем еще на ряд труднодоступных, но интересных источников, в которых можно найти описание применения герменевтических схем в различных областях [36–39]. Для знающих немецкий язык можно отметить фундаментальный анализ герменевтических приемов, содержащийся в [40]. Использование подобных приемов с целью реконструкции способов рассуждения наших далеких предков стало сейчас довольно распространенным. Укажем в связи с этим на ранее упоминавшуюся работу [9], а также на исследование [41]. Некоторые сведения о логических системах Индии и Китая можно получить из [42–44].
Глава третья
Глава четвертая
Глава пятая
Глава шестая
Интересные результаты, связанные с психологическими особенностями восприятия людьми силлогистических умозаключений, приведены в [26]. В этой же работе излагаются результаты исследований психологов, объясняющие феномен неправильного восприятия тех или иных фигур силлогизмов.
В работе [27] рассмотрен вопрос о влиянии межполушарной асимметрии человеческого мозга на реализацию силлогистических выводов. Оказалось, что способность к такому выводу есть порождение левополушарного мышления. При функцировании лишь правого полушария испытуемые затруднялись в силлогистическом выводе и пытались подменить его рассуждениями эмпирического типа, опирающимися на практический опыт. Вот один из примеров, приведенных в [27]. Испытуемым предлагается силлогизм
Испытуемый с функционирующим левым и не функционирующим правым полушариями: «Да, в Приморске белые ночи, раз на той же широте». Другой испытуемый, у которого левое полушарие не функционирует: «Все равно не знаю, какие там ночи, кто его знает, где этот Приморск». В этих экспериментах левое полушарие выступает как победитель, но в экспериментах с пониманием метафор, описанных в этой же работе, оно уступает пальму первенства правому полушарию. Это еще раз подчеркивает важность обоих типов мышления для реализации человеческих рассуждений.
Расширения силлогистики Аристотеля. Попытки расширения традиционной силлогистики Аристотеля за счет включения в нее условных высказываний, отрицательных высказываний и ряда других форм высказываний делались почти с самого начала возникновения силлогистики. В упоминавшихся уже исследованиях [21, 22] можно найти немало примеров этого. И в наше время попытки создания различных расширений силлогистики продолжаются [23, 24, 28–31]. В книге [28], написанной со свойственным автору знаменитых приключений Алисы блеском, читатель найдет немало занимательных соритов, два из которых вошли в текст данного раздела. Заметим, что тот подход к силлогистике, который принят у Льюиса Кэррола, во многом близок к тому, как моделируются рассуждения в исчислениях, описанных в третьей главе.
Моделирование силлогистики. Несмотря на многочисленные попытки построить автоматическую систему, способную делать правильные силлогистические выводы, такие системы не получили широкого распространения. В основном это связано с тем, что неавтоматизированным остается начальный этап – перевод текстов посылок в нормальную форму. Автоматизировать его непросто. Для этого необходимо иметь развитую систему трансформаций предложений для языка. В работе [32] эта проблема обсуждается весьма подробно. В частности, в ней рассматриваются и трансформационные преобразования для введения кванторов, чтобы привести высказывания к нормальной форме. Тем не менее, хотя имеются значительные успехи в области трансформационных грамматик для естественных языков, все еще не существует развитых лингвистических процессоров, которые были бы эффективны при моделировании силлогистики.
В качестве примера совсем недавней попытки создания силлогистической машины можно указать на спецпроцессор, имитирующий силлогистический вывод, разработанный в г. Краснодаре специалистами из Кубанского государственного университета. Время проверки одного силлогизма на истинность или время построения заведомо истинного силлогизма в этом спецпроцессоре составляет 0,02 с. Однако в этом спецпроцессоре также нет автоматического преобразования посылок в нормальную форму и нет средств, позволяющих выявлять связи между различными фактами, например выявлять противоречивость посылок, когда она носит не синтаксический, а семантический характер (для этого также требуется иметь развитую трансформационную грамматику, устанавливающую синонимию высказываний). Таким образом, в этом спецпроцессоре реализуются лишь те процедуры, которые характерны для двух блоков модели силлогистического вывода, показанной на рис. 18, расположенных над блоком «База фактов».
Интересно отметить, что новое – это часто полностью забытое старое. В газете «Русские ведомости» 16 апреля 1914 года была опубликована заметка «Мыслительная машина». В ней говорилось: «В субботу, 19-го апреля, в большой аудитории Политехнического музея состоится публичная лекция проф. А.Н. Шукарева на тему „Познание и мышление“. Во время лекции будет демонстрирована мыслительная машина, аппарат, который позволяет воспроизвести механически процесс человеческой мысли, т.е. выводить заключения из поставленных посылок. Машина была впервые построена математиком Джевонсом и усовершенствована автором лекции. Результаты ее операций получаются на экране в словесной форме». Машина Шукарева была создана в Харьковском университете, а через 70 лет специалисты Кубанского университета, используя новую технику, повторили работу своего предшественника. Изложение истории создания логической машины Шукарева можно найти в [33]. В этой же работе говорится и о другой логической машине, созданной П.Д. Хрущевым.
Забытые науки. Возрождение этих наук только начинается. Поэтому на русском языке пока нет книг, в которых отражался бы современный уровень их понимания. Лишь книга [34] дает сведения о том, как использовались схемы рассуждений в алхимии. Эти рассуждения во многом определялись принципами установления аналогий, о которых мы говорили в четвертой главе. Некоторые сведения о приемах герменевтики и экзегетики можно получить из популярной статьи [35], опубликованной не так давно. Укажем еще на ряд труднодоступных, но интересных источников, в которых можно найти описание применения герменевтических схем в различных областях [36–39]. Для знающих немецкий язык можно отметить фундаментальный анализ герменевтических приемов, содержащийся в [40]. Использование подобных приемов с целью реконструкции способов рассуждения наших далеких предков стало сейчас довольно распространенным. Укажем в связи с этим на ранее упоминавшуюся работу [9], а также на исследование [41]. Некоторые сведения о логических системах Индии и Китая можно получить из [42–44].
Глава третья
Исчисление высказываний. Эта формальная система описана во всех руководствах по математической логике, например в [45]. Цитаты из Д. Самойлова заимствованы из сборника [46].
«Логик-теоретик». Существует весьма много программ, с помощью которых демонстрировались возможности ЭВМ при доказательстве выводимости формул в исчислении высказываний. Например, одна из первых работ в данной области [47] и первая отечественная система такого рода [48]. Программа «Логик-теоретик» была первым шагом на пути создания А. Ньюэллом и Г. Саймоном общей концепции решения творческих задач на ЭВМ на основе организованного эвристически перебора по лабиринту возможных альтернатив. Эта идея была воплощена ими в виде программы, названной «Общий решатель задач». Работы по этому кругу вопросов печатались неоднократно, например [49, 50]. Как позже выяснилось, подход к решению задач, реализованный в «Общем решателе задач», оказался не столь плодотворным, как думали авторы. Но для организации вывода в исчислении высказываний он удобен, хотя программа не всегда без большого перебора могла находить нужные пути по множеству альтернатив. В работах [49, 50] по этому поводу имеется немало экспериментальных наблюдений как над людьми, ищущими вывод, так и над работой программы «Логик-теоретик»
Исчисление предикатов. Исчисление предикатов описано во всех учебниках. Сошлемся на [45]. Проблема соответствия логики предикатов и силлогистики Аристотеля до сих нор вызывает некоторую полемику [31, 51]. Еще во второй половине 40-х годов известный логик Я. Лукасевич построил специальную формальную систему для силлогистики [52]. Он оставил два квантора A и I, положив по определению, что Esp=Isp и Osp=Asp. Выражения Asp и Isp Лукасевич отнес к элементарным (неделимым далее) формулам. В качестве аксиом он выбрал следующие четыре формулы: Ass; Iss; (Amp&Asm)Asp; (Amp&Ims)Isp.
Я. Лукасевич ввел три правила вывода: 1) в выводимую формулу вместо любой переменной типа s, p или m можно одновременно по всей формуле подставить любую формулу исчисления; 2) в выводимой формуле вместо любой переменной можно по всей формуле поставить другую переменную; 3) модус поненс.
Изложение вопросов, связанных с процедурами автоматизации доказательств, можно найти в монографии [53].
Первым универсальным методом доказательства был предложенный в 1965 году американским логиком Дж. Робинсоном метод резолюций. Его появление совершило переворот в использовании ЭВМ для доказательства теорем в исчислении предикатов. Начиная с работы самого Робинсона [54], возник огромный поток исследований в этом направлении. В монографии [53] на зафиксированном в ней временном срезе дан аналитический обзор всего сделанного в этой области. Но и до сегодняшнего дня всевозможные модификации метода Робинсона продолжают оставаться предметом публикаций.
Появление языка программирования ПРОЛОГ вновь стимулировало интерес к методу резолюций. Язык ПРОЛОГ, считающийся весьма перспективным для ЭВМ новых поколений, позволяет эффективно описывать выполняемые в нем процедуры в виде вывода в исчислении предикатов (точнее, в некоторой части этого исчисления, связанной с дизъюнктами Хориовского типа, исключающими некоторые типы выражений). А так как метод резолюций есть универсальная процедура для Хорновских дизъюнктов, то понятен тот интерес, который специалисты по программированию, созданию ЭВМ новых поколений и пользователи, оперирующие ПРОЛОГом, проявляют к методам типа метода резолюций.
Общая схема вывода. Описанное в этом разделе представление имеет куда большее значение, чем то, о котором в нашей книге идет речь. В теории искусственного интеллекта И-ИЛИ деревья и И-ИЛИ сети встречаются не только при моделировании рассуждений. Они широко используются при представлении знаний о проблемных областях разного типа. Находят они применение и в лингвистических процессорах, предназначенных для анализа текстов на естественном языке. В монографиях [55–57] заинтересованные читатели могут найти описание областей применения таких моделей. Идея метода обратного вывода принадлежит С.Ю. Маслову. Впервые она сформулирована в работе [58]. В настоящее время в СССР имеются версии программной реализации этого метода, во многом не уступающего по своей эффективности методу резолюций Робинсона. Рассказ Э. По, из которого приведена цитата, помещен в [59].
«Логик-теоретик». Существует весьма много программ, с помощью которых демонстрировались возможности ЭВМ при доказательстве выводимости формул в исчислении высказываний. Например, одна из первых работ в данной области [47] и первая отечественная система такого рода [48]. Программа «Логик-теоретик» была первым шагом на пути создания А. Ньюэллом и Г. Саймоном общей концепции решения творческих задач на ЭВМ на основе организованного эвристически перебора по лабиринту возможных альтернатив. Эта идея была воплощена ими в виде программы, названной «Общий решатель задач». Работы по этому кругу вопросов печатались неоднократно, например [49, 50]. Как позже выяснилось, подход к решению задач, реализованный в «Общем решателе задач», оказался не столь плодотворным, как думали авторы. Но для организации вывода в исчислении высказываний он удобен, хотя программа не всегда без большого перебора могла находить нужные пути по множеству альтернатив. В работах [49, 50] по этому поводу имеется немало экспериментальных наблюдений как над людьми, ищущими вывод, так и над работой программы «Логик-теоретик»
Исчисление предикатов. Исчисление предикатов описано во всех учебниках. Сошлемся на [45]. Проблема соответствия логики предикатов и силлогистики Аристотеля до сих нор вызывает некоторую полемику [31, 51]. Еще во второй половине 40-х годов известный логик Я. Лукасевич построил специальную формальную систему для силлогистики [52]. Он оставил два квантора A и I, положив по определению, что Esp=Isp и Osp=Asp. Выражения Asp и Isp Лукасевич отнес к элементарным (неделимым далее) формулам. В качестве аксиом он выбрал следующие четыре формулы: Ass; Iss; (Amp&Asm)Asp; (Amp&Ims)Isp.
Я. Лукасевич ввел три правила вывода: 1) в выводимую формулу вместо любой переменной типа s, p или m можно одновременно по всей формуле подставить любую формулу исчисления; 2) в выводимой формуле вместо любой переменной можно по всей формуле поставить другую переменную; 3) модус поненс.
Изложение вопросов, связанных с процедурами автоматизации доказательств, можно найти в монографии [53].
Первым универсальным методом доказательства был предложенный в 1965 году американским логиком Дж. Робинсоном метод резолюций. Его появление совершило переворот в использовании ЭВМ для доказательства теорем в исчислении предикатов. Начиная с работы самого Робинсона [54], возник огромный поток исследований в этом направлении. В монографии [53] на зафиксированном в ней временном срезе дан аналитический обзор всего сделанного в этой области. Но и до сегодняшнего дня всевозможные модификации метода Робинсона продолжают оставаться предметом публикаций.
Появление языка программирования ПРОЛОГ вновь стимулировало интерес к методу резолюций. Язык ПРОЛОГ, считающийся весьма перспективным для ЭВМ новых поколений, позволяет эффективно описывать выполняемые в нем процедуры в виде вывода в исчислении предикатов (точнее, в некоторой части этого исчисления, связанной с дизъюнктами Хориовского типа, исключающими некоторые типы выражений). А так как метод резолюций есть универсальная процедура для Хорновских дизъюнктов, то понятен тот интерес, который специалисты по программированию, созданию ЭВМ новых поколений и пользователи, оперирующие ПРОЛОГом, проявляют к методам типа метода резолюций.
Общая схема вывода. Описанное в этом разделе представление имеет куда большее значение, чем то, о котором в нашей книге идет речь. В теории искусственного интеллекта И-ИЛИ деревья и И-ИЛИ сети встречаются не только при моделировании рассуждений. Они широко используются при представлении знаний о проблемных областях разного типа. Находят они применение и в лингвистических процессорах, предназначенных для анализа текстов на естественном языке. В монографиях [55–57] заинтересованные читатели могут найти описание областей применения таких моделей. Идея метода обратного вывода принадлежит С.Ю. Маслову. Впервые она сформулирована в работе [58]. В настоящее время в СССР имеются версии программной реализации этого метода, во многом не уступающего по своей эффективности методу резолюций Робинсона. Рассказ Э. По, из которого приведена цитата, помещен в [59].
Глава четвертая
Стебаков Сергей Александрович – советский математик, специалист в области топологии, качественной теории дифференциальных уравнений и теории управления.
От Аристотеля до Бэкона. Историю становления учения об индукции до начала XX века содержит монография [60]. Для ознакомления с более поздним пониманием этих вопросов можно рекомендовать статьи из сборника [61]. Специально логике формирования гипотез посвящена работа [62]. Высказывание Р. Грегори о небиологичности дедукции и о роли индукции для живых организмов заимствовано из [63, с. 187].
Индукция Джона Стюарта Милля. Взгляды Милля изложены в его сочинении, вышедшем в 1843 году. Позже эта книга была переведена на русский язык [64]. Цитата из В. Луговского взята из поэмы «Сказка о дедовой шубе», вошедшей в книгу [65]. Все формулировки принципов Милля сделаны в соответствии с текстами из [60].
Читатели, знакомые с методами распознавания образов, должны почувствовать почти дословное совпадение принципов Милля с приемами, используемыми в обучении распознаванию и классификации с помощью обучающих выборок из примеров и контрпримеров. Первое и наиболее полное описание подобных приемов содержится в [66]. Другие подходы к решению подобных же задач имеются в многочисленных публикациях по распознаванию образов. Укажем лишь наиболее близкие по духу методы, описанные в работах [67–69]. Такая близость между индуктивными методами рассуждений и распознаванием (вернее, узнаванием и классификацией) образов еще раз подчеркивает верность замечания Р. Грегори, процитированного в предыдущем разделе.
Рассуждения по аналогии. Первой программой, в которой были реализованы принципы работы с пропорцией Лейбница была, по-видимому, программа «Аналогия», разработанная Т. Эвансом в конце 60-х годов. Она с успехом решала задачи типа задач на аналогию из известной книги головоломок Г. Айзенка [70].
Программа, находящая аналогии для множества родственников, была создана Д. Румельхартом и А. Абрахамсоном в 1973 году. Именно в ней была использована идея семантического пространства Осгуда. Метод построения этого пространства основан на следующих экспериментах. Испытуемым предъявляют около 400 шкал, на концах которых стоят слова-антонимы, описывающие признаки (например, добрый – злой, острый – тупой, быстрый – медленный). В середине шкалы находится нейтральное деление (оно отмечено словосочетаниями типа не добрый – не злой; не острый – не тупой; не быстрый – не медленный). Кроме того, на шкале имеется еще по несколько делений слева и справа от нейтрального деления. Они никакими словами не маркируются. Испытуемым задается (всем одинаковый) список слов (например, отец, дерево, шило и т.п.), и их просят расположить каждое из слов списка на всех шкалах. Многие шкалы испытуемым кажутся весьма неподходящими для расположения заданных слов (например, как разместить слово «отец» на шкале острый – тупой?). В этих случаях экспериментатор предлагает размещать их «как хочется». После этого шкалы с нанесенными на них словами подвергаются статистической обработке по методу факторного анализа и выделяются основные факторы.
Результатом опытов, проведенных по методу Осгуда, всегда является выделение трех главных факторов, устраняющих практически всю дисперсию. Эти три обобщенные шкалы обычно называют шкалами оценки, силы и активности. Они образуют оси пространства Осгуда. В этом пространстве понятия, близкие по своей семантике, образуют компактные скопления – кластеры. Одно из таких скоплений образуют слова, использованные на рис. 25. Весьма много для анализа методов разрешения пропорции Лейбница сделал математик из ГДР Д. Пёчке. Его подход мы продемонстрировали при описании поиска В’ для ситуации на рис. 26.
ДСМ-метод. Этот метод изложен в [71, 72]. Интересно, что его авторы, пожалуй, впервые описали его не на уровне алгоритмов и программ, реализующих эти алгоритмы, а на уровне некоторой формальной логической системы. До них попытку такого рода сделали лишь авторы ГУХА-метода, созданного для формирования гипотез на основе статистических методов и логических рассуждений [73]. Сравнение этих двух методов с точки зрения правил правдоподобного вывода, используемых в них, дано в работе [74]. В [75] высказано немало соображений об ошибочных умозаключениях на основе наблюдаемых в экспериментах фактах. Многие из этих ошибок основаны на особенностях человеческих рассуждений, на неумении людей объективированно вводить оценки достоверности гипотез. В этой же книге дан анализ различных видов причин, частично использованный при написании данного раздела.
В настоящее время причинно-следственные отношения широко используются для описания знаний в интеллектуальных системах, например при описаниях течения разного рода заболеваний или знаний о последствиях многошагового управления в больших технических или организационных системах. Начинает создаваться специальная каузальная логика, в которой описываются общие процедуры для работы с причинно-следственными отношениями [76]. Интересно ознакомиться с работой [77], в которой решается ряд задач, аналогичных тем, которые решались и ДСМ-методом, но на иных принципах. Еще раз отметим близость многих постановок задач и методов их решения в индуктивных рассуждающих системах и системах распознавания образов, опирающихся на идею обучения на примерах [66].
Нечеткий вывод. Оператор «только» с логической точки зрения обсуждался в ряде работ, например в [78]. Приведенные в этом разделе примеры заимствованы из этой монографии, а также из [79]. Для углубленного знакомства с идеями нечетких множеств и различных методов, основанных на них, можно рекомендовать монографию [80]. Более подробно со схемами нечеткого вывода можно ознакомиться по соответствующим разделам книги [76], в которой, в частности, описана процедура порождения квантификаторов в заключительном утверждении, опирающаяся на идею «универсальной шкалы» И.В. Ежковой (ссылки на ее работы есть в [76]) в свое время был предложен принципиально иной метод определения квантификаторов заключения. Он основан на вычислении суперпозиции функций принадлежности для посылок в схеме, являющейся прямым обобщением на нечеткий случай правила вывода модус поненс.
Нечеткая силлогистика. Исследования в этой области – большое достижение специалистов нашей страны. Первые публикации по D-силлогизмам появились в 1984 году [81]. Они опираются на развитый С.В. Чесноковым детерминационный анализ (отсюда название D-силлогизмы), относящийся к обработке статистического материала, характерного для социологии и психологии [82]. История о силлогизме бабушки полностью заимствована из работы С.В. Чеснокова, которая на русском языке не публиковалась. Отголоски данной истории можно найти в [83]. Несколько иной взгляд на нечеткую силлогистику содержится в работах [84, 85], но общие принципы, лежащие в основе идеи «вычисления» значения нечеткого квантификатора, в этих исследованиях практически совпадают.
Коллекция схем. Систематические исследования в области схем умозаключений правдоподобного типа в середине 50-х годов начал известный математик Д. Пойа. Его монография [86], в которой описано более полусотни схем правдоподобных рассуждений, и сейчас является настольной книгой специалистов, работающих в этой области. Кроме схем, заимствованных из этого труда, в данном разделе приведен ряд схем, предлагавшихся в различное время на конференциях по искусственному интеллекту специалистами из разных стран.
От Аристотеля до Бэкона. Историю становления учения об индукции до начала XX века содержит монография [60]. Для ознакомления с более поздним пониманием этих вопросов можно рекомендовать статьи из сборника [61]. Специально логике формирования гипотез посвящена работа [62]. Высказывание Р. Грегори о небиологичности дедукции и о роли индукции для живых организмов заимствовано из [63, с. 187].
Индукция Джона Стюарта Милля. Взгляды Милля изложены в его сочинении, вышедшем в 1843 году. Позже эта книга была переведена на русский язык [64]. Цитата из В. Луговского взята из поэмы «Сказка о дедовой шубе», вошедшей в книгу [65]. Все формулировки принципов Милля сделаны в соответствии с текстами из [60].
Читатели, знакомые с методами распознавания образов, должны почувствовать почти дословное совпадение принципов Милля с приемами, используемыми в обучении распознаванию и классификации с помощью обучающих выборок из примеров и контрпримеров. Первое и наиболее полное описание подобных приемов содержится в [66]. Другие подходы к решению подобных же задач имеются в многочисленных публикациях по распознаванию образов. Укажем лишь наиболее близкие по духу методы, описанные в работах [67–69]. Такая близость между индуктивными методами рассуждений и распознаванием (вернее, узнаванием и классификацией) образов еще раз подчеркивает верность замечания Р. Грегори, процитированного в предыдущем разделе.
Рассуждения по аналогии. Первой программой, в которой были реализованы принципы работы с пропорцией Лейбница была, по-видимому, программа «Аналогия», разработанная Т. Эвансом в конце 60-х годов. Она с успехом решала задачи типа задач на аналогию из известной книги головоломок Г. Айзенка [70].
Программа, находящая аналогии для множества родственников, была создана Д. Румельхартом и А. Абрахамсоном в 1973 году. Именно в ней была использована идея семантического пространства Осгуда. Метод построения этого пространства основан на следующих экспериментах. Испытуемым предъявляют около 400 шкал, на концах которых стоят слова-антонимы, описывающие признаки (например, добрый – злой, острый – тупой, быстрый – медленный). В середине шкалы находится нейтральное деление (оно отмечено словосочетаниями типа не добрый – не злой; не острый – не тупой; не быстрый – не медленный). Кроме того, на шкале имеется еще по несколько делений слева и справа от нейтрального деления. Они никакими словами не маркируются. Испытуемым задается (всем одинаковый) список слов (например, отец, дерево, шило и т.п.), и их просят расположить каждое из слов списка на всех шкалах. Многие шкалы испытуемым кажутся весьма неподходящими для расположения заданных слов (например, как разместить слово «отец» на шкале острый – тупой?). В этих случаях экспериментатор предлагает размещать их «как хочется». После этого шкалы с нанесенными на них словами подвергаются статистической обработке по методу факторного анализа и выделяются основные факторы.
Результатом опытов, проведенных по методу Осгуда, всегда является выделение трех главных факторов, устраняющих практически всю дисперсию. Эти три обобщенные шкалы обычно называют шкалами оценки, силы и активности. Они образуют оси пространства Осгуда. В этом пространстве понятия, близкие по своей семантике, образуют компактные скопления – кластеры. Одно из таких скоплений образуют слова, использованные на рис. 25. Весьма много для анализа методов разрешения пропорции Лейбница сделал математик из ГДР Д. Пёчке. Его подход мы продемонстрировали при описании поиска В’ для ситуации на рис. 26.
ДСМ-метод. Этот метод изложен в [71, 72]. Интересно, что его авторы, пожалуй, впервые описали его не на уровне алгоритмов и программ, реализующих эти алгоритмы, а на уровне некоторой формальной логической системы. До них попытку такого рода сделали лишь авторы ГУХА-метода, созданного для формирования гипотез на основе статистических методов и логических рассуждений [73]. Сравнение этих двух методов с точки зрения правил правдоподобного вывода, используемых в них, дано в работе [74]. В [75] высказано немало соображений об ошибочных умозаключениях на основе наблюдаемых в экспериментах фактах. Многие из этих ошибок основаны на особенностях человеческих рассуждений, на неумении людей объективированно вводить оценки достоверности гипотез. В этой же книге дан анализ различных видов причин, частично использованный при написании данного раздела.
В настоящее время причинно-следственные отношения широко используются для описания знаний в интеллектуальных системах, например при описаниях течения разного рода заболеваний или знаний о последствиях многошагового управления в больших технических или организационных системах. Начинает создаваться специальная каузальная логика, в которой описываются общие процедуры для работы с причинно-следственными отношениями [76]. Интересно ознакомиться с работой [77], в которой решается ряд задач, аналогичных тем, которые решались и ДСМ-методом, но на иных принципах. Еще раз отметим близость многих постановок задач и методов их решения в индуктивных рассуждающих системах и системах распознавания образов, опирающихся на идею обучения на примерах [66].
Нечеткий вывод. Оператор «только» с логической точки зрения обсуждался в ряде работ, например в [78]. Приведенные в этом разделе примеры заимствованы из этой монографии, а также из [79]. Для углубленного знакомства с идеями нечетких множеств и различных методов, основанных на них, можно рекомендовать монографию [80]. Более подробно со схемами нечеткого вывода можно ознакомиться по соответствующим разделам книги [76], в которой, в частности, описана процедура порождения квантификаторов в заключительном утверждении, опирающаяся на идею «универсальной шкалы» И.В. Ежковой (ссылки на ее работы есть в [76]) в свое время был предложен принципиально иной метод определения квантификаторов заключения. Он основан на вычислении суперпозиции функций принадлежности для посылок в схеме, являющейся прямым обобщением на нечеткий случай правила вывода модус поненс.
Нечеткая силлогистика. Исследования в этой области – большое достижение специалистов нашей страны. Первые публикации по D-силлогизмам появились в 1984 году [81]. Они опираются на развитый С.В. Чесноковым детерминационный анализ (отсюда название D-силлогизмы), относящийся к обработке статистического материала, характерного для социологии и психологии [82]. История о силлогизме бабушки полностью заимствована из работы С.В. Чеснокова, которая на русском языке не публиковалась. Отголоски данной истории можно найти в [83]. Несколько иной взгляд на нечеткую силлогистику содержится в работах [84, 85], но общие принципы, лежащие в основе идеи «вычисления» значения нечеткого квантификатора, в этих исследованиях практически совпадают.
Коллекция схем. Систематические исследования в области схем умозаключений правдоподобного типа в середине 50-х годов начал известный математик Д. Пойа. Его монография [86], в которой описано более полусотни схем правдоподобных рассуждений, и сейчас является настольной книгой специалистов, работающих в этой области. Кроме схем, заимствованных из этого труда, в данном разделе приведен ряд схем, предлагавшихся в различное время на конференциях по искусственному интеллекту специалистами из разных стран.
Глава пятая
Что такое интеллектуальная система. В этой книге мы не можем уделить много места обсуждению особенностей систем, работа которых основана на знаниях. Кроме упомянутых в книге ЭВМ пятого поколения, интеллектуальных роботов для производства и экспертных систем можно указать еще на расчетно-логические системы, используемые в проектировании и планировании, интеллектуальные пакеты прикладных программ, облегчающие труд многих специалистов, системы автоматизации научных исследований и т.д. Все такие системы содержат базу знаний и блок, имитирующий профессиональные рассуждения. Более полное представление о специфике подобных систем и их работе можно получить из популярной [87, 88] и научной [89, 90] литературы.
Продукционные системы. Продукционные системы описывались в литературе неоднократно. Их модели, связанные с уточнением понятия алгоритма, излагаются, например, в [91]. В работах [92, 93] отражены многие аспекты применения продукции в интеллектуальных системах. Часто представление процессов в виде продукционных систем считают особым стилем программирования для ЭВМ новых поколений. Во всяком случае, с этой точки зрения они обладают рядом несомненных преимуществ по сравнению с классическими языками программирования.
Можно отметить по крайней мере три таких преимущества. Первое – естественная модульность, позволяющая весьма несложно вставлять и убирать продукции. Если в продукционной системе нет прямой связи между продукциями (например, нет ссылок на конкретные продукции в метапродукциях; выбирающих продукции из фронта или чего-нибудь подобного), то такая замена не вызывает никаких переделок. Однако при вставке и изъятии продукций надо учитывать и эффект их взаимодействия через базу знаний. Учет этого фактора может оказаться весьма непростым делом. Вторым преимуществом продукций является возможность одновременного описания с их помощью как фрагментов базы знаний, так и самих операторов преобразований. Другими словами, в продукциях можно однотипно описывать как декларативные, так и процедурные знания. Наконец, присущая продукциям асинхронность, встроенная в продукционные системы параллельность позволяют при наличии ЭВМ соответствующей архитектуры выполнять описываемую системой продукций процедуру параллельным способом. Однако за все приходится платить. И за эти достоинства продукционных систем, когда они выступают в качестве языка программирования, приходится расплачиваться весьма тяжелыми процедурами отладки и поиска ошибок.
Тем не менее, подобный стиль программирования находит в мире все больше сторонников. Заметим, что известные языки программирования ПРОЛОГ и РЕФАЛ многое как бы «заимствовали» из продукционных систем. Отметим также, что в возникшем в нашей стране еще до работ в области искусственного интеллекта ситуационном управлении [76] системы, подобные продукционным, использовались для поиска решений при оперативном управлении в сложных технических и организационных системах. Это были так называемые системы логико-трансформационных правил [94]. Пример с преобразованием схем химических реакций в продукционную систему принадлежит Т. Яхно.
Управление выводом. Обзор различных методов управления выводом в продукционных системах можно найти в [92, 93]. Поскольку продукционные системы часто выступают в качестве средства представления знаний в экспертных системах и осуществляют с помощью некоторого механизма управления выводом вывод на знаниях, то об этих механизмах можно найти достаточно богатые сведения в литературе по экспертным системам. Укажем в связи в этим на обзорные работы [95, 96].
Вывод на семантической сети. Вывод с помощью «поиска по образцу» на семантической сети, как он описан в этом разделе, используется во многих экспериментальных образцах машин баз знаний. Для этого создаются специальные аппаратные средства. К выводу на семантической сети можно свести метод резолюций, описанный в третьей главе. Переход к семантической сети позволяет строить процедуры вывода, обладающие большим уровнем параллелизма. В работе [97] рассмотрен один из таких методов, позволяющий резко повысить эффективность логического вывода в современных ЭВМ. При имитации движения по семантическим сетям в виде прямых, обратных или встречных волн в ЭВМ новых поколений предполагается использовать специальные аппаратные средства и языки волнового типа. Работа [98] показывает, какие принципы при этом используются. С особенностями немонотонных рассуждений можно ознакомиться по книге [99]. В [100] содержится интересная информация о выводах, которые можно делать при неполных знаниях в базе.
Спрашивай – Отвечаем. Логика вопросов и ответов описана в [101]. Ее авторы сумели построить теорию вопросно-ответных отношений для ЛИ-вопросов, КАКОЙ-вопросов и частично для ПОЧЕМУ-вопросов. Логики такого вида обычно называются эротетическими. Для других типов вопросов, рассмотренных в данном разделе, логики пока не построены. Для того чтобы имитировать для вопросно-ответных отношений случаи неполноты информации в базе знаний или ее противоречивости, Н. Белнап предложил специальную четырехзначную логику, описание которой имеется в приложении к книге [101]. В этой логике наряду с обычными логическими оценками «Истина» и «Ложь» используются специальные оценки «Неизвестно» и «Истина и Ложь одновременно». Высказывание о мышлении специалистов в области археологии заимствовано из [102, с. 9]. Рассказ о космическом Ответчике помещен в [103].
Продукционные системы. Продукционные системы описывались в литературе неоднократно. Их модели, связанные с уточнением понятия алгоритма, излагаются, например, в [91]. В работах [92, 93] отражены многие аспекты применения продукции в интеллектуальных системах. Часто представление процессов в виде продукционных систем считают особым стилем программирования для ЭВМ новых поколений. Во всяком случае, с этой точки зрения они обладают рядом несомненных преимуществ по сравнению с классическими языками программирования.
Можно отметить по крайней мере три таких преимущества. Первое – естественная модульность, позволяющая весьма несложно вставлять и убирать продукции. Если в продукционной системе нет прямой связи между продукциями (например, нет ссылок на конкретные продукции в метапродукциях; выбирающих продукции из фронта или чего-нибудь подобного), то такая замена не вызывает никаких переделок. Однако при вставке и изъятии продукций надо учитывать и эффект их взаимодействия через базу знаний. Учет этого фактора может оказаться весьма непростым делом. Вторым преимуществом продукций является возможность одновременного описания с их помощью как фрагментов базы знаний, так и самих операторов преобразований. Другими словами, в продукциях можно однотипно описывать как декларативные, так и процедурные знания. Наконец, присущая продукциям асинхронность, встроенная в продукционные системы параллельность позволяют при наличии ЭВМ соответствующей архитектуры выполнять описываемую системой продукций процедуру параллельным способом. Однако за все приходится платить. И за эти достоинства продукционных систем, когда они выступают в качестве языка программирования, приходится расплачиваться весьма тяжелыми процедурами отладки и поиска ошибок.
Тем не менее, подобный стиль программирования находит в мире все больше сторонников. Заметим, что известные языки программирования ПРОЛОГ и РЕФАЛ многое как бы «заимствовали» из продукционных систем. Отметим также, что в возникшем в нашей стране еще до работ в области искусственного интеллекта ситуационном управлении [76] системы, подобные продукционным, использовались для поиска решений при оперативном управлении в сложных технических и организационных системах. Это были так называемые системы логико-трансформационных правил [94]. Пример с преобразованием схем химических реакций в продукционную систему принадлежит Т. Яхно.
Управление выводом. Обзор различных методов управления выводом в продукционных системах можно найти в [92, 93]. Поскольку продукционные системы часто выступают в качестве средства представления знаний в экспертных системах и осуществляют с помощью некоторого механизма управления выводом вывод на знаниях, то об этих механизмах можно найти достаточно богатые сведения в литературе по экспертным системам. Укажем в связи в этим на обзорные работы [95, 96].
Вывод на семантической сети. Вывод с помощью «поиска по образцу» на семантической сети, как он описан в этом разделе, используется во многих экспериментальных образцах машин баз знаний. Для этого создаются специальные аппаратные средства. К выводу на семантической сети можно свести метод резолюций, описанный в третьей главе. Переход к семантической сети позволяет строить процедуры вывода, обладающие большим уровнем параллелизма. В работе [97] рассмотрен один из таких методов, позволяющий резко повысить эффективность логического вывода в современных ЭВМ. При имитации движения по семантическим сетям в виде прямых, обратных или встречных волн в ЭВМ новых поколений предполагается использовать специальные аппаратные средства и языки волнового типа. Работа [98] показывает, какие принципы при этом используются. С особенностями немонотонных рассуждений можно ознакомиться по книге [99]. В [100] содержится интересная информация о выводах, которые можно делать при неполных знаниях в базе.
Спрашивай – Отвечаем. Логика вопросов и ответов описана в [101]. Ее авторы сумели построить теорию вопросно-ответных отношений для ЛИ-вопросов, КАКОЙ-вопросов и частично для ПОЧЕМУ-вопросов. Логики такого вида обычно называются эротетическими. Для других типов вопросов, рассмотренных в данном разделе, логики пока не построены. Для того чтобы имитировать для вопросно-ответных отношений случаи неполноты информации в базе знаний или ее противоречивости, Н. Белнап предложил специальную четырехзначную логику, описание которой имеется в приложении к книге [101]. В этой логике наряду с обычными логическими оценками «Истина» и «Ложь» используются специальные оценки «Неизвестно» и «Истина и Ложь одновременно». Высказывание о мышлении специалистов в области археологии заимствовано из [102, с. 9]. Рассказ о космическом Ответчике помещен в [103].
Глава шестая
Рационален ли человек? Модель целенаправленного поведения, описанная нами, основывается на модели, предложенной в [104]. Из [105] заимствованы некоторые примеры, опровергающие доминанту рационализма в поведении человека и его рассуждениях. В работе [104] показано, что модель рационального поведения человека обладает эмпирической, управленческой, методологической, теоретической и экзистенциальной ограниченностью.
«Ты прав, но это меня не убеждает». Проблемам логической аргументации посвящена монография [106]. В библиографии к этой книге интересующиеся могут найти новые источники по проблеме аргументации. Цитата из О. Сулейменова взята из [107, с. 8]. В работе [108] на конкретном примере продемонстрирован процесс аргументации, в котором представители Афин стараются изменить у жителей Мелоса систему исходных аксиом, чтобы Мелос отменил свое решение о неприсоединении его к коалиции городов, возглавляемых Афинами. Анализ этого процесса опирается на текст Фукидита, который включил в свою «Историю» эпизод дипломатических переговоров между Афинами и Мелосом. Таким схемам рассуждений посвящено исследование [109]. Типология споров, описанная в данном разделе, взята из этой книги.
«Ты прав, но это меня не убеждает». Проблемам логической аргументации посвящена монография [106]. В библиографии к этой книге интересующиеся могут найти новые источники по проблеме аргументации. Цитата из О. Сулейменова взята из [107, с. 8]. В работе [108] на конкретном примере продемонстрирован процесс аргументации, в котором представители Афин стараются изменить у жителей Мелоса систему исходных аксиом, чтобы Мелос отменил свое решение о неприсоединении его к коалиции городов, возглавляемых Афинами. Анализ этого процесса опирается на текст Фукидита, который включил в свою «Историю» эпизод дипломатических переговоров между Афинами и Мелосом. Таким схемам рассуждений посвящено исследование [109]. Типология споров, описанная в данном разделе, взята из этой книги.