Вопрос о том, должны ли мы стремиться к рациональности, является этическим вопросом. В следующем разделе я рассмотрю некоторые его аспекты.
   Д. Вероятность и поведение/
   Положение епископа Балтера, что вероятность есть руководитель жизни, очень хорошо известно. Рассмотрим вкратце, что оно значит, насколько оно истинно и что связано с верой, что оно имеет ту степень истинности, которой она, по-видимому, обладает.
   Большинство этических теорий относится к одному из двух видов. Согласно первому виду, хорошее поведение - это такое поведение, которое повинуется определенным правилам;
   согласно второму,- это такое поведение, которое направлено на достижение определенных целей. Имеются и теории, которые не относятся ни к одному из этих двух видов, но для наших целей мы можем их игнорировать.
   Первый тип теории представлен Кантом и десятью заповедями ветхого Завета. Правда, десять заповедей не являются чистым примером этого типа теории, поскольку для некоторых повелении приводятся основания. Вы не должны поклоняться кумирам, потому что Бог ревнив; вы должны почитать ваших родителей, потому что это уменьшает шансы вашей смерти. Легко, конечно, найти основания против убийства и воровства, но этих оснований не дается в десяти заповедях. Если даются основания, то должны быть и исключения из них, и обыденный здравый смысл в общем признает их, хотя в тексте они не даются.
   Когда этика рассматривается как совокупность правил поведения, тогда вероятность не играет в ней никакой роли. Она приобретает значение только во втором типе этической теории, согласно которому добродетель состоит в стремлении к определенным целям. Что касается отношения к вероятности, то различие в избираемой цели имеет мало значения. Ради ясности предположим, что целью является возможно большее преобладание удовольствия над страданием, причем удовольствие и страдание рассматриваются как равные, когда лицо, которое должно сделать выбор, безразлично к тому, имеет ли оно их или не имеет. Мы можем коротко обозначить эту цель как увеличение удовольствия до максимума.
   Мы не можем сказать, что добродетельный человек будет действовать таким способом, который действительно увеличит удовольствие до максимума, поскольку у него может не быть основания ожидать этого результата. Было бы очень хорошо, если бы мать Гитлера убила его, когда он был еще ребенком, но она не могла знать, что он будет таким, каким стал. Мы должны поэтому сказать, что добродетельный человек будет действовать таким способом, который, насколько хватает его знания, вероятно увеличит до предела удовольствие. Тот вид вероятности, который здесь предполагается, является, очевидно, степенью правдоподобия.
   Относящиеся сюда вероятности должны оцениваться по правилам исчисления "ожидания". Это значит, что если имеется вероятность p того, что определенное действие среди своих последствий будет иметь удовольствие, измеряемое величиной x, то это придает ожиданию величину px. То обстоятельство, что отдаленные последствия редко имеют поддающуюся оценке вероятность, оправдывает обычное обращение человека практики своего внимания на менее удаленные последствия своего действия.
   Есть и другое соображение: связанные с этим исчисления часто бывают трудными и в высшей степени трудными, когда приносящие счастье свойства двух возможных действий почти одинаковы; в таком случае выбор не имеет особого значения. Следовательно, как правило, не имеет особого смысла тщательно определять, какое действие произведет наивысшее удовольствие. Это служит основанием в пользу правил действия даже в том случае, если наша высшая этика отвергает их: они могут быть верными в огромном большинстве случаев и экономят наши заботы и время, связанные с оценкой вероятных следствий. Но сами правила действия должны быть тщательно проверены с точки зрения их способности приносить счастье, и, где речь идет о действительно важных решениях, может быть необходимо помнить, что правила не являются абсолютными. Денежная реформа обычно связана с чем-то вроде воровства, а война предполагает убийство. Государственный деятель, который должен решить вопрос о реформе денег или об объявлении войны, должен исходить из правил и самым лучшим образом оценить вероятные последствия. Только в этом смысле вероятность может быть руководителем жизни, и то только в определенных обстоятельствах.
   Имеется, однако, в этом афоризме и другой менее важный смысл, который, возможно, и имел в виду епископ Батлер. Этот смысл заключается в том, что мы должны практически трактовать как достоверное все то, что имеет очень высокую степень вероятности. Это является вопросом только обыденного здравого смысла и не ставит никакого вопроса, представляющего какой-либо интерес для теории вероятности.
   ГЛАВА 7.
   ВЕРОЯТНОСТЬ И ИНДУКЦИЯ.
   А. Постановка проблемы.
   Проблема индукции сложна, имеет различные аспекты и ответвления. Я начну с постановки проблемы индукции через простое перечисление.
   1. Основным вопросом, которому подчинены другие, является следующий вопрос: если дано, что какие-то случаи класса а оказались принадлежавшими к классу p, то делает ли это вероятным а), что следующий случай a будет p, или б), что все а будут p?
   2. Если каждая из этих вероятностей нее является истинной универсально, то существуют ли такие ограничения альфа и (бета, которые делают эти вероятности истинными?
   3. Если каждая вероятность истинна с соответствующими ограничениями, то является ли она при таком ограничении законом логики или законом природы?
   4. Получается ли она из какого-либо другого принципа, вроде естественных видов, или принципа ограничения многообразия Кейнса, или господства закона, или принципа единообразия природы, или какого-либо другого принципа?
   5. Должен ли принцип индукции формулироваться в другой форме, а именно: если дано предположение h, которое имеет много известных истинных следствий и не имеет известных ложных, то делает ли этот факт h вероятным? И если не делает вообще, то делает ли при соответствующий обстоятельствах?
   6. Какова минимальная форма индуктивного постулата, который будет, если он истинен, делать правильными принятые научные выводы?
   7. Имеется ли какое-либо основание - и если имеется, то какое считать этот минимальный постулат истинным? Если же такого основания нет, то имеется ли тем не менее основание действовать так, как если бы оно было истинным?
   Обсуждая все это, нет нужды помнить о неопределенности слова "вероятный", как оно обычно употребляется. Когда я говорю, что при определенных обстоятельствах "вероятно", что следующая а будет p, я надеюсь, что смогу интерпретировать это в соответствии с теорией конечной частоты. Если же я говорю, что индуктивный принцип "вероятно" истинен, я принужден употреблять слово "вероятно" для выражения высокой степени правдоподобия. Благодаря недостаточно отчетливому различению этих двух значений слова "вероятно" легко могут возникнуть разного рода смешения.
   Споры и обсуждения, которыми мы займемся, имеют свою историю, которую можно считать начавшейся с Юма. По большому числу частных вопросов были получены определенные результаты; иногда эти вопросы сначала не признавались за частные. Но теперь соответствующее исследование сделало совершенно очевидным, что обсуждения технических вопросов, достигшие некоторых результатов, мало что дали для главной проблемы, которая остается, по существу такой же:
   как ее сформулировал Юм.
   Б. Индукция через простое перечисление.
   Индукция через простое перечисление представляет собой следующий принцип: "Если дано некоторое число n случаев а, которые оказались p, и если при этом не оказалось ни одного а, которое не было бы p, тогда два утверждения: (а) "следующее а будет p" и (б) "все а суть p" - оба имеют вероятность, которая повышается по мере увеличения n и стремится к достоверности как к пределу, по мере того как n стремится к бесконечности".
   Я буду называть (а) "частной индукцией" и (б) "общей индукцией". Таким образом, (а) утверждает на основании нашего знания о смертности людей в прошлом, что, вероятно, г-н такой-то умрет, тогда как (6) утверждает, что, вероятно, все люди смертны.
   Прежде чем перейти к более трудным или сомнительным вопросам, сформулируем некоторые довольно важные вопросы, которые могут быть решены без особых затруднений. Эти вопросы следующие:
   1. Если индукция должна служить целям, которым, как мы думаем, она служит в науке, то "вероятность" должна быть так интерпретирована, что утверждение вероятности утверждает факт; это требует, чтобы связанный с этим род вероятности был выводным из истинности и ложности, в не был бы неопределимым, а это в свою очередь делает конечно-частотную интерпретацию более или менее неизбежной.
   2. Индукция, по-видимому, недействительна в применении к ряду натуральных чисел.
   3. Индукция недействительна в качестве логического принципа.
   4. Индукция требует, чтобы случаи, на которых ока основывается, были даны в виде последовательности, а не только в виде класса.
   5. Всякое ограничение, которое может оказаться необходимым, чтобы сделать принцип действенным, должно быть сформулировано в терминах интенсивности, посредством которой определяются классы а и p, а не в терминах экстенсивности.
   6. Если число вещей во вселенной конечно или если какой-либо ограниченный класс является единственным, относящимся к индукции, тогда индукция для достаточного числа n становится доказательной; но на практике это не имеет значения, потому что тогда относящиеся к делу n были бы большими по числу, чем это может когда-либо быть в любом действительном исследовании.
   Я теперь перехожу к доказательству этих предложений.
   1. Если "вероятность" берется как неопределимая, то мы должны допустить, что невероятное может произойти и что, следовательно, предложение вероятности ничего не говорит нам о ходе вещей в природе. Если принять этот взгляд, то индуктивный принцип может быть правильным, но всякий вывод, сделанный в соответствии с ним, может все же оказаться ложным; это невероятно, но не невозможно. Следовательно, мир, в котором индукция оказывается истинной, эмпирически не отличим от мира, в котором она оказывается ложной. Из этого следует, что никогда не может быть какого-либо свидетельства в пользу или против этого принципа и что он не может помочь нам сделать вывод о том, что произойдет. Если этот принцип должен служить своей цели, то мы должны интерпретировать слово "вероятный" как обозначающее "то, что обычно действительно происходит"; это значит, что мы должны интерпретировать вероятность как частоту.
   2. Индукция в арифметике. В арифметике легко дать примеры таких индукций, которые ведут к истинным заключениям, и таких, которые ведут к ложным. Джевонс приводит два примера:
   5, 15, 35, 45, 65, 95
   7, 17, 37, 47, 67, 97
   В первой строке каждое число оканчивается на 5 и делится на 5; это может привести к предположению, что каждое число, оканчивающееся на 5, делится на 5, что является истинным. Во втором ряду каждое число оканчивается на 7 и является простым; это могло бы привести к предположению, что каждое число, оканчивающееся на 7, является простым, что было бы ложным.
   Или возьмем следующий пример: "Каждое четное целое число является суммой двух простых". Это истинно в каждом случае, в каком это было проверено, а число таких случаев громадно. Тем не менее остается обоснованное сомнение относительно того, является ли это всегда истинным.
   В качестве поразительного примера недостаточности индукции в арифметике возьмем следующее: пусть Пи(х) = числу простых чисел больше или равно х
   Известно, что когда х - велико, Пи(х) и li(х) почти равны. Также известно, что для каждого известного простого числа
   Пи (х) < li(x) .
   Гаусс предположил, что это неравенство имеет место всегда. Это было проверено для всех простых числе до 107 и для очень многих сверх этого, и не было обнаружено ни одного частного случая ложности этого предположения. Тем не менее Литлвуд доказал в 1912 году, что имеется бесконечное число простых чисел, для которых это предположение оказывается ложным, а Скьюз (Skewes)' доказал, что оно ложно для некоторых чисел меньших чем
   34
   10
   10
   10
   Видно, что хотя предположение Гаусса и оказалось ложным, все же оно имело в свою пользу гораздо лучшее индуктивное свидетельство, чем какое существует в пользу наших даже наиболее твердо установленных эмпирических обобщений.
   Даже не вдаваясь так глубоко в теорию чисел, легко сконструировать ложные индукции в арифметике в любом нужном количестве. Например, ни одно число, меньшее чем n, не делится на n. Мы можем сделать n как угодно большим, и таким образом, получить сколько угодно свидетельств в пользу обобщения: 'Ни одно число не делится на n".
   Ясно, что любые n целых чисел должны обладать многими общими свойствами, которыми большинство целых чисел не обладает. Для начала, если m есть наибольшее из них, то все они обладают бесконечно редким свойством быть не большими чем m. Следовательно, ни общая, ни частная индукции не действенны в применении к целым числам, если свойство, к которому индукция должна быть применена, не является как-либо ограниченным. Я не знаю, как сформулировать такое ограничение, и все же любой хороший математик в отношении свойства, по видимости допускающего действенную индукцию, будет иметь чувство, аналогичное обыденному здравому смыслу. Если вы заметили, что 1 + 3 = 22, 1 + 3 + 5 = З2, 1 + + 3 + 5 + 7 = 42, то вы будете склонны предположить, что
   1 + 3 + 5 + ... + (2n - 1) = N2 ,
   и легко может быть доказано, что это предположение правильно. Подобным же образом, если вы заметили, что 13 + 23 = З2, 13 + 23 + З3 = б2, 13 + 23 + З3 + 43 = 102, то вы можете предположить, что сумма первых я кубов всегда равна какому-либо числу в квадрате, и это опять-таки легко доказать. Математическая интуиция никоим образом не является безошибочной в отношении таких индукций, но у хороших математиков она, по-видимому, чаще бывает правильной, чем ошибочной. Я не знаю, как ясно выразить то, что руководит математической интуицией в таких случаях, А пока мы можем только сказать, что никакое известное ограничение не сделает индукцию действенной в применении к натуральным числам.
   3. Индукция не действенна в качестве логического принципа. Ясно, что если мы можем выбрать наш класс бета по желанию, то мы легко можем убедиться, что наша индукция будет ошибочной. Пусть а1, а2, ..., an" будет до сего времени наблюденными членами класса а, все члены которого оказались членами класса p, и пусть an+1) будет следующим членом класса альфа. Поскольку дело касается чистой логики, класс бета может состоять только из членов а1, а2, ..., an" или может состоять из всего, что есть во вселенной, кроме an+1; или может состоять из любого класса, промежуточного для этих двух. В любом из этих случаев индукция в отношении an+1) будет ложной.
   Ясно (как может сказать возражающий), что класс бета не должен быть тем, что можно было бы назвать "искусственным" классом, то есть классом, частично определяемым через объем. В случаях определенного рода, наблюдаемых в индуктивном выводе, p всегда является классом, который известен по содержанию, а не по объему, кроме случаев, касающихся наблюденных членов а1, a2, ..., an и таких других членов класса p, но не членов класса альфа, которые могли наблюдаться.
   Очень легко построить явно недейственные индукции. Деревенский житель мог бы сказать: весь скот, который я когда-либо видел находится в Херефордшире; следовательно, вероятно, весь скот находится в этой части страны. Или мы могли бы утверждать: ни один человек, живущий сейчас, не умер, следовательно, вероятно, все люди, живущие сейчас, бессмертны. Ошибки в таких индукциях очень заметны, но они не были бы ошибками, если бы индукция была чисто логическим принципом.
   Ясно поэтому, что для того, чтобы индукция не была явно ложной, класс p должен иметь определенные характерные признаки или должен каким-либо особым образом относиться к классу а. Я не утверждаю, что с этими ограничениями этот принцип должен быть истинным; я утверждаю, что без этих ограничений он должен быть ложным.
   4. В эмпирическом материале явления идут во временном порядке и, следовательно, всегда составляют последовательность. Когда мы решаем вопрос, применима ли индукция в арифметике, мы, естественно, думаем о числах как расположенных в порядке величины. Но если бы мы могли расположить их произвольно, мы могли бы получить странные результаты; например, как мы видели, мы можем доказать, что бесконечно невероятным является то, что число, выбранное наудачу, не будет простым.
   Для формулировки частной индукции существенно, чтобы был следующий случай, который требует упорядочения в последовательности.
   Если должно быть какое-то оправдание для общей индукции, то необходимо чтобы первые n членов класса а оказались членами класса p, а не просто чтобы а и p имели бы n членов общих. Это опять-таки требует расположения в последовательности.
   5. Если допустить, что для признания индуктивного вывода действенным необходимо, чтобы между классами а и p было какое-то отношение или какая-либо характеристика одного из них, в силу которых он является действенным, то ясно, что это отношение должно быть между содержаниями, например между "человеческим" и "смертным" или между "жвачным" и "имеющим раздвоенные копыта". Мы стараемся вывести объемные отношения, но мы первоначально не знаем объемов а и p, когда имеем дело с эмпирически данными классами, новые члены которых становятся известными время от времени. Каждый признает предложение "Собаки лают" хорошим индуктивным выводом, мы ожидаем соответствия между видимым образом животного и шумом, который оно издает. Это ожидание является, конечно, результатом другой, более широкой индукции, но это сейчас меня не касается. Меня касается соответствие между определенной внешней формой и определенным шумом, притом, что и то и другое являются содержаниями, и тот факт, что некоторые содержания кажутся нам более подходящими для индуктивного соотнесения, чем некоторые другие.
   6. Этот пункт ясен. Если вселенная конечна, то полное перечисление теоретически возможно, а до тех пор, пока оно не сделано, обыкновенное исчисление вероятности показывает, что индукция, вероятно, действенна. Но на практике это соображение не имеет значения из-за диспропорции между числом вещей, которые мы можем наблюдать, и числом вещей во вселенной.
   Теперь обратимся в общему принципу, помня, что мы должны поискать какое-либо ограничение, которое сделает его возможно действенным. Возьмем сначала частную индукцию. Эта индукция говорит, что если сделанный наудачу набор n членов класса альфа состоит полностью из членов класса p, то вероятно, что следующий член класса а будет p, то есть что большинство оставшихся альфа будет бета. Нужно, чтобы само это положение было только вероятным. Мы можем предположить, что а есть конечный класс, содержащий, скажем, N членов. Мы знаем, что из них по крайней мере n суть члены класса p. Если все число членов а, являющихся членами p, есть m, то все число способов получения n членов есть N! /(n ! (N - n)!), а все число способов получения n членов, которые суть альфа, есть m!/(n! (m - n)!), "м обозначает произведение всех целых чисел от 1 до N. Следовательно, шанс набора, состоящего целиком из а, есть
   Если Pm есть априорная вероятность того, что m есть число членов, общих для а и p, тогда вероятность после того, как произведен опыт, есть
   Назовем ее qm . Если число членов, общих для а и р, есть m, тогда после изъятия n членов а, которые суть р, остается m- n членов бета и N-п членов не-бета. Следовательно, из предположения, что а и р имеют m общих членов, мы получаем вероятность qm (m - n)/(N-n) других бета. Следовательно, общая вероятность есть
   Значение этого полностью зависит от Pm, для оценки которых нет действенного способа. Если мы вместе с Лапласом допустим, что каждое значение m равно вероятно, то мы получим результат Лапласа, что шанс, что следующее а будет р, есть (n +1)/(n +2). Если мы допустим, что априори каждое а одинаково вероятно будет р и не будет р, то мы получим значение 1/2. Даже при предположении Лапласа общая индукция имеет вероятность только (n +1)/(/V+1), которая бывает обычно небольшим.
   Нам нужно, следовательно, какое-либо предположение, которое делает pm, большим, когда m почти равно N. А всякий шанс этого предположения на то, чтобы быть действенным, должен зависеть от природы классов а и (3.
   В. Математическая трактовка индукции.
   Со времени Лапласа делались различные попытки показать, что вероятная истинность индуктивного вывода вытекает из математической теории вероятности. Теперь всеми признается, что все эти попытки были безуспешными и что если индуктивные доказательства должны быть действенными, то это должно быть в силу какой-либо внелогической характеристики действительного мира в его противоположности различным логически возможным мирам, какие только могут представляться умственному взору логика.
   Первое из таких доказательств принадлежит Лапласу. В своей истинной, чисто математической форме оно имеет следующий вид:
   Имеется n+1 сумок, сходных друг с другом по внешнему виду, каждая из которых содержит n шаров. В первой - все шары черные; во второй - один белый и все остальные черные; r +1-й сумке r шаров белые и остальные черные. Из этих сумок выбирается одна, состав которой неизвестен, и из нее вынимается m шаров. Все они оказываются белыми. Какова вероятность, (а) что следующий вынутый шар будет белым, (б) что мы выбрали сумку, состоящую из одних белых шаров?
   Ответ таков: (а) шанс, что следующий шар будет белым, равен (n +1)/(m +2), (б) шанс, что мы выбрали сумку, в которой все шары белые, равен (m +1)/(n +1). Этот правильный результат имеет непосредственную интерпретацию на основе конечно-частотной теории. Но Лаплас делает вывод, что если m членов А оказались членами В, то шанс, что следующий А будет равен В, равен (m+1)/(m +2), и что шанс, что все А суть В, равен (m +1)/(n +1). Он получает этот результат с помощью допущения, что при данном числе n объектов, о которых мы не знаем ничего, вероятности, что 0, 1, 2, ..., n из этих объектов суть B, все равны. Это, конечно, является абсурдным допущением. Если мы заменим его несколько менее абсурдным допущением, что каждый из этих объектов имеет равный шанс быть или не быть В, то шанс, что следующий А будет В, остается равным 1/2, как бы много А ни оказались B.
   Даже если бы его доказательство было принято, общая индукция остается невероятной, если n гораздо больше, чем m, хотя частная индукция может быть в высокой степени вероятной. В действительности же, однако, его доказательство является только историческим раритетом.
   Кейнс в своей книге "Трактат о вероятности" сделал наилучшее, что только может быть сделано для индукции на чисто математической основе, и решил, что она неадекватна. Его результат следующий.
   Пусть g будет обобщение, х1, x2; ... - наблюденные случаи, благоприятные для обобщения, и h - общие обстоятельства, поскольку они относятся к делу.
   Допустим
   и так далее
   Пусть
   Таким образом, Pn есть вероятность общей индукции после n благоприятных случаев. Напишем д вместо отрицания д и P0 вместо g/h, то есть априорной вероятности обобщения. Тогда
   По мере того как n увеличивается, эта дробь стремится к 1 как пределу, если
   стремится к нулю как пределу; а это случится, если имеются конечные количества e и j такие, что для всех достаточно больших r
   Рассмотрим эти два условия. Первое говорит, что имеется количество 1 е, меньшее, чем 1, такое, что если обобщение ложно, то вероятность того, что следующий случай будет благоприятным, после определенного числа благоприятных случаев будет всегда меньше, чем это количество. Рассмотрим в качестве примера его ошибочности обобщение "все числа суть непростые". По мере того как мы движемся по ряду чисел, простые числа становятся более редкими, и шанс, что следующее число после г непростых будет само непростое, возрастает и стремится к достоверности как пределу, если г удерживается постоянным. Это условие, следовательно, может оказаться недостаточным.
   Но второе условие, что д должно еще до начала индукции иметь вероятность, большую, чем какая-либо конечная вероятность, гораздо труднее. В общем трудно найти какой-либо способ оценки этой вероятности. Какова была бы вероятность предложения "Все лебеди белые" для человека, который никогда не видел лебедя или ничего не слышал о цвете лебедей? Такие вопросы и темны и неопределенны, и Кейнс признает, что они делают его результат неудовлетворительным. Я вернусь к этому вопросу в главе II части шестой. Имеется одно простое предположение, которое способно дать ту конечную вероятность, которой хочет Кейнс. Предположим, что число вещей во вселенной конечно, скажем N. Пусть бета будет классом, состоящим из n вещей, и пусть а будет произвольным набором m вещей. Тогда число возможных альфа будет
   а число тех, которые содержатся в ,бета, будет
   Следовательно, шанс, что все а суть р, равен
   что является конечным. Это значит, что каждое обобщение, в отношении которого мы не имеем свидетельства, имеет конечный шанс быть истинным.