Страница:
Я вернусь в Рейхенбаху в связи с индукцией. А сейчас я хочу разъяснить мой собственный взгляд в отношении связи математической вероятности с естественным ходом вещей в природе. Возьмем в качестве примера закон больших чисел Бернулли, выбрав самый простой из возможных случаев. Мы видели, что если мы соберем все возможные целые числа, состоящие из n знаков, каждое из которых будет или 1, или 2, то, если n является большим скажем, не меньшим, чем 1000,- огромное большинство возможных целых чисел будет иметь приблизительно одинаковое число единиц и двоек. Это есть только применение того факта, что при разложении бинома (х + у)n, когда n большое, сумма биноминальных коэффициентов около середины будет мало отличаться от суммы всех коэффициентов, каковая равна 2n. Но какое это имеет отношение к утверждению, что если я буду достаточно много раз бросать монету, то я, вероятно, получу приблизительно одинаковое число выпадений лицевой и оборотной сторон? Первое есть логический факт, второе, очевидно, является эмпирическим фактом; какова же связь между ними?
При некоторых интерпретациях "вероятности" утверждение, содержащее слово "вероятный", никогда не может быть эмпирическим утверждением. Признается, что то, что не является вероятным, может произойти, а то, что считается вероятным, может не произойти. Из этого следует, что то, что на самом деле происходит, не показывает, что прежнее суждение о вероятности было или правильным, или ложным; любой воображаемый ход событий логически совместим с любой предшествующей оценкой вероятности, какую только можно вообразить. Это можно отрицать только в том случае, если мы будем считать, что то, что в высокой степени невероятно, не происходит, чего мы не имеем права думать. В частности, если индукция утверждает только вероятности, тогда все то, что может произойти, логически совместимо как с истинностью, так и с ложностью индукции. Следовательно, индуктивный принцип не имеет эмпирического содержания. Это есть reductio ad absurdum и показывает, что мы должны связывать вероятное с действительным теснее, чем это иногда делается.
Если мы согласимся с теорией конечной частоты - а я пока не вижу оснований не соглашаться с ней,- то скажем, что, утверждая вероятность суждения "о есть А "при том, что "а есть B", мы имеем в виду, что действительно большинство членов B является членами А Это есть утверждение факта, а не утверждение об a. И если я скажу, что индуктивный аргумент (соответствующим образом сформулированный и ограниченный) делает заключение из него вероятным, то я имею в виду, что он является одним из класса аргументов, из большинства которых вытекают истинные заключения.
Что теперь могу я иметь в виду, когда говорю, что шанс выпадения лицевой стороны монеты равен половине? Начнем с того, что это, если оно истинно, является эмпирическим фактом; это не следует из того факта, что в бросании монеты есть только две возможности: выпадение лицевой и оборотной сторон. Если бы это следовало из него, мы могли бы сделать вывод, что шанс того, что какой-либо незнакомец называется Эбинизер Уилкс Смит, равен половине, поскольку здесь есть только две возможности, именно что он или называется, или не называется так. В некоторых монетах лицевая сторона выпадает чаще, чем оборотная; в других оборотная чаще, чем лицевая. Когда я говорю, не конкретизируя монету, что шанс выпадения лицевой стороны равен половине, то что я имею в виду?
Мое утверждение, как и все другие эмпирические утверждения, претендующие на численную точность, будет только приблизительным. Когда я говорю, что рост человека равен 6 футам 1 дюйму, мне разрешается до определенных пределов допускать ошибку; даже если бы я поклялся, что у меня нет ошибки, то все равно меня нельзя было бы обвинить в том, что я клятвопреступник, если даже окажется, что я ошибаюсь на одну сотую дюйма. Точно так же нельзя считать, что я высказал ложное утверждение о моменте, если окажется, что 0,500001 будет более точной оценкой, чем 0,5. Однако сомнительно, сможет ли какое бы то ни было свидетельство заставить меня думать, что 0,500001 является лучшей оценкой, чем 0,5. В теории вероятности, как и всюду, мы берем наиболее простое предположение, приблизительно соответствующее фактам. Возьмем, скажем, закон падения тел. Галилей сделал некоторое количество наблюдений, которые более или менее соответствовали формуле s = 1/2 gt2. Без сомнения, он мог бы найти такую функцию f(t), что s = f(t) соответствовала бы его наблюдениям более точно, но он предпочел простую формулу с достаточно хорошим соответствием. Точно так же, если я бросил монету 2000 раз и получил 999 выпадений лицевой стороны и 1001 оборотной стороны, я должен считать шанс выпадения лицевой стороны равным половине. Но что именно должен я иметь в виду, утверждая это?
Этот вопрос показывает силу определения Рейхенбаха. Согласно ему, я имею в виду, что если я буду продолжать бросать достаточно долго, то пропорция выпадений лицевой стороны со временем будет постоянно очень близкой к 1/2; действительно, она будет отличаться от 1/2 на величину, меньшую, чем сколь угодно малая дробь. Это предсказание; если оно правильно, то моя оценка вероятности верна, если же неправильно, то она будет неверной. Что может теория конечной частоты противопоставить этому?
Мы должны различать между тем, что есть вероятность, и тем, что она вероятно есть. Что касается того, что вероятность есть, то это зависит от класса рассматриваемых нами бросаний. Если мы рассматриваем бросание с данной монетой, тогда, если за все время своего существования эта монета даст m выпадений лицевой стороны из общего числа A бросаний, вероятность выпадения лицевой стороны у этой монеты будет m/n. Если же мы рассматриваем монеты вообще, то n должно быть общим числом бросаний всех монет, какие только существовали и будут существовать на протяжении всей прошедшей и будущей истории мира, а m - числом всех выпадений лицевой стороны. Чтобы сделать вопрос менее обширным, мы можем ограничиться бросаниями, имевшими место в этом году в Англии, или бросаниями, попавшими в таблицы исследований вероятности. Во всех этих случаях m и n - конечные числа, а m/n есть вероятность выпадении лицевой стороны при данных условиях.
Но ни одна из приведенных выше вероятностей не известна. Мы поэтому вынуждены оценить их, то есть найти какой-либо способ решить, что они вероятно представляют собой. Если мы присоединяемся к теории конечной частоты, то это значит, что наша последовательность выпадений лицевой и оборотной сторон должна быть членом какого-то ограниченного класса последовательности и что мы должны иметь какое-то относящееся к делу знание обо всем этом классе. Предположим, что мы наблюдали, что в каждой последовательности из 10000 или более бросаний данной монеты отношение выпадений лицевой стороны после 5000-го бросания никогда не изменялось более чем на 2е, где е - очень мало. Мы можем тогда сказать: в каждом наблюдаемом случае отношение выпадений лицевой стороны после 5000 бросков данной монеты всегда оставалось между p - е и p + s, где p есть постоянная, зависящая от монеты. Аргументировать, исходя из этого, к случаю, еще не наблюденному, есть дело индукции. Для того чтобы это заключение было действительным, мы нуждаемся в аксиоме о том, что (при определенных обстоятельствах) признак, присутствующий во всех наблюденных случаях, присутствует в большом отношении всех случаев;
или во всяком случае нам нужна какая-либо аксиома, из которой вытекала бы эта. Тогда мы сможем выводить из наблюденных частот вероятную вероятность, интерпретируя вероятность в согласии с теорией конечной частоты.
Вышеизложенное является только набросками теории. Главное, что я хочу подчеркнуть, есть то, что по теории, которую я защищаю, всякое утверждение вероятности (в противоположность только сомнительному утверждению) есть утверждение факта, касающегося какого-либо отношения в последовательности. В частности, индуктивный принцип - все равно, истинный или ложный - должен утверждать, что как факт большинство последовательностей определенного вида имеет повсюду любой признак определенного рода, который имеется у большого числа следующих друг за другом членов последовательностей. Если это факт, то индуктивные аргументы могут давать вероятность; если же это не так, то не могут. Сейчас я не исследую, каким образом, мы можем знать, является ли это фактом или нет; эту проблему я не буду рассматривать до последней части нашего исследования.
Из сказанного можно видеть, что в результате вышеприведенного обсуждения мы пришли к согласию с Рейхенбахом по многим пунктам, хотя определенно не согласны с ним в отношении определения вероятности. Главное мое возражение против его определения -то, что частота, от которой оно зависит, гипотетична и не поддается удостоверению. Я не согласен с ним также и а том, что более резко по сравнению с ним различаю вероятность и сомнительность, и в том, что считаю, что логика вероятности с логической точки зрения не является основной в противоположность логике достоверности.
ГЛАВА 5.
ТЕОРИЯ ВЕРОЯТНОСТИ КЕЙНСА.
Сочинение Кейнса "Трактат о вероятности" (Treatise on Probability, 1921) выдвигает теорию, которая в некотором смысле является антитезой теории частоты. Он считает, что отношение, применяемое в дедукции, именно "p имплицирует q", есть крайняя форма отношения, которое может быть названо "p более или менее имплицирует q". "Если знание h,- говорит он,оправдывает рациональную веру в а степени а, то мы говорим, что имеется отношение вероятности степени а между о и h". Мы записываем это: "a/h=а". "Между двумя рядами предложений существует отношение, в силу которого, если мы знаем первый, мы можем приписать второму некоторую степень рациональной веры". Вероятность, по существу, есть отношение: "Так же бесполезно говорить "b вероятно", как и "b равно "или "b больше, чем". Из "a "и "a имплицирует b" мы можем вывести "b"; это значит, что мы можем опустить всякое упоминание посылки и просто утверждать заключение. Но если а так относится к b, что зияние a превращает вероятную веру в b в рациональную, то мы не можем вообще ничего заключить о b, которое не имеет отношения к а; нет ничего соответствующего опусканию истинной посылки в доказательном выводе.
Вероятность, согласно Кейнсу, есть логическое отношение, которое не может быть определено иначе, кроме как, возможно, в терминах степеней рациональной веры. Но в целом кажется, что Кейнс скорее склоняется к определению "степеней рациональной веры" в терминах отношения вероятности. Рациональная вера, говорит он, есть нечто производное от знания: когда мы имеем степень рациональной веры в p, это происходит потому, что мы знаем какое-либо предложение h, а также знаем, что p/h = а. Из этого следует, что среди наших посылок должны быть некоторые предложения формы "p/h = а". Наше знание бывает отчасти непосредственным, а отчасти приобретается через умозаключение; наше знание, приобретаемое через умозаключение, осуществляется благодаря непосредственному знанию предложений формы "p имплицирует q", или "q/p = а ". Во всяком умозаключении, если его полностью проанализировать, мы должны иметь непосредственное знание отношения посылок к заключению, будь это отношение импликацией или отношением вероятности в какой-либо степени. Знание h и того, что p/h=а, ведет к "рациональной вере соответствующей степени" в p. Кейнс открыто признает, что все непосредственное знание достоверно и что рациональная вера, которой недостает достоверности, может возникнуть только через восприятие отношения вероятности.
Вероятности вообще, согласно Кейнсу, не поддаются числовому измерению; те же вероятности, которые поддаются ему, образуют весьма частный класс вероятностей. Он считает, что одна вероятность не может сравниться с другой, то есть не может быть ни большей, ни меньшей, чем другая, ни быть даже равной ей. Он считает даже, что иногда невозможно сравнивать вероятности p и не-p на основе данного свидетельства. Он не имеет при этом в виду, что мы недостаточно знаем, чтобы делать это; он думает, что действительно нет отношения равенства или неравенства. Он думает о вероятностях согласно следующей геометрической схеме: возьмем две точки, представляющие собой 0 невозможности и 1 достоверности; тогда численно измеримые вероятности могут быть изображены лежащими на прямой линии между 0 и 1, тогда как другие лежат на различных кривых, идущих от 0 к 1. Мы можем сказать, что из двух вероятностей, находящихся на одной и той же линии, та, которая находится ближе к 1, является большей, но мы не можем сравнивать вероятности, находящиеся на разных линиях, за исключением тех случаев, когда две линии перекрещиваются, что может случиться.
Кейнсу, как мы видели, нужно непосредственное знание предложений вероятности. Для того чтобы положить начало получению такого знания, он исследует и исправляет то, что называется "принципом недостаточного основания", или, как он предпочитает называть его, "принципом индифферентности".
В своей грубой форме этот принцип утверждает, что если нет известного основания в пользу какой-либо одной из нескольких возможностей, то все эти возможности равно вероятны. В этой форме, как указывает Кейнс, этот принцип ведет к противоречиям. Допустим, например, что вы ничего не знаете о цвете какой-либо определенной книги; тогда шансы, что она синяя или не синяя, одинаковым и, следовательно, каждый равен 1/2. Точно так же шанс, что она черная, равен тоже 1/2. Следовательно, шанс того, что она синяя или черная, равен 1. Из этого следует, что все книги или синие, или черные, что абсурдно. Или предположим, что мы знаем, что некий определенный человек живет или же в Великобритании, или в Ирландии; возьмем ли мы в качестве наших возможностей эти страны, или возьмем Англию, Шотландию и Ирландию, или возьмем каждое графство как одинаково вероятное? Или если мы знаем, что удельный вес определенного вещества находится между 1 и 3, то будем ли мы рассматривать интервалы от 1 до 2 и от 2 до 3 как равно вероятные? Но если мы примем во внимание относительный объем, то естественно выбрать интервалы от 1 до 2/3 и от 2/3 до 1/3 что создает одинаковые шансы для того, чтобы удельный вес был или между 1 и 3/2 или между 3/2 и 3. Такие парадоксы можно увеличивать бесконечно.
Из-за этого Кейнс не расстается полностью с принципом индифферентности; он думает, что этот принцип может быть так сформулирован, что можно будет избежать вышеупомянутых затруднений и что он будет все еще полезен. Для этой цели он сначала определяет то, что является "не относящимся к делу".
Грубо говоря, добавленная посылка является "не относящейся к делу", если она не изменяет вероятности, то есть h1 не связано с отношением к x и h, если x/h1h = x/h. Таким образом, например, тот факт, что фамилия человека начинается с буквы M, не имеет отношения к оценке шансов его смети. Вышеприведенное определение является, однако, до некоторой степени слишком простым, потому что h\ может состоять из двух частей, из которых одна может повышать вероятность х, тогда как другая - понижать ее. Например: шансы жизни белого человека понижаются при жизни его в тропиках, но повышаются (или так по крайней мере говорят), если он ведет трезвый образ жизни. Может быть, смертность среди белых трезвенников в тропиках та же, что и вообще у белых людей, но мы не можем сказать, что трезвый образ жизни человека, живущего в тропиках, не имеет отношения к этому вопросу. Поэтому мы говорим, что h1 не имеет отношения к x/h, если нет никакой части h1, которая изменяет вероятность x.
Кейнс теперь формулирует принцип индифферентности в следующей форме: вероятности событий а и b в отношении к данному свидетельству одинаковы, если нет относящегося к событию a свидетельства без соответствующего свидетельства, относящегося к событию b; это значит, что вероятности событий а и b в отношении свидетельства равны, если это свидетельство симметрично по отношению к о и b.
Здесь, однако, все же добавляется довольно трудное условие. "Мы должны исключить те случаи, в которых одна из относящихся к делу альтернатив сама является дизъюнкцией подчиненных альтернатив той же самой формы". Когда это условие выполняется, альтернативы называются неделимыми по отношению к свидетельству. Кейнс дает следующее формальное определение "делимых" альтернатив: альтернатива f (a) делима по отношению к свидетельству h, если, при данном h, "f(a) эквивалентно f(b)" или "f(с)", где f(b) и f(с) несовместимы, но каждое возможно, когда b истинно. Здесь существенно, что f(a), f(b) и f(с) все суть значения одной и той же пропорциональной функции.
Кейнс, таким образом, в конце концов признает в качестве аксиомы тот принцип, что, при данном свидетельстве, f(a) и f(a) равно вероятны, если (1) свидетельство симметрично по отношению к a и b (2) в отношении свидетельства f(a) и f(b) неделимы.
По отношению к вышеприведенной теории эмпиристы могут выдвинуть общее возражение. Они могут сказать, что непосредственное знание отношений вероятности, которого она требует, явно невозможно. Дедуктивная доказательная логика - как этот аргумент можно было выразить - возможна потому, что она состоит из тавтологий, потому, что она просто переформирует наш запас исходных предложений другими словами. Когда она делает больше этого - когда, например, она выводит предложение "Сократ смертен" из предложения "Все люди смертны",- она зависит от опыта, связанного со значением слова "Сократ". Ничто, кроме тавтологий, не может быть познано независимо от опыта, а Кейнс не утверждает, что его отношения вероятности являются тавтологиями. Как же в таком случае они могут быть познаны? Ибо ясно, что они не познаются из опыта в том смысле, в котором мы можем говорить это о суждениях восприятия; вместе с тем признается, что некоторые из них не выводятся. Они поэтому составили бы - если их признать - такой род знания, который эмпиризм считает невозможным.
Я очень сочувствую этому возражению, но не думаю, что его можно рассматривать как решающее. Когда мы подойдем к обсуждению принципов научного вывода, мы увидим, что наука невозможна без некоторого знания, которого мы не могли бы иметь, если бы эмпиризм в его строгой форме был прав. Во всяком случае, мы не должны догматически считать, что эмпиризм прав, хотя и имеется оправдание нашим попыткам найти совместимые с эмпиризмом решения наших проблем. Вышеприведенное возражение поэтому, хотя и может служить причиной известного нерасположения к принятию теории Кейнса, не должно, однако же, заставлять нас отвергать ее совершенно.
Имеется трудность в вопросе, который Кейнс, по-видимому, адекватно не рассмотрел, а именно: сообщает ли вероятность, относящаяся к посылкам, рациональное правдоподобие предложению, которое превращается в вероятное, и если да, то при каких обстоятельствах? Кейнс говорит, что так же бессмысленно говорить, что "p вероятно", как и говорить, что "p равно "или "p больше, чем". Согласно ему, здесь нет ничего аналогичного опущению истинной посылки в дедуктивном выводе. Тем не менее, он говорит, что если мы знаем h и знаем также, что p/h = а, то мы вправе придавать p "рациональную веру в соответствующей степени". Но когда мы поступаем так, мы больше не выражаем отношение p к h, мы пользуемся этим отношением для того, чтобы что-либо вывести относительно p. Это "что-либо" мы можем назвать "рациональным правдоподобием" и можем сказать, что "p рационально правдоподобно в степени а". Но если это должно быть истинным утверждением p, не предполагающим упоминания о h, тогда b не может быть произвольным. Ибо предположим, что P/h = a, а p/h' = a; должны ли мы при допущении, что h и h' известны, придавать p степень а или а' рационального правдоподобия? Невозможно, чтобы оба ответа были правильны при любом данном состоянии нашего знания.
Если верно, что "вероятность есть руководитель жизни", тогда при любом данном состоянии нашего знания должна быть одна вероятность, которая относится к p более существенным образом, чем любая другая, и эта вероятность не может быть относительной по отношению к произвольным посылкам. Мы должны сказать, что это есть вероятность, которая получается, когда h рассматривается как все наше относящееся к делу знание. Мы можем сказать: при любой данной совокупности предложений, составляющих определенное знание какого-либо лица, при том, что связь этой совокупности предложений называется n, имеется некоторое число предложений, не являющихся членами этой совокупности, которые имеют к ней отношения вероятности. Если p есть также предложение, a p/h = а, тогда для этого лица а есть степень рационального правдоподобия, принадлежащего p. Мы не должны говорить, что если h' есть некое истинное предложение, несколько отличающееся от h, которое известно лицу, о котором идет речь, и если p/h' = а', тогда для этого лица p имеет степень правдоподобия а'; оно будет иметь только эту степень правдоподобия для лица, знание которого, относящееся к делу, суммируется через h'. Со всем этим, однако, Кейнс, безусловно, согласится. Возражение на самом деле относится только к некоторой рыхлости формулировки, а не к чему-либо существенному в этой теории.
Более существенное возражение касается наших средств познания предложений, вроде таких, как p/h = а. Я сейчас не утверждаю априори, что мы не можем их знать; я интересуюсь только вопросом, как мы можем их знать. Нетрудно заметить, что если "вероятность" не может быть определена, то должны быть такие предложения вероятности, которые не могут быть доказаны и которые, следовательно, если принять их, должны быть среди посылок нашего познания. Это является общей чертой всех логически расчлененных систем. Каждая такая система по необходимости начинает с исходного аппарата не получивших определения терминов и недоказанных предложений. Ясно, что не получивший определения термин не может появиться в выводном предложении, если он не появился по крайней мере в одном из недоказанных предложений, тогда как нет необходимости в том, чтобы получивший определение термин появлялся в каком-либо недоказанном предложении. Например, пока считалось, что в арифметике участвуют термины, не получившие определения, приходилось считать, что в ней не должны быть также и недоказанные аксиомы: Пеано имел дело с тремя неопределенными терминами и пятью аксиомами. Но когда числа и сложение определяются логически, арифметика не нуждается в каких-либо недоказанных предложениях, кроме предложений логики.
Итак, в нашем случае если "вероятность" может быть определена, то возможно, что могут быть выведены все предложения, в которых это слово встречается; но если она не может быть определена, то должны быть - если мы в состоянии что-либо знать об этом - содержащие это слово предложения, которые мы знаем без свидетельства со стороны.
Не совсем ясно, какого рода предложения Кейнс склонен признавать в качестве посылок в нашем познании вероятности. Познаем ли мы непосредственно предложения формы "p/h = a"? И что представляет собой а, когда вероятность численно не измеряется? Или мы знаем только равенства и неравенства, то есть что p/h < q/h или p/h = q/h7 Я склонен думать, что Кейнс придерживается последнего взгляда. Но если так, то основными в этом вопросе являются отношения трех предложений, а не двух-, мы должны начинать с тернарного отношения
p(p, q, h),
что значит: при данном h, p является менее вероятным, чем q. Мы могли бы в таком случае сказать, что "p/h = q/h", значит, "ни p(p, q, h), ни P(q, p, h)". Мы должны были бы допустить, что p является асимметричным и транзитивным по отношению к p и q, когда h постоянно. Принцип индифферентности Кейнса, если его принять, тогда позволит нам при определенных обстоятельствах доказать, что p/h = q/h. A на этом основании исчисление вероятностей - насколько Кейнс считает его действительным может быть построено.
При некоторых интерпретациях "вероятности" утверждение, содержащее слово "вероятный", никогда не может быть эмпирическим утверждением. Признается, что то, что не является вероятным, может произойти, а то, что считается вероятным, может не произойти. Из этого следует, что то, что на самом деле происходит, не показывает, что прежнее суждение о вероятности было или правильным, или ложным; любой воображаемый ход событий логически совместим с любой предшествующей оценкой вероятности, какую только можно вообразить. Это можно отрицать только в том случае, если мы будем считать, что то, что в высокой степени невероятно, не происходит, чего мы не имеем права думать. В частности, если индукция утверждает только вероятности, тогда все то, что может произойти, логически совместимо как с истинностью, так и с ложностью индукции. Следовательно, индуктивный принцип не имеет эмпирического содержания. Это есть reductio ad absurdum и показывает, что мы должны связывать вероятное с действительным теснее, чем это иногда делается.
Если мы согласимся с теорией конечной частоты - а я пока не вижу оснований не соглашаться с ней,- то скажем, что, утверждая вероятность суждения "о есть А "при том, что "а есть B", мы имеем в виду, что действительно большинство членов B является членами А Это есть утверждение факта, а не утверждение об a. И если я скажу, что индуктивный аргумент (соответствующим образом сформулированный и ограниченный) делает заключение из него вероятным, то я имею в виду, что он является одним из класса аргументов, из большинства которых вытекают истинные заключения.
Что теперь могу я иметь в виду, когда говорю, что шанс выпадения лицевой стороны монеты равен половине? Начнем с того, что это, если оно истинно, является эмпирическим фактом; это не следует из того факта, что в бросании монеты есть только две возможности: выпадение лицевой и оборотной сторон. Если бы это следовало из него, мы могли бы сделать вывод, что шанс того, что какой-либо незнакомец называется Эбинизер Уилкс Смит, равен половине, поскольку здесь есть только две возможности, именно что он или называется, или не называется так. В некоторых монетах лицевая сторона выпадает чаще, чем оборотная; в других оборотная чаще, чем лицевая. Когда я говорю, не конкретизируя монету, что шанс выпадения лицевой стороны равен половине, то что я имею в виду?
Мое утверждение, как и все другие эмпирические утверждения, претендующие на численную точность, будет только приблизительным. Когда я говорю, что рост человека равен 6 футам 1 дюйму, мне разрешается до определенных пределов допускать ошибку; даже если бы я поклялся, что у меня нет ошибки, то все равно меня нельзя было бы обвинить в том, что я клятвопреступник, если даже окажется, что я ошибаюсь на одну сотую дюйма. Точно так же нельзя считать, что я высказал ложное утверждение о моменте, если окажется, что 0,500001 будет более точной оценкой, чем 0,5. Однако сомнительно, сможет ли какое бы то ни было свидетельство заставить меня думать, что 0,500001 является лучшей оценкой, чем 0,5. В теории вероятности, как и всюду, мы берем наиболее простое предположение, приблизительно соответствующее фактам. Возьмем, скажем, закон падения тел. Галилей сделал некоторое количество наблюдений, которые более или менее соответствовали формуле s = 1/2 gt2. Без сомнения, он мог бы найти такую функцию f(t), что s = f(t) соответствовала бы его наблюдениям более точно, но он предпочел простую формулу с достаточно хорошим соответствием. Точно так же, если я бросил монету 2000 раз и получил 999 выпадений лицевой стороны и 1001 оборотной стороны, я должен считать шанс выпадения лицевой стороны равным половине. Но что именно должен я иметь в виду, утверждая это?
Этот вопрос показывает силу определения Рейхенбаха. Согласно ему, я имею в виду, что если я буду продолжать бросать достаточно долго, то пропорция выпадений лицевой стороны со временем будет постоянно очень близкой к 1/2; действительно, она будет отличаться от 1/2 на величину, меньшую, чем сколь угодно малая дробь. Это предсказание; если оно правильно, то моя оценка вероятности верна, если же неправильно, то она будет неверной. Что может теория конечной частоты противопоставить этому?
Мы должны различать между тем, что есть вероятность, и тем, что она вероятно есть. Что касается того, что вероятность есть, то это зависит от класса рассматриваемых нами бросаний. Если мы рассматриваем бросание с данной монетой, тогда, если за все время своего существования эта монета даст m выпадений лицевой стороны из общего числа A бросаний, вероятность выпадения лицевой стороны у этой монеты будет m/n. Если же мы рассматриваем монеты вообще, то n должно быть общим числом бросаний всех монет, какие только существовали и будут существовать на протяжении всей прошедшей и будущей истории мира, а m - числом всех выпадений лицевой стороны. Чтобы сделать вопрос менее обширным, мы можем ограничиться бросаниями, имевшими место в этом году в Англии, или бросаниями, попавшими в таблицы исследований вероятности. Во всех этих случаях m и n - конечные числа, а m/n есть вероятность выпадении лицевой стороны при данных условиях.
Но ни одна из приведенных выше вероятностей не известна. Мы поэтому вынуждены оценить их, то есть найти какой-либо способ решить, что они вероятно представляют собой. Если мы присоединяемся к теории конечной частоты, то это значит, что наша последовательность выпадений лицевой и оборотной сторон должна быть членом какого-то ограниченного класса последовательности и что мы должны иметь какое-то относящееся к делу знание обо всем этом классе. Предположим, что мы наблюдали, что в каждой последовательности из 10000 или более бросаний данной монеты отношение выпадений лицевой стороны после 5000-го бросания никогда не изменялось более чем на 2е, где е - очень мало. Мы можем тогда сказать: в каждом наблюдаемом случае отношение выпадений лицевой стороны после 5000 бросков данной монеты всегда оставалось между p - е и p + s, где p есть постоянная, зависящая от монеты. Аргументировать, исходя из этого, к случаю, еще не наблюденному, есть дело индукции. Для того чтобы это заключение было действительным, мы нуждаемся в аксиоме о том, что (при определенных обстоятельствах) признак, присутствующий во всех наблюденных случаях, присутствует в большом отношении всех случаев;
или во всяком случае нам нужна какая-либо аксиома, из которой вытекала бы эта. Тогда мы сможем выводить из наблюденных частот вероятную вероятность, интерпретируя вероятность в согласии с теорией конечной частоты.
Вышеизложенное является только набросками теории. Главное, что я хочу подчеркнуть, есть то, что по теории, которую я защищаю, всякое утверждение вероятности (в противоположность только сомнительному утверждению) есть утверждение факта, касающегося какого-либо отношения в последовательности. В частности, индуктивный принцип - все равно, истинный или ложный - должен утверждать, что как факт большинство последовательностей определенного вида имеет повсюду любой признак определенного рода, который имеется у большого числа следующих друг за другом членов последовательностей. Если это факт, то индуктивные аргументы могут давать вероятность; если же это не так, то не могут. Сейчас я не исследую, каким образом, мы можем знать, является ли это фактом или нет; эту проблему я не буду рассматривать до последней части нашего исследования.
Из сказанного можно видеть, что в результате вышеприведенного обсуждения мы пришли к согласию с Рейхенбахом по многим пунктам, хотя определенно не согласны с ним в отношении определения вероятности. Главное мое возражение против его определения -то, что частота, от которой оно зависит, гипотетична и не поддается удостоверению. Я не согласен с ним также и а том, что более резко по сравнению с ним различаю вероятность и сомнительность, и в том, что считаю, что логика вероятности с логической точки зрения не является основной в противоположность логике достоверности.
ГЛАВА 5.
ТЕОРИЯ ВЕРОЯТНОСТИ КЕЙНСА.
Сочинение Кейнса "Трактат о вероятности" (Treatise on Probability, 1921) выдвигает теорию, которая в некотором смысле является антитезой теории частоты. Он считает, что отношение, применяемое в дедукции, именно "p имплицирует q", есть крайняя форма отношения, которое может быть названо "p более или менее имплицирует q". "Если знание h,- говорит он,оправдывает рациональную веру в а степени а, то мы говорим, что имеется отношение вероятности степени а между о и h". Мы записываем это: "a/h=а". "Между двумя рядами предложений существует отношение, в силу которого, если мы знаем первый, мы можем приписать второму некоторую степень рациональной веры". Вероятность, по существу, есть отношение: "Так же бесполезно говорить "b вероятно", как и "b равно "или "b больше, чем". Из "a "и "a имплицирует b" мы можем вывести "b"; это значит, что мы можем опустить всякое упоминание посылки и просто утверждать заключение. Но если а так относится к b, что зияние a превращает вероятную веру в b в рациональную, то мы не можем вообще ничего заключить о b, которое не имеет отношения к а; нет ничего соответствующего опусканию истинной посылки в доказательном выводе.
Вероятность, согласно Кейнсу, есть логическое отношение, которое не может быть определено иначе, кроме как, возможно, в терминах степеней рациональной веры. Но в целом кажется, что Кейнс скорее склоняется к определению "степеней рациональной веры" в терминах отношения вероятности. Рациональная вера, говорит он, есть нечто производное от знания: когда мы имеем степень рациональной веры в p, это происходит потому, что мы знаем какое-либо предложение h, а также знаем, что p/h = а. Из этого следует, что среди наших посылок должны быть некоторые предложения формы "p/h = а". Наше знание бывает отчасти непосредственным, а отчасти приобретается через умозаключение; наше знание, приобретаемое через умозаключение, осуществляется благодаря непосредственному знанию предложений формы "p имплицирует q", или "q/p = а ". Во всяком умозаключении, если его полностью проанализировать, мы должны иметь непосредственное знание отношения посылок к заключению, будь это отношение импликацией или отношением вероятности в какой-либо степени. Знание h и того, что p/h=а, ведет к "рациональной вере соответствующей степени" в p. Кейнс открыто признает, что все непосредственное знание достоверно и что рациональная вера, которой недостает достоверности, может возникнуть только через восприятие отношения вероятности.
Вероятности вообще, согласно Кейнсу, не поддаются числовому измерению; те же вероятности, которые поддаются ему, образуют весьма частный класс вероятностей. Он считает, что одна вероятность не может сравниться с другой, то есть не может быть ни большей, ни меньшей, чем другая, ни быть даже равной ей. Он считает даже, что иногда невозможно сравнивать вероятности p и не-p на основе данного свидетельства. Он не имеет при этом в виду, что мы недостаточно знаем, чтобы делать это; он думает, что действительно нет отношения равенства или неравенства. Он думает о вероятностях согласно следующей геометрической схеме: возьмем две точки, представляющие собой 0 невозможности и 1 достоверности; тогда численно измеримые вероятности могут быть изображены лежащими на прямой линии между 0 и 1, тогда как другие лежат на различных кривых, идущих от 0 к 1. Мы можем сказать, что из двух вероятностей, находящихся на одной и той же линии, та, которая находится ближе к 1, является большей, но мы не можем сравнивать вероятности, находящиеся на разных линиях, за исключением тех случаев, когда две линии перекрещиваются, что может случиться.
Кейнсу, как мы видели, нужно непосредственное знание предложений вероятности. Для того чтобы положить начало получению такого знания, он исследует и исправляет то, что называется "принципом недостаточного основания", или, как он предпочитает называть его, "принципом индифферентности".
В своей грубой форме этот принцип утверждает, что если нет известного основания в пользу какой-либо одной из нескольких возможностей, то все эти возможности равно вероятны. В этой форме, как указывает Кейнс, этот принцип ведет к противоречиям. Допустим, например, что вы ничего не знаете о цвете какой-либо определенной книги; тогда шансы, что она синяя или не синяя, одинаковым и, следовательно, каждый равен 1/2. Точно так же шанс, что она черная, равен тоже 1/2. Следовательно, шанс того, что она синяя или черная, равен 1. Из этого следует, что все книги или синие, или черные, что абсурдно. Или предположим, что мы знаем, что некий определенный человек живет или же в Великобритании, или в Ирландии; возьмем ли мы в качестве наших возможностей эти страны, или возьмем Англию, Шотландию и Ирландию, или возьмем каждое графство как одинаково вероятное? Или если мы знаем, что удельный вес определенного вещества находится между 1 и 3, то будем ли мы рассматривать интервалы от 1 до 2 и от 2 до 3 как равно вероятные? Но если мы примем во внимание относительный объем, то естественно выбрать интервалы от 1 до 2/3 и от 2/3 до 1/3 что создает одинаковые шансы для того, чтобы удельный вес был или между 1 и 3/2 или между 3/2 и 3. Такие парадоксы можно увеличивать бесконечно.
Из-за этого Кейнс не расстается полностью с принципом индифферентности; он думает, что этот принцип может быть так сформулирован, что можно будет избежать вышеупомянутых затруднений и что он будет все еще полезен. Для этой цели он сначала определяет то, что является "не относящимся к делу".
Грубо говоря, добавленная посылка является "не относящейся к делу", если она не изменяет вероятности, то есть h1 не связано с отношением к x и h, если x/h1h = x/h. Таким образом, например, тот факт, что фамилия человека начинается с буквы M, не имеет отношения к оценке шансов его смети. Вышеприведенное определение является, однако, до некоторой степени слишком простым, потому что h\ может состоять из двух частей, из которых одна может повышать вероятность х, тогда как другая - понижать ее. Например: шансы жизни белого человека понижаются при жизни его в тропиках, но повышаются (или так по крайней мере говорят), если он ведет трезвый образ жизни. Может быть, смертность среди белых трезвенников в тропиках та же, что и вообще у белых людей, но мы не можем сказать, что трезвый образ жизни человека, живущего в тропиках, не имеет отношения к этому вопросу. Поэтому мы говорим, что h1 не имеет отношения к x/h, если нет никакой части h1, которая изменяет вероятность x.
Кейнс теперь формулирует принцип индифферентности в следующей форме: вероятности событий а и b в отношении к данному свидетельству одинаковы, если нет относящегося к событию a свидетельства без соответствующего свидетельства, относящегося к событию b; это значит, что вероятности событий а и b в отношении свидетельства равны, если это свидетельство симметрично по отношению к о и b.
Здесь, однако, все же добавляется довольно трудное условие. "Мы должны исключить те случаи, в которых одна из относящихся к делу альтернатив сама является дизъюнкцией подчиненных альтернатив той же самой формы". Когда это условие выполняется, альтернативы называются неделимыми по отношению к свидетельству. Кейнс дает следующее формальное определение "делимых" альтернатив: альтернатива f (a) делима по отношению к свидетельству h, если, при данном h, "f(a) эквивалентно f(b)" или "f(с)", где f(b) и f(с) несовместимы, но каждое возможно, когда b истинно. Здесь существенно, что f(a), f(b) и f(с) все суть значения одной и той же пропорциональной функции.
Кейнс, таким образом, в конце концов признает в качестве аксиомы тот принцип, что, при данном свидетельстве, f(a) и f(a) равно вероятны, если (1) свидетельство симметрично по отношению к a и b (2) в отношении свидетельства f(a) и f(b) неделимы.
По отношению к вышеприведенной теории эмпиристы могут выдвинуть общее возражение. Они могут сказать, что непосредственное знание отношений вероятности, которого она требует, явно невозможно. Дедуктивная доказательная логика - как этот аргумент можно было выразить - возможна потому, что она состоит из тавтологий, потому, что она просто переформирует наш запас исходных предложений другими словами. Когда она делает больше этого - когда, например, она выводит предложение "Сократ смертен" из предложения "Все люди смертны",- она зависит от опыта, связанного со значением слова "Сократ". Ничто, кроме тавтологий, не может быть познано независимо от опыта, а Кейнс не утверждает, что его отношения вероятности являются тавтологиями. Как же в таком случае они могут быть познаны? Ибо ясно, что они не познаются из опыта в том смысле, в котором мы можем говорить это о суждениях восприятия; вместе с тем признается, что некоторые из них не выводятся. Они поэтому составили бы - если их признать - такой род знания, который эмпиризм считает невозможным.
Я очень сочувствую этому возражению, но не думаю, что его можно рассматривать как решающее. Когда мы подойдем к обсуждению принципов научного вывода, мы увидим, что наука невозможна без некоторого знания, которого мы не могли бы иметь, если бы эмпиризм в его строгой форме был прав. Во всяком случае, мы не должны догматически считать, что эмпиризм прав, хотя и имеется оправдание нашим попыткам найти совместимые с эмпиризмом решения наших проблем. Вышеприведенное возражение поэтому, хотя и может служить причиной известного нерасположения к принятию теории Кейнса, не должно, однако же, заставлять нас отвергать ее совершенно.
Имеется трудность в вопросе, который Кейнс, по-видимому, адекватно не рассмотрел, а именно: сообщает ли вероятность, относящаяся к посылкам, рациональное правдоподобие предложению, которое превращается в вероятное, и если да, то при каких обстоятельствах? Кейнс говорит, что так же бессмысленно говорить, что "p вероятно", как и говорить, что "p равно "или "p больше, чем". Согласно ему, здесь нет ничего аналогичного опущению истинной посылки в дедуктивном выводе. Тем не менее, он говорит, что если мы знаем h и знаем также, что p/h = а, то мы вправе придавать p "рациональную веру в соответствующей степени". Но когда мы поступаем так, мы больше не выражаем отношение p к h, мы пользуемся этим отношением для того, чтобы что-либо вывести относительно p. Это "что-либо" мы можем назвать "рациональным правдоподобием" и можем сказать, что "p рационально правдоподобно в степени а". Но если это должно быть истинным утверждением p, не предполагающим упоминания о h, тогда b не может быть произвольным. Ибо предположим, что P/h = a, а p/h' = a; должны ли мы при допущении, что h и h' известны, придавать p степень а или а' рационального правдоподобия? Невозможно, чтобы оба ответа были правильны при любом данном состоянии нашего знания.
Если верно, что "вероятность есть руководитель жизни", тогда при любом данном состоянии нашего знания должна быть одна вероятность, которая относится к p более существенным образом, чем любая другая, и эта вероятность не может быть относительной по отношению к произвольным посылкам. Мы должны сказать, что это есть вероятность, которая получается, когда h рассматривается как все наше относящееся к делу знание. Мы можем сказать: при любой данной совокупности предложений, составляющих определенное знание какого-либо лица, при том, что связь этой совокупности предложений называется n, имеется некоторое число предложений, не являющихся членами этой совокупности, которые имеют к ней отношения вероятности. Если p есть также предложение, a p/h = а, тогда для этого лица а есть степень рационального правдоподобия, принадлежащего p. Мы не должны говорить, что если h' есть некое истинное предложение, несколько отличающееся от h, которое известно лицу, о котором идет речь, и если p/h' = а', тогда для этого лица p имеет степень правдоподобия а'; оно будет иметь только эту степень правдоподобия для лица, знание которого, относящееся к делу, суммируется через h'. Со всем этим, однако, Кейнс, безусловно, согласится. Возражение на самом деле относится только к некоторой рыхлости формулировки, а не к чему-либо существенному в этой теории.
Более существенное возражение касается наших средств познания предложений, вроде таких, как p/h = а. Я сейчас не утверждаю априори, что мы не можем их знать; я интересуюсь только вопросом, как мы можем их знать. Нетрудно заметить, что если "вероятность" не может быть определена, то должны быть такие предложения вероятности, которые не могут быть доказаны и которые, следовательно, если принять их, должны быть среди посылок нашего познания. Это является общей чертой всех логически расчлененных систем. Каждая такая система по необходимости начинает с исходного аппарата не получивших определения терминов и недоказанных предложений. Ясно, что не получивший определения термин не может появиться в выводном предложении, если он не появился по крайней мере в одном из недоказанных предложений, тогда как нет необходимости в том, чтобы получивший определение термин появлялся в каком-либо недоказанном предложении. Например, пока считалось, что в арифметике участвуют термины, не получившие определения, приходилось считать, что в ней не должны быть также и недоказанные аксиомы: Пеано имел дело с тремя неопределенными терминами и пятью аксиомами. Но когда числа и сложение определяются логически, арифметика не нуждается в каких-либо недоказанных предложениях, кроме предложений логики.
Итак, в нашем случае если "вероятность" может быть определена, то возможно, что могут быть выведены все предложения, в которых это слово встречается; но если она не может быть определена, то должны быть - если мы в состоянии что-либо знать об этом - содержащие это слово предложения, которые мы знаем без свидетельства со стороны.
Не совсем ясно, какого рода предложения Кейнс склонен признавать в качестве посылок в нашем познании вероятности. Познаем ли мы непосредственно предложения формы "p/h = a"? И что представляет собой а, когда вероятность численно не измеряется? Или мы знаем только равенства и неравенства, то есть что p/h < q/h или p/h = q/h7 Я склонен думать, что Кейнс придерживается последнего взгляда. Но если так, то основными в этом вопросе являются отношения трех предложений, а не двух-, мы должны начинать с тернарного отношения
p(p, q, h),
что значит: при данном h, p является менее вероятным, чем q. Мы могли бы в таком случае сказать, что "p/h = q/h", значит, "ни p(p, q, h), ни P(q, p, h)". Мы должны были бы допустить, что p является асимметричным и транзитивным по отношению к p и q, когда h постоянно. Принцип индифферентности Кейнса, если его принять, тогда позволит нам при определенных обстоятельствах доказать, что p/h = q/h. A на этом основании исчисление вероятностей - насколько Кейнс считает его действительным может быть построено.