Страница:
где N есть число гораздо большее, чем то, которого мы можем достичь в действительном эксперименте. В этом случае наши индукции становились бы эмпирически фальсифицированными как раз тогда, когда мы думали бы, что они прочно установлены. Или опять-таки с любой эмпирической последовательностью могло бы случиться, что через некоторое время она перестала бы подчиняться закону и перестала бы в каком бы то ни было смысл стремиться к пределу. Если в таком случае вышеприведенное распространение нашего определения на бесконечные последовательности нужно применить к эмпирическим последовательностям, то мы должны будем ввести какую-то индуктивную аксиому. Без этого нет основания ожидать, что более поздние части такой последовательности будут продолжать подчиняться тому закону, которому подчиняются более ранние ее части.
В обычных эмпирических суждениях вероятности, таких, например, которые содержатся в прогнозах погоды, имеется смесь различных элементов, которые важно отделить друг от друга. Самым простым предположением - чрезмерно упрощенным здесь для целей иллюстрации - является предположение на основе наблюдения какого-либо симптома, который, скажем, в девяноста процентах случаев, в которых он прежде наблюдался, сопровождался дождем. В этом случае, если бы индуктивные аргументы были столь же бесспорны, как и дедуктивные, мы сказали бы, что "имеется девяностопроцентная вероятность дождя". Это значит, что настоящий момент относится к определенному классу (классу моментов, когда вышеупомянутый симптом налицо), девяносто процентов членов которого являются моментами, предшествующими дождю. Это вероятность в уже разобранном нами математическом смысле. Но не только это делает нас неуверенными в отношении наступления дождя. Мы не уверены также и в отношении бесспорности самого вывода; мы не чувствуем уверенности в том, что за этим симптомом будет в будущем следовать дождь в девяти случаях из десяти. И это сомнение может быть двух видов - научным и философским. Сохраняя в общем полное доверие к методам науки, мы можем чувствовать, что в этом случае слишком мало данных, чтобы обеспечить индукцию, или что не проявлено достаточной заботы для элиминирования других обстоятельств, которые также могут быть налицо и могут быть более неизменными предшественниками дождя. Кроме того, записи могут быть сомнительными: они могли быть испорчены дождем и стать недоступными, для расшифровки или могли быть сделаны человеком, о котором вскоре после этого стало известно, что он ненормален. Такие сомнения относятся к научным методам, но существуют также сомнения, выдвинутые Юмом: является ли индуктивный метод действительным или только удобной для нас привычкой? Все или любое из этик оснований могут заставить нас колебаться в отношении девяностопроцентного шанса дождя, в который наши свидетельства склоняют нас верить.
В случаях такого рода мы имеем иерархию вероятностей. Первая ступень: вероятно, будет дождь. Вторая ступень: вероятно, симптомы, которые я заметил, являются признаками вероятного дождя. Третья ступень: вероятно, определенного рода события делают определенные будущие события вероятными. Из этих трех ступеней первая характеризует обыденный здравый смысл, вторая есть уровень науки и третья - философии.
На первой ступени мы наблюдали, что до сего времени в девяти случаях из десяти за А следовало В; в прошлом, следовательно, А делало В вероятным в смысле конечной частоты. На этой стадии мы без размышления предполагаем, что мы можем ожидать это же самое и в будущем.
На второй ступени, не ставя под вопрос общую возможность выведения будущего из настоящего, мы сознаем, что такие выводы должны подчиняться определенным гарантиям, таким, например, как гарантии четырех методов Милля. Мы сознаем, также, что индукции, даже когда они осуществляются в соответствии с наилучшими правилами, не всегда подтверждаются. Но я думаю, что наши действия все же могут быть включены в сферу теории конечной частоты. Мы осуществили в прошлом какое-то количество индукций, одних более, других менее тщательно. Из осуществленных в соответствии с определенной процедурой пропорция P до сих пор подтверждалась; следовательно, эта процедура до сего времени сообщала вероятность p тем индукциям, которые ома санкционировала. Научный метод в значительной мере состоит из правил, посредством которых p (испытанное прошлыми результатами прошлых индукций) может быть больше приближено к 1. Все это находится все еще в пределах теории конечной частоты, но теперь уже только индукции являются единственными членами в нашей оценке частоты.
Это значит, что мы имеет два класса A и B, из которых A состоит из индукций, которые были осуществлены в соответствии с определенными правилами, а В состоит из индукций, которые до сего времени подтверждались опытом. Если n есть число членов A, а m есть число членов, общих для A и B, тогда m/n есть шанс, что индукция, осуществленная в соответствии с вышеупомянутыми правилами, приведет в настоящее время к результатам, которые оказались бы истинными, если бы могли быть проверены.
Говоря это, мы не пользуемся индукцией; мы просто описываем черты естественного порядка вещей, поскольку его наблюдали. Мы, однако, нашли критерий высокого качества (до сего времени) всякого предлагаемого правила научной процедуры и нашли его в пределах конечной частоты. Единственно новое есть то, что наши единицы теперь являются не единичными событиями, а индукциями. Индукции трактуются как события, и только те из них, которые действительно имели место, должны рассматриваться, как члены нашего класса.
Но как только мы начинаем доказывать или то, что какая-либо отдельная индукция, которая к настоящему времени подтвердилась, будет или вероятно будет подтверждена в будущем, или то, что правила процедуры, дававшие до сих пор большую пропорцию индукций, которые к настоящему времени были подтверждены, способны давать большую пропорцию подтвержденных индукций в будущем, мы выходим за пределы теории конечной частоты, поскольку мы здесь имеем дело с классами, члены которых неизвестны. Математическая теория вероятности, как и вся чистая математика, хотя и дает знание, не даст (по крайней мере в одном весьма важном смысле) чего-либо нового; индукция же, напротив, определенно дает что-то новое, и сомнение касается только того, является ли то, что она дает, знанием.
Я пока не хочу исследовать индукцию критически, я хочу только выяснить, что она не может быть введена в сферу теории конечной частоты, даже если мы будем рассматривать отдельную индукцию как одну из класса индукций, поскольку проверенные индукции могут давать только индуктивное свидетельство в пользу еще не проверенной индукции. Если затем мы скажем, что принцип, оправдывающий индукцию, является "вероятным", то мы должны употреблять слово "вероятный" в ином смысле, чем оно употребляется в теории конечной частоты; этот смысл должен - как я сказал бы - быть тем, что мы называли "степенью правдоподобия".
Я склонен думать, что если признать индукцию или любой другой постулат, который мы решим поставить вместо нее, то все точные и измеримые вероятности могут быть интерпретированы как конечные частоты. Допустим, что я, например, говорю, что "имеется высокая степень вероятности, что Зороастр существовал". Чтобы обосновать это утверждение, я должен буду рассмотреть сначала, каковы относящиеся к этому вопросу свидетельства, а затем поискать подобные свидетельства, о которых известно, что они правдивы или неверны. Класс, от которого зависит вероятность, не является классом пророков существующих и несуществующих, ибо, включая несуществующих, мы делаем этот класс до некоторой степени неопределенным; не может этот класс быть также классом только существующих пророков, поскольку исходным вопросом как раз и является вопрос, принадлежит ли Зороастр к этому классу. Мы должны будем рассуждать следующим образом: в случае вопроса о Зороастре имеется свидетельство, принадлежащее к определенному классу А; мы находим что из всех свидетельств, которые принадлежат к этому классу и которые могут быть проверены, отношение p оказывается правдивым свидетельством; мы, следовательно, может сделать индуктивный вывод, что есть вероятность p в пользу подобных свидетельств в случае Зороастра. Таким образом, частота плюс индукция оказываются достаточными для этого использования вероятности.
Или допустим, что, подобно епископу Батлеру, мы говорим:
"Вероятно, что вселенная является результатом замысла Создателя" Здесь мы начинаем с таких вспомогательных аргументов, как аргумент, что создание часов предполагает часового мастера. Имеется множество образцов часов, о которых известно, что они сделаны часовыми мастерами, и нет ни одних часов, о которых было бы известно, что они сделаны не часовым мастером. В Китае существует вид мрамора, который иногда чисто случайно производит впечатление картины, созданной художником; я видел поразительные примеры этого.
Но это бывает так редко, что, когда мы видим картину, мы бываем правы (допуская индукцию), делая с очень высокой степенью вероятности вывод о создавшем ее художнике. Епископу-логику остается - как он и подчеркивает это заглавием своей книги - доказать эту аналогию. Это может считаться сомнительным делом, но, конечно, не может быть подведено под математическую вероятность.
Пока, следовательно, может казаться, что сомнительность и математическая вероятность - последняя в смысле конечной частоты - являются единственными понятиями, необходимыми в добавление к законам природы и правилам логики. Это заключение, однако, является только предварительным. Нельзя сказать ничего окончательного, пока мы не рассмотрим некоторые другие предложенные определения "вероятности".
ГЛАВА 4.
ТЕОРИЯ ЧАСТОТЫ МИЗЕСА-РЕЙХЕНБАХА.
Частотная интерпретация вероятности в форме, отличающейся от интерпретации, данной в предшествующей главе, была развита в двух имеющих большое значение книгах германских профессоров, которые жили тогда в Константинополе.
Труд Рейхенбаха является развитием труда Мизеса и в различных отношениях лучшей формулировкой той же самой теории. Я поэтому ограничусь рассмотрением теории Рейхенбаха.
Изложив аксиомы исчисления вероятности, Рейхенбах предлагает далее интерпретацию, которая, по-видимому, внушена статистическими корреляциями. Он исходит из допущения двух последовательностей (x1, х2, ... , xn...), (y1, y2, .... Уn...) и двух классов О и p. Некоторые или все х принадлежат к классу O; его интересует вопрос: как часто соответствующие у принадлежат к классу P?
Допустим, например, что вы исследуете вопрос, предрасположен ли мужчина к самоубийству вследствие того, что он имеет сварливую жену. В этом случае x обозначает жен, а у - мужей, класс О состоит из сварливых женщин, а класс p - из самоубийц. Тогда при том, что жена принадлежит к классу О, наш вопрос заключается в следующем: как часто ее муж принадлежит к классу p?
Рассмотрим отрезки двух последовательностей, состоящие из первых n членов каждой последовательности. Допустим, что среди первых n членов х имеется a членов, принадлежащих к классу О, и допустим, что из них имеется b членов, таких, что соответствуют у и принадлежат к классу p; соответствующий у есть член с тем же самым индексом. Тогда мы говорим, что во всем отрезке от х1 до Xn "относительная частота" О и P есть b/а. Если все х принадлежат к классу О, то а=n и относительная частота есть b/n. Обозначим эту относительную частоту выражением "Hn (О, p)".
Теперь перейдем к определению "вероятности p при данном О", которую мы обозначим как "W(0, p)". Определение следующее: W (О, p) есть предел Нn(0, p), по мере того как n неограниченно увеличивается.
Это определение может быть значительно упрощено с помощью небольшого использования математической логики. Во-первых, нет необходимости иметь две последовательности, так как предполагается, что обе являются рядами (progressions) и имеется, следовательно, взаимно-однозначное соответствие их членов. Если это соответствие есть S, то сказать, что определенный член у принадлежит к классу p, равнозначно тому, что сказать, что соответствующий х принадлежит к классу членов, имеющих отношение S к тому или другому из членов P. Например, пусть S есть отношение жены к мужу, тогда если у есть женатый мужчина, ax - его жена, то утверждение, что у есть правительственный чиновник, является истинным, и только в том случае, если х есть жена правительственного чиновника.
Во-вторых, нет никакого преимущества в принятии случая, в котором не все х принадлежат к классу О. Определение применимо только в том случае, если бесконечное число членов х принадлежит к классу О, в этом случае те х, которые принадлежат к О, образуют ряд, а остальные могут быть отброшены. Таким образом, мы удержим все существенное в определении Рейхенбаха, если подставим следующее.
Пусть О будет рядом, а a каким-либо классом, из числа членов которого в важных случаях имеются члены, которые в последовательности О являются последующими за любым данным членом. Пусть m будет число членов а среди первых n членов О. Тогда W(О, а) определяется как предел m/n, когда n неограниченно возрастает.
Возможно, по недосмотру Рейхенбах говорит, как если бы понятие вероятности было применимо только к бесконечным рядам и не было применимо к конечным класса. Я не могу думать, что он имел это в виду. Человеческая раса, например, есть конечный класс, и мы хотим применить вероятность к статистике жизни, что было бы невозможно согласно букве определения. Психологически, когда Рейхенбах говорит о пределе для n-бесконечности, он думает о предел как некотором числе, к которому легко приблизиться всякий раз, когда n с эмпирической точки зрения является большим, то есть когда оно недалеко от того максимума, который наши средства наблюдения позволяют нам достичь. У него есть аксиома или постулат о том, что, когда есть такое число для каждого большого доступного наблюдению n, оно приблизительно равно пределу для n-бесконечности. Это нелепая аксиома не только потому, что она произвольна, но и потому, что большинство рядов, с которыми нам приходится иметь дело вне чистой математики не являются бесконечными; в самом деле, можно сомневаться, являются ли таковыми какие-либо из них. Мы привыкли считать пространство-время непрерывным, что предполагает существование бесконечных рядов; но это предположение не имеет иного основания, кроме математического удобства.
Для того чтобы сделать теорию Рейхенбаха насколько возможно более адекватной, я буду исходить из того, что там, где речь идет о конечных классах, должно быть сохранено определение, данное в предшествующей главе, и что новое определение имеет целью только расширение, позволяющее нам применять вероятность к бесконечным классам. Таким образом, его Нn(0, p) будет вероятностью, но приложимой только к первым n членам ряда.
То, что Рейхенбах постулирует в качестве своей формы индукции, есть нечто вроде следующего. Допустим, что мы сделали N наблюдений в отношении корреляции О и p, так что мы в состоянии вычислить Нn (О, p) для всех значений n до n=N, и допустим, что во всей последней половине значений n вероятность Hn(О, p) всегда отличается от определенной дроби p меньше, чем на е, где e - мало. Тогда мы утверждаем, что, сколько бы мы ни увеличивали n, вероятность Нn(0, p) будет все-таки находиться в этих узких границах, и, следовательно, W (О, p), являющееся пределом для n-бесконечности, будет также лежать в этих границах. Без этого допущения мы не можем иметь эмпирического свидетельства в отношении предела для n-бесконечности, и вероятности, для которых, определение специально предназначено, должны оставаться неизвестными.
В защиту теории Рейхенбаха перед лицом вышеупомянутых затруднений можно высказать два соображения. Во-первых, он может утверждать, что нет необходимости предполагать, что n беспредельно стремится к бесконечности; для всех практических целей достаточно, если n будет очень большим. Допустим, например, что мы занимаемся статистикой жизни. Для страховой компании не имеет значения, что произойдет со статистикой, если она будет продолжена на следующие десять тысяч лет; ее могут касаться самое большее следующие сто лет. Если, собрав статистические данные, мы предполагаем, что частоты останутся приблизительно теми же самыми даже тогда, когда мы соберем в десять раз больше данных, чем мы собрали, то этого будет достаточно почти для всех практических целей. Рейхенбах может сказать, что, когда он говорит о бесконечности, он пользуется удобной математической стенографией, имея в виду только "гораздо больше, чем мы до сих пор исследовали". Он может сказать, что этот случай совершенно аналогичен случаю эмпирического определения скорости. Теоретически скорость может быть определена только, если нет предела малости измеряемых отрезков пространства и времени; в практике, поскольку такой предел имеется, мгновенная скорость никогда не может быть известна даже приблизительно. Правда, мы можем узнать с достаточно большой точностью среднюю скорость на протяжении короткого промежутка времени. Но даже если мы предположим постулат непрерывности, средняя скорость на протяжении, скажем, секунды не дает абсолютно никакого указания на мгновенную скорость в данный момент в интервале этой секунды. Все движение может состоять из периодов покоя, разделенных моментами бесконечно большой скорости. Но даже и помимо этой крайней гипотезы и даже если мы допустим непрерывность в математическом смысле, любая конечная мгновенная скорость несовместима с какой-либо конечной средней скоростью на протяжении конечного интервала времени - как бы он короток ни был, - содержащего этот момент. Для практических целей, однако, это не имеет значения. За исключением таких немногих явлений, как взрывы, если мы принимаем мгновенную скорость в любой момент на протяжении очень короткого измеримого интервала времени как приблизительно среднюю скорость в течение этого интервала, то законы физики оправдываются. "Мгновенная скорость" поэтому может рассматриваться не иначе, как удобная математическая фикция.
Подобным же образом Рейхенбах может сказать, когда он говорит о пределе частоты, когда n бесконечно, что он имеет в виду только актуальную частоту для очень больших чисел, или, скорее, эту частоту с небольшим запасом ошибки. Бесконечное и бесконечно малое одинаково ненаблюдаем и, следовательно (как он может сказать), одинаково не имеют значения для эмпирического знания.
Я склонен признать справедливость этого ответа. Я только сожалею, что это не выражено явно в книге Рейхенбаха; я думаю тем не менее, что он должен был это иметь в виду.
Второе соображение в пользу его теории - то, что она применима как раз к тем случаям, в которых мы хотим воспользоваться аргументами вероятности. Мы испытываем желание воспользоваться этими аргументами, когда имеем некоторые данные, касающиеся определенного будущего события, но которых недостаточно, чтобы определить его характер в некотором интересующем нас отношении. Моя смерть, например, является событием будущего, и если я страхую свою жизнь, то я могу испытывать желание узнать, какое существует свидетельство, касающееся вероятности его осуществления в том или ином данном году. В таком случае мы всегда имеем некоторое число индивидуальных фактов, записанных в виде последовательности, и предполагаем, что частоты, обнаруженные до сих пор, будут более или менее продолжать оставаться такими же. Или возьмем азартную игру, в которой и возник весь этот вопрос. Мы не интересуемся тем простым фактом, что имеется 36 возможных результатов бросаний с двумя костями. Мы интересуемся тем фактом (если это факт), что на протяжении длинной последовательности бросаний каждая из 36 возможностей будет осуществляться приблизительно одинаковое число раз. Этот факт не вытекает из одного лишь существования 36 возможностей. Когда вы встречаете незнакомого человека, есть только две возможности: одна та, что его зовут Эбинизер Уилкс Смит, другая - что его зовут не так. Но на протяжении долгой жизни, в течение которой я встретил множество незнакомых людей, я только один раз столкнулся с реализацией первой возможности. Чисто математическая теория, которая только перечисляет возможные случаи, лишена практического интереса, если мы не знаем, что каждый возможный случай осуществляется приблизительно с одинаковой или с какой-то известной частотой. А это, если мы рассматриваем не логическую схему, а события, может быть известным только через действительную статистику, использование которой - как я сказал бы - должно идти более или менее в соответствии с теорией Рейхенбаха.
И этот аргумент я принимаю предварительно; он будет исследован заново, когда мы придем к рассмотрению индукции.
Есть совершенно другого рода возражение против теории Рейхенбаха в его собственной формулировке, и это возражение относится к ее введению последовательностей там, где, по-видимому, только классы логически значимы. Возьмем пример: каков шанс, что выбранное наудачу целое число окажется простым? Если мы возьмем целые числа в порядке их следования в натуральном ряде, то шанс, в соответствии с его определением, равен нулю; так как если n есть целое число, то число простых чисел, меньших или равных n, есть приблизительно n /(In n), если n - большое, так что шанс, что целое число, меньшее, чем n, будет простым числом, стремится к n /(In n), а предел 1/(1п n), поскольку n безгранично увеличивается, равен нулю. Но теперь допустим, что мы расставим целые числа в следующем порядке: поставим сначала первые 9 простых чисел, затем первое число, не являющееся простым, затем 9 простых, а затем второе число, не являющееся простым, и так далее до бесконечности. Когда целые числа расставлены в этом порядке, определение Рейхенбаха показывает, что шанс того, что выбранное наудачу число будет простым, равен 9/10. Мы могли бы даже расставить целые числа так, чтобы шанс того, что выбранное число не будет простым, стал равен нулю. Чтобы получить этот результат, начнем с первого непростого числа, то есть с 4, и поставим после n-го числа, не являющегося простым, n простых чисел, следующих после уже поставленных; эта последовательность начинается следующим образом: 4, 1, 6, 2, 3, 8, 5, 7, 11, 9, 13, 17, 19, 23, 10, 29, 31, 37, 41, 43, 12... В этой расстановке перед (n +1)-м непростым будет n непростых и 1/2n (n +1) простых; таким образом, по мере того как n возрастает, отношение числа непростых к числу простых приближается к 0 как пределу.
Из этого примера ясно, что если принять определение Рейхенбаха, то при данном любом классе А, имеющем столько же членов, сколько есть натуральных чисел, и при данном любом бесконечном подклассе В шанс, что выбранное наудачу А будет В, равен любому числу между 0 и 1 (включая и то и другое) в соответствии со способом, который мы избираем для распределения членов В среди А.
Из этого следует, что если вероятность должна применяться к бесконечным совокупностям, она должна применяться не к классам, а к последовательностям. Это кажется странным.
Правда, там, где в деле участвуют эмпирические данные, они все даются во временном порядке и, следовательно, в виде последовательности. Если мы избираем предположение о возможности бесконечного числа событий исследуемого нами вида, тогда мы можем также заключить, что наше определение вероятности является применимым только до тех пор, пока события располагаются во временной последовательности. Но вне чистой математики ни одна последовательность нам неизвестна как бесконечная, а большинство, насколько мы можем судить, является конечными. Каков шанс, что человек шестидесятилетнего возраста умрет от рака? Конечно, мы можем определить этот шанс и без допущения, что число людей, которые до конца мира умрут от рака, бесконечно. Но, согласно букве определения Рейхенбаха, определить это было бы невозможно.
Если вероятности зависят от того, что события берутся в их временном, а не в каком-либо другом порядке, в каком их можно расположить, то вероятность не может быть ветвью логики, а должна быть частью изучения природы. Взгляд Рейхенбаха не таков; он считает, напротив, что всякая истинная логика есть логика вероятности и что классическая логика ошибочна, потому что она делит предложения по признаку их истинности или ложности, а не по признаку обладания той или иной степенью вероятности. Он должен был бы поэтому сформулировать основные положения теории вероятности в абстрактных логических терминах, не вводя в них такие случайные признаки действительного мира, как время.
Имеется очень большая трудность в соединении статистического взгляда на вероятность со взглядом, которого также придерживается Рейхенбах и который состоит в том, что все предложения обладают только различными степенями вероятности, не достигающими достоверности. Трудность заключается в том, что тем самым мы, по-видимому, осуждены на бесконечный регресс. Допустим, что мы говорим о вероятности того, что человек, заболевший чумой, умрет от нее. Это значит, что если бы мы могли составить полную последовательность людей, которые с древнейших времен и до исчезновения человеческой расы болели и будут болеть чумой, то мы установили бы, что больше половины из них умерли и умрут от нее. Поскольку в отношении будущего и значительной части прошедшего регистрации нет, постольку мы считаем, что зарегистрированные случаи служат хорошим образчиком. Но теперь мы должны вспомнить, что все наше знание только вероятно; следовательно, если, собрав наши статистические данные, мы найдем, что А болел чумой и умер от нее, то мы должны рассматривать этот случай не как достоверный, а только как вероятный. Чтобы узнать, насколько он вероятен, мы должны включить его в последовательность, скажем, официальную регистрацию смертей, и должны найти какой-либо способ удостовериться, какое отношение регистрации смертей является правильным. При этом какой-нибудь отдельный пункт в нашей статистике окажется, например, следующим: "Было официально удостоверено, что мистер Браун умер, но потом оказалось, что он все же живой". Но и этот пункт в свою очередь должен быть только вероятным и должен, следовательно, входить в последовательность зарегистрированных официальных ошибок, некоторые из которых окажутся не ошибками. Это значит, что мы должны собрать случаи, когда мы ошибочно верили, что лицо, зарегистрированное как умершее, оказалось все-таки живым. Этому процессу не может быть конца, если все наше знание только вероятно, а вероятность имеет только статистический характер. Если мы хотим избежать бесконечного регресса, а все наше знание является только вероятным, то "вероятность" должна интерпретироваться как "степень правдоподобия" и должна определяться не статистически, а как-либо иначе. Статистическая вероятность может определяться только на основе действительной или постулируемой достоверности.
В обычных эмпирических суждениях вероятности, таких, например, которые содержатся в прогнозах погоды, имеется смесь различных элементов, которые важно отделить друг от друга. Самым простым предположением - чрезмерно упрощенным здесь для целей иллюстрации - является предположение на основе наблюдения какого-либо симптома, который, скажем, в девяноста процентах случаев, в которых он прежде наблюдался, сопровождался дождем. В этом случае, если бы индуктивные аргументы были столь же бесспорны, как и дедуктивные, мы сказали бы, что "имеется девяностопроцентная вероятность дождя". Это значит, что настоящий момент относится к определенному классу (классу моментов, когда вышеупомянутый симптом налицо), девяносто процентов членов которого являются моментами, предшествующими дождю. Это вероятность в уже разобранном нами математическом смысле. Но не только это делает нас неуверенными в отношении наступления дождя. Мы не уверены также и в отношении бесспорности самого вывода; мы не чувствуем уверенности в том, что за этим симптомом будет в будущем следовать дождь в девяти случаях из десяти. И это сомнение может быть двух видов - научным и философским. Сохраняя в общем полное доверие к методам науки, мы можем чувствовать, что в этом случае слишком мало данных, чтобы обеспечить индукцию, или что не проявлено достаточной заботы для элиминирования других обстоятельств, которые также могут быть налицо и могут быть более неизменными предшественниками дождя. Кроме того, записи могут быть сомнительными: они могли быть испорчены дождем и стать недоступными, для расшифровки или могли быть сделаны человеком, о котором вскоре после этого стало известно, что он ненормален. Такие сомнения относятся к научным методам, но существуют также сомнения, выдвинутые Юмом: является ли индуктивный метод действительным или только удобной для нас привычкой? Все или любое из этик оснований могут заставить нас колебаться в отношении девяностопроцентного шанса дождя, в который наши свидетельства склоняют нас верить.
В случаях такого рода мы имеем иерархию вероятностей. Первая ступень: вероятно, будет дождь. Вторая ступень: вероятно, симптомы, которые я заметил, являются признаками вероятного дождя. Третья ступень: вероятно, определенного рода события делают определенные будущие события вероятными. Из этих трех ступеней первая характеризует обыденный здравый смысл, вторая есть уровень науки и третья - философии.
На первой ступени мы наблюдали, что до сего времени в девяти случаях из десяти за А следовало В; в прошлом, следовательно, А делало В вероятным в смысле конечной частоты. На этой стадии мы без размышления предполагаем, что мы можем ожидать это же самое и в будущем.
На второй ступени, не ставя под вопрос общую возможность выведения будущего из настоящего, мы сознаем, что такие выводы должны подчиняться определенным гарантиям, таким, например, как гарантии четырех методов Милля. Мы сознаем, также, что индукции, даже когда они осуществляются в соответствии с наилучшими правилами, не всегда подтверждаются. Но я думаю, что наши действия все же могут быть включены в сферу теории конечной частоты. Мы осуществили в прошлом какое-то количество индукций, одних более, других менее тщательно. Из осуществленных в соответствии с определенной процедурой пропорция P до сих пор подтверждалась; следовательно, эта процедура до сего времени сообщала вероятность p тем индукциям, которые ома санкционировала. Научный метод в значительной мере состоит из правил, посредством которых p (испытанное прошлыми результатами прошлых индукций) может быть больше приближено к 1. Все это находится все еще в пределах теории конечной частоты, но теперь уже только индукции являются единственными членами в нашей оценке частоты.
Это значит, что мы имеет два класса A и B, из которых A состоит из индукций, которые были осуществлены в соответствии с определенными правилами, а В состоит из индукций, которые до сего времени подтверждались опытом. Если n есть число членов A, а m есть число членов, общих для A и B, тогда m/n есть шанс, что индукция, осуществленная в соответствии с вышеупомянутыми правилами, приведет в настоящее время к результатам, которые оказались бы истинными, если бы могли быть проверены.
Говоря это, мы не пользуемся индукцией; мы просто описываем черты естественного порядка вещей, поскольку его наблюдали. Мы, однако, нашли критерий высокого качества (до сего времени) всякого предлагаемого правила научной процедуры и нашли его в пределах конечной частоты. Единственно новое есть то, что наши единицы теперь являются не единичными событиями, а индукциями. Индукции трактуются как события, и только те из них, которые действительно имели место, должны рассматриваться, как члены нашего класса.
Но как только мы начинаем доказывать или то, что какая-либо отдельная индукция, которая к настоящему времени подтвердилась, будет или вероятно будет подтверждена в будущем, или то, что правила процедуры, дававшие до сих пор большую пропорцию индукций, которые к настоящему времени были подтверждены, способны давать большую пропорцию подтвержденных индукций в будущем, мы выходим за пределы теории конечной частоты, поскольку мы здесь имеем дело с классами, члены которых неизвестны. Математическая теория вероятности, как и вся чистая математика, хотя и дает знание, не даст (по крайней мере в одном весьма важном смысле) чего-либо нового; индукция же, напротив, определенно дает что-то новое, и сомнение касается только того, является ли то, что она дает, знанием.
Я пока не хочу исследовать индукцию критически, я хочу только выяснить, что она не может быть введена в сферу теории конечной частоты, даже если мы будем рассматривать отдельную индукцию как одну из класса индукций, поскольку проверенные индукции могут давать только индуктивное свидетельство в пользу еще не проверенной индукции. Если затем мы скажем, что принцип, оправдывающий индукцию, является "вероятным", то мы должны употреблять слово "вероятный" в ином смысле, чем оно употребляется в теории конечной частоты; этот смысл должен - как я сказал бы - быть тем, что мы называли "степенью правдоподобия".
Я склонен думать, что если признать индукцию или любой другой постулат, который мы решим поставить вместо нее, то все точные и измеримые вероятности могут быть интерпретированы как конечные частоты. Допустим, что я, например, говорю, что "имеется высокая степень вероятности, что Зороастр существовал". Чтобы обосновать это утверждение, я должен буду рассмотреть сначала, каковы относящиеся к этому вопросу свидетельства, а затем поискать подобные свидетельства, о которых известно, что они правдивы или неверны. Класс, от которого зависит вероятность, не является классом пророков существующих и несуществующих, ибо, включая несуществующих, мы делаем этот класс до некоторой степени неопределенным; не может этот класс быть также классом только существующих пророков, поскольку исходным вопросом как раз и является вопрос, принадлежит ли Зороастр к этому классу. Мы должны будем рассуждать следующим образом: в случае вопроса о Зороастре имеется свидетельство, принадлежащее к определенному классу А; мы находим что из всех свидетельств, которые принадлежат к этому классу и которые могут быть проверены, отношение p оказывается правдивым свидетельством; мы, следовательно, может сделать индуктивный вывод, что есть вероятность p в пользу подобных свидетельств в случае Зороастра. Таким образом, частота плюс индукция оказываются достаточными для этого использования вероятности.
Или допустим, что, подобно епископу Батлеру, мы говорим:
"Вероятно, что вселенная является результатом замысла Создателя" Здесь мы начинаем с таких вспомогательных аргументов, как аргумент, что создание часов предполагает часового мастера. Имеется множество образцов часов, о которых известно, что они сделаны часовыми мастерами, и нет ни одних часов, о которых было бы известно, что они сделаны не часовым мастером. В Китае существует вид мрамора, который иногда чисто случайно производит впечатление картины, созданной художником; я видел поразительные примеры этого.
Но это бывает так редко, что, когда мы видим картину, мы бываем правы (допуская индукцию), делая с очень высокой степенью вероятности вывод о создавшем ее художнике. Епископу-логику остается - как он и подчеркивает это заглавием своей книги - доказать эту аналогию. Это может считаться сомнительным делом, но, конечно, не может быть подведено под математическую вероятность.
Пока, следовательно, может казаться, что сомнительность и математическая вероятность - последняя в смысле конечной частоты - являются единственными понятиями, необходимыми в добавление к законам природы и правилам логики. Это заключение, однако, является только предварительным. Нельзя сказать ничего окончательного, пока мы не рассмотрим некоторые другие предложенные определения "вероятности".
ГЛАВА 4.
ТЕОРИЯ ЧАСТОТЫ МИЗЕСА-РЕЙХЕНБАХА.
Частотная интерпретация вероятности в форме, отличающейся от интерпретации, данной в предшествующей главе, была развита в двух имеющих большое значение книгах германских профессоров, которые жили тогда в Константинополе.
Труд Рейхенбаха является развитием труда Мизеса и в различных отношениях лучшей формулировкой той же самой теории. Я поэтому ограничусь рассмотрением теории Рейхенбаха.
Изложив аксиомы исчисления вероятности, Рейхенбах предлагает далее интерпретацию, которая, по-видимому, внушена статистическими корреляциями. Он исходит из допущения двух последовательностей (x1, х2, ... , xn...), (y1, y2, .... Уn...) и двух классов О и p. Некоторые или все х принадлежат к классу O; его интересует вопрос: как часто соответствующие у принадлежат к классу P?
Допустим, например, что вы исследуете вопрос, предрасположен ли мужчина к самоубийству вследствие того, что он имеет сварливую жену. В этом случае x обозначает жен, а у - мужей, класс О состоит из сварливых женщин, а класс p - из самоубийц. Тогда при том, что жена принадлежит к классу О, наш вопрос заключается в следующем: как часто ее муж принадлежит к классу p?
Рассмотрим отрезки двух последовательностей, состоящие из первых n членов каждой последовательности. Допустим, что среди первых n членов х имеется a членов, принадлежащих к классу О, и допустим, что из них имеется b членов, таких, что соответствуют у и принадлежат к классу p; соответствующий у есть член с тем же самым индексом. Тогда мы говорим, что во всем отрезке от х1 до Xn "относительная частота" О и P есть b/а. Если все х принадлежат к классу О, то а=n и относительная частота есть b/n. Обозначим эту относительную частоту выражением "Hn (О, p)".
Теперь перейдем к определению "вероятности p при данном О", которую мы обозначим как "W(0, p)". Определение следующее: W (О, p) есть предел Нn(0, p), по мере того как n неограниченно увеличивается.
Это определение может быть значительно упрощено с помощью небольшого использования математической логики. Во-первых, нет необходимости иметь две последовательности, так как предполагается, что обе являются рядами (progressions) и имеется, следовательно, взаимно-однозначное соответствие их членов. Если это соответствие есть S, то сказать, что определенный член у принадлежит к классу p, равнозначно тому, что сказать, что соответствующий х принадлежит к классу членов, имеющих отношение S к тому или другому из членов P. Например, пусть S есть отношение жены к мужу, тогда если у есть женатый мужчина, ax - его жена, то утверждение, что у есть правительственный чиновник, является истинным, и только в том случае, если х есть жена правительственного чиновника.
Во-вторых, нет никакого преимущества в принятии случая, в котором не все х принадлежат к классу О. Определение применимо только в том случае, если бесконечное число членов х принадлежит к классу О, в этом случае те х, которые принадлежат к О, образуют ряд, а остальные могут быть отброшены. Таким образом, мы удержим все существенное в определении Рейхенбаха, если подставим следующее.
Пусть О будет рядом, а a каким-либо классом, из числа членов которого в важных случаях имеются члены, которые в последовательности О являются последующими за любым данным членом. Пусть m будет число членов а среди первых n членов О. Тогда W(О, а) определяется как предел m/n, когда n неограниченно возрастает.
Возможно, по недосмотру Рейхенбах говорит, как если бы понятие вероятности было применимо только к бесконечным рядам и не было применимо к конечным класса. Я не могу думать, что он имел это в виду. Человеческая раса, например, есть конечный класс, и мы хотим применить вероятность к статистике жизни, что было бы невозможно согласно букве определения. Психологически, когда Рейхенбах говорит о пределе для n-бесконечности, он думает о предел как некотором числе, к которому легко приблизиться всякий раз, когда n с эмпирической точки зрения является большим, то есть когда оно недалеко от того максимума, который наши средства наблюдения позволяют нам достичь. У него есть аксиома или постулат о том, что, когда есть такое число для каждого большого доступного наблюдению n, оно приблизительно равно пределу для n-бесконечности. Это нелепая аксиома не только потому, что она произвольна, но и потому, что большинство рядов, с которыми нам приходится иметь дело вне чистой математики не являются бесконечными; в самом деле, можно сомневаться, являются ли таковыми какие-либо из них. Мы привыкли считать пространство-время непрерывным, что предполагает существование бесконечных рядов; но это предположение не имеет иного основания, кроме математического удобства.
Для того чтобы сделать теорию Рейхенбаха насколько возможно более адекватной, я буду исходить из того, что там, где речь идет о конечных классах, должно быть сохранено определение, данное в предшествующей главе, и что новое определение имеет целью только расширение, позволяющее нам применять вероятность к бесконечным классам. Таким образом, его Нn(0, p) будет вероятностью, но приложимой только к первым n членам ряда.
То, что Рейхенбах постулирует в качестве своей формы индукции, есть нечто вроде следующего. Допустим, что мы сделали N наблюдений в отношении корреляции О и p, так что мы в состоянии вычислить Нn (О, p) для всех значений n до n=N, и допустим, что во всей последней половине значений n вероятность Hn(О, p) всегда отличается от определенной дроби p меньше, чем на е, где e - мало. Тогда мы утверждаем, что, сколько бы мы ни увеличивали n, вероятность Нn(0, p) будет все-таки находиться в этих узких границах, и, следовательно, W (О, p), являющееся пределом для n-бесконечности, будет также лежать в этих границах. Без этого допущения мы не можем иметь эмпирического свидетельства в отношении предела для n-бесконечности, и вероятности, для которых, определение специально предназначено, должны оставаться неизвестными.
В защиту теории Рейхенбаха перед лицом вышеупомянутых затруднений можно высказать два соображения. Во-первых, он может утверждать, что нет необходимости предполагать, что n беспредельно стремится к бесконечности; для всех практических целей достаточно, если n будет очень большим. Допустим, например, что мы занимаемся статистикой жизни. Для страховой компании не имеет значения, что произойдет со статистикой, если она будет продолжена на следующие десять тысяч лет; ее могут касаться самое большее следующие сто лет. Если, собрав статистические данные, мы предполагаем, что частоты останутся приблизительно теми же самыми даже тогда, когда мы соберем в десять раз больше данных, чем мы собрали, то этого будет достаточно почти для всех практических целей. Рейхенбах может сказать, что, когда он говорит о бесконечности, он пользуется удобной математической стенографией, имея в виду только "гораздо больше, чем мы до сих пор исследовали". Он может сказать, что этот случай совершенно аналогичен случаю эмпирического определения скорости. Теоретически скорость может быть определена только, если нет предела малости измеряемых отрезков пространства и времени; в практике, поскольку такой предел имеется, мгновенная скорость никогда не может быть известна даже приблизительно. Правда, мы можем узнать с достаточно большой точностью среднюю скорость на протяжении короткого промежутка времени. Но даже если мы предположим постулат непрерывности, средняя скорость на протяжении, скажем, секунды не дает абсолютно никакого указания на мгновенную скорость в данный момент в интервале этой секунды. Все движение может состоять из периодов покоя, разделенных моментами бесконечно большой скорости. Но даже и помимо этой крайней гипотезы и даже если мы допустим непрерывность в математическом смысле, любая конечная мгновенная скорость несовместима с какой-либо конечной средней скоростью на протяжении конечного интервала времени - как бы он короток ни был, - содержащего этот момент. Для практических целей, однако, это не имеет значения. За исключением таких немногих явлений, как взрывы, если мы принимаем мгновенную скорость в любой момент на протяжении очень короткого измеримого интервала времени как приблизительно среднюю скорость в течение этого интервала, то законы физики оправдываются. "Мгновенная скорость" поэтому может рассматриваться не иначе, как удобная математическая фикция.
Подобным же образом Рейхенбах может сказать, когда он говорит о пределе частоты, когда n бесконечно, что он имеет в виду только актуальную частоту для очень больших чисел, или, скорее, эту частоту с небольшим запасом ошибки. Бесконечное и бесконечно малое одинаково ненаблюдаем и, следовательно (как он может сказать), одинаково не имеют значения для эмпирического знания.
Я склонен признать справедливость этого ответа. Я только сожалею, что это не выражено явно в книге Рейхенбаха; я думаю тем не менее, что он должен был это иметь в виду.
Второе соображение в пользу его теории - то, что она применима как раз к тем случаям, в которых мы хотим воспользоваться аргументами вероятности. Мы испытываем желание воспользоваться этими аргументами, когда имеем некоторые данные, касающиеся определенного будущего события, но которых недостаточно, чтобы определить его характер в некотором интересующем нас отношении. Моя смерть, например, является событием будущего, и если я страхую свою жизнь, то я могу испытывать желание узнать, какое существует свидетельство, касающееся вероятности его осуществления в том или ином данном году. В таком случае мы всегда имеем некоторое число индивидуальных фактов, записанных в виде последовательности, и предполагаем, что частоты, обнаруженные до сих пор, будут более или менее продолжать оставаться такими же. Или возьмем азартную игру, в которой и возник весь этот вопрос. Мы не интересуемся тем простым фактом, что имеется 36 возможных результатов бросаний с двумя костями. Мы интересуемся тем фактом (если это факт), что на протяжении длинной последовательности бросаний каждая из 36 возможностей будет осуществляться приблизительно одинаковое число раз. Этот факт не вытекает из одного лишь существования 36 возможностей. Когда вы встречаете незнакомого человека, есть только две возможности: одна та, что его зовут Эбинизер Уилкс Смит, другая - что его зовут не так. Но на протяжении долгой жизни, в течение которой я встретил множество незнакомых людей, я только один раз столкнулся с реализацией первой возможности. Чисто математическая теория, которая только перечисляет возможные случаи, лишена практического интереса, если мы не знаем, что каждый возможный случай осуществляется приблизительно с одинаковой или с какой-то известной частотой. А это, если мы рассматриваем не логическую схему, а события, может быть известным только через действительную статистику, использование которой - как я сказал бы - должно идти более или менее в соответствии с теорией Рейхенбаха.
И этот аргумент я принимаю предварительно; он будет исследован заново, когда мы придем к рассмотрению индукции.
Есть совершенно другого рода возражение против теории Рейхенбаха в его собственной формулировке, и это возражение относится к ее введению последовательностей там, где, по-видимому, только классы логически значимы. Возьмем пример: каков шанс, что выбранное наудачу целое число окажется простым? Если мы возьмем целые числа в порядке их следования в натуральном ряде, то шанс, в соответствии с его определением, равен нулю; так как если n есть целое число, то число простых чисел, меньших или равных n, есть приблизительно n /(In n), если n - большое, так что шанс, что целое число, меньшее, чем n, будет простым числом, стремится к n /(In n), а предел 1/(1п n), поскольку n безгранично увеличивается, равен нулю. Но теперь допустим, что мы расставим целые числа в следующем порядке: поставим сначала первые 9 простых чисел, затем первое число, не являющееся простым, затем 9 простых, а затем второе число, не являющееся простым, и так далее до бесконечности. Когда целые числа расставлены в этом порядке, определение Рейхенбаха показывает, что шанс того, что выбранное наудачу число будет простым, равен 9/10. Мы могли бы даже расставить целые числа так, чтобы шанс того, что выбранное число не будет простым, стал равен нулю. Чтобы получить этот результат, начнем с первого непростого числа, то есть с 4, и поставим после n-го числа, не являющегося простым, n простых чисел, следующих после уже поставленных; эта последовательность начинается следующим образом: 4, 1, 6, 2, 3, 8, 5, 7, 11, 9, 13, 17, 19, 23, 10, 29, 31, 37, 41, 43, 12... В этой расстановке перед (n +1)-м непростым будет n непростых и 1/2n (n +1) простых; таким образом, по мере того как n возрастает, отношение числа непростых к числу простых приближается к 0 как пределу.
Из этого примера ясно, что если принять определение Рейхенбаха, то при данном любом классе А, имеющем столько же членов, сколько есть натуральных чисел, и при данном любом бесконечном подклассе В шанс, что выбранное наудачу А будет В, равен любому числу между 0 и 1 (включая и то и другое) в соответствии со способом, который мы избираем для распределения членов В среди А.
Из этого следует, что если вероятность должна применяться к бесконечным совокупностям, она должна применяться не к классам, а к последовательностям. Это кажется странным.
Правда, там, где в деле участвуют эмпирические данные, они все даются во временном порядке и, следовательно, в виде последовательности. Если мы избираем предположение о возможности бесконечного числа событий исследуемого нами вида, тогда мы можем также заключить, что наше определение вероятности является применимым только до тех пор, пока события располагаются во временной последовательности. Но вне чистой математики ни одна последовательность нам неизвестна как бесконечная, а большинство, насколько мы можем судить, является конечными. Каков шанс, что человек шестидесятилетнего возраста умрет от рака? Конечно, мы можем определить этот шанс и без допущения, что число людей, которые до конца мира умрут от рака, бесконечно. Но, согласно букве определения Рейхенбаха, определить это было бы невозможно.
Если вероятности зависят от того, что события берутся в их временном, а не в каком-либо другом порядке, в каком их можно расположить, то вероятность не может быть ветвью логики, а должна быть частью изучения природы. Взгляд Рейхенбаха не таков; он считает, напротив, что всякая истинная логика есть логика вероятности и что классическая логика ошибочна, потому что она делит предложения по признаку их истинности или ложности, а не по признаку обладания той или иной степенью вероятности. Он должен был бы поэтому сформулировать основные положения теории вероятности в абстрактных логических терминах, не вводя в них такие случайные признаки действительного мира, как время.
Имеется очень большая трудность в соединении статистического взгляда на вероятность со взглядом, которого также придерживается Рейхенбах и который состоит в том, что все предложения обладают только различными степенями вероятности, не достигающими достоверности. Трудность заключается в том, что тем самым мы, по-видимому, осуждены на бесконечный регресс. Допустим, что мы говорим о вероятности того, что человек, заболевший чумой, умрет от нее. Это значит, что если бы мы могли составить полную последовательность людей, которые с древнейших времен и до исчезновения человеческой расы болели и будут болеть чумой, то мы установили бы, что больше половины из них умерли и умрут от нее. Поскольку в отношении будущего и значительной части прошедшего регистрации нет, постольку мы считаем, что зарегистрированные случаи служат хорошим образчиком. Но теперь мы должны вспомнить, что все наше знание только вероятно; следовательно, если, собрав наши статистические данные, мы найдем, что А болел чумой и умер от нее, то мы должны рассматривать этот случай не как достоверный, а только как вероятный. Чтобы узнать, насколько он вероятен, мы должны включить его в последовательность, скажем, официальную регистрацию смертей, и должны найти какой-либо способ удостовериться, какое отношение регистрации смертей является правильным. При этом какой-нибудь отдельный пункт в нашей статистике окажется, например, следующим: "Было официально удостоверено, что мистер Браун умер, но потом оказалось, что он все же живой". Но и этот пункт в свою очередь должен быть только вероятным и должен, следовательно, входить в последовательность зарегистрированных официальных ошибок, некоторые из которых окажутся не ошибками. Это значит, что мы должны собрать случаи, когда мы ошибочно верили, что лицо, зарегистрированное как умершее, оказалось все-таки живым. Этому процессу не может быть конца, если все наше знание только вероятно, а вероятность имеет только статистический характер. Если мы хотим избежать бесконечного регресса, а все наше знание является только вероятным, то "вероятность" должна интерпретироваться как "степень правдоподобия" и должна определяться не статистически, а как-либо иначе. Статистическая вероятность может определяться только на основе действительной или постулируемой достоверности.