Фоменко Анатолий Тимофеевич. Методы статистического анализа исторических текстов (часть 1)

TheLib.Ru » История » Фоменко Анатолий Тимофеевич » Методы статистического анализа исторических текстов (часть 1) » онлайн-чтение (стр. 26)

   Чем объясняется такая неравномерность в описании разных годов? Одно из объяснений таково. Летописец более подробно описал данный "древний год", поскольку от этого "древнего года" до него дошло больше уцелевшей информации, например, бо'льший объем старых документов, чем от соседних лет.
   Схема дальнейших наших рассуждений такова.
   1) Мы сформулируем теоретическую модель, то есть статистическую гипотезу, позволяющую предсказывать - какие именно годы из интервала времени (A,B) будут подробно описаны поздним летописцем, уже не являющимся современником описываемых им древних событий.
   2) Затем мы математически формализуем эту статистическую модель (гипотезу).
   3) Проверим ее справедливость на достаточно большом достоверном историческом материале.
   4) Обнаружив, что теоретическая модель подтверждается в эксперименте, мы предложим методику датирования древних событий.
   Пусть С(t) - объем всех текстов, написанных о годе t современниками этого года. См.рис.3.2. Как и выше, построим числовой график объема на интервале времени (A,B). Конечно, точный вид этого графика С(t) сегодня нам НЕИЗВЕСТЕН, так как с течением времени первичные тексты, написанные современниками событий года t, постепенно утрачиваются. До наших дней дошла только какая-то их часть. График C(t) можно назвать ГРАФИКОМ ПЕРВИЧНОГО ФОНДА ИНФОРМАЦИИ. Пусть из эпохи (A,B) современники наиболее подробно описали некоторые годы, то есть зафиксировали об этих годах особенно много информации. Причины такой "первичной неравномерности" мы здесь обсуждать не будем, так как они для нас сейчас не важны. На языке графика объема C(t) такие "подробно описанные современниками" годы будут выявляться тем, что именно в эти годы график делает всплески.
   Каков механизм потери и забывания письменной информации, приводящий с течением времени к уменьшению высоты графика C(t) и его искажению? Сформулируем МОДЕЛЬ ПОТЕРИ ИНФОРМАЦИИ.
   Хотя с течением времени высота графика C(t) уменьшается, тем не менее, ОТ ТЕХ ЛЕТ, В КОТОРЫЕ ИХ СОВРЕМЕННИКАМИ БЫЛО НАПИСАНО ОСОБЕННО МНОГО ТЕКСТОВ, - БОЛЬШЕ И ОСТАНЕТСЯ.
   Для переформулировки этой модели полезно поступить следующим образом. Фиксируем какой-то момент времени M справа от точки B на рис.3.2 и построим график C_M (t), показывающий объем текстов, которые <<дожили>> до момента времени M и описывают события года t из исторической эпохи (A,B).
   Другими словами, число C_M (t) указывает объем первичных древних текстов от года t, сохранившихся до "момента наблюдения фонда" в год M. График C_M (t) можно условно назвать графиком "остаточного фонда информации", сохранившегося от эпохи (A,B) до года M. Теперь наша модель может быть переформулирована таким образом.
   ГРАФИК ОБЪЕМА ОСТАТОЧНОГО ФОНДА C_M (t) ДОЛЖЕН ИМЕТЬ ВСПЛЕСКИ ПРИМЕРНО В ТЕ ЖЕ ГОДЫ НА ИНТЕРВАЛЕ (A,B), ЧТО И ИСХОДНЫЙ ГРАФИК ПЕРВИЧНОГО ФОНДА ИНФОРМАЦИИ C(t).
   Разумеется, проверить модель в таком ее виде трудно, поскольку график C(t) первоначального фонда информации сегодня нам точно неизвестен. Но одно из следствий теоретической модели (гипотезы) проверить все-таки можно.
   Поскольку более поздние летописцы Х и Y, описывая один и тот же исторический период (А,В) и один и тот же "поток событий", уже не являются современниками этих древних событий, то они вынуждены опираться на приблизительно один и тот же набор дошедших до них текстов. Следовательно, они должны "в среднем" более подробно описать именно те годы, от которых сохранилось больше текстов, и менее подробно - годы, о которых сохранилось мало информации. Другими словами, летописцы должны увеличивать подробность изложения при описании тех лет, от которых до них дошло больше текстов.
   На языке графиков объема эта модель выглядит так. Если летописец X живет в эпоху M, то он будет опираться на остаточный фонд C_M (t). Если другой летописец Y живет в эпоху N, отличную, вообще говоря, от эпохи M, то он опирается на сохранившийся фонд информации C_N (t). См.рис.3.3.
   Естественно ожидать, что <<в среднем>> летописцы X и Y работают более или менее добросовестно, а потому они должны более подробно описать те годы из древней (для них) эпохи (A,B), от которых до них дошло больше информации, больше старых текстов.
   Другими словами, график объемов vol X(t) будет иметь всплески примерно в те годы, где имеет всплески график C_M (t). В свою очередь, график vol Y(t) будет иметь всплески примерно в те годы, где делает всплески график C_N (t). См.рис.3.3.
   Но точки всплесков графика остаточного фонда C_M (t) близки к точкам всплесков исходного, первичного графика C(t) . Аналогично, и точки всплесков графика остаточного фонда C_N (t) близки к точкам всплесков первичного графика C(t) . Следовательно, графики объемов летописей X и Y, - то есть графики vol X(t) и vol Y(t), - должны делать всплески ПРИМЕРНО ОДНОВРЕМЕННО, "в одних и тех же" точках. Другими словами, точки их локальных максимумов должны коррелировать. См. рис.3.1.
   При этом, конечно, амплитуды графиков vol X(t) и vol Y(t) могут быть существенно различны. См.рис.3.4.
   Окончательно ПРИНЦИП КОРРЕЛЯЦИИ МАКСИМУМОВ формулируется так. Предыдущие рассуждения могут сейчас рассматриваться лишь как наводящие соображения.
   ПРИНЦИП КОРРЕЛЯЦИИ МАКСИМУМОВ:
   а) Если две летописи (текста) X и Y ЗАВЕДОМО ЗАВИСИМЫ, - то есть описывают один и тот же "поток событий" исторического периода (A,B) государства Г, - то графики объемов летописей X и Y ДОЛЖНЫ ОДНОВРЕМЕННО ДОСТИГАТЬ ЛОКАЛЬНЫХ МАКСИМУМОВ (ДЕЛАТЬ ВСПЛЕСКИ) на отрезке (А,В). Другими словами, годы, "подробно описанные в летописи Х", и годы, "подробно описанные в летописи Y", должны быть близки или совпадать. См. рис.3.4.
   б) Напротив, если летописи Х и Y ЗАВЕДОМО НЕЗАВИСИМЫ, то есть описывают либо разные исторические периоды (А,В) и (C,D), либо разные "потоки событий" в разных государствах, то графики объемов для летописей Х и Y достигают локальных максимумов В РАЗНЫХ ТОЧКАХ. Другими словами, точки всплесков графиков vol X(t) и vol Y(t) не должны коррелировать. См. рис.3.5. При этом считается, что для сравнения двух графиков мы должны предварительно совместить отрезки (А,В) и (C,D) одинаковой длины.
   Все другие пары тексты, то есть не являющиеся ни заведомо зависимыми, ни заведомо независимыми, мы условно назовем НЕЙТРАЛЬНЫМИ. Относительно них никакого утверждения не делается.
   Этот принцип подтвердится, если для большинства пар реальных, достаточно больших ЗАВИСИМЫХ летописей Х и Y, то есть описывающих одни и тот же "поток событий", графики объема для Х и Y делают всплески приблизительно одновременно, в одни и те же годы. При этом ВЕЛИЧИНА ЭТИХ ВСПЛЕСКОВ МОЖЕТ БЫТЬ СУЩЕСТВЕННО РАЗЛИЧНОЙ.
   Напротив, для реальных НЕЗАВИСИМЫХ хроник какая-либо корреляция точек всплесков должна отсутствовать. Конечно, для конкретных зависимых хроник одновременность всплесков графиков объема может иметь место лишь приблизительно.
   1.3. СТАТИСТИЧЕСКАЯ МОДЕЛЬ.
   Грубая идея состоит в следующем. Для количественной оценки близости точек всплесков поступим так. Вычислим число f(Х,Y) - сумму квадратов чисел f[k], где f[к] - расстояние в годах от точки всплеска с номером "k" графика объема Х до точки всплеска с номером "k" графика объема Y. Если оба графика делают всплески одновременно, то моменты всплесков с одинаковыми номерами совпадают, и все числа f[k] равны нулю. Рассмотрев достаточно большой фиксированный запас различных реальных текстов Н и вычисляя для каждого из них число f(Х,Н), отберем затем только такие тексты Н, для которых это число не превосходит числа f(Х,Y). Подсчитав долю таких текстов во всем запасе текстов Н, получаем коэффициент, который, - при гипотезе о распределении случайного вектора Н, - можно интерпретировать как вероятность р(Х,Y). Более подробно описание р(Х,Y) см. в [416], [438], [419], [375]. Если коэффициент р(X,Y) мал, то летописи Х и Y зависимы, то есть описывают приблизительно один и тот же "поток событий". Если же коэффициент велик, то летописи X и Y независимы, то есть сообщают о разных "потоках событий".
   Перейдем теперь к более детальному описанию статистической модели. Конечно, для реальных графиков объема одновременность их всплесков может иметь место лишь приблизительно. Для оценки того, насколько одновременно оба графика делают всплески, математический аппарат статистики позволяет определить некоторое число p(X,Y), измеряющее несовпадение лет, подробно описанных в летописи X, и лет, подробно описанных в летописи Y. Оказывается, если рассматривать наблюдаемую близость всплесков обоих графиков как случайное событие, то число p(X,Y) можно рассматривать как вероятности этого события. Чем меньше это число, тем лучше совпадают годы, подробно описанные в X, с годами, подробно описанными в Y. Дадим математическое определение коэффициента p(X,Y).
   Рассмотрим интервал времени (A,B) и график объема vol X(t), который достигает локальных максимумов в некоторых точках m_1,...,m_{n-1}. Мы считаем для простоты, что каждый локальный максимум (всплеск) достигается ровно в одной точке. Эти точки (то есть годы) m_i разбивают интервал (A,B) на некоторые отрезки, вообще говоря, разной длины. См.рис.3.6. Измеряя длины получившихся отрезков (в годах), то есть измеряя расстояния между точками соседних локальных максимумов m_i и m_{i+1}, мы получаем последовательность целых чисел a(X)=(x_1,...,x_n). То есть, число x_1 - это расстояние от точки A до первого локального максимума. Число x_2 - это расстояние от первого локального максимума до второго. И так далее. Число x_n - это расстояние от последнего локального максимума m_{n-1} до точки B.
   Эту последовательность можно изобразить вектором a(X) в евклидовом пространстве R^n размерности n. Например, в случае двух локальных максимумов (то есть если n=3), мы получаем целочисленный вектор a(X)=(x_1,x_2,x_3) в трехмерном пространстве. Назовем вектор a(X)=(x_1,...,x_n) ВЕКТОРОМ ЛОКАЛЬНЫХ МАКСИМУМОВ летописи X.
   Для другой летописи Y мы получим, вообще говоря, другой вектор a(Y)=(y_1,...,y_m). Будем считать, что летопись Y описывает события на интервале времени (C,D), длина которого равна длине интервала (A,B), то есть B-A=D-C. Чтобы сравнить графики объемов летописей X и Y, мы предварительно совместим друг с другом два отрезка (A,B) и (C,D) одинаковой длины (наложим их друг на друга). Конечно, число локальных максимумов у графиков vol X(t) и vol Y(t) может быть различно. Однако без ограничения общности можно считать, что число максимумов одинаково, а потому векторы a(X) и a(Y) двух сравниваемых летописей X и Y имеют одинаковое число координат. В самом деле, если число максимумов у двух сравниваемых графиков различно, то можно поступить так. Будем считать некоторые максимумыми КРАТНЫМИ, то есть считать, что в этой точке слились вместе несколько локальных максимумов. При этом, длины соответствующих отрезков, отвечающих этим кратным максимумам, можно считать равными нулю. Пользуясь этим соглашением, можно очевидно уравнять число локальных максимумов у графиков объемов летописей X и Y. Конечно, такая операция, - введение кратных максимумов, - неоднозначна. Фиксируем пока какой-либо вариант введения кратных максимумов. В дальнейшем мы избавимся от указанной неоднозначности, минимизировав нужные нам коэффициенты близости по всем возможным способам введения кратных максимумов. Отметим, что введение кратных максимумов означает, что у вектора a(X) на некоторых местах появляются нулевые компоненты, то есть отрезки нулевой длины.
   Итак, сравнивая летописи X и Y, можно считать, что оба вектора a(X)=(x_1,...,x_n) и a(Y)=(y_1,...,y_n) имеют одно и то же число координат и поэтому лежат в одном и том же евклидовом пространстве R^n. Отметим, что у каждого из этих векторов сумма его координат - одна и та же и равна B-A=D-C, то есть длине интервала времени (A,B). Итак:
   x_1 + ... + x_n = y_1 + ... + y_n = B-A.
   Рассмотрим теперь множество всех целочисленных векторов c=(c_1,...,c_n), у которых все координаты неотрицательны и их сумма c_1+...+c_n равна одному и тому же числу, а именно B-A, то есть длине временно'го интервала (A,B). Обозначим множество всех таких векторов через S. Геометрически, эти векторы можно изобразить так. Будем считать, что все они выходят из начала координат, то есть из точки O в R_n. Рассмотрим концы все такие векторов c=(c_1,...,c_n). Все они лежат на "многомерном симплексе" L, определяемом в пространстве R_n одним уравнением
   c_1 + ... + c_n = B-A, где все координаты c_1,...,c_n являются вещественными неотрицательными числами. Множество S геометрически изображается как множество "целых точек" на симплексе L, то есть множество всех точек из L, имеющих целочисленные координаты.
   Ясно, что концы векторов локальных максимумов a(X) и a(Y) для летописей X и Y принадлежат множеству S. См. рис.3.7.
   Фиксируем теперь вектор a(X)=(x_1,...,x_n) и рассмотрим все векторы c=(c_1,...,c_n) (с вещественными координатами), принадлежащие симплексу L и такие, что они удовлетворяют еще одному дополнительному соотношению:
   (с_1 - x_1)^2 + ... + (c_n - x_n)^2 <

   (y_1 - x_1)^2 + ... + (y_n - x_n)^2.
   Множество всех таких векторов c=(c_1,...,c_n) мы обозначим через K. Математически эти векторы описываются как удаленные от фиксированного вектора a(X) на расстояние, не превышающее расстояния r(X,Y) от вектора a(X) до вектора a(Y). Говоря здесь о расстоянии между векторами, мы имеем в виду расстояние между их концами. Напомним, что величина
   (y_1 - x_1)^2 + ... + (y_n - x_n)^2 равна квадрату расстояния r(X,Y) между векторами a(X) и a(Y). Поэтому множество K - это часть симплекса L, попавшая в "n-мерный" шар радиуса r(X,Y) с центром в точке a(X).
   Подсчитаем теперь, сколько "целочисленных векторов" содержится в множестве K и сколько - в множестве L. Полученные числа обозначим через m(K) и m(L) соответственно. В качестве "предварительного коэффициента" p'(X,Y) мы возьмем отношение этих двух чисел, то есть
   p'(X,Y)=m(K)/m(L), то есть
   количество "целых точек" в множестве K
   p'(X,Y)= ----------------------------------------- .
   количество "целых точек" в множестве L
   Так как множество K составляет лишь часть множества L, то
   0 < p'(X,Y) < 1.
   -
   Если векторы a(X) и a(Y) совпадают, то p'(X,Y)=0. Если векторы, напротив, далеки друг от друга, то число p'(X,Y) близко к единице и даже может оказаться равным единице.
   Отметим здесь полезную, хотя и необязательную для дальнейшего, интерпретацию числа p'(X,Y). Предположим, что вектор c=(c_1,...,c_n) случайным образом пробегает все векторы из множества S, причем он с единаковой вероятностью может оказаться в любой точке этого множества. В таком случае говорят, что случайный вектор c=(c_1,...,c_n) распределен РАВНОМЕРНО на множестве S, то есть на множестве "целых точках" (n-1)-мерного симплекса. Тогда определенное нами число p'(X,Y) допускает вероятностную интерпретацию. Оно равно вероятности случайного события, заключающегося в том, что случайный вектор c=(c_1,...,c_n) оказался на расстоянии от фиксированного вектора a(X), не превышающем расстояния между векторами a(X) и a(Y). Чем меньше эта вероятность, тем менее случайна наблюдаемая нами близость векторов a(X) и a(Y). Другими словами, в этом случае их близость указывает на наличие какой-то ЗАВИСИМОСТИ между ними. И эта зависимость тем больше, чем меньше число p'(X,Y).
   Равномерность распределения случайного вектора c=(c_1,...,c_n) на симплексе L (точнее, на множестве S его "целых точек") может быть обоснована тем, что этот вектор изображает расстояния между соседними локальными максимумами функции объема "глав" исторических летописей или каких-то аналогичных текстов, описывающих заданный период времени (A,B). При рассмотрении всевозможных летописей, говорящих об истории всевоможных государств во всевозможные исторические эпохи, естественно предполагать, что локальный максимум может "с равной вероятностью" появиться в произвольной точке временно'го интервала (A,B).
   Описанное построение было выполнено в предположении, что мы фиксировали некоторый вариант введения кратных максимумов у графиков объема летописей. Таких вариантов, конечно, много. Рассмотрим все такие варианты и для каждого из них подсчитаем число p'(X,Y), после чего возьмем наименьшее из всех получившихся чисел. Обозначим его через p''(X,Y). То есть, мы минимизируем коэффициент p'(X,Y) по всем возможным способам введения локальных максимумов у графиков vol X(t) и vol Y(t).
   Наконец, вспомним, что при подсчете коэффициента p''(X,Y) летописи X и Y оказались в неравноправном положении. Дело в том, что выше мы рассматривали "n-мерный шар" радиуса r(X,Y) с центром в точке a(X). Чтобы устранить возникшее неравноправие между летописями X и Y, просто поменяем их местами и повторим описанную выше конструкцию, взяв теперь за центр "n-мерного шара" точку a(Y). В результате получится некоторое число, которое мы обозначим через p''(Y,X). В качестве "симметричного коэффициента" p(X,Y) мы возьмем среднее арифметическое чисел p'(X,Y) и p''(X,Y), то есть
   p''(X,Y) + p''(Y,X)
   p(X,Y)= --------------------.
   2
   Для наглядности поясним смысл "предварительного коэффициента" p'(X,Y) на примере графиков объема с всего лишь двумя локальными максимумами. В этом случае оба вектора
   a(X)=(x_1,x_2,x_3) и a(Y)=(y_1,y_2,y_3) являются векторами в трехмерном евклидовом пространстве. Концы этих векторов лежат на двумерном равностороннем треугольнике L, отсекающем от координатных осей в пространстве R_3 одно и то же число B-A. См.рис.3.8. Если расстояние от точки a(X) до точки a(Y) обозначить через |a(X)-a(Y)|, то множество K - это пересечение треугольника L с трехмерным шаром, центр которого находится в точке a(X), а радиус равен |a(X)-a(Y)|. После этого нужно подсчитать количество "целых точек" (то есть точек с целочисленными координатами) в множестве K и в треугольнике L. Взяв отношение получившихся чисел, мы и получим коэффициент p'(X,Y).
   При конкретных вычислениях удобно пользоваться приближенным способом вычисления коэффициента p(X,Y). Дело в том, что подсчет числа "целых точек" в множестве K довольно затруднителен. Но оказывается эту трудность можно обойти, перейдя от "дискретной модели" к "непрерывной модели". Хорошо известно, что если (n-1)-мерное множество K в (n-1)-мерном симплексе L достаточно велико, то число "целых точек" в K примерно равно (n-1)-мерному объему множества K. Поэтому с самого начала в качестве "предварительного коэффициента" p'(X,Y) можно брать просто отношение (n-1)-мерного объема K к (n-1)-мерному объему L, то есть
   (n-1)-мерный объем K
   p'(X,Y)= ----------------------.
   (n-1)-мерный объем L
   Например, в случае двух локальных максимумов в качестве коэффициента p'(X,Y) следует взять отношение:
   площадь множества K
   -------------------- .
   площадь треугольника L
   Конечно, при малых значениях B-A, "дискретный коэффициент" и "непрерывный коэффициент" различны. Но в наших исследованиях мы будем иметь дело с временны'ми интервалами B-A в несколько десятков и даже сотен лет, так что для интересующих нас целей можно, не делая большой ошибки, уверенно пользоваться "непрерывной моделью" p'(X,Y). Точные математические формулы для подсчета "непрерывного коэффициента" p'(X,Y) приведены в работе [375], с.107.
   Укажем еще одно уточнение описанной статистической модели. При работе с конкретными графиками объема исторических текстов следует "сглаживать" эти графики, чтобы устранить мелкие случайные всплески. Мы проводили такое сглаживание графика, "усредняя по соседям", то есть заменяя значение функции объема в каждой точке t на среднее арифметическое трех значений функции, а именно, в точках t-1, t, t+1. В качестве "окончательного коэффициента" p(X,Y) следует взять его значение, подсчитанное для таких "сглаженных графиков".
   Сформулированный выше принцип корреляции максимумов подвердится, если для большинства пар заведомо зависимых текстов X и Y коэффициент p(X,Y) окажется "малым", а для большинства пар заведомо независимых текстов, напротив, "большим".
   1.4. ЭКСПЕРИМЕНТАЛЬНАЯ ПРОВЕРКА ПРИНЦИПА КОРРЕЛЯЦИИ МАКСИМУМОВ.
   ПРИМЕРЫ ЗАВИСИМЫХ И НЕЗАВИСИМЫХ ИСТОРИЧЕСКИХ ТЕКСТОВ.
   В 1978-1985 годах нами был проведен первый обширный вычислительный эксперимент по подсчету чисел р(Х,Y) для нескольких сотен пар конкретных исторических текстов - хроник, летописей и т.п. Детали см. в [416], [438], [419], [375].
   Оказалось, что коэффициент р(Х,Y) достаточно хорошо различает ЗАВЕДОМО ЗАВИСИМЫЕ и ЗАВЕДОМО НЕЗАВИСИМЫЕ пары исторических текстов. Было обнаружено, что для всех исследованных нами пар реальных летописей Х,Y, описывающих ЗАВЕДОМО РАЗНЫЕ события (разные исторические эпохи или разные государства), - то есть для НЕЗАВИСИМЫХ текстов, число р(Х,Y) колеблется от 1 до 1/100 при количестве локальных максимумов от 10 до 15. Напротив, если исторические летописи Х и Y ЗАВЕДОМО ЗАВИСИМЫ, то есть описывают одни и те же события, то число р(Х,Y) не превосходит 10^{-8} для того же количества максимумов.
   Таким образом, между значениями коэффициента для зависимых и независимых текстов обнаруживается разрыв примерно на 5-6 порядков. Подчеркнем, что здесь важны не абсолютные величины получающихся коэффициентов, а тот факт, что "зона коэффициентов для заведомо зависимых текстов" отделена НЕСКОЛЬКИМИ ПОРЯДКАМИ от "зоны коэффициентов для заведомо независимых текстов". Приведем типичные примеры. Точные значения функций объемов для особо интересных летописей мы приводим в Приложении, в конце книги, чтобы не загромождать здесь изложение.
   ПРИМЕР 1.
   На рис.3.9, рис.3.10 и рис.3.11 показаны графики объемов двух заведомо зависимых исторических текстов.
   А именно, в качестве текста Х мы взяли историческую монографию современного автора В.С.Сергеева "Очерки по истории древнего Рима", тома 1-2, М., 1938, ОГИЗ.
   В качестве текста Y мы взяли "античный" источник, а именно, "Римскую историю" Тита Ливия, тома 1-6, М., 1897-1899.
   Согласно скалигеровской хронологии, эти тексты описывают события на интервале якобы 757-287 годы до н.э. Итак, здесь A = 757 год до н.э., B = 287 год до н.э. Оба текста описывают одну и ту же историческую эпоху, примерно одни и те же события. Наглядно видно, что графики объемов делают свои ОСНОВНЫЕ всплески практически одновременно. Для количественного сравнения функций следует предварительно сгладить "мелкую зыбь", то есть вторичные вплески, накладывающиеся на основные, первичные колебания графиков. При вычислении коэффициента p(X,Y) мы сгладили, усреднили эти графики, чтобы выделить лишь их ОСНОВНЫЕ локальные максимумы, в количестве не превышающем пятнадцати. Оказалось, что здесь р(Х,Y) = 2x10^{-12}. Малая величина коэффициента указывает на ЗАВИСИМОСТЬ сравниваемых текстов. В данном случае это неудивительно. Как мы уже отмечали, оба текста описывают один и тот же период в истории "античного" Рима. Малое значение коэффициента p(X,Y) показывает, что если рассматривать наблюдаемую близость точек всплесков обоих графиков как случайное событие, то его вероятность чрезвычайно мала. Как мы видим, современный автор В.С.Сергеев достаточно аккуратно воспроизвел в своей книге "античный" оригинал. Конечно, он дополнил его своими соображениями и комментариями, но, как выясняется, они не влияют на характер зависимости этих текстов.
   Теперь в качестве "летописи" Х' возьмем снова книгу В.С.Сергеева, а в качестве "летописи" Y' - ее же, но заменив порядок лет в тексте на противоположный. То есть, грубо говоря, прочитав книгу Сергеева "задом наперед". Оказывается, в этом случае р(Х',Y') будет равняться 1/3. Таким образом, получается значение, существенно более близкое к единице, чем предыдущее, и указывающее на независимость сравниваемых текстов. Что и неудивительно, так как проведенная нами операция "перевертывания летописи" очевидно дает два заведомо независимых текста.
   ПРИМЕР 2.
   Возьмем следующие заведомо зависимые исторические тексты, две русские летописи:
   Х - Никифоровская летопись,
   Y - Супрасльская летопись [166].
   Следующий интервал времени описан в обоих летописях: якобы, 850-1256 годы н.э.
   См. графики их объемов на рис.3.12. Оба графика объемов "глав" на интервале якобы 850-1255 годы н.э. имеют 31 всплеск и делают эти всплески практически одновременно, в одни и те же годы. Подсчет дает, что здесь р(Х,Y) = 10^{-24}. Это значение весьма мало, что подтверждает зависимость этих текстов. В Приложение 4.1 мы приводим точные численные значения функций объемов этих летописей.
   ПРИМЕР 3. Рассмотрим следующие две русские летописи:
   X - Холмогорская летопись [166],
   Y - "Повесть временных лет".
   Следующий интервал времени описан в обоих летописях: якобы, 850-1000 годы н.э. Графики объемов летописей также достигают локальных максимумов ПРАКТИЧЕСКИ ОДНОВРЕМЕННО. И снова это не случайно, а закономерно, иначе реализовался бы единственный шанс из 10^{15} шансов. Здесь p(X,Y)=10^{-15}. На указанном временно'м интервале эти две летописи зависимы. На рис.3.13 представлены сразу три графика объемов для Супрасльской летописи, Никифоровской летописи и Повести временных лет. Последняя летопись "богаче", поэтому ее график имеет больше локальных максимумов и зависимость не столь очевидна. Тем не менее, после сглаживания выясняется, что между этими тремя графиками также имеется ярко выраженная зависимость. Подробнее о сравнении "богатых" и "бедных" летописей мы расскажем в следующих разделах. Распределение объемов указанных летописей приведено в Приложении 4.1.
   ПРИМЕР 4.
   Приведем пример из средневековой римской истории.
   X - фундаментальная монография немецкого историка Фердинанда Грегоровиуса "История города Рима в средние века", тома 1-5. См. [47]. Эта книга написана в XIX веке на основе огромного числа средневековых светских и церковных документов.
   Y - Liber Pontificalis (T.Mommsen, Gestorum Pontificum Romanorum, 1898). Это "Книга Понтифексов" (то есть список и жизнеописания римских пап средних веков), восстановленная немецким историком Теодором Моммзеном на основе средневековых римских текстов. Здесь, оказывается, p(X,Y)=10^{-10}, что указывает на яркую зависимость этих двух текстов. В предположении случайности такой близости, реализовался бы один шанс из 10 миллиардов.