II

   Нельзя ли по частоте таких частиц узнавать авторов, как-будто по чертам их портретов?
   Для этого прежде всего надо перевести их на графики, обозначая каждую распорядительную частицу на горизонтальной линии, а число её повторения на вертикальной, и сравнить эти графики между собой у различных авторов.
   Ещё в первые годы моей сознательной жизни, задолго до того, как я познакомился с трудами Гомперца и других стилеметристов, мне пришла такая идея и даже ясно представились её вероятные детали. Мне было ясно, что у авторов различных эпох такие графики в некоторых служебных частицах должны сильно различаться. Возьмём хотя бы частицу ибо, часто встречающуюся в русском языке ещё в первой четверти XIX века. Очевидно, что вместо неё на графике современных нам писателей будет зияющая зазубрина, так как её теперь нет. Точно также слово весьма оставит вместо себя пустоту, потому что оно заменилось теперь почти нацело словом очень, и т. д., и т. д.
   Даже у современных друг другу писателей должны появляться свои оригинальные зазубрины, свойственные лишь им одним, благодаря антипатии того или другого автора к той или другой служебной частице.
   Всё это, думалось мне, делает такие графики подобными световым спектрам химических элементов, в которых каждый элемент характеризуется своими особыми зазубринами, так что астроном легко и надёжно определяет по ним химический состав недоступных нашим летательным аппаратам небесных светил.
   Тогда же мне пришла в голову и мысль назвать подобные графики лингвистическими спектрами, и исследование по ним авторов назвать лингвистическим анализом, соответственно спектральному анализу состава небесных светил.
   Однако, разработать эти идеи мне было долго невозможно в Шлиссельбургской крепости, где они впервые пришли мне в голову, хотя в последние годы мне вновь пришлось возвратиться там невольно к этому предмету. Астрономическое исследование Апокалипсиса и библейских пророков привело меня по имеющимся там астрономическим данным к неожиданному для меня самого заключению, что черновик этой книги написан в промежуток от 30 сентября по 1 октября 395 года нашей эры, а библейские пророки ещё позднее: в V веке нашей же эры. Это приводило меня к выводу, что все дошедшие до нас сочинения «Иоанна Хризостома», «Оригена», «Тертулиаиа» и других христианских авторов первых четырёх веков нашей эры апокрифичны, так как они упоминают и об Апокалипсисе, и о пророках.
   Идея об исследовании их лингвистическим анализом сама собой пришла мне в голову. Но для этого необходимо было прочно установить основные приёмы такого анализа на современных общеизвестных авторах, показав, что каждый из них обладает какими-либо особенностями в своём лингвистическом спектре.
   Однако, моё время так было заполнено другими делами, что только летом 1915 г. я нашёл несколько свободных дней, чтобы составить лингвистические спектры хотя бы нескольких писателей. Я взял сначала Гоголя («Майскую ночь», «Страшную месть» и «Тараса Бульбу»), Пушкина («Капитанскую дочку», «Дубровского» и «Барышню-крестьянку»), Толстого («Смерть Ивана Ильича», «Корнея Васильева», «Три смерти» и «Три старца»), Тургенева («Малиновую воду»), Карамзина («Бедную Лизу») и Загоскина («Юрия Милославского»).
   В каждом из этих рассказов я отсчитывал (исключая эпиграфы или вводные цитаты из посторонних авторов) первую тысячу слов, подчёркивая в ней красным карандашом все служебные частицы, а потом сосчитывал число каждой.[4]
   Прежде всего сейчас же обнаружились некоторые резкие оригинальности.
   У Карамзина в беллетристических произведениях очень часто употребляется восклицание «Ах!», почти совершенно отсутствующее у Гоголя, Пушкина, Толстого, Тургенева и Загоскина.
   Служебная частица «было» (например, чуть-было) – только у Пушкина; «близ» – только у Тургенева (у других «около»); «ведь» – отсутствует у Карамзина и Загоскина; «вдруг» и «даже» – редки у Толстого; «еле» – только у Гоголя; «заместо» – только у Тургенева; «ибо» – ещё употребляется часто Карамзиным и Гоголем, изредка Пушкиным, но уже совсем отсутствует у Толстого, Тургенева и Загоскина; «коли» (вместо «если») – часто у Толстого в речи простых людей, но нет у Тургенева и у других; «может» (без «быть») – только у Гоголя; «нежели» – только у Пушкина; «оттого» – у Толстого; «про» (например, «про него») – довольно часто у Гоголя, Толстого и Пушкина и отсутствует у Тургенева и Загоскина; «против» – часто у Гоголя; «подле» (вместо «рядом») – у Загоскина; «среди» (вместо «между») – у Гоголя и Карамзина; «словно» – часто у Толстого; «точно» – у Тургенева; «через» – часто у Пушкина; «этак» – только у Гоголя.
   А в числе употребляемых ими служебных частиц (союзов и предлогов) оказались ясные процентные различия (слоговые типы).
   Чтоб не давать очень сложных общих спектров при нанесении этих цифр на графики, я разделил их здесь на предложные, союзные, местоименные спектры и т. д., судя по тому, что они представляют.
   Наиболее часто повторяющимися оказались у всех русских авторов предлоги в, на[5]с, почему их графики я и назвал главным предложным спектром. Они даны на рис. 29[6], из которого читатель и без цифр видит по вертикальному ряду чисел, что на тысячу слов у Гоголя предлог в повторился в «Тарасе Бульбе» 23 раза, в «Майской ночи» 15, а в «Страшной мести» 16 раз; предлог на повторился 24 раза в «Майской ночи» и 26 в «Бульбе» и «Страшной мести» и т. д. А когда я соединил эти точки линиями, то во всех (взятых мною совершенно случайно) трёх произведениях Гоголя получились очень сходные ломаные линии в виде острых крыш с ясным преобладанием предлога на над бис (см. рис. 29). У Пушкина же во всех трёх (взятых мною также совершенно случайно) произведениях, наоборот, оказалось, на такую же тысячу слов, сильное преобладание предлога в над предлогами на и с, почти равными по частоте своего повторения.
 
   Рис. 29. Образчики главного предложного спектра. (На 1000 слов.)
 
   Отсюда ясно, что по одному простому взгляду на главный предложный спектр какого-либо произведения Пушкина, по недоразумению приписанного Гоголю, мы заподозрили бы неправильность такого утверждения и сделали бы догадку о принадлежности его Пушкину, хотя ещё и не решили бы этим дела окончательно.
   Действительно, сравнивая на нашей графике главный предложный спектр Пушкина с таким же спектром «Малиновой воды» Тургенева (в последней колонке рис. 29), мы видим, что они очень сходны, и потому для отличия Тургенева от Пушкина главный предложный спектр негоден и надо искать других.
   Да и вообще нельзя решать вопроса об авторстве по какому-либо одному небольшому спектру, в роде взятого нами и состоящего лишь из трёх членов. Необходимо составить очень длинный многочленный спектр, или несколько коротких, но разнородных по своему содержанию спектров, и это тем более необходимо, что не всякий член спектра абсолютно постоянен у данного автора по частоте своего употребления. Здесь в полной мере господствует закон случайных отклонений от средней нормы, дающей вместо средней частоты употребления вариационную с размахом АВ, который, однако, тем более суживается, чем больше тысяч слов отсчитано нами в исследуемом отрывке, т. е. если при числе N слов (рис. 30) вариационный криволинейный треугольник будет иметь вид АВС, то при числе 2N слов он получит вид A1В1C1, а при большем числе слов его основание ещё больше сузится за счёт вырастающей высоты, так как площадь его всегда одна и та же, если перечислена на промилли (пли на проценты).
 
   Рис. 30. Широкая или узкая вариационная дуга вероятных отступлений многократно повторяющихся фактов от средней нормы, при малом или большом количестве их подсчитанных повторений.
 
   Но и при меньшем числе слов неправильное определение по причине значительной величины вероятной ошибки возможно лишь тогда, когда мы исследуем только три-четыре распорядительные частицы, а при десятке их всегда обнаружится общий характер лингвистического спектра для данного писателя.
   Особенно обязательно это для старых авторов рукописного периода, которые не могли десятки раз «исправлять свой слог в корректурах», заменяя другими как раз те распорядительные частицы, которые для них слишком привычны.
   Очень интересно отметить, например, что те самые члены главного предложного спектра (в, на, с), которые обнаружили постоянство у Пушкина и у Гоголя, совсем не обнаруживают этого у Толстого, и главный предложный спектр у него является в двух вариациях. Первая (например, в «Смерти Ивана Ильича» и в «Корнее Васильеве») напоминает спектр Пушкина, хотя и с несравненно меньшим числом частицы в (рис. 29), а вторая вариация (например, в «Трёх смертях» и «Трёх старцах») напоминает Гоголя, но с несравненно меньшим числом предлога с.
   Здесь является вопрос: отчего зависит это расчленение главного лингвистического спектра Толстого на два типа? Оттого ли, что он сильно корректировал свои произведения и этим сделал свой главный предложный спектр неопределённым, пли те перевороты, которые он переживал в своём мировоззрении и направлении своего творчества, отзывались и на слоге его речи? Конечно, у каждого автора, писавшего более полувека, лингвистический спектр не может оставаться всё время совершенно неизменным. Он должен подвергаться медленной эволюции, как и световые спектры физических тел, изменяющиеся по мере повышения температуры. Однако, у Толстого обе вариации так резко различились на приведённых мною графиках, что наводят на мысль о специальной корректурной обработке автором их частоты, и исследование в этом отношении всех других его произведений является в высшей степени желательным.
   Перейдём теперь к другим спектрам тех же писателей в тех же их произведениях. Рассмотрим, например, один из многих возможных союзных спектров (рис. 31). Я взял для его составления, как видно по таблице, сначала союз а, затем союз и, когда он употребляется в выражениях в роде «был и он», «я и знал», т. е. служит не обозначением конца перечня, а чисто слоговой приставкой, вследствие чего я и поставил его в кавычках («и»). Затем я взял тот же союз и в начале фраз, когда он пишется с большой буквы. В спектре Библии этот член дал бы преобладание над предыдущими, а у взятых мною писателей он всегда в минимуме, как видно по его графике. Этот спектр тоже оказался различен у них всех. У Гоголя и Пушкина здесь преобладает слоговое «и», у Толстого же «а»; кроме того, Пушкин отличается от Гоголя почти полным отсутствием библейского предфразного И (как оно употребляется во фразах в роде: «И был вечер, и было утро», «И пошёл Иисус» и т. д.).
 
   Рис. 31. Один из союзных спектров.
 
   Спектр пз наиболее часто встречающихся местоимений: этот, свой, тот оказался уже несоставимым у современных писателей при подсчёте только одной тысячи слов, так как этих местоимений у них оказалось лишь по нескольку на тысячу, а малое количество повторений какого-либо случайного фактора, как известно из статистики, не даёт возможности для вывода в нём закономерностей, благодаря уже отмеченному мною закону случайных отклонений от средней нормы тем более широких, чем меньше взято слов для подсчёта. Для того, чтобы местоименные и другие спектры дали достаточно типичные графики, нужно подсчитать их число по крайней мере среди пяти тысяч слов (а потом разделить полученную цифру на пять, с целыо приведения их к однородности с вышеприведёнными спектрами).
   Но, даже и при значительной частоте повторения некоторых служебных частиц речи, могут обнаруживаться, как мы уже видели у Толстого, значительные колебания их числа в различных произведениях того же самого автора, если мы будем брать всего лишь тысячу слов. Образчиком такого неопределённого спектра является, между прочим, и приводимый мною на рис. 32, где я сопоставил отрицательную частицу не с союзом и, в его двух вариациях: первая (и') соединяет между собою существительные или прилагательные имена, вторая (и") – глаголы или пелые фразы. Мы видим, что колебания их числа в различных произведениях у того же самого автора настолько же резки, как и у двух различных писателей. Однако и тут могут найтись авторы, у которых этот спектр обнаружит явное постоянство во всех произведениях.
 
   Рис. 32. Спектр и"-не-и'.
 
   Все лингвистические спектры, где, как у предыдущих, лишь высчитывается прямое среднее число той или другой служебной частицы на тысячу слов, можно назвать естественными. Они не всегда удобны для наглядного выражения слоговой физиономии автора и, кроме того, с ними надо уметь обращаться при их подборе для спектра. Составьте, например, спектр из каких-либо двух часто употребляемых служебных частиц и из одной мало употребительной. Поставив её на графике в середине между двумя первыми, вы получите всегда фигуру в роде V, в которой сольются все индивидуальные особенности слога различных авторов. Но особенности каждого из них станут ясно определёнными, когда мы расположим все такие частицы не в случайном порядке, а по мере уменьшения или по мере увеличения их средней употребимости у писателей данной эпохи. Так я и сделал в предыдущих таблицах, иначе мои графики обнаружили бы лишь ложное сходство.

III

   Чтобы избежать подобных фикций, при дальнейшем развитии предлагаемого мною метода следует все естественные спектры обращать в приведённые. Для этого надо только соблюдать следующее правило.
   Среднее число повторений каждой служебной частицы на тысячу слов данного произведения нужно разделить на среднюю повторяемость той же частицы, вычисленную по многим авторам данной эпохи. Тогда вместо предыдущих абсолютных цифр получатся Коэффициенты индивидуальности авторов, величиною своею то более, то менее единицы. Изобразив для их представления на графике единицу высоты горизонтальной линией (рис. 33) и обозначив выше её избыток исследуемой частицы в десятых долях единицы, а ниже недочёт (в таких же долях), мы и получим приведённые спектры. Образчик их я дал здесь на рис. 33 для спектра из предлогов в, на и с, который в естественном виде был показан уже ранее, на рис. 29.
   Составил я его так. Определив среднюю повторяемость этих трёх предлогов на тысячу слов по приведённым в примечании десяти произведениям Пушкина[7], Гоголя и Толстого, я получил знаменатели однородности для этих предлогов. Именно:
   для В ………. 26
   для НА ……… 20
   для С ………. 11
   Здесь предлоги в, на и с написаны надстрочными буквами в знак того, что они не относятся к какому-либо отдельному автору, а представляют собой обобщённые величины. Разделив на них число повторений тех же самых предлогов (найденных среди тысячи же слов) в отдельных произведениях Гоголя, Пушкина и Толстого, мы получаем результаты, приведённые на таблице XIII.
 
   Рис. 33. Приведённый спектр предлогов в-на-с.
ТАБЛИЦА XIII
 
   Перенеся это на графику, мы и находим для указанных произведений главный предложный приведённый спектр (рис. 33). В нём оказываются исключёнными все ложные сходства, зависящие от случайных группировок между собой исследуемых служебных частиц речи, а остаются только одни действительные сходства или различия.
   Из двух последних колонок этой таблицы мы видим, между прочим, что в своих произведениях «Три смерти» и «Три старца» Толстой специально обрабатывал свой слог, вычёркивая предлоги «с» и «на» и заменяя их другими распорядительными частицами речи, чтобы приблизить свой слог более к народному, где эти предлоги сравнительно редки. У старых авторов мы такой тщательной обработки не находим.
   Значит, всякий раз, когда вы для составления лингвистических спектров группируете между собою распорядительные (т. е. служебные) частицы, сильно различающиеся по своей обшей употребительности, вам необходимо сначала составить для них приведённые числа, а из них приведённые спектры по данному выше образчику. Только тогда вы будете вполне гарантированы от ложных сходств, да и сами спектры получат большую определённость.

IV

   Таковы общие основы лингвистического анализа, предлагаемого мною, главным образом, для доказательства плагиатов и апокрифов, которыми полна литература, приписываемая авторам древности и начала средних веков. Лингвистический анализ даёт нам здесь объективные основы для суждений об одноавторности и разноавторности произведений. Что же касается применимости этого метода ко всякому языку и ко всякой эпохе, то в этом не может быть сомнения. Всё различие в слоге у разных писателей, одинаких по языку и по роду своего творчества, именно и заключается в средней длине п сложности их фразы и в различном употреблении ими служебных частиц речи. Точный подсчёт этих частиц, отнесённый к определённому количеству слов (к 1000), только численно выражает (в промиллях) то, что мы и без того чувствуем слухом.
   Возьмём хотя бы сочинения «Платона», как наиболее исследованные в этом отношении. Я ставлю это имя в кавычках, потому что, как говорил уже выше, не считаю доказанным, что они написаны одним и тем же человеком, называвшимся Платоном (или, как утверждают некоторые, Аристоклом), «учеником Сократа и учителем Аристотеля, жившим между 430 и 344 г. до начала нашей эры». В подлинности многих из этпх произведений сомневались и все вообще их исследователи, «Фрасилов канон сочинений Платона», приводимый в книге Лаэртия и приписываемый им автору 1 века нашей эры «Фрасилу», даёт нам 36 произведений («Платона», поименованных на таблице XIV. «Канон» этот оставался, так сказать, священным со времени появления книги Лаэртпя в печати (когда он только и стал известным учёному миру) вплоть до XIX века, когда величайший из всех исследователей «Платона» Аст в своей книге «Platos Leben und Schrifien» (1816 г.) решился отвергнуть более половины из вошедших в него книг (см. нулики на таблице XIV). Шааршмидт (1866 г.) признал заслуживающим доверия только 9 диалогов, в том числе Законы, оспариваемые другими. В более умеренном виде высказали скептицизм по отношению ко многим произведениям этого «канона» и все другие исследователи (напр., Штальбаум, Ибервег, табл. XIV), но они не пришли к единогласию, и те книги, которые одними признавались подложными, другими объявлялись подлинными, и наоборот[8]. Ясным было для всех только одно, что сочинения, приписываемые Платону, опровергают друг друга по своему идейному содержанию. В одних автор проповедует идеализм, в других реализм, в третьих является скептиком, в четвёртых мистиком и так далее… В Федоне, например, психика человека определяется автором как дуализм духа и тела, а в Федре и Тимее та же психика сводится к тройственному делению души на разум, дух и похоть. В Политике автор утверждает, что важна не форма правления, а то, хорошо управляется государство или нет, и что при хороших законах демократия хуже аристократии, а аристократия хуже монархии, а при дурных законах наоборот. В книге Государство проповедуется аристократическое правительство философов, а в Законах автор считает лучшей формой правления тирана (т. е. автократа), доступного хорошим внушениям.
   Вес противоречия разных книг, приписываемых Платону, конечно, лучше и проще всего были бы объяснены допущением, что эти книги принадлежат различным авторам. Но тогда что останется от философа Платона как исторической личности? – Благодаря естественному желанию сохранить эту привычную нам личность, большинство исследователей выбирало другое решение загадки, именно, что все эти трактаты писаны Платоном в разные периоды его жизни, при чём он радикально менял все свои политические, моральные и религиозные убеждения на противоположные, т. е., ставя точку над i, был типичным идейным хамелеоном. Но точно ли это значит сохранить историческую личность Платона? – Его моральная физиономия является при таком допущении совсем неприглядной и мало соответствует правильному представлению о творческих умах вообще.
   Меняют свои основные убеждения только те, кто не сам их выработал, а заимствовал готовыми от других. Почти все великие творческие умы отказывались от того, что было заимствовано ими без критики в детстве от окружающих, ради новых более совершенных идей, но мы не знаем ни одного случая, где великий и оригинальный ум выработал бы сам в различные периоды своей жизни несколько противоречащих друг другу убеждений. А «Платон» по своему времени должен был бы являться именно самостоятельным мыслителем и творцом своих идей, вынашивавшим их своим собственным потом и кровью. Всё, что мы видим в сочинениях, приписываемых Платону, более соответствует творчеству различных мыслителей одного и того же литературно-философского течения, тотчас разбившегося на несколько ручейков, хотя и имевших общий исток и общую эпоху развития. Вот почему очень важно разобрать и выяснить этот вопрос объективно, нашим методом наглядного диаграмметрического исследования склада речи данных произведений, приняв за основное положение, что склад речи меняется очень медленно и немного у отдельных личностей и что вообще нельзя допустить, чтоб один и тот же человек писал сначала карамзинским слогом, а потом перешёл к тургеневскому и не в каком-нибудь одном отношении, а во многих.
ТАБЛИЦА XIV
«Фрасилов Канон» из 56 сочинений «Платона»
   Крестики в кругах налево перед названиями обозначают диалоги, всеми признанные за подложные. Нулики справа обозначают произведения, признанные подложными указанными вверху исследователями.
   К сожалению, статистические данные, представленные разными исследователями стиля «Платона», не однородны между собой, и большинство их обращает особенное внимание именно на слова редкие, специально придуманные самим автором данного произведения и часто заключающиеся только в нём одном. Вот, например, табличка таких слов, взятая у Кемпбелля (таблица XV)[9]
ТАБЛИЦА XV
(По Кемпбеллю)
 
   Табличка эта в первой колонке даёт для каждой страницы издания Didot'а среднее количество оригинальных слов, найденных в показанных сбоку диалогах, т. е. имеющихся лишь в одном данном диалоге и не встречающихся во всех других.
   У Кемпбелля расчёт был сделан на 100 страниц текста, так что все оригинальные слова выражались сотнями, в целых числах. Я же здесь отделил запятою последнюю пару цифр, чтоб отнести величины к одной странице текста (в издании Didot), что более ясно говорит нашему уму. Мы видим, например, что язык (т. е. уже словарь, а не слог) у автора Федра настолько отличается от языка каждого из остальных «платонианских» произведений, что на каждой странице содержит в среднем более четырёх (4,36) своеобразных слов, не употребляемых более нигде в «платоновых» произведениях. Язык Законов ещё более своеобразен, так как на каждой странице содержит более 4? слов, не имеющихся ни в Федре, ни в других платонианских книгах. То же самое, хотя и в меньшей степени, можно сказать о Политике и Софисте.
   Тимей же и Критиас, как сложенные вместе, показывают нам только одно, что и они тоже очень оригинальны по языку, хотя неудачная идея сложить их и не даёт нам права заключить, велика ли разница их собственных словарей друг от друга.
   Даже приняв во внимание, что некоторая часть оригинальных слов объясняется в «платонианских» диалогах разностью их сюжетов, нельзя не поразиться этой своеобразностью языка каждого из них, так как на специальные слова нельзя отнести даже и четверти полученной здесь разницы. Из приложенной таблички XVI, даваемой Кемпбеллем, к сожалению, только для Политика и Софиста[10], ясно видно, что специальных слов, каковы физические и математические термины в Политике, только 0,25 на странице (т. е. одно на четыре страницы), в Софисте же и того менее – 0,08 на страницу (что соответствует одному слову на двенадцать страниц). Значит, почти вся разница языка, даваемая нами в предыдущей (XVI) таблице, сводится, главным образом, к таким словам, которые могли быть почти безразлично употреблены и в других диалогах. Однако же о них там нет и помина; это указывает на то, что каждое из этих произведений написано особым автором.