Страница:
На концепцию ЭИ и ЭБ, а также на их программное обеспечение существенное влияние оказывают требования, связанные с представлением и возможностью использования информации.
Все информационное пространство ЭИ или ЭБ, доступное пользователю, должно быть представлено в виде совокупности самостоятельных объектов. В качестве таковых во многих случаях могут выступать электронные документы. Под электронным документом понимается законченное произведение, представленное на машиночитаемом носителе, имеющее автора и допускающее однозначную идентификацию.
Информационные объекты могут представлять собой текстовые произведения, изображения, фонограммы, базы данных или их фрагменты и т. д. Организация информационного пространства как совокупности объектов и однозначная идентификация последних необходимы для обеспечения эффективной навигации и выполнения некоторых видов информационных поисков. В качестве основы такой идентификации может выступать библиографическое описание объекта, поскольку основную часть фонда будут составлять документы, допускающие стандартную библиографическую обработку.
Очерк развития электронных библиотек
Принцип, лежащий в основе электронных библиотек, можно возвести к глубокой древности. Некоторые называют этот принцип александрийским - по названию Александрийской библиотеки. Суть его состоит в том, что зафиксированная информация хранится в виде одного материального объекта (документа) в одном месте, все желающие имеют к ней доступ и могут по мере необходимости ее копировать для своих потребностей. Как таковой, этот принцип противостоит Гутенбергову, согласно которому информация фиксируется в виде определенного количества идентичных материальных объектов (документов) - тиража, экземпляры которого хранятся в разных местах, и все желающие имеют доступ к отдельным экземплярам, в частности могут приобретать их по мере необходимости. Однако действительный переход от Гутенберговой (книгопечатной) эпохи к новой информационной парадигме (александрийского типа) стал возможен лишь с развитием современных информационных технологий.
Среди первых работ, в которых было предсказано появление электронных библиотек и описаны их общие принципы, обычно называют статью В. Буша (V. Bush) "Как мы можем думать" (1945) и книгу Дж. С. Р. Ликлидера (J. C. R. Licklider) "Библиотеки в будущем" (1965). В первой, написанной тогдашним директором Американского агентства научных исследований, демонстрировались потенциальные возможности, которые технология может предоставить ученым для сбора, хранения, поиска и обработки информации. Предложенная А. Бушем концепция информационной системы, названной им "Memex", базировалась на использовании фотографий для хранения информации и в определенном смысле предвосхитила дальнейшее изобретение и внедрение микрофильмов и микрофиш. Однако главное значение его статьи в том, что в ней наглядно показана связь между новыми технологиями, информацией и развитием научных исследований. Дж. Ликлидер был одним из сотрудников Массачусетского технологического института и изучал влияние цифровых вычислений на будущее библиотек. В своей работе он перечислял исследования и разработки, необходимые для того, чтобы создать истинно дружественную по отношению к пользователю ЭБ.
Использование компьютеров для хранения и обработки библиотечной информации началось с 60-х годов. Одним из первых успешных примеров было создание (в конце 60-х) в Библиотеке Конгресса формата MARC (Machine-Readable Cataloging) для создания и ведения машиночитаемых каталогов. Его использование в Центре компьютерных онлайновых библиотек (Online Computer Library Center, OCLC) дало возможность предоставить доступ к каталожным записям многим библиотекам, что позволило им сэкономить значительные средства.
Зарождение ЭБ в современном смысле относится к концу 80-х годов, когда стали создаваться первые электронные библиотеки научных журналов (проекты "Mercury", CORE, "Tulip", 1987-1993 гг.; JSTORE, с 1995 г.; "High Wire Press", с 1995 г., и др.). Эти проекты преследовали как научные, так и экономические цели (создание архива важнейших журналов и обеспечении широкого доступа к нему, сокращение расходов библиотек за счет устранения дублирования коллекций журналов). Кроме того, решались чисто технические задачи, например, проблема адекватного отображения на экране греческих, математических и иных специальных символов. С середины 90-х годов многие научные журналы стали издаваться только в электронной форме. Это оказалось и экономичнее, и эффективнее (подробнее см. [29]).
В это же время многие печатные периодические издания широкого профиля (журналы, газеты, бюллетени и т. д.) стали создавать свои электронные версии включая оцифрованные архивы прежних выпусков, и предоставлять к ним платный или чаще бесплатный доступ через Интернет.
Кроме того, крупные библиотеки и музеи приступили к оцифровке хранящихся у них материалов, прежде всего редких, старинных и находящихся под угрозой физического разрушения, чтобы сохранить их для будущего и сделать общедоступными. Такие проекты, получившие название конверсионных, основываются, как правило, на постраничном сканировании рукописных или печатных документов с последующим сохранением изображений в графических файлах с высоким разрешением. Затем на основе этих файлов, составляющих репозиторий коллекции, создаются облегченные графические или текстовые варианты представления информации, которые могут передаваться по сети. Примерами проектов такого рода могут служить программы "American Memory" (с 1989 г. по настоящее время) и "National Digital Library" (c 1990 г., в 1998 г. преобразована в единую межведомственную программу - "Digital Libraries Initiative - Phase 2"), целью которых является перевод в электронную форму материалов, значимых для истории и культуры США. С середины 90-х годов подобные проекты стали осуществляться и в России (оцифровка коллекций Эрмитажа, редких рукописей в РГБ, ВГБИЛ и т. д.).
На начальных этапах становления Интернета значительный вклад в построение электронных библиотек внесли любители-энтузиасты, создавшие большое число ресурсов, некоторые из которых получили весьма широкую известность. Наиболее известными проектами такого рода являются "Проект Гутенберг" (http://promo.net/pg), инициированный в 1990 г. американским программистом М. Хартом, и российская "Библиотека Мошкова" (http://lib.ru), запущенная в ноябре 1994 г. и к августу 2001 г. включавшая в себя более 17 тыс. текстовых файлов общим объемом более 2,5 Гб, что почти на порядок превосходит текстовые объемы "Проекта Гутенберг" (около 2 тыс. текстов). Столь значительно различие объясняется не только русским "литературоцентризмом", но и в первую очередь спецификой отношения к интеллектуальной собственности и авторскому праву на Западе и в России (подробнее см. [1; 3; 10]). Оба проекта развиваются благодаря активности добровольцев, которые бесплатно набирают или сканируют и присылают тексты "библиотекарям". Однако если М. Мошков публикует все произведения, которые ему присылают, гарантируя, что снимет публикацию, если автор произведения заявит протест (чего, как правило, не случается) [16], то "Проект Гутенберг", как и другие любительские ЭБ на Западе, может легально публиковать только те тексты, срок авторских прав на которые истек и которые перешли в публичное пользование (public domain). Этот срок постоянно увеличивается законодателями, и в настоящее время в США и некоторых других странах составляет 50 лет после смерти автора. Понятно, что это резко сужает возможности западных некоммерческих ЭБ.
При всей несомненной общественной значимости любительские проекты обладают рядом существенных недостатков по сравнению с профессиональными ЭБ [9]. Главные из них таковы:
стихийность формирования фондов, неясность принципов отбора;
случайность и неполнота собраний;
недостаточная текстологическая база: произвольные источники публикации, опечатки, отсутствие необходимой библиографической информации; отсутствие справочно-комментаторского аппарата;
технологическая примитивность: "слабая" разметка документов (текст ASCII или простой HTML), минимальное количество сервисов для читателей.
Все это приводит к тому, что любительские ЭБ выполняют общекультурную функцию, выступая как удобный источник текстов в электронной форме, однако использовать эти ЭБ в научных и образовательных целях полноценно, как правило, невозможно.
Большая часть ЭБ в США и Западной Европе возникла и развивается в рамках академических и исследовательских организаций, к которым относятся прежде всего университеты. Именно в университетах и в университетских библиотеках и издательствах (разумеется, при финансовой поддержке со стороны государства, благотворительных фондов и корпораций) осуществляются передовые исследования в области ЭБ, разрабатываются стандарты и создаются разного рода цифровые коллекции. В качестве одного из образцовых примеров можно назвать "Центр электронного текста" при Университете Вирджинии (http://etext.lib.virginia.edu), коллекция которого насчитывает порядка 45 тыс. текстов на 12 языках в области литературы и гуманитарных наук, размеченных в SGML и бесплатно доступных онлайн. Другой замечательный проект, созданный на базе классического отделения Университета Тафтса, - ЭБ "Персей" (http://www.perseus.tufts.edu), известный, в частности, своим обширным собранием греческих и латинских текстов (в оригинале с пословным переводом и морфологическим анализом), справочных и учебных материалов, а также уникальными инструментами для лингвистической работы. Оба названных проекта, как и многие им подобные, ставят своей целью электронную публикацию максимально полного корпуса материалов в рамках заявленной специализации и предоставление доступа к ним максимальному числу пользователей. (список электронных центров в США и некоторых других странах см. в [31]). Научные электронные публикации, которые составляют основную часть электронной продукции академических учреждений, - тема обширная и в рамках данной статьи подробно не рассматривается. Укажем лишь на практически исчерпывающую библиографию по этой теме: [30]
Многие университетские ЭБ, однако, предоставляют лишь ограниченный доступ - либо только своим сотрудникам и студентам, либо некоторому числу других университетов и культурных учреждений, получая в обмен доступ к их цифровым коллекциям. Примером такой коллаборации может служить Калифорнийская цифровая библиотека (http://www.cdlib.org), предоставляющая доступ к значительному числу электронных коллекций и баз данных в девяти кампусах Университета Калифорнии. Заметим, что лицензирование доступа к цифровым коллекциям - весьма распространенное явление. Например, такие проекты, как JSTORE (http://www.jstor.org) и "Muse" (http://muse.jhu.edu), предоставляют доступ к своим электронным собраниям научных журналов исключительно по подписке и прежде всего организациям, а не частным лицам.
Необходимо отметить, что созданием и поддержкой ЭБ и других электронных продуктов занимается целый ряд коммерческих компаний, продающих как сами эти продукты на жестких носителях, так и лицензии на доступ к цифровой информации онлайн. Так, компания "ProQuest" (http://www.proquestcompany.com), базирующаяся в Анн-Арборе (штат Мичиган, США) и являющаяся одним из крупнейших провайдеров информационных услуг, лицензирует доступ к полным текстам тысяч периодических изданий, диссертаций, книг и других публикаций включая обширные электронные ресурсы компании "Chadwyck-Healey", которая в 1999 г. стала подразделением "ProQuest". Собрание микрофильмов, которым владеет кампания и которое переводится ею в цифровую форму, в начале 2002 г. насчитывало 6 млрд страниц. "ProQuest" имеет договоры о сотрудничестве с 8,5 тыс. издателей по всему миру и поставляет свои продукты в 160 стран. Информационные продукты, которыми торгует кампания, включают компакт-диски, микрофильмы, печатные издания, а также доступ к онлайновым информационным системам.
Говоря о соотношении платного и бесплатного доступа к ЭБ и другим информационным системам, можно констатировать тенденцию предоставления бесплатного доступа к информации неспециализированного типа или к такой информации, которая рассматривается в качестве национального культурного наследия (под обе категории подпадают, например, популярные издания произведений классической литературы). Информация же, которая необходима для проведения научных исследований или бизнеса, чаще оказывается платной. Другой параметр, влияющий на коммерческую ценность информации, - ее полнота: коллекции, состоящие из разрозненных документов, вероятно, будут бесплатными, полные собрания информации по теме, да еще с той или иной "добавочной ценностью" скорее всего будут продаваться. Можно предположить, что дальнейшее развитие ЭБ пойдет по пути сочетания некоммерческого и коммерческого подходов: базовые информационные ресурсы будут бесплатными, более "продвинутые" будут продаваться.
Конечно, определенную роль играет и то обстоятельство, кто является производителем информации. Одно дело - частные поставщики информации, живущие по законам рынка, другое - библиотеки, которые издавна рассматриваются как общественные службы. Дискуссия о том, должны ли электронные библиотеки взимать с пользователей деньги, идут давно (см., например, [34; 36; 38]), но единое решение так и не найдено. Сторонники бесплатного доступа исходят в основном из соображений идейного или политического характера (свободный доступ к информации как фундаментальное право личности и необходимый элемент общественных отношений), защитники рыночных отношений упирают на экономический фактор (высокая стоимость аппаратного и программного обеспечения, значительные затраты на подготовку информации и т. п.). Обсуждаются также концептуальные и технологические решения, позволяющие взимать плату с читателя ЭБ за конкретный объем востребованной им информации или предоставлять эту информацию бесплатно, но на четко ограниченный срок [34].
Наш обзор был бы неполон без упоминания о национальных и международных программах в области ЭБ, которые активно осуществляются в развитых странах (США, государствах Европейского союза, Японии, Австралии и др.) последние 10-15 лет. Мы уже упоминали об инициативе Библиотеки Конгресса по построению национальной электронной библиотеки и программе "Digital Libraries Initiative", которые в 1998 г. были объедены в единую межведомственную программу "Digital Libraries Initiative - Phase 2". Впечатляющий пример национальной программы создания ЭБ дает Япония, где в 1989 г. было начато проектирование электронной "библиотеки XXI в." [41]. Для проведения исследований, экспериментов и подготовки проектной документации было создано специальное Агентство по внедрению новых информационных технологий (IPA). В его состав вошли специалисты из Национальной парламентской библиотеки, Национального центра НТИ, других информационных центров, а также из крупных фирм, действующих на рынке информационных технологий. В результате был подготовлен проект Электронной библиотеки Японии в провинции Кансай (500 км от Токио), преобразовано в электронную форму (главным образом в виде изображений) более 10 млн страниц различных печатных изданий (книги, журналы, газеты, карты и др.). В марте 1998 г. был подготовлен план реализации всего проекта Электронной библиотеки Японии со сроком завершения в 2003 г. Общая стоимость проекта оценивается в 500 млн долл. К его реализации привлечено девять крупных фирм, в том числе NEC, "Mitsubisi", "Fujitsu".
Отметим также немецкий проект ЭБ "Global-Info" (http://www.global-info.org), начало подготовки которого относится к 1995 г. Его инициаторами стали 16 университетов и 4 научных общества (физики, математики, химии и информатики). Проект осуществляется под эгидой федерального Министерства образования, науки и технологии, которое финансирует 60% стоимости работ, оцениваемых в 60 млн марок. Проект рассчитан на шесть лет, а его практическая реализация начата в январе 1998 г.
Среди франкоязычных ЭБ назовем проект "Gallica" (http://gallica.bnf.fr), который активно развивается с 1997 г. под эгидой Национальной библиотеки Франции и к настоящему моменту содержит более 80 тыс. оцифрованных документов общим объемом около 15 млн страниц).
Помимо собраний более или менее традиционных библиотечных объектов в электронной форме в последние годы возникают коллекции принципиально нового типа. Так, появилось понятие "веб-архив", где объектом сохранения, описания и классификации выступают самые разнообразные интернет-ресурсы: веб-страницы, отдельные сайты, архивы телеконференций и т. п. Пожалуй, самым известным проектом такого рода является "The Internet Archive" (http://www.archive.org), сохраняющий содержимое Интернета "послойно", так что пользователь может проследить историю развития тех или иных сайтов в динамике или же получить образ Интернета или какой-то его части на определенный момент. Объем этого веб-архива, который начал вестись с 1996 г., составил к началу 2002 г. около 11 млрд страниц, или 100 Тб [35]. Кроме того, "The Internet Archive" поддерживает ряд специальных цифровых коллекций, также состоящих из нетрадиционных для ЭБ объектов: собрание американских документальных фильмов с 1903 по 1973 гг. (http://movie0.archive.org), собрание телепередач, посвященных событиям 11 сентября 2001 г. (http://www.televisionarchive.org), архив телеконференций (USENET) с 1996 г. и т. д. Можно ожидать, что на этом развитие ЭБ не закончится: содержание человеческого опыта и дальше будет неуклонно переводиться в электронную форму, возникнут или выйдут на передний план новые типы коллекций (например, собрания оцифрованных трехмерных объектов или миров виртуальной реальности), методы сбора, каталогизации, сохранения и доставки информации будут совершенствоваться, развитие информационных технологий будут преподносить все новые и новые сюрпризы.
Электронные библиотеки в России
Следует отметить, что в создании ЭБ в нашей стране задействованы все типы институций, рассматривавшиеся выше: любители-энтузиасты, университеты и научно-исследовательские организации, музеи и библиотеки, общественные организации, частные коммерческие предприятия и т. д. Имеется ряд обзоров популярных российских ЭБ [4, 11, 20, 25]. Не претендуя на детальное рассмотрение всего массива российских ЭБ, остановимся на наиболее характерных, как нам представляется, явлениях и тенденциях в этой области.
Разительное отличие российской ситуации с ЭБ от западной, которое бросается в глаза всем, кто занимается компаративистскими исследованиями в этой области, состоит прежде всего в том, что частные инициативы значительно превосходят по востребованности и социальной значимости федеральные и институциональные проекты. Следует отметить громадное количество любительских, некоммерческих электронных библиотек. Мы уже упоминали "Библиотеку Мошкова". Отмечалось, что причины превосходства этой "русской народной" ЭБ над аналогичным американским "Проектом Гутенберг" связаны, в частности, с разницей в подходе к понятию авторского права. Если западная модель жестко защищает имущественные права, то российское сознание особого значения им не предает, уважая лишь неимущественные права (авторство и т. п.). Интересно, что "легкомысленное" с западной точки зрения отношение к авторскому праву характеризует как электронных издателей, так и самих авторов, которые, как правило, охотно идут на публикацию своих произведений в электронном виде или по крайней мере не препятствуют таковой. Сюда же, помимо публикации в ЭБ раннее опубликованных в печатном виде литературных текстов, относится широкое распространение электронных литературных журналов, где произведения печатаются впервые именно в электронной форме (примером такого издания может служить "Сетевая словесность" - http://www.litera.ru/slova/, за пять лет существования опубликовавшая около тысячи произведений трехсот с лишним современных авторов), а также электронные архивы печатных журналов (например, "Журнальный зал" - http://www.russ.ru/krug/biblio/magazines/, предоставляющий свободный доступ к полным текстам произведений, опубликованных в российских "толстых" журналах). Другое проявление этой тенденции - относительная неразвитость ЭБ, поддерживаемых университетами и издательствами, а также малое количество индивидуальных авторских сайтов, преследующих коммерческие цели. Таким образом, специфика русского Интернета (во всяком случае, в том, что относится к литературным и окололитературным текстам) заключается в том, что он, в отличие от западного, носит ярко выраженный "общественный" и некоммерческих характер (см. подробнее превосходное исследование Э. Шмидт на эту тему [26]). Количество любительских электронных библиотек исчисляется в России десятками, если не сотнями. Существует множество списков таких ЭБ; назовем несколько самых представительных: каталог "Лучшие электронные библиотеки" (http://www.russ.ru/krug/biblio/catalogue.html), поддерживаемый "Русским журналом" в рамках проекта "Новости электронных библиотек", и раздел "Ссылки", составленный И.А. Пильщиковым и К.В. Вигурским для Фундаментальной электронной библиотеки (http://feb-web.ru/feb/feb/sites.htm).
Что касается университетов, которые, как отмечалось, играют ведущую роль в создании ЭБ на Западе, то в России вплоть до последнего времени академические организации в этом отношении были довольно пассивны. Дело, как правило, ограничивалось созданием тематических коллекций текстов (по математике, психологии, общественным наукам и т. п.), причем по технологическому уровню публикаций эти коллекции были сопоставимы с любительскими, значительно уступая им в охвате и темпах роста. В ряде случаев функции университетов принимают на себя независимые публикаторы. В качестве примеров можно назвать проект "Общий текст" (http://text.net.ru), созданный, "чтобы сообща пополнять Сеть отсутствующими в ней текстами", и "Русскую виртуальную библиотеку" (http://www.rvb.ru) - первую в русской Сети библиотеку академического типа, публикующую русскую классику по авторитетным изданиям с приложением справочного аппарата и комментариев.
Далеко не блестяще обстоят дела с электронными публикациями и у библиотек. Ни одна из крупных библиотек до сих пор не породила ничего достойного внимания или могущего конкурировать с любительскими ЭБ. Как правило, библиотечные проекты в области ЭБ являют собой печальные образцы "освоения грантов": создается какой-нибудь "каталог ресурсов", и на этом дело заканчивается. Примером такого рода проектов может служить "Виртуальная библиотека" (http://www.vlibrary.ru) при ГПНТБ России, созданная, как указано на сайте, "при поддержке Совета по программе "Информатизация России". Описание проекта говорит само за себя: "В Виртуальной Библиотеке Вы можете отыскать необходимые ссылки на ресурсы Internet. Представлено более 2000 адресов онлайновых журналов, газет, WWW сайтов и домашних страниц". Есть в этой библиотеке и собственные онлайновые публикации, правда, совсем немного - одна, да и то в формате MS Word6. Разумеется, активность ГПНТБ в сфере электронных публикаций не сводится к указанному проекту, однако этот печальный пример весьма характерен для электронно-издательской деятельности российских библиотек.
Значительное количество ЭБ в России создается силами отдельных предприятий, организаций и учреждений. Рассмотрим несколько наиболее удачных на наш взгляд проектов: два проекта архивного типа, работающих с материалами СМИ, и три проекта в сфере науки и образования.
Public.ru: "Публичная интернет-библиотека" (http://www. public.ru). Поддерживается ЗАО "Публичная библиотека". Представляет собой базу данных по российским СМИ. Основной фонд составляют публикации российских периодических изданий с 1990 г. по настоящее время. Представлено около 1000 источников: центральные и региональные газеты и журналы. Заявленная цель: "способствовать реализации права граждан на свободный доступ к информации и свободное духовное развитие, а также на культурную, научную и образовательную деятельность". Основные задачи: "создание архива публикаций центральных и региональных периодических изданий, предоставление массового доступа к нему, организация справочно-библиографического обслуживания пользователей, исследование рынка СМИ". Поиск по фондам обеспечивается системой "Excalibur RetrievalWare". Предоставляется свободный доступ, но предлагаются и платные услуги: обслуживание в режиме "профессиональный поиск", подбор документов по заданным критериям, составление тематических баз данных, составление на заказ справок и аналитических материалов, подписка на тематические обзоры прессы.
"Национальная электронная библиотека" (НЭБ) (http://www.nel.ru) электронный архив русскоязычных открытых информационных источников. Возник как внутренний проект Национальной службы новостей в 1994 г. и по мере развития пополнялся за счет сбора текущих публикаций и покупки существующих информационных архивов. Фонды НЭБ содержат материалы газет, журналов, агентств, информационно-аналитических институтов, теле- и радиостанций, современных и опубликованных до 1994 г., практически из всех регионов России, стран СНГ, Балтии и дальнего зарубежья. На начало 2002 г. архив содержал порядка 10 млн документов из более чем 2 тыс. источников. Опираясь на документальную базу данных, НЭБ выпускает еженедельные и ежедневные тематические обзоры, иллюстрированные собственными рейтингами. Основные темы: банковская деятельность, внутренняя и международная политика, культура, преступность, макроэкономика, прогнозируемые отставки и назначения во властных центральных и региональных структурах. Все услуги платные.
"Научная электронная библиотека" (http://elibrary.ru). Владелец: OOO "Интра-Центр+". Спонсоры: Российский фонд фундаментальных исследований, Фонд Сороса, Министерство образования. Предоставляет доступ к зарубежным и российским научным журналам и базам данных крупным российским университетам, научно-техническим библиотекам России и их филиалам, части научных библиотек институтов РАН и региональных научных библиотек России. Доступ ограничен, требуется институциональная подписка.
Все информационное пространство ЭИ или ЭБ, доступное пользователю, должно быть представлено в виде совокупности самостоятельных объектов. В качестве таковых во многих случаях могут выступать электронные документы. Под электронным документом понимается законченное произведение, представленное на машиночитаемом носителе, имеющее автора и допускающее однозначную идентификацию.
Информационные объекты могут представлять собой текстовые произведения, изображения, фонограммы, базы данных или их фрагменты и т. д. Организация информационного пространства как совокупности объектов и однозначная идентификация последних необходимы для обеспечения эффективной навигации и выполнения некоторых видов информационных поисков. В качестве основы такой идентификации может выступать библиографическое описание объекта, поскольку основную часть фонда будут составлять документы, допускающие стандартную библиографическую обработку.
Очерк развития электронных библиотек
Принцип, лежащий в основе электронных библиотек, можно возвести к глубокой древности. Некоторые называют этот принцип александрийским - по названию Александрийской библиотеки. Суть его состоит в том, что зафиксированная информация хранится в виде одного материального объекта (документа) в одном месте, все желающие имеют к ней доступ и могут по мере необходимости ее копировать для своих потребностей. Как таковой, этот принцип противостоит Гутенбергову, согласно которому информация фиксируется в виде определенного количества идентичных материальных объектов (документов) - тиража, экземпляры которого хранятся в разных местах, и все желающие имеют доступ к отдельным экземплярам, в частности могут приобретать их по мере необходимости. Однако действительный переход от Гутенберговой (книгопечатной) эпохи к новой информационной парадигме (александрийского типа) стал возможен лишь с развитием современных информационных технологий.
Среди первых работ, в которых было предсказано появление электронных библиотек и описаны их общие принципы, обычно называют статью В. Буша (V. Bush) "Как мы можем думать" (1945) и книгу Дж. С. Р. Ликлидера (J. C. R. Licklider) "Библиотеки в будущем" (1965). В первой, написанной тогдашним директором Американского агентства научных исследований, демонстрировались потенциальные возможности, которые технология может предоставить ученым для сбора, хранения, поиска и обработки информации. Предложенная А. Бушем концепция информационной системы, названной им "Memex", базировалась на использовании фотографий для хранения информации и в определенном смысле предвосхитила дальнейшее изобретение и внедрение микрофильмов и микрофиш. Однако главное значение его статьи в том, что в ней наглядно показана связь между новыми технологиями, информацией и развитием научных исследований. Дж. Ликлидер был одним из сотрудников Массачусетского технологического института и изучал влияние цифровых вычислений на будущее библиотек. В своей работе он перечислял исследования и разработки, необходимые для того, чтобы создать истинно дружественную по отношению к пользователю ЭБ.
Использование компьютеров для хранения и обработки библиотечной информации началось с 60-х годов. Одним из первых успешных примеров было создание (в конце 60-х) в Библиотеке Конгресса формата MARC (Machine-Readable Cataloging) для создания и ведения машиночитаемых каталогов. Его использование в Центре компьютерных онлайновых библиотек (Online Computer Library Center, OCLC) дало возможность предоставить доступ к каталожным записям многим библиотекам, что позволило им сэкономить значительные средства.
Зарождение ЭБ в современном смысле относится к концу 80-х годов, когда стали создаваться первые электронные библиотеки научных журналов (проекты "Mercury", CORE, "Tulip", 1987-1993 гг.; JSTORE, с 1995 г.; "High Wire Press", с 1995 г., и др.). Эти проекты преследовали как научные, так и экономические цели (создание архива важнейших журналов и обеспечении широкого доступа к нему, сокращение расходов библиотек за счет устранения дублирования коллекций журналов). Кроме того, решались чисто технические задачи, например, проблема адекватного отображения на экране греческих, математических и иных специальных символов. С середины 90-х годов многие научные журналы стали издаваться только в электронной форме. Это оказалось и экономичнее, и эффективнее (подробнее см. [29]).
В это же время многие печатные периодические издания широкого профиля (журналы, газеты, бюллетени и т. д.) стали создавать свои электронные версии включая оцифрованные архивы прежних выпусков, и предоставлять к ним платный или чаще бесплатный доступ через Интернет.
Кроме того, крупные библиотеки и музеи приступили к оцифровке хранящихся у них материалов, прежде всего редких, старинных и находящихся под угрозой физического разрушения, чтобы сохранить их для будущего и сделать общедоступными. Такие проекты, получившие название конверсионных, основываются, как правило, на постраничном сканировании рукописных или печатных документов с последующим сохранением изображений в графических файлах с высоким разрешением. Затем на основе этих файлов, составляющих репозиторий коллекции, создаются облегченные графические или текстовые варианты представления информации, которые могут передаваться по сети. Примерами проектов такого рода могут служить программы "American Memory" (с 1989 г. по настоящее время) и "National Digital Library" (c 1990 г., в 1998 г. преобразована в единую межведомственную программу - "Digital Libraries Initiative - Phase 2"), целью которых является перевод в электронную форму материалов, значимых для истории и культуры США. С середины 90-х годов подобные проекты стали осуществляться и в России (оцифровка коллекций Эрмитажа, редких рукописей в РГБ, ВГБИЛ и т. д.).
На начальных этапах становления Интернета значительный вклад в построение электронных библиотек внесли любители-энтузиасты, создавшие большое число ресурсов, некоторые из которых получили весьма широкую известность. Наиболее известными проектами такого рода являются "Проект Гутенберг" (http://promo.net/pg), инициированный в 1990 г. американским программистом М. Хартом, и российская "Библиотека Мошкова" (http://lib.ru), запущенная в ноябре 1994 г. и к августу 2001 г. включавшая в себя более 17 тыс. текстовых файлов общим объемом более 2,5 Гб, что почти на порядок превосходит текстовые объемы "Проекта Гутенберг" (около 2 тыс. текстов). Столь значительно различие объясняется не только русским "литературоцентризмом", но и в первую очередь спецификой отношения к интеллектуальной собственности и авторскому праву на Западе и в России (подробнее см. [1; 3; 10]). Оба проекта развиваются благодаря активности добровольцев, которые бесплатно набирают или сканируют и присылают тексты "библиотекарям". Однако если М. Мошков публикует все произведения, которые ему присылают, гарантируя, что снимет публикацию, если автор произведения заявит протест (чего, как правило, не случается) [16], то "Проект Гутенберг", как и другие любительские ЭБ на Западе, может легально публиковать только те тексты, срок авторских прав на которые истек и которые перешли в публичное пользование (public domain). Этот срок постоянно увеличивается законодателями, и в настоящее время в США и некоторых других странах составляет 50 лет после смерти автора. Понятно, что это резко сужает возможности западных некоммерческих ЭБ.
При всей несомненной общественной значимости любительские проекты обладают рядом существенных недостатков по сравнению с профессиональными ЭБ [9]. Главные из них таковы:
стихийность формирования фондов, неясность принципов отбора;
случайность и неполнота собраний;
недостаточная текстологическая база: произвольные источники публикации, опечатки, отсутствие необходимой библиографической информации; отсутствие справочно-комментаторского аппарата;
технологическая примитивность: "слабая" разметка документов (текст ASCII или простой HTML), минимальное количество сервисов для читателей.
Все это приводит к тому, что любительские ЭБ выполняют общекультурную функцию, выступая как удобный источник текстов в электронной форме, однако использовать эти ЭБ в научных и образовательных целях полноценно, как правило, невозможно.
Большая часть ЭБ в США и Западной Европе возникла и развивается в рамках академических и исследовательских организаций, к которым относятся прежде всего университеты. Именно в университетах и в университетских библиотеках и издательствах (разумеется, при финансовой поддержке со стороны государства, благотворительных фондов и корпораций) осуществляются передовые исследования в области ЭБ, разрабатываются стандарты и создаются разного рода цифровые коллекции. В качестве одного из образцовых примеров можно назвать "Центр электронного текста" при Университете Вирджинии (http://etext.lib.virginia.edu), коллекция которого насчитывает порядка 45 тыс. текстов на 12 языках в области литературы и гуманитарных наук, размеченных в SGML и бесплатно доступных онлайн. Другой замечательный проект, созданный на базе классического отделения Университета Тафтса, - ЭБ "Персей" (http://www.perseus.tufts.edu), известный, в частности, своим обширным собранием греческих и латинских текстов (в оригинале с пословным переводом и морфологическим анализом), справочных и учебных материалов, а также уникальными инструментами для лингвистической работы. Оба названных проекта, как и многие им подобные, ставят своей целью электронную публикацию максимально полного корпуса материалов в рамках заявленной специализации и предоставление доступа к ним максимальному числу пользователей. (список электронных центров в США и некоторых других странах см. в [31]). Научные электронные публикации, которые составляют основную часть электронной продукции академических учреждений, - тема обширная и в рамках данной статьи подробно не рассматривается. Укажем лишь на практически исчерпывающую библиографию по этой теме: [30]
Многие университетские ЭБ, однако, предоставляют лишь ограниченный доступ - либо только своим сотрудникам и студентам, либо некоторому числу других университетов и культурных учреждений, получая в обмен доступ к их цифровым коллекциям. Примером такой коллаборации может служить Калифорнийская цифровая библиотека (http://www.cdlib.org), предоставляющая доступ к значительному числу электронных коллекций и баз данных в девяти кампусах Университета Калифорнии. Заметим, что лицензирование доступа к цифровым коллекциям - весьма распространенное явление. Например, такие проекты, как JSTORE (http://www.jstor.org) и "Muse" (http://muse.jhu.edu), предоставляют доступ к своим электронным собраниям научных журналов исключительно по подписке и прежде всего организациям, а не частным лицам.
Необходимо отметить, что созданием и поддержкой ЭБ и других электронных продуктов занимается целый ряд коммерческих компаний, продающих как сами эти продукты на жестких носителях, так и лицензии на доступ к цифровой информации онлайн. Так, компания "ProQuest" (http://www.proquestcompany.com), базирующаяся в Анн-Арборе (штат Мичиган, США) и являющаяся одним из крупнейших провайдеров информационных услуг, лицензирует доступ к полным текстам тысяч периодических изданий, диссертаций, книг и других публикаций включая обширные электронные ресурсы компании "Chadwyck-Healey", которая в 1999 г. стала подразделением "ProQuest". Собрание микрофильмов, которым владеет кампания и которое переводится ею в цифровую форму, в начале 2002 г. насчитывало 6 млрд страниц. "ProQuest" имеет договоры о сотрудничестве с 8,5 тыс. издателей по всему миру и поставляет свои продукты в 160 стран. Информационные продукты, которыми торгует кампания, включают компакт-диски, микрофильмы, печатные издания, а также доступ к онлайновым информационным системам.
Говоря о соотношении платного и бесплатного доступа к ЭБ и другим информационным системам, можно констатировать тенденцию предоставления бесплатного доступа к информации неспециализированного типа или к такой информации, которая рассматривается в качестве национального культурного наследия (под обе категории подпадают, например, популярные издания произведений классической литературы). Информация же, которая необходима для проведения научных исследований или бизнеса, чаще оказывается платной. Другой параметр, влияющий на коммерческую ценность информации, - ее полнота: коллекции, состоящие из разрозненных документов, вероятно, будут бесплатными, полные собрания информации по теме, да еще с той или иной "добавочной ценностью" скорее всего будут продаваться. Можно предположить, что дальнейшее развитие ЭБ пойдет по пути сочетания некоммерческого и коммерческого подходов: базовые информационные ресурсы будут бесплатными, более "продвинутые" будут продаваться.
Конечно, определенную роль играет и то обстоятельство, кто является производителем информации. Одно дело - частные поставщики информации, живущие по законам рынка, другое - библиотеки, которые издавна рассматриваются как общественные службы. Дискуссия о том, должны ли электронные библиотеки взимать с пользователей деньги, идут давно (см., например, [34; 36; 38]), но единое решение так и не найдено. Сторонники бесплатного доступа исходят в основном из соображений идейного или политического характера (свободный доступ к информации как фундаментальное право личности и необходимый элемент общественных отношений), защитники рыночных отношений упирают на экономический фактор (высокая стоимость аппаратного и программного обеспечения, значительные затраты на подготовку информации и т. п.). Обсуждаются также концептуальные и технологические решения, позволяющие взимать плату с читателя ЭБ за конкретный объем востребованной им информации или предоставлять эту информацию бесплатно, но на четко ограниченный срок [34].
Наш обзор был бы неполон без упоминания о национальных и международных программах в области ЭБ, которые активно осуществляются в развитых странах (США, государствах Европейского союза, Японии, Австралии и др.) последние 10-15 лет. Мы уже упоминали об инициативе Библиотеки Конгресса по построению национальной электронной библиотеки и программе "Digital Libraries Initiative", которые в 1998 г. были объедены в единую межведомственную программу "Digital Libraries Initiative - Phase 2". Впечатляющий пример национальной программы создания ЭБ дает Япония, где в 1989 г. было начато проектирование электронной "библиотеки XXI в." [41]. Для проведения исследований, экспериментов и подготовки проектной документации было создано специальное Агентство по внедрению новых информационных технологий (IPA). В его состав вошли специалисты из Национальной парламентской библиотеки, Национального центра НТИ, других информационных центров, а также из крупных фирм, действующих на рынке информационных технологий. В результате был подготовлен проект Электронной библиотеки Японии в провинции Кансай (500 км от Токио), преобразовано в электронную форму (главным образом в виде изображений) более 10 млн страниц различных печатных изданий (книги, журналы, газеты, карты и др.). В марте 1998 г. был подготовлен план реализации всего проекта Электронной библиотеки Японии со сроком завершения в 2003 г. Общая стоимость проекта оценивается в 500 млн долл. К его реализации привлечено девять крупных фирм, в том числе NEC, "Mitsubisi", "Fujitsu".
Отметим также немецкий проект ЭБ "Global-Info" (http://www.global-info.org), начало подготовки которого относится к 1995 г. Его инициаторами стали 16 университетов и 4 научных общества (физики, математики, химии и информатики). Проект осуществляется под эгидой федерального Министерства образования, науки и технологии, которое финансирует 60% стоимости работ, оцениваемых в 60 млн марок. Проект рассчитан на шесть лет, а его практическая реализация начата в январе 1998 г.
Среди франкоязычных ЭБ назовем проект "Gallica" (http://gallica.bnf.fr), который активно развивается с 1997 г. под эгидой Национальной библиотеки Франции и к настоящему моменту содержит более 80 тыс. оцифрованных документов общим объемом около 15 млн страниц).
Помимо собраний более или менее традиционных библиотечных объектов в электронной форме в последние годы возникают коллекции принципиально нового типа. Так, появилось понятие "веб-архив", где объектом сохранения, описания и классификации выступают самые разнообразные интернет-ресурсы: веб-страницы, отдельные сайты, архивы телеконференций и т. п. Пожалуй, самым известным проектом такого рода является "The Internet Archive" (http://www.archive.org), сохраняющий содержимое Интернета "послойно", так что пользователь может проследить историю развития тех или иных сайтов в динамике или же получить образ Интернета или какой-то его части на определенный момент. Объем этого веб-архива, который начал вестись с 1996 г., составил к началу 2002 г. около 11 млрд страниц, или 100 Тб [35]. Кроме того, "The Internet Archive" поддерживает ряд специальных цифровых коллекций, также состоящих из нетрадиционных для ЭБ объектов: собрание американских документальных фильмов с 1903 по 1973 гг. (http://movie0.archive.org), собрание телепередач, посвященных событиям 11 сентября 2001 г. (http://www.televisionarchive.org), архив телеконференций (USENET) с 1996 г. и т. д. Можно ожидать, что на этом развитие ЭБ не закончится: содержание человеческого опыта и дальше будет неуклонно переводиться в электронную форму, возникнут или выйдут на передний план новые типы коллекций (например, собрания оцифрованных трехмерных объектов или миров виртуальной реальности), методы сбора, каталогизации, сохранения и доставки информации будут совершенствоваться, развитие информационных технологий будут преподносить все новые и новые сюрпризы.
Электронные библиотеки в России
Следует отметить, что в создании ЭБ в нашей стране задействованы все типы институций, рассматривавшиеся выше: любители-энтузиасты, университеты и научно-исследовательские организации, музеи и библиотеки, общественные организации, частные коммерческие предприятия и т. д. Имеется ряд обзоров популярных российских ЭБ [4, 11, 20, 25]. Не претендуя на детальное рассмотрение всего массива российских ЭБ, остановимся на наиболее характерных, как нам представляется, явлениях и тенденциях в этой области.
Разительное отличие российской ситуации с ЭБ от западной, которое бросается в глаза всем, кто занимается компаративистскими исследованиями в этой области, состоит прежде всего в том, что частные инициативы значительно превосходят по востребованности и социальной значимости федеральные и институциональные проекты. Следует отметить громадное количество любительских, некоммерческих электронных библиотек. Мы уже упоминали "Библиотеку Мошкова". Отмечалось, что причины превосходства этой "русской народной" ЭБ над аналогичным американским "Проектом Гутенберг" связаны, в частности, с разницей в подходе к понятию авторского права. Если западная модель жестко защищает имущественные права, то российское сознание особого значения им не предает, уважая лишь неимущественные права (авторство и т. п.). Интересно, что "легкомысленное" с западной точки зрения отношение к авторскому праву характеризует как электронных издателей, так и самих авторов, которые, как правило, охотно идут на публикацию своих произведений в электронном виде или по крайней мере не препятствуют таковой. Сюда же, помимо публикации в ЭБ раннее опубликованных в печатном виде литературных текстов, относится широкое распространение электронных литературных журналов, где произведения печатаются впервые именно в электронной форме (примером такого издания может служить "Сетевая словесность" - http://www.litera.ru/slova/, за пять лет существования опубликовавшая около тысячи произведений трехсот с лишним современных авторов), а также электронные архивы печатных журналов (например, "Журнальный зал" - http://www.russ.ru/krug/biblio/magazines/, предоставляющий свободный доступ к полным текстам произведений, опубликованных в российских "толстых" журналах). Другое проявление этой тенденции - относительная неразвитость ЭБ, поддерживаемых университетами и издательствами, а также малое количество индивидуальных авторских сайтов, преследующих коммерческие цели. Таким образом, специфика русского Интернета (во всяком случае, в том, что относится к литературным и окололитературным текстам) заключается в том, что он, в отличие от западного, носит ярко выраженный "общественный" и некоммерческих характер (см. подробнее превосходное исследование Э. Шмидт на эту тему [26]). Количество любительских электронных библиотек исчисляется в России десятками, если не сотнями. Существует множество списков таких ЭБ; назовем несколько самых представительных: каталог "Лучшие электронные библиотеки" (http://www.russ.ru/krug/biblio/catalogue.html), поддерживаемый "Русским журналом" в рамках проекта "Новости электронных библиотек", и раздел "Ссылки", составленный И.А. Пильщиковым и К.В. Вигурским для Фундаментальной электронной библиотеки (http://feb-web.ru/feb/feb/sites.htm).
Что касается университетов, которые, как отмечалось, играют ведущую роль в создании ЭБ на Западе, то в России вплоть до последнего времени академические организации в этом отношении были довольно пассивны. Дело, как правило, ограничивалось созданием тематических коллекций текстов (по математике, психологии, общественным наукам и т. п.), причем по технологическому уровню публикаций эти коллекции были сопоставимы с любительскими, значительно уступая им в охвате и темпах роста. В ряде случаев функции университетов принимают на себя независимые публикаторы. В качестве примеров можно назвать проект "Общий текст" (http://text.net.ru), созданный, "чтобы сообща пополнять Сеть отсутствующими в ней текстами", и "Русскую виртуальную библиотеку" (http://www.rvb.ru) - первую в русской Сети библиотеку академического типа, публикующую русскую классику по авторитетным изданиям с приложением справочного аппарата и комментариев.
Далеко не блестяще обстоят дела с электронными публикациями и у библиотек. Ни одна из крупных библиотек до сих пор не породила ничего достойного внимания или могущего конкурировать с любительскими ЭБ. Как правило, библиотечные проекты в области ЭБ являют собой печальные образцы "освоения грантов": создается какой-нибудь "каталог ресурсов", и на этом дело заканчивается. Примером такого рода проектов может служить "Виртуальная библиотека" (http://www.vlibrary.ru) при ГПНТБ России, созданная, как указано на сайте, "при поддержке Совета по программе "Информатизация России". Описание проекта говорит само за себя: "В Виртуальной Библиотеке Вы можете отыскать необходимые ссылки на ресурсы Internet. Представлено более 2000 адресов онлайновых журналов, газет, WWW сайтов и домашних страниц". Есть в этой библиотеке и собственные онлайновые публикации, правда, совсем немного - одна, да и то в формате MS Word6. Разумеется, активность ГПНТБ в сфере электронных публикаций не сводится к указанному проекту, однако этот печальный пример весьма характерен для электронно-издательской деятельности российских библиотек.
Значительное количество ЭБ в России создается силами отдельных предприятий, организаций и учреждений. Рассмотрим несколько наиболее удачных на наш взгляд проектов: два проекта архивного типа, работающих с материалами СМИ, и три проекта в сфере науки и образования.
Public.ru: "Публичная интернет-библиотека" (http://www. public.ru). Поддерживается ЗАО "Публичная библиотека". Представляет собой базу данных по российским СМИ. Основной фонд составляют публикации российских периодических изданий с 1990 г. по настоящее время. Представлено около 1000 источников: центральные и региональные газеты и журналы. Заявленная цель: "способствовать реализации права граждан на свободный доступ к информации и свободное духовное развитие, а также на культурную, научную и образовательную деятельность". Основные задачи: "создание архива публикаций центральных и региональных периодических изданий, предоставление массового доступа к нему, организация справочно-библиографического обслуживания пользователей, исследование рынка СМИ". Поиск по фондам обеспечивается системой "Excalibur RetrievalWare". Предоставляется свободный доступ, но предлагаются и платные услуги: обслуживание в режиме "профессиональный поиск", подбор документов по заданным критериям, составление тематических баз данных, составление на заказ справок и аналитических материалов, подписка на тематические обзоры прессы.
"Национальная электронная библиотека" (НЭБ) (http://www.nel.ru) электронный архив русскоязычных открытых информационных источников. Возник как внутренний проект Национальной службы новостей в 1994 г. и по мере развития пополнялся за счет сбора текущих публикаций и покупки существующих информационных архивов. Фонды НЭБ содержат материалы газет, журналов, агентств, информационно-аналитических институтов, теле- и радиостанций, современных и опубликованных до 1994 г., практически из всех регионов России, стран СНГ, Балтии и дальнего зарубежья. На начало 2002 г. архив содержал порядка 10 млн документов из более чем 2 тыс. источников. Опираясь на документальную базу данных, НЭБ выпускает еженедельные и ежедневные тематические обзоры, иллюстрированные собственными рейтингами. Основные темы: банковская деятельность, внутренняя и международная политика, культура, преступность, макроэкономика, прогнозируемые отставки и назначения во властных центральных и региональных структурах. Все услуги платные.
"Научная электронная библиотека" (http://elibrary.ru). Владелец: OOO "Интра-Центр+". Спонсоры: Российский фонд фундаментальных исследований, Фонд Сороса, Министерство образования. Предоставляет доступ к зарубежным и российским научным журналам и базам данных крупным российским университетам, научно-техническим библиотекам России и их филиалам, части научных библиотек институтов РАН и региональных научных библиотек России. Доступ ограничен, требуется институциональная подписка.