Горный Е & Вигурский К
Развитие электронных библиотек - мировой и российский опыт, проблемы, перспективы

   Евгений Горный, Константин Вигурский
   Развитие электронных библиотек:
   мировой и российский опыт, проблемы, перспективы
   В статье обсуждаются вопросы создания и развития электронных библиотек; специфика ЭБ в сравнении с прочими информационными системами; определения и термины, используемые в этой области; основные подходы к пониманию ЭБ. Прослеживается история развития ЭБ в мире и в России. Анализируется типология производителей электронного содержания, проблема авторского права, соотношения платного и бесплатного доступа. Обсуждаются трудности и проблемы в развитии ЭБ и намечаются возможные пути их разрешения.
   Введение
   Место электронных библиотек среди других информационных систем
   Определения и термины
   Очерк развития электронных библиотек
   Электронные библиотеки в России
   Проблемы и трудности
   Заключение
   Литература
   Введение
   Развитие и широкое внедрение информационных технологий оказывает трансформирующее воздействие на все области современной жизни включая сферы экономики, власти, науки и образования. Для характеристики нового общественного строя, в котором главной ценностью являются информация и знание, используются такие эпитеты, как посткапиталистическое, постэкономическое, постиндустриальное, информационное, информациональное общество, общество знания и т. п. [14; 15; 19]. Несмотря на концептуальные различия, стоящие за этими определениями, общим является тот факт, что информация и знание становятся определяющим экономическим фактором, а также важнейшим национальным ресурсом, который в определенном смысле подобен недрам, воде, лесам и т. п. [38; 42] и который в значительной степени определяет благосостояние государства. Сохранение, развитие и рациональное использование национального информационного ресурса является задачей государственного значения.
   Национальный информационный ресурс складывается из двух составляющих: традиционной (рукописные и печатные материалы, живопись, скульптура, архитектура, аудиозаписи, фотографии, кино- и видеофильмы и т.п.) и электронной (любые информационные объекты в цифровой форме). Различие между этими двумя составляющими состоит не только в способе представления информации, но и в стратегиях ее хранения, распространения и модификации.
   Сохранение и использование рукописных, печатных и иных документов традиционного типа достаточно хорошо освоено в ходе исследовательской и практической работы многих поколений специалистов. Но очевидно, что объемы информации, хранящейся в традиционной форме, делают все более затруднительной эффективную работу с ней - хранение, распространение, поиски, учет и т. п. Решение этой фундаментальной проблемы лежит на пути использования современных средств вычислительной техники и информационных технологий и теснейшим образом связано с переводом хранимой информации в электронную форму.
   Хотя отмеченные составляющие информационного ресурса развиваются параллельно, в перспективе вся наиболее значимая часть традиционной составляющей будет, безусловно, представлена и в электронной форме. С другой стороны, в последние десятилетия наблюдается стремительный рост объема информации, существующей только в электронной форме или создаваемой в этой форме изначально для последующего выпуска печатных, аудио-, видео- и прочих изданий. В России (не самой передовой стране в области информационной индустрии) объем информации, содержащейся только в официально зарегистрированных базах данных, превышает весь объем информации, хранимой в Российской государственной библиотеке. Общее число баз данных у организаций, проходивших в 1996 г. обследование Госкомстата, составило почти 800 тыс., в том числе около 400 тыс. собственного производства. Общий объем всех баз данных составил свыше 15 Тб (для собственных баз данных общий объем - свыше 5 Тб). Количество электронных документов, доступных через Интернет, оценивалось в 2000 г. в 300 млн, а к концу 2001 г. это число достигло 3 млрд [33]. Проиндексированный объем российского сегмента Интернета, по данным "Яндекса", составлял в июне 2001 г. около 650 Гб, а в марте 2002 г. достиг 1 Тб [20].
   В настоящее время электронная форма позволяет хранить информацию наиболее надежно и компактно, распространять ее намного оперативнее и шире, а кроме того, предоставляет возможности манипулирования с ней, которых не могло быть при иных формах. Таким образом, представление информации в электронной форме: создание электронных документов, организация ее в виде электронных изданий (ЭИ), разнообразных электронных коллекций и электронных библиотек (ЭБ) - не дань моде, а насущная необходимость.
   Роль ЭБ в условиях информационного общества трудно переоценить. "Обеспечение публичного (в том числе удаленного) доступа пользователей к информационным ресурсам стало одной из первоочередных задач обслуживания науки, культуры и образования" [12]. Очевидно, что эта задача имеет общенациональное и, шире, общечеловеческое значение и как таковая требует стратегического планирования, значительных инвестиций и объединения усилий многих специалистов, как практиков, так и теоретиков.
   Мы рассмотрим ряд принципиальных вопросов, касающихся создания и развития электронных библиотек, имея в виду прежде всего необходимость полноценного вхождения России в информационную эпоху, что представляется невозможным без развития собственных информационных ресурсов и технологий, одной из важнейших форм которых являются ЭБ. Вначале мы вкратце обсудим специфику ЭБ в сравнении с прочими информационными системами. Затем рассмотрим основные определения и термины, используемые в этой области, проанализируем основные подходы к пониманию ЭБ и предложим целостную концепцию функциональной структуры ЭБ, введя необходимую терминологию. Далее мы проследим историю развития ЭБ в мире, затронув такие вопросы, как типология производителей электронного содержания, авторское право, соотношение платного и бесплатного доступа. После этого мы остановимся на том, что было к настоящему времени сделано в области ЭБ в России; обсудим возникающие здесь трудности и проблемы и наметим возможные пути их разрешения.
   Место электронных библиотек среди других информационных систем
   Очевидный путь повышения эффективности использования электронной информации - создание соответствующих информационных систем, способных надежно сохранять информацию и обеспечивать ее целенаправленное использование.
   Под целенаправленным использованием прежде всего понимается:
   адекватность воспроизведения информации, не зависящая от средств реализации;
   удобные процедуры копирования и передачи информации;
   возможность проведения разнообразных и качественных информационных поисков;
   наличие простых и эффективных средств навигации в доступном пользователю информационном пространстве.
   В соответствии с поставленными задачами эти информационные системы представляют собой, как правило, достаточно сложные комплексы, включающие программные, аппаратные, технологические, организационные и другие составляющие.
   К числу таких ИС можно отнести:
   системы, оперирующие с документальной информацией:
   коллекции электронных документов различных видов на веб-сайтах;
   электронные издания;
   электронные библиотеки;
   системы, оперирующие с потоками данных:
   транспортные системы;
   экономические системы;
   системы управления производством;
   системы статистических данных и т. п.;
   системы комбинированного типа:
   системы делопроизводства;
   геоинформационные системы и др.
   Количество таких систем, разработанных только за последние годы, достаточно велико. Наиболее новым и интенсивно развивающимся видом информационных систем являются ЭИ и ЭБ. Более того, можно с достаточной степенью вероятности утверждать, что системы документальной информации будут занимать все более значимое положение в информационном мире. Это утверждение обусловлено рядом причин, среди которых стоит выделить две. Первая заключается в том, что представлять данные в виде документов привычнее и понятнее, чем в иных формах, например, как реляционные таблицы. Реляционная таблица - в лучшем случае отдельный фрагмент документа. Манипулировать данными с использованием такой естественной для человека (но логически избыточной!) сущности, как "связь", также привычнее и понятнее, чем со ссылочными ключами, которые в реальных документах встречаются редко [5]. Вторая причина связана со все более широким использованием языков разметки, в частности SGML-подобных языков. Создание в последние годы языка разметки XML и целого класса связанных с ним спецификаций и программных средств позволяет говорить о возникновении XML-технологии. Эта технология содержит в себе возможности представления и манипулирования данными, которые могут оказаться вполне конкурентоспособными возможностям реляционных систем управления базами данных.
   Естественно, что ЭИ и ЭБ для выполнения своих функций фактически должны реализовываться в виде некоторых информационных систем, отличительным свойством которых является длительное хранение и использование информации, в частности ее распространение. Информационные же системы, работающие с динамической информацией, а также информационные системы, накапливающие информацию, но не предполагающие ее распространение (системы архивного типа), не могут быть отнесены к рассматриваемому классу (подробнее см. [6]).
   Определения и термины
   Область деятельности, связанная с ЭИ и ЭБ, является достаточно новой и поэтому еще не имеет устойчивой терминологии. Кажется, впервые этот вопрос подробно рассматривал Ф. Ланкастер в начале 80-х годов [37]. Однако его работы имели в определенной степени футурологический характер.
   Существенное развитие работы по ЭБ получили на рубеже 80-х и 90-х годов, когда появились адекватные средства вычислительной техники и информационные технологии, обеспечивающие надежное сохранение, оперативную обработку и эффективное использование больших массивов разнородной информации, прежде всего текстовой. Именно в это время в ряде стран стали подготавливаться проекты ЭБ. В процессе этих работ стало конкретизироваться понятие "электронная библиотека", стали определяться и уточняться ее цели, задачи и функции, что однако, не привело еще к однозначной трактовке проблемы. Так, в качестве синонимов для понятия "электронная библиотека" можно встретить такие словосочетания, как "цифровая библиотека" (digital library - наиболее распространенный термин в западной литературе) и "виртуальная библиотека" (virtual library). Сложность определений в этой области и разнообразие мнений показала и Вторая Всероссийская научная конференция "Электронные библиотеки: перспективные методы и технологии, электронные коллекции", проходившая в сентябре 2000 г. [27].
   Уточнение терминологии в рассматриваемой области деятельности является совершенно необходимым. Понятие "электронные библиотеки" используют в специальных работах и популярных статьях. Отчасти его употребление обоснованно, отчасти это дань моде. Нечто подобное происходило с понятием "база данных". "Электронные библиотеки", как и "электронные издания" и другие подобные выражения, появляются в различных контекстах и практически всегда либо без определений, либо с определениями, вряд ли проясняющими суть.
   Наиболее распространенные представления об ЭБ можно объединить в три группы:
   автоматизация традиционных библиотек;
   использование баз данных в Интернете;
   коллекции какой угодно информации, лишь бы в электронной форме и в Сети.
   Эти представления вряд ли можно признать правильными, хотя они отнюдь не бесполезны и связаны с существом проблемы.
   В первом случае предполагается, что ЭБ либо является частью традиционной библиотеки в современных условиях, либо полностью совпадает со средствами автоматизации этих библиотек. Возражения против такого подхода можно свести к двум утверждениям. Во-первых, основным объектом деятельности традиционных библиотек являются печатные издания со всей присущей им спецификой хранения, обработки и использования. ЭБ, в свою очередь, аккумулируют электронную информацию, представленную в виде совокупностей данных или электронных документов. Эта информация по способам организации, описания, хранения, по технологии подготовки и использования, по применяемым средствам существенно отличается от печатной. Даже в тех случаях, когда речь идет о представлении в электронной форме печатных изданий, различие весьма ощутимо. Во-вторых, вряд ли можно согласиться с мнением некоторых библиотечных работников, что их учреждения являются единственными и всеохватывающими системами хранения и распространения информации. Из сказанного не следует, что в рамках традиционных библиотек не следует создавать ЭБ. Сочетание различных форм обслуживания на базе различных фондов, как традиционных, так и электронных, может дать большой положительный эффект. Нужно только не забывать, что это, несмотря на сходство, разные сущности. Вместе с тем совершенно очевидно, что опыт, накопленный традиционными библиотеками, должен в полной мере учитываться при проектировании и эксплуатации ЭБ.
   Второе представление об ЭБ связано с базами данных и доступом к ним через Интернет. В последнее время любую базу данных часто начинают рассматривать как ЭБ. Принятие такого представления существенно сужает понятие ЭБ, превращая его фактически в новое обозначение уже известных сущностей. Упор в этом случае делается на программные и технические вопросы, в частности на масштабируемость, распределенность и интероперабельность. Бесспорно, эти вопросы должны занимать значительное место в проблеме ЭБ, однако ими она далеко не исчерпывается. С другой стороны, при таком подходе остаются в тени или вовсе игнорируются вопросы информационного содержания, например, что является основным информационным объектом, как работать с объектами, изменяющимися во времени, как их описывать и т. п.
   Представление об ЭБ просто как о коллекции каких угодно информационных объектов выхолащивает это понятие, лишает его системности. Уместно провести следующую аналогию - не всякое собрание или коллекция книг может рассматриваться как библиотека. При таком подходе, как правило, забывают о точно определенной стратегии формирования и развития информационного фонда, о каталогизации и описании информационных объектов и ряде других вопросов. Несомненно, любая ЭБ является коллекцией информационных объектов, однако обратное неверно, а именно это декларируется в рассматриваемом представлении. Кроме того, при таком понимании ЭБ оказывается неким гибридным, недифференцированным понятием, покрывающим множество разнородных явлений. К ним относят как собрания любых материалов в электронной форме, так и перечни гиперссылок на такие собрания или материалы.
   Тенденция применять термин "электронная библиотека" к собранию материалов любого типа могла бы быть правомерной при условии дифференциации самих этих типов. Например, можно было бы оставить название "библиотека" лишь для тех коллекций, которые содержат преимущественно текстовые материалы - неважно, в виде ли простого или размеченного текста либо в виде графических файлов, представляющих собой постранично сканированные книги и иные печатные материалы. Тогда к собраниям другого типа можно было бы прилагать более специфические обозначения: аудиотека (для аудиозаписей), видеотека (для кинои видеодокументов), пинакотека (для изображений), медиатека (для любых нетекстовых материалов). Реализация этого подхода, однако, сталкивается с серьезными трудностями, вызванными тем обстоятельством, что в электронной среде традиционная типология по материалу перестает работать, поскольку на первый план выдвигается понятие мультимедийности, когда в рамках отдельного документа или среды в целом объединяются и смешиваются материалы разных типов (текст, изображение, звук, видео и т. д.). Кроме того, разделение по материалу утрачивает смысл и по той причине, что практически к любому электронному объекту могут прилагаться одни и те же методы редактирования/модификации (копирование, вставка, морфинг и т. п.) [40].
   Итак, в настоящее время не существует единого понимания, что такое ЭБ. Чтобы показать спектр мнений по этому вопросу, приведем дюжину наиболее конструктивных определений понятия "электронная библиотека", взятых из западной и отечественной специальной литературы.
   1. <Цифровая библиотека - это:>
   управление ресурсами посредством компьютера;
   возможность связывать поставщика информации с потребителем информации через электронные каналы;
   возможность для сотрудников выступать в качестве посредников в электронном взаимодействии, когда поступает запрос от пользователя;
   возможность хранить, организовывать и передавать информацию к потребителю через электронные каналы.
   (Dowlin K. The Electronic Library. - S. l., 1984)
   2. Цифровые библиотеки - это набор электронных ресурсов и сопутствующих технических возможностей для создания, поиска и использования информации. В этом смысле они являются продолжением и расширением систем хранения и извлечения информации, имеющих дело с цифровыми данными любого типа (текст, изображения, звуки; статические или динамические изображения) и существующих в распределенных сетях. Содержание электронных библиотек включает в себя данные, метаданные, описывающие различные аспекты данных (например, тип репрезентации, создатель, владелец, права на воспроизведение), а также метаданные, состоящие из связей или отношений к другим данным или метаданным, неважно, носят они внутренний или внешний характер относительно электронной библиотеки.
   (1996 UCLA-NSF Social Aspects of Digital Libraries Workshop)
   3. Электронная библиотека - это база данных, содержащая цифровые информационные объекты в различных форматах, предоставляющая непосредственный доступ сообществу пользователей и обладающая следующими дополнительными характеристиками:
   универсальный инструмент доступа (например, каталог) дает возможность поиска и получения информации по всей базе данных;
   имеются организованные технические процедуры, посредством которых библиотечные специалисты добавляют объекты в базу данных или удаляют их согласно внятной и понятной политике формирования фондов.
   (Graham P. Rutgers University Libraries. - S. l., 1997)
   4. Электронная библиотека - понятие, обладающее разным значением в разных сообществах. Для инженерного и компьютерного сообщества электронная библиотека - это метафора новых видов услуг распределенных баз данных, управляющих неструктурированными мультимедийными данными. Для политического и делового сообщества этот термин обозначает новый рынок мировых информационных ресурсов и услуг. Для футуристических сообществ электронные библиотеки - это проявление уэллсовского Мирового Мозга.
   (Marchionini G. Research and Development in Digital Libraries. - S. l., 1998)
   5. Цифровые библиотеки - это сложные системы данных/информации/знания (далее - информации), которые помогают:
   удовлетворять информационные потребности пользователей (общества),
   предоставлять информационные услуги (сценарии),
   организовывать информацию таким образом, чтобы ее было удобно использовать (структуры),
   управлять местонахождением информации (пространства) и осуществлять передачу информации пользователям и их посредникам (потоки).
   (E. A. Fox, 1999)
   6. Работа электронной библиотеки осуществляется в сложно организованном контексте, который задают четыре измерения: сообщество, технология, услуги и содержание.
   (Marchionini G., Fox E. A. Progress toward digital libraries: augmentation through integration. - S. l., 1999)
   7. Электронные библиотеки - это организации, предоставляющие ресурсы включая обслуживающий персонал для отбора, структурирования, интеллектуального доступа, истолкования, сохранения целостности и обеспечения длительного функционирования собраний цифровых работ с тем, чтобы они были легко и экономично доступны для использования определенным сообществом или набором сообществ.
   (Digital Library Federation)
   Определения 1-7 приведены по [32] в переводе авторов настоящей статьи.
   8. Информационное определение ЭБ: управляемая коллекция информации в совокупности с соответствующими сервисами, причем информация хранится в цифровых форматах и доступна по сети.
   [29]
   9. ЭБ есть совокупность распределенных информационных ресурсов, объединенных единым интерфейсом и состоящее из:
   Модуля администрирования
   Аппаратно-программного комплекса
   Содержательных ресурсов: - реферативных БД - средств анализа рефератов доступа к полным текстам документов - гиперссылок на другие ресурсы Интернет.
   [21]
   10. "Электронная библиотека" - аппаратно-программный комплекс с широким спектром возможностей в области поиска и предоставления необходимой информации. Электронная библиотека (ЭБ), или цифровая библиотека - вид информационных систем, в котором документы хранятся и могут использоваться в машиночитаемой ("электронной") форме, причем программными средствами обеспечивается единый интерфейс доступа к электронным документам, содержащим тексты и изображения. База данных ЭБ может состоять из различного вида электронных коллекций документов. В принципе, в современной электронной библиотеке может обеспечиваться доступ не только к собственным электронным ресурсам, но и к ресурсам сторонних организаций, также обладающих соответствующими программными средствами, в том числе - сетевыми протоколами. В данном случае речь идет о виртуальной библиотеке.
   [7]
   11. Электронная библиотека - документальная автоматизированная информационная система, в которой документы (статьи, монографии, отчеты, рефераты и т. п.) хранятся, как правило, в полнотекстовом виде на электронных машинных носителях и могут предоставляться пользователям по их запросам в автоматизированную систему также в электронной форме, например, путем передачи текстов этих документов по электронной почте.
   [16]
   12. Электронная библиотека - это комплекс взаимосвязанных гетерогенных массивов информации и средств, обеспечивающих доступ пользователей к этим массивам, в функционально и организационно однородной среде.
   [8]
   Не вступая в полемику с авторами приведенных определений, хочется отметить то общее, что присутствует в большинстве из них: ЭБ предназначены для хранения информации различных видов, прежде всего текстовой, и реализуются в виде сложных информационных систем, возможно, распределенных и обладающих унифицированным интерфейсом.
   Приведем более детальное и, как нам кажется, более адекватное определение, предложенное одним из авторов настоящий статьи [2]: "Электронная библиотека (ЭБ) - информационная система, позволяющая надежно сохранять и эффективно использовать разнообразные коллекции электронных документов (текстовых, изобразительных, звуковых, видео и др.), локализованных в самой системе, а также доступных ей через телекоммуникационные сети. Основные задачи ЭБ интеграция информационных ресурсов и эффективная навигация в них".
   Под интеграцией информационных ресурсов понимается их объединение с целью использования (с помощью удобных и унифицированных пользовательских интерфейсов, желательно одного) различной информации с сохранением ее свойств, особенностей представления и пользовательских возможностей манипулирования с ней. При этом объединение ресурсов не обязательно должно осуществляться физически, оно может быть виртуальным, главное - оно должно обеспечивать пользователю восприятие доступной информации как единого информационного пространства. В частности предполагается, что ЭБ должны обеспечивать работу с гетерогенными БД или системами БД, обеспечивая пользователю эффективность информационных поисков независимо от особенностей конкретных информационных систем, к которым осуществляется доступ.
   Под эффективной навигацией в ЭБ понимается возможность для пользователя находить интересующую его информацию с наибольшей полнотой и точностью при наименьших затратах усилий во всем доступном информационном пространстве. При таком подходе хорошо известные информационные поиски, используемые в информационных системах и базах данных, являются частными случаями навигационных средств.
   Очевидно, как и в случае электронных изданий (ЭИ), информационные системы ЭБ должны быть полнотекстовыми, с мощными средствами информационных поисков. Однако если ЭИ выпускается как законченный продукт, то в ЭБ должны быть предусмотрены возможности ввода или удаления информационных объектов, их интеграции, реструктуризации и других подобных операций. Необходимо подчеркнуть, что эти возможности должны распространяться в основном (а возможно, и только) на информационные объекты, например на электронные документы, а не на содержащуюся в них информацию.
   Далее, к основным особенностям ЭБ также относятся:
   профильность хранимой информации, т. е. наличие определенной концепции формирования информационного пространства, доступного пользователю, и политики ее реализации;
   инвентаризация, в частности каталогизация (в самом широком смысле) объектов и различных их объединений, образующих это информационное пространство.