Архивы и библиотеки

Кто
Physicians' Online - Интерактивные информационные ресурсы для врачей

Что
В начале 90-х годов Christian Mayaud и William Greenberg, занимавшиеся врачебной практикой в Нью-Йорке, решили упростить доступ врачей к медицинским базам данных в пределах больниц в которых они работали, используя свое знание компьютеров, медицинских информационных источников и профессиональный опыт. В результате они пришли к мысли о необходимости внедрения подобных решений повсеместно. Они осознали колоссальный эффект, который мог бы быть достигнут благодаря обеспечению централизованного доступа к единым базам медицинской информации, а также к коммуникационным ресурсам, включая электронную почту, Web-конференции, доски объявлений и форумы.

Для успешного функционирования эта служба должна была быть доступной медикам непосредственно на их рабочих местах, "разговаривать" на понятном им языке, быть доступной по цене и простой в использовании.

В то время как Chris Mayaud разрабатывал бизнес-план, находил деловых партнеров и формировал команду разработчиков, Bill Greenberg сосредоточился на инфраструктуре системы. Требовалась современная информационно-поисковая система, которую можно бы было максимально настроить на задачи заказчика, обладающая также удобным и простым графическим интерфейсом, и, что наиболее важно, поисковые возможности которой позволяли бы обрабатывать специфические запросы по медицинской тематике.

Каким образом
В результате Greenberg нашел Convera RetrievalWare - систему, обладающую всеми необходимыми качествами. RetrievalWare позволял вводить запросы на естественном языке и обладал широкими функциональными возможностями, включая поиск документов по образцу, атрибутивный и рекурсивный поиск. Но что однозначно делало RetrievalWare вне конкуренции - это возможность его полного встраивания в Unified Medical Language System (UMLS) - глобальную базу знаний по медицинской тематике, разработанной National Library of Medicine (Национальной Медицинской Библиотекой США).

Работая в тесном сотрудничестве с Greenberg'ом и его командой, Convera Technologies использовала UMLS для построения семантической сети медицинской терминологии - уникальной структуры, позволяющей RetrievalWare осуществлять поиск, основываясь не на написании слов, а на их смысловых значениях.

"Используя поисковые технологии, лежащие в основе RetrievalWare, наши врачи могут четко и быстро осуществлять поиск медицинской литературы без дополнительного изучения сложных методик поиска", - сказал William Greenberg, старший вице-президент и соучредитель Physicians' Online.

Physicians' Online

Служба Physicians' Online уникальна среди других интерактивных служб тем, что она полностью финансируется корпоративными спонсорами. Пользователи Physicians' Online имеют доступ к большому количеству других медицинских служб, включая: MEDLINE(c), AIDSLINE(c),CANCERLIT(c),HEALTH(c), АIDSDRUGS/AIDSTRIALS, Quick Medical Reference(QMR)(c) (QMR), Physicians GenRx/Foreign GenRx, Medi-Span, Clinical Alerts, Prescribing Decision Support Tools (PDST), ежедневные медицинские новости от Medical Tribune News Service а также New Medicines in Development.

Кто
"Публичная библиотека" использует технологии Convera

Что
Публичная библиотека - www.public.ru - единственная в России библиотека, обеспечивающая оперативный полнотекстовый доступ к фондам в сочетании с предоставлением исчерпывающей аналитики из открытых источников информации.

Библиотека Public.ru является членом Российской библиотечной ассоциации (РБА) и членом Международной федерации библиотечных ассоциаций (ИФЛА).

Основные фонды библиотеки представляют собой электронные архивы полных текстов публикаций периодических изданий на русском языке с 1990-го года по настоящее время. В настоящее время ежесуточно обрабатывается около 8 тысяч документов - фонды прирастают со скоростью примерно 300 документов в час, а общий объем базы данных достиг 25Гб. Основные национальные издания обрабатываются в режиме реального времени и становятся доступными для читателей библиотеки еще до наступления рабочего дня (число изданий для оперативной обработки составляет 47 наименований). Всего фонд библиотеки насчитывает около 1000 наименований периодики. За сутки в библиотеке регистрируется около 1000 посещений и выполняется порядка 3000 запросов.

За время работы библиотеки (она было открыта весной 2000 года) существенным образом изменился тематический репертуар изданий - если ранее он был ограничен преимущественно общественно-политическими, официальными изданиями и журналами социально-экономического блока, то теперь в фондах представлены практически все основные отрасли профессиональной деятельности: от энергетики до фармацевтики.

Выбор изданий осуществляется не только исходя из необходимости обеспечения тематической полноты фондов, но и качественных характеристик издания - информационной емкости, достоверности и первичности предоставляемых сведений, тиража и репутации газеты или журнала. В настоящее время журнальный фонд библиотеки содержит около 300 наименований.

Фонды библиотеки охватывают все регионы России - число региональных источников превысило 400, включая основные общественно-политические издания регионов и региональные информационные агентства.

Помимо российских изданий ведется мониторинг зарубежных русскоязычных изданий, в том числе изданий, выходящих в Латвии, Эстонии, Литве, Казахстане, Азербайджане, на Украине, а также ряда русскоязычных изданий, издающихся в США и Европе.

Деятельность <Публичной библиотеки> не ограничена мониторингом периодики - сегодня она выступает как интегратор информационного и рабочего пространства современного потребителя информации. Высокий уровень интеграции обеспечивается за счет системного подхода - помимо оперативного доступа к текстам, библиотека предлагает весь спектр аналитических услуг - тематические подборки текстов, аннотирование и реферирование публикаций, предоставление библиографических и фактографических справок, проводит комплексные исследований информационного поля российских СМИ, в том числе путем его измерений на основе статистических методов.

Ориентация библиотеки на требования квалифицированного читателя во многом предопределила структуру постоянных пользователей библиотеки - коммерческие структуры, преимущественно крупные корпорации, такие как Сберегательный банк РФ, Росбанк, РАО <ЕЭС России>, <СУАЛ-холдинг>, международная консалтинговая компания <Мак-Кинзи>, нефтяные компании <Лукойл> и <Сибнефть>, основные национальные телеканалы (ОРТ, ВГТРК, НТВ), государственные структуры (в частности, Минфин, ГУБОП, ФАПСИ, МПС), ряд общественно-политических организаций. В настоящее время библиотека на постоянной платной основе обслуживает примерно 300 корпоративных пользователей.

Библиотека работает не только для корпоративных пользователей - ее фонды открыты и доступны для любого пользователя Всемирной сети: при создании библиотеки был заложен механизм практической реализации обеспечения публичности фондов. Применяемая в библиотеке модель обслуживания, основанная на сочетании режимов платного и бесплатного обслуживания, в полной мере отвечает требованию доступности информации - она предоставляет открытый бесплатный доступ к информации для всех желающих за счет группы квалифицированных пользователей, для которых поиск информации является профессией.

Каким образом
В результате анализа нескольких средств создания информационно-поисковых систем зарубежных и российских разработчиков в качестве платформы был выбран продукт Convera RetrieveWare WebExpress корпорации Convera Technologies, интересы которой в России представляет компания "Одеон-АСТ".

По словам директора "Публичной библиотеки" Елены Бунь, такое решение во многом объясняется изучением опыта применения технологий Convera в крупнейших информационных хранилищах мира - в библиотеках Конгресса США и Британского музея. Хотя объем архива "Публичной библиотеки" сегодня не очень велик по сравнению с западными проектами, но динамика его роста весьма значительна, поэтому наиболее актуальна проблема масштабируемости.

Большое значение имеют мощные и разнообразные поисковые возможности Convera. Наличие Русского семантического сервера, разработанного в рамках локализации продукта, позволяет использовать технологию расширенного поиска для русскоязычных документов с применением запросов в виде логических конструкций или на естественном языке. В то же время крайне необходим имеющийся в Convera механизм нечеткого поиска. Он обеспечивает не только решение проблемы опечаток в документах или ошибок при распознавании текста, но также открывает отличные возможности для автоматизации поиска в массивах звуковой, графической и видеоинформации. Расширение базы данных в будущем планируется вести в значительной степени за счет широкого охвата мультимедийной информации.

Явным плюсом продукта Convera является его реализация в виде настоящего коробочного варианта. Настройка и адаптация под конкретный проект, а также разработка некоторых дополнительных модулей выполнялась силами программистов компании "Вектор-Инфо".