Что
Выявление подозрительных финансовых операций в банке, который обслуживает миллионы счетов - исключительно дорогостоящая и трудоемкая задача. После атак террористов 11 сентября Правительство США направило в банки списки 400 человек для выявления их банковских счетов, а также банковских счетов связанных с ними лиц.
Проблема заключается в том, что многие из этих имен и фамилий - арабские и восточноевропейские, и имеют десятки вариантов написания и произношения (как правильных, так и ошибочных). Кроме того, зачастую арабские фамилии также вводятся вместо имен и наоборот.
Эта задача осложняется также разнообразием и сложностью банковских материалов, которые необходимо исследовать. Например, в соответствии со швейцарским законодательством бумажные документы могут быть уничтожены после пяти лет хранения, с сохранением их образов в архивной базе данных. Банки также вынуждены осуществлять поиск среди многих источников - от записей о финансовых операциях по конкретному банковскому счету и газетных статей до писем из правительственных организаций.
Каким образом
RetrievalWAre оказалась единственной системой, способной справиться с подобными проблемами. Технологии "нечеткого" (APRP) и ассоциативного (семантическая сеть) поиска позволяют RetrievalWare справляться с вышеописанными проблемами арабских и восточноевропейских имен и фамилий, одновременно помогая сотрудникам банка исправлять неверно внесенные данные.
Каждое утро сотрудники банка получают от RetrievalWare рекомендательный список лиц похожих, на лиц из списка подозреваемых в связях с международным терроризмом. Сотрудникам остается проверить информацию о лицах, имеющих наибольшую степень совпадения с подозреваемыми, чтобы убедиться в том, что это не простое совпадение фамилии. Далее вопрос нескольких минут установить детали финансовой операции. Традиционный поиск занял бы месяцы.
Банк Швейцарии использует RetrievalWare с 1998 года для выявления фактов легализации доходов, полученных преступным путем. Программа RetrievalWare автоматически сравнивает информацию обо всех финансовых операциях с информацией о финансовых скандалах, фактах банкротства и обвинениях. До этого, последние два года сотрудники вынуждены были делать это вручную, но нехватка времени заставляла сотрудников делать эту операцию поверхностно. С помощью RetrievalWare они способны проводить детальный поиск по всем информационным массивам банка.
Кто
Департамент розыска без вести пропавших военнослужащих (DPMO) Министерства обороны США.
Что
До недавнего времени информация, касающаяся пропавших без вести военнослужащих, хранилась в бумажной форме и при необходимости обрабатывалась аналитиком в каждом индивидуальном случае. Соответственно, предоставить совместный доступ к информации для нескольких сотрудников DPMO представляло собой большую проблему.
После десятилетий использования данной бумажно-ориентированной технологии DPMO создал централизованный электронный архив документов.
При автоматизации архивной деятельности имеется несколько проблем, которые носят принципиальный характер с точки зрения автоматизации архивной деятельности. Так, например, на этапе перевода бумажных носителей в электронный вид с использованием программ распознавания текста возникает большое количество критических ошибок (до 20 % для печатных текстов).
Вычитывание и исправление этих ошибок является трудоемким и дорогостоящим процессом.
Каким образом
Возрастающая сложность информационной системы и рост количества используемых источников информации вынудили DPMO повернуться лицом к компании Convera и её технологиям интеллектуального поиска. RetrievalWare, обеспечивающим помехоустойчивость к ошибкам распознавания, т.е. способность находить информацию не на основе точного совпадения условия запроса и изучаемого массива, а на измерении степени близости их написания. При этом данная система показывает не только найденный распознанный текст, соответствующий запросу, но и графический образ, что является принципиально важным, так как предоставляет пользователю графический образ документа "как есть".
Принципиально важными характеристиками архивной системы, обрабатывающей терабайты информации, также являются скорость полнотекстового индексирования и скорость поиска. По этим показателям система RetrievalWare является мировым лидером среди систем полнотекстового поиска.
Кроме того, архивы хранят не только бумажные документы, но также и фотографии, фильмы (микрофильмы). Соответственно, информационная система должна работать как с текстовой, так и с фото-видеоинформацией, что также прекрасно реализовано в семействе продуктов компании Convera. Разграничение доступа на уровне файлов является также обязательным требование к архивной информационной системе, и это требование реализовано в RetrievalWare.
Кто
Американский центр исследования и оценки лекарств Комиссии по продуктам и лекарствам.
Что
Более 1800 ученых Комиссии по продуктам и лекарствам заняты исследованиями отчетов о вредных последствиях и разработкой, производством и продажей всех рецептурных и безрецептурных лекарств. Необходимость повышения эффективности их надзора за сертификацией, маркировкой и продажей вновь созданных лекарственных средств обусловило использование технологий извлечения знаний
Каким образом
Использование RetrievalWare компании Convera для поиска в архиве объемом более трех миллионов документов, содержащих информацию о вновь созданных лекарственных средствах обеспечило доступ к текстовой, фото и видео- информации предприятия.
Технологии поиска, разработанные Convera, позволяют оптимизировать информационную инфраструктуру в соответствии со всевозрастающими объемами информационных потоков. Они обеспечивают возможность быстрого и точного доступа к разнородной информации большому количеству пользователей.
Кто
Роспатент - Федеральный институт промышленной собственности России.
Что
Роспатент проводит единую государственную политику в области охраны объектов промышленной собственности, программ для ЭВМ, баз данных и топологий интегральных микросхем, осуществляет работы по совершенствованию законодательной и нормативной базы и международного сотрудничества в области интеллектуальной собственности, обеспечению условий для вовлечения объектов промышленной собственности в хозяйственный оборот; выполняет функции по вопросам совершенствования законодательства, международного сотрудничества и взаимодействия с общественными организациями в области авторского права и смежных прав, имеющих межведомственный характер, за исключением вопросов пресечения правонарушений в этой области.
Роспатент нуждался в масштабируемой поисковой системе, обладающей интеллектуальным поиском и способной извлекать информацию, хранящуюся в файлах различных форматов.
Каким образом
Программное обеспечение фирмы Convera Retrieval Ware эксплуатируется в Роспатенте - Федеральном институте промышленной собственности уже несколько лет и используется для создания и управления БД по объектам промышленной собственности, зарегистрированным в России (изобретения, полезные модели, промышленные образцы, товарные знаки).
Роспатент предоставляет в доступ через Интернет: 2 реферативные и 2 полнотекстовые БД по изобретениям, 3 БД по товарным знакам и наименованиям мест происхождения товаров, 1 БД по промышленным образцам, 1 БД по полезным моделям и 3 БД классификаторов. Общее количество документов - более 1 миллиона. Номенклатура БД постоянно пополняется.
В 2002 годe c Retrieval Ware ежедневно работало 450-500 пользователей. Количество запросов и количество пользователей постоянно увеличивается.