Интеграция Internet-новостей - актуальность задачи и пути
ее решения
Григорьев Александр Николаевич,
директор
Информационного центра "ЭЛВИСТИ"
Internet как информационная сеть ставит огромное число проблем перед
пользователем. Многие считают ее ни чем иным, как большой "информационной
свалкой". В настоящее время, когда общие ресурсы Internet превышают 2
млрд. файлов, разобраться с их информационным наполнением помогают
поисковые системы и развитые каталоги, многие из которых претендуют на роль
"стартовых страниц Internet" для своих пользователей. Однако большинство из
сетевых навигаторов не в состоянии отслеживать и регистрировать
появляющиеся в Internet новые ресурсы в оперативном режиме. Это связано с
тем, что периоды индексации универсальных информационно-поисковых систем
очень велики и зачастую превышают несколько недель. В результате значимый
по величине и наполнению, один из самых актуальных пластов информационных
ресурсов - новостные сообщения - не охватывается традиционными
навигаторами. Названная проблема обусловила появление нового типа
информационных систем в Internet - сетевых интеграторов новостей.
Практически одновременно с освоением традиционными СМИ виртуального
пространства Интернет и с настоящей экспансией он-лайновых изданий, стали
возникать службы, обеспечивающие обобщенное представление информации со
страниц сетевых СМИ на своих сайтах, а также ?проталкивание? (push-
технология) информации, якобы интересующей пользователей в рабочие области
их браузеров. Получила начальное развитие и технология "персональных
информационных агентов", обеспечивающих клиентскую часть появляющихся
систем интеграции новостей.
Одним из первых серьезных интеграторов новостей в Сети стала служба
Northern Light Technology (http://www.nlsearch.com/). Этой службой создана
и постоянно пополняется "специальная коллекция", включающая статьи из более
7 тысяч источников - журналов, газет, агентств, реферативных журналов.
В настоящее время в мире появились службы, специализирующиеся на
информационном обеспечении самих интеграторов новостей. Например, Northern
Light Technology является клиентом одной из крупнейших служб сбора новостей
- COMTEX (http://www.comtexnews.net/), которая интегрирует ресурсы около
сотни солидных источников, среди которых крупнейшие мировые информационные
агентства, такие как Associated Press, ИТАР-ТАСС, Синьхуа. Клиентами COMTEX
являются также десятки новостных служб, среди которых OneSource, Screaming
Media, Vertical Net, CompuServe и др.
Типовой алгоритм интеграции Internet-новостей включает три основных шага:
- Сканирование информации, включающее сбор данных в сети Internet и ее
первичную обработку;
- Обработку собранных данных средствами "контент-механизмов" (Content
Engines), в качестве которых чаще всего используются системы
полнотекстового поиска и системы автоматической классификации;
- Предоставление данных потребителю. При этом предусматривается широкий
спектр возможных технологий - от размещения на Web и пересылки по
электронной почте до принудительного "проталкивания" (push) или передачи по
WAP-протоколу.
В Информационном центре "ЭЛВИСТИ" разработана система Stream, которая
обеспечивает автоматизированный сбор информации с Web-сайтов сети Интернет
в режиме реального времени, ее структурирование, группировку по
семантическим признакам, а также эффективное тематическое избирательное
распределение информации и предоставление к ней доступа в режимах просмотра
и поиска. В настоящее время в "ЭЛВИСТИ" системой Stream обрабатывается
свыше 20000 сообщений в сутки из более 300 информационных источников
(украинских и зарубежных). Ядром "контент-механизма" Stream является
информационно-поисковая система InfoReS-XL, обеспечивающая обработку
информации в двух основных режимах:
- в режиме избирательного распространения информации (ИРИ);
- в режиме интерактивного доступа к полнотекстовой базе данных.
Режим ИРИ используется в двух основных процессах - при поиске и доставке по
электронной почте сохраненных запросов пользователей и при классификации
поступающей в систему информации. Режим интерактивного доступа к базе
данных предлагается пользователям корпоративных сетей, в которых
установлены системы, построенные на основе технологии Stream.
Перспективным направлением систем сетевой интеграции новостей сегодня
является контент-мониторинг, который позволяет автоматически формировать
компактные дайджесты, статистические таблицы и гистограммы, заменяя ими
необозримые объемы электронных медиа.
Внедрение системы Stream обеспечивает следующие преимущества:
- Предоставление оперативного доступа к самой актуальной информации;
- Включение рабочих мест сотрудников в информационное пространство,
своевременное "напоминание" и "проталкивание" профильной информации в
электронные "почтовые ящики";
- Обеспечение целенаправленной работы сотрудников, отсутствие факторов
отвлечения внимания, присущих сети Интернет;
- Возможность контроля потребляемой сотрудниками информации;
- "Виртуальная экстерриториальность" - возможность составления
презентабельных и актуальных отчетов, не покидая рабочего места;
- Защита данных, конспиративность.
Потоковая технология Stream и системы, построенные на основе этой
технологии, сегодня уже внедрены или внедряются в ряде организаций и
государственных органов. На сегодняшний день Stream-технология уже
используется в Госкомсвязи и информатизации Украины, в Главном управлении
государственной службы Украины, в МЧС Украины. В настоящее время проводятся
работы по внедрению технологии Stream в ГУБОП МВД Украины, Фонде
Госимущества Украины, Службе безопасности Украины, Министерстве иностранных
дел Украины.
Презентация в формате MS Power Point
|