This version of the page http://www.webmasterpro.com.ua/news96.html (0.0.0.0) stored by archive.org.ua. It represents a snapshot of the page as of 2007-12-15. The original page over time could change.
Интервью: Поисковая система должна работать как Altavista, а не как Яндекс: WebmasterPro.com.ua - оптимизация сайтов в поисковых системах. Маркетинг и реклама в интернет

Поиск по некоммерческим SEO-ресурсам рунета

Реклама на сайте

 Хостинг
Платный хостинг
Бесплатный хостинг

Регистрация доменов

 Статьи
Яндекс
Google
Все поисковые системы
Оптимизация - основы
Баннерная реклама
Общие вопросы рекламы
Реклама в интернет
Маркетинг в интернет
Website management
Email-маркетинг
Почтовые рассылки
Спам и борьба с ним
Разработка сайта
Веб-дизайн
Usability
Каскадные таблицы стилей
HTML
Базы данных
Таблицы
MySQL
CGI
xDSL
Партнерские программы
Электронная коммерция
Выбор хостинга
Доменные имена
Провайдеры
Сервера
А также
Пресс-релизы
Каталог сайтов
Партнерские программы
Платный хостинг
Регистрация доменов
Раскрутка сайта
High-Tech портал

 Партнерские программы:
Продажа хостинга, регистрация доменов 
% от первого и последующих платежей клиентов за хостинг и регистрацию доменов
Выкуп поискового трафика из Google
по многочисленным запросам. Практически любая тематика. Стоимость клика - до 1$.

добавить рекламный блок

Интервью: Поисковая система должна работать как Altavista, а не как Яндекс


Категория: Все поисковые системы
Дата публикации:03-12-2004

Недавно РБК объявила о намерении предлагать решения для поиска информации в файловых хранилищах крупных корпораций, базах данных с миллионами записей или масштабных интернет-порталах, основанные на поисковой системе разработанной американской компанией Altavista. Вице-президент по информационным технологиям Холдинга РБК Алексей Кузовкин и технический директор Холдинга РБК Максим Филамофитский рассказали "Компьюленте" подробности.

- "Яндекс" утверждает, что если верить первым впечатлениям, у AltaVista есть некоторые проблемы с русским языком.

- В версию поискового механизма Альтависты, которую мы предлагаем, встроена полноценная поддержка русской морфологии, причем специально разработанная и адаптированная для задач поиска. Работа по созданию модуля поддержки русского языка велась нами более полутора лет. Просто в Yandex не до конца осознали задачи, которые решает наша система. По крайней мере, нам они не задали никаких вопросов.

- Насколько известно, поддержку русского языка в Altavista добавили непосредственно в РБК. Не могли бы Вы рассказать об этом подробнее?

- Когда перед нами встала задача доработки механизма AltaVista для поддержки русского языка, мы подробно во всех технических и лингвистических аспектах изучили практически все представленные на российском рынке пакеты работы с русским языком. Мы не нашли решения, которое полностью соответствовало бы нашим запросам. Часть решений были отсечены по технологическим аспектам, часть по качеству лингвистики. Когда дорабатывалась AltaVista, сначала наши лингвисты изучали поисковые запросы, введенные посетителями, и редакторами и по результатам этого исследования были разработаны механизмы, специально адаптированные для задач поиска. Поясним на простом примере, который приводит сам Yandex. В их поисковом механизме слова "человек" и "люди" считаются одинаковыми. Это верно с точки зрения русского языка, но это не правильно с точки зрения подхода к человеку, который ищет какой-либо документ. В нашем механизме есть специальные модули, которые пытаются предсказать, как изменяются слова, которых нет в словарях. Это важно при поиске нераспространенных географических названий, фамилий и других именах собственных. Это часть того ноу-хау, которые мы используем. Подобные средства есть и в более простых поисковых системах, например, в Yandex. Но попробуйте ввести слово "ПТУ" на РБК и в Yandex. На РБК вы получите документы о Профессиональных технических училищах, в Yandex же вам выдадут документы, где есть сокращение времени работы любой организации (пн-пт). Поисковая система решила, что ПТУ - это дательный падеж слова "пт". Это пример того, как не должна работать поисковая система.

- Какие другие системы поиска использовались на РБК ранее?

- Мы использовали решение Yandex с 1997 года. На тот момент это было единственное решение, которое предлагалось на российском рынке. Но с ростом посещаемости и количества документов, которые проходили через РБК наши потребности изменились, а технологии Yandex остались на прежнем уровне. К началу 2000 года к поисковому механизму Yandex накопилось очень много вопросов. Поддержкой системы в РБК практически постоянно занимались два человека. Время индексации всех наших документов превышало сутки и при сбоях системы, которые происходили еженедельно, наши пользователи теряли доступ к последней информации. Тогда мы приняли решение о смене поисковой технологии. После этого мы изучили все лидирующие российские и западные решения и выбрали механизм AltaVista. Теперь наши пользователи всегда могут мгновенно найти любой документ.

- Проводилось ли сравнительное тестирование Altavista и других поисковых систем?

- Конечно, проводилось. Мы разработали специальную методику тестирования, которая включала в себя оценку качества поиска (релевантности), скорость поиска, возможность работы с различными форматами, качество поддержки русского языка и многие другие показатели. AltaVista победила по всем показателям. Дело в том, что поисковая технология в веб отличается от корпоративной наличием так называемого "червя", который собирает документы из Интернет. У нас эта возможность не используется, так как мы знаем, как хранятся наши документы. Корпоративная же поисковая система должна поддерживать различные форматы данных, AltaVista умеет воспринимать более 250 различных форматов электронных документов.

- Что представляет собой корпоративное решение на базе Altavista, и насколько трудоемок процесс его интеграции в существующие системы документооборота?

- Корпоративное решение AltaVista предназначено для средних и крупных компаний. Такие фирмы уже имеют большие файловые хранилищами и базы данных. Между тем, объем данных, которые приходится обрабатывать человеку во время работы, по статистике, удваивается каждые три года. Кроме того, 80% информационных "запасов" типичной организации неструктурированны. В среднем за рабочий день на поиск информации в крупных компаниях тратится 30-40 минут, а это - непозволительная роскошь. Именно поэтому обеспечить сотрудников эффективным доступом к большим объемам данных становится не только технической задачей, но и проблемой успешного управления компании в целом. С точки зрения технологий системы документооборота и поисковый механизм - это разные системы. AltaVista позволяет интегрировать различные системы, где данные могут храниться в базе данных, на жестких дисках, в электронной почте, системах документооборота, CRM и ERP cистемах, в Интернете. Технологии AltaVista дают возможность работать с любыми исходными данными, причем процесс интеграции предельно прост.

- Во сколько обойдётся внедрение системы?

Цена внедрения очень сильно зависит от объема документооборота компании. Для средней компании затраты на внедрение AltaVista не превысят 30.000 долларов США. Крупное внедрение для большой корпорации будет стоить более 200.000 долларов.

Источник: Compulenta.ru

отправить по e-mail: версия для печати





 

Новости, статьи и пресс-релизы присылайте на news@webmasterpro.com.ua 
При перепечатке материалов ссылка на WebmasterPro обязательна


Copyright © 1999-2006 webmaster@webmasterpro.com.ua