В развитии СУБД намечается крутой поворот.

В этом году IBM готовится представить первые плоды своего долгосрочного исследовательского проекта, начав тем самым новый раунд борьбы с конкурентами на многомиллиардодолларовом рынке СУБД.

В конце этого месяца Big Blue объявит о том, что к июню выйдет первый продукт в рамках инициативы Xperanto, цель которой - помочь компаниям извлекать информацию одновременно из множества источников данных, от торговой статистики до документов, хранящихся на серверах электронной почты.

Тем временем Microsoft и BEA Systems приближаются к решению той же проблемы посредством аналогичной технологии, тогда как лидер рынка СУБД Oracle предпочитает принципиально иной подход. На кон поставлено влияние на мировом рынке ПО и услуг управления базами данных, объем которого в 2001 году составлял 9 млрд $. Каждая компания надеется, что именно ее технология проложит путь к новой категории серверов баз данных или дополнительных серверов, специально предназначенных для интеграции.

Производители СУБД давно муссируют идею «федеративной», или виртуальной, базы данных, однако многочисленные попытки реализовать ее закончились неудачей из-за низкой скорости обработки распределенных запросов, рассказывает аналитик Giga Information Group Филип Рассом (Philip Russom). Немалую роль сыграла и сложность системы, а также отсутствие универсального языка представления данных, такого как Extensible Markup Language (XML).

Однако достижения последних двух лет в области технологии обработки запросов наряду с появлением более быстродействующей аппаратуры и сетей повысили шансы на успех проектов федеративных систем интеграции данных и корпоративной информации (enterprise information integration, EII). «Если поставщикам EII удастся решить проблемы производительности, то call-центры станут самым модным приложением, - говорит Рассом. - Пока же это лишь теоретический сценарий. Очень сложно найти пример предприятия, освоившего решение EII».

Система EII удобна для составления отчетов с целью анализа деятельности компании, когда быстрая реакция на изменение содержимого баз данных не требуется. У подхода федеративных данных есть преимущества по отношению к проектам хранилищ данных (data warehousing), где данные собираются через определенные интервалы времени и накапливаются в центральном хранилище. Если такой проект обычно обходится в миллиард долларов в год, то системы EII стоят десятки или тысячи долларов и обеспечивают максимально оперативную информацию.

Проект IBM Xperanto, основанный на XML, опирается на концепцию федеративного управления данными. Вместо единой большой базы данных - именно такую модель использует Oracle - в федеративной схеме создается виртуальная база, связывающая все необходимые данные. Источники данных опрашиваются там, где они находятся, а серверы СУБД консолидируют результаты и предоставляют их в распоряжение пользователей.

Сторонники федеративного подхода подчеркивают, что он позволяет сохранять данные в том формате и в том месте, где это удобнее всего, избегая новых разработок и дорогостоящих и ненадежных операций по преобразованию данных. Например, вместо того чтобы строить абсолютно новую СУБД для системы поддержки заказчиков, Xperanto-серверы позволят агентам по работе с клиентами отвечать на их запросы, поступающие через разные, несовместимые друг с другом системы. Обычными методами добиться этого нелегко, хотя и возможно.

Конкуренты IBM тоже интенсивно работают над технологией одновременного опроса разных источников данных. В прошлом году BEA Systems выпустила продукт Liquid Data for WebLogic, использующий для извлечения данных из множества источников XML-запросы.

Microsoft в первом полугодии этого года планирует выпустить бета-версию своей СУБД SQL Server с кодовым названием Yukon, которая облегчит манипулирование XML-данными из разных источников. Microsoft готовит и более крупный проект по интеграции технологии запросов в стиле Yukon в операционную систему Windows - разработки по этому проекту ведутся компанией уже десять лет.

В движение включаются и более мелкие компании, такие как Nimble Technology и MetaMatrix. «Мы уверены, что это очень важный сдвиг в индустрии управления данными, - говорит директор IBM по интеграции информации Нельсон Мэттос (Nelson Mattos). - Он ведет к переходу от управления только теми данными, которые физически находятся в системе, к федеративному подходу».

Давний спор

IBM Xperanto подливает масла в огонь давнего спора о том, как лучше управлять корпоративными данными. IBM, BEA и Microsoft защищают федеративный подход. Oracle - главный проповедник более централизованного подхода - утверждает, что обслуживать меньшее число крупных баз данных дешевле, чем большое число более мелких. Но СУБД Oracle тоже могут обращаться к разным источникам данных и работать с данными формата XML, отметил вице-президент Oracle по технологии распределенных баз данных Бенни Саудер (Benny Souder). «Мы считаем, что меньшее число крупных узлов создает экономию масштаба», - говорит он.

IBM возражает на это тем, что компании нуждаются в интеграции на разных уровнях - между источниками информации, приложениями и бизнес-процессами, - и инвестирует во все три направления. Пользуясь инструментами программирования IBM WebSphere Studio, разработчик может создать приложение, использующее возможности Xperanto, промежуточного ПО интеграции приложений WebSphereMQ и системы WebSphere Business Integrator. «Заказчики видят, что Xperanto повышает производительность труда программистов. Если они пишут приложение J2EE (Java 2 Enterprise Edition) и им нужно извлечь информацию из трех баз данных, они должны подсоединиться к каждой из этих БД, выдать запрос, извлечь данные и объединить их на уровне сервера приложений, - объясняет Мэттос из IBM. - В Xperanto же они подсоединяются и выполняют единственный запрос, получая данные, уже объединенные нужным образом».

IBM указывает на ряд внедрений в фармацевтической индустрии, где заказчики используют продукт IBM Data Joiner, специально предназначенный для обращения к реляционным базам данным и неструктурированным файлам на мейнфреймах. Кроме того, IBM старается привлечь разработчиков ПО к применению Xperanto в их собственных продуктах. Партнером IBM по Xperanto стала компания Crystal Decisions, которая продает ПО для создания бизнес-отчетов.

IBM намерена обрабатывать информацию как в реляционных СУБД, которые служат краеугольным камнем большинства бизнес-приложений, так и в системах управления электронной почтой и контентом, в которых хранятся документы. Работая со структурированными данными РСУБД и неструктурированными документами, IBM опирается на технологию XML. Будет поддерживаться и SQL (structured query language), способ обращения к реляционным базам данных, используемый всеми производителями СУБД. «Мы не верим в эффективность революционного подхода. Наши заказчики стараются использовать данные в уже существующих средах и добиться быстрой окупаемости инвестиций. А SQL - это гигантские инвестиции», - говорит Мэттос.

Первым продуктом IBM с использованием Xperanto станет специализированный сервер интеграции данных на базе флагманской СУБД IBM DB2. В него войдет инструмент разработки IBM WebSphere Studio для создания приложений, опирающихся на распределенные данные. В версию Xperanto, выпуск которой запланирован на 2004 год, IBM добавит возможность составлять запросы на XML-языке XQuery. Другие будущие версии расширят возможности поиска и анализа текстовых документов.