В развитии СУБД намечается крутой поворот.
В этом году IBM готовится представить первые плоды своего
долгосрочного исследовательского проекта, начав тем самым новый раунд борьбы
с конкурентами на многомиллиардодолларовом рынке СУБД.
В конце этого месяца Big Blue объявит о том, что к июню выйдет
первый продукт в рамках инициативы Xperanto, цель которой - помочь компаниям
извлекать информацию одновременно из множества источников данных, от торговой
статистики до документов, хранящихся на серверах электронной почты.
Тем временем Microsoft и BEA Systems приближаются к решению
той же проблемы посредством аналогичной технологии, тогда как лидер рынка
СУБД Oracle предпочитает принципиально иной подход. На кон поставлено влияние
на мировом рынке ПО и услуг управления базами данных, объем которого в 2001
году составлял 9 млрд $. Каждая компания надеется, что именно ее технология
проложит путь к новой категории серверов баз данных или дополнительных серверов,
специально предназначенных для интеграции.
Производители СУБД давно муссируют идею «федеративной», или
виртуальной, базы данных, однако многочисленные попытки реализовать ее закончились
неудачей из-за низкой скорости обработки распределенных запросов, рассказывает
аналитик Giga Information Group Филип Рассом (Philip Russom). Немалую роль
сыграла и сложность системы, а также отсутствие универсального языка представления
данных, такого как Extensible Markup Language (XML).
Однако достижения последних двух лет в области технологии
обработки запросов наряду с появлением более быстродействующей аппаратуры
и сетей повысили шансы на успех проектов федеративных систем интеграции данных
и корпоративной информации (enterprise information integration, EII). «Если
поставщикам EII удастся решить проблемы производительности, то call-центры
станут самым модным приложением, - говорит Рассом. - Пока же это лишь теоретический
сценарий. Очень сложно найти пример предприятия, освоившего решение EII».
Система EII удобна для составления отчетов с целью анализа
деятельности компании, когда быстрая реакция на изменение содержимого баз
данных не требуется. У подхода федеративных данных есть преимущества по отношению
к проектам хранилищ данных (data warehousing), где данные собираются через
определенные интервалы времени и накапливаются в центральном хранилище. Если
такой проект обычно обходится в миллиард долларов в год, то системы EII стоят
десятки или тысячи долларов и обеспечивают максимально оперативную информацию.
Проект IBM Xperanto, основанный на XML, опирается на концепцию
федеративного управления данными. Вместо единой большой базы данных - именно
такую модель использует Oracle - в федеративной схеме создается виртуальная
база, связывающая все необходимые данные. Источники данных опрашиваются там,
где они находятся, а серверы СУБД консолидируют результаты и предоставляют
их в распоряжение пользователей.
Сторонники федеративного подхода подчеркивают, что он позволяет
сохранять данные в том формате и в том месте, где это удобнее всего, избегая
новых разработок и дорогостоящих и ненадежных операций по преобразованию данных.
Например, вместо того чтобы строить абсолютно новую СУБД для системы поддержки
заказчиков, Xperanto-серверы позволят агентам по работе с клиентами отвечать
на их запросы, поступающие через разные, несовместимые друг с другом системы.
Обычными методами добиться этого нелегко, хотя и возможно.
Конкуренты IBM тоже интенсивно работают над технологией одновременного
опроса разных источников данных. В прошлом году BEA Systems выпустила продукт
Liquid Data for WebLogic, использующий для извлечения данных из множества
источников XML-запросы.
Microsoft в первом полугодии этого года планирует выпустить
бета-версию своей СУБД SQL Server с кодовым названием Yukon, которая облегчит
манипулирование XML-данными из разных источников. Microsoft готовит и более
крупный проект по интеграции технологии запросов в стиле Yukon в операционную
систему Windows - разработки по этому проекту ведутся компанией уже десять
лет.
В движение включаются и более мелкие компании, такие как Nimble
Technology и MetaMatrix. «Мы уверены, что это очень важный сдвиг в индустрии
управления данными, - говорит директор IBM по интеграции информации Нельсон
Мэттос (Nelson Mattos). - Он ведет к переходу от управления только теми данными,
которые физически находятся в системе, к федеративному подходу».
Давний спор
IBM Xperanto подливает масла в огонь давнего спора о том,
как лучше управлять корпоративными данными. IBM, BEA и Microsoft защищают
федеративный подход. Oracle - главный проповедник более централизованного
подхода - утверждает, что обслуживать меньшее число крупных баз данных дешевле,
чем большое число более мелких. Но СУБД Oracle тоже могут обращаться к разным
источникам данных и работать с данными формата XML, отметил вице-президент
Oracle по технологии распределенных баз данных Бенни Саудер (Benny Souder).
«Мы считаем, что меньшее число крупных узлов создает экономию масштаба», -
говорит он.
IBM возражает на это тем, что компании нуждаются в интеграции
на разных уровнях - между источниками информации, приложениями и бизнес-процессами,
- и инвестирует во все три направления. Пользуясь инструментами программирования
IBM WebSphere Studio, разработчик может создать приложение, использующее возможности
Xperanto, промежуточного ПО интеграции приложений WebSphereMQ и системы WebSphere
Business Integrator. «Заказчики видят, что Xperanto повышает производительность
труда программистов. Если они пишут приложение J2EE (Java 2 Enterprise Edition)
и им нужно извлечь информацию из трех баз данных, они должны подсоединиться
к каждой из этих БД, выдать запрос, извлечь данные и объединить их на уровне
сервера приложений, - объясняет Мэттос из IBM. - В Xperanto же они подсоединяются
и выполняют единственный запрос, получая данные, уже объединенные нужным образом».
IBM указывает на ряд внедрений в фармацевтической индустрии,
где заказчики используют продукт IBM Data Joiner, специально предназначенный
для обращения к реляционным базам данным и неструктурированным файлам на мейнфреймах.
Кроме того, IBM старается привлечь разработчиков ПО к применению Xperanto
в их собственных продуктах. Партнером IBM по Xperanto стала компания Crystal
Decisions, которая продает ПО для создания бизнес-отчетов.
IBM намерена обрабатывать информацию как в реляционных СУБД,
которые служат краеугольным камнем большинства бизнес-приложений, так и в
системах управления электронной почтой и контентом, в которых хранятся документы.
Работая со структурированными данными РСУБД и неструктурированными документами,
IBM опирается на технологию XML. Будет поддерживаться и SQL (structured query
language), способ обращения к реляционным базам данных, используемый всеми
производителями СУБД. «Мы не верим в эффективность революционного подхода.
Наши заказчики стараются использовать данные в уже существующих средах и добиться
быстрой окупаемости инвестиций. А SQL - это гигантские инвестиции», - говорит
Мэттос.
Первым продуктом IBM с использованием Xperanto станет специализированный
сервер интеграции данных на базе флагманской СУБД IBM DB2. В него войдет инструмент
разработки IBM WebSphere Studio для создания приложений, опирающихся на распределенные
данные. В версию Xperanto, выпуск которой запланирован на 2004 год, IBM добавит
возможность составлять запросы на XML-языке XQuery. Другие будущие версии
расширят возможности поиска и анализа текстовых документов.
|