数据联邦(Federation)是比较成熟的企业数据集成方法之一。通过IBM联邦数据库技术来认识数据联邦是如何集成企业数据的。IBM在联邦技术上进行了大量投资,使之在整个数据管理产品系列中取得市场领先能力。联邦技术能够统一地访问任何信息存储中以任何格式(结构化的和非结构化的)表示的任何数字信息。通过各种 IBM 产品可以使用这些联邦技术。
在大型现代企业中,组织中的各部门使用不同数据库管理系统来存储和搜索其重要数据,这几乎是不可避免的。竞争、不断发展的技术、合并、收购、地域分布以及扩展中不可避免的分散等因素都会造成这种多样性。但只有将这些系统中的信息组合起来,企业才会认识到这些系统所包含数据的整体价值。
例如,在金融行业,合并几乎是很常见的事。新创建的实体沿袭了原有机构的数据存储。许多这样的存储都是关系数据库管理系统,但这些系统常常来自不同的厂商;例如,一家公司可能主要用Sybase,而另一家公司用 Informix IDS。他们可能都有一个或多个文档管理系统(譬如,Documentum或IBM Content Manager)用于存储文本文档(譬如,贷款副本等)。每种系统可能都有一些应用程序来计算重要信息(例如,某个特定客户的贷款风险)或挖掘有关客户购买模式的信息。
在企业合并之后,他们需要能够从两套存储中访问所有客户信息,使用现有的和新的应用程序来分析其新的资产组合,通常情况下,还要通过一个公共接口来使用两个机构中经过组合的资源。虽然不同公司可能用完全不同的标识键来标识他们的客户,但在合并后他们需要能够标识他们公共的客户,合并这些客户的帐户。在这些情况下,联邦技术通过提供异构数据的统一接口有效地解决这一问题。
本文主要讨论高级的数据库联邦技术,它们是通过代号为“Garlic”的技术来实现的,这种技术代表了IBM软件的下一代信息联邦增强功能。这些增强功能将使客户机能够访问和集成数据,能够专门计算各种关系型和非关系型数据源。随着时间的推移,Garlic技术将会不断融入IBM所有提供联邦技术软件产品之中。不但他们对现有产品的投资会受到保护,而且以后无论选择哪种产品,他们都将能够利用这里所描述的高级技术。这组联邦技术会继续得到增强,客户在所有这些产品上的投资会继续产生实际的商业价值。
IBM的联邦数据库系统为组合来自多个数据源的信息提供了功能强大的工具。IBM的联邦数据库技术构建在早期产品DB2 DataJoiner 的最佳技术之上,并且在可扩展性和性能方面,通过应用 Garlic 研究项目的一些位于前沿的特性而得到了增强。DB2 DataJoiner 引入了
虚拟数据库的概念,这个虚拟数据库是通过联邦多个异构数据源而创建的。DB2 DataJoiner 的用户可以随意查询存储在联邦系统中任意位置的数据,而不必担心数据的位置、实际数据源系统的SQL语言种类或者存储的能力。相反,对于联邦数据库中的任何数据,用户可以按照 DB2 的方式来进行操作。Garlic项目展现了拓展这一思想来构建联邦体数据库系统的可行性,该系统可以有效地使用各种不同的、可能是非关系型数据源的查询能力。在这些系统中(如当今的 DB2),中间件查询处理器促进了优化执行方案,并弥补了各数据源可能缺乏的功能。