在搭建数据仓库的过程中,ETL设计和实施的工作量一般要占总工作量的60%以上,而且
业务部门会不断提出新的业务需求,任何前端业务模型的改变都会涉及到ETL设计,数据仓库日常运维效率的好坏也依赖ETL设计,因此ETL工具的选择对于整个数据仓库项目的成功是非常重要的。
ELT是利用数据库的处理能力,E=从
源数据库抽取数据,L=把数据加载到目标库的
临时表中,T=对临时表中的数据进行转换,然后加载到目标库目标表中。
在ELT架构中,ELT只负责提供图形化的
界面来设计
业务规则,数据的整个加工过程都在目标和源的数据库之间流动,ELT协调相关的
数据库系统来执行相关的应用,数据加工过程既可以在源数据库端执行,也可以在目标数据仓库端执行(主要取决于系统的架构设计和
数据属性)。当ETL过程需要提高效率,则可以通过对相关数据库进行调优,或者改变执行加工的服务器就可以达到。一般数据库厂商会力推该中架构,像
Oracle和
Teradata都极力宣传ELT架构。
2. ELT可以保持所有的数据始终在数据库当中,避免数据的加载和导出,从而保证效率,提高系统的可
监控性。
4. ELT的可扩展性取决于数据库引擎和其硬件服务器的可扩展性。
和基于ETL架构的工具(
Kettle、
Talend、
Datastage、
Informatica)相比,基于ELT架构的工具目前并不多(OWB、HaoheDI)。