400 028 6601

建站动态

根据您的个性需求进行定制 先人一步 抢占小程序红利时代

ETL的发展历程是什么

ETL的发展历程是什么,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。

创新互联建站专业为企业提供前郭网站建设、前郭做网站、前郭网站设计、前郭网站制作等企业网站建设、网页设计与制作、前郭企业网站模板建站服务,十多年前郭做网站经验,不只是建网站,更提供有价值的思路和整体网络服务。

ETL是什么?ETL是Extract(提取)、Transformation(转换)和Load(加载)的首字母缩写。简而言之,ETL就是在两个位置之间拷贝数据。

根据基础设施的不同,ETL可以划分为两大类。


ETL的发展历程是什么传统ETL  

以前,数据通常都保存在操作系统、文件和数据仓库中。每天,数据都要在这些位置之间移动多次。ETL工具和脚本都是现写现用。

ETL的发展历程是什么

传统ETL的工作流

这个架构非常难以管理,而且非常复杂。下面是传统ETL架构的一些缺点:

随着时间一天天过去,大数据改变了处理的顺序。数据先提取并加载到一个仓库中,并以原始格式保存。每当数据分析师或其他系统需要数据时再进行转换。这个过程叫做ELT。不过这个过程最适合在数据仓库中进行处理。如Oracle Data Integration Platform Cloud等系统提供了该功能。


ETL的发展历程是什么ETL的现状
与十年前相比,当今世界的数据和处理状况已经发生了巨大的变化。使用传统ETL过程处理现代数据已经力不从心。部分原因如下:

ETL的发展历程是什么

数据映射层

ETL的发展历程是什么

数据处理过程

ETL的发展历程是什么

拯救世界的流式ETL
新的数据需求是驱动组织前进的动力。许多组织中的绝大多数传统系统依然能够运行,这些系统使用的都是数据库和文件系统。这些组织也在尝试新的系统和新技术。这些技术能够处理大数据和增长和更快的数据速率(如每秒上万条记录),如Kafka、ActiveMQ等。使用流式ETL继承架构,组织不需要计划、设计并实现一个复杂的架构,就能填补传统系统和现代系统之间的空白。流式ETL架构师可伸缩的、可管理的,还能处理大容量、结构多样的实时数据。将数据提取和加载从数据转换中解耦合,就构成了源-目的地模型,该模型可以让系统与未来的新技术向前兼容。这个功能可以通过许多系统实现,如Apache Kafka(配合KSQL)、Talend、Hazelcast、Striim和WS02 Streaming Integrator(配合Siddhi IO)。
现代ETL功能  

如上所述,传统系统通常将所有数据都放到数据库和文件系统中,以便进行批处理。这个场景说明了为何传统的事件源(如文件、改变数据捕获(Change Data Capture,简称CDC))要与新的流式集成平台集成。我们来考虑一个工厂中的实际应用场景,它有以下功能。传统系统:

传统的ETL工具:

流式平台架构如何解决现代ETL问题:

ETL的发展历程是什么

现代流式平台的工作流

通过上述架构,我们可以看到为了ETL数据处理,流式平台与传统系统集成,如文件、CDC与使用Kafka和HTTP的现代系统的结合。

看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注创新互联行业资讯频道,感谢您对创新互联的支持。


当前题目:ETL的发展历程是什么
当前地址:http://mbwzsj.com/article/giijpc.html

其他资讯

让你的专属顾问为你服务