分享好友 资讯首页 频道列表

处理复杂的数据集成,你还在编写脚本吗?

2022-03-04 12:003830

数据并不单独存在于一个数据库、文件系统、数据湖或存储库中。在记录系统中创建的数据必须满足多种业务需求,与其他数据源相集成,然后才能在分析、面向客户的应用程序或内部工作流中使用。例子包括:

来自电子商务应用程序的数据与用户分析、客户关系管理 (CRM) 系统中的客户数据或其他主数据源相集成,以建立客户细分并定制营销信息。物联网 (IoT) 传感器数据与运营和财务数据存储相关联,用于控制吞吐量和报告制造过程的质量。员工工作流应用程序把跨多个软件即服务 (SaaS) 平台和内部数据源的数据和工具连接到一个易于使用的移动界面中。

许多企业还拥有数据科学家、数据分析师和创新团队,他们越来越需要整合内部和外部数据源。开发预测模型的数据科学家通常会加载多个外部数据源,例如计量经济学、天气、人口普查和其他公共数据,然后将它们与内部数据源混合。进行人工智能试验的创新团队需要聚合大量且通常很复杂的数据源来训练和测试他们的算法。曾经在电子表格中执行分析的业务和数据分析师现在可能需要更复杂的工具来加载、加入和处理多个数据供给。

用编程和脚本处理数据集成

对于任何具有基本编程技能的人来说,将数据从源移动到目的地的最常见方法就是开发一个简短的脚本。代码从一个或多个源中提取数据,执行任何必要的数据验证和操作,并将其推送到一个或多个目标。

开发人员可以使用多种方法对点对点的数据集成进行编码,例如:

将数据变化推送到其他数据库系统的数据库存储过程作为预定工作或服务来运行的脚本当应用程序的最终用户更改数据时向服务发出警报的webhook连接系统间数据的微服务部署到无服务器架构的小型数据处理代码片段

这些编码过程可以从多个源中提取数据,在将数据传送到目标数据源之前加入、筛选、清理、验证和转换数据。

编写脚本可能是一种快速简便的数据移动方法,但它并不算是专业级的数据处理方法。生产级数据处理脚本需要自动执行处理和传输数据以及处理多个操作所需的步骤步骤。

例如,处理大量数据的集成应该是多线程的,并且对有许多数据源的工作也需要可靠的数据验证和异常处理。如果需要有效的业务逻辑和数据转换,开发人员应该记录这些步骤或采取其他措施来确保这些集成是可以被观察到的。

支持这些操作需求的脚本编程并非易事。它要求开发人员预测数据集成可能出现的问题,并相应地进行编程。此外,在使用很多实验数据源时,开发自定义脚本可能并不划算。所以最后,数据集成脚本通常难以在多个开发人员之间进行知识转移和维护。

出于这些原因,许多有数据集成需求的企业通常会寻找编程和编写数据流脚本之外的方法。

作者:Isaac Sacolick是StarCIO的总裁,也是亚马逊畅销书《推动数字化:通过技术实现业务转型的领导者指南》的作者。Sacolick是公认的顶级社交CIO和数字化转型影响者。他在InfoWorld.com、CIO.com、他的博客Social、Agile和Transformation以及其他网站上发表了700多篇文章。

原文网址:https://www.infoworld.com/article/3621992/why-you-need-a-data-integration-platform.html

反对 0
举报 0
收藏 0
打赏 0
评论 0
云安全日报220304:IBM安全智能平台发现跨站脚本攻击漏洞,需要尽快升级
IBM Security QRadar安全智能平台是IBM公司一个集成的产品家族,旨在帮助安全团队应对网络威胁,实现智能自动化,并以一

0评论2022-03-04381

云安全日报220301: 红帽Ruby脚本语言发现任意代码执行漏洞,需要尽快升级
Ruby是一种可扩展的、解释性的、面向对象的脚本语言。它具有处理文本文件和执行系统管理任务的功能。8月5日,RedHat发

0评论2022-03-01496

云安全日报220222: 红帽Ruby脚本语言发现任意代码执行漏洞,需要尽快升级
Ruby是一种可扩展的、解释性的、面向对象的脚本语言。它具有处理文本文件和执行系统管理任务的功能。8月5日,RedHat发

0评论2022-02-22388

云安全日报211118:思科公共服务平台收集器发现跨站点脚本攻击漏洞,需要尽快升级
Cisco Common Services Platform Collector(CSPC)是思科(Cisco)公司的一款通用服务平台数据收集器。该产品通过轮询思科设备的

0评论2021-11-18455

云安全日报210812:思科身份服务引擎发现跨站脚本攻击漏洞,需要尽快升级
Cisco Identity Services Engine(ISE)是思科(Cisco)公司的一款基于身份的环境感知平台(ISE身份服务引擎)。该平台通过收集�

0评论2021-08-13453

云安全日报210810:IBM数据保护平台发现跨站脚本攻击漏洞,需要尽快升级
IBM Security Guardium是IBM公司的一套提供数据保护功能的平台。该平台包括自定义UI、报告管理和流

0评论2021-08-12542

云安全日报210729:思科语音统一通信服务发现跨站点脚本漏洞,需要尽快升级
Cisco Unified Customer Voice Portal(CVP)是思科(Cisco)公司的一套用于提供语音和视频自助服务的统一通信系统。 7月28�

0评论2021-07-30465

云安全日报201218:负载均衡厂商F5 BIG-IP发现跨站脚本漏洞,需要尽快升级
F5(F5 Networks)是全球领先的应用交付网络(ADN)领域的厂商。12月17日,F5 BIG-IP(负载均衡器)发现XSS(跨站脚本攻击)漏洞,需�

0评论2020-12-29577