Alteryx问答--Alteryx是ETL工具吗?它与SSIS有什么不同?
【提问】我的客户希望我使用Alteryx实施ETL过程,因为他们有许可证。我很困惑Alteryx是否是ETL工具。我相信Alteryx通常用于为Tableau数据可视化工具准备数据。
请指教是否使用ETL工具?它与SSIS有什么不同?
【答复】
1、是,Alteryx是ETL和数据扯皮的工具,但它确实比纯ETL多了不少。 Alteryx与许多嵌入式功能(如数据挖掘,地理空间,数据清理)结合起来提供预先连接(Experian/Tableau等)选项,以在一个产品中提供一套工具。
如果您正在寻找的是基本的a-> b ETL映射,并且您不需要Alteryx提供的附加功能,那么像SSIS这样的更便宜的产品往往绰绰有余。
2、Alteryx是一个数据准备/高级分析应用程序。人们以许多不同的方式使用它,因为它允许数据准备,空间分析和预测。
我与许多客户合作,他们选择纯粹将Alteryx用于其ETL功能,将数据从一个数据库移动到另一个数据库,例如我曾与一位使用Alteryx将客户端的负载自动从MySQL迁移到Amazon Redshift数据库的客户端进行了合作,另一位客户正在使用SQL - > Tableau数据引擎,以及其他许多涉及一系列数据输入的示例(Alteryx支持所有自定义API - > Excel)。
如果你已经在使用SSIS,那么你会发现Alteryx呼吸新鲜空气,说实话,我在过去的生活中一直在使用SSIS,后来发现Alteryx的开发速度要快得多。它更容易改变数据,并允许更紧密地集成许多不同的数据源。新的数据库内置工具与以前可能实现的SQL紧密集成允许在数据库内完成工作。
最后,与SSIS相比,我认为你会发现Alteryx非常简单易学。他们网站上的在线培训视频将为您提供尽可能多的介绍。
3、Alteryx可以,只要你有一个Alteryx服务器用于ETL。我用它来处理一些用例,尤其是在云数据库之间。
有些事情,在我个人的意见,使其明显优于SSIS:
如果输入有列名(从数据库或从头部csv文件),它自动处理意想不到的新列或列的顺序变化,而不需要你改变流量。
您可以将流构建为“宏”,然后您可以完全独立于源/目标数据库进行单元测试(尝试在SSIS中进行测试..)
能够在流程中的任何位置放置浏览工具并进行有效调试。
使用“测试”工具构建断言。
流是从服务器上的命令行运行的,我发现(除了使用Alteryx自己的调度器)最简单的方法是将其另存为“应用程序”,然后从使用Alteryx引擎从命令行运行可执行文件,通过xml文件传递参数。您可以通过点击魔棒按钮(在将流保存为.yxwz(app)之后)从流中保存示例xml参数文件。这会显示一个面板,可让您设置变量,并且该面板具有方便的“保存“按钮,它以正确的格式生成一个xml文件。
在流本身内部,可以通过操作工具或模块级别参数(User。*)参数化环境设置等 - 然后可以使用%User在输入上设置数据库服务器[变量名称]%在该领域。
错误日志通常非常出色(识别失败的工具,有用的错误消息),命令行抛出有用的错误级别号码,因此非常简单,可以安排一些第三方调度程序(或仅使用Alteryx服务器自己的调度程序)。
显然,如果你需要做任何严肃的数据操作,pivoting等,那么它就是我使用过的最简单的工具。