数据治理软件市场鱼龙混杂 如何练就火眼金睛做选择?

    xiaoxiao2021-04-19  252

    专家John Ladley对市面上一些主流的数据治理软件的功能进行对比,了解这些对比结果,可以帮助你确定哪些工具能够更好地满足你的需求。

    市面上可以提高数据治理效果的工具越来越多。除了现有的软件供应商,还时常有新的竞争者进入治理软件市场。如果你想要提高数据治理程序的效率和可持续性,要在众多供应商和治理软件中做出选择,已经变得越来越困难。

    在购买数据治理工具之前,你需要做好准备;在做出购买决定之前,需要确定使用治理软件的目的,以及如何从中获得商业价值。一旦你做好这些准备,就可以据此来评估治理产品。但如何考虑哪些工具能满足你的特定治理需求呢?

    为了缩小数据治理工具的选择范围,可以对比一下市场上主要的治理工具,这些工具主要来自于10家供应商,我们将从使用场景和产品类别对这些产品进行分析。

    按照用例来评估数据治理工具讨论数据治理工具的价值,需要结合具体的业务场景,让我们看看供应商是如何支持以下三个基本用例的:

    受到高度监管的行业。金融服务和医疗保健组织(尤其是在美国)是这种类型数据治理用例的代表。这个用例要求软件提供了全面的数据管理功能,包括支持数据意义一致性,跟踪数据沿袭,工作流,以及高度可见的数据日常治理过程等。

    提供业务术语表功能,能够维护一般性数据定义的工具包括:Alation Data Catalog,Adaptive Metadata Manager, Collibra Data Governance Center, Data3Sixty Data Collaboration Suite,Diaku Axon,,IBM InfoSphere Information Governance Catalog 和 SAS Data Governance。在某些情况下,某些产品只适用于特定行业;例如,IBM,Collibra和Diaku的治理软件主要针对金融领域, Information Builders Omni-Gen 的软件主要为卫生保健供应商和保险公司服务。

    此外,不同供应商提供的术语表功能也各有不同。例如,对于某些供应商,数据发现和术语集合功能是软件的核心。而其他一些供应商的软件则更专注于管理同义词和其他复杂语义。这些工具在浏览和导入元数据方面的功能也不尽相同,例如Adaptive Metadata Manager的特色在于元数据收集,而其他产品,如Alation,Collibra和Data3Sixty,则支持互动性更强的数据发现方法。

    对于记录数据沿袭这个用例,不同工具所提供的功能也是不一样的。有的工具仅仅在数据沿袭过程提供协助,而有的工具则可以帮助你从数据集提取数据沿袭信息,还有些工具只是允许你简单地记录数据沿袭。你所支持的数据沿袭方式,有很大程度上依赖于应用程序的架构(例如,你使用的是供应商的产品还是和自主开发的应用程序等),基础设施和数据库管理系统技术。所以一旦需要,你要保证对上面提及的领域有充分的认识。

    工作流和项目管理功能在这些主流数据管理软件上的具体实现形式也是不同的。每一个供应商都有其独特的方法来管理流程。Collibra以工作流起家,所以对工作流管理早已驾轻就熟。SAP的治理工具主要(但不是全部)与ERP套件整合在一起。自适应工作流功能近期也开始流行。工作流与具体行业相关,所以在选择管理软件时,请仔细审核你对该功能的要求,以确保最终选择的产品能够真正满足你的需求。

    迫切需要整合重要数据域。调节驱动型的数据治理项目主要源自于主数据管理(MDM)和“golden copy”工作的需求。供应商的产品扩展了这一功能,他们把嵌入式MDM存储库和数据质量维护工具与数据治理功能结合起来。像SAP这样的供应商们,整合了数据质量、业务对齐,价值评估和策略管理等功能。SAS也将数据治理、数据质量和策略管理与MDM功能整合在了一起。Information Builders则实现了数据质量和数据修复与MDM管理功能的整合。

    需要注意的是,许多数据治理工具只适用于特定信息管理用例,如大数据或MDM,而另一些则具有普遍适用性。你的具体用例将决定你如何做出选择。

    数据的实用性和可访问性。大数据分析和商业智能目前使用数据治理的目的是为了保证数据迁移的高效性和数据维度的可靠性、数据安全性以及相关性等。数据治理工具在这个领域,与上面所提到的其他用例情况类似,只是部署方式不同而已。

    Informatica Master Data Management专门提供对大数据的支持。通过使用数据管理,数据的有效性变得更有保证,大部分数据治理工具都涵盖了这一功能,包括Collibra。

    很多工具都关联或者直接提供基本的数据质量保证功能。例如,SAP的Master Data Governance产品包含广泛的数据质量管理功能。正如上面提到的, Information Builder的Omni-Gen提供了数据修复和数据规范,Informatica还提供选项,实现了与数据质量管理功能的互联。

    评估数据治理工具的其他考量因素

    事实上,数据治理工具反映了采集数据和处理数据的方式。反过来也意味着,数据治理工具必须与你的商业模式和所用技术具有较高的契合度。

    虽然供应商能够提供内容广泛的许可和部署选项,从本地部署,到远端服务,web服务和传统的客户端服务器模式。现在你可以通过订阅来试用产品,然后选择是否实现本地部署。在基础设施层面亦是如此。例如,尽管许多供应商提供web服务选项,但其中一些却未必像在其他web服务中工作得那么好。许多供应商提供各种连接选项,但其连接到其他文件结构的方法也相差很大。所有的选项都可以被用户有选择的添加,只不过价格也会水涨船高。选择适合你特定基础设施的工具,这一点非常重要。

    和许多其他类型的软件工具一样,在你正式购买之前,你必须先试用数据治理工具,确定符合你的数据治理用例后再购买。很多时候,这些产品在某种环境和需求组合下,工作良好。但同样的产品在另一个场景的表现就不尽人意。

    此外,数据治理工具与相同供应商的软件往往配合的较好,与不同供应商的软件就未必如此。有时候,某些供应商的用户界面可能并不适合你的需求,而其他供应商的却适合,这种情况比比皆是。你要记住,这些工具的使用者大多是业务部门的数据管理者或其他非IT相关人员。他们对供应商的忠诚度可能并不如在其他数据管理领域那么高。

    部署这些工具一个关键考量是它们利用基础设施的方式,是为一个web服务还是依赖本地服务器或云服务?坦白的讲,一些数据治理产品可以实现灵活的部署,所以如果你的企业领导坚定地选择面向服务的体系结构,那你就需要明确这之间的不同点。许多供应商提供基于云的许可,这种方式很好,它可以在避免较大内部技术变动的情况下,保证数据治理工具的良好运行。

    随着时间的推移,你可能需要多个供应商才能让你的数据治理工具继续满足需求。在这种情况下,您必须确保多个供应商的产品能够协同工作。虽然几乎所有工具都提供通用访问选项(例如SQL),但他们中的一些,如Adaptive, Collibra, IBM InfoSphere Information Governance Catalog和SAS,提供了很多复杂互连选项。对于那些需要调整或概念验证项目,这一方面需要重点验证。你的基础设施和技术堆栈的本质,将严重影响多个供应商产品的互操作性。

    一些工具套件更适合于大型企业或那些在同一家供应商投入大量资金的企业。毫无疑问,IBM,Informatica,Information Builders,SAP和SAS所提供的套件将是这些大企业的首选。但数据治理工具市场还不够成熟,你不能无视其他小供应商的产品。Adaptive,Alation,Collibra, Data3Sixty 和Daiku所提供的功能,价格和部署选项,也适用于很多企业。

    数据治理软件的市场可能有些混乱,希望你能够理解数据治理工具给企业带来的好处,正确的选择适合企业的数据治理工具。

    本文转自d1net(转载)

    相关资源:Java培训市场鱼龙混杂选择需当心.pdf

    最新回复(0)