什么是报表目录CPDA数据分析师告诉您

北京中科医院亲身经历 https://wapjbk.39.net/yiyuanzaixian/bjzkbdfyy/jzpj_p2/

企业是由他们创建和消费的报告驱动的。想象一下,一家相对较大的公司的高管想要计算员工工资的数字。他要求所有部门发送关于员工人数、总体工资支出、平均工资等的报告。

首先要报告的两个部门是产品开发部门和人力资源部门。他开始比较他们的数据,意识到两个部门的报告方式不同。人力资源部不仅在另一种工具中创建了报告,而且财务部门(位于印度)已经提交了以印度卢比为单位的总数(人力资源部的总数是美元)。

这位主管疯狂地检查他的电子邮件,看看是否有其他报告可以与这些报告进行比较,但其余部门仍然需要提交。他试着研究最近一次这样的报告被要求,但在他的收件箱里找不到请求或旧的报告。

这些只是用户在合并和比较公司报告时可能遇到的一些问题。来自不同部门的相同报告看起来可能完全不同,这取决于工具、来源、kpi、协议等。这就是为什么你需要一个报告目录,一个用于所有公司报告的集中工具,来统一这种混乱。

什么是报表目录?CPDA数据分析师的课程中已经做了很详细的介绍,我们在此,简单的为大家解答一下:

报表目录是一个单一的访问点,业务用户可以在其中查找、评估和比较所有企业报表。它根据收集到的元数据组织报告。组织使用它来确定谁拥有访问权限,哪些报告是优先级的,批准工作流报告应该遵循,以及围绕相关报告的交付和完成的所有其他实践。

用户可以与与其职位、主题领域、专业知识和兴趣相关的报告进行交互,并请求访问那些尚未被视为相关的报告。这完全发生在报表目录中,无需移动工具来接收、响应、发送或完成报表。

下面是一个关于Ataccama的报表目录示例。

为什么需要报表目录?

问题:您的公司可能有来自多个不同来源和报告系统的报告。每个部门可能使用不同的工具来发送和创建报告。这种变化会导致:

?企业报告混乱且缺乏一致性。

?报告变得过时且难以解释。

?信息缺失

?报告缺乏足够的原始材料

?人们不相信他们收到的报告

?限制人们对公司报告资源的访问

最终,这种无法有效交付报告的情况会导致对kpi的理解不足,并不断要求生成新的(更好的)报告。

解决方案:企业必须按照对数据和治理资产进行分类的方式对报告进行分类。报表目录提供了解决这些问题所需的顺序和稳定性。您的组织从报表目录中获得的一些直接好处包括:

?在报告交付、创建和审查方面节省大量时间。

?报告所有者和数据管理员可以逐步淘汰和清理报告,确保只有最好的、最有代表性的信息。

?不需要同一位分析师一次又一次地重复和验证报告。

?为用户提供一个单一的地方来查找他们正在寻找的信息(而不是限制他们在电子邮件中弹出的任何信息)。

?从概念和逻辑上将报告与业务和技术实体连接起来,从而实现出色的数据沿袭。

?您将能够看到将这些报告连接到业务术语的特定列和表提要。

?可以让您在报表级别跟踪数据质量。

下面是报表目录中数据沿袭的示例。

报表目录的基本特性

既然我们已经建立了什么是报表目录以及为什么需要报表目录,那么让我们来了解一下具体的细节。以下是每个报表目录都必须具备的一些功能,以充分解决企业报表的痛点。

向下钻取(业务谱系)

用户需要知道他们的报告来自哪里。报表目录中的业务沿袭可以显示报表在交付之前所采取的每一步(例如数据来自何处、是否以某种方式进行了转换、经过哪些系统),以及数据的来源。这让用户更好地理解它是如何创建的,并且更容易信任最终的结果。它还可以更容易地将报告中的问题追溯到根源。

例如:报表的数据来自数据仓库,进入Hadoop集群,最后到达报表。然后,该报告通过上层管理,进行了一些小的更改(包括关于这些更改的信息),得到批准,然后添加到报告目录中。

协作能力

为了让用户体验目录的全部好处,他们需要在工具内部进行协作。业务用户、数据所有者、报告所有者和数据管理员应该能够对报告进行评论、交换信息并在发生问题时排除故障。

报告不应该只存在于创建者和接收者之间。由于组织中的每个人都可以集中访问所有报告目录,因此大多数协作应该自然发生。但是,您也可以通过在其他通信工具(如Slack或MicrosoftTeams)中引用报告目录来鼓励人们更多地一起工作。

功能

与任何目录一样,可搜索性是根据人们的要求为他们提供所需信息的重要组成部分。搜索可以通过可访问性、主题、部门等来缩小范围。保持搜索的公开和透明是鼓励用户主动搜索他们感兴趣的报告的好方法。

不同级别的认证

任何值得信赖的报告都需要经过不同程度的审查,以确保其内容的准确性。在报告目录中,这可以以批准工作流的形式发生,该工作流将报告交付给相关方以批准/不批准,然后再向下游发送给其他用户。

BI生态系统中的报表目录

由于报表目录的主要目的是使报表更易于组织和查找,因此可以通过将报表连接到更多元数据实体来改进报表。这将提供关于每个报告的更完整的信息。这里有一些元数据实体可以帮助您的报表目录。

源系统和数据库

这是任何报告的起点。将它们连接到目录将使向下钻取报表和生成数据沿袭变得更容易。

业务术语和kpi

通常,这些术语存储在业务术语表中。将它们连接到报表目录将为报表和表提供业务上下文。这样,当您收到带有特定业务术语标记的报告时,您就知道该报告的内容。该表将捕获报告中的技术概念,而相关业务术语将为该报告提供业务解释。

业务规则/DQ规则

连接到报表的另一个关键组件是规则库。它将定义治理标准报告,并确保它们符合您的数据质量标准。

例如,您可能有一个数据质量规则,它定义了数据在系统中被认为“过时”之前的生命周期。如果报表是在过期后使用数据构建的,那么如果它连接到规则库,那么报表目录也可以将其标记为“过时”。

您还可以在报表级别创建DQ规则。例如,“所有报告都必须有所有者和创建日期。”

数据目录

报告是根据存储数据的表和列构建的,可以在数据目录中搜索这些数据。帮助组织数据目录的元数据也可以用于对报表目录中的报表进行排序/组织。

例如,如果您将数据目录中关于客户的所有数据列标记为“客户数据”,那么您可以立即找到由“客户数据”构建的所有报告,并将它们组织为“客户报告”。

访问管理规定

将您的报表目录连接到公司已经就位的任何访问和权限协议是至关重要的。这将确保只有具有适当角色的用户才能访问报告,使您的可访问性符合GDPR等监管要求,并确保公司的私人信息安全,不受未经授权的查看。

数据所有权和数据管理

对贵公司数据管理系统中的数据负责的个人也应对基于该数据的报告负责。还可以实现“报告所有者”的新角色,让某人从创建报告到交付报告,并确保其质量。

关于实现报表目录的建议

虽然这绝对是有益的,但实现报表目录仍然有点复杂。您可能对公司当前的系统非常满意,或者认为构建目录过于复杂和耗时。我们的一位行业专家LucadeIonna对想要开始使用报表目录的公司提出了以下建议。

从小事做起

试图将公司创建的每一份报告编入目录可能会让人感到不知所措和沮丧。我们建议从5到10个关键报告开始,并优先考虑那些具有最高商业价值的报告。一旦您对它们在目录中创建、交付和处理的方式感到满意,这些报告就可以作为新条目和报告工作流的模板。



转载请注明:http://www.abuoumao.com/hytd/8479.html

网站简介| 发布优势| 服务条款| 隐私保护| 广告合作| 网站地图| 版权申明

当前时间: 冀ICP备19029570号-7