数据是石油行业主要的资产,近几年越来越多的石油企业开展了企业级的数据管理平台,对数据资产进行系统性、体系化的管理,以便充分挖掘数据的潜在战略、战术价值。鉴于此,对数据资产进行全面盘点、构建企业级的数据资产目录成为了数据资产管理的一项基础性工作。不同大厂推出了自己的数据资产目录构建方法和相应的工具。如何构建石油数据资产目录,如何管理与使用石油数据资产目录,成为石油数据管理与应用首先需要回答的问题。
1、数据资产目录解决什么问题?
数据资产目录梳理是数据管理的一项基础性工作,也是石油业务梳理的基础工作。数据是在业务中产生和使用的,从某个意义上讲,数据是业务的信息化表现方式,是业务的全息信息记录。数据资产目录梳理要回答以下问题。
1.1 石油勘探开发业务应该有哪些业务?每一个石油数据在哪个业务中产生?
数据是业务的记录,有多少业务就应该有多少数据,因此梳理数据资产需要从业务角度采用业务理解的方法全量梳理,通过梳理有多少业务,每一个业务产生多少数据,从而最终回答石油勘探开发业务应该有哪些数据,每一个数据应该对应在哪个业务产生。
1.2 每一个石油数据应该包含哪些内容?
数据要准确记录业务全部信息就对数据内容有特定要求,数据资产梳理要确定每一个数据记录的内容要求,包括数据本身的内容要求和数据产生背景信息要求(即元数据内容要求)。
1.3 数据产生及管理的责任部门是谁?
数据产生及管理的责任也是数据资产目录梳理主要的内容之一,石油企业不同的部门负责不同的业务,每一个数据都有对应的数据产生部门、数据责任管理部门等。数字资产目录需要确定每一个数据的责任部门。
1.4 数据分类分级
不同的数据管理要求及应用方式不同,数据资产目录梳理还要对数据分类分级方案进行标准化,在标准化基础上梳理具体内容。
1.5 数据的业务关系是什么?
业务之间是有业务逻辑关系的,数据之间也应该有业务关系,包括业务逻辑关系、血缘关系等,这些也要在梳理中明确。
1.6 数据和业务、用户的关系?
数据最终是为了业务应用,数据梳理还要梳理数据与业务之间的关系,数据与用户之间的关系,明确这些内容为后续的数据服务打下基础。
1.7 数据能够被谁使用?
数据权限管理是数据管理的重要内容,数据权限就是数据与用户之间的对应关系,一个用户可以使用哪些数据,或者说一个数据可以被哪些用户使用。
2、数据资产目录梳理模型
石油勘探开发业务非常复杂,各个业务之间还存在复杂的业务关联关系,对这样一个复杂业务数据的梳理必须采用一个标准的模型方法才可以梳理清楚,按照传统的枚举法很难表述清晰。
我们知道所有的数据都是在业务中产生和使用的,从这个角度看,数据是伴随业务产生的,一定是先有业务后有数据。因此我们梳理数据资产目录可以分为两步走,第一步是梳理业务,采用标准方法和模型将勘探开发业务分解到最小业务单元,第二步是梳理每一个最小业务单元伴随的数据,这样就可以将石油勘探开发所有的业务和数据梳理清楚。
2.1 业务梳理的维度划分
梳理一个复杂的业务我们可以将业务区分的要素进行梳理,也就是确定划分业务的描述维度。根据侏罗纪独创的业务坐标模型理论,我们可以将业务维度划分为五个维度。
2.1.1 业务阶段维度(业务域)
业务阶段维度是指按照时间维度划分的业务工作阶段,如勘探、开发、生产等阶段。每一个阶段还可以按照时间进一步细分,如勘探普查、详查、评价等子阶段。
2.1.2 工作性质维度(工作域)
工作性质维度是指在同一个时间点上,从工作性质角度分类维度,如生产、研究、管理、经营、决策等。这些工作类型同样可以进一步划分为各种工作性质子类型,如研究可以进一步划分为基础研究、生产研究、方案研究等类型。
2.1.3 对象类型维度(对象域)
对象是指勘探开发工作的对象,如井、圈闭、油气田等。每一个工作都对应到一个具体的对象上。
2.1.4 专业类型(专业工种)维度(专业域)
专业维度是指工作中专业类型的区分,如钻井过程中专业可以分为钻井、钻井液、固井、录井、测井、定向井等不同专业的工作。
2.1.5 业务流程维度(业务过程域)
业务流程维度是指上述大的业务类型确定后得到了一个业务工作流程,在该业务工作流程中进一步划分为若干个工作步骤或者工作内容的划分。
2.2 最小业务单元数据分析
通过上述五维业务坐标模型可以将业务中的最小业务单元识别出来,最小业务单元是勘探开发业务中的最小工作单元,也是构成勘探开发业务的最基础单元。
每一个最小业务单元都会用到数据也会产生数据,可以采用IPOM分析法确定每一个业务工作节点相关的数据。同时可以通过这种分析方法得到业务节点之间的业务关系。
3、数据资产目录梳理方法
石油业务专业多、链路长,业务梳理按照常规方法很难梳理清楚,另外在业务梳理中还要明细上述各项内容,侏罗纪公司经过长期研究摸索,创建了业务坐标模型理论和方法,按照该方法可以对石油业务和数据进行完整的梳理。
很多数据资产目录梳理方法都是直接从数据开始梳理,我们认为石油数据是伴随业务产生和使用的,梳理数据应该先梳理石油业务,在业务明晰的基础上再梳理数据,因此我们发明了石油数据资产目录梳理七步法。分别对应业务梳理的七个层次,即L1,L2,L3,L4,L5,L6,L7.
3.1 第一步:梳理业务主题(L1)
业务主题是根据石油勘探开发业务阶段维度划分的主题,又可称为业务阶段主题。在石油业务中,不同业务阶段的工作是由不同的业务部门负责的,在确定业务主题同时,还可以确定每一个业务主题负责的部门,该部门一般是总部级的大业务部门。
3.2 第二步:梳理业务工作主题(L2)
业务工作主题是业务主题和工作性质维度的组合主题。业务阶段和工作性质两个维度两两之间的组合就是业务工作主题。每一个业务工作主题又可以对应到工作主题对应的大部门下的子部门。
3.3 第三步:梳理业务工作对象主题(L3)
工作对象主题是业务阶段维度、工作性质维度、对象维度组合的主题,它是业务工作主题有进一步按照对象主题细化的主题。一般到业务工作对象主题就是一个具体的工作主题,由具体的业务部门负责,我们组织数据资产目录可以以业务工作对象主题为单元分配工作。
3.4 第四步:梳理业务工作流主题(L4)
业务工作流主题是指业务阶段维度、工作性质维度、对象维度、专业维度四个维度组合得到的主题,是业务工作对象主题结合专业划分确定的工作主题。通过四个维度的组合实际上是得到一个具体的业务工作流。
3.5 第五步:梳理最小业务工作节点(L5)
对一个具体的业务工作流梳理具体的工作节点,得到最小业务工作节点。
3.6 第六步:梳理最小业务工作节点对应的数据集(L6)
通过最小业务工作节点的IPOM分析,可以得到每一个业务节点的输出数据集,该数据集作为业务工作节点对应的数据集。
3.7 第七步:梳理最小业务工作节点产生的数据项(L7)
对业务节点产生的数据项进行定义,对该节点产生的数据项作为工作节点对应的数据项,按照标准定义数据项的各项属性内容。L1-L7梳理方法是一个按照业务逻辑,根据业务关键要素逐步细化深入的过程,通过上述步骤可以将一个复杂的数据资产目录梳理工作按照一个统一的标准分解到各个工作岗位上分别实施,分开实施的成果又可以成为一个有机的整体。通过上述方法就可以采用统一的方法将整个石油勘探开发业务及数据全部梳理清楚,并且在梳理的过程中可以通过业务坐标定义得到数据的关系、数据和业务、用户的关系,还可以定义数据的分级、数据的责任部门等,这些信息为后续的数据管理使用提供基础。
4、石油数据资产目录梳理软件
配套上述数据资产目录梳理方法,侏罗纪公司开发了数据资产目录管理工具,通过该工具一方面可以将梳理的成果导入到系统中进行管理,同时也可以从全局的角度展示整个勘探开发业务内容及数据资产目录内容。
4.1 业务梳理模板确定
根据梳理方法,由系统根据业务坐标模型自动得到业务工作对象主题目录,以每一个业务工作对象主题作为业务梳理的工作单元,得到整个数据资产目录。
业务工作流主题梳理模板。在梳理业务内容时要按照一定的工作模板标准化梳理,主要有业务工作流主题梳理,以业务工作对象主题为单元,结合专业分类维度坐标,最终得到每一个业务工作对象主题所包含的石油业务工作流主题。
最小业务工作节点梳理模板。对每一个业务工作流主题结合具体的业务工作流程内容得到该业务工作流主题的每一个最小业务工作节点。
最小业务工作节点业务内容梳理模板。对每一个最小业务工作节点的IPOM、责任部门、输入输出数据、功能处理、数据分级等内容进行详细的梳理,最终得到每一个最小业务工作节点所包含的石油业务内容,包括数据内容。
数据项梳理模板。按照数据字典结构,定义每一个最小业务工作节点产生数据的详细定义,得到每一个业务数据项的定义。
4.2 数据资产目录导入和管理
将上述模板内容分别导入到系统中,最终形成数据资产梳理成果库,该成果库记录了石油的业务工作划分、业务阶段名称及内容、业务阶段对应的所有数据集和数据项,也记录了与数据相关的内容。
4.3 数据资产目录展示
1)按照业务工作对象主题查看
2)按照全业务流程查看