□特约记者 安心 通讯员 陈柯宇
截至4月17日,西南油气田公司4099个场站(含功能节点)、2.3万公里管道主数据完成导入存储,标志着西南区域湖首个专业数据成功入湖,为实现数据全共享、业务全协同迈出了坚实的一步。
进入工业4.0时代,数据已经成为继土地、劳动力、资本、技术之后的第五大生产要素。近年来,西南油气田公司数字化转型逐步深入,业务部门之间的协同需求愈加频繁。而由于早期系统分散建设,数据割裂,且标准不一,导致同一主数据在各系统中可能存在冲突。如何做好数据整合、数据治理,发挥数据价值,形成勘探与开发、地质与工程、生产与销售的有机串联,成为公司数字化转型过程中的挑战。
让数据资源变成数据资产的第一步,是将散落在各信息系统中的数据采集并存储起来。去年4月,西南油气田公司统一部署,启动数据治理工作。“我们首先对公司8套勘探开发重点系统开展主数据反演,对数据进行去重、清洗,形成了井、管道、场站全集清单。”项目组信通中心技术人员陈柯宇介绍。
主数据是各类业务数据共享的基础,是数据建设和治理工作的重中之重,主要涉及井、场站、管道三类数据。在做好主数据处理的基础上,信通中心梳理形成井8项属性、管道20项属性、场站7项属性标准,并在相关业务部门的指导下,会同公司多家生产、科研单位进行数据补充和修订,首次形成了井、管道、场站主数据权威历史数据清单。该清单涵盖4099个场站1万余条数据、2.3万公里管道6万余条数据、8200口井7万余条数据。自此,公司管道和场站基础数据“一本台账、一套标准、一套系统”的新格局基本形成,实现了重点气藏的气藏、井筒、地面数据的线上管理。
通过区域湖的贴源层、治理层、共享层、应用层,数据将依次完成主数据关联性、唯一性和规范性质检等入湖步骤,并按照数据专业、数据结构进行分类存储。信通中心数据中心主任官庆介绍:“数据湖是一个包容性强的存储空间,可对接oracle、pg等多种异构数据库。还可以无缝对接多种计算分析平台,根据业务场景不同,对数据湖中存储的数据进行主题式的数据处理与服务。”与传统存储空间不同,数据湖具备结构化、非结构化、时序等多种类型的数据存储能力,入湖后的数据,可在各平台实现离线分析、实时分析、交互式分析,适用于多种场景。
存储好的数据得到妥善管理后,如何用好数据,真正发挥数据价值,是实现数据“变现”的关键一步。通过在区域湖上建立数据资源目录,让业务人员更快、更准确地找到湖里的数据,通过发起数据订单,区域湖可快速根据订单组装好主题数据包提供给用户,促进数据资源到资产的转变。
公司还将持续推进主数据的治理和入湖工作,通过以主数据为核心,串联勘探开发等业务数据,实现数据的关联存储和共享,发挥数据价值。