发布时间:2020-11-06 10:10 原文链接: 我国科学家完成深层碳酸盐岩测井相多元转化

  随着大数据时代的到来,数据挖掘算法被广泛使用,其优势可概括为:识别数据中的隐藏模式;捕获复杂的非线性关系;自动学习模型;无需定义完整的输入和输出变量之间基于物理的数学关系。在勘探地球物理学中,岩石物理响应多解性使地球物理数据与地质分类间存在复杂的非线性关系。例如,深层碳酸盐岩缝洞型储层由于岩性多变、易发生的成岩作用和随机裂缝,导致存在较强非均质性。此时,单一属性的地球物理数据难以准确识别储层,需通过结合地质-地球物理的手段进行研究,机器学习方法是处理复杂数据问题的工具,有利于解决该类问题。然而,岩性识别是一个多元分类问题,现在的算法大多针对二元分类问题而开发,且每种算法存在固有局限性,因此,将多元分类转化为二元分类并非易事。

  针对上述问题,中国科学院地质与地球物理研究所硕士研究生郑文浩及其导师、高级工程师田飞和研究员底青云等以塔河油田为例,利用深层碳酸盐岩缝洞型储层的常规测井信息,结合岩心和电成像测井(FMI)资料,应用主成分分析(PCA)、K-means、线性判别分析(LDA)3种算法进行测井相综合预测。

  具体方法是:(1)数据预处理,采用箱形图去除异常数据及深度不匹配的数据,进行Z-score标准化处理;(2)通过PCA对测井参数降维,将7维数据转化成2个互相独立的变量,简化数据结构(图1a、图1b)。然而,一次PCA处理后,各种测井相数据点之间仍存在较多重叠。为进一步简化数据结构,研究人员将洞穴数据点和非洞穴数据点做二次PCA处理(图1c、图1d);(3)对得到的数据集进行K-means聚类(图2),根据测井相的种类及复杂程度选择合适的k值,并以岩心约束下的FMI图像,确定测井相的标签,实现结合地球物理数据的半定量解释与地质信息的定性解释,从而建立测井相-岩相数据库(图3),在测井相-岩相图版标定每个测井相的区域范围;(4)为实现测井相的自动化定量预测,使用LDA算法获得6种测井相的判别函数,将某一深度点测量的测井信息代入上述判别函数,函数值最大者作为该点的测井相类型归属(图4)。该测井相预测模型的正确率达到92%,并且能够快速获得测井相预测结果,有利于提高勘探效率、节约勘探成本。

  该研究的底层逻辑是运用地质信息约束多属性的地球物理响应,并通过机器学习算法对多参数的地球物理数据进行数据挖掘,以实现利用地球物理数据自动预测地质信息的效果。目前,研究人员正在探索一条结合地质-地球物理-数据分析的综合解决方案。相关研究成果以Electrofacies classification of deeply buried carbonate strata using machine learning methods: A case study on ordovician paleokarst reservoirs in Tarim Basin为题,发表在Marine and Petroleum Geology(MPG)上。

  图1.PC1-PC2交会图。(a)PC1-PC2交会图中的初始数据点;(b)在PC1-PC2相交图中,基于FMI图像的粗略识别,数据点可分为两类:非洞穴数据点和洞穴数据点。非洞穴数据点的线性相关线的系数为-0.697,洞穴数据点的线性相关线的系数为1.874;(c)在PC1(非洞穴)-PC2(非洞穴)交会图中,非洞穴数据点的线性相关线斜率为0;(d)在PC1(洞穴)-PC2(洞穴)交会图中,洞穴数据点的线性相关线斜率为0

  图2.数据经过K-means处理,通过FMI图像进行标定每类数据点的测井相。(a)K-means将非洞穴数据划分为16类;(b)K-means将洞穴数据点划分为8类;(c)第14类非洞穴数据点标定为裂缝相;(d)第37类洞穴数据点标定为洞穴(未充填)相

  

图3.测井相-岩相图版。(a)非洞穴数据点的测井相-岩相图版;(b)洞穴数据点的测井相-岩相图版

  

图4.应用测井相预测模型预测S75井的测井相,通过FMI图像验证预测结果


相关文章

中国石化牵头,国家能源碳酸盐岩油气重点实验室揭牌

近日,国家能源碳酸盐岩油气重点实验室在北京揭牌,这是由中国石化牵头,联合多家石油产业科研机构和大型油田公司共同建设的国家级研发平台。该实验室的成立,旨在加强我国碳酸盐岩油气资源的勘探开发技术,提升国家......

研究揭示造山带中碳酸盐熔体的起源

10月25日,记者从中国科学院广州地球化学研究所获悉,该所汪程远、王煜和徐义刚联合中国地质大学(武汉)刘勇胜、澳大利亚麦考瑞大学StephenFoley,通过对远离俯冲带的燕山造山带内的新生代碳酸盐熔......

2023医疗大数据:从“生产要素”到“资产”,距离数据流通还有多远?

千禧年后的第二个十年,移动医疗、人工智能等前沿技术的发展唤起医疗数据的需求。作为算法、算力、数据三要素中最常见但又最难获取的要素,医疗数据彼时仍以碎片化、非标准化的形态分散于医院各个系统中。为了寻找智......

首个量子领域大模型上线了!

百度量子计算研究所所长段润尧介绍,该量子领域大模型是在百度文心一言的基础上,使用量子领域高质量数据进行更有针对性的训练和优化而成的。它能更好地理解量子知识,执行量子领域相关任务。据介绍,百度量子领域大......

研究揭示海底冷泉环境对水合物形成的影响

近日,国际学术期刊《海洋和石油地质学》报道了中国科学院海洋研究所在冷泉环境中水合物快速形成动力学方面的最新研究成果,研究揭示了海底冷泉环境对水合物形成的影响,并且为南海冷泉区水合物形成的动力学过程提供......

碳酸盐团簇同位素数据标准化新方法

碳酸盐团簇同位素是目前不断发展的古温度代用指标,在地球科学诸多领域中具有重要的应用价值。在分析测试方面,要获得准确可靠的碳酸盐团簇同位素组成(如Δ47值),通常需要使用合适的标准物质进行数据标定。近年......

机器学习算法现在可以快速与准确地诊断心脏病发作

心脏病发作的症状有时与非心脏相关的疾病相似,使诊断变得棘手。英国研究人员已经转向机器学习,为医生提供一种快速和准确的诊断心脏病发作的方法,这有可能缩短诊断所需的时间,并为患者提供更高效和有效的治疗。目......

乘势而上,生命科学算力与算法市场需求持续增长

北京,2023年5月5日——IDC于近日发布了《中国生命科学算力与算法解决方案市场分析》(IDC#CHC50191223,2023年4月),本报告主要围绕中国生命科学领域算力与算法的相关解决方案展开分......

解码大脑信号再现视觉图像

是否有可能仅根据大脑信号,就完全重建某人所看到的内容?瑞士洛桑联邦理工学院研究人员朝着这个方向迈出了重要的一步,他们引入了一种新算法构建的人工神经网络模型,能以令人印象深刻的准确度捕捉大脑动态。该研究......

“所想即所见”

是否有可能仅根据大脑信号,就完全重建某人所看到的内容?瑞士洛桑联邦理工学院研究人员朝着这个方向迈出了重要的一步,他们引入了一种新算法构建的人工神经网络模型,能以令人印象深刻的准确度捕捉大脑动态。该研究......