论文纸片盒子 03
FRACTURE FLOW RATE ESTIMATION USING MACHINE LEARNING ON TEMPERATURE DATA
introduction
现有裂缝表征技术(fracture characterization techniques)有:间接法(indirect)、直接远场法(direct far-field)、直接近井法(direct near-wellbore)。
间接法:测井(well testing)、生产数据分析(production data analysis)、压力分析(net pressure analysis)等。
直接远场法:裂缝监测(tilt fracture mapping)、微震监测(microseismic mapping)。
直接近井法:放射性示踪(radioactive tracing)、生产测井(production logging)、井眼图像测井(borehole image logging)、井下视频(downhole video)、温度测井(temperature logging)。
temperature transient analysis
传统的温度测井主要获取多点的时间-温度关系曲线。通过温度变化情况确定流体进入地层的位置。
深度学习结合温度瞬态分析可用于裂缝标准。
problem statement
通过裂缝与井眼交点处的温度时间序列估算在注水阶段或停泵时的流体流量。
methodology
本项目主要包括两部分:基于物理过程的正演模型(forward model)、基于统计学或机器学习的反演模型(inverse model)。
正演模型用于生成流量-温度历史数据;反演模型用于通过输入温度数据自动输出流量数据。
forward model
通过AD-GPRS flow simulator
建立一个二维模型,通过物理过程的数值模拟生成流量-温度数据。
储层关键参数如下:
参数 | 数值 | 单位 |
---|---|---|
几何尺寸 | 400x200 | m |
钻井长度 | 200 | m |
渗透率 | 0.5 | md |
孔隙度 | 0.15 | - |
储层温度 | 368 | K |
导热系数 | 124.5 | kJ/(m·day·K) |
热容量 | 0.9211 | kJ/(kg·K) |
密度 | 2250 | kg/m³ |
裂缝数量 | 3 | - |
裂缝半长 | [10,30,50] | m |
裂缝间距 | 50 | m |
压裂液 | 25℃ 清水 | - |
无流动边界条件 |
inverse model
通过温度估算流量,本质上是回归问题。
表示输入数据——温度时间序列
表示输出数据——流量时间序列
由于正演模型生成数据计算消耗很大,所以输入数据的规模较小。因而不能采用简单的training-validation-test
数据集划分方法。本项目采用cross-validation
方法训练模型。
time series cross-validation
K-Fold Cross-Validation
将数据集分为 K
份,算法流程如下:
- 选择第
k
份作为验证集;选择其他的k-1
份作为训练集。 - 训练集训练模型,验证集计算模型误差。
-
k=1,2,3,...K
,重复训练模型。 -
K
次训练的误差均值作为最终误差。
常规的K-Fold Cross-Validation
对数据集有一定的要求:数据点各自独立且分布均匀。但是温度时间序列具有高度的时间相关性,显然不适用这个条件。
为了解决上述问题,本项目采用K-Fold Cross Validation
的变种,如下图所示。
machine learning algorithms
本项目采用了三种机器学习算法:Lasso regression, Random forest, Kernel ridge regression。
linear regression methods
basis expansions
regularization: the lasso and ridge regression
kernels
tree based methods
random forest
machine learning framework
modeling results
case 1. injection at constant pressure
注水压力控制。
features set
三个特征:温度、温度空间分量、温度时间分量。
model performance
Lasso regression 方法均方根误差为28%, Random forest 方法均方根误差为68%。并且 Lasso regression 预测更为平滑,接近真实数据。