摘要

中国新疆克拉玛依油田七区砂砾岩油藏岩性多样,隔夹层发育,常规取心识别方法成本高,在非取心段识别精度低,导致储层划分困难.为实现岩性的快速准确识别,根据地质资料将研究区内岩性划分为泥岩、粗砂岩、中-细砂岩、粗砾岩、中-细砾岩和煤层6种.基于敏感性分析,优选测井参数提取主成分,建立岩性识别图版,识别准确率达81.37%.针对不均衡样本导致的少数类识别率低的问题,提出一种基于k均值聚类人工少数类过采样(k-means synthetic minority oversampling technique, KMSMOTE)与随机森林结合的智能岩性识别模型,通过对少数类样本过采样提升识别精度,该模型的识别准确率达到92.94%.将图版法和KMSMOTE-随机森林应用于邻井进行岩性识别并对比分析结果发现,KMSMOTE-随机森林识别准确率为95.71%,优于图版法的82.91%.同时,对各类岩性的识别准确率均高于传统的随机森林模型,证明KMSMOTE和随机森林结合的智能岩性识别模型在不均衡岩性样本识别问题上具有较好的适用性,泛化能力强,能够快速、准确地识别地层岩性.研究结果为不均衡岩性样本识别提供了智能化新思路.