RDBU| Repositório Digital da Biblioteca da Unisinos

Aplicação de inteligência artificial e machine learning em dados litoestratigráficos e geofísicos das expedições do Programa Internacional de Descobertas Oceânicas (IODP)

Mostrar registro simples

Autor Bressan, Thiago Santi;
Lattes do autor http://lattes.cnpq.br/9582298785054550;
Orientador Chemale Junior, Farid;
Lattes do orientador http://lattes.cnpq.br/3498788836155706;
Co-orientador Rigo, Sandro José;
Lattes do co-orientador http://lattes.cnpq.br/3914159735707328;
Instituição Universidade do Vale do Rio dos Sinos;
Sigla da instituição Unisinos;
País da instituição Brasil;
Instituto/Departamento Escola Politécnica;
Idioma pt_BR;
Título Aplicação de inteligência artificial e machine learning em dados litoestratigráficos e geofísicos das expedições do Programa Internacional de Descobertas Oceânicas (IODP);
Resumo Ferramentas computacionais específicas auxiliam o geólogo a identificar litologias e o empilhamento estratigráfico em perfuração de poços, reduzindo custos operacionais e gerenciando tempo de trabalho prático dos profissionais, direcionando-os para interpretações eficientes de dados ou mesmo no aprimoramento das pesquisas científicas na região o trabalho ou em regiões geologicamente distintas. Neste estudo, a aplicação de algoritmos de aprendizado de máquina para a classificação supervisionada de litologias foi avaliada. Foram utilizados dados de registros de parâmetros multivariados em poços offshore, relacionados ao Programa Internacional de Descobertas Oceânicas (IODP) com dados supervisionados e não supervisionados (imagens), com a criação de um contexto de aplicação híbrida de algoritmos, dividida em dois manuscritos. No manuscrito I, por meio da análise das litologias propostas em 7 Expedições IODP e do uso da utilização dos algoritmos, foi possível agrupar e dividir os conjuntos litológicos em quatro grupos de litologias e templates. As propriedades geofísicas utilizadas no presente estudos incluíram GRA, PWL, MS, RSC e SRM. Os templates foram submetidos a treinamento e testes pelos métodos Multi-Layer Perceptron (MLP), DecisionTree, RandomForest e Support Vector Machine (SVM) utilizando como avaliação dos resultados as métricas de classificação. Como resultado, observou-se que Template1 obteve melhores resultados no algoritmo MLP, Template2 e Template3 obtiveram melhores resultados no algoritmo RandomForest acima de 80,00% de acurácia. Para Cross-validation, o algoritmo RandomForest obteve ótimo desempenho em todos os cenários. No Practical Template, o grupo de litologia G2 obteve melhor resultado com o algoritmo MLP com acurácia média superior a 85,00%. Para o manuscrito II, a divisão dos dados incluiu a formatação de três conjuntos de dados: dataset0, dataset1 e dataset2, especificamente com os dados obtidos durante a Expedição IODP 362. As propriedades petrofísicas utilizadas incluíram PWL, GRA, RSC, NGR, MAD, MS, RGB e imagens de alta definição. Dataset0 incluiu dados de formação temporária para validar o melhor interpolador. O dataset1 possui os dados interpolados das propriedades petrofísicas, perfazendo um total de 295.945 registros para U1480 e U1481 com 17 features. O dataset2 abrange os dados de textura e cor extraídos da segmentação das imagens, perfazendo um total de 85.058 registros para o U1480 e U1481, com 90 features. Cada conjunto de dados é replicado em dois grupos de litologia: Grupo 1 e Grupo 2. Para o dataset2, novas combinações são adicionadas entre as features formando 102 arranjos práticos com resultados específicos em cada combinação. Os valores foram interpolados por Linear, Spline, Slinear, Quadratic, Cubic, Akima, Pchip e Piecewise. O método de aprendizado de máquina empregado para todos os datasets é o RamdomForest. Os resultados mostram que o melhor interpolador avaliado no dataset0 é o Akima com acurácia igual a 98,22%. Para dataset1, U1480, o valor de acurácia é 96,96% na combinação de 70% de treinamento e 30% de teste no Grupo 1 e 97,71% na combinação de 70% de treinamento e 30% de teste no Grupo 2. Para dataset1, U1481, o valor de acurácia é 99,68% na combinação de 80% de treinamento e 20% de teste no Grupo 1 e 99,74% na combinação de 80% de treinamento e 20% de teste no Grupo 2. Para o dataset2, os arranjos práticos melhores avaliados são o 51 (Grupo 1) e o 102 (Grupo 2) para U1480 e os arranjos práticos 32, 33, 44, 45 e 51 (Grupo 1) e 102 (Grupo 2) para U1481. Em relação ao novo método Area Superpixel (Apx), os melhores resultados estão no Grupo 1 com maior combinação de treinamento e menor combinação de testes. Os conjuntos de dados avaliados foram agrupados numa organização entre os locais da expedição, em que se gerou um contexto de aplicação prática real na atividade diária do geólogo com excelentes resultados de classificação litológica. A interpolação de propriedades petrofísicas é válida e necessária quando há poucos dados para treinamento respeitando as características de cada propriedade e interpolador. Propriedades extraídas das imagens são relevantes e agrupadas em conjunto com as propriedades petrofísicas criam um contexto de extrema importância na descoberta e apresentação da informação para o profissional geólogo.;
Abstract Specific computational tools help the geologist to identify lithologies and stratigraphic stacking in well drilling, reducing operational costs and managing the professionals practical work time, directing them to efficient data interpretations or even in the improvement of scientific research in the region. in geologically distinct regions. In this study, the application of machine learning algorithms for the supervised classification of lithologies was evaluated. Data from records of multivariate parameters in offshore wells were used, related to the International Ocean Discovery Program (IODP) with supervised and unsupervised data (images), with the creation of a context of hybrid application of algorithms, divided into two manuscripts. In manuscript I, through the analysis of the lithologies proposed in 7 IODP-Expeditions and the use of the use of the algorithms, it was possible to group and divide the lithological sets into four groups of lithologies and templates. The geophysical properties used in the present study included GRA, PWL, MS, RSC and SRM. The templates were submitted to training and testing by the Multi-Layer Perceptron (MLP), DecisionTree, RandomForest and Support Vector Machine (SVM) methods, using the classification metrics as the result evaluation. As a result, it was observed that Template1 obtained better results in the MLP algorithm, Template2 and Template3 obtained better results in the RandomForest algorithm above 80.00% accuracy. For Cross-validation, the RandomForest algorithm achieved excellent performance in all scenarios. In the Practical Template, the G2 lithology group obtained the best result with the MLP algorithm with an average accuracy greater than 85.00%. For manuscript II, the division of the data included the formatting of three datasets: dataset0, dataset1 and dataset2, specifically with the data obtained during the IODP-Expedition 362. The petrophysical data used included PWL, GRA, RSC, NGR, MAD, MS, RGB and high-definition images. Dataset0 included temporary training data to validate the best interpolator. The dataset1 has the interpolated data of the petrophysical properties, making a total of 295,945 records for U1480 and U1481 with 17 features. The dataset2 covers the texture and color data extracted from the segmentation of the images, making a total of 85,058 records for the U1480 and U1481, with 90 features. Each data set is replicated in two groups of lithology: Group 1 and Group 2. For dataset2, new combinations are added between the features forming 102 practical arrangements with specific results in each combination. The values were interpolated by Linear, Spline, Slinear, Quadratic, Cubic, Akima, Pchip and Piecewise. The machine learning method used for all datasets is RamdomForest. The results show that the best interpolator evaluated in dataset0 is Akima with an accuracy of 98.22%. For dataset1, U1480, the accuracy value is 96.96% in the combination of 70% training and 30% testing in Group 1 and 97.71% in the combination of 70% training and 30% testing in Group 2. For dataset1, U1481, the accuracy value is 99.68% in the combination of 80% training and 20% testing in Group 1 and 99.74% in the combination of 80% training and 20% testing in Group 2. For dataset2, the best evaluated practical arrangements are 51 (Group 1) and 102 (Group 2) for U1480 and practical arrangements 32, 33, 44, 45 and 51 (Group 1) and 102 (Group 2) for U1481. Regarding the new Area Superpixel (Apx) method, the best results are in Group 1 with the greatest combination of training and the least combination of tests. The evaluated datasets were grouped in an organization between the expedition sites, in which a context of real practical application in the daily activity of the geologist was generated with excellent results of lithological classification. The interpolation of petrophysical data is valid and necessary when there is little data for training respecting the characteristics of each property and interpolator. Properties extracted from the images are relevant and grouped together with the petrophysical properties create a context of extreme importance in the discovery and presentation of information to the geologist.;
Palavras-chave Classificação litológica; Aprendizado de máquina; Lithological classification; Machine learning; Random forest;
Área(s) do conhecimento ACCNPQ::Ciências Exatas e da Terra::Geologia;
Tipo Tese;
Data de defesa 2021-02-22;
Agência de fomento CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior;
Direitos de acesso openAccess;
URI http://www.repositorio.jesuita.org.br/handle/UNISINOS/9664;
Programa Programa de Pós-Graduação em Geologia;


Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Buscar

Busca avançada

Navegar

Minha conta

Estatística