NSEE

Machine learning para prever a sobrevida de pacientes com câncer colorretal

2 de Julho de 2023

Artigo feito por

Lucas Buk Cardoso, Vanderlei Cunha Parro, Stela Verzinhasse Peres, Maria Paula Curado, Gisele Aparecida Fernandes, Victor Wünsch Filho & Tatiana Natasha Toporcov

Resumo

O câncer colorretal é um dos tipos de câncer mais incidentes no mundo, com quase 2 milhões de novos casos anualmente. No Brasil, o cenário é o mesmo, foram estimados cerca de 41 mil novos casos nos últimos 3 anos. Esse aumento de casos intensifica ainda mais o interesse e a importância de estudos relacionados ao tema, principalmente com novas abordagens. O uso de algoritmos de aprendizado de máquina para estudos de câncer tem crescido nos últimos anos, e eles podem fornecer informações importantes para a medicina, além de fazer previsões com base nos dados. Neste estudo, foram realizadas cinco classificações diferentes, considerando a sobrevida dos pacientes. Os dados foram extraídos do Registro Hospitalar de Câncer de São Paulo, coordenado pela Fundação Oncocentro de São Paulo, contendo pacientes com câncer colorretal do estado de São Paulo, Brasil, tratados entre 2000 e 2021. Os modelos de aprendizado de máquina usados ​​nos forneceram as previsões e as características mais importantes para cada um dos algoritmos dos estudos. Usando parte do conjunto de dados para validar nossos modelos, os resultados dos preditores ficaram em torno de 77% de precisão, com AUC próximo a 0,86, e a coluna mais importante foi o estadiamento clínico em todos eles.

Introdução

A análise da sobrevida de pacientes com câncer é fundamental para o planejamento e avaliação dos serviços de saúde. Além disso, a identificação e validação de fatores prognósticos são importantes para orientar o protocolo de tratamento.

Estudos epidemiológicos têm utilizado modelos estatísticos, baseados em preditores pré-estabelecidos para o prognóstico de sobrevida em pacientes com câncer colorretal (CCR). Tais técnicas apresentam limitações relacionadas à adaptação de modelos, mudanças na realidade e potencial redução da acurácia ao longo do tempo. Os modelos estatísticos mais comuns são lineares e partem de descrições explícitas das relações entre os dados. Atualmente, a inteligência artificial (IA) vem colaborando no diagnóstico de diversas doenças 2,3 e na avaliação de sobrevida, a técnica de aprendizado de máquina, aplicativo baseado em dados de inteligência artificial, em que os sistemas aprendem e se aprimoram automaticamente sem programação explícita, tem tem sido utilizada na busca de uma avaliação que demande menos recursos humanos, possivelmente mais acurada e perene de sobrevivência. São rápida e facilmente adaptáveis a novas realidades e seu uso foi testado em estudos sobre o câncer.

Uma vez que os modelos que utilizam aprendizado de máquina não fornecem estrutura e parâmetros de forma explícita e facilmente interpretável, torna-se crucial testar seu uso e sua precisão com dados reais. Nos últimos anos, dados de registro de câncer, como o US Surveillance, Epidemiology and End Results (SEER), têm sido usados para prever mortalidade ou sobrevivência nos EUA usando inteligência artificial.

O câncer colorretal (CCR) está entre os dez mais incidentes no mundo. Estima-se que aproximadamente 10% dos casos de câncer no mundo em 2020 serão de cólon ou reto, correspondendo a aproximadamente 1,8 milhão de novos casos anualmente, com tendência crescente em ambos os sexos. No Brasil, são estimados cerca de 41 mil novos casos entre 2020 e 2022. O Registro Hospitalar de Câncer do Estado de São Paulo (RHC-SP), sediado na Fundação Oncocentro do Estado de São Paulo (FOSP), abrange uma população de aproximadamente 30 milhão de habitantes, com 33.000 casos de câncer colorretal, configurando uma oportunidade única para a realização de estudos de predição de mortalidade ou sobrevida para pacientes brasileiros. O objetivo do presente estudo é avaliar e comparar a validade de três algoritmos de inteligência artificial para prever a sobrevida de pacientes com CCR tratados em São Paulo, o estado mais populoso do Brasil, de 2000 a 2021, com base em dados do RHC- SP.