Tecnología

/ Publicado el 19 de diciembre de 2025

Medicina personalizada

DT-GPT: O futuro da medicina preditiva na palma da sua mão

Explore as funcionalidades de chatbot do DT-GPT e sua capacidade de prever variáveis clínicas não treinadas, abrindo novas possibilidades para a medicina personalizada.

Autor/a: Makarov, N., Bordukova, M., Quengdaeng, P. et al.

Fuente: npj Digit. Med. 8, 588 (2025). https://doi.org/10.1038/s41746-025-02004-3 Large language models forecast patient health trajectories enabling digital twins

A previsão clínica é essencial para o monitoramento de pacientes. Uma abordagem promissora para apoiar essa previsão é o uso de gêmeos digitais (digital twins), que são representações virtuais de pacientes que geram previsões multivariáveis e detalhadas de futuros estados de saúde, aproveitando o histórico médico longitudinal. Ao serem inicializados com as características de um paciente individual, esses gêmeos digitais podem simular respostas em tempo real a intervenções ou tratamentos. Eles oferecem uma estrutura abrangente para a modelagem de pacientes, integrando diversos fluxos de dados, incluindo históricos de exames, diagnósticos, tratamentos, perfil molecular, fatores de estilo de vida e conhecimento biomédico geral. Ao ligar a evidência de nível populacional com insights de nível individual, a sua aplicação tem o potencial de revolucionar a saúde em áreas como medicina de precisão e personalizada, análise preditiva e apoio à decisão.

A Inteligência Artificial (IA) generativa apresenta uma grande promessa para a criação de gêmeos digitais, devido à sua capacidade de produzir dados sintéticos e realistas, embora essa área ainda esteja em fase inicial. Atualmente, os métodos existentes frequentemente apresentam deficiências no tratamento de dados ausentes, interpretabilidade e desempenho. Embora os modelos tenham alcançado avanços, a maioria dos modelos focados na previsão de pacientes se concentra em previsões de ponto único, em vez das trajetórias longitudinais abrangentes. Por outro lado, os Large Language Models (LLMs) focados em texto, embora menos explorados para esse propósito, demonstraram capacidades de previsão, incluindo a notável habilidade de previsão zero-shot (previsão sem qualquer treinamento específico prévio na tarefa), destacando sua notável generalização.

Por isso, Makarov e colaboradores (2025) propuseram a criação de gêmeos digitais baseados em LLMs que aproveitam dados de prontuários eletrônicos de saúde (EHRs) e estudos observacionais. Eles desenvolveram o modelo Digital Twin—Generative Pretrained Transformer (DT-GPT), estendendo as soluções de previsão baseadas em LLM para a predição de trajetórias clínicas. O DT-GPT utiliza EHRs sem a necessidade de imputação ou normalização de dados e supera desafios comuns de dados do mundo real, como dados ausentes, ruído e tamanho limitado da amostra.

O DT-GPT foi projetado para: (i) prever trajetórias de variáveis clínicas, (ii) realizar previsões zero-shot de variáveis clínicas não treinadas anteriormente e (iii) fornecer interpretabilidade preliminar utilizando funcionalidades de chatbot.

A ferramenta alcançou um desempenho de previsão de ponta, registrando o menor erro absoluto médio escalonado (MAE) geral em comparação com modelos de aprendizado de máquina estabelecidos e outros modelos avançados em todos os conjuntos de dados de benchmarking avaliados. O desempenho foi testado em três escalas temporais distintas: curto prazo (próximas 24 horas) para pacientes da Unidade de Terapia Intensiva (UTI), médio prazo (até 13 semanas) para pacientes com câncer de pulmão de não pequenas células (CPNPC), e longo prazo (próximos 24 meses) para a doença de Alzheimer (DA).

Comparado aos modelos de última geração, o DT-GPT demonstrou melhorias relativas no MAE escalonado de 3,4% no conjunto de dados de CPNPC, 1,3% no conjunto de dados de UTI e 1,8% no conjunto de dados da DA. Notavelmente, o modelo alcançou esses resultados enquanto superava os modelos de linguagem não ajustados (non-fine-tuned), inclusive o Qwen3-32B, um modelo significativamente maior (32 bilhões de parâmetros), sublinhando a necessidade do ajuste fino (fine-tuning) específico para a tarefa.

Além da precisão, os resultados destacam que o DT-GPT preservou a distribuição geral das variáveis alvo (com a pontuação KS mediana mais baixa entre todos os modelos) e manteve as correlações cruzadas entre as variáveis clínicas, alinhando-se estreitamente com os dados originais. O modelo também se mostrou robusto aos desafios comuns de dados do mundo real (RWD), como a escassez de dados de entrada e a presença de erros de digitação, operando sem a necessidade de imputação ou normalização de dados.

Em termos de utilidade clínica, o DT-GPT demonstrou forte potencial para capturar tendências laboratoriais relevantes, como a detecção de anemia leve e níveis elevados de LDH. Contudo, o desempenho foi limitado na previsão de eventos críticos específicos e de baixa prevalência, como quedas severas nos níveis de hemoglobina.

Uma capacidade inovadora introduzida pelo DT-GPT é a interpretabilidade preliminar por meio de funcionalidades de chatbot, permitindo que os usuários questionem o raciocínio por trás das previsões e identifiquem as variáveis mais importantes que influenciam as trajetórias, como o tipo de terapia e o status ECOG.

Finalmente, o DT-GPT demonstrou a habilidade de realizar previsões zero-shot para variáveis clínicas não treinadas explicitamente, expandindo sua aplicabilidade. Em uma comparação, o DT-GPT superou um modelo LightGBM totalmente treinado em 13 das 69 variáveis não alvo, sendo superior naquelas variáveis altamente correlacionadas aos alvos usados no ajuste fino. Essa capacidade de previsão sugeriu que o modelo foi capaz de capturar conhecimento clínico latente.

Em conclusão, o DT-GPT não apenas alcançou a precisão superior na previsão das trajetórias de saúde do paciente em comparação com os modelos de aprendizado de máquina existentes, mas também exibiiu robustez aos desafios de dados do mundo real, como dados ausentes e ruído, sem exigir extenso pré-processamento de dados. A capacidade do modelo de preservar as relações intervariáveis e as características distribucionais das variáveis clínicas ressaltou ainda mais seu potencial para a criação de gêmeos digitais realistas. Além disso, os recursos exclusivos do DT-GPT, incluindo interpretabilidade preliminar por meio de funcionalidades de chatbot e capacidades de previsão zero-shot, destacaram seu potencial para revolucionar a tomada de decisões clínicas, a seleção de tratamento e o design de ensaios clínicos. Embora os desafios permaneçam, o DT-GPT representa um passo significativo para a concretização da visão de gêmeos digitais alimentados por LLM como componentes integrais dos futuros sistemas de saúde.