Avanço na IA médica: novo modelo reduz custos de treinamento e aumenta o raciocínio

11

Pesquisadores da Universidade de Inteligência Artificial Mohamed bin Zayed (MBZUAI) em Abu Dhabi revelaram o MediX-R1, um novo modelo médico de IA projetado para imitar o raciocínio clínico humano de forma mais eficaz e a um custo menor do que os sistemas existentes. Desenvolvido em colaboração com médicos na Índia, este modelo de código aberto aproveita a aprendizagem por reforço para analisar imagens médicas e fornecer respostas clínicas abertas – um passo significativo além dos resultados de múltipla escolha comuns na IA médica atual.

O problema com a IA médica atual

A maioria dos modelos de IA médica são treinados usando conjuntos de dados formatados como questões de múltipla escolha. Esta abordagem não reflete cenários clínicos do mundo real, onde os médicos devem sintetizar informações, considerar o contexto e formular diagnósticos diferenciados. A dependência do treinamento de múltipla escolha cria uma lacuna entre a inteligência artificial e a prática médica real. O MediX-R1 visa preencher essa lacuna, permitindo o raciocínio clínico de forma livre.

Como funciona o MediX-R1

A principal inovação reside no uso do modelo de aprendizagem por reforço (RL) com um sistema de recompensa composto. Isso permite que o MediX-R1 aprenda com um conjunto de dados relativamente pequeno (aproximadamente 51.000 exemplos de instruções) sem a necessidade de anotações humanas extensas e dispendiosas. O modelo está disponível em versões de 2, 8 e 30 bilhões de parâmetros, sendo a menor versão capaz de ser executada localmente em um dispositivo móvel, tornando-o acessível em ambientes de saúde com recursos limitados.

Desempenho e capacidades

O desempenho do MediX-R1 é impressionante. Atinge uma média de referência de 73,6% em 17 conjuntos de dados médicos e pontua 95,1% no Exame de Licenciamento Médico dos EUA. Ainda mais notavelmente, os médicos preferiram as suas respostas às de outros modelos em 72,7% das avaliações cegas de especialistas. A versão de 8 bilhões de parâmetros supera o modelo MedGemma-27B do Google, apesar de ser três vezes menor, demonstrando a eficiência da abordagem de aprendizagem por reforço da equipe.

O modelo suporta 16 modalidades de imagens médicas, incluindo raios X, tomografia computadorizada, ressonância magnética e ultrassom, tornando-o um dos modelos de linguagem visual médica de código aberto mais versáteis disponíveis.

Código aberto e implicações futuras

O MediX-R1 é totalmente de código aberto sob uma licença CC-BY-NC-SA 4.0, o que significa que os pesos do modelo, o código de treinamento e os conjuntos de dados estão disponíveis publicamente. Esta transparência acelerará a investigação e permitirá que a comunidade mais ampla de IA desenvolva este trabalho. Embora ainda seja um protótipo de pesquisa e ainda não esteja pronto para implantação clínica devido a riscos como possíveis alucinações, o MediX-R1 representa um passo fundamental em direção a uma IA médica mais acessível e eficaz.

Prevê-se que o mercado global de IA generativa nos cuidados de saúde atinja os 21,7 mil milhões de dólares até 2032, e avanços como o MediX-R1 são essenciais para superar os obstáculos técnicos que atualmente tornam a formação de modelos dispendiosa e intensiva em recursos. Ao demonstrar um caminho mais eficiente para a IA médica de alta qualidade, esta pesquisa tem o potencial de democratizar o acesso a ferramentas de diagnóstico avançadas em todo o mundo.