Исследователи из Университета искусственного интеллекта имени Мохаммеда бен Заида (MBZUAI) в Абу-Даби представили MediX-R1, новую модель медицинского ИИ, разработанную для более эффективного и экономичного воспроизведения клинического мышления человека по сравнению с существующими системами. Разработанная в сотрудничестве с врачами из Индии, эта модель с открытым исходным кодом использует обучение с подкреплением для анализа медицинских изображений и предоставления развёрнутых клинических ответов – значительный шаг вперёд по сравнению с выбором из множества вариантов, характерным для современных медицинских ИИ.
Зміст
Проблема с текущим медицинским ИИ
Большинство медицинских ИИ-моделей обучаются на наборах данных, отформатированных в виде вопросов с множественным выбором. Такой подход не отражает реальных клинических сценариев, где врачам необходимо синтезировать информацию, учитывать контекст и формулировать нюансированные диагнозы. Зависимость от обучения с использованием вопросов с множественным выбором создаёт разрыв между искусственным интеллектом и реальной медицинской практикой. MediX-R1 стремится преодолеть этот разрыв, обеспечивая свободное клиническое рассуждение.
Как работает MediX-R1
Ключевая инновация заключается в использовании обучения с подкреплением (RL) с составной системой вознаграждений. Это позволяет MediX-R1 обучаться на относительно небольшом наборе данных (около 51 000 примеров инструкций) без необходимости в дорогостоящих аннотациях от человека. Модель доступна в версиях с 2, 8 и 30 миллиардами параметров, при этом самая маленькая версия может работать локально на мобильном устройстве, что делает её доступной в условиях ограниченных ресурсов здравоохранения.
Производительность и возможности
Производительность MediX-R1 впечатляет. Она достигает среднего балла 73,6% по 17 медицинским наборам данных и набирает 95,1% на экзамене на получение лицензии на медицинскую практику в США. Более того, врачи предпочли её ответы ответам других моделей в 72,7% случаев в слепых экспертных обзорах. Версия с 8 миллиардами параметров превосходит MedGemma-27B от Google, несмотря на то, что она в три раза меньше, что демонстрирует эффективность подхода команды к обучению с подкреплением.
Модель поддерживает 16 методов медицинской визуализации, включая рентген, КТ, МРТ и УЗИ, что делает её одной из самых универсальных моделей с открытым исходным кодом, доступных в области медицинского зрения и языка.
Открытый исходный код и будущие перспективы
MediX-R1 полностью опубликована под лицензией CC-BY-NC-SA 4.0, что означает, что веса модели, код обучения и наборы данных находятся в открытом доступе. Такая прозрачность ускорит исследования и позволит более широкому сообществу ИИ развивать эту работу. Хотя это пока прототип исследования и ещё не готов к клиническому внедрению из-за таких рисков, как потенциальные галлюцинации, MediX-R1 представляет собой важный шаг к более доступному и эффективному медицинскому ИИ.
Прогнозируется, что мировой рынок генеративного ИИ в здравоохранении достигнет 21,7 миллиарда долларов к 2032 году, и такие прорывы, как MediX-R1, необходимы для преодоления технических препятствий, которые в настоящее время делают обучение моделей дорогим и ресурсоёмким. Доказав более эффективный путь к высококачественному медицинскому ИИ, это исследование может демократизировать доступ к передовым диагностическим инструментам во всём мире.



























