Медичний прорив у галузі ІІ: Нова модель знижує витрати на навчання, підвищує рівень міркувань

4

Дослідники з Університету штучного інтелекту імені Мохаммеда бен Заїда (MBZUAI) в Абу-Дабі представили MediX-R1, нову модель медичного ІІ, розроблену для більш ефективного та економічного відтворення клінічного мислення людини порівняно з існуючими системами. Розроблена у співпраці з лікарями з Індії, ця модель з відкритим вихідним кодом використовує навчання з підкріпленням для аналізу медичних зображень та надання розгорнутих клінічних відповідей – значний крок уперед порівняно з вибором із безлічі варіантів, характерним для сучасних медичних ІІ.

Проблема з поточним медичним ІІ

Більшість медичних ІІ-моделей навчаються на наборах даних, відформатованих у вигляді питань із множинним вибором. Такий підхід не відображає реальних клінічних сценаріїв, де лікарям необхідно синтезувати інформацію, враховувати контекст та формулювати нюансовані діагнози. Залежність від навчання з використанням питань з множинним вибором створює розрив між штучним інтелектом та реальною медичною практикою. MediX-R1 прагне подолати цей розрив, забезпечуючи вільне клінічне міркування.

Як працює MediX-R1

Ключова інновація полягає у використанні навчання з підкріпленням (RL) із складовою системою винагород. Це дозволяє MediX-R1 навчатися на відносно невеликому наборі даних (близько 51 000 прикладів інструкцій) без потреби у дорогих інструкціях від людини. Модель доступна у версіях з 2, 8 і 30 мільярдами параметрів, причому найменша версія може працювати локально на мобільному пристрої, що робить її доступною в умовах обмежених ресурсів охорони здоров’я.

Продуктивність та можливості

Продуктивність MediX-R1 вражає. Вона досягає середнього балу 73,6% за 17 медичними наборами даних та набирає 95,1% на іспиті на отримання ліцензії на медичну практику у США. Більше того, лікарі віддали перевагу відповідям відповідей інших моделей у 72,7% випадків у сліпих експертних оглядах. Версія з 8 мільярдами параметрів перевершує MedGemma-27B від Google, незважаючи на те, що вона втричі менша, що демонструє ефективність підходу команди до навчання з підкріпленням.

Модель підтримує 16 методів медичної візуалізації, включаючи рентген, КТ, МРТ та УЗД, що робить її однією з найуніверсальніших моделей з відкритим вихідним кодом, доступних у галузі медичного зору та мови.

Відкритий вихідний код та майбутні перспективи

MediX-R1 повністю опублікована під ліцензією CC-BY-NC-SA 4.0, що означає, що ваги моделі, код навчання та набори даних знаходяться у відкритому доступі. Така прозорість прискорить дослідження та дозволить ширшій спільноті ІІ розвивати цю роботу. Хоча це поки що прототип дослідження і ще не готовий до клінічного впровадження через такі ризики, як потенційні галюцинації, MediX-R1 є важливим кроком до більш доступного та ефективного медичного ІІ.

Прогнозується, що світовий ринок генеративного ІІ в охороні здоров’я досягне 21,7 мільярда доларів до 2032 року, і такі прориви, як MediX-R1, необхідні для подолання технічних перешкод, які нині роблять навчання моделей дорогим та ресурсомістким. Довівши більш ефективний шлях до високоякісного медичного ІІ, це дослідження може демократизувати доступ до передових діагностичних інструментів у всьому світі.