Microsoft запускает новый ИИ для диагностики: «До 4 раз лучше врачей»

Сегодня компания Microsoft представила исследование, которое может стать поворотным моментом в отношениях между искусственным интеллектом и медициной.
Проект рабочей группы по искусственному интеллекту под руководством Мустафы Сулеймана продемонстрировал способность правильно диагностировать 85% клинических случаев, опубликованных в New England Journal of Medicine (одном из самых престижных медицинских журналов в мире) . Это, как утверждается, превышает точность группы врачей-экспертов более чем в четыре раза.
«Команда Microsoft AI делится исследованиями, которые демонстрируют, как ИИ может последовательно исследовать и решать самые сложные диагностические задачи в медицине», — говорится в статье, опубликованной на официальном сайте Microsoft, — «случаи, которые даже опытным врачам трудно решить».
Новые рубежи последовательной диагностикиСердце инновации MAI – DxO (так называется программа) заключается в ее способности шаг за шагом воспроизводить клинические рассуждения. То есть, точно так же, как это сделал бы врач в реальной практике. Речь идет не о том, чтобы отвечать на вопросы с несколькими вариантами ответов, а о том, чтобы следовать реальному процессу диагностики, начиная с симптомов, задавая конкретные вопросы, назначая тесты и оценивая результаты. Больше, чем просто анализ, довольно точное воспроизведение клинических рассуждений.
«В Microsoft AI мы работаем над улучшением и оценкой возможностей клинического мышления. Чтобы выйти за рамки ограничений тестов с множественным выбором, мы сосредоточились на последовательной диагностике, которая является основой принятия медицинских решений в реальном мире», — говорится на странице, где представлены результаты исследования.
Конкретный пример среди предложенных в исследовании. По словам исследователей, пациент с кашлем и лихорадкой может заставить систему решить сначала запросить анализы крови, а затем рентген грудной клетки, прежде чем прийти к правильному диагнозу пневмонии, как это сделал бы врач.
ИИ против врачей: программное обеспечение побеждает команду людей со счетом 85% против 20%Команда использовала 304 реальных клинических случая из еженедельной серии Case Records NEJM, превратив их в эталон под названием SD Bench (Sequential Diagnosis Benchmark). Производительность MAI?DxO, которая координирует большие языковые модели, такие как OpenAI o3, Gemini, Claude, Grok и другие, удивила исследователей, которые написали: «Сравнивая результаты с реальными случаями, еженедельно публикуемыми в New England Journal of Medicine, мы показываем, что Microsoft AI Diagnostic Orchestrator (MAI-DxO) правильно диагностирует до 85% случаев, что более чем в четыре раза выше, чем у группы опытных врачей».
21 врач, участвовавший в оценке — из США и Великобритании — получил в среднем 20% правильных диагнозов. Система Microsoft также оказалась более экономически эффективной, выбрав более целевые и менее инвазивные тесты. «MAI-DxO приходит к правильному диагнозу дешевле, чем врачи», — добавляют они.
Не замена человеку, а усовершенствованиеMicrosoft подчеркнула, что MAI?DxO не призван заменить врачей, а оказать им поддержку в самых сложных случаях или при отсутствии доступа к специалистам.
«Роль врачей гораздо шире, чем просто диагностика. Они должны уметь справляться с неоднозначными ситуациями и выстраивать доверительные отношения с пациентами и их семьями, чего сегодня не может сделать ИИ», — продолжает он.
Компания признает, что система пока не готова к клиническому использованию, но полагает, что в будущем она может улучшить доступ к медицинской помощи, сократить количество ошибок и помочь в особо сложных ситуациях.
На пути к медицинскому «суперинтеллекту»Microsoft выбрала выражение для определения пути: «Путь к медицинскому суперинтеллекту» , дорога к медицинскому суперинтеллекту. Цель: ИИ, который не только равен, но и превосходит человеческие возможности в медицинской диагностике, лечении и прогнозировании.
В статье поясняется, что «выход на этот уровень рассуждений — и выше — может кардинально изменить систему здравоохранения. ИИ может помочь пациентам самостоятельно управлять простыми аспектами своего здоровья и предоставить врачам расширенную поддержку в более сложных случаях».
Microsoft объявила, что сделает бенчмарк общедоступным для научного сотрудничества и проверки. Будущие тесты будут сосредоточены на более распространенных симптомах, чтобы подтвердить надежность в обычных ситуациях.
Проект реализуется в то время, когда расходы на здравоохранение в мире стремительно растут, причем в США, как напоминает Guardian, расходы превышают 20% ВВП, а до четверти расходов считаются неэффективными.
repubblica