Нейро-консилиум превзошёл обычных врачей в диагностике заболеваний

Новый этап развития ИИ в медицине демонстрирует впечатляющие результаты в диагностике заболеваний. Согласно исследованию, модель o3 справилась с задачей на уровне ~80%, существенно опередив среднестатистических врачей-терапевтов, которые правильно диагностируют лишь в 20% случаев.

Ключевым фактором успеха стала разработка системы-оркестратора, имитирующей работу группы виртуальных врачей, которые критически анализируют решения друг друга. Такой подход позволил добиться значительных улучшений в точности и оптимизации затрат.

Так, под управлением нейросетевого консилиума:

Модель o3 достигла точности 80%, одновременно снизив расходы на обследования почти вдвое.
GPT-4o показала точность около 60%, потратив меньше денег, чем практикующие врачи.
Другие модели, включая Gemini 2.5 Pro, Claude 4 Opus, Grok-3, DeepSeek R1 и Llama 4 Maverick, продемонстрировали повышение качества диагностики примерно на 10%.

Система успешно справилась с 304 сложными клиническими случаями из журнала New England Journal of Medicine (NEJM), где требовалась поэтапная диагностика. Она не только превзошла врачей-людей по точности (четыре правильных диагноза из пяти), но и снизила количество дорогостоящих анализов.

Подробные результаты исследования, включая методологию и расчёты затрат, представлены в публикации на arXiv.

Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube

Нейро-консилиум превзошёл обычных врачей в диагностике заболеваний

София Лайтман

Компании намеренно ухудшают поддержку клиентов: как «саботаж» стал частью сервиса

Ошибка в лотерее подарила норвежцам ложные надежды на миллионы евро