Новый этап развития ИИ в медицине демонстрирует впечатляющие результаты в диагностике заболеваний. Согласно исследованию, модель o3 справилась с задачей на уровне ~80%, существенно опередив среднестатистических врачей-терапевтов, которые правильно диагностируют лишь в 20% случаев.
Ключевым фактором успеха стала разработка системы-оркестратора, имитирующей работу группы виртуальных врачей, которые критически анализируют решения друг друга. Такой подход позволил добиться значительных улучшений в точности и оптимизации затрат.
Так, под управлением нейросетевого консилиума:
- Модель o3 достигла точности 80%, одновременно снизив расходы на обследования почти вдвое.
- GPT-4o показала точность около 60%, потратив меньше денег, чем практикующие врачи.
- Другие модели, включая Gemini 2.5 Pro, Claude 4 Opus, Grok-3, DeepSeek R1 и Llama 4 Maverick, продемонстрировали повышение качества диагностики примерно на 10%.
Система успешно справилась с 304 сложными клиническими случаями из журнала New England Journal of Medicine (NEJM), где требовалась поэтапная диагностика. Она не только превзошла врачей-людей по точности (четыре правильных диагноза из пяти), но и снизила количество дорогостоящих анализов.
Подробные результаты исследования, включая методологию и расчёты затрат, представлены в публикации на arXiv.
Ещё по теме:
- Компании намеренно ухудшают поддержку клиентов: как «саботаж» стал частью сервиса
- Продажи Mac в США растут быстрее всех — почему Apple снова на подъёме
- Афиша муромского полумарафона с ИИ-семьёй и «летающими ногами» ушла в печать и стала мемом