Ssylka

Медицинский ИИ: рост технологий и недостаточная проверка

Искусственный интеллект интегрируется во множество сфер здравоохранения: скрининг рака молочной железы, ведение клинических записей, управление медицинскими страховками, виртуальное сопровождение пациентов и транскрипция бесед врача с пациентом. Компании уверяют, что эти инструменты повышают эффективность работы и снижают нагрузку на персонал, однако остаются вопросы реальной работоспособности систем.
Медицинский ИИ: рост технологий и недостаточная проверка
Изображение носит иллюстративный характер

Крупномасштабные языковые модели обучаются на обширных наборах данных для создания текстов, максимально приближённых к человеческому стилю. В большинстве случаев оценка их эффективности в медицине проводится через тестирование, аналогичное экзаменам медицинских студентов, таким как MCAT.

Лишь 5% исследований, посвящённых медицинским AI, используют данные реальных пациентов. Практически все тесты сосредоточены на проверке теоретических знаний, вместо того чтобы оценивать выполнение таких важных задач, как выписывание рецептов, суммирование консультаций или непосредственное общение с пациентами.

Дебора Раджи из Университета Калифорнии в Беркли отмечает, что существующие эталоны оценивания чрезмерно ориентированы на экзаменационные вопросы. «Эти тесты отвлекают и создают ложное чувство уверенности в клинических способностях системы», – считает она, подчёркивая, что такие подходы вовсе не отражают сложность реальных клинических условий и игнорируют вклад медсестёр и другого медицинского персонала.

Для улучшения оценки предлагается проведение интервью с экспертами отрасли, сбор естественных данных из пилотных испытаний и использование методов «red teaming», позволяющих выявить уязвимости системы при нестандартных запросах. Роксана Данешжу, соавтор исследований в этом направлении, подтверждает важность подобного подхода.

Получение данных об использовании ИИ в настоящих больничных условиях, включая анонимизированную информацию о пациентах, позволяет создать оценку, основанную на реальных наблюдениях, аналогичных методикам психологического анализа. Такой сбор данных способствует более точному определению эффективности инструментов в клиническом контексте.

Специализированные эталоны для суммирования врачебных записей и анализа загруженных данных принципиально отличаются от тестов, ориентированных на воспроизведение знаний. Усиление акцента на задачах, свойственных повседневной клинической практике, становится ключевым направлением для дальнейшего развития системы оценивания.

Рекомендуется повышение прозрачности в институциональных практиках: больницы должны создавать инвентари используемых AI-продуктов с подробным описанием рабочих процессов, а поставщики — делиться информацией о принятых стандартах тестирования. Такой обмен данными позволит выявить существующие пробелы в оценке эффективности технологий.

Оценка ИИ должна основываться на реалистичных сценариях, отражающих его непосредственную интеграцию в клиническую работу. Эти рекомендации были изложены в интервью, опубликованном в Science News, с дополнительными ссылками на февральский выпуск New England Journal of Medicine AI, что подчёркивает необходимость пересмотра текущих методов тестирования в пользу более строгих и практичных подходов.


Новое на сайте

18884Знаете ли вы, что приматы появились до вымирания динозавров, и готовы ли проверить свои... 18883Четыреста колец в туманности эмбрион раскрыли тридцатилетнюю тайну звездной эволюции 18882Телескоп Джеймс Уэбб раскрыл тайны сверхэффективной звездной фабрики стрелец B2 18881Математический анализ истинного количества сквозных отверстий в человеческом теле 18880Почему даже элитные суперраспознаватели проваливают тесты на выявление дипфейков без... 18879Шесть легендарных древних городов и столиц империй, местоположение которых до сих пор... 18878Обзор самых необычных медицинских диагнозов и клинических случаев 2025 года 18877Критическая уязвимость CVE-2025-14847 в MongoDB открывает удаленный доступ к памяти... 18876Научное обоснование классификации солнца как желтого карлика класса G2V 18875Как безграничная преданность горным гориллам привела Дайан Фосси к жестокой гибели? 18874Новый родственник спинозавра из Таиланда меняет представления об эволюции хищников Азии 18873Как новая электрохимическая технология позволяет удвоить добычу водорода и снизить... 18872Могут ли ледяные гиганты Уран и Нептун на самом деле оказаться каменными? 18871Внедрение вредоносного кода в расширение Trust Wallet привело к хищению 7 миллионов... 18870Проверка клинического мышления на основе редких медицинских случаев 2025 года