В условиях пандемии, когда врачи валятся с ног от усталости, а в существующих стационарах не хватает коек, особенно актуальным становится такое давно провозглашённое перспективным направление развития искусственного интеллекта (AI), как клиническая диагностика.

Подразделение Google Health долгое время работало над тренировкой нейронных сетей для уверенного диагностирования пациентов на основе тех же средств, которыми пользуются живые специалисты, — медицинских анамнезов, данных КТ и МРТ, фотоснимков, анализов и тому подобного. И до сих пор тренировка демонстрировала очень даже неплохие результаты: в ряде случаев AI выявлял ранние признаки определённых типов рака, скажем, точнее опытных клиницистов.

Однако когда натренированным в лаборатории нейросетям начали скармливать не информацию об уже известных и диагностированных случаях, а неаннотированные сырые данные по болеющим прямо сейчас пациентам, система стала выдавать один сбой за другим. Дело в том, что главным критерием натаскивания ИИ на результат в кабинетных, что называется, условиях была точность. Верный диагноз для каждого из прогоняемых через нейросеть наборов данных был изначально известен, и в зависимости от того, насколько точным было очередное приближение к нему, в систему выдавалась та или иная обратная связь. В результате диагностический AI от Google выучился верно угадывать уже сформулированные живыми врачами диагнозы для того набора модельных исходных данных, на котором его тренировали.

В реальных же клиниках, как показала практика последних месяцев, ситуация сплошь и рядом отличается от идеальной лабораторной. Существенной оказывается разница в настройках и качестве калибровки исследовательской аппаратуры, в пунктуальности составляющего анамнез и ведущего историю болезни врача, в добросовестности сбора проб для анализа младшим медперсоналом и т. п. Плюс к тому, в каждой клинике — своя микробиологическая обстановка, свой букет больничных инфекций, который особым образом накладывается на картину течения формально того же самого заболевания, искажая её порой весьма причудливым образом.

При этом речь не идёт даже о коронавирусе. Медицинский AI Google ещё в начале года начали применять в экспериментальном порядке для диагностирования диабетической ретинопатии в клиниках Таиланда, где на 4,5 млн больных диабетом, потенциально подверженных этому недугу, приходится лишь 200 специалистов соответствующей квалификации. Специалисты Google Health развернули фронт-энды своей системы в 11 клиниках страны: этот AI в лаборатории был натренирован с 90%-ной точностью диагностировать ранние стадии диабетической ретинопатии менее чем за 10 минут — на основании одних лишь только цифровых снимков радужной оболочки. Казалось бы, что могло пойти не так?

Как выяснилось, практически всё. Натренированная на великолепного качества снимках, сделанных в лучших университетских клиниках США, система впадала в ступор, сталкиваясь с изображениями, которые поступали в неё чуть ли не с ноутбучных веб-камер, да ещё сделанными не разбирающимся в тонкостях фотодела младшим медперсоналом в условиях недостаточной освещённости. Высокий процент отбраковки снимков приводил к перенаправлению пациентов, которым не удавалось сходу поставить диагноз, в другие клиники. Где, соответственно, увеличивался наплыв страждущих, медсёстры оказывались перегружены запросами на потоковое сканирование, качество делаемых ими снимков падало — с очевидными последствиями.

Плюс к тому, в тайской глубинке с Интернетом не всё идеально, так что загрузка снимков — в особенности сделанных с должным разрешением и качеством — занимала значительно больше времени, чем ожидали специалисты Google. Все эти соображения необходимо будет теперь принимать в расчёт в ходе совершенствования диагностического AI: проблемы реального здравоохранения во всём мире явно будет решить сложнее, чем натренировать искусственный интеллект на более гибкую, контекстно-зависимую диагностику.