Почему ученые используют искусственный интеллект для подделки данных о здоровье?

15 Oct 2018
606
Прослушать

Современные системы на базе искусственного интеллекта (artificial intelligence, AI) нуждаются в большом количестве данных, на которых обычно "обучается" алгоритм. Но такие данные не всегда доступны, если говорить о здравоохранении. В частности, "тренировке" алгоритма на реальных данных могут мешать вопросы обеспечения приватности, финансовые проблемы, недостаток данных по редким заболеваниям. И здесь может помочь решение на базе генеративно-состязательных сетей (generative adversarial networks, GAN)*, которые могут создавать достаточно реалистические медицинские изображения для обучения алгоритма.

В недавно опубликованном в arXiv.org отчете об исследованиях американские ученые из компании NVIDIA, MGH & BWH Center for Clinical Data Science и клиники Майо показали, как они используют алгоритмы GAN для создания синтетических изображений МРТ мозга с опухолями.

Исследователи использовали для "обучения" системы два набора данных МРТ-сканов мозга - один из которых соответствует мозгу с болезнью Альцгеймера и другой с раковыми опухолями. Результирующие изображения использовали "смесь" из 10% реальных данных и 90% сгенерированных с помощью GAN данных. Выяснилось, что полученные таким образом изображения мозга подходили для "тренировки" алгоритма по обнаружению опухоли так же, как и набор данных из реальных изображений.

Правда, здесь и свои ограничения. Решение на базе GAN не может создавать изображения с деталями, которые оно ранее не видело, и, кроме этого, оно может сделать незаметные несоответствия в изображении еще хуже. И поскольку биология опухолей до сих пор не до конца понятна, создавать подобные изображения "с нуля" не получится. Тем не менее, с помощью GAN можно создавать изображения с опухолями, которые больше или меньше, или перемещать их на другую сторону мозга, и делать все это вполне реалистично.

Напомним, что технология на базе GAN больше известна как метод Deep Fakes*, позволяющий создавать очень реалистичные поддельные видео. Но в медицинской сфере GAN может быть полезной технологией, и мы имеем несколько примеров этого. Недавно в этом же arXiv.org публиковались данные исследования, в котором GAN использовался для создания реалистических изображений поражений кожи. Эти изображения были настолько качественные, что дерматологи не могли отличить их от реальных фотографий. Еще в одной работе этот метод использовался для создания изображений новообразований в печени.

* Генеративно-состязательная сеть - алгоритм машинного обучения без учителя, построенный на комбинации из двух нейронных сетей, одна из которых генерирует образцы, а другая старается отличить правильные («подлинные») образцы от неправильных.

** Deep Fakes — это нейросеть, которая на входе получает видеофайл и сотню другую фотографий лица человека, которого вы хотите поместить на это видео. То есть в итоге мы получаем человека на видео, хотя он никогда там не снимался