Как Instagram и AI могут использоваться для прогнозирования эпидемии гриппа

06 Dec 2018
499
Прослушать

Финские исследователи из университета в Тампере разработали систему на базе искусственного интеллекта (artificial intelligence, AI), которая способна прогнозировать развитие эпидемии гриппа путем анализа публикаций в Instagram. Система может успешно делать такие предсказания путем анализа данных множества публикаций в Instagrem, имеющих отношение к симптомам гриппа, о чем свидетельствует сравнение с данными государственной статистики, касающейся общественного здравоохранения.

По словам одного из разработчиков этого решения - исследователя медицинского факультета университета в Тампере Огужана Генкоглу,

Это первая подобная система, которая использует визуальный анализ для предсказания эпидемий. Мы выбрали семь ключевых слов и фраз, таких как "грипп" или "боль в горле", и исследовали данные в Instagram с помощью таких хэштегов*, оценивая текст и изображения. Мы вели еженедельный подсчет таких хэштегов и анализировали визуальный контент, используя специально созданный для этого алгоритм глубокого обучения, который способен вести еженедельный подсчет изображений, которые содержат таблетки, коробочки с лекарствами, кружки с имбирным чаем и которыми охотно делятся пользователи.

Говоря о том, почему они решили использовать для анализа Instagram, Генкоглу говорит, что эта социальная сеть сегодня очень популярна и обеспечивает возможность использования преимущества большого количества информации. При этом дополнительным достоинством является то, что люди здесь охотно предоставляют доступ к подобным фотографиям и при этом большинство аккаунтов в этой социальной сети являются открытыми.

Алгоритм был "натренирован" на данных Instagram за 317 недель и затем был использован для прогнозирования ряда официально зарегистрированных в стране инцидентов, похожих на грипп. При сравнении с официальными данными о заболеваемости гриппом, публикуемыми в Национальном регистре здравоохранения Финляндии, AI-модель показала хорошую результативность со средней ошибкой в 11.3 инцидента в неделю и коэффициентом корреляции в 0.963.

Прогнозируя заболеваемость на две недели вперед, модель достигла показателя корреляции в 0.903, что свидетельствует о надежности такого решения для использования в системе здравоохранения.

По словам разработчиков, аналогичная прогнозная система может также использоваться и с другими заразными болезнями за счет "обучения" алгоритма на других наборах данных.

* Хештег – это ключевое слово или фраза, перед которыми ставится символ # и которые используется в публикациях в социальных сетях. В результате этот пост становится доступен людям с такими же интересами, даже если они не подписаны на эти обновления.