Борьба с болезнями, фолдинг белков и чтение мыслей

Рассказываем о прорывах в Data Science за 2020 год
4 минуты6954

Статья подготовлена специалистами факультета Data Science в медицине GeekBrains.

Сегодня мы поговорим о Data Science — точнее, о том, чего этой отрасли удалось достичь в прошлом году. Практически все сферы жизни в 2020-м были затронуты пандемией COVID-19, так что и Data Science не стала исключением. Но статья не будет чисто о медицине, поскольку интересными достижениями могут похвастаться и другие направления. 

Мониторим распространение COVID-19

Без Data Science контролировать вспышки заболеваемости коронавирусом было бы сложно. Многие компании, специализирующиеся на науке о данных, с начала прошлого года активно развивали инструменты мониторинга пандемии. Одна из таких организаций — SAS, разработавшая интерактивную карту. Она показывает текущее состояние пандемии, очаги активности вируса и направления его распространения.

Базовые данные обновляются каждый день:

  • Количество новых случаев заболевания коронавирусом за последние 10 дней.
  • Изменения показателей распространения вируса, показателей выздоровления и смертности.
  • Направления миграции вируса.
  • Подтверждённые случаи заболевания — для отслеживания изменения скорости выздоровления.

Обзор вспышек COVID-19, включая количество подтверждённых новых случаев, выздоровевших и смертей от вируса, отфильтрованного по географическому расположению.

Диагностика COVID-19 по кашлю 

В прошлом году сразу несколько университетов стали разрабатывать технологии диагностики коронавируса по кашлю. MIT, например, создал приложение, которое даёт возможность  с высокой степенью точности определить, заражён человек вирусом COVID-19 или нет.

Приложение простое: запускаете и просто кашляете в трубку смартфона. Запись звука отправляется в облако для анализа, и через несколько секунд система ставит предварительный диагноз. Кашель заболевшего ковидом человека отличается от кашля, вызванного иными причинами. На Soundcloud есть пример аудиозаписи, которая даёт представление об этих отличиях.

Специалисты по Data Science из MIT совместно с медиками смогли разработать точную модель анализа аудиозаписи. С её помощью можно понять обычная простуда у пользователя или нет. Конечно, система иногда ошибается, но это намного лучше, чем ничего. В 2021 году, вероятно, подобные приложения и сервисы станут очень распространёнными. Разработчики планируют встроить их в умные колонки вроде Amazon Echo или «Алиса». 

Показать всё, что скрыто — эволюция радиомики

Не слышали про радиомику? Неудивительно — это новый подход к анализу изображений компьютерной томографии и МРТ, который лежит на стыке радиологии, математической статистики и компьютерных наук. Ещё в 2012 году учёные предположили, что медицинские изображения содержат полезную для диагностики заболеваний информацию, которую врач не может оценить без специальных инструментов. Эту информацию (например, оттенки цвета ткани на снимке) можно проанализировать, применив методы компьютерного анализа.

В итоге врачи получают дополнительный инструмент диагностики, позволяющий более точно идентифицировать заболевание, предсказать его течение и найти лекарство. Наиболее перспективна радиомика для  диагностики и лечения онкологических заболеваний. В частности, она позволяет определить тип опухоли без биопсии, где требуется инвазивное вмешательство.

 

Разметка МРТ-изображений. Слева: МРТ-изображение головного мозга человека. Красным цветом выделена злокачественная опухоль. Справа: Гистограмма интенсивностей отдельных пикселей выделенной области. Значения гистограммных признаков: минимальное (min), максимальное (max), среднее (mean), медианное (median). Skewness — величина асимметрии распределения. Анализ изображения показывает, что зона, выделенная цветом, поражена злокачественной опухолью.

В 2020 году радиомика значительно продвинулась. Можно надеяться на то, что в скором времени она станет одним из главных инструментов диагностики заболеваний.  

Data Science и биология

Один из важнейших прорывов 2020 года — моделирование фолдинга (сворачивания) белков. И всё благодаря компании DeepMind, одного из лидеров на рынке ИИ. Её новый проект позволил предсказывать, какую форму примет тот или иной белок после синтеза. Таких форм может быть великое множество, так что учёные изучили лишь 0,1% от возможных комбинаций, действуя методом проб и ошибок.

Ранее специалисты пытались моделировать структуру неизвестных белков при помощи инструментов Data Science, но не всегда удачно. Представители DeepMind заявили, что им удалось найти ключ к решению этой задачи. И если это действительно так (а на это похоже), то нас ожидает прорыв в фармацевтике, разработке вакцин, понимании причин возникновения и течения многих болезней. Дело в том, что учёные, зная, какую форму примет тот либо иной белок, могут предсказать его влияние на организм человека. Соответственно, фармацевты получают возможность разработки крайне эффективных препаратов, а медики смогут прогнозировать ход заболевания у пациентов с высокой степенью точности.

А ещё чтение мыслей!

Не совсем в том виде, как нам показывают в фильмах или рассказывают в научно-фантастических романах. Но мы уже близко к моменту, когда при помощи компьютера можно узнать, о чём мы думаем.

Группа учёных Калифорнийского университета Сан-Франциско смогла доказать возможность преобразования электрических сигналов в мозге человека в слова, которые мысленно произносит участник эксперимента. Правда, пока что для этого нужно вживлять в мозг электроды, но в будущем технология может стать станет неинвазивной. Для анализа сигналов используется рекуррентная нейросеть.

Точность определения слов — 97%. Этот результат позволяет надеяться на скорое появление устройства для чтения мыслей.

В целом, 2020 год стал годом прорывов в Data Science — сейчас наука о данных и её достижения активно применяются во многих отраслях, включая промышленность, IT, медицину, физику, биологию. Нет сомнений, что в 2021 году наука о данных поможет совершить ещё больше прорывов в науке и технологиях.

В GeekBrains на факультете Data Science в медицине мы обучаем, как применять методы искусственного интеллекта в этой области и стать биостатистиком. Узнать больше об условиях обучения и программе вы можете на странице факультета.

программированиеdata-science-medicine
Нашли ошибку в тексте? Напишите нам.
Спасибо,
что читаете наш блог!