Два новых доклада подробно анализируют вселенную белков, раскрытую 200 миллионами моделей AlphaFold 2

Два новых доклада анализируют вселенную белков с помощью AlphaFold 2

И им пришлось создать новые инструменты для работы с таким большим объемом моделей белковой структуры

Один из ресурсов, представленных в обсуждаемых статьях, https://uniprot3d.org/, изображает белки, распределенные как в современном представлении Вселенной, где более яркие кластеры содержат больше участников. При увеличении масштаба пользователь может изучать связанные белки, а при щелчке на определенном узле отображается информация (здесь показана только структурная модель) о семействе белков в контексте Uniprot. Изображение составлено автором во время просмотра веб-сайта.

Недавнее выпуск более чем 200 миллионов предсказанных структур белков DeepMind’s AlphaFold 2 в сотрудничестве с Европейским институтом биоинформатики открыл новую эру исследований белков. Здесь я представляю краткое изложение результатов двух революционных статей, опубликованных на страницах журнала Nature на этой неделе, которые погружаются в глубины этой белковой вселенной. Эти статьи используют инновационные алгоритмы кластеризации, структурные сравнения и другие модификации существующих инструментов для работы с большими объемами данных, чтобы прояснить структурное разнообразие, эволюционные отношения и функциональные возможности белков в масштабах, невиданных ранее.

Белки – это “рабочие лошадки” биологии, управляющие множеством клеточных процессов, от производства энергии до деления клеток. В то время как последовательность белков растет с каждым годом благодаря прогрессу в геномике, определение их трехмерной структуры отстает из-за нехватки масштабируемых экспериментальных методов. Однако с появлением AlphaFold 2, революционной системы искусственного интеллекта, разработанной DeepMind, ландшафт прогнозирования белковой структуры претерпел изменения. В базе данных белковой структуры AlphaFold (AFDB) теперь находится удивительное количество в 200 миллионов предсказанных структур белков, что является вехой в вычислительной биологии.

Базы данных на основе AlphaFold и полноценные, легко используемые онлайн-интерфейсы AlphaFold готовы к…

Не только вычислительная, но и экспериментальная биология. Мысли о будущем нишей науки о данных в биологии.

towardsdatascience.com

На самом деле, на этой неделе две группы авторов пишут в журнале Nature о том, как использовать модели белков AlphaFold 2 для получения новых идей о белковой вселенной. Эти исследования используют инновационные версии существующих инструментов, адаптированные к огромному объему данных в AFDB; например, современные версии алгоритмов кластеризации и методы структурного сравнения. С помощью этих адаптированных инструментов работы исследуют просторы белковых структур, их эволюционное происхождение и функциональные последствия.