Google DeepMind представляет новый инструмент искусственного интеллекта, который классифицирует эффекты 71 миллиона мутаций миссенс.

Google DeepMind представляет инструмент искусственного интеллекта для классификации мутаций.

Самое большое испытание в генетике человека, пожалуй, это сложность генома человека и огромное разнообразие генетических факторов, которые влияют на здоровье и болезни. Геном человека состоит из более чем 3 миллиардов пар оснований и содержит не только гены, кодирующие белки, но и некодирующие области, которые играют важную роль в регуляции и функционировании генов. Понимание процессов этих элементов и их взаимодействий – это гигантская задача.

Знание того, что генетическая вариантность, связанная с болезнью, – это только начало. Понимание функциональных последствий этих вариантов, их взаимодействия с другими генами и их роль в патологии болезни является сложной и ресурсоемкой задачей. Анализ огромного количества генетических данных, генерируемых высокотехнологичными методами секвенирования, требует передовых вычислительных инструментов и инфраструктуры. Хранение, обмен и анализ данных представляют существенные логистические проблемы.

Исследователи Google DeepMind разработали каталог AlphaMissense с использованием новой модели искусственного интеллекта под названием AlphaMissense, которую они создали. Он состоит из около 89% всех 71 миллиона возможных миссенс-вариантов, разделенных на патогенные или доброкачественные категории. Миссенс-вариант – это генетическая мутация, которая приводит к замене одного нуклеотида в последовательности ДНК. Нуклеотиды являются строительными блоками ДНК и располагаются в определенном порядке. Эта последовательность содержит фундаментальную генетическую информацию и структуру белка в живых организмах. В среднем человек несет более 9000 миссенс-вариантов.

Эти классифицирующие миссенс-варианты помогают понять, какие изменения белка приводят к возникновению болезней. Их текущая модель обучена на их ранее успешной модели под названием AlphaFold, которая предсказывала структуры для почти всех известных белков по последовательности аминокислот. Однако AlphaMissense только классифицирует базу данных последовательности белка и структурный контекст вариантов для получения оценок от 0 до 1. Оценка 1 указывает на то, что структура в высокой степени вероятно является патогенной. Для данной последовательности оценки анализируются, чтобы выбрать порог для классификации вариантов.

AlphaMissense превосходит все другие вычислительные методы и модели. Их модель также является наиболее точным методом для предсказания лабораторных результатов, что отражает согласованность с различными способами измерения патогенности. Используя эту модель, пользователи могут получить предварительный просмотр результатов для тысяч белков за раз, что может помочь оптимизировать ресурсы и ускорить область исследования. Из более чем 4 миллионов миссенс-вариантов, наблюдаемых у людей, только 2% были отмечены экспертами как патогенные или доброкачественные, примерно 0,1% от всех 71 миллиона возможных миссенс-вариантов.

Важно отметить, что генетика человека стремительно развивается, и прогресс в технологиях, анализе данных и нашем понимании генетических механизмов продолжает решать эти проблемы. Несмотря на значительные трудности, они также представляют захватывающие возможности для улучшения здоровья человека и персонализированной медицины через генетические исследования. Расшифровка геномов различных организмов также предоставляет представление о эволюции.