Исследователи из UC San Diego представляют EUGENe простое в использовании программное обеспечение для глубокого обучения в геномике.

Ученые из Университета Калифорнии в Сан-Диего представляют EUGENe - простое в использовании программное обеспечение для глубокого обучения в области геномики.

Глубокое обучение применяется во всех сферах жизни. Оно имеет свое применение в каждой области. Оно оказывает большое влияние на биомедицинские исследования. Это похоже на умный компьютер, который может становиться лучше в выполнении задач с небольшой помощью. Оно изменило способ, которым ученые изучают медицину и болезни.

Оно оказывает влияние на геномику, область биологии, которая исследует организацию ДНК в гены и процессы, при которых эти гены активируются или деактивируются внутри отдельных клеток.

Исследователи из Университета Калифорнии в Сан-Диего разработали новую платформу для глубокого обучения, которую можно быстро и легко адаптировать под различные геномные проекты. Ханна Картер, доктор философии, доцент в Кафедре медицины Университета Калифорнии в Сан-Диего, сказала, что каждая клетка имеет одинаковую ДНК, но то, как проявляется ДНК, изменяет то, как выглядят и функционируют клетки.

EUGENe использует модули и подпакеты для облегчения основных функций в рамках глубокого обучения геномики. Эти функции включают в себя (1) извлечение, преобразование и загрузку данных последовательности из различных форматов файлов; (2) создание, инициализация и обучение различных архитектур моделей; и (3) оценка и интерпретация поведения модели.

Несмотря на то, что глубокое обучение имеет потенциал для предоставления ценных исследований различных биологических процессов, регулирующих генетическое разнообразие, его внедрение представляет вызов для исследователей, нуждающихся в более широких знаниях в области компьютерных наук. Исследователи говорят, что их целью было разработать платформу, которая позволяет исследователям в области геномики оптимизировать анализ данных глубокого обучения, облегчая извлечение прогнозов из исходных данных с большей легкостью и эффективностью.

Несмотря на то, что всего около 2% от общего генома составляют гены, кодирующие специфические белки, оставшиеся 98%, часто называемые мусорной ДНК из-за предполагаемого отсутствия известных функций, играют решающую роль в определении времени, местоположения и способа активации определенных генов. Понимание роли этих не-кодирующих участков генома является высшим приоритетом для исследователей геномики. Глубокое обучение доказало свою эффективность как мощный инструмент для достижения этой цели, хотя его эффективное использование может быть сложным.

Адам Кли, студент докторской программы в лаборатории Картер и первый автор исследования, сказал, что многие существующие платформы требуют множества часов кодирования и обработки данных. Он отметил, что многочисленные проекты требуют, чтобы исследователи начали свою работу с нуля, требуя компетентности, которые могут не быть доступными для всех лабораторий, заинтересованных в этой области.

Для оценки эффективности платформы EUGENe исследователи протестировали ее, пытаясь повторить результаты трех предыдущих исследований геномики, которые использовали различные типы данных секвенирования. Ранее анализ таких разнообразных наборов данных требовал интеграции нескольких различных технологических платформ.

EUGENe продемонстрировал замечательную гибкость, успешно повторяя результаты каждого исследования. Эта гибкость подчеркивает способность платформы управлять широким спектром данных секвенирования и ее потенциал как адаптируемого инструмента для геномных исследований.

EUGENe показывает адаптированность к различным типам данных секвенирования ДНК и поддержку различных моделей глубокого обучения. Исследователи планируют расширить ее функциональность, чтобы охватить большее количество типов данных, включая данные секвенирования единичных клеток, и планируют сделать Eugene доступным для исследовательских групп по всему миру.

Картер выразил энтузиазм по поводу потенциала этого проекта для сотрудничества. Он сказал, что одной из интересных вещей в этом проекте является то, что чем больше людей использует платформу, тем лучше ее можно сделать со временем, что будет важно, так как глубокое обучение продолжает стремительно развиваться.