Познакомьтесь с PepCNN инструментом глубокого обучения для прогнозирования связывающих аминокислот в белках с использованием последовательностей, структурных и языковых моделей
Поздравляем с введением PepCNN инструмента глубокого обучения для точного прогнозирования связывающих аминокислот в белках с использованием последовательностей, структурных и языковых моделей
PepCNN – это модель глубокого обучения, разработанная исследователями из Университета Гриффита, Центра интегративных медицинских наук RIKEN, Рутгерского университета и Токийского университета. Она решает проблему прогнозирования остатков связывания белок-пептид. В сравнении с другими методами, PepCNN превосходит их по специфичности, точности и метрикам площади под ROC-кривой, объединяя структурную и последовательностную информацию, что делает его ценным инструментом для понимания взаимодействий белок-пептид и продвижения исследований в области поиска лекарств.
Понимание взаимодействий белок-пептид является важным для клеточных процессов и механизмов заболевания, таких как рак, что требует использования вычислительных методов, так как экспериментальные подходы требуют значительных ресурсов. Вычислительные модели, разделенные на структуру и последовательность, предлагают альтернативы. Используя признаки от предварительно обученных языковых моделей белка и экспозиционные данные, PepCNN превосходит предыдущие методы, подчеркивая значимость его набора признаков для повышения точности прогнозирования взаимодействий белок-пептид.
Существует необходимость в вычислительных подходах для более глубокого понимания взаимодействий белок-пептид и их роли в клеточных процессах и механизмах заболевания. В то время как разработаны модели, основанные на структуре и последовательности, точность остается проблемой из-за сложности взаимодействий. PepCNN, новая модель глубокого обучения, предлагает решение этой проблемы путем интеграции структурной и последовательностной информации для прогнозирования остатков связывания пептида. Обладая превосходной производительностью по сравнению с существующими методами, PepCNN обещает стать полезным инструментом для поддержки исследовательских усилий в области поиска лекарств и развития понимания взаимодействий белок-пептид.
- Познакомьтесь с Meditron набором открытых медицинских моделей больших языков (LLMs) на основе LLaMA-2.
- Эта научная статья ИИ от университета Норт-Истерн и MIT предлагает метод интерпретируемых регуляторов концептов для улучшенного управления генерацией изображений в моделях диффузии.
- Google DeepMind представляет GNoME новый инструмент глубокого обучения, который драматически увеличивает скорость и эффективность открытий, предсказывая стабильность новых материалов.
PepCNN использует инновационные техники, такие как полусферическая экспозиция, позиционно-специфические матрицы оценки и встраивание из предварительно обученной языковой модели белка, чтобы достичь превосходных результатов по сравнению с девятью существующими методами, включая PepBCL. Его впечатляющая специфичность и точность выделяются, и его производительность превосходит другие последние достижения. Эти прогрессивные изменения подчеркивают эффективность предложенного метода.
Модель глубокого обучения для прогнозирования PepCNN превзошла различные методы, включая PepBCL, с более высокой специфичностью, точностью и метриками площади под ROC-кривой. После оценки на двух наборах тестов, PepCNN продемонстрировала значительные улучшения, особенно в метрике площади под ROC-кривой. Результаты показали, что чувствительность составила 0,254, специфичность – 0,988, точность – 0,55, MCC – 0,350, а метрика площади под ROC-кривой – 0,843 на первом тестовом наборе. Будущие исследования направлены на интеграцию технологии DeepInsight для облегчения применения архитектур 2D сверточных нейронных сетей и техник обучения передачи для дальнейшего развития.
В заключение, передовая модель глубокого обучения для прогнозирования PepCNN, сочетающая структурную и последовательностную информацию из первичных последовательностей белка, превосходит существующие методы в специфичности, точности и метриках площади под ROC-кривой, как было показано в тестах на наборах данных TE125 и TE639. Дальнейшие исследования направлены на улучшение ее производительности путем интеграции технологии DeepInsight, позволяющей применять архитектуры 2D сверточных нейронных сетей и техники обучения передачи.