Познакомьтесь с PepCNN инструментом глубокого обучения для прогнозирования связывающих аминокислот в белках с использованием последовательностей, структурных и языковых моделей

Поздравляем с введением PepCNN инструмента глубокого обучения для точного прогнозирования связывающих аминокислот в белках с использованием последовательностей, структурных и языковых моделей

PepCNN – это модель глубокого обучения, разработанная исследователями из Университета Гриффита, Центра интегративных медицинских наук RIKEN, Рутгерского университета и Токийского университета. Она решает проблему прогнозирования остатков связывания белок-пептид. В сравнении с другими методами, PepCNN превосходит их по специфичности, точности и метрикам площади под ROC-кривой, объединяя структурную и последовательностную информацию, что делает его ценным инструментом для понимания взаимодействий белок-пептид и продвижения исследований в области поиска лекарств.

Понимание взаимодействий белок-пептид является важным для клеточных процессов и механизмов заболевания, таких как рак, что требует использования вычислительных методов, так как экспериментальные подходы требуют значительных ресурсов. Вычислительные модели, разделенные на структуру и последовательность, предлагают альтернативы. Используя признаки от предварительно обученных языковых моделей белка и экспозиционные данные, PepCNN превосходит предыдущие методы, подчеркивая значимость его набора признаков для повышения точности прогнозирования взаимодействий белок-пептид.

Существует необходимость в вычислительных подходах для более глубокого понимания взаимодействий белок-пептид и их роли в клеточных процессах и механизмах заболевания. В то время как разработаны модели, основанные на структуре и последовательности, точность остается проблемой из-за сложности взаимодействий. PepCNN, новая модель глубокого обучения, предлагает решение этой проблемы путем интеграции структурной и последовательностной информации для прогнозирования остатков связывания пептида. Обладая превосходной производительностью по сравнению с существующими методами, PepCNN обещает стать полезным инструментом для поддержки исследовательских усилий в области поиска лекарств и развития понимания взаимодействий белок-пептид.

PepCNN использует инновационные техники, такие как полусферическая экспозиция, позиционно-специфические матрицы оценки и встраивание из предварительно обученной языковой модели белка, чтобы достичь превосходных результатов по сравнению с девятью существующими методами, включая PepBCL. Его впечатляющая специфичность и точность выделяются, и его производительность превосходит другие последние достижения. Эти прогрессивные изменения подчеркивают эффективность предложенного метода.

Модель глубокого обучения для прогнозирования PepCNN превзошла различные методы, включая PepBCL, с более высокой специфичностью, точностью и метриками площади под ROC-кривой. После оценки на двух наборах тестов, PepCNN продемонстрировала значительные улучшения, особенно в метрике площади под ROC-кривой. Результаты показали, что чувствительность составила 0,254, специфичность – 0,988, точность – 0,55, MCC – 0,350, а метрика площади под ROC-кривой – 0,843 на первом тестовом наборе. Будущие исследования направлены на интеграцию технологии DeepInsight для облегчения применения архитектур 2D сверточных нейронных сетей и техник обучения передачи для дальнейшего развития.

В заключение, передовая модель глубокого обучения для прогнозирования PepCNN, сочетающая структурную и последовательностную информацию из первичных последовательностей белка, превосходит существующие методы в специфичности, точности и метриках площади под ROC-кривой, как было показано в тестах на наборах данных TE125 и TE639. Дальнейшие исследования направлены на улучшение ее производительности путем интеграции технологии DeepInsight, позволяющей применять архитектуры 2D сверточных нейронных сетей и техники обучения передачи.