PNAS: фолдинг белков предсказали на суперкомпьютерах при помощи ИИ
Ученые Научно-исследовательского центра по развитию суперкомпьютерных технологий (NCSA) представили новый метод пророчества трехмерной структуры белков при помощи искусственного ума (ИИ) и суперкомпьютеров. Итоги исследования размещены в журнальчике Proceedings of the Национальный Academy of Sciences (PNAS).
Белки делают широкий диапазон био функций, которые зависят от их трехмерных структур, возникающих при сворачивании аминокислотных цепочек. Беда фолдинга (сворачивания) белков была признана биологами как одна из величайших заморочек современной науки, так как до сего времени было нелегко пророчить, в какую структуру свернется определенная аминокислотная последовательность.
Обыкновенными способами исследования структуры белочка являются рентгеновская кристаллография, которая позволяет найти атомную и молекулярную структуру кристалла, и криоэлектронная микроскопия, включающая секундное охлаждение молекул в водянистом азоте и бомбардировку их электронами для получения изображений. Но методы AlphaFold на базе ИИ позволяют точно и мгновенно пророчить структуру по аминокислотным последовательностям.
Новенькая вычислительная устройство APACE упрощает применение инструмента AlphaFold2 и увеличивает его скорость. Модель также предвещает конформационное многообразие белков, что является ключевым, так как белки могут изменять свою форму при выполнении собственных функций.
APACE затрагивает управление данными, что получается из-за размещения модели и базы данных AlphaFold2 размером 2,6 терабайта на суперкомпьютере, откуда нейронные сети могут не трудно получать доступ к данным. Другие улучшения включают оптимизацию центральных и графических микропроцессоров для распараллеливания шагов пророчества структуры белочка, требующих насыщенного использования GPU.
Для тестирования APACE команда использовала 300 графических микропроцессоров NVIDIA A100 суперкомпьютера Delta в NCSA. Они нашли, что APACE на 2-ва порядка резвее стандартных реализаций AlphaFold2, что сильно ускоряет пророчество структуры белков. Данный инструмент можно применять совместно с механизированными лабораториями для автоматизации и ускорения научных открытий. Работа также была эффективно воспроизведена на суперкомпьютере Polaris в Argonne Leadership Computing Facility.