Новостная лента

Одна из самых больших тайн биологии решена ИИ

Ученые разработали новую систему искусственного интеллекта DeepMind AlphaFold, способную предсказывать трехмерную структуру белка. Проблема фолдинга (сворачивания) белков была признана биологами всего мира как одна из величайших проблем современной науки, и над ее решением исследователи бились около полувека. О научном прорыве сообщается на сайте DeepMind.



Результаты оценки Critical Assessment of protein Structure Prediction (CASP), проводимая научным сообществом с 1994 года, показали, что AlphaFold обеспечивает беспрецедентную точность в прогнозировании структуры белка. Участники испытаний CASP должны представить систему, способную предсказать, как свернется белок, по последовательности аминокислот, каждая из которых обладает определенными химическими свойствами (например, полярности и гидрофобности). При этом результат прогноза сравнивается с трехмерной структурой, выявленной экспериментальным путем.
Для тестирования используются только те белки, чье сворачивание было изучено лишь недавно, а в некоторых случаях еще не изучено. В последнем варианте нужно ждать, пока трехмерная структура не будет получена для сравнения.
Средняя оценка для AlphaFold составила 92,4 по метрике Global Distance Test (GDT). При этом оценка 90 GDT считается конкурентоспособной среди результатов, полученных экспериментально. Это значит, что искусственный интеллект способен во многих случаях просчитывать трехмерную структуру белков точнее, чем с использованием ряда лабораторных методов.
Трехмерная структура белков тесно связана с их функциями. Однако для каждой аминокислотной последовательности теоретически существует астрономическое число способов сворачивания, но только несколько могут реализовываться и играть важную роль для организма.
Что такое белки?
Белки присутствуют во всех живых вещах, где они играют центральную роль в химических процессах, необходимых для жизни.
Состоит из строк аминокислот, они складываются в бесконечное количество способов в сложные формы, которые держат ключ к тому, как они выполняют свои жизненно важные функции.
Многие заболевания связаны с ролью белков в катализимных химических реакциях (ферментах), борьбе с болезнями (антителами) или в качестве химических посыльных (гормонов, таких как инсулин).
"Даже крошечные перестановки этих жизненно важных молекул может иметь катастрофические последствия для нашего здоровья, так что один из наиболее эффективных способов понять болезнь и найти новые методы лечения является изучение белков участие", сказал д-р Джон Молт из Университета штата Мэриленд, США, председатель группы научных судей.
"Есть десятки тысяч человеческих белков и многие миллиарды других видов, в том числе бактерий и вирусов, но разработки формы только один требует дорогостоящего оборудования и может занять годы".
Как работает задача?
В 1972 году Кристиан Анфинсен был удостоен Нобелевской премии за свою работу, показывающую, что должна быть возможность определить форму белков на основе последовательности их аминокислотных строительных блоков.
Каждые два года десятки команд из более чем 20 стран слепо пытаются предсказать с помощью компьютеров форму набора из примерно 100 белков только из аминокислотных последовательностей.
В то же время 3-D структуры выработаны в лаборатории биологами с использованием традиционных методов, таких как рентгеновская кристаллография и ЯМР-спектроскопия, которые определяют расположение каждого атома относительно друг друга в молекуле белка.
Затем группа ученых из Casp (Эксперимент сообщества по критической оценке методов прогнозирования структуры белка) сравнивает эти прогнозы с 3-D структурами, решенными с помощью экспериментальных методов.
Casp использует метрику, известную как глобальный тест расстояния для оценки точности, начиная от 0-100. Оценка около 90, которую достигла программа AlphaFold Компании DeepMind, считается сопоставимой с лабораторными методами.
Что случилось в этом году?
В последнем раунде испытания, Casp-14, AlphaFold определил форму около двух третей белков с точностью, сопоставимой с лабораторными экспериментами.
Оценщики сказали точность с большинством других белков также высока, хотя и не совсем на этом уровне.
AlphaFold основан на концепции, называемой глубоким обучением. В этом процессе структура сложенного белка представлена как пространственный график.
Затем программа «учится», используя информацию о 3-D формах известных белков, содержится в всемирной базе данных.
Программа ИИ была в состоянии сделать в течение нескольких дней, что может занять годы в лаборатории скамейке.
DeepMind является компанией и исследовательской лабораторией, наиболее известной сложными играми ИИ со сверхчеловеческими навыками. Он был приобретен Google в 2014 году.
Как будет использоваться эта информация?
Знание 3-D структуры белка имеет важное значение в разработке лекарств и в понимании заболеваний человека, включая рак, слабоумие и инфекционные заболевания.

Одним из примеров является Covid-19, где ученые изучали, как белок шипа на поверхности вируса Sars-CoV-2 взаимодействует с рецепторами в клетках человека.
Профессор Эндрю Мартин (Andrew Martin) из Университетского колледжа Лондона (UCL), бывший абитуриент и оценщик Casp, сказал BBC News: «Понимание того, как белковая последовательность складывается в три измерения, на самом деле является одним из фундаментальных вопросов биологии.
"Весь способ, в котором функции белка зависит от его трехмерной структуры и белковой функции имеет отношение к всему в области здравоохранения и болезней.
"Зная трехмерные структуры белков, мы можем помочь в разработке лекарств и вмешаться с проблемами со здоровьем, будь то инфекции или наследственные заболевания".
Как белки складываются, чтобы создать "изысканно уникальные трехмерные структуры" является одной из самых больших тайн биологии, говорит профессор Дама Джанет Торнтон из Европейского института биоинформатики EMBL в Хинкстоне, Великобритания.
«Лучшее понимание белковых структур и способность предсказывать их с помощью компьютера означает лучшее понимание жизни, эволюции и, конечно же, здоровья человека и болезней», – пояснила она.


Материал предоставил М.В. Лебедев

https://www.bbc.com/news/science-environment-55133972