DeepMind의 AlphaFold에서 단백질 흡수 확인
뉴욕 – 2018년 도입된 DeepMind의 AlphaFold 프로그램은 생물학 연구의 핵심 도구가 되었으며, 이를 통해 과학자들은 아미노산 서열을 기반으로 단백질 구조를 높은 정확도로 예측할 수 있습니다.
최근에 연구자들은 단백질-단백질 상호작용(PPI) 작업에 AlphaFold와 그 최신 버전인 AlphaFold2를 사용하여 단백질 상호작용을 예측 및 검증하고 구조 모델을 생성하는 유틸리티를 탐색하기 시작했습니다.
이러한 노력은 필요한 집중적인 컴퓨팅 리소스로 인해 여전히 제한되어 있지만, 연구에 따르면 AI 기반 접근 방식은 대규모 PPI 연구에 유용할 수 있으며 질량 분석법 및 효모 2-하이브리드 시스템과 같은 기존 도구를 보완할 수 있습니다.
에딘버러 대학 단백질체학 교수이자 베를린 공과대학 생물분석학 교수인 Juri Rappsilber는 "매우 흥미로운 공간입니다."라고 말했습니다. 지난 4월 그와 동료들은 바실러스 서브틸리스(Bacillus subtilis)의 PPI를 예측하고 검증하기 위해 PPI 연구용 AlphaFold2의 확장인 AlphaFold-Multimer 소프트웨어와 가교 질량 분석법 및 공동 분별 질량 분석기를 결합한 연구를 분자 시스템 생물학(Molecular Systems Biology)에 발표했습니다. .
Rappsilber는 연구자들이 면역 풀다운 질량 분석 실험에서와 마찬가지로 특정 관심 단백질에 대해 후보 단백질 상호작용자를 선별하기 위해 소프트웨어를 사용하는 "알파 풀다운"이라고 부르는 일반적인 용도 중 하나로 언급했습니다.
Rappsilber는 "그들은 관심 있는 단백질을 가지고 있고, 그 단백질과 상호작용할 수 있다고 생각하는 수많은 후보 단백질을 갖고 있으며, 관심 있는 단백질에 대해 하나씩 던지기만 하면 됩니다"라고 Rappsilber는 말했습니다.
그는 "알파폴드가 긍정적이라면 두 사람이 상호작용할 가능성이 매우 높다"고 말했다. "따라서 10명, 20명, 50명의 후보자가 소수의 후보자로 줄어들고, 후속 조치를 취하는 것이 더 그럴듯합니다."
Rappsilber는 중요한 것은 PPI를 검증하는 다른 접근 방식과 달리 연구자들이 상호 작용 구조 모델을 사용하여 이러한 실험을 수행한다고 덧붙였습니다.
"그리고 이는 실험으로서 다음에 무엇을 해야 하는지에 대한 매우 명확한 지침입니다."라고 그는 말했습니다. 이러한 구조적 정보를 통해 연구자들은 상호 작용을 방해하고 생물학적 효과를 조사할 수 있도록 상호 작용 부위에서 점 돌연변이를 설계할 수 있다고 지적했습니다.
"가장 큰 한계는 계산 능력입니다."라고 Martin-Luther University of Halle-Wittenberg의 극저온 EM 조교수이자 그리스 국립 그리스 연구 재단의 극저온 EM ERA 의장인 Panagiotis Kastritis는 PPI 작업에 AlphaFold를 사용하는 것에 대해 말했습니다. "이러한 계산의 대부분은 연구소 규모의 컴퓨터에서 수행되었습니다."
그러나 Kastritis는 컴퓨팅 성능이 지속적으로 저렴해지고 접근성이 높아짐에 따라 향후 5~10년 동안 이것이 덜 어려운 문제가 될 것이라고 지적했습니다.
그는 또한 특정 컴퓨팅 전략이 대규모 PPI 작업에 AlphaFold를 사용하는 데 필요한 컴퓨팅 성능을 줄일 수 있다고 제안했습니다. 예를 들어 AlphaFold2는 단백질의 아미노산 서열을 취하고 이를 다른 단백질 서열 데이터베이스와 비교하여 모델을 구성하는 데 사용하는 유사한 서열을 식별함으로써 생성되는 다중 서열 정렬을 사용하여 단백질 구조를 예측한다고 말했습니다. Kastritis는 이러한 MSA가 점점 더 많이 식별됨에 따라 이를 식별하기 위해 시퀀스 데이터베이스를 다시 검색할 필요 없이 소프트웨어가 직접 액세스할 수 있는 방식으로 저장할 수 있다고 말했습니다.
"우리가 [MSA]를 미리 결정하고 미리 계산했다면 물론 더 빠르고 쉬울 것입니다."라고 그는 말했습니다.
지난 4월, Microsoft와 베를린 자유 대학의 연구원들은 AlphaFold2의 PPI 예측 속도를 높이기 위해 Kastritis가 제안한 것과 유사한 접근 방식을 포함하여 여러 가지 계산 접근 방식을 사용하는 BioRxiv 사전 인쇄본을 발표했습니다. 저자에 따르면, 1,000개 단백질의 쌍별 상호작용을 예측하는 접근 방식을 적용했을 때 필요한 디스크 공간은 4,460배 줄이면서 예측에 필요한 시간이 40배 단축되었습니다.