모든 생물학적 과정의 중심이되는 단백질에 대해, 각 단백질은 고유의 입체 구조를 가지고있다는 것은 판명되어있는데, "각 단백질이 실제로 어떤 입체 구조를 가지고 있는가"에 관한 연구는 50년 동안 큰 진전이 없다.
각 단백질이 가진 입체 구조에 이르기까지의 "폴딩"이라는 과정을 조사하는 연구가 얼마나 어려운 것인지를, 실제로 폴딩 연구를하고 있던 제이슨 크로포드 씨가 설명해주고있다.
단백질은 21 종류의 아미노산이 다수 결합한 거대한 분자의 총칭으로, 각각의 단백질을 구성하는 아미노산의 수와 종류, 결합 순서는 DNA의 염기 서열에 의해 결정된다. 모든 단백질은 쇄상(쇠고리를 길게 이어 놓은 모양)이라고하는 직선적인 형태를 하고 있지만, 실제로는 각 단백질은 직선적 인 형상이 아니라, 입체적인 형상으로 몰려있어 안정화하고있다.
각각의 단백질을 쇄상으로 생각한다면 "일차 구조"라고 부르고, 입체적인 형상으로 생각한다면 "이차 구조"라고한다. 단백질의 이차 구조의 대표적인 예가 다음 β 시트(왼쪽)와 α나선 (오른쪽 그림)이라는 구조로, β 시트는 하나의 단백질이 평면으로 접혀 안정된 상태이고, α나선은 나선형으로 안정된 상태를 말한다.
이차 구조의 단백질이 모여 안정된 상태가 "삼차 구조"라고한다. 삼차 구조의 예가 아래, Colwellia psychrerythraea라고하는 박테리아의 효소의 삼차 구조이다.
삼차 구조는 복수의 단백질이 얽힌것만의 구조로 보이지만, 실제로는 각 단백질의 삼차 구조는 1가지 밖에 없다. 각 단백질은 삼차 구조에 따른 특성을 가지고 있기 때문에, 삼차 구조를 검토하는 것이 중요하게 되지만, 현재의 삼차 구조의 조사 방법은 고액이며 시간이 걸릴뿐만 아니라, 일부의 단백질에만 적용 가능하고, 이미 1억 8000만개나 발견되고 있다는 단백질 모두를 조사한다는 것은 불가능하다.
따라서, 각 단백질이 어떻게 폴딩을 할것인가라는 "폴딩 문제"를 해명하고, 일차 구조에서 삼차 구조를 추정하는 방법이 요구되고있다.
폴딩 문제를 해결하기 위해 사용되는 것이, 컴퓨터 시뮬레이션이다. 시뮬레이터에 각 단백질에 포함 된 원자의 위치, 전하, 화학 결합 등을 고려한 모델을 입력하고, 각각의 가속도와 속도를 산정시킴으로써 삼차 구조가 추정 가능, 이러한 학문 분야는 "분자 동력 대학법"으로 최근 활발해지고 있다고한다.
그러나 시뮬레이터로 삼차 구조를 추정하는 방법은 "계산기의 파워가 필요하다"라는 문제가있다. 대부분의 단백질은 수천 개의 원자로 구성되어있는데다 주변의 물 분자와 상호 작용한다. 그러므로 일반적인 삼차 구조 하나에 관련된 원자는 약 3만개, 그 상호 관계는 4억 5000만개에 달한다는 것.
모든 원자를 시뮬레이션하는 대신 가능한 구조 후보 중에서 가장 안정 구조를 에너지 지형으로 산정하는 대체 방법도 고안되어 있다고하지만, 구조 후보는 10,300개에 달하는 것으로 보이며, 모든 패턴을 계산하기 전에 우주의 수명이 다 해버리는 것으로 알려져있다. 그만큼 시간이 많이 소모된다는...
이러한 계산에 도움이 되는것이 슈퍼 컴퓨터 및 분산 컴퓨팅이다. 전세계 가정에있는 PC의 연산 능력을 합산하여 폴딩 문제를 해명하는 프로젝트 "Folding@home"은 세계 TOP500 슈퍼 컴퓨터를 합산 한 성능에 달해, 2020년 이후의 신종 코로나 바이러스의 대유행 이후 신종 코로나 바이러스의 내부에있는 단백질의 분석도 실시...
이렇게 진행되고 있었던 폴딩 문제였지만, 2020년 12월 1일, Google 산하의 인공 지능 기업 인 DeepMind가 기계 학습을 이용하여 단백질의 삼차 구조를 비약적인 속도와 높은 정확도로 예측할 수있는 "AlphaFold"라는 시스템을 발표했다.
AlphaFold는 복수의 신경망에 의해 각 단백질에 관련된 다양한 기능을 학습하고, 삼차 구조의 단백질에 포함 된 아미노산의 최종 거리를 예측할 수 있는 함수를 도출하는 것. AlphaFold에 의한 구조 예측은 다른 컴퓨터 프로그램을 웃돌고 있을뿐 아니라 기존의 기법 이상의 정확도를 달성하고 있는것으로 확인되고 있다.
DeepMind는 발표문에서 "폴딩 문제를 해결했다"고 주장하고 있으며, 크로포드 씨는 "DeepMind의 주장은 너무 단순하다고 생각되지만, 어쨌든 획기적인 발전이다"라고 코멘트.