CWN(CHANGE WITH NEWS) - 메타, 제2의 알파폴드 ′ESM폴드′ 공개...AI로 단백질 형태 6억 가지 예측

  • 구름많음태백10.0℃
  • 구름많음정선군11.9℃
  • 구름조금고흥14.8℃
  • 맑음해남15.6℃
  • 구름많음북부산15.2℃
  • 구름많음홍천9.5℃
  • 맑음강진군15.0℃
  • 구름조금광양시14.7℃
  • 맑음완도15.4℃
  • 구름많음강릉15.4℃
  • 구름조금금산13.1℃
  • 구름조금거창11.9℃
  • 구름많음의성12.1℃
  • 구름조금제천9.9℃
  • 흐림서산13.1℃
  • 구름많음밀양11.4℃
  • 흐림강화13.1℃
  • 맑음순천13.9℃
  • 맑음고산16.5℃
  • 맑음장흥15.5℃
  • 구름조금추풍령12.5℃
  • 구름많음경주시14.5℃
  • 구름조금창원14.6℃
  • 연무백령도14.2℃
  • 맑음진도군14.7℃
  • 구름많음포항14.3℃
  • 구름많음청송군12.1℃
  • 구름조금이천12.3℃
  • 구름많음영덕14.8℃
  • 구름많음고창14.8℃
  • 맑음진주13.1℃
  • 구름많음부안14.0℃
  • 구름많음울산15.9℃
  • 구름많음수원13.7℃
  • 구름많음울진16.1℃
  • 구름많음정읍14.7℃
  • 구름많음울릉도14.9℃
  • 구름조금북창원14.5℃
  • 구름많음안동11.3℃
  • 구름조금양산시14.7℃
  • 구름많음전주14.2℃
  • 구름조금영주11.0℃
  • 구름많음청주12.5℃
  • 구름많음고창군14.5℃
  • 구름조금봉화11.6℃
  • 구름조금통영15.1℃
  • 구름많음영광군14.5℃
  • 흐림부여10.9℃
  • 구름많음홍성14.3℃
  • 구름많음천안12.6℃
  • 구름조금거제13.9℃
  • 구름조금산청11.2℃
  • 맑음성산18.0℃
  • 구름조금영월10.7℃
  • 흐림파주11.6℃
  • 맑음임실12.3℃
  • 구름많음흑산도17.2℃
  • 흐림인제10.1℃
  • 구름조금함양군12.8℃
  • 구름많음원주11.5℃
  • 흐림춘천7.2℃
  • 구름많음보령15.1℃
  • 구름많음대구12.4℃
  • 구름조금김해시15.0℃
  • 구름많음대전13.2℃
  • 구름많음세종12.3℃
  • 구름많음군산14.1℃
  • 구름많음대관령7.5℃
  • 맑음남원11.7℃
  • 맑음보성군14.0℃
  • 구름조금상주14.3℃
  • 맑음제주17.1℃
  • 구름많음충주12.0℃
  • 흐림서울12.6℃
  • 구름조금합천13.7℃
  • 구름조금부산15.5℃
  • 구름조금여수13.2℃
  • 흐림인천13.1℃
  • 흐림속초14.2℃
  • 맑음목포15.2℃
  • 구름조금보은11.0℃
  • 흐림철원11.5℃
  • 구름조금남해11.9℃
  • 맑음의령군11.8℃
  • 구름많음서청주11.5℃
  • 맑음서귀포18.1℃
  • 구름조금광주13.7℃
  • 맑음장수12.3℃
  • 맑음순창군11.5℃
  • 흐림동두천12.1℃
  • 구름많음영천12.4℃
  • 구름조금구미11.5℃
  • 흐림북강릉14.9℃
  • 구름조금문경13.8℃
  • 흐림북춘천6.9℃
  • 구름많음동해15.4℃
  • 구름많음양평10.9℃
  • 2025.11.23 (일)

메타, 제2의 알파폴드 'ESM폴드' 공개...AI로 단백질 형태 6억 가지 예측

박채원 / 기사승인 : 2022-11-03 18:06:20
  • -
  • +
  • 인쇄

2020년, 런던 스타트업 딥마인드(DeepMind)가 단백질 구조를 예측하는 인공지능(AI) 프로그램 알파폴드(AlphaFold)를 개발했다. 알파폴드는 공개와 동시에 생물학계 난제를 풀 것이라는 기대를 한 몸에 받았다. 최근, 메타가 알파폴드와 같은 AI 단백질 예측 구조 프로그램인 ‘ESM폴드(ESMFold)’를 선보였다.

해외 과학 전문 매체 네이처는 알렉산더 라이브스(Alexander Rives) 메타AI 단백질팀 연구 국장을 인용, 메타 연구팀은 각각 문자로 표현할 수 있는 아미노산 사슬 20종으로 표현할 수 있는 단백질 시퀀스를 알고리즘에 주입했다고 설명했다. 이후 알고리즘의 네트워크는 아미노산의 일부가 가려진 단백질 자동 완성 방법을 학습했다.

라이브스 국장은 단백질 형태 정보를 보유한 단백질 시퀀스를 사용한 뒤 이미 알려진 단백질 구조와 시퀀스 간의 관계 심층 분석 정보를 이용하여 단백질 시퀀스로 예측할 수 있는 구조를 생성하도록 훈련했다.

이후 연구팀은 토양과 해수, 인간의 내장, 피부 및 기타 미생물 서식지를 포함한 환경 원천에서 대량 배열된 유전자학 DNA 데이터베이스에 ESM폴드를 적용해보았다. 이 과정에서 단 2주간 총 6억 1,700만 개 이상의 단백질 구조를 예측했다.

ESM폴드의 단백질 구조 예측 속도는 알파폴드보다 60배 더 빠르다. 그러나 ESM폴드는 아직 알파폴드보다 정확도가 낮은 편이다.

다만, ESM폴드가 예측한 단백질 구조 중 1/3 이상은 질적으로 완성도가 높아, 전체적인 단백질 모양이 정확하다는 확신을 가질 수 있었다. 간혹 더 미세한 원자 수준의 세부 사항을 구별할 수도 있었다.

하버드대학교 진화생물학자인 세르게이 오브친니코프(Sergey Ovchinnikov) 박사는 ESM폴드가 낮은 신뢰도를 기반으로 한 단백질 구조 수억 개를 예측한 방법을 궁금해한다. 오브친니코프 박사는 일부는 적어도 분리된 정의된 구조가 없을 수 있는 반면, 다른 일부는 단백질 코딩 물질로 잘못 알려진 비코딩 DNA일 수 있다고 언급했다.

반면, 독일 뮌헨공과대학교 컴퓨터 생물학자인 버크하드 로스트(Burkhard Rost)는 ESM폴드의 단백질 예측 구조 생성 속도가 빠르다는 점에 감탄했다. 다만, 균유전체학 데이터베이스 사용 시 알파폴드의 예측 결과보다 더 우수하다고 평가할 수 있을지는 더 지켜봐야 한다고 덧붙였다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue