
캐나다 워털루대학교 연구팀이 아프리카 언어 구사 능력을 지닌 언어 모델인 아프리버타(AfriBERTa)를 개발했다. 그동안 아프리카 토착 언어나 세계 각지의 소수 민족 언어는 데이터가 부족해, 언어 모델 개발 프로젝트가 진행된 사례가 매우 드물었다. 워털루대학교 연구팀도 언어 데이터가 부족한 상태에서 언어 모델 훈련 과정을 거쳐, 아프리버타가 현재 암하라어와 스와힐리어 등 아프리카 언어 11개를 유창하게 구사할 수 있도록 제작했다. 언어 데이터가 부족한 상태에서 유창한 언아 구사력을 갖춘 언어 모델을 제작할 수 있었던 비결은 무엇일까?
[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]