딥마인드, 인간보다 더 우수한 수익 분배 능력 선보인 머신러닝 시스템 개발

딥마인드, 인간보다 더 우수한 수익 분배 능력 선보인 머신러닝 시스템 개발: 최은희 / 기사승인 : 2022-07-07 15:05:08

인공지능(AI)을 이용한 분배 방식이 인간의 기존 부의 분배 방식보다 더 큰 인기를 얻을 가능성이 제기됐다.

해외 과학기술 뉴스 포럼 사이언스앨러트에 따르면, 딥마인드(DeepMind) 연구팀이 공정성 인식과 사회 번성 등 사회적 목표 달성을 도울 머신러닝 시스템을 선보였다.

연구팀의 머신러닝 개발 과정에는 인간이 실제로 원하는 바와 같이 이익이 될 정보를 제공하기 위한 가치 정렬(value alignment)이 주요 장벽이 되었다. 연구팀은 가치 정렬 문제를 해결하고자 인간의 상호작용을 훈련 데이터에 적용한 부의 분배 에이전트인 ‘디모크러틱 AI(Democratic AI)’를 별도로 개발했다.

연구팀은 디모크러틱 AI로 공공재 게임이라는 투자 실천을 연구했다. 해당 게임은 플레이어가 다양한 양의 자산을 받고, 공공 펀드로 자본을 투자한 뒤 투자 수준에 따라 수익을 얻도록 한다. 연구팀은 디모크럭틱 AI가 게임 속에서 투자 후 수익을 분배할 때 엄격한 평등주의와 자유주의, 자유적 평등주의라는 기존의 세 가지 부의 분배 패러다임을 적용했다. 이때, 세 가지 분배 방식 모두 플레이어에게 제공한 수익 수준이 달랐다.

이어서 연구팀은 심층 강화학습으로 개발돼, 인간과 가상 에이전트의 피드백 데이터를 활용하는 ‘인간 중심 재분배 메커니즘(HCRM)’으로 수익을 분배했다.

이후 연구팀은 대다수 플레이어가 기존 수익 분배 방식보다 HCRM 기반 수익 분배 방식을 더 선호한다는 사실을 확인했다.

연구팀은 “AI가 초기 부의 불균형을 해소하고 수익 분배 과정에서 아무 노력도 하지 않고 이익을 얻으려는 이들을 제재하며, 다수의 지지를 받는 메커니즘 발견에 성공했다”라고 말했다.

다만, 연구팀은 이번 수익 분배 시스템이 극복해야 할 문제가 존재한다는 사실을 인정했다. 주로 가치 정렬이 민주적인 결정을 중심으로 구성돼, 실제 사회의 불평등이나 편견을 악화할 수 있다는 점이다. 이는 다수의 결정 과정에서 사회적 불평등이나 편견이 있다면, AI가 문제를 그대로 학습할 수 있다는 의미이기도 하다.

또한, 연구팀은 “이번 연구 결과를 사회의 자산 분배 방식을 번복하기 위한 급진적 기술관료주의 목적으로 활용해서는 안 된다”라며, “현재 인간이 가지고 있는 방식보다 더 나은 해결책을 고안하도록 도울 연구 도구”라고 설명했다.