CWN(CHANGE WITH NEWS) - 딥마인드, 인간보다 더 우수한 수익 분배 능력 선보인 머신러닝 시스템 개발

  • 구름많음세종1.6℃
  • 흐림태백-2.7℃
  • 구름많음부여2.5℃
  • 흐림파주-3.5℃
  • 흐림청주2.0℃
  • 구름많음북춘천-3.7℃
  • 흐림철원-3.7℃
  • 흐림부안2.3℃
  • 흐림영주-1.4℃
  • 맑음밀양1.0℃
  • 구름조금임실1.1℃
  • 맑음의령군0.1℃
  • 맑음강릉3.1℃
  • 구름많음영광군6.3℃
  • 흐림의성1.0℃
  • 구름많음홍천-1.8℃
  • 흐림충주0.2℃
  • 구름많음고창군5.4℃
  • 흐림천안1.9℃
  • 흐림추풍령2.5℃
  • 맑음영천0.5℃
  • 구름많음광주6.6℃
  • 구름많음홍성1.5℃
  • 맑음장수3.2℃
  • 구름조금성산10.1℃
  • 흐림상주2.7℃
  • 구름많음순창군2.7℃
  • 흐림서울-0.1℃
  • 맑음대구1.9℃
  • 흐림구미1.2℃
  • 흐림동두천-0.9℃
  • 맑음산청1.8℃
  • 흐림안동1.6℃
  • 구름많음고창7.2℃
  • 구름조금통영4.8℃
  • 흐림진주5.3℃
  • 맑음전주4.6℃
  • 맑음장흥3.7℃
  • 맑음북부산2.1℃
  • 맑음울릉도2.7℃
  • 구름많음대전2.6℃
  • 구름많음속초2.2℃
  • 구름조금고흥2.0℃
  • 맑음포항3.0℃
  • 맑음합천3.2℃
  • 맑음순천3.5℃
  • 흐림창원4.6℃
  • 흐림이천-1.0℃
  • 흐림보은2.4℃
  • 구름조금영덕-0.3℃
  • 맑음거창2.3℃
  • 흐림영월-2.2℃
  • 흐림서산1.7℃
  • 구름조금남원1.6℃
  • 구름조금양산시2.6℃
  • 흐림흑산도8.5℃
  • 맑음동해2.4℃
  • 맑음울진2.8℃
  • 맑음거제3.5℃
  • 구름많음광양시6.0℃
  • 구름조금완도2.9℃
  • 구름많음백령도2.0℃
  • 구름조금고산13.5℃
  • 구름많음해남5.2℃
  • 구름조금서귀포13.2℃
  • 맑음울산5.6℃
  • 맑음함양군0.7℃
  • 흐림강화-0.3℃
  • 흐림서청주1.5℃
  • 흐림봉화-6.4℃
  • 흐림문경1.4℃
  • 구름많음남해4.1℃
  • 흐림원주-0.8℃
  • 맑음여수4.6℃
  • 흐림청송군-2.0℃
  • 구름많음춘천-2.6℃
  • 맑음북강릉1.0℃
  • 구름많음목포6.8℃
  • 흐림제천-1.9℃
  • 구름많음군산2.2℃
  • 흐림양평-0.7℃
  • 흐림인제-2.8℃
  • 흐림정선군-4.0℃
  • 구름많음진도군6.3℃
  • 흐림정읍4.0℃
  • 구름조금부산5.8℃
  • 흐림인천0.6℃
  • 맑음보성군2.6℃
  • 흐림수원0.6℃
  • 맑음금산3.2℃
  • 구름많음보령3.9℃
  • 맑음북창원5.6℃
  • 맑음대관령-4.6℃
  • 맑음김해시4.2℃
  • 맑음경주시0.8℃
  • 구름많음강진군3.0℃
  • 맑음제주10.3℃
  • 2026.01.14 (수)

딥마인드, 인간보다 더 우수한 수익 분배 능력 선보인 머신러닝 시스템 개발

최은희 / 기사승인 : 2022-07-07 15:05:08
  • -
  • +
  • 인쇄

인공지능(AI)을 이용한 분배 방식이 인간의 기존 부의 분배 방식보다 더 큰 인기를 얻을 가능성이 제기됐다.

해외 과학기술 뉴스 포럼 사이언스앨러트에 따르면, 딥마인드(DeepMind) 연구팀이 공정성 인식과 사회 번성 등 사회적 목표 달성을 도울 머신러닝 시스템을 선보였다.

연구팀의 머신러닝 개발 과정에는 인간이 실제로 원하는 바와 같이 이익이 될 정보를 제공하기 위한 가치 정렬(value alignment)이 주요 장벽이 되었다. 연구팀은 가치 정렬 문제를 해결하고자 인간의 상호작용을 훈련 데이터에 적용한 부의 분배 에이전트인 ‘디모크러틱 AI(Democratic AI)’를 별도로 개발했다.

연구팀은 디모크러틱 AI로 공공재 게임이라는 투자 실천을 연구했다. 해당 게임은 플레이어가 다양한 양의 자산을 받고, 공공 펀드로 자본을 투자한 뒤 투자 수준에 따라 수익을 얻도록 한다. 연구팀은 디모크럭틱 AI가 게임 속에서 투자 후 수익을 분배할 때 엄격한 평등주의와 자유주의, 자유적 평등주의라는 기존의 세 가지 부의 분배 패러다임을 적용했다. 이때, 세 가지 분배 방식 모두 플레이어에게 제공한 수익 수준이 달랐다.

이어서 연구팀은 심층 강화학습으로 개발돼, 인간과 가상 에이전트의 피드백 데이터를 활용하는 ‘인간 중심 재분배 메커니즘(HCRM)’으로 수익을 분배했다.

이후 연구팀은 대다수 플레이어가 기존 수익 분배 방식보다 HCRM 기반 수익 분배 방식을 더 선호한다는 사실을 확인했다.

연구팀은 “AI가 초기 부의 불균형을 해소하고 수익 분배 과정에서 아무 노력도 하지 않고 이익을 얻으려는 이들을 제재하며, 다수의 지지를 받는 메커니즘 발견에 성공했다”라고 말했다.

다만, 연구팀은 이번 수익 분배 시스템이 극복해야 할 문제가 존재한다는 사실을 인정했다. 주로 가치 정렬이 민주적인 결정을 중심으로 구성돼, 실제 사회의 불평등이나 편견을 악화할 수 있다는 점이다. 이는 다수의 결정 과정에서 사회적 불평등이나 편견이 있다면, AI가 문제를 그대로 학습할 수 있다는 의미이기도 하다.

또한, 연구팀은 “이번 연구 결과를 사회의 자산 분배 방식을 번복하기 위한 급진적 기술관료주의 목적으로 활용해서는 안 된다”라며, “현재 인간이 가지고 있는 방식보다 더 나은 해결책을 고안하도록 도울 연구 도구”라고 설명했다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue