CWN(CHANGE WITH NEWS) - 딥마인드, 인간보다 더 우수한 수익 분배 능력 선보인 머신러닝 시스템 개발

  • 맑음거제18.5℃
  • 맑음북강릉17.2℃
  • 맑음고흥14.1℃
  • 맑음청송군14.8℃
  • 맑음장흥14.6℃
  • 맑음의령군15.6℃
  • 박무수원14.7℃
  • 맑음포항19.2℃
  • 맑음파주14.1℃
  • 박무인천18.3℃
  • 맑음부안15.6℃
  • 맑음완도17.9℃
  • 맑음인제16.3℃
  • 맑음부산20.8℃
  • 맑음문경14.3℃
  • 박무북춘천16.7℃
  • 맑음광양시16.2℃
  • 맑음김해시18.0℃
  • 흐림서청주14.6℃
  • 맑음성산18.7℃
  • 맑음순천12.6℃
  • 안개안동14.8℃
  • 맑음봉화11.8℃
  • 맑음거창11.9℃
  • 천둥번개울릉도16.5℃
  • 흐림충주16.3℃
  • 맑음진도군14.7℃
  • 맑음창원18.6℃
  • 맑음영천17.4℃
  • 맑음목포18.8℃
  • 맑음태백9.8℃
  • 맑음경주시16.0℃
  • 맑음대관령10.6℃
  • 맑음보성군16.0℃
  • 맑음고창14.7℃
  • 맑음남해17.3℃
  • 맑음금산15.3℃
  • 맑음임실14.0℃
  • 맑음영광군14.6℃
  • 맑음여수18.8℃
  • 맑음북부산17.8℃
  • 맑음서산14.4℃
  • 맑음양평15.6℃
  • 맑음이천16.4℃
  • 맑음철원15.1℃
  • 맑음추풍령13.2℃
  • 맑음합천16.2℃
  • 맑음강화15.6℃
  • 흐림부여15.0℃
  • 맑음군산15.7℃
  • 박무홍성14.2℃
  • 맑음구미15.9℃
  • 흐림원주15.3℃
  • 박무백령도19.3℃
  • 흐림춘천16.7℃
  • 맑음함양군12.9℃
  • 흐림보은13.5℃
  • 맑음제주19.7℃
  • 맑음정읍15.6℃
  • 맑음서귀포20.8℃
  • 맑음울진15.7℃
  • 맑음광주16.7℃
  • 맑음북창원18.7℃
  • 흐림정선군14.6℃
  • 흐림영월15.2℃
  • 맑음영주11.7℃
  • 흐림제천14.1℃
  • 맑음고산21.2℃
  • 맑음동두천15.4℃
  • 맑음산청14.3℃
  • 맑음밀양16.7℃
  • 흐림홍천15.8℃
  • 구름조금대구17.9℃
  • 맑음보령15.9℃
  • 맑음남원13.9℃
  • 맑음강진군14.4℃
  • 박무서울17.6℃
  • 맑음통영18.5℃
  • 맑음장수12.4℃
  • 맑음고창군14.9℃
  • 맑음상주14.5℃
  • 맑음동해17.3℃
  • 맑음의성15.8℃
  • 박무청주16.5℃
  • 맑음해남14.0℃
  • 구름조금울산17.8℃
  • 맑음강릉18.4℃
  • 맑음순창군14.6℃
  • 맑음속초19.4℃
  • 흐림천안14.3℃
  • 맑음흑산도19.9℃
  • 구름조금양산시18.4℃
  • 맑음영덕17.7℃
  • 맑음대전15.5℃
  • 맑음전주16.2℃
  • 맑음진주14.3℃
  • 맑음세종14.8℃
  • 2025.10.01 (수)

딥마인드, 인간보다 더 우수한 수익 분배 능력 선보인 머신러닝 시스템 개발

최은희 / 기사승인 : 2022-07-07 15:05:08
  • -
  • +
  • 인쇄

인공지능(AI)을 이용한 분배 방식이 인간의 기존 부의 분배 방식보다 더 큰 인기를 얻을 가능성이 제기됐다.

해외 과학기술 뉴스 포럼 사이언스앨러트에 따르면, 딥마인드(DeepMind) 연구팀이 공정성 인식과 사회 번성 등 사회적 목표 달성을 도울 머신러닝 시스템을 선보였다.

연구팀의 머신러닝 개발 과정에는 인간이 실제로 원하는 바와 같이 이익이 될 정보를 제공하기 위한 가치 정렬(value alignment)이 주요 장벽이 되었다. 연구팀은 가치 정렬 문제를 해결하고자 인간의 상호작용을 훈련 데이터에 적용한 부의 분배 에이전트인 ‘디모크러틱 AI(Democratic AI)’를 별도로 개발했다.

연구팀은 디모크러틱 AI로 공공재 게임이라는 투자 실천을 연구했다. 해당 게임은 플레이어가 다양한 양의 자산을 받고, 공공 펀드로 자본을 투자한 뒤 투자 수준에 따라 수익을 얻도록 한다. 연구팀은 디모크럭틱 AI가 게임 속에서 투자 후 수익을 분배할 때 엄격한 평등주의와 자유주의, 자유적 평등주의라는 기존의 세 가지 부의 분배 패러다임을 적용했다. 이때, 세 가지 분배 방식 모두 플레이어에게 제공한 수익 수준이 달랐다.

이어서 연구팀은 심층 강화학습으로 개발돼, 인간과 가상 에이전트의 피드백 데이터를 활용하는 ‘인간 중심 재분배 메커니즘(HCRM)’으로 수익을 분배했다.

이후 연구팀은 대다수 플레이어가 기존 수익 분배 방식보다 HCRM 기반 수익 분배 방식을 더 선호한다는 사실을 확인했다.

연구팀은 “AI가 초기 부의 불균형을 해소하고 수익 분배 과정에서 아무 노력도 하지 않고 이익을 얻으려는 이들을 제재하며, 다수의 지지를 받는 메커니즘 발견에 성공했다”라고 말했다.

다만, 연구팀은 이번 수익 분배 시스템이 극복해야 할 문제가 존재한다는 사실을 인정했다. 주로 가치 정렬이 민주적인 결정을 중심으로 구성돼, 실제 사회의 불평등이나 편견을 악화할 수 있다는 점이다. 이는 다수의 결정 과정에서 사회적 불평등이나 편견이 있다면, AI가 문제를 그대로 학습할 수 있다는 의미이기도 하다.

또한, 연구팀은 “이번 연구 결과를 사회의 자산 분배 방식을 번복하기 위한 급진적 기술관료주의 목적으로 활용해서는 안 된다”라며, “현재 인간이 가지고 있는 방식보다 더 나은 해결책을 고안하도록 도울 연구 도구”라고 설명했다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue