CWN(CHANGE WITH NEWS) - 딥마인드, 인간보다 더 우수한 수익 분배 능력 선보인 머신러닝 시스템 개발

  • 맑음의성26.3℃
  • 맑음함양군27.6℃
  • 맑음부안25.7℃
  • 맑음고창군26.6℃
  • 구름조금태백22.8℃
  • 구름조금해남26.7℃
  • 맑음추풍령24.2℃
  • 맑음제주27.9℃
  • 맑음북강릉25.1℃
  • 맑음고창26.2℃
  • 구름조금천안24.6℃
  • 구름조금완도28.8℃
  • 구름많음부여26.0℃
  • 맑음고산24.5℃
  • 구름조금동해23.7℃
  • 맑음충주24.7℃
  • 구름조금영월24.4℃
  • 맑음통영27.7℃
  • 구름조금전주26.7℃
  • 구름조금포항25.1℃
  • 맑음진주26.8℃
  • 구름많음철원23.1℃
  • 구름조금북부산28.7℃
  • 맑음정읍27.3℃
  • 구름많음강진군27.4℃
  • 구름조금강릉26.8℃
  • 구름조금군산24.8℃
  • 구름조금인제22.6℃
  • 구름조금양산시29.5℃
  • 맑음청송군26.5℃
  • 구름조금대관령21.1℃
  • 맑음영덕24.2℃
  • 맑음진도군25.3℃
  • 구름많음장흥27.2℃
  • 맑음영천26.6℃
  • 구름많음파주23.6℃
  • 구름조금울산27.0℃
  • 구름많음세종25.6℃
  • 구름많음밀양28.7℃
  • 맑음영주24.3℃
  • 구름조금홍천23.8℃
  • 맑음금산25.2℃
  • 맑음거창28.0℃
  • 맑음여수26.4℃
  • 구름많음대전26.3℃
  • 맑음북창원28.1℃
  • 구름많음서청주24.4℃
  • 맑음구미26.9℃
  • 맑음광양시28.3℃
  • 맑음성산26.7℃
  • 구름많음의령군26.3℃
  • 맑음수원25.7℃
  • 구름조금안동26.3℃
  • 구름많음부산26.9℃
  • 구름조금속초26.2℃
  • 맑음문경25.4℃
  • 구름조금흑산도26.7℃
  • 구름조금상주24.6℃
  • 구름많음인천24.3℃
  • 맑음경주시27.8℃
  • 구름조금양평22.7℃
  • 천둥번개백령도16.3℃
  • 맑음남원26.9℃
  • 맑음남해27.0℃
  • 맑음광주26.4℃
  • 맑음순천26.1℃
  • 맑음제천23.3℃
  • 흐림강화22.7℃
  • 맑음이천24.0℃
  • 구름조금보성군27.4℃
  • 맑음김해시28.6℃
  • 구름조금순창군26.8℃
  • 구름조금서울25.6℃
  • 구름조금보령26.8℃
  • 맑음서귀포28.8℃
  • 맑음산청27.0℃
  • 맑음장수24.6℃
  • 맑음원주23.9℃
  • 맑음임실26.0℃
  • 구름많음고흥28.2℃
  • 구름조금목포25.6℃
  • 맑음대구26.8℃
  • 맑음보은24.8℃
  • 구름많음서산25.1℃
  • 구름조금정선군26.5℃
  • 맑음봉화24.5℃
  • 맑음청주25.6℃
  • 맑음북춘천24.1℃
  • 구름많음홍성25.2℃
  • 구름많음합천27.7℃
  • 구름많음동두천23.6℃
  • 맑음영광군25.7℃
  • 구름많음창원27.5℃
  • 맑음거제26.7℃
  • 구름조금울릉도23.6℃
  • 구름조금춘천25.2℃
  • 맑음울진25.1℃
  • 2025.10.01 (수)

딥마인드, 인간보다 더 우수한 수익 분배 능력 선보인 머신러닝 시스템 개발

최은희 / 기사승인 : 2022-07-07 15:05:08
  • -
  • +
  • 인쇄

인공지능(AI)을 이용한 분배 방식이 인간의 기존 부의 분배 방식보다 더 큰 인기를 얻을 가능성이 제기됐다.

해외 과학기술 뉴스 포럼 사이언스앨러트에 따르면, 딥마인드(DeepMind) 연구팀이 공정성 인식과 사회 번성 등 사회적 목표 달성을 도울 머신러닝 시스템을 선보였다.

연구팀의 머신러닝 개발 과정에는 인간이 실제로 원하는 바와 같이 이익이 될 정보를 제공하기 위한 가치 정렬(value alignment)이 주요 장벽이 되었다. 연구팀은 가치 정렬 문제를 해결하고자 인간의 상호작용을 훈련 데이터에 적용한 부의 분배 에이전트인 ‘디모크러틱 AI(Democratic AI)’를 별도로 개발했다.

연구팀은 디모크러틱 AI로 공공재 게임이라는 투자 실천을 연구했다. 해당 게임은 플레이어가 다양한 양의 자산을 받고, 공공 펀드로 자본을 투자한 뒤 투자 수준에 따라 수익을 얻도록 한다. 연구팀은 디모크럭틱 AI가 게임 속에서 투자 후 수익을 분배할 때 엄격한 평등주의와 자유주의, 자유적 평등주의라는 기존의 세 가지 부의 분배 패러다임을 적용했다. 이때, 세 가지 분배 방식 모두 플레이어에게 제공한 수익 수준이 달랐다.

이어서 연구팀은 심층 강화학습으로 개발돼, 인간과 가상 에이전트의 피드백 데이터를 활용하는 ‘인간 중심 재분배 메커니즘(HCRM)’으로 수익을 분배했다.

이후 연구팀은 대다수 플레이어가 기존 수익 분배 방식보다 HCRM 기반 수익 분배 방식을 더 선호한다는 사실을 확인했다.

연구팀은 “AI가 초기 부의 불균형을 해소하고 수익 분배 과정에서 아무 노력도 하지 않고 이익을 얻으려는 이들을 제재하며, 다수의 지지를 받는 메커니즘 발견에 성공했다”라고 말했다.

다만, 연구팀은 이번 수익 분배 시스템이 극복해야 할 문제가 존재한다는 사실을 인정했다. 주로 가치 정렬이 민주적인 결정을 중심으로 구성돼, 실제 사회의 불평등이나 편견을 악화할 수 있다는 점이다. 이는 다수의 결정 과정에서 사회적 불평등이나 편견이 있다면, AI가 문제를 그대로 학습할 수 있다는 의미이기도 하다.

또한, 연구팀은 “이번 연구 결과를 사회의 자산 분배 방식을 번복하기 위한 급진적 기술관료주의 목적으로 활용해서는 안 된다”라며, “현재 인간이 가지고 있는 방식보다 더 나은 해결책을 고안하도록 도울 연구 도구”라고 설명했다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue