CWN(CHANGE WITH NEWS) - 기성 작품을 사용하는 빅테크 AI 학습

  • 흐림영월-2.9℃
  • 흐림이천-0.5℃
  • 맑음양산시5.2℃
  • 구름많음서청주0.4℃
  • 구름많음전주3.5℃
  • 눈북춘천-5.7℃
  • 흐림부여0.5℃
  • 흐림상주2.5℃
  • 구름많음안동0.4℃
  • 구름많음고산8.4℃
  • 구름많음순창군1.7℃
  • 구름많음속초2.0℃
  • 흐림강화-0.8℃
  • 맑음울릉도3.0℃
  • 흐림보은1.5℃
  • 구름많음강진군5.7℃
  • 흐림정선군-3.3℃
  • 흐림서산1.6℃
  • 맑음대구4.4℃
  • 흐림제천-2.3℃
  • 구름조금구미3.2℃
  • 구름많음진도군7.2℃
  • 구름많음봉화-1.1℃
  • 맑음고창4.7℃
  • 구름많음대관령-4.8℃
  • 구름조금합천5.1℃
  • 맑음포항4.7℃
  • 구름많음임실1.1℃
  • 구름많음보성군5.3℃
  • 구름많음제주9.7℃
  • 흐림철원-2.2℃
  • 구름조금청송군1.6℃
  • 구름많음해남6.3℃
  • 구름많음백령도5.4℃
  • 흐림태백-4.0℃
  • 맑음경주시5.2℃
  • 맑음밀양5.1℃
  • 구름많음남해5.9℃
  • 구름많음흑산도8.1℃
  • 흐림추풍령1.1℃
  • 흐림파주-3.3℃
  • 구름많음고흥6.6℃
  • 구름조금산청4.1℃
  • 구름조금부산5.1℃
  • 흐림문경0.2℃
  • 구름많음함양군3.2℃
  • 구름많음통영5.0℃
  • 구름많음부안4.8℃
  • 구름많음목포4.0℃
  • 흐림완도7.9℃
  • 구름많음광주5.1℃
  • 흐림남원1.9℃
  • 맑음영덕2.9℃
  • 맑음울진3.2℃
  • 구름조금김해시5.6℃
  • 구름많음거제5.2℃
  • 흐림장수0.4℃
  • 구름조금북창원6.3℃
  • 흐림양평-1.6℃
  • 눈서울-1.0℃
  • 구름많음정읍3.8℃
  • 눈대전1.6℃
  • 흐림서귀포8.8℃
  • 구름많음천안0.7℃
  • 눈수원0.3℃
  • 구름조금의령군5.3℃
  • 구름많음원주0.5℃
  • 구름많음의성3.0℃
  • 구름많음강릉2.3℃
  • 흐림홍성-0.1℃
  • 구름많음동해2.1℃
  • 구름조금북부산5.7℃
  • 흐림충주-0.5℃
  • 구름많음성산10.2℃
  • 흐림영주-1.0℃
  • 구름조금창원5.4℃
  • 흐림홍천-2.5℃
  • 흐림인제-4.0℃
  • 구름많음군산3.3℃
  • 구름많음장흥5.5℃
  • 눈인천-0.4℃
  • 구름조금진주5.5℃
  • 구름조금고창군4.7℃
  • 구름조금영천3.8℃
  • 구름많음순천4.0℃
  • 구름많음청주1.4℃
  • 구름많음광양시6.3℃
  • 맑음울산5.3℃
  • 구름많음보령2.5℃
  • 흐림세종1.6℃
  • 구름많음거창3.5℃
  • 구름많음북강릉2.8℃
  • 구름많음여수6.2℃
  • 흐림금산2.0℃
  • 맑음영광군4.8℃
  • 흐림춘천-4.3℃
  • 흐림동두천-2.6℃
  • 2026.01.12 (월)

기성 작품을 사용하는 빅테크 AI 학습

조하민 / 기사승인 : 2023-08-22 10:55:38
  • -
  • +
  • 인쇄
최근 출간된 책 포함한 AI가 이미 점령한 예술 세계

페이스북 모회사 메타가 개발하는 생성형 인공지능(AI)의 기반이 되는 대규모 언어모델(LLM) ‘라마(LLaMA)’ 학습에 쓰인 작품의 작가 중 일부다. 미국 시사매체 디애틀랜틱은 이 작가들의 작품이 무단 사용됐다고 19일(현지 시간) 보도했다. 앞서 미 일부 작가가 자신들의 책이 동의 없이 챗GPT 훈련에 사용됐다고 오픈AI를 상대로 소송을 냈는데 방대한 양의 저작권이 있는 자료가 무단 사용된 사실이 드러난 것이다.

디애틀랜틱이 라마 학습에 사용된 데이터세트 ‘북3(Books 3)’를 입수해 분석한 결과 최근 20년간 출간된 17만 권 넘는 책이 포함된 것으로 나타났다. 미 출판사 펭귄랜덤하우스 책 3만 권, 영국 출판사 하퍼콜린스와 맥밀런 책 각각 1만4000권과 7000권, 영국 옥스퍼드대 출판부 책 1800권 등이다. 3분의 1은 픽션이고, 3분의 2는 논픽션이었다. 디애틀랜틱은 “AI가 약속한 미래는 훔친 말들(stolen words)로 쓰여 있었다”고 지적했다.

북3는 오픈AI의 챗GPT 학습과 올 3월 블룸버그통신이 출시한 생성형 AI ‘블룸버그GPT’ 학습에도 쓰였다. AI 커뮤니티에서 인기를 끌던 북3는 올 6월 오픈AI에 대한 저작권 집단소송이 제기되면서 접근이 어려워졌다고 디애틀랜틱은 설명했다. 빅테크 기업들은 저작권 위반 소송 제기에 “생성형 AI는 훈련받은 책을 복제하는 것이 아니라 새 작품을 생산하는 것”이라며 맞서고 있다.

디애틀랜틱은 “완성작의 복제와 배포를 규제하겠다는 보장 없이 몇 년 동안 소설을 쓰거나 역사를 연구할 사람은 없을 것”이라며 “오늘날 대표 기술이 대량 절도에 의해 작동하고 있다는 것은 불편하지만 적절한 말이다”라고 꼬집었다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue