CWN(CHANGE WITH NEWS) - 기성 작품을 사용하는 빅테크 AI 학습

  • 맑음순천-1.7℃
  • 맑음상주2.4℃
  • 맑음군산1.7℃
  • 맑음동두천2.0℃
  • 맑음속초9.3℃
  • 흐림원주5.1℃
  • 맑음광양시3.9℃
  • 맑음장수-3.1℃
  • 맑음장흥-1.1℃
  • 맑음고산12.2℃
  • 맑음보성군1.6℃
  • 맑음홍성3.4℃
  • 맑음정읍2.1℃
  • 맑음성산8.3℃
  • 맑음광주3.3℃
  • 흐림서청주0.6℃
  • 맑음서산1.7℃
  • 맑음합천-0.1℃
  • 맑음창원5.3℃
  • 맑음태백2.2℃
  • 맑음파주-1.2℃
  • 맑음임실-1.8℃
  • 맑음서울6.7℃
  • 구름조금울릉도10.1℃
  • 맑음양평4.1℃
  • 맑음거창-3.4℃
  • 맑음전주2.7℃
  • 맑음해남-0.4℃
  • 맑음산청-0.4℃
  • 맑음의성-0.8℃
  • 맑음영덕6.3℃
  • 맑음보령3.7℃
  • 맑음밀양-0.6℃
  • 구름조금제주10.4℃
  • 맑음부안2.1℃
  • 맑음영천-0.9℃
  • 맑음포항6.6℃
  • 맑음고창군1.3℃
  • 맑음목포4.9℃
  • 맑음홍천0.8℃
  • 맑음구미0.7℃
  • 맑음대관령2.0℃
  • 맑음봉화-3.7℃
  • 맑음철원-0.4℃
  • 흐림제천3.7℃
  • 맑음완도4.4℃
  • 맑음강화3.5℃
  • 맑음부산7.8℃
  • 맑음북창원4.1℃
  • 맑음안동-0.5℃
  • 구름조금영월2.1℃
  • 구름많음청주4.8℃
  • 맑음추풍령0.5℃
  • 맑음영광군1.3℃
  • 맑음대구2.1℃
  • 맑음순창군-1.3℃
  • 맑음양산시1.9℃
  • 맑음북춘천-0.2℃
  • 맑음김해시4.9℃
  • 맑음울진7.0℃
  • 흐림천안1.6℃
  • 맑음진주-1.2℃
  • 맑음대전2.0℃
  • 맑음여수6.4℃
  • 맑음정선군-0.1℃
  • 맑음의령군-2.4℃
  • 맑음울산5.4℃
  • 맑음부여-1.0℃
  • 맑음서귀포9.5℃
  • 맑음문경3.2℃
  • 맑음함양군-1.8℃
  • 맑음경주시0.7℃
  • 맑음북부산0.8℃
  • 맑음이천4.7℃
  • 맑음강진군1.1℃
  • 맑음청송군-3.4℃
  • 맑음백령도9.8℃
  • 맑음진도군1.6℃
  • 맑음보은-0.3℃
  • 맑음세종1.5℃
  • 흐림영주2.2℃
  • 맑음통영4.7℃
  • 맑음고흥0.2℃
  • 맑음남해4.7℃
  • 맑음거제3.9℃
  • 맑음동해6.9℃
  • 맑음인제2.3℃
  • 맑음북강릉5.9℃
  • 맑음남원-0.9℃
  • 맑음흑산도10.2℃
  • 맑음금산-1.2℃
  • 맑음고창0.4℃
  • 구름조금인천8.8℃
  • 맑음강릉9.9℃
  • 맑음수원4.6℃
  • 흐림충주5.8℃
  • 맑음춘천0.3℃
  • 2025.11.22 (토)

기성 작품을 사용하는 빅테크 AI 학습

조하민 / 기사승인 : 2023-08-22 10:55:38
  • -
  • +
  • 인쇄
최근 출간된 책 포함한 AI가 이미 점령한 예술 세계

페이스북 모회사 메타가 개발하는 생성형 인공지능(AI)의 기반이 되는 대규모 언어모델(LLM) ‘라마(LLaMA)’ 학습에 쓰인 작품의 작가 중 일부다. 미국 시사매체 디애틀랜틱은 이 작가들의 작품이 무단 사용됐다고 19일(현지 시간) 보도했다. 앞서 미 일부 작가가 자신들의 책이 동의 없이 챗GPT 훈련에 사용됐다고 오픈AI를 상대로 소송을 냈는데 방대한 양의 저작권이 있는 자료가 무단 사용된 사실이 드러난 것이다.

디애틀랜틱이 라마 학습에 사용된 데이터세트 ‘북3(Books 3)’를 입수해 분석한 결과 최근 20년간 출간된 17만 권 넘는 책이 포함된 것으로 나타났다. 미 출판사 펭귄랜덤하우스 책 3만 권, 영국 출판사 하퍼콜린스와 맥밀런 책 각각 1만4000권과 7000권, 영국 옥스퍼드대 출판부 책 1800권 등이다. 3분의 1은 픽션이고, 3분의 2는 논픽션이었다. 디애틀랜틱은 “AI가 약속한 미래는 훔친 말들(stolen words)로 쓰여 있었다”고 지적했다.

북3는 오픈AI의 챗GPT 학습과 올 3월 블룸버그통신이 출시한 생성형 AI ‘블룸버그GPT’ 학습에도 쓰였다. AI 커뮤니티에서 인기를 끌던 북3는 올 6월 오픈AI에 대한 저작권 집단소송이 제기되면서 접근이 어려워졌다고 디애틀랜틱은 설명했다. 빅테크 기업들은 저작권 위반 소송 제기에 “생성형 AI는 훈련받은 책을 복제하는 것이 아니라 새 작품을 생산하는 것”이라며 맞서고 있다.

디애틀랜틱은 “완성작의 복제와 배포를 규제하겠다는 보장 없이 몇 년 동안 소설을 쓰거나 역사를 연구할 사람은 없을 것”이라며 “오늘날 대표 기술이 대량 절도에 의해 작동하고 있다는 것은 불편하지만 적절한 말이다”라고 꼬집었다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue