CWN(CHANGE WITH NEWS) - 기성 작품을 사용하는 빅테크 AI 학습

  • 구름많음북창원21.5℃
  • 맑음울산16.9℃
  • 맑음성산20.0℃
  • 맑음남해19.0℃
  • 구름조금고창15.9℃
  • 맑음서청주15.6℃
  • 구름많음부산20.4℃
  • 구름많음흑산도20.6℃
  • 맑음서귀포22.8℃
  • 맑음부안17.1℃
  • 맑음양평16.7℃
  • 구름조금강진군16.1℃
  • 맑음보은14.6℃
  • 맑음포항19.0℃
  • 맑음대관령6.9℃
  • 맑음상주16.0℃
  • 맑음인천18.9℃
  • 맑음거창15.1℃
  • 맑음금산15.3℃
  • 흐림북부산20.3℃
  • 맑음원주16.5℃
  • 박무북춘천15.0℃
  • 구름조금고창군15.6℃
  • 맑음전주17.5℃
  • 구름많음영덕16.7℃
  • 맑음울진15.5℃
  • 구름많음합천18.3℃
  • 구름조금보성군17.6℃
  • 흐림안동17.5℃
  • 흐림영주17.0℃
  • 구름조금완도18.9℃
  • 구름조금진도군16.7℃
  • 구름많음청주19.0℃
  • 맑음이천16.0℃
  • 구름조금제천15.6℃
  • 구름조금산청17.1℃
  • 맑음남원16.2℃
  • 맑음속초15.7℃
  • 맑음의성15.8℃
  • 맑음부여16.1℃
  • 구름조금제주21.8℃
  • 맑음여수20.2℃
  • 맑음순창군15.1℃
  • 구름조금고흥15.6℃
  • 맑음서울18.2℃
  • 흐림청송군15.5℃
  • 맑음세종16.9℃
  • 구름조금대전16.9℃
  • 구름조금장수13.1℃
  • 맑음강화15.9℃
  • 흐림봉화16.1℃
  • 맑음충주16.1℃
  • 맑음철원15.1℃
  • 맑음울릉도18.4℃
  • 맑음태백9.9℃
  • 맑음천안14.9℃
  • 흐림의령군18.9℃
  • 맑음구미16.2℃
  • 맑음홍성16.1℃
  • 맑음강릉16.6℃
  • 맑음동해15.0℃
  • 구름조금밀양20.4℃
  • 맑음경주시15.9℃
  • 맑음함양군16.2℃
  • 구름조금순천14.7℃
  • 맑음인제13.1℃
  • 맑음동두천15.7℃
  • 맑음춘천15.2℃
  • 맑음통영19.4℃
  • 구름조금대구18.6℃
  • 맑음정선군13.3℃
  • 구름많음진주19.1℃
  • 맑음파주14.6℃
  • 맑음북강릉15.0℃
  • 구름많음김해시20.0℃
  • 구름조금고산21.4℃
  • 맑음군산16.9℃
  • 구름많음광주17.7℃
  • 맑음영천15.6℃
  • 구름많음백령도18.6℃
  • 맑음홍천15.8℃
  • 구름조금임실14.6℃
  • 구름조금정읍15.7℃
  • 맑음거제20.2℃
  • 구름조금양산시20.6℃
  • 구름조금해남15.7℃
  • 맑음수원15.6℃
  • 구름많음영월15.6℃
  • 구름조금장흥16.2℃
  • 맑음보령16.4℃
  • 구름많음창원20.8℃
  • 구름조금광양시18.4℃
  • 맑음추풍령14.0℃
  • 맑음서산14.6℃
  • 맑음문경15.5℃
  • 구름많음목포19.7℃
  • 구름많음영광군16.5℃
  • 2025.09.30 (화)

기성 작품을 사용하는 빅테크 AI 학습

조하민 / 기사승인 : 2023-08-22 10:55:38
  • -
  • +
  • 인쇄
최근 출간된 책 포함한 AI가 이미 점령한 예술 세계

페이스북 모회사 메타가 개발하는 생성형 인공지능(AI)의 기반이 되는 대규모 언어모델(LLM) ‘라마(LLaMA)’ 학습에 쓰인 작품의 작가 중 일부다. 미국 시사매체 디애틀랜틱은 이 작가들의 작품이 무단 사용됐다고 19일(현지 시간) 보도했다. 앞서 미 일부 작가가 자신들의 책이 동의 없이 챗GPT 훈련에 사용됐다고 오픈AI를 상대로 소송을 냈는데 방대한 양의 저작권이 있는 자료가 무단 사용된 사실이 드러난 것이다.

디애틀랜틱이 라마 학습에 사용된 데이터세트 ‘북3(Books 3)’를 입수해 분석한 결과 최근 20년간 출간된 17만 권 넘는 책이 포함된 것으로 나타났다. 미 출판사 펭귄랜덤하우스 책 3만 권, 영국 출판사 하퍼콜린스와 맥밀런 책 각각 1만4000권과 7000권, 영국 옥스퍼드대 출판부 책 1800권 등이다. 3분의 1은 픽션이고, 3분의 2는 논픽션이었다. 디애틀랜틱은 “AI가 약속한 미래는 훔친 말들(stolen words)로 쓰여 있었다”고 지적했다.

북3는 오픈AI의 챗GPT 학습과 올 3월 블룸버그통신이 출시한 생성형 AI ‘블룸버그GPT’ 학습에도 쓰였다. AI 커뮤니티에서 인기를 끌던 북3는 올 6월 오픈AI에 대한 저작권 집단소송이 제기되면서 접근이 어려워졌다고 디애틀랜틱은 설명했다. 빅테크 기업들은 저작권 위반 소송 제기에 “생성형 AI는 훈련받은 책을 복제하는 것이 아니라 새 작품을 생산하는 것”이라며 맞서고 있다.

디애틀랜틱은 “완성작의 복제와 배포를 규제하겠다는 보장 없이 몇 년 동안 소설을 쓰거나 역사를 연구할 사람은 없을 것”이라며 “오늘날 대표 기술이 대량 절도에 의해 작동하고 있다는 것은 불편하지만 적절한 말이다”라고 꼬집었다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue