CWN(CHANGE WITH NEWS) - 텍스트만으로 원하는 그림 얻는다?…카카오브레인, ′AI 이미지 생성모델′ 깃허브에 공개

  • 구름많음정읍13.3℃
  • 구름많음인천12.3℃
  • 구름많음보은11.9℃
  • 구름조금군산13.9℃
  • 구름조금충주11.5℃
  • 구름많음보성군14.6℃
  • 맑음백령도9.8℃
  • 맑음울릉도13.6℃
  • 구름조금남원12.5℃
  • 맑음의령군13.5℃
  • 흐림제주14.2℃
  • 맑음양산시14.9℃
  • 구름많음고흥14.3℃
  • 구름조금산청14.6℃
  • 구름많음태백7.7℃
  • 구름많음청주13.9℃
  • 맑음북창원15.0℃
  • 맑음광주13.5℃
  • 구름많음고창13.5℃
  • 맑음거제13.3℃
  • 구름조금세종13.8℃
  • 구름많음정선군9.0℃
  • 구름조금영주11.3℃
  • 흐림철원10.2℃
  • 구름조금영월8.5℃
  • 구름많음북춘천8.8℃
  • 구름많음순창군11.4℃
  • 구름많음고창군13.2℃
  • 구름많음금산12.2℃
  • 흐림고산13.4℃
  • 구름조금원주10.6℃
  • 구름많음성산15.3℃
  • 맑음북부산15.2℃
  • 구름많음춘천8.1℃
  • 구름조금이천11.1℃
  • 구름조금속초11.9℃
  • 구름많음인제9.4℃
  • 구름조금거창13.0℃
  • 맑음김해시14.7℃
  • 맑음여수14.1℃
  • 흐림장수9.6℃
  • 구름많음완도13.4℃
  • 구름조금대전14.3℃
  • 구름많음장흥13.7℃
  • 구름조금부여14.5℃
  • 구름조금서청주13.4℃
  • 구름조금서귀포16.5℃
  • 구름많음문경12.2℃
  • 구름많음진도군13.3℃
  • 구름많음부안14.5℃
  • 구름많음동두천12.8℃
  • 구름조금북강릉14.3℃
  • 구름조금서산13.8℃
  • 맑음남해14.7℃
  • 구름조금상주12.8℃
  • 구름많음전주13.3℃
  • 맑음포항14.8℃
  • 구름조금강화13.3℃
  • 구름많음임실10.5℃
  • 구름조금홍성14.4℃
  • 맑음통영14.7℃
  • 구름많음추풍령11.2℃
  • 구름많음대관령6.2℃
  • 구름조금구미14.5℃
  • 구름많음목포13.6℃
  • 맑음대구13.4℃
  • 구름조금제천9.0℃
  • 구름많음함양군12.6℃
  • 구름많음서울13.2℃
  • 구름많음파주12.4℃
  • 맑음울진15.5℃
  • 맑음부산14.3℃
  • 맑음밀양14.2℃
  • 구름조금안동12.8℃
  • 맑음진주13.7℃
  • 구름많음영광군13.3℃
  • 구름조금합천15.5℃
  • 구름많음수원12.7℃
  • 구름많음순천12.0℃
  • 구름많음봉화10.0℃
  • 구름많음양평8.5℃
  • 구름많음보령16.2℃
  • 구름많음강진군14.9℃
  • 구름조금강릉13.6℃
  • 흐림흑산도15.1℃
  • 흐림홍천9.8℃
  • 구름조금광양시15.0℃
  • 맑음울산14.7℃
  • 구름조금청송군11.7℃
  • 구름많음해남13.0℃
  • 구름조금의성13.9℃
  • 맑음영덕13.3℃
  • 맑음영천13.9℃
  • 맑음창원14.5℃
  • 구름많음천안13.1℃
  • 구름조금동해14.2℃
  • 맑음경주시14.7℃
  • 2025.11.20 (목)

텍스트만으로 원하는 그림 얻는다?…카카오브레인, 'AI 이미지 생성모델' 깃허브에 공개

온라인뉴스팀 / 기사승인 : 2022-04-19 13:29:35
  • -
  • +
  • 인쇄
카카오브레인이 공개한 이미지 생성 AI모델 'RQ-Transformer'에 '사막에 있는 에펠탑'을 입력하자 생성된 샘플 이미지(카카오브레인 제공)© 뉴스1

카카오브레인이 초거대 멀티모달 인공지능(AI) '민달리(minDALL-E)'의 업그레이드 버전 'RQ-Transformer'를 깃허브에 공개했다.

19일 카카오브레인에 따르면, 이번에 공개된 RQ-Transformer는 39억개의 매개변수로 구성돼 있으며 3000만쌍의 '텍스트-이미지' 데이터셋을 학습한 text-to-image AI모델이다. 처음 보는 텍스트의 조합을 이해하고 이에 대응하는 이미지를 만들어낼 수 있다.

이를테면 '사막에 있는 에펠탑'이란 텍스트 입력 시 그 뜻을 헤아려 관련 그림을 다수 생성한다.

RQ-Transformer는 기존에 공개한 이미지 생성모델 민달리와 비교해 모델 크기는 3배, 이미지 생성 속도와 학습 데이터셋 크기는 2배 늘어났다.

특히 민달리가 미국의 인공지능 개발 기업 오픈AI가 공개한 'DALL-E'를 재현하는 것에 가까웠다면 RQ-Transformer는 카카오브레인 만의 독자적인 기술로 개발됐다는 점에서 의미가 더욱 크다.

카카오브레인은 이번 AI모델의 기술성을 인정받아 오는 6월 세계적인 학술대회 'CVPR 2022'에 해당 논문을 발표할 예정이다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue