CWN(CHANGE WITH NEWS) - 텍스트만으로 원하는 그림 얻는다?…카카오브레인, ′AI 이미지 생성모델′ 깃허브에 공개

  • 구름조금이천12.8℃
  • 구름조금함양군12.9℃
  • 구름조금전주14.8℃
  • 구름많음인제10.1℃
  • 구름조금세종14.5℃
  • 맑음속초13.1℃
  • 구름조금진주14.7℃
  • 흐림고산13.8℃
  • 구름조금순창군12.0℃
  • 구름조금안동12.6℃
  • 구름많음흑산도14.3℃
  • 맑음백령도9.3℃
  • 구름많음대전14.4℃
  • 구름조금홍성14.0℃
  • 구름조금남해14.5℃
  • 구름조금군산13.9℃
  • 구름조금추풍령12.2℃
  • 구름조금천안14.2℃
  • 맑음창원15.8℃
  • 구름조금북강릉13.4℃
  • 구름조금서청주14.4℃
  • 구름조금고흥14.7℃
  • 구름조금대관령5.9℃
  • 구름조금거창13.2℃
  • 구름많음영월11.1℃
  • 구름조금동해13.4℃
  • 구름조금충주11.7℃
  • 구름조금구미14.4℃
  • 구름많음정선군10.6℃
  • 구름많음춘천11.3℃
  • 구름많음제천10.7℃
  • 구름조금완도15.4℃
  • 구름조금파주13.6℃
  • 흐림장수10.5℃
  • 맑음양산시16.0℃
  • 맑음의성14.6℃
  • 맑음강화12.9℃
  • 구름많음정읍14.8℃
  • 맑음서귀포17.3℃
  • 구름많음부안14.3℃
  • 구름조금울릉도13.6℃
  • 구름조금철원12.3℃
  • 구름많음보은12.8℃
  • 구름많음임실11.9℃
  • 맑음북창원15.8℃
  • 맑음울산15.8℃
  • 구름조금해남14.6℃
  • 구름조금청송군12.9℃
  • 구름많음고창군14.2℃
  • 구름조금양평10.4℃
  • 구름조금동두천13.6℃
  • 구름조금금산13.9℃
  • 맑음부산15.1℃
  • 구름조금광주13.3℃
  • 구름조금부여14.3℃
  • 맑음포항15.3℃
  • 맑음의령군14.5℃
  • 맑음통영15.3℃
  • 구름많음영주12.0℃
  • 맑음경주시15.0℃
  • 구름조금강릉13.4℃
  • 맑음영덕14.0℃
  • 구름많음강진군14.7℃
  • 구름조금원주12.1℃
  • 구름조금보성군14.8℃
  • 구름많음영광군13.1℃
  • 구름많음고창13.7℃
  • 구름조금서산13.3℃
  • 구름조금홍천12.1℃
  • 구름조금합천15.4℃
  • 구름조금상주13.0℃
  • 구름많음북춘천10.4℃
  • 구름조금여수14.9℃
  • 구름조금성산15.1℃
  • 구름많음목포13.4℃
  • 구름조금보령15.9℃
  • 구름조금청주15.4℃
  • 구름조금태백7.6℃
  • 맑음북부산15.9℃
  • 구름많음순천12.4℃
  • 맑음밀양15.0℃
  • 구름조금수원12.3℃
  • 구름조금남원12.6℃
  • 구름많음진도군13.5℃
  • 맑음거제13.7℃
  • 구름조금봉화10.7℃
  • 흐림제주14.0℃
  • 구름조금광양시15.3℃
  • 구름많음문경13.5℃
  • 맑음울진15.1℃
  • 구름조금산청14.2℃
  • 구름조금영천14.2℃
  • 구름조금서울14.6℃
  • 구름많음장흥14.3℃
  • 맑음인천12.7℃
  • 맑음대구15.4℃
  • 맑음김해시15.6℃
  • 2025.11.20 (목)

텍스트만으로 원하는 그림 얻는다?…카카오브레인, 'AI 이미지 생성모델' 깃허브에 공개

온라인뉴스팀 / 기사승인 : 2022-04-19 13:29:35
  • -
  • +
  • 인쇄
카카오브레인이 공개한 이미지 생성 AI모델 'RQ-Transformer'에 '사막에 있는 에펠탑'을 입력하자 생성된 샘플 이미지(카카오브레인 제공)© 뉴스1

카카오브레인이 초거대 멀티모달 인공지능(AI) '민달리(minDALL-E)'의 업그레이드 버전 'RQ-Transformer'를 깃허브에 공개했다.

19일 카카오브레인에 따르면, 이번에 공개된 RQ-Transformer는 39억개의 매개변수로 구성돼 있으며 3000만쌍의 '텍스트-이미지' 데이터셋을 학습한 text-to-image AI모델이다. 처음 보는 텍스트의 조합을 이해하고 이에 대응하는 이미지를 만들어낼 수 있다.

이를테면 '사막에 있는 에펠탑'이란 텍스트 입력 시 그 뜻을 헤아려 관련 그림을 다수 생성한다.

RQ-Transformer는 기존에 공개한 이미지 생성모델 민달리와 비교해 모델 크기는 3배, 이미지 생성 속도와 학습 데이터셋 크기는 2배 늘어났다.

특히 민달리가 미국의 인공지능 개발 기업 오픈AI가 공개한 'DALL-E'를 재현하는 것에 가까웠다면 RQ-Transformer는 카카오브레인 만의 독자적인 기술로 개발됐다는 점에서 의미가 더욱 크다.

카카오브레인은 이번 AI모델의 기술성을 인정받아 오는 6월 세계적인 학술대회 'CVPR 2022'에 해당 논문을 발표할 예정이다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue