CWN(CHANGE WITH NEWS) - 건국대 김원준 교수팀, ICCV 2025서 차세대 3D 영상 분할 기술 발표

  • 흐림춘천-0.2℃
  • 흐림철원2.0℃
  • 구름많음북강릉5.2℃
  • 맑음진주6.1℃
  • 맑음추풍령3.9℃
  • 흐림이천0.2℃
  • 구름많음강릉5.6℃
  • 구름많음해남6.9℃
  • 구름조금고창6.4℃
  • 흐림대관령-1.8℃
  • 구름조금보성군6.6℃
  • 구름많음강진군7.1℃
  • 흐림태백0.0℃
  • 흐림북춘천-0.2℃
  • 흐림서산4.9℃
  • 구름많음서귀포9.4℃
  • 맑음순천4.1℃
  • 흐림충주2.0℃
  • 흐림천안5.4℃
  • 구름조금영광군6.4℃
  • 구름조금백령도7.0℃
  • 맑음밀양5.8℃
  • 구름조금순창군4.8℃
  • 구름많음안동4.6℃
  • 맑음영덕5.5℃
  • 구름조금상주5.3℃
  • 구름조금남원4.7℃
  • 구름조금장수1.9℃
  • 흐림보은4.7℃
  • 흐림양평1.1℃
  • 구름조금전주6.1℃
  • 구름많음대전5.5℃
  • 맑음남해4.8℃
  • 구름조금부안6.6℃
  • 흐림완도7.3℃
  • 구름조금영천5.6℃
  • 흐림동두천2.0℃
  • 맑음제주9.8℃
  • 맑음여수6.9℃
  • 구름많음진도군7.6℃
  • 흐림강화5.4℃
  • 맑음부산5.8℃
  • 맑음의령군
  • 맑음산청4.7℃
  • 구름많음봉화2.8℃
  • 맑음의성5.6℃
  • 흐림정선군1.0℃
  • 맑음울산6.8℃
  • 구름많음장흥7.0℃
  • 맑음통영6.3℃
  • 구름많음흑산도6.9℃
  • 구름많음광주6.4℃
  • 구름많음금산5.3℃
  • 맑음경주시6.0℃
  • 구름많음목포7.3℃
  • 흐림홍천1.4℃
  • 맑음거제5.3℃
  • 맑음합천6.8℃
  • 흐림영월1.3℃
  • 구름많음군산6.2℃
  • 맑음김해시5.5℃
  • 맑음구미5.0℃
  • 흐림인제1.2℃
  • 흐림청주5.6℃
  • 맑음포항7.0℃
  • 맑음대구6.8℃
  • 구름많음속초5.2℃
  • 맑음함양군4.7℃
  • 맑음양산시6.0℃
  • 흐림홍성5.3℃
  • 흐림파주3.0℃
  • 구름많음고흥6.7℃
  • 맑음북창원5.0℃
  • 맑음울릉도4.5℃
  • 구름조금성산9.8℃
  • 구름조금고창군6.0℃
  • 흐림제천1.0℃
  • 흐림서청주5.1℃
  • 흐림서울2.8℃
  • 구름조금임실4.1℃
  • 구름많음영주4.4℃
  • 구름많음고산8.5℃
  • 흐림수원4.5℃
  • 맑음창원4.4℃
  • 흐림인천4.4℃
  • 맑음광양시6.3℃
  • 구름조금정읍6.0℃
  • 맑음거창4.5℃
  • 맑음북부산5.8℃
  • 흐림보령5.7℃
  • 구름많음세종5.1℃
  • 구름많음문경4.7℃
  • 구름조금울진5.5℃
  • 구름많음동해5.5℃
  • 구름많음부여6.1℃
  • 맑음청송군3.4℃
  • 흐림원주1.3℃
  • 2026.01.09 (금)

건국대 김원준 교수팀, ICCV 2025서 차세대 3D 영상 분할 기술 발표

신현수 기자 / 기사승인 : 2025-07-09 18:00:00
  • -
  • +
  • 인쇄
텍스트로 3차원 영상 객체 분할·편집…AI 기반 콘텐츠 제작 기술 진화
ICCV 2025 정식 발표 확정…세계 최고 권위 컴퓨터 비전 학회에서 주목

건국대학교 공과대학 김원준 교수(전기전자공학부) 연구팀이 개발한 ‘고성능 개방형 어휘 3차원 영상 분할 알고리즘’이 세계 최고 권위의 컴퓨터 비전 학회인 ICCV 2025(IEEE/CVF International Conference on Computer Vision)에서 발표된다. ICCV는 h5-index 291을 기록한 최상위 학술대회로, 해당 연구의 기술력과 학문적 기여도를 국제적으로 인정받았다는 의미다.

김 교수 연구팀은 텍스트 명령만으로 3차원 영상 내에서 사용자가 원하는 객체를 정확하게 분할하고 편집할 수 있는 개방형 어휘(Open-vocabulary) 기반의 영상 분할 기술을 구현했다. 논문은 오는 10월 미국 하와이에서 개최되는 ICCV 2025에서 공식 발표될 예정이다.

▲ 자료제공=건국대학교 (연구 내용 적용 예시)

핵심 기술은 언어 임베딩(Language Embedding)과 가우시안 스플래팅(Gaussian Splatting) 파라미터를 동시에 학습함으로써, 서로 다른 시점에서의 영상 내 객체를 일관되게 이해하고 생성할 수 있도록 한 것이다. 특히 대조적 학습(Contrastive Learning) 기법을 접목해 새로운 시점 이미지에서의 객체 검출 성능도 획기적으로 개선했다.

이를 통해 사용자는 단순한 텍스트 입력만으로 3차원 장면 내 특정 객체를 선택하거나 편집할 수 있으며, 정밀한 3D 장면 렌더링과 영상 편집이 동시에 가능해졌다. 해당 기술은 향후 3D 콘텐츠 제작, 몰입형 서비스(이머시브 서비스), 증강현실(AR) 및 메타버스 플랫폼 등에서 활용성이 클 것으로 기대된다.

이번 논문의 제1저자는 건국대 전기전자공학부 석사과정 장성민 연구원이며, 교신저자는 김원준 교수다. 연구는 과학기술정보통신부의 지원을 받아 수행됐다.

김원준 교수는 “텍스트로 직관적인 3D 영상 제어가 가능한 기술은 콘텐츠 제작의 패러다임을 크게 바꾸는 계기가 될 것”이라며 “앞으로도 3차원 장면 이해 및 생성 기술의 연구를 지속해 나가겠다”고 밝혔다.

CWN 신현수 기자
hs.shin.1716@gmail.com

 

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue