CWN(CHANGE WITH NEWS) - 美 스타트업, AI 언어 모델 ′블룸′ 무료 웹 앱 출시…”GPT-3만큼 뛰어난 언어 처리 능력 갖췄다”

  • 맑음영광군-4.6℃
  • 흐림철원-16.1℃
  • 흐림이천-10.6℃
  • 구름많음의령군-8.4℃
  • 맑음장수-9.7℃
  • 맑음보령-6.0℃
  • 맑음서청주-9.3℃
  • 구름조금동해-3.2℃
  • 맑음금산-7.4℃
  • 맑음임실-8.2℃
  • 맑음부안-5.6℃
  • 맑음구미-5.9℃
  • 맑음남원-7.4℃
  • 구름많음완도-2.4℃
  • 맑음군산-6.4℃
  • 맑음문경-7.1℃
  • 맑음부여-8.1℃
  • 맑음춘천-15.2℃
  • 흐림인제-13.5℃
  • 맑음서울-8.9℃
  • 흐림산청-5.7℃
  • 구름많음해남-5.1℃
  • 구름많음통영-1.6℃
  • 맑음합천-6.2℃
  • 맑음원주-9.8℃
  • 맑음밀양-6.6℃
  • 맑음영덕-5.0℃
  • 맑음경주시-6.9℃
  • 맑음고산3.6℃
  • 맑음대구-4.1℃
  • 맑음김해시-3.4℃
  • 구름많음거제-0.4℃
  • 맑음강릉-4.6℃
  • 구름조금진도군-3.8℃
  • 맑음목포-2.6℃
  • 맑음양산시-2.6℃
  • 맑음성산2.2℃
  • 흐림대관령-14.7℃
  • 맑음북부산-5.3℃
  • 맑음서귀포3.7℃
  • 흐림동두천-12.7℃
  • 맑음수원-9.7℃
  • 맑음추풍령-6.5℃
  • 흐림봉화-9.1℃
  • 맑음홍성-8.5℃
  • 맑음백령도-3.3℃
  • 흐림홍천-12.9℃
  • 구름조금충주-11.2℃
  • 구름많음여수-1.8℃
  • 맑음순창군-6.8℃
  • 맑음흑산도1.1℃
  • 흐림파주-16.7℃
  • 맑음상주-6.0℃
  • 구름많음고흥-3.7℃
  • 맑음거창-8.1℃
  • 구름많음북창원-2.0℃
  • 맑음대전-7.0℃
  • 흐림태백-8.9℃
  • 구름많음광양시-2.4℃
  • 흐림양평-11.0℃
  • 맑음영월-11.4℃
  • 구름많음강진군-3.6℃
  • 맑음함양군-7.4℃
  • 맑음세종-7.2℃
  • 맑음울산-3.1℃
  • 구름많음남해-2.0℃
  • 맑음속초-3.5℃
  • 맑음정읍-6.2℃
  • 흐림제천-13.4℃
  • 맑음서산-8.6℃
  • 흐림정선군-13.5℃
  • 구름조금부산-1.6℃
  • 맑음안동-7.0℃
  • 맑음광주-3.5℃
  • 맑음영천-4.8℃
  • 맑음고창-6.0℃
  • 맑음보은-9.6℃
  • 구름조금장흥-4.5℃
  • 흐림강화-12.2℃
  • 맑음천안-10.1℃
  • 구름조금순천-4.3℃
  • 맑음포항-3.4℃
  • 흐림진주-5.9℃
  • 맑음인천-8.5℃
  • 맑음울진-5.4℃
  • 맑음제주2.3℃
  • 구름많음울릉도-1.8℃
  • 맑음전주-5.5℃
  • 맑음의성-10.0℃
  • 흐림영주-7.5℃
  • 맑음청송군-7.2℃
  • 구름많음보성군-2.7℃
  • 구름많음창원-1.4℃
  • 맑음고창군-5.6℃
  • 맑음청주-6.2℃
  • 맑음북강릉-5.0℃
  • 맑음북춘천-16.3℃
  • 2026.01.14 (수)

美 스타트업, AI 언어 모델 '블룸' 무료 웹 앱 출시…”GPT-3만큼 뛰어난 언어 처리 능력 갖췄다”

고다솔 / 기사승인 : 2022-07-13 18:07:32
  • -
  • +
  • 인쇄
출처: BigScience
출처: BigScience

테크크런치, MIT 테크놀로지 리뷰 등 복수 외신에 따르면, 브루클린 지역 인공지능(AI) 스타트업인 허깅 페이스(Hugging Face)가 다운로드하지 않고도 즉시 사용할 수 있는 AI 언어 모델 ‘블룸(Bloom)’의 무료 웹 앱을 출시했다.

블룸은 광범위한 연구에 활용할 수 있는 자연어 모델 개발이라는 목표로 진행된 국제 커뮤니티 기반 프로젝트인 빅사이언스(BigScience)를 통해 제작된 AI 기반 언어 모델이다. 빅사이언스는 허깅 페이스가 프랑스 정부 기관의 자금 협력을 바탕으로 이루어졌다.

빅사이언스 프로젝트 시작 후 블룸은 철학자, 법률 전문가, 엔지니어 등 여러 분야의 전문가 1,000여 명이 참여한 빅사이언스 프로젝트를 통해 수개월 만에 오픈소스 모델로 탄생했다.

블룸 웹 앱은 허깅 페이스 웹사이트에서 무료로 사용할 수 있으머, 뛰어난 접근성과 공개성 덕분에 매우 매력적이다. 프랑스어와 베트남어, 북경어, 인도네시아어, 인도 지방 언어 13개 언어, 아프리카 부족 언어 20개 등을 포함한 총 46가지 자연어와 13가지 프로그래밍 언어를 처리할 수 있어, 사용자는 처리하고자 하는 언어를 선택할 수 있다.

프로젝트팀은 세계 여러 지역의 전문가가 자발적으로 참여한 덕분에 아프리카 부족 언어와 같이 상대적으로 참고 자료가 부족하며, 기존 언어 모델이 다루지 못한 언어도 골고루 다루는 데 도움이 되었다고 설명했다.

블룸은 역사 문헌 발췌, 번역, 지시 규정 적용 등 다양한 분야에 활용할 수 있도록 설계되었다. 블룸 개발 작업에 참여한 전문가는 훈련에 사용한 데이터를 공유하였다.

출처: BigScience
출처: BigScience

허깅 페이스는 블룸의 언어 처리 능력이 오픈AI(OpenAI)의 GPT-3만큼 뛰어나다고 주장한다. 블룸은 총 1,760억 가지 변수를 다루기 때문이다. GPT-3가 다룰 수 있는 변수는 총 1,750억 가지이다. 또한, 허깅 페이스는 비슷한 규모의 다른 대규모 언어 처리 모델보다는 유해한 텍스트 생성 위험성이 훨씬 적다고 전했다.

빅사이언스 프로젝트는 언어 모델 생성 과정에서 윤리성을 염두에 두고, 인터넷에서 수집한 다량의 언어 데이터로 훈련 과정을 거쳤다. 인터넷에서 언어 데이터를 마구 수집한다면, 비속어나 혐오 표현 등 유해 언어가 포함되어 기존 언어 모델처럼 문제를 일으킬 위험성이 커진다.

이에, 빅사이언스 프로젝트팀은 활용하는 훈련 데이터와 소유자, 데이터 세트 출처 등을 명확하게 구분하기 위한 대규모 언어 처리 모델 전용 데이터 거버넌스 구조를 개발했다.

그러나 일각에서는 블룸도 오픈AI, 딥마인드 등 대규모 연구 기관의 대규모 언어 처리 모델과 같이 차별, 혐오 표현 등 유해한 언어를 생성할 위험성을 피할 수는 없다고 본다.

이 부분에서 허깅 페이스 AI 연구원 마가렛 미셸(Margaret Mitchell)은 “블룸도 기존 언어 처리 모델과 같이 차별적 표현을 생성하거나 언어 처리 능력의 정확성이 떨어지는 등의 문제를 일으킬 수 있다. 하지만 블룸은 오픈소스이기 때문에 많은 사용자가 블룸의 강점과 약점에 비판적인 의문을 제기할 것”이라며, 궁극적으로 빠른 문제 개선에 도움이 될 것이라고 말했다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue