CWN(CHANGE WITH NEWS) - 마이크로소프트, ML.NET 2.0 배포...텍스트 분류 기능 강화

  • 구름많음속초22.7℃
  • 구름많음영천24.6℃
  • 구름조금보령22.8℃
  • 구름많음문경21.6℃
  • 구름조금밀양25.4℃
  • 구름많음추풍령20.7℃
  • 맑음목포24.3℃
  • 구름조금서산22.9℃
  • 구름많음북부산24.8℃
  • 맑음진도군23.4℃
  • 구름조금안동22.9℃
  • 구름많음강릉23.9℃
  • 구름많음전주23.8℃
  • 구름많음금산22.8℃
  • 구름조금천안21.3℃
  • 흐림양평21.1℃
  • 맑음광양시25.8℃
  • 구름많음영월20.7℃
  • 구름많음경주시23.7℃
  • 구름많음제천20.6℃
  • 구름조금고창군23.6℃
  • 구름많음부산24.1℃
  • 구름많음이천21.9℃
  • 맑음백령도22.5℃
  • 구름조금흑산도23.6℃
  • 맑음장수20.4℃
  • 구름많음원주21.5℃
  • 맑음순천23.4℃
  • 구름많음인천22.1℃
  • 맑음여수24.8℃
  • 맑음진주23.2℃
  • 구름조금통영23.9℃
  • 구름조금의령군23.8℃
  • 구름조금세종21.3℃
  • 맑음고흥25.2℃
  • 구름조금북창원24.7℃
  • 흐림북춘천21.5℃
  • 맑음의성24.4℃
  • 구름조금울릉도22.1℃
  • 맑음거창24.6℃
  • 구름많음거제23.6℃
  • 맑음남해22.6℃
  • 흐림고산23.1℃
  • 구름많음강화21.9℃
  • 구름많음정읍25.0℃
  • 맑음보성군24.6℃
  • 구름많음청송군23.1℃
  • 구름조금창원23.6℃
  • 구름조금청주23.7℃
  • 구름많음군산23.1℃
  • 구름많음북강릉21.8℃
  • 흐림정선군20.2℃
  • 구름많음포항23.8℃
  • 맑음임실22.8℃
  • 구름조금합천24.0℃
  • 구름조금부여23.4℃
  • 구름많음양산시25.5℃
  • 구름조금함양군25.0℃
  • 흐림봉화19.3℃
  • 구름많음수원22.0℃
  • 구름조금대구26.0℃
  • 맑음남원24.0℃
  • 구름많음서울22.8℃
  • 맑음광주24.0℃
  • 구름많음성산23.5℃
  • 구름많음울산23.1℃
  • 구름조금구미
  • 흐림영주19.3℃
  • 구름많음영광군23.5℃
  • 구름많음철원22.2℃
  • 맑음장흥24.1℃
  • 구름많음보은22.5℃
  • 흐림춘천21.5℃
  • 맑음강진군24.3℃
  • 흐림제주24.3℃
  • 구름많음고창23.9℃
  • 구름많음홍천21.7℃
  • 구름많음상주23.1℃
  • 구름조금홍성23.6℃
  • 구름많음동두천21.7℃
  • 구름많음김해시24.1℃
  • 맑음완도26.0℃
  • 구름조금서청주23.1℃
  • 구름많음태백18.2℃
  • 구름많음동해22.6℃
  • 흐림영덕21.6℃
  • 맑음순창군24.0℃
  • 흐림충주22.0℃
  • 흐림인제20.9℃
  • 구름많음대전22.5℃
  • 흐림서귀포25.3℃
  • 구름많음부안23.6℃
  • 맑음해남24.2℃
  • 구름많음파주21.7℃
  • 흐림대관령17.2℃
  • 구름많음울진22.5℃
  • 구름많음산청24.0℃
  • 2025.09.30 (화)

마이크로소프트, ML.NET 2.0 배포...텍스트 분류 기능 강화

최정인 / 기사승인 : 2022-11-29 09:47:00
  • -
  • +
  • 인쇄

해외 IT 매체 인포월드가 마이크로소프트의 오픈소스 크로스 플랫폼 머신러닝 .NET 프레임워크 인 ML.NET 2.0 배포 소식을 보도했다. ML.NET 2.0은 텍스트 분류와 자동 머신러닝 기능을 개선했다.

ML.NET 2.0은 11월 10일 자로 ML.NET 모델 작성기(ML.NET Model Builder)의 신규 버전과 함께 공개됐다. ML.NET 모델 작성기는 머신러닝 모델을 구축하는 시각적 개발 도구이다. 모델 작성기의 텍스트 분류 시나리오는 ML.NET 텍스트 분류 응용 프로그램 인터페이스(ML.NET Text Classification API)를 기반으로 한다.

지난 6월 자로 프리뷰 과정을 거친 텍스트 분류 API(Text Classification API)는 개발자가 원시 텍스트 데이터를 분류하기 위한 사용자 지정 모델을 학습하는 기능을 지원한다. 텍스트 분류 API는 마이크로소프트 리서치(Microsoft Research)가 개발한 사전 학습 토치샤프 NAS-BERT 모델(TorchSharp NAS-BERT model)과 개발자가 소유한 자료를 이용해 모델을 미세 조정한다. 모델 작성기 시나리오는 중앙처리장치(CPU)나 쿠다(CUDA) 호환 그래픽 처리 장치(GPU)에서 로컬 학습을 지원한다.

이진 분류(binary classification), 다중 분류(multiclass classification)와 회귀 모델 학습에서 사전 학습된 자동 기계학습 파이프라인을 이용할 수 있어, 머신러닝을 더욱 쉽게 시작할 수 있다.

오토ML 피처라이저(AutoML Featurizer)를 이용해 데이터 전처리 과정 자동화도 지원한다. 아울러, 개발자는 학습 과정에서 사용할 트레이너를 선택할 수 있다. 최적 하이퍼 매개 변수를 찾는 데 사용할 조정 알고리즘도 선택할 수 있다.

고급 자동 오토ML 훈련 옵션도 추가돼, 트레이너와 최적화용 평가 지표도 선택할 수 있다. 또한, 토치샤프 NAS-BERT 모델을 기반으로 하는 문장 유사도 API는 두 개 어구의 유사도를 대변하는 값을 산출한다.

이 밖에 ML.NET 개발진은 앞으로 딥러닝 기능을 강화하고 회귀나 분류 등 기존 머신러닝 작업에 LightGBM 프레임워크 사용을 확대할 예정이라고 밝혔다. 개발진은 오토ML API 개선에도 참여하여 새로운 시나리오와 사용자 정의를 지원하고 머신러닝 작업 흐름을 단순화한다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue